谈谈内容制作中的关键词标签优化和效果分析
硬核干货!谈谈内容制作中的关键词标签化和效果分析!在抖音、知乎等媒体平台与「内容分发」的链路中,对于人群和内容的向量化分析与推荐引擎是当前的核心技术,但该技术对「内容制作」的指导能力有局限性,不能很好地指导品牌保持品效合一的诉求。
我们与品牌的合作中发现,帮助企业打造内容中台,在内容制作过程中积累标签数据,并在后链路中通过 MAB 等方式进行人群内容测试,更有助于帮助企业指导内容优化并影响企业增长。本次分享主要围绕上述解决方案中使用的技术架构和部分实现细节实践进行。
01
媒体平台
「内容分发」的经验
谈谈内容制作中的关键词标签优化和效果分析
当前媒体平台的内容分发机制已经非常复杂,个性化的推荐大行其道,比如 Facebook 广告用户选择屏蔽理由时的第一项是「这个广告知道得太多了」。
谈谈内容制作中的关键词标签优化和效果分析
为了精准的命中,平台通过向量的距离进行推荐引擎的计算,把内容的向量空间与人群的向量空间进行匹配,将距离用户最近的内容点优先推荐给用户。
谈谈内容制作中的关键词标签优化和效果分析
在完整的向量空间中计算相近的用户向量和内容向量是无法承受的运算成本,因此整个推荐流程不是简单的一次层次的筛选,会经过一个多层次的机器模型学习模型和排序算法。以 Facebook 为例,信息流推荐通过多层级的机器学习模型和排序算法,推荐在长期最有价值和有意义的内容给特定用户。这一切的隐藏目的是保证用户能够在平台上消耗更多的内容时长,即一个接一个的刷内容,保证广告能掺杂在其他原生内容之中被分发出去。大概就像上面的这幅图:建立库存——初步排除(排除质量差的和用户明显不会感兴趣的)——精细排序——上下文调整(多样性、类型)。
而在与抖音类似的弱社交大范围推荐场景,因为缺乏朋友网络的限制条件,会对一开始的曝光量进行一定的简单规则限制,以保证内容有一定的基础曝光量,使得长尾内容得以分发。然后基于前一次的曝光得到用户内容交互(观看、点赞、评论)进行多次放量,中间运营人员会按照内容类型进行一定的加量保量等人工动作。
02
矛盾点:媒体平台对内容创作的支持VS品牌的实际需求
媒体平台在帮助创作者的内容生产会做一些怎样的产品和工具呢?
此前,在 Facebook 创作者工作室(Creator Studio)的工作经历中,主要解决的问题是以下三个方面:
1.内容变现:提供内容是否可以直接订阅收费、收取打赏或者和品牌合作做内容植入广告的合作机会。
2.内容版权:保证发布内容是否与其他人上传的版权素材有较高的片段重合度,这样可以向侵权者索取版权费用以及商业收益的抽成。
3.内容分析:内容分析更多都基于具体内容条目的表现数据,给出一定的统计事实数据,包括内容本身的观看时长、完播率等等;以及观众的忠诚度、人群画像。
平台为了整个内容的生态服务,而品牌在内容生产中实际面临的问题是:品牌的商业内容要求“品效合一”,品牌不仅要保持调性统一,也要挑战内容多样化,应对不同渠道的需求;大量的内容制作需求需要以更有效的方式来实现,且保证其效果。
然而基于上述的内容工具,平台很难全面的提供面向他们的帮助,得到的数据分析结果也并不直观,建设面向B端的内容生态在平台还没有明显的积累优势。
我们抓住了这个机会,帮助品牌建设自有的“内容工程”体系。
谈谈内容制作中的关键词标签优化和效果分析
按照内容的数据化程度做一些分类,从低到高分别是内容粗分类、内容细致分类、内容结构化标签、内容特征向量化和原始文件。「我们」在做的是内容的结构化标签,相对用于推荐的内容特征向量和原始文件,在内容的准确描述的程度上比不上向量,更比不上原始内容文件,但它有独特的很多优点:兼具一定的对推荐系统的逆向工程的有效性,同时人又能理解其中的标签含义,这对于指导内容制作与生产的价值会更有效。
03
内容工程
我们帮助品牌通过几个方面的标签系统建设来实现从内容到管理,从管理到投放数据最后优化下一步内容结构的工作流。
一方面,梳理了关于内容标签的知识图谱,把内容标签本身的分类和关系做了比较详细的总结,对「有效性」这一些标签进行了比较细致的归因分析。
另一方面,搭建了一些相当复杂的体系:基于客户需求,底层考虑了混合云的部署;在稍微往上的一些层次,提供了数据中台和 AI 中台的部分能力,这些数据中台的能力并不是为了消费者画像而准备的,是为了内容的数据处理以及为了客户的使用所做的数据分析和清洗。
谈谈内容制作中的关键词标签优化和效果分析
我们不处理过多的人群画像问题,建设的重点是内容的AI中台(面向内容识别整个算法和算法任务之间、任务 pipeline 之间的关系维护)。在训练和部署都遵循比较好的 MLOps 的实践,在建立底层的算法能力上,我们在 NLP 和 CV 场景也有积累;这为业务中台的跨业务线和跨产品线的通用业务服务提供基础;最后到达上层的产品前台的微服务模块上。
在产品服务层的最下层,我们把内容以打散的原子化的素材形式进行管理,同时组织产品和素材相关的主数据管理的一些方式;中层,提供像创意商城、合规、数据面板、内容洞察和内容编辑器、产品库相关的功能;最上层,方便客户去做一些内外部协作和分享,通过内容中心把内容真正地分发到各个渠道和对接各个渠道的中间件上。
那么,什么样的标签配得上这样的一套复杂的体系去做整个内容的管理和分析?
04
内容元素标签
谈谈内容制作中的关键词标签优化和效果分析
以视频品类为例,我们从视频类型、视频情节、视频美学、背景音乐、达人内容、行动号召、产品 SKU、品牌本身等维度展开,对场景里的具体的元素进行了标签化的分析。
其一,通过手动标注去注明其中的一些信息;其二,跟主数据进行关联后提取到的产品相关信息;其三,结合算法来做一些比如创意分类、故事内容、拍摄手法、音乐基础信息、对话人群等形式上的分析,然后通过机器来的去识别和推导哪一些是标签对最后的转化数据的效果影响大。
谈谈内容制作中的关键词标签优化和效果分析
· 标签选取举例
05
算法实践举例
1.运用公开数据集。可以确定故事题材、和粗粒度的人物、产品相关信息,并根据识别目标定位到视频的特定片段实现一部分的场景切分。
谈谈内容制作中的关键词标签优化和效果分析
2.通过 Treemax classification 进行多信息源合并
谈谈内容制作中的关键词标签优化和效果分析
3.通过电商信息构建商品的图谱
谈谈内容制作中的关键词标签优化和效果分析
4.通过 OCR/ASR 等方式获得标签。将 OCR 和 ASR 的结果经过实体提取,与上述商品和基本内容标签图谱进行对齐,提取出多媒体内容的其他标签。
5.针对特殊多媒体文件进行特别优化。长图处理,进行特别的切图位置判断,避免截断、缩放关键信息,极大提高目标检测、图像识别准确率,排除掉图像伸缩的影响。
谈谈内容制作中的关键词标签优化和效果分析
6.长视频处理,转码过程中进行非均匀的关键字幕帧抽取和音轨提取,提升处理效率,加快整体标签提取速度 85% 以上。
06
内容人群效果分析
谈谈内容制作中的关键词标签优化和效果分析
1.基于品牌过往素材,积累产品图、产品宣传语言、装饰、代言人、模版等创意基础素材,分别带有各自的内容基本标签。
谈谈内容制作中的关键词标签优化和效果分析
2.通过我们智能内容生成算法,将内容中的某个关键元素进行替换(如主文案、主人物),生成一组动态内容,如将海报中的主题色、装饰风格替换为不同的种类。
谈谈内容制作中的关键词标签优化和效果分析
3.将素材中的标签带入到内容上,即内容的标签就是素材标签的组合(C1, C2, C3, C4);
4.基于初步的人群分群 A1, A2, A3, A4,可以将单次投放任务切分成多个等量批次进行实验优化 Ek,每个实验可以包含4X4组自动管理的投放计划,用于进一步获取内容与人群表现中的关系 Et = {P(C1, A1), P(C2, A1), ..., P(C4, A4)} ;
5.对于每组实验 Et,基于之前的人群和素材的投放标签数据,我们可以从我们在DAM管理的素材标签与过往数据的对比中,大概预算出一个内容和一组人群之间的相关度 R(Ci, Aj) ,那么对于单组人群 Aj,这次我们投放计划 P(Ci, Aj) 的先验投放概率为:
因此我们把这组实验按这个概率来分配投放量目标;
6.基于该轮投放结果的表现中每个内容的表现,我们可以使用梯度赌博机 Gradient Bandits 的模型算法,计算出后验的内容-人群相关度,基于以下的梯度公式更新;
7.基于更新的Ht预估值,我们可以反向传播更新到原始内容对应的素材与上述人群之间的关联上。如果忽略掉人群差别,也可以得到一个整体的素材偏好分数。
通过上述方式,在持续内容投放优化上取得了不错的效果。