抖音:行为预测主导的去中心化推荐抖音采用深度学习模型+去中心化推荐机制,通过神经网络预估用户行为,机器判断比传统的用户标签更灵活。 抖音的内容分发流程主要分为三个阶段: 1. 视频审核阶段视频在进入冷启动前,会进行机器初判阶段。此时,就要根据口播文案、视频字幕文案、画面等内容进行合规性判断。通过AI识别文本、图像、声音中的违规内容,包括侵权、低俗、违法违规、诱导、虚假宣传等。然后进入到冷启动阶段,此时会进入到200-500人的流量池。 2. 算法推荐阶段通过多模态特征识别技术,对视频内容进行深度分析
平台根据“打分机制”来评判视频后续的推荐,完播率、点赞率、评论率、转发率等用户行为指标综合计算。 抖音的推荐算法已几乎不依赖对内容和用户打标签,而是通过神经网络直接预测用户行为,计算用户观看内容获得的价值总和。 3. 流量分配机制多样性打散:打破 “相似内容连续轰炸” 算法会在推荐列表中主动 “打散” 高度相似的 AIGC 内容。 多兴趣召回:挖掘用户的 “隐藏兴趣点” 传统 “单兴趣召回” 仅针对用户最明显的兴趣(如 “AI 搞笑视频”),而多兴趣召回会通过用户行为数据(如浏览时长、搜索记录、评论关键词)识别多个兴趣标签。
小红书:CES评分驱动的标签匹配系统小红书的推荐算法以CES评分(社区参与度评分)为核心 采用”内容标签+用户标签”的双向匹配机制 CES评分公式为:CES=点赞数(1分)+收藏数(1分)+评论数(4分)+转发数(4分)+关注数(8分) 内容识别流程:
小红书内容的“互动率”(点赞、评论、收藏)是突破幼稚内容的关键。这三项是推荐优质笔记进入1w~100w流量池差异化的关键。 优质内容会按顺序进入覆盖 1 万、10 万、100 万以上用户的展示范围,其中用户的互动表现(如点赞、评论、收藏等行为的综合占比)是实现层级突破的关键因素。 小红书的召回周期很长,即使发布2-3个月的视频也会被找回进行流量推送,更注重长尾浏览。所以做小红书一定要注重图文质量和实际功能性的内容,通过“搜索”还可以推荐到优质内容。
视频号:私域撬动公域的社交推荐体系视频号的推荐算法与抖音、快手等平台有本质区别,其核心逻辑是”私域流量撬动公域流量”,内容权重在三大平台中最低,约占50%,社交关系链权重较高。 推荐机制:
内容审核流程:
违规判定标准:视频号对直播内容的审核更为严格,禁止录播、低互动行为、虚假演绎等 同时,平台对内容原创性、画质清晰度、互动真实性均有要求,私域流量中的”好友互动异常”(如短时间内大量点赞)可能被判定为违规 流量分配特点:视频号的流量分配更依赖社交关系链,初始流量主要来自关注者、好友和社群的自然流量,随后基于地理位置、兴趣标签等进行基础推荐 内容得分排序权重为:完播率>点赞数>评论数>点击扩展链接数量>转发数>收藏数
文本NLP拆词机制解析抖音:子词级分词与深度语义理解抖音的文本NLP处理采用子词级分词技术,主要基于以下方法:
小红书:词典匹配与长尾词优化小红书的文本NLP处理更注重关键词布局与搜索优化,其分词机制主要基于以下方法:
视频号:话题标签与BPE分词结合视频内容检测,AI会结合文本(字幕、标题、视频简介)文本会结合NLP拆词,例如“上海东方明珠”会拆成“上海”、“东方明珠”两套词、图像(封面),封面的特征例如人脸、衣着等均为检测目标、音效(背景音乐)、视频画面(抽帧检测)等多模态特征进行合规审查。 生成式AI模型应用:如S-YOLO V5和Vision Transformer模型用于视频内容描述生成,结合注意力机制(Attention)增强关键帧识别,提升文本生成质量。
|