今日头条内容推荐机制(超详细解读)
推荐系统的本质,就是从一个巨大的内容池里,给当前用户匹配出几篇感兴趣的文章。这个内容池有几十万、上百万的内容,涵盖文章、图片、小视频、问答等各种各样的体裁。
信息的匹配主要依据三个要素:用户、内容、用户对内容感兴趣的程度 。

1、系统是怎么理解我们创作的内容呢?
这些内容又包括娱乐、体育、健康等等多种分类,平台可以提取内容中的关键词,或者利用AI技术识别音频与视频的具体内容从而将内容迅速分类。
2、那么我们怎么给用户提供他们喜欢的内容呢?
平台有很多角度可以去刻画一个用户的画像,比如年龄、性别、历史浏览的内容、环境特征等等。以环境特征为例,用户浏览某个信息的时间是在平时还是周末,地点是在外出时还是在常住的地方,这些都是刻画用户画像的重要因素。
3、了解了内容与用户,接下来最重要的一点就是感兴趣。我们不可以问用户,你对这个内容感兴趣吗?是否感兴趣,我们只能从用户的动作中来了解。
当用户刷新出十几篇文章的时候,如果对某篇文章感兴趣,他会点击阅读。如果觉得这篇文章确实写得很好,他可能会和身边人分享,还会点赞评论。假如这片文章让他对作者产生了兴趣,还会让他有下一步的动作,关注作者。有的人看完一篇文章觉得内容质量太差,也可能对这篇文章点一个不喜欢。
以上就是我们用来刻画用户是不是喜欢这篇内容的动作。这些动作在我们的推荐系统里会作为一个因素被纳入最终的考虑之中。
假如你的内容得到很多人的点击,但用户进去看了两眼就走了,不点赞也不评论,推荐系统就会判定你的内容没那么吸引人。
提取内容特征,用户特征,结合用户兴趣,综合评估用户对内容的满意度,最后给用户推送它最有可能喜欢的内容,以上就是头条系推荐系统的工作原理。
4、那么在内容发表之后会在系统中经历怎样的生命历程呢?
首先它们会进入审核环节,通过审核后系统会对内容做一些加权推荐,我们称之为“冷启动”。
冷启动完成后就开始正常推荐了,在这一过程中,我们将不断得到用户的反馈,会有用户点击它,评论它,甚至举报它。这种行为进而触发我们的复审流程,复审会直接影响内容的后续推荐,下面来为大家详细解读一下。
内容发布后会进入审核环节,也叫初审。我们可以看到两种审核结果:
发文符合平台规范,将通过审核并开始正常推荐;
发文符合平台规范,内容将被限制推荐或退回,不予收录。
初审的目的在于判断这篇内容有没有违反国家的有关法律的风险,在机器和人工的共同配合下,内容会以较快的速度通过初审,从而立即展现在用户眼前。
在内容审核之后就是冷启动的过程。冷启动是一个概念上的推荐,对于新发表的内容,我们不知道它会不会火起来,因此我们会做一个加权推荐,将这篇内容展示给可能喜欢它的用户,在加权之后内容大概会展现几千次,而根据用户的点击、分享、点赞等行为,我们可以判断哪些人群会喜欢这篇文章,哪些人群不喜欢,当内容在几千次的展现之后,系统会认为已经给足了冷启动的机会,就会撤销对这片内容的加权。这篇内容后续能不能推出来,就靠创作的实力了。
通过了冷启动阶段的内容,我们会搜集到最基础的推荐效果。如果一篇内容的推荐效果很好,系统就会认为这篇内容是有潜质的,会进一步扩量推荐给更多的用户。如果一篇内容用户的阅读兴趣并不大,系统就会收紧推荐,减少后续的推荐量。
在正常推荐过程中,基于各种各样的用户行为,系统会检测到很多数据上的异常。比如点击率特别高,但与此同时负面评论或举报又特别多的现象,这时这篇文章又会再次进入审核流程,也就是复审。复审过程中如果发现是标题党、封面党、低俗、虚假等问题,系统就会停止推荐。
了解了推荐机制,希望大家在创作时遵守平台规范,在提升标题与封面吸引力的同时,更注重内容质量,避免标题党、封面党等行为,以优质的内容获得更多用户的喜爱。
技能培训中心热点关注