📜  Facebook 动态消息算法

📅  最后修改于: 2021-10-22 02:37:44             🧑  作者: Mango

有没有注意到众多社交网站和应用程序的新闻提要因人而异?每个提要似乎都是为个人量身定制的,以提供已预测的内容,以便为用户提供理想的平台。预测是这里的关键词使人们推断可能有一些机器学习支持大型社交平台(如 Facebook、Instagram 和 Twitter)上帖子的精确独特排列。在当今这个时代,机器学习是通用术语,这种推论肯定是正确的。事实上,Facebook 是第一个从时间顺序墙过渡到基于算法的提要的平台。其他社交媒体渠道现在正在追随 Facebook 最初奠定的趋势。

因此,让我们以这个潮流引领者为例,探索Facebook Newsfeed背后的算法。

多年来,新闻提要算法经历了多次变化。此前,早在 2015 年,Facebook 提要背后的算法是边缘排名算法。遵循基于排名的方法来确定帖子的顺序,由三个参数控制:亲和力得分、边缘权重和时间衰减,在下面链接后面的文章中讨论过。

现在,新闻提要算法已改进为一种机器学习方法,该方法考虑了 10000 多个权重。该算法目前专注于预测会促进“积极参与”的帖子。该术语表示该算法通过为使帖子具有个性化和值得对话的参数分配更大的权重来预测分数。

正如 Adam Mosseri(曾经是 Facebook 新闻源的负责人,现在是 Instagram 的负责人)所描述的,该算法的四个部分以及其中一些参数如下:

存货:
这包括队列中尚未被最终用户看到的所有帖子。这些帖子包括促销内容、关注页面的帖子以及来自朋友的内容。每天都有数以千计的此类帖子相互竞争,才能在算法仲裁者的眼中崛起。最后,一旦算法做出决定,考虑到参数,其中只有几百个最终进入用户的新闻提要。

信号:
这个阶段是关于内容的考虑。每个帖子都根据可用数据进行分析,例如:

  • 喜欢、评论、分享和反应的数量
  • 帖子类型(视频、图片、书面内容)
  • 帖子所有者
  • 发帖时间和日期
  • 互联网连接速度
  • 使用的设备类型
  • 被阻止的内容
  • 标记为垃圾邮件
  • 发帖时间
  • 前 50 名互动
  • 视频参与(打开音频,更改为全屏或高清)

上述信号由用户生成并赋予权重。例如,分享一个帖子(个人/公开)比喜欢它或对它做出反应具有更大的权重。同样,根据收集到的信息,来自家人和朋友的内容通常比来自后续页面的内容权重更高。

预测:
然后使用上述数据做出明智的决定。该算法试图根据可用信息进行预测,以确定用户更喜欢在他们的提要上看到什么,他们可能隐藏什么,他们积极参与或忽略它的可能性有多大。例如,之前曾收到用户对过去类似帖子的评论的朋友发布的帖子很可能会被预测为用户对之前从同一用户收到过赞的关注页面中的内容感兴趣。如果视频内容被认为比书面材料或图像获得更高的参与度,则预计此类帖子将受到用户的青睐。

评分:
各个场景中的这些预测帖子以及权重用于得出相关性分数。然后根据此分数按降序对帖子进行排序。这些帖子然后按确定的顺序传送到新闻提要。
因此,News Feed Algorithm 被描述为一种“排序以组织”的方法。

其他新闻提要算法也建立在类似的线路上。然而,Facebook 算法是当今所有 News Feed 算法中最复杂的。这种复杂算法的详细工作背后的神秘之处在于,它阻碍了对 Facebook 和幕后研究人员工作的信任。然而,它正在不断发展和超越人工智能的障碍,提供一个致力于连接人的平台。