不要错过明天的社交媒体行业新闻
已发表: 2023-04-01正如 Twitter 首席执行官埃隆·马斯克本月早些时候所承诺的那样,今天,Twitter 已在 GitHub 上发布了其推荐算法代码供所有人查看,同时还发布了其推文推荐算法如何工作的新概述,提供了对决定顺序的新见解其中显示推文。
正如推特所解释的那样:
“在GitHub 上,您会发现两个新的存储库( main repo和ml repo ),其中包含 Twitter 许多部分的源代码,包括我们的推荐算法,它控制您在 For You 时间轴上看到的推文。 对于此版本,我们的目标是尽可能提高透明度,同时排除任何会危及用户安全和隐私或保护我们的平台免受不良行为者影响的代码,包括破坏我们打击儿童性剥削和性操纵的努力。”
同样重要的是要注意 Twitter 没有连接到每个元素的权重信息 - 即每个因素在驱动最终输出结果时得到了多少重视。
所以它不是每个细节,但它确实提供了对 Twitter 算法如何工作的高级洞察,同时 Twitter 还提供了对该系统的更外行的解释,以帮助人们了解它如何决定你将在时间轴上看到的内容打开应用程序的时间。
根据推特:
“ Twitter 推荐的基础是一组核心模型和功能,它们从推文、用户和参与数据中提取潜在信息。 这些模型旨在回答有关 Twitter 网络的重要问题,例如“您将来与其他用户互动的可能性有多大?” 或者,“Twitter 上有哪些社区,其中有哪些热门推文?”准确回答这些问题使 Twitter 能够提供更相关的推荐。”
最后一个元素很重要,并且与垃圾日的瑞安布罗德里克在他的实验中发现的一致,该实验测试了现在通过推文获得牵引力的内容。
正如布罗德里克总结的那样:
“Twitter 正在通过主题使用不可见的 subreddits 来通过算法组织推文。 因为“为你”页面不再按时间顺序排列,病毒式推文无法像过去那样及时。 他们必须是常青树。 如果他们对已经流行起来的东西发表评论,这会有所帮助。 如果您发布主题、回复自己或在回复中发起某种讨论,这真的很有帮助。 现在似乎也更加重视视频。 ”
事实证明,Ryan 是正确的——Twitter 现在希望根据主题参与度在“为你”提要中推广更多推文,Twitter 在帐户级别定义主题参与度,方法是将某些帐户过滤到主题类别中,然后将其用作分类指南他们每条推文的可能主题。
根据推特:
“ Twitter 最有用的嵌入空间之一是SimClusters 。 SimClusters 使用自定义矩阵分解算法发现由一群有影响力的用户锚定的社区。 有 145,000 个社区,每三周更新一次。 社区的规模从个别朋友组的几千用户到新闻或流行文化的数亿用户不等。 喜欢推文的社区用户越多,推文与该社区的关联度就越高。”
上图显示了一些最大的 Twitter“社区”,或基于 Twitter 算法过滤的主题集合。
Twitter 表示,这种方法已成为决定将哪些“网络外”推文插入“为你”提要,或向你展示哪些你未关注的帐户的推文的关键因素。 随着越来越多的这些推荐被插入到用户源中,它已成为推文曝光的更大驱动力——尽管当 Twitter 进一步将“为你”推荐限制为仅来自付费订阅者帐户的推文时,这种情况很快就会再次发生变化。
这将如何影响 Twitter 的体验是目前任何人的猜测,但它将从根本上改变“为你”的提要,至少,通过限制 Twitter 可以从中提取的源推文池。
如果名人不付钱,或者因此停止发推文,那么影响可能会很大。
这是 Twitter 算法概述最重要的启示,尽管文档中还包含其他几个有趣的注释和要点:
- 对于每个用户会话,Twitter会提取大约 1500 条它认为每个人可能会感兴趣的推文,然后在“For You”提要中对它们进行排名
- For You 时间线目前平均包含 50% 的网络内推文(您关注的人)和 50% 的网络外推文
- Twitter 还预测了两个用户之间互动的可能性。 “你和推文作者之间的 Real Graph 得分越高,我们将包括的他们的推文越多”
- 另一个因素是你关注的人正在参与的推文——这不是一个启示,只是一个注意点
- 推文排名是通过“~48M 参数神经网络进行的,该神经网络在推文交互上持续训练以优化积极参与(例如,喜欢、转推和回复)”。 然而,没有说明 Twitter 在这种情况下如何确定积极参与和消极参与
这提供了一些有趣的背景,说明 Twitter 如何对推文进行排名,并在主要“For You”提要中最大限度地提高曝光率——尽管如此,这将在 4 月 15 日发生变化,届时 Twitter 将切换为仅显示来自付费用户的推文它的“为你”推荐。
在某些方面,这使得很多这种见解变得多余——尽管我猜想,如果工作理论是最终大多数用户都会付费,那么它可能会在一段时间内保持指示性。
除了,他们不会。
目前只有不到 1% 的 Twitter 用户为 Twitter Blue 付费,虽然删除“遗留”蓝色勾号并恢复“For You”排名过程的决定将推动一些额外的接受,但似乎不太可能让 Twitter Blue对于绝大多数 Twitter 用户来说,这是一个重要的考虑因素。
我想,在这方面要考虑的另一个因素是绝大多数推文来自极少数用户,大多数 Twitter 个人资料很少发布自己的推文。 那么,也许 Twitter 只需要一小部分用户注册 Blue,就可以使其成为推文排名中更重要的元素。 但它似乎仍然不太可能在突出显示整个应用程序中最相关的内容方面产生更好的结果。
无论如何,Twitter 似乎正在向前推进,现在,外部开发人员对 Twitter 算法的工作原理有了更多的了解,这将导致关于如何玩弄该系统的新见解和指示的涌入。
推特希望它也能帮助它快速改进算法。 也许这也会发生。 我们将不得不拭目以待。