RecAlign - The smart content filter for social media feed

RecAlign - 社交媒体信息流的智能内容过滤器

3 分钟阅读

[编者按] 这是一篇由 Tian Jin 撰写的客座文章。我们重点介绍这个应用是因为我们认为这是一个新颖的用例。 具体来说,我们认为推荐系统在我们的日常生活中影响深远,但关于 LLM 将如何影响这些系统的讨论还不多。

我们都体验过使用推荐系统的痛苦:你注册 Twitter 是为了关注最新的 AI 研究,但是点击一个有趣的表情包就会让你的时间线充斥着类似的干扰。 这些系统为了最大化其所有者的利润而工作,而不是你的福祉。 在这里,我们概述了我们基于 LangChain 的解决方案背后的原理,以解决这个问题的核心。

透明度和可配置性。 在 Brian Christian 的著作《对齐问题》中,他分享了一个轶事:他的朋友正在从酒精成瘾中恢复,但推荐系统似乎非常了解他对酒精的热爱,并在他的信息流中充斥着酒精广告。 这个事件生动地说明了一个反复出现的问题 —— 推荐系统擅长迎合我们今天的样子,但几乎没有给我们留下决定我们渴望成为什么样的人的自由。 当前的推荐系统缺乏透明度和可配置性。 因此,我们很难识别推荐系统对我们的偏好做出的任何有问题的推断,更不用说修改它们了。

利益冲突。 我们不能期望推荐系统的所有者(例如,Twitter)来解决这种缺乏透明度和可配置性的问题,因为存在利益冲突:系统所有者的目标是最大化收入,通常将此目标置于用户其他期望的目标之上。 这让我们相信,为了改进推荐系统,我们必须解决潜在的利益冲突。 用户必须直接控制他们在推荐中看到的内容。

解决方案。 我们建议使用大型语言模型(LLM),例如 ChatGPT,作为社交媒体信息流的智能内容过滤器,这些信息流是社交媒体平台上的推荐系统的输出。 我们开发了一个开源 Chrome 扩展程序 RecAlign (https://github.com/tjingrant/RecAlign),您可以在其中用文字指定您的观看偏好,例如“我喜欢阅读关于 AI 研究的内容”。 然后,我们要求 LLM 智能地确定社交媒体信息流中的每个条目是否符合用户偏好,并删除所有违反偏好的条目。 我们计划在不久的将来开发其他高度可配置的增强功能,例如信息流重新排序。

基于 LLM 的智能内容过滤器具有以下优点

  • 可配置。 在 ChatGPT 时代,英语是新的编程语言。 我们让用户可以轻松配置智能内容过滤器并立即看到其效果。
  • 透明。 您的偏好就在那里,用文字完整地陈述。
  • 灵活。 我们的偏好可以是短暂的。 易于配置的偏好使户能够灵活地在不同的偏好之间切换。

加入我们。 在 Github 上试用 RecAlign:https://github.com/recalign/RecAlign! 考虑关注/星标我们以获取未来的开发!

LangChain。 LangChain 在我们的项目中发挥着核心作用。 我们使用 LangChain 作为与 OpenAI 后端通信的人体工程学界面。 我们还依赖 LangChain 轻松格式化和解析 LLM 的输入和输出的能力。 我们强烈推荐 LangChain,因为它能够在使用 LLM 构建的项目上实现快速原型设计和快速迭代。

我们是谁。 我们最初是来自麻省理工学院和哈佛大学的两位计算机科学博士生组成的团队。 这个项目始于 Xin 距离他的博士论文答辩还有 2 周的时候。 尽管他判断力通常很好,但他还是决定从事这个项目。 感谢 LangChain,我们发布了我们的第一个原型,为 Xin 准备答辩留出了充足的时间!