Chat-Your-Data Challenge

Chat-Your-Data 挑战赛

2 分钟阅读

ChatGPT 已经风靡全球。数百万用户都在使用它。虽然它在通用知识方面表现出色,但它只了解其训练数据中的信息,这些数据通常是 2021 年之前公开的互联网数据。它不了解您的私人数据,也不了解最近的数据来源。

如果它能做到这一点,岂不是很有用吗?这就是 LangChain 的用武之地。

LangChain 的目标是让每个人都能更轻松地开发语言模型应用程序。我们最近发布了一份关于如何基于您自己的数据创建 ChatGPT 的指南,请点击此处查看。其中包含一个示例 GitHub 仓库,您可以从中开始并进行自定义。但即便如此,仍有大量的需要集成的和编写提示的数据源。在征集大家对最有趣的集成方案的意见并收到热烈反响后,我们意识到了这一点。

在“Chat-Your-Data”挑战赛中,我们发起了一项为期一周的挑战,旨在基于您的数据源创建 ChatGPT。

动机

这样做的动机一如既往,是为了让每个人都能更轻松地开发语言模型应用程序。特别是,我们认为示例对于帮助人们做到这一点至关重要。因此,我们希望尽可能多地收集针对各种数据源的示例(数据加载器 + 提示)。

然后,我们会将数据加载逻辑放入 LangChain,将提示放入 LangChainHub,并将示例放入 LangChain 文档中,以便其他人尽可能轻松地入门。

如何开始

  1. 克隆示例 GitHub 仓库
  2. 自定义数据源和提示以适应您的数据(可以参考本教程
  3. 奖励:部署一个漂亮的配套前端!在上面的教程中,我们提供了一个部署到 Hugging Face Spaces 的示例。
  4. 使用此表单提交您的作品
  5. 重复!

示例

我们基于此示例 GitHub 仓库创建了两个示例仓库,以展示其外观

我们从上述推文中看到的其他数据源的想法有

  • Obsidian
  • Gong 通话记录
  • PDF 文件
  • 音频文件(可以使用 Whisper!)
  • Git 仓库
  • 任意网站

还有很多很多!如果您正在寻找想法,请查看此推文的回复。

会有获胜者吗?

是的!没有获胜者的挑战算什么挑战?

参与规则如下

  • 每天结束时,我们都会在 Twitter 上发布一份在提交表单中提交的所有示例 GitHub 仓库的列表
  • 在本周结束时(2 月 12 日),我们将冻结提交,并发布一条包含所有提交的 GitHub 仓库的推文
  • 截至 2 月 19 日,获得星数最多的仓库将成为获胜者!

我能赢得什么?

一件限量版 LangChain T 恤。