ChatGPT 已经风靡全球。数百万用户都在使用它。虽然它在通用知识方面表现出色,但它只了解其训练数据中的信息,这些数据通常是 2021 年之前公开的互联网数据。它不了解您的私人数据,也不了解最近的数据来源。
如果它能做到这一点,岂不是很有用吗?这就是 LangChain 的用武之地。
LangChain 的目标是让每个人都能更轻松地开发语言模型应用程序。我们最近发布了一份关于如何基于您自己的数据创建 ChatGPT 的指南,请点击此处查看。其中包含一个示例 GitHub 仓库,您可以从中开始并进行自定义。但即便如此,仍有大量的需要集成的和编写提示的数据源。在征集大家对最有趣的集成方案的意见并收到热烈反响后,我们意识到了这一点。
将加强关于如何使用 @LangChainAI 基于特定文档创建您自己的 Chat-GPT 的教程
— Harrison Chase (@hwchase17) 2023年2月6日
人们希望获得哪些类型的文档/知识库的示例?例如 Notion、Obsidian、网页等
在“Chat-Your-Data”挑战赛中,我们发起了一项为期一周的挑战,旨在基于您的数据源创建 ChatGPT。
动机
这样做的动机一如既往,是为了让每个人都能更轻松地开发语言模型应用程序。特别是,我们认为示例对于帮助人们做到这一点至关重要。因此,我们希望尽可能多地收集针对各种数据源的示例(数据加载器 + 提示)。
然后,我们会将数据加载逻辑放入 LangChain,将提示放入 LangChainHub,并将示例放入 LangChain 文档中,以便其他人尽可能轻松地入门。
如何开始
- 克隆示例 GitHub 仓库
- 自定义数据源和提示以适应您的数据(可以参考本教程)
- 奖励:部署一个漂亮的配套前端!在上面的教程中,我们提供了一个部署到 Hugging Face Spaces 的示例。
- 使用此表单提交您的作品
- 重复!
示例
我们基于此示例 GitHub 仓库创建了两个示例仓库,以展示其外观
- Notion:连接到您的 Notion
- ReadTheDocs:连接到您的 ReadTheDocs 站点
我们从上述推文中看到的其他数据源的想法有
- Obsidian
- Gong 通话记录
- PDF 文件
- 音频文件(可以使用 Whisper!)
- Git 仓库
- 任意网站
还有很多很多!如果您正在寻找想法,请查看此推文的回复。
会有获胜者吗?
是的!没有获胜者的挑战算什么挑战?
参与规则如下
- 每天结束时,我们都会在 Twitter 上发布一份在提交表单中提交的所有示例 GitHub 仓库的列表
- 在本周结束时(2 月 12 日),我们将冻结提交,并发布一条包含所有提交的 GitHub 仓库的推文
- 截至 2 月 19 日,获得星数最多的仓库将成为获胜者!
我能赢得什么?
一件限量版 LangChain T 恤。
