今天,我们宣布 LangChain 与 Chroma 集成,这是通往现代 A.I. 堆栈的第一步。
LangChain - A.I. 原生开发者工具包
我们启动 LangChain 的初衷是构建一个模块化且灵活的框架,用于开发 A.I. 原生应用程序。我们首先想到的用例包括 聊天机器人、问答 服务和 代理。现在,成千上万的开发者正在使用 LangChain 灵活易用的框架,进行黑客马拉松、修补和构建各种由 LLM 驱动的应用程序。
这些应用程序的关键组件之一是嵌入,以及用于存储和处理这些嵌入的向量存储。
我们注意到许多现有向量存储的一个痛点是,它们通常需要连接到存储嵌入的外部服务器。虽然这对于将应用程序投入生产环境没有问题,但它确实使在本地轻松原型化应用程序变得有点棘手。
我们用于本地向量存储的最佳解决方案是使用 FAISS,但许多社区成员指出,FAISS 存在一些棘手的依赖关系,导致安装问题。
Chroma - A.I. 原生向量存储
Chroma 的成立是为了构建利用嵌入功能的工具。嵌入是代表任何类型数据的 A.I. 原生方式,使其非常适合与各种 A.I. 驱动的工具和算法配合使用。
在 Chroma 探索模型嵌入的可能性时,Chroma 团队需要一个易于使用、性能良好且轻量级的向量存储,它可以处理现代 A.I. 工作负载。
虽然已经有几种向量数据库解决方案,但他们发现这些解决方案主要面向其他用例和访问模式,例如大规模语义搜索。此外,它们通常设置和运行起来很麻烦,尤其是在开发环境中。
简而言之,Chroma 团队没有找到我们需要的,所以 Chroma 构建了它。
Chroma 是一个向量存储和嵌入数据库,从头开始设计,旨在让使用嵌入构建 AI 应用程序变得容易。它自带 开始使用所需的一切,并在您的机器上运行 - 只需 pip install chromadb
!
LangChain 和 Chroma
凭借我们对灵活性和易用性的共同关注,我们发现 LangChain 和 Chroma 非常契合。
具体来说,LangChain 提供了一个框架,可以在本地轻松原型化 LLM 应用程序,而 Chroma 提供了一个向量存储和嵌入数据库,可以在本地开发期间无缝运行,为这些应用程序提供支持。
今天,我们宣布 Chroma 与 LangChain 集成。Chroma 旨在成为大多数使用 LangChain 构建 LLM 应用程序的开发者的首选、最简单和最佳选择。它今天就可以使用!只需获取最新版本的 LangChain,然后 from langchain.vectorstores import Chroma
就可以了!
为了帮助您入门,我们整理了一个 示例 GitHub 仓库,供您试用。
未来
StableDiffusion 和 ChatGPT 的发布引发了 A.I. 创造力的爆发。今天,世界各地成千上万的人们正在努力发现和释放 A.I. 的全部力量。与此同时,A.I. 研究继续以惊人的速度发展。更多种类的数据、更多与 A.I. 交互的方式以及更多关于模型如何工作的见解每天都在被发明出来。
毫无疑问,这是一个变革的时代,不仅在于我们如何构建软件,还在于什么是可能的。LangChain 和 Chroma 将继续走在前沿。