[Week of 5/13] LangChain Release Notes

[5月13日当周] LangChain 发行说明

LangSmith 增加了 RBAC、配对评估,并且现在符合 GDPR 标准。LangChain v0.2 即将推出。

6 分钟阅读时间

LangChain 这里一片欣欣向荣。LangChain v0.2 即将推出,LangSmith 现在增强了安全性和合规性,并推出了配对评估等新功能。“使用 LangChain” 部分重点介绍了现实生活中的用例,我们还为合作伙伴和社区内容贡献者增加了专门的播出时间。祝您阅读愉快!


产品更新

💡
重点介绍 LangChain、LangSmith 和 LangGraph 的最新产品更新和新闻

LangChain

🚀 随着 LangChain v0.2 预发布,我们将 langchain 包与 langchain-community 解耦,以提高 langchain 的稳定性和安全性。

使用 v0.2,您可以期待

  • 版本化的文档,具有改进的可发现性,因此您可以将信息和说明与您的次要版本相匹配
  • LangGraph 作为构建代理的推荐方式,可以轻松定义循环和内置内存,然后对其进行自定义和修改

自我们的第一个稳定库版本 v0.1 以来,我们还对以下方面进行了改进

  • 标准聊天模型功能,包括标准化工具调用支持和用于构建输出的接口
  • 对许多核心抽象的异步支持
  • 使用新的事件流 API 进行流式传输支持
  • 针对 Python 和 JavaScript 包中 20 多个提供程序的合作伙伴包

我们很乐意收到您在 GitHub 讨论区 上的反馈。有关如何 迁移 到 LangChain v0.2 的文档,请参见此处。

LangSmith

🌍 LangSmith 现在符合 GDPR 标准。

LangSmith(我们用于构建、测试和监控 LLM 应用程序的统一开发者平台)现在符合 GDPR 标准。安全性和合规性对我们和我们不断增长的企业客户来说非常重要。我们很高兴能够更有效地为每个人服务。

🔒 基于角色的访问控制 (RBAC) 现已面向企业客户提供。

管理员现在可以使用 LangSmith 中的 RBAC 为其组织中的用户分配角色。创建/编辑具有精细权限的自定义角色,以确定谁可以访问资源。

我们还引入了改进的 API 密钥以支持访问控制。这些包括

  • 个人访问令牌,其范围限于用户的权限
  • 服务密钥,用于访问 LangSmith API 的服务(不受用户删除等组织更改的影响)

此功能适用于我们企业计划的用户。请联系 LangSmith 专家

🍐 配对评估使您能够在测试文本生成或聊天时智能地在输出之间进行选择。

对于像文本生成或聊天这样的 LLM 用例(可能没有一个“正确”的答案),使用配对评估选择首选响应可能是一种有效的方法。

LangSmith 的 配对评估 使您能够 (1) 使用任何所需标准定义自定义的配对 LLM 作为评判者的评估器,以及 (2) 使用此评估器比较两个 LLM 生成的结果。

深入了解我们的 视频教程,逐步了解如何在 LangSmith 中使用自定义配对评估器,或查看 文档

额外内容:需要对您的生产日志进行回测?此 视频 展示了配对评估如何帮助您将应用程序运行的不同版本与基准生产应用程序进行比较。

🛠️ 现在,通过与 LangChain Hub 分开的新的专用位置,可以更轻松地访问和管理个人提示。

您的 组织的提示 现在与 LangChain Hub 分开。按提交版本组织和提取现有提示,以便您可以跟踪同一提示的不同版本的性能并快速调试任何问题。

所有公开共享的提示仍然位于 LangSmith 底部侧边栏的公共中心。祝您提示愉快!


使用 LangChain

🦜
现实生活中的用例和示例,展示了人们如何使用 LangChain、LangSmith 或 LangGraph 构建具有高质量和准确性的 LLM 应用程序,即使是在生产环境中

多代理应用程序

LangGraph 是名称,多代理是游戏。通过在 LLM 工作流程中使用多个独立代理,您可以解决更复杂的问题。以下是一些使用 LangGraph 库 解决用户挑战的实用技术。

📝 使用 GPT Researcher 和 LangGraph 构建自主研究助手

Assaf Elovic(Wix 研发主管)提供了一个 分步演练,介绍了流程工程和多代理协作如何帮助自动化对任何给定主题(从架构到运行)的深入研究。

在他的示例中,平均运行会生成一份可自定义的 5-6 页研究报告,采用 PDF、Docx 和 Markdown 等多种格式。您可以在 此处 自己尝试一下!

🤖 在 LangGraph 中构建客户支持机器人

从零样本代理开始,观看此视频,了解如何设计和构建一个客户支持机器人,帮助您研究和管理航班、交通、酒店和短途旅行的预订。

您将看到如何通过以下方式为您的聊天机器人添加表达能力和控制力:(1) 在采取行动之前进行用户确认,(2) 根据确认的需要对行动进行分组,以及 (3) 将工具分解为针对不同用户旅程的工作流程。您还可以参考 项目代码文档

⏪ 多代理 RAG,从草稿到实时应用程序

此直播录制 中,听取 AI Makerspace 联合创始人的意见,他们展示了如何协调代理(每个代理都有自己的草稿),并在管理最终应用程序的监督员的指导下工作。在这个例子中,他们建立了一个研究团队和一个文档团队,使用 LangGraph 创建了一个顶级的技术博客。

评估:使用 GPT-4o、RAG 等

使用 LangSmith 测试新的 GPT-4o

通过我们对 OpenAI 最新的“omni”模型 GPT-4o 的支持,您可以将 GPT4o 与旧的 OpenAI 模型进行比较,看看升级是否安全。

在这个 8 分钟的视频 中,我们使用一个简单的 RAG 应用程序,在一个包含 20 个与 LangChain 文档相关的问题的数据集上测试了新的 GPT-4o。剧透:我们的 回归测试 表明,GPT-4o 在 RAG 准确率方面有适度提高 (2%),在 p50 延迟方面有显著提高 (29%)。据报道,成本降低了约 50%,在这种情况下我们可以安全地升级。

使用 数据集 进行尝试,并使用 LangSmith 中的 RAG 评估 为您自己的应用程序自定义此评估。

您现在可以在任何 LangChain 应用程序中使用 GPT-4o 的多模态功能。查看我们的 PythonJavaScript 文档了解更多信息。

🤔 RAG 评估的中间步骤

对于像 RAG(检索增强生成)这样的管道,可能需要评估管道输出(即最终答案)和中间步骤的输出。但是,如何隔离和评估中间步骤的输出呢?

在我们评估视频系列的 最新视频 中,了解如何使用 LangSmith 独立评估 RAG 管道中的任何步骤(包括 中间步骤,例如文档检索),以及如何更好地进行调试。


合作伙伴关系

🤝
我们 💚 通过使用我们的集成来帮助用户利用生态系统中的合作伙伴功能

Hugging Face 合作伙伴包: langchain-huggingface

我们很高兴地宣布推出 langchain-huggingface,这是 LangChain 中与 Hugging Face 共同维护的合作伙伴包。

LangChain 用户现在可以可靠地连接和访问 Hugging Face 功能。这些功能包括用于本地和托管实例的聊天、文本完成和嵌入模型。阅读 这篇博文 了解更多信息。

Qdrant 合作伙伴包: langchain-qdrant

使用 langchain-qdrant,LangChain 用户可以连接到 Qdrant 向量存储。LangChain 现在支持 Qdrant 的内存中部署、API 部署或混合云部署。查看 PythonJavaScript 包。

Redis 和 LangChain 多模态 RAG 模板

这篇博客文章介绍了多模态 RAG,逐步讲解了模板设置,并展示了一些示例查询以及允许模型处理和推理文本和图像以构建更细致的 LLM 应用程序的优势。

奖励:LangChain 是 MongoDB 的 年度人工智能应用程序框架合作伙伴


来自社区

🗣️
了解我们超过 100 万的开发人员和构建者如何在日常工作中使用 LangChain。感谢您一直帮助我们构建更好的产品!

视频

博客

课程

GitHub 项目和笔记本


如何才能跟上所有这些喧嚣?请查看 LangChain 博客YouTube 频道,了解更多产品和内容更新。

您也可以加入 我们的 Discord 参与讨论,或发送电子邮件至 support@langchain.dev 获取支持。