[5月13日当周] LangChain 发行说明

LangChain 这里一片欣欣向荣。LangChain v0.2 即将推出，LangSmith 现在增强了安全性和合规性，并推出了配对评估等新功能。“使用 LangChain” 部分重点介绍了现实生活中的用例，我们还为合作伙伴和社区内容贡献者增加了专门的播出时间。祝您阅读愉快！

产品更新

💡

重点介绍 LangChain、LangSmith 和 LangGraph 的最新产品更新和新闻

LangChain

🚀 随着 LangChain v0.2 预发布，我们将 langchain 包与 langchain-community 解耦，以提高 langchain 的稳定性和安全性。

使用 v0.2，您可以期待

版本化的文档，具有改进的可发现性，因此您可以将信息和说明与您的次要版本相匹配
LangGraph 作为构建代理的推荐方式，可以轻松定义循环和内置内存，然后对其进行自定义和修改

自我们的第一个稳定库版本 v0.1 以来，我们还对以下方面进行了改进

标准聊天模型功能，包括标准化工具调用支持和用于构建输出的接口
对许多核心抽象的异步支持
使用新的事件流 API 进行流式传输支持
针对 Python 和 JavaScript 包中 20 多个提供程序的合作伙伴包

我们很乐意收到您在 GitHub 讨论区 上的反馈。有关如何 迁移 到 LangChain v0.2 的文档，请参见此处。

LangSmith

🌍 LangSmith 现在符合 GDPR 标准。

LangSmith（我们用于构建、测试和监控 LLM 应用程序的统一开发者平台）现在符合 GDPR 标准。安全性和合规性对我们和我们不断增长的企业客户来说非常重要。我们很高兴能够更有效地为每个人服务。

🔒 基于角色的访问控制 (RBAC) 现已面向企业客户提供。

管理员现在可以使用 LangSmith 中的 RBAC 为其组织中的用户分配角色。创建/编辑具有精细权限的自定义角色，以确定谁可以访问资源。

我们还引入了改进的 API 密钥以支持访问控制。这些包括

个人访问令牌，其范围限于用户的权限
服务密钥，用于访问 LangSmith API 的服务（不受用户删除等组织更改的影响）

此功能适用于我们企业计划的用户。请联系 LangSmith 专家。

🍐 配对评估使您能够在测试文本生成或聊天时智能地在输出之间进行选择。

对于像文本生成或聊天这样的 LLM 用例（可能没有一个“正确”的答案），使用配对评估选择首选响应可能是一种有效的方法。

LangSmith 的配对评估使您能够 (1) 使用任何所需标准定义自定义的配对 LLM 作为评判者的评估器，以及 (2) 使用此评估器比较两个 LLM 生成的结果。

深入了解我们的视频教程，逐步了解如何在 LangSmith 中使用自定义配对评估器，或查看文档。

额外内容：需要对您的生产日志进行回测？此 视频 展示了配对评估如何帮助您将应用程序运行的不同版本与基准生产应用程序进行比较。

🛠️ 现在，通过与 LangChain Hub 分开的新的专用位置，可以更轻松地访问和管理个人提示。

您的组织的提示现在与 LangChain Hub 分开。按提交版本组织和提取现有提示，以便您可以跟踪同一提示的不同版本的性能并快速调试任何问题。

所有公开共享的提示仍然位于 LangSmith 底部侧边栏的公共中心。祝您提示愉快！

使用 LangChain

🦜

现实生活中的用例和示例，展示了人们如何使用 LangChain、LangSmith 或 LangGraph 构建具有高质量和准确性的 LLM 应用程序，即使是在生产环境中

多代理应用程序

LangGraph 是名称，多代理是游戏。通过在 LLM 工作流程中使用多个独立代理，您可以解决更复杂的问题。以下是一些使用 LangGraph 库解决用户挑战的实用技术。

📝 使用 GPT Researcher 和 LangGraph 构建自主研究助手

Assaf Elovic（Wix 研发主管）提供了一个分步演练，介绍了流程工程和多代理协作如何帮助自动化对任何给定主题（从架构到运行）的深入研究。

在他的示例中，平均运行会生成一份可自定义的 5-6 页研究报告，采用 PDF、Docx 和 Markdown 等多种格式。您可以在此处自己尝试一下！

🤖 在 LangGraph 中构建客户支持机器人

从零样本代理开始，观看此视频，了解如何设计和构建一个客户支持机器人，帮助您研究和管理航班、交通、酒店和短途旅行的预订。

您将看到如何通过以下方式为您的聊天机器人添加表达能力和控制力：(1) 在采取行动之前进行用户确认，(2) 根据确认的需要对行动进行分组，以及 (3) 将工具分解为针对不同用户旅程的工作流程。您还可以参考项目代码和文档。

⏪ 多代理 RAG，从草稿到实时应用程序

在此直播录制中，听取 AI Makerspace 联合创始人的意见，他们展示了如何协调代理（每个代理都有自己的草稿），并在管理最终应用程序的监督员的指导下工作。在这个例子中，他们建立了一个研究团队和一个文档团队，使用 LangGraph 创建了一个顶级的技术博客。

评估：使用 GPT-4o、RAG 等

⚡使用 LangSmith 测试新的 GPT-4o

通过我们对 OpenAI 最新的“omni”模型 GPT-4o 的支持，您可以将 GPT4o 与旧的 OpenAI 模型进行比较，看看升级是否安全。

在这个 8 分钟的视频中，我们使用一个简单的 RAG 应用程序，在一个包含 20 个与 LangChain 文档相关的问题的数据集上测试了新的 GPT-4o。剧透：我们的回归测试表明，GPT-4o 在 RAG 准确率方面有适度提高 (2%)，在 p50 延迟方面有显著提高 (29%)。据报道，成本降低了约 50%，在这种情况下我们可以安全地升级。