文档焕然一新,数据集支持拆分,线下见面会名额火热登记中……LangChain 持续发展 🐎。 在本期内容中,我们将介绍版本化文档,以及 LangSmith 中的数据集改进和新的现成评估器。
我们还将在“LangChain 应用案例”中介绍真实的用例和合作伙伴活动 - 包括与 NVIDIA 联合举办的新竞赛。 最后,我们的社区成员将分享一些教育资料(视频、博客和 GitHub 项目),无论您是 LangChain 新手还是人工智能专家,都可以参考这些资料。 祝您阅读愉快!
产品更新
LangChain
📝 LangChain v0.2 版本发布了版本化文档,结构和内容更加清晰。
我们更新了 LangChain v0.2 的文档,将其分为以下几部分:
- 教程:有关如何从头到尾构建特定应用程序(例如聊天机器人、RAG 应用程序或代理)的分步指南
- 操作指南:有关如何执行特定任务的详细说明指南(更深入、更高级)
- 概念指南:新概念或 LangChain 知识的术语和技术词汇表
- API 文档:详细的技术参考文档
LangChain v0.2 文档导览
查看 Python 和 JavaScript 中的新文档,然后 在此处 提供您的反馈。 要迁移现有代码库,只需按照我们的 Python 迁移脚本 或 JavaScript/TypeScript 迁移脚本 进行操作即可。
📞 JavaScript 中的多模态函数调用允许您传递图像、视频和音频,并获取结构化输出
在我们的 @langchain/google-genai
或 @langchain/google-vertexai
软件包中,我们添加了具有结构化输出的函数调用,这使您能够构建更可靠的应用程序,并提供多模态支持,包括图像、音频和视频。 有关详细信息,请参阅文档。
LangSmith
借助数据集拆分,可以更轻松地在 LangSmith 中对数据子集运行评估。 您可以 使用不同的拆分名称标记示例,编辑和添加到拆分,以及根据所需条件进行筛选。
当您有一个包含多个类别的数据集需要单独评估时,拆分非常有用。 这使您能够通过 将示例添加到单独的拆分中进行测试来测试新的用例,同时保留您的评估工作流程。
除了拆分之外,您还可以通过对数据集示例执行以下操作来加快查找相关信息的的速度
- 将示例克隆到另一个数据集
- 直接在 UI 中编辑元数据
- 搜索特定示例

本视频 演示了如何使用数据集拆分。
您现在可以在 LangSmith 中 多次运行您的实验。 这有助于消除应用程序或 LLM 作为评法官的评估器引入的可变性带来的噪声,以便您对实验结果更有信心。
在 本视频 中,了解如何通过重复对数据集进行评估。 您可以查看 N 次重复的平均得分,还可以比较不同重复之间的输出可变性。

LangSmith 的在线评估器(LLM 作为评法官)使用可自定义的提示和自动化规则自动运行生产跟踪。 我们新的现成评估器为您提供了一个自定义提示,可以
- 标记检索到的文档是否与用户输入的问题相关(文档相关性)
- 检查 RAG 响应中的幻觉(幻觉)
- 检查 RAG 答案是否有助于解决问题,无需基本事实答案(答案有用性)
- 根据特定条件进行标记,例如毒性(标记)
额外内容:观看本视频 或 查看文档,了解如何使用 LangSmith 建立防护栏来检测包含 PII 或有毒查询的用户输入。
我们改进了 SDK 和 LangSmith 提示 UI,以简化提示导航。 现在,只有公共提示需要在创建时使用句柄。 新帐户在创建公共提示之前不需要创建 LangChain Hub 句柄。
通过 SDK 拉取或推送您自己的提示 时,您不再需要指定句柄。 例如,您可以使用 hub.pull('prompt_name')
而不是 hub.pull('handle/prompt_name')
。
即将举行的活动
🐻 6 月 18 日(旧金山):伯克利 LLM 见面会。 欢迎所有伯克利博士生、教职工和校友! 快来了解 LangGraph、加州大学伯克利分校构建的酷炫开源项目,并与从事 LLM 工作的志同道合的同行建立联系。 在此处注册。
🏙️ 6 月 26 日(纽约市):LangChain 和 Elastic 纽约市见面会。 聆听闪电演讲,与 LangChain 团队的一些成员见面,然后是社交、披萨和茶点时间。 在此处注册。
LangChain 应用案例
代理的自动更正
反思循环会提示您的 LLM 反思和批评其过去的行为,这可以提高代理的质量和成功率。 以下是我们如何看待代理利用自我纠正来产生更好的结果。
🌀 使用 LangGraph 和 Codestral 的自我纠正代码助手
随着 Mistral 发布 Codestral-22B(一种使用 80 多种编程语言训练的代码生成模型),我们测试了使用 Codestral 和 LangGraph 构建自我纠正代码助手。
借鉴 AlphaCodium 论文中的想法,我们在 本视频 中展示了如何将 Codestral 与结构化输出/工具使用、循环内单元测试和错误反馈结合使用,以从错误中自我纠正。 您也可以在 我们的教程中 按照说明进行操作。
🌐 具有审阅者自动更正功能的多代理流代理,用于文本到 SQL
FlowiseAI 新的 多代理流 具有一个代理团队协作完成任务的功能。 对于文本到 SQL 查询,处理流程如下 - SQL 专家代理生成查询,执行器代理运行查询,最后审阅者代理自动更正查询。
该系统与函数调用、多模态、API 和提示输入变量一起使用反射循环来提高长时间运行任务的输出质量。
使用代理进行财务分析
代理使重新构想传统财务分析领域(从投资到费用跟踪)成为可能。 以下是一些很好的例子
📈 GPT4 支持的人工智能代理可以成为足够优秀的绩效归因分析师吗?
纽约人寿投资公司的 Bruno Veras De Melo 在 他的论文 中探讨了使用 LangChain 代理更好地评估投资组合成功驱动因素的方法。
使用 LangChain 作为标准代理框架和提示工程技术(如思维链 (CoT) 和求解计划 (PS)),他在分析绩效驱动因素方面实现了 93% 的准确率,在模拟官方考试标准的问答练习中实现了 84% 的准确率。

💸 LangGraph 支出追踪器
Jan Willem Altink(Esdec 产品经理)的这个项目展示了如何使用 LangGraph 管理您的支出。您可以发送发票图片(通过提取)——然后该项目允许您构建支出结构、对其进行分类并将它们放入数据库。
协作与集成
NVIDIA 和 LangChain 联合举办的生成式 AI 代理开发者竞赛
使用 NVIDIA 的一个或多个 LLM 堆栈以及 LangChain 或 LangGraph 框架创建一个基于文本或多模态的代理。然后,将一段 <90 秒的视频分享到社交媒体并提交参赛表格。立即参加比赛,截止日期为 6 月 17 日。GPU 奖品等你来拿!
使用 Azure 容器应用动态会话的代码解释器
新的 LangChain 与动态会话的集成使您能够安全可靠地赋予您的代理执行 Python 代码的能力。阅读我们的博客文章或观看我们的教程,了解如何使用 LangGraph 和动态会话构建数据分析师。
使用 Claude 3 进行强制工具调用
Anthropic 的强制工具调用为 LangChain 中的 bind_tools 和 with_structured_output 功能实现了可靠的工具调用。升级您的 langchain-anthropic
包以试用这些改进(Python)或(JavaScript)。
Nomic Embed 增加了对 Python 的本地支持
LangChain 用户可以访问官方支持的 Nomic Embed 本地版本。根据输入大小和复杂性动态切换本地和远程推理。阅读更多信息,了解如何在优化性能和成本的同时嵌入文本。
☁️ 🦸 非常感谢 Eden Marco 上周在 Google Cloud 峰会上支持 LangGraph!
来自社区
想开始使用 LangChain,但不知道从哪里开始?我们的社区成员为您提供帮助。😊
在下面的 14 分钟视频中,David(Decoder.sh 创始人)将从基础知识开始,逐步介绍如何构建您的第一个链——使用模板、模型和可运行程序。
说到视频……请观看下面 Santiago Valdarrama(Tideily 联合创始人)的教程,了解如何从头开始构建 RAG 应用程序。该 RAG 应用程序使用 LangChain、Pinecone 和 OpenAI 构建,允许您询问有关任何 YouTube 视频的问题。
在您的 RAG 旅程中,您可能希望拆分/分块文档以在提出问题时保留内容——请查看 Sudarshan Korala(数据科学基础知识)的教程。
如果您正在探索更高级的 RAG 概念,您可能对以下内容更感兴趣
- 结合自适应 RAG、纠正性 RAG 和自 RAG以使用 LangGraph 提高检索文档的相关性和准确性——Ankush Singal(机密数据科学经理)
- 自查询检索以使用 LangChain 和 Qdrant 过滤器优化搜索结果——Daniel Romero(Qdrant 开发者布道师)
- 介绍使用 LangChain 和 Neo4j 的 GraphRAG以使用图形而不是纯向量数据库为 RAG 应用程序提供支持,以实现更好的检索——Valentina Alto(微软 Azure 专家)
如果您渴望获得更多内容,我们还有更多资源可以满足您的需求。
更多视频
- 使用 LangGraph Llama 3 和 Groq 创建 AI 代理,作者:Sam Witteveen(Red Dragon AI 联合创始人)
- Amazon Bedrock 入门以及使用 LangChain 和 Chainlit 创建简单的 ChatUI,作者:Sudarshan Koirala(KONE 机器学习工程师)
- LLM 和 AI 基准测试 - GenAI Eval 深入探讨,作者:Adam Lucek(思科数字专家)
- 具有自我反思功能的高级 RAG,作者:Eduardo Vasquez(Complidata 数据科学家)
更多博客
- 使用 LangChain.js 进行无服务器 AI 聊天和 RAG,作者:Yohan Lasorsa 和 Glaucia Lemos(微软开发者布道师)
以及 GitHub 项目
- Cognita:用于构建模块化 RAG 应用程序的开源 RAG 框架,作者:Tahreem Rasul(Red Buffer 机器学习工程师)
- HippoRAG:受人类长期记忆神经生物学启发的 RAG 框架,作者:Bernal Gutierrez 和 Yiheng Shu(俄亥俄州立大学博士生)
- 使用 Mistral AI、Neon 和 LangChain 构建文本到 SQL 转换系统,作者:Ishan Anand(机器学习咨询)
- 使用 LangChain 文档加载器支持本地文件的 GPT 研究器,作者:Assaf Elovic(Wix 研发主管)
如何才能及时了解所有 Lang 最新资讯?请查看LangChain 博客和YouTube 频道,了解更多产品和内容更新。
您也可以加入我们的Discord讨论,或发送电子邮件至 support@langchain.dev 获取支持。