[Week of 5/27] LangChain Release Notes

[5月27日当周] LangChain 发行说明

LangChain v0.2 发布了版本化文档;LangSmith 增加了现成的评估器提示,以及数据集拆分和重复功能。 此外,请查看我们与 NVIDIA 联合举办的竞赛以及纽约/旧金山线下见面会!

阅读时间:7 分钟

文档焕然一新,数据集支持拆分,线下见面会名额火热登记中……LangChain 持续发展 🐎。 在本期内容中,我们将介绍版本化文档,以及 LangSmith 中的数据集改进和新的现成评估器。

我们还将在“LangChain 应用案例”中介绍真实的用例和合作伙伴活动 - 包括与 NVIDIA 联合举办的新竞赛。 最后,我们的社区成员将分享一些教育资料(视频、博客和 GitHub 项目),无论您是 LangChain 新手还是人工智能专家,都可以参考这些资料。 祝您阅读愉快!


产品更新

💡
重点介绍 LangChain、LangSmith 和 LangGraph 的最新产品更新和新闻

LangChain

📝 LangChain v0.2 版本发布了版本化文档,结构和内容更加清晰。

我们更新了 LangChain v0.2 的文档,将其分为以下几部分:

  • 教程:有关如何从头到尾构建特定应用程序(例如聊天机器人、RAG 应用程序或代理)的分步指南
  • 操作指南:有关如何执行特定任务的详细说明指南(更深入、更高级)
  • 概念指南:新概念或 LangChain 知识的术语和技术词汇表
  • API 文档:详细的技术参考文档

LangChain v0.2 文档导览

查看 PythonJavaScript 中的新文档,然后 在此处 提供您的反馈。 要迁移现有代码库,只需按照我们的 Python 迁移脚本JavaScript/TypeScript 迁移脚本 进行操作即可。 

📞 JavaScript 中的多模态函数调用允许您传递图像、视频和音频,并获取结构化输出

在我们的 @langchain/google-genai@langchain/google-vertexai 软件包中,我们添加了具有结构化输出的函数调用,这使您能够构建更可靠的应用程序,并提供多模态支持,包括图像、音频和视频。 有关详细信息,请参阅文档

LangSmith

✂️ 用于评估和筛选/编辑数据集示例的数据集拆分

借助数据集拆分,可以更轻松地在 LangSmith 中对数据子集运行评估。 您可以 使用不同的拆分名称标记示例,编辑和添加到拆分,以及根据所需条件进行筛选。

当您有一个包含多个类别的数据集需要单独评估时,拆分非常有用。 这使您能够通过 将示例添加到单独的拆分中进行测试来测试新的用例,同时保留您的评估工作流程。

除了拆分之外,您还可以通过对数据集示例执行以下操作来加快查找相关信息的的速度

本视频 演示了如何使用数据集拆分。

🔁 重复以增强您对实验结果的信心

您现在可以在 LangSmith 中 多次运行您的实验。 这有助于消除应用程序或 LLM 作为评法官的评估器引入的可变性带来的噪声,以便您对实验结果更有信心。

本视频 中,了解如何通过重复对数据集进行评估。 您可以查看 N 次重复的平均得分,还可以比较不同重复之间的输出可变性。

🔧 现成的在线评估器提示,用于捕获 RAG 中的不良检索和幻觉

LangSmith 的在线评估器(LLM 作为评法官)使用可自定义的提示和自动化规则自动运行生产跟踪。 我们新的现成评估器为您提供了一个自定义提示,可以

  • 标记检索到的文档是否与用户输入的问题相关(文档相关性)
  • 检查 RAG 响应中的幻觉(幻觉)
  • 检查 RAG 答案是否有助于解决问题,无需基本事实答案(答案有用性)
  • 根据特定条件进行标记,例如毒性(标记)

额外内容:观看本视频查看文档,了解如何使用 LangSmith 建立防护栏来检测包含 PII 或有毒查询的用户输入。

💬 无需句柄即可管理私有提示

我们改进了 SDK 和 LangSmith 提示 UI,以简化提示导航。 现在,只有公共提示需要在创建时使用句柄。 新帐户在创建公共提示之前不需要创建 LangChain Hub 句柄。

通过 SDK 拉取或推送您自己的提示 时,您不再需要指定句柄。 例如,您可以使用 hub.pull('prompt_name') 而不是 hub.pull('handle/prompt_name')


即将举行的活动

🎫
在下个月的线下活动中与 LangChain 爱好者、员工和热衷于人工智能应用程序构建者见面

🐻 6 月 18 日(旧金山):伯克利 LLM 见面会。 欢迎所有伯克利博士生、教职工和校友! 快来了解 LangGraph、加州大学伯克利分校构建的酷炫开源项目,并与从事 LLM 工作的志同道合的同行建立联系。 在此处注册。

🏙️ 6 月 26 日(纽约市):LangChain 和 Elastic 纽约市见面会。 聆听闪电演讲,与 LangChain 团队的一些成员见面,然后是社交、披萨和茶点时间。 在此处注册


LangChain 应用案例

🦜
人们如何使用 LangChain、LangSmith 或 LangGraph 构建高质量和高精度的 LLM 应用程序的真实用例和示例,即使是在生产环境中

代理的自动更正

反思循环会提示您的 LLM 反思和批评其过去的行为,这可以提高代理的质量和成功率。 以下是我们如何看待代理利用自我纠正来产生更好的结果。

🌀 使用 LangGraph 和 Codestral 的自我纠正代码助手

随着 Mistral 发布 Codestral-22B(一种使用 80 多种编程语言训练的代码生成模型),我们测试了使用 Codestral 和 LangGraph 构建自我纠正代码助手。

借鉴 AlphaCodium 论文中的想法,我们在 本视频 中展示了如何将 Codestral 与结构化输出/工具使用、循环内单元测试和错误反馈结合使用,以从错误中自我纠正。 您也可以在 我们的教程中 按照说明进行操作。

🌐 具有审阅者自动更正功能的多代理流代理,用于文本到 SQL

FlowiseAI 新的 多代理流 具有一个代理团队协作完成任务的功能。 对于文本到 SQL 查询,处理流程如下 - SQL 专家代理生成查询,执行器代理运行查询,最后审阅者代理自动更正查询。

该系统与函数调用、多模态、API 和提示输入变量一起使用反射循环来提高长时间运行任务的输出质量。

0:00
/0:23

使用代理进行财务分析

代理使重新构想传统财务分析领域(从投资到费用跟踪)成为可能。 以下是一些很好的例子

📈 GPT4 支持的人工智能代理可以成为足够优秀的绩效归因分析师吗?

纽约人寿投资公司的 Bruno Veras De Melo 在 他的论文 中探讨了使用 LangChain 代理更好地评估投资组合成功驱动因素的方法。

使用 LangChain 作为标准代理框架和提示工程技术(如思维链 (CoT) 和求解计划 (PS)),他在分析绩效驱动因素方面实现了 93% 的准确率,在模拟官方考试标准的问答练习中实现了 84% 的准确率。

Bruno 的图表显示,通过测试少量样本提示,关键字推理准确率达到了 93%

💸 LangGraph 支出追踪器

Jan Willem Altink(Esdec 产品经理)的这个项目展示了如何使用 LangGraph 管理您的支出。您可以发送发票图片(通过提取)——然后该项目允许您构建支出结构、对其进行分类并将它们放入数据库。


协作与集成

🤝
我们 💚 通过使用我们的集成帮助用户利用生态系统中的合作伙伴功能

NVIDIA 和 LangChain 联合举办的生成式 AI 代理开发者竞赛

使用 NVIDIA 的一个或多个 LLM 堆栈以及 LangChain 或 LangGraph 框架创建一个基于文本或多模态的代理。然后,将一段 <90 秒的视频分享到社交媒体并提交参赛表格。立即参加比赛,截止日期为 6 月 17 日。GPU 奖品等你来拿!

使用 Azure 容器应用动态会话的代码解释器

新的 LangChain 与动态会话的集成使您能够安全可靠地赋予您的代理执行 Python 代码的能力。阅读我们的博客文章或观看我们的教程,了解如何使用 LangGraph 和动态会话构建数据分析师。

使用 Claude 3 进行强制工具调用

Anthropic 的强制工具调用为 LangChain 中的 bind_tools 和 with_structured_output 功能实现了可靠的工具调用。升级您的 langchain-anthropic 包以试用这些改进(Python)(JavaScript)

Nomic Embed 增加了对 Python 的本地支持

LangChain 用户可以访问官方支持的 Nomic Embed 本地版本。根据输入大小和复杂性动态切换本地和远程推理。阅读更多信息,了解如何在优化性能和成本的同时嵌入文本。

☁️ 🦸 非常感谢 Eden Marco 上周在 Google Cloud 峰会上支持 LangGraph


来自社区

🗣️
了解我们超过 100 万的开发者和构建者如何在日常工作中使用 LangChain。感谢您一直帮助我们做得更好!

想开始使用 LangChain,但不知道从哪里开始?我们的社区成员为您提供帮助。😊

在下面的 14 分钟视频中,David(Decoder.sh 创始人)将从基础知识开始,逐步介绍如何构建您的第一个链——使用模板、模型和可运行程序。

说到视频……请观看下面 Santiago Valdarrama(Tideily 联合创始人)的教程,了解如何从头开始构建 RAG 应用程序。该 RAG 应用程序使用 LangChain、Pinecone 和 OpenAI 构建,允许您询问有关任何 YouTube 视频的问题。

在您的 RAG 旅程中,您可能希望拆分/分块文档以在提出问题时保留内容——请查看 Sudarshan Korala(数据科学基础知识)的教程

如果您正在探索更高级的 RAG 概念,您可能对以下内容更感兴趣

如果您渴望获得更多内容,我们还有更多资源可以满足您的需求。

更多视频

更多博客

以及 GitHub 项目


如何才能及时了解所有 Lang 最新资讯?请查看LangChain 博客YouTube 频道,了解更多产品和内容更新。

您也可以加入我们的Discord讨论,或发送电子邮件至 support@langchain.dev 获取支持。