[4月29日当周] LangChain 发行说明

🦜🛠️ LangSmith 新功能

😍 改进的回归测试体验：在对 LLM 应用程序进行更改时，了解行为是否与其先前的测试用例相比出现退化非常重要。对提示、检索策略或模型选择所做的更改可能会对应用程序生成的响应产生重大影响。我们更新了比较视图，以便更轻松地探索多个实验中的数据
- 我们发布了更多显示选项，以便您可以自定义要查看的信息粒度。查看您认为重要的列、数据点和图表。
- 与基线相比，自动突出显示在评估指标上增加或减少的测试运行，并过滤以仅显示偏离的测试运行。
- 改进的侧面板视图允许您深入了解您感兴趣的特定运行的详细信息。

查看我们的视频演示和博客了解更多信息！

注释队列中的热键：我们在注释队列中引入了热键，以帮助您更快地导航 🔥！在现在支持键盘快捷键的按钮旁边查找热键指示器。
Mustache 支持：您现在可以选择在 Playground 和 Prompt Hub 中的 f 字符串和 Mustache 之间切换提示的模板语言。这为您管理和格式化变量提供了更大的灵活性。
评估：我们的新视频系列向您展示了 LangSmith 实验如何帮助您添加测试覆盖率、发现回归以及在延迟、成本和质量之间做出明智的权衡。我们发布了另外三个侧重于 RAG 评估的概念，向您展示如何评估响应质量：正确性（视频、文档）、幻觉（视频、文档）和检索到的文档相关性（视频、文档）。
Azure 市场：我们很高兴地宣布，LangSmith 现在已在Azure 市场中提供。当您使用 Azure 信用额度通过 Azure 市场购买 LangSmith 时，您将能够将数据完全保留在您的 Azure VPC 中，轻松部署并体验更顺畅的采购流程。在我们的博客中了解更多信息，并联系销售人员以与我们的一位专家开始对话。

🕸️ LangGraph

查看使用LangGraph（我们用于使用 LLM 构建有状态、多参与者应用程序的框架）的三个新教程。

我们将在下周三（5 月 8 日）与 AI Makerspace 联合举办一场在线研讨会，我们将向您展示如何使用 LangGraph 构建和编排多代理 RAG 应用程序。在此注册！

使用 LangGraph 和 Llama3 实现可靠的本地 RAG 代理：在此视频中，我们将深入探讨如何使用 LangGraph 和 Llama3-8b 从头开始构建您自己的本地 RAG 代理。我们将向您展示如何通过使用 LangGraph 将三篇高级 RAG 论文中的技术组合到一个控制流中来提高代理性能。代码。
使用 LangGraph 和 Mistral 实现高级 RAG 代理：我们发布了一个视频和一组食谱，向您展示如何使用 LangGraph 和 Mixtral 8x22B 中的控制流构建高级 RAG 代理。
使用 LangGraph 构建计算奥林匹克竞赛代理：普林斯顿大学的研究人员最近发布了美国计算奥林匹克竞赛基准数据集，表明零样本 GPT-4 代理仅解决了 8.7% 的挑战。虽然 LLM 无法单独解决最困难的问题，但通过一些巧妙的流程设计，您可以构建一个人工智能混合系统来获得成功的解决方案。我们已经实现了他们的论文，并发布了一个视频，向您展示如何使用 LangGraph 构建一个编程奥林匹克选手。代码。

👀 如果您错过了

😍 Dosu 如何使用 LangSmith 在没有提示工程的情况下实现 30% 的准确率提升：提示工程是帮助 LLM 学习的最常用方法，但上下文（少样本）学习可以提供明显更好的结果。了解 Dosu（自动标记问题和 PR 的 GitHub 机器人）如何使用 LangSmith 为其上下文学习管道提供支持 - 查看我们的视频、博客和食谱。
🤖 代理基准测试：我们更新了基准测试结果，该结果评估了由不同模型驱动的代理。这些基准测试利用了 LangSmith和 LangChain 的标准工具调用接口，因此您可以看到哪些 LLM 最适合某些任务。在我们最初的博客文章中详细了解我们的方法。
🌊 使用 CodiumAI 进行流程工程：流程工程因其能够使用迭代过程胜过简单的提示工程而越来越受欢迎。LangGraph 是我们用于创建作为图形的代理的高度可控框架，它与流程工程原理紧密结合。在此网络研讨会回放中收听我们首席执行官 Harrison Chase 和 CodiumAI 首席执行官 Itamar Friedman 的讲话。
🔁 使用 LangChain 和 Neo4j 通过基于图形的元数据技术优化向量检索：文本嵌入有助于识别文档相关性，但在日期或类别等特定条件下会遇到困难。通过将元数据过滤与向量相似性搜索配对，您可以优化搜索结果以更好地匹配特定属性。在我们的博客中深入了解这种方法，该博客向您展示了如何使用 LangChain 和 Neo4j 进行更精确的文档检索。