Tradestack 是一家位于英国的初创公司,其使命是提高贸易业务的效率。凭借一支由建筑和房地产专家组成的团队,他们发现了一个关键痛点:贸易业务的后台任务耗时过长。他们的解决方案是什么?一个人工智能驱动的助手,可以将创建项目报价所需的时间从数小时缩短到几分钟。
在 LangGraph Cloud 的帮助下,Tradestack
- 在 6 周内构建并向 28,000 多名用户社区推出了 MVP
- 获得了他们的首批付费客户
- 通过快速迭代和新的多模态输入及自动化工具,将端到端性能从 36% 提高到 85%
问题:为贸易业务创建报价
贸易业务面临许多复杂性,Tradestack 选择专注于减少为建筑和房地产项目创建报价的行政负担。例如,为油漆和装饰项目创建报价是一个繁琐的过程——这可能包括分析平面图、审查项目图像、评估工作量、计算材料价格以及制作用于客户演示的专业文档。
对于单个项目报价,此过程通常需要 3.5 到 10 小时。Tradestack 的愿景是将此时间缩短到 15 分钟以内。
MVP:用于自动化油漆和装饰项目报价的 WhatsApp 助手
Tradestack 的首要任务是通过试验不同认知架构的指导级别来测试其价值主张。LangGraph 使他们能够使用图、节点和边来设计这些架构,同时管理每个节点都可以写入的共享状态。这种设置在保持输入灵活性(语音、文本、图像、文档)的同时,生成准确、个性化的客户报价。
鉴于 WhatsApp 的广泛普及,尤其是在不精通技术的用户中,Tradestack 选择它作为其主要界面。为了交付有意义的业务影响,他们需要可靠地处理通过 WhatsApp 发送的各种输入。这需要识别每个任务所需的技能,并在需要时要求用户或专家进行澄清。
然而,要使 AI 代理系统在各种输入下始终如一地保持高质量的性能并非易事。在设计这样的系统中,存在多个故障点,包括
- 用户输入的多样性或歧义
- 不同用户的不同起点和终点
- LLM 节点完成的规划或路由的不一致或不准确的部分
Tradestack 的目标是构建一个 MVP,在能力、通用性和可靠性之间取得适当的平衡。
LangGraph 是明显的解决方案。Tradestack 团队已经熟悉 LangChain 生态系统,他们重视 LCEL 的抽象和 LangSmith 的追踪功能,以便进行快速迭代和性能评估。LangGraph 直观的框架使他们能够控制设计针对用户需求的推理和记忆流程。借助 LangGraph Cloud,他们进一步大规模地改进了其代理工作流程,快速迭代并添加多模态输入,以交付高质量的输出。
使用 LangGraph Studio 进行快速迭代
借助 LangGraph,Tradestack 试验了个性化推理,这意味着根据用户偏好定制推理过程,而不仅仅是内容生成。通过利用配置变量,Tradestack 定制了其认知架构中的指令和路径,根据特定用例选择子图。这种灵活性使他们能够在输入模式(无论是语音、文本还是图像)与最终输出的可靠性之间取得适当的平衡。
Tradestack 最初使用LangGraph 模板作为起点,采用具有监督节点的分层多代理系统,该监督节点扩展用户查询并根据任务目标创建计划。通过让内部利益相关者访问LangGraph Studio,即代理交互的可视化工作室,他们能够快速识别缺陷,迭代其设计并提高性能。他们的团队可以与助手交谈并在开发的同时记录反馈,节省了两周的内部测试时间。
使用 LangGraph Cloud 部署
一旦他们的 MVP 准备就绪,Tradestack 就使用LangGraph Cloud 无缝部署了它。作为一个精干的团队,他们需要一个可以轻松处理部署、监控和提交修订的平台。LangGraph Cloud 正好提供了这一点,使他们能够专注于改进其 AI 代理,而不是基础设施问题。
为了确保 WhatsApp 助手界面上的用户交互顺畅,他们利用 LangGraph 的“中断”功能并构建了一个自定义中间件来智能地管理双重文本和他们的消息队列。LangSmith 追踪直接集成到他们的工作流程中,从而可以轻松地审查和评估每次运行。
LangSmith 还帮助 Tradestack 团队通过强大的测试识别性能差距。通过在 LangSmith 中设置节点级和端到端评估,Tradestack 可以试验规划节点的不同模型,并查看哪些模型的性能最佳。例如,他们发现 gpt-4-0125-preview 比 gpt-4o 在规划节点上表现更好,这帮助他们在节点级别进行了优化。
流式模式的 UX 考虑因素
为了在 WhatsApp 上创建用户友好的体验,Tradestack 仔细控制了流式传输给用户的信息量。他们不想用不必要的中间步骤让用户感到不知所措,因此他们使用 LangGraph 灵活的流式传输选项,仅显示来自选定节点的关键消息。添加了一个聚合器节点,以组合来自各个中间步骤的输出,从而在所有通信中提供一致的语气。
人机循环干预在 Tradestack 的 UX 中也发挥了至关重要的作用。当出现边缘情况时(例如用户请求英国不可用的材料),系统将触发手动干预。然后,Tradestack 的团队可以通过 Slack 或直接在 LangGraph Studio 中介入以调整对话。这有助于确保满足用户的需求,而不会影响用户体验。
结论
展望未来,Tradestack 计划深化他们与 LangSmith 的集成,以进行微调数据集并扩展其代理的功能。他们的目标是探索语音代理 UX、代理训练模式以及与外部工具的进一步集成,确保他们的 AI 解决方案不断发展并为用户提供价值。
您可以了解更多关于Tradestack的使命,并在此处阅读了解如何开始使用 LangGraph Cloud。有关更多 LangChain 新闻,在 X 上关注我们并在我们的更新日志上获取最新的产品更新。