Tradestack 是一家位于英国的初创公司,其使命是使贸易企业更高效。凭借其建筑和房地产专家团队,他们发现了一个关键痛点:贸易企业的后台任务需要很长时间。他们的解决方案是什么?一个可以将创建项目报价所需时间从几小时缩短到几分钟的 AI 驱动的助手。
在 LangGraph Cloud 的帮助下,Tradestack
- 在 6 周内构建并向 28,000 多名用户社区推出 MVP
- 获得了首批付费客户
- 通过快速迭代和新的多模态输入和自动化工具,将端到端性能从 36% 提高到 85%
问题:为贸易企业创建报价
贸易企业面临许多复杂性,Tradestack 选择专注于减少为建筑和房地产项目创建报价的管理负担。例如,为油漆和装饰项目创建报价是一个非常繁琐的过程 - 这可能包括分析平面图、查看项目图片、估计工作量、计算材料价格以及为客户演示撰写专业文件。
此过程通常会占用单个项目报价 3.5 到 10 个小时的时间。Tradestack 的愿景是将此时间缩短到 15 分钟以内。
MVP:WhatsApp 助手,用于自动为油漆和装饰项目报价
Tradestack 的首要任务是通过试验不同认知架构下的不同指导水平来测试其价值主张。LangGraph 允许他们使用图表、节点和边来设计这些架构,同时管理每个节点都可以写入的共享状态。这种设置保持了输入灵活性(语音、文本、图像、文档),同时产生了准确的、个性化的客户报价。
鉴于 WhatsApp 的广泛应用,尤其是在非技术精通的用户中,Tradestack 选择将其作为其主要界面。为了带来有意义的商业影响,他们需要可靠地处理通过 WhatsApp 发送的各种输入。这需要识别每个任务所需的技能,并在需要时向用户或专家寻求澄清。
然而,让 AI 代理系统在各种输入下始终如一地以高质量执行并非易事。在设计这样的系统时,存在多个故障点,包括
- 用户输入的多样性或模糊性
- 不同用户的不同起点和终点
- LLM 节点执行的计划或路由不一致或不准确的部分
Tradestack 的目标是构建一个在能力、通用性和可靠性之间取得适当平衡的 MVP。
LangGraph 是明确的解决方案。Tradestack 团队已经熟悉 LangChain 生态系统,他们重视 LCEL 的抽象和 LangSmith 的跟踪,以便快速迭代和性能评估。LangGraph 的直观框架为他们提供了根据用户需求设计推理和内存流所需的控制。借助 LangGraph Cloud,他们进一步提升了其代理工作流程的规模,快速迭代并添加多模态输入以提供高质量的输出。
使用 LangGraph Studio 快速迭代
凭借 LangGraph,Tradestack 尝试了个性化推理,这意味着将推理过程调整为用户偏好,而不仅仅是内容生成。通过利用 配置变量,Tradestack 自定义了其认知架构中的指令和路径,根据特定用例选择子图。这种灵活性使他们能够在输入模式(无论是语音、文本还是图像)和最终输出的可靠性之间取得适当平衡。
Tradestack 最初使用 LangGraph 模板 作为起点,采用了一个分层的多代理系统,其中一个监督节点扩展了用户查询并根据任务目标创建计划。通过让内部利益相关者访问 LangGraph Studio(代理交互的视觉工作室),他们能够快速识别缺陷、迭代设计并提高性能。他们的团队可以与助手交谈并将反馈记录在开发的同时,节省了 2 周的内部测试时间。
使用 LangGraph Cloud 部署
一旦他们的 MVP 准备就绪,Tradestack 便使用 LangGraph Cloud 无缝地将其部署。作为一个精干的团队,他们需要一个能够轻松处理部署、监控和提交修订的平台。LangGraph Cloud 提供了这一切,使他们能够专注于完善其 AI 代理,而不是基础设施问题。
为了确保 WhatsApp 助手界面上的用户交互顺利,他们利用了 LangGraph 的“中断”功能并构建了一个自定义中间件,以智能地管理 双发短信 和其消息队列。LangSmith 跟踪已直接集成到他们的工作流程中,使他们能够轻松地查看和评估每次运行。
LangSmith 还帮助 Tradestack 团队通过强大的测试识别性能差距。通过在 LangSmith 中设置节点级和端到端评估,Tradestack 可以尝试针对规划节点的不同模型,并查看哪些模型表现最佳。例如,他们发现gpt-4-0125-preview 在规划节点上的表现优于gpt-4o,这有助于他们在节点级别进行优化。
使用流模式进行 UX 考虑
为了在 WhatsApp 上创造友好的用户体验,Tradestack 仔细控制了流向用户的 信息量。他们不想用不必要的中间步骤来淹没用户,因此他们使用 LangGraph 的灵活流选项仅显示来自选定节点的关键消息。添加了一个聚合节点以合并来自各种中间步骤的输出,在所有通信中提供一致的语调。
人机协同干预在 Tradestack 的 UX 中也发挥了至关重要的作用。当出现边缘情况时(例如,用户请求英国没有的材料),系统将触发人工干预。Tradestack 的团队可以通过 Slack 或直接在 LangGraph Studio 中进行干预,以调整对话。这有助于确保满足用户的需求,而不会影响用户体验。
结论
展望未来,Tradestack 计划深化与 LangSmith 的集成,以便微调数据集并扩展代理的功能。他们旨在探索语音代理 UX、代理训练模式以及与外部工具的进一步集成,确保其 AI 解决方案能够持续发展并为用户提供价值。
您可以了解有关 Tradestack 的使命的更多信息,以及 此处 如何开始使用 LangGraph Cloud 的信息。有关更多 LangChain 新闻,请关注我们在 X 上 并在我们的 变更日志 上获取最新的产品更新。