中文内容
- 从 SOP 迈向实时系统
- 在高风险环境中证明可靠性
- 展示首日影响,以及未来路径
2026 年 4 月 1 日
初创公司Gradient Labs 为每位银行客户配备 AI 客户经理
Gradient Labs 使用 GPT‑4.1、GPT‑5.4 mini 和 nano,以高准确率和低延迟运行复杂的金融支持流程。

结果
10 倍
收入增长
结果
正文:98%
客户对 AI Agent 体验的满意度
结果
正文:+11%
与次优提供商相比,GPT-4.1 准确率更高
在银行业,解决客户问题很少是简单的。欺诈或付款受阻等案例,需要多个团队严格遵循复杂流程。当系统能力不足时,客户会被转接到不同团队、排队等待,并在事关重大的时刻遭遇延迟。
Gradient Labs(在新窗口中打开)正是为处理这种复杂性而构建。这家总部位于伦敦的公司正在构建 AI Agent,让每位银行客户都获得专属客户经理般的体验。该公司由此前在 Monzo 领导 AI 和数据工作的团队创立,其平台基于 OpenAI 模型构建,目前正将生产流量迁移到 GPT‑5.4 mini 和 nano。
“我们在 GPT‑5.4 mini 和 nano 上看到了 500 毫秒的延迟,这正是自然语音对话所需的,”Gradient Labs 联合创始人兼首席科学家 Danai Antoniou 表示。“我们正在把很大一部分工作负载迁移过去。”
“我们同时需要三件事:指令遵循的准确性、低幻觉率,以及函数调用的可靠性,并且都要满足语音延迟约束。OpenAI 是唯一在这三方面都通过的提供商。”
从 SOP 迈向实时系统
在银行业,客户互动受标准操作程序(SOP)约束,这些程序定义了每一步应当发生的事项。
一次典型的客户互动可能如下:
- 客户来电报告银行卡被盗。
- 系统验证其身份,并实时处理更正和打断。
- 验证通过后,系统冻结银行卡并启动换卡流程。
- 系统回答后续问题,例如配送时间,并建议下一步操作。
每一步都遵循既定程序,并基于用户输入、上下文、运行中的护栏以及客户和 Agent 的回应实时作出决策,以确保合规。
“模型需要在打断、附和反馈和话题切换之间保持程序状态,同时保持快速生成响应,”Antoniou 表示。“大多数提供商甚至无法尝试做到这一点。”
Gradient Labs 会在其最具挑战性的流程上对提供商进行基准测试,并按他们所称的轨迹准确率进行评估:即系统是否从始至终遵循正确路径。
在他们的一项初始评估中,GPT‑4.1 是唯一达到 97% 轨迹准确率和一致性的模型。次接近的提供商为 88%。
“在金融服务领域,这就是解决一次来电与造成一次合规事件之间的差别,”Antoniou 说。
这一结果影响了 Gradient Labs 的系统设计方式。团队构建了一种混合架构,将 OpenAI 模型用于推理密集型步骤,将较小模型用于更快且确定性的任务,并根据复杂度和延迟约束自适应路由。
在内部,该系统由中央推理 Agent 编排的专业技能组成,使复杂案例能够在不同工作流之间流转而不丢失上下文。
对于每次互动,15 个以上护栏系统并行运行,以确保对话保持在既定程序和合规边界内,包括金融建议检测、脆弱性信号、投诉,以及绕过验证或访问敏感数据的尝试。
在高风险环境中证明可靠性
金融机构不会仅凭信任部署这样的系统。它们需要逐步看到系统在真实环境下能够正确运行。
“你必须从一开始就以无幻觉为目标进行架构设计,”Antoniou 表示。“这需要成为构建过程中的指导原则。”
为了评估新模型和现有模型,团队会重放真实客户对话,并将系统行为与预期流程进行比较。他们还会生成合成对话,在任何内容部署之前测试边缘案例和罕见场景。
Gradient Labs 还让团队能够控制系统的引入方式。他们分析历史支持数据,以绘制一家银行所处理的客户问题类型及其发生频率。随后,团队可以选择 AI 应处理哪些类别,从较低风险的工作流开始,并随着时间逐步扩展。

上线前,客户可以模拟对话,审查系统在不同场景下的响应方式,从而建立其按预期运行的信心。
部署通常从一小部分流量开始,并通过持续监控和自动化检查标记可能需要人工审查的对话。随着系统展现出稳定表现,覆盖范围会逐步扩大。
展示首日影响,以及未来路径
Gradient Labs 的客户报告称,CSAT 分数最高可达 98%,在某些情况下超过其最佳人工 Agent。多数部署在第一天的解决率就超过 50%,即便是争议、账户验证和欺诈等复杂工作流也是如此。
这种影响也体现在公司的增长上。过去一年,Gradient Labs 的收入增长超过 10 倍,并从入站支持扩展到出站和后台流程。
展望未来,Gradient Labs 专注于能够在多次互动之间承载上下文的系统:理解客户历史、跟踪持续问题,并从此前对话中断的地方继续。这一方向与 Gradient Labs 对其与 OpenAI 长期合作关系的思考高度一致。
“我们不只是在为今天选择一个模型。我们是在一个平台上构建,因为我们看到推理模型的发展轨迹与我们的产品方向一致。”
随着模型持续改进,可以安全自动化的流程范围也在扩大。对 Gradient Labs 而言,这意味着更接近这样一种系统:每一次客户互动都能以顶尖人工 Agent 的一致性、判断力和连续性来处理。
OpenAI <3 初创公司




















