元鉴
返回中文阅读流

OpenAI News

Gradient Labs 为每位银行客户配备 AI 客户经理

Gradient Labs 使用 GPT-4.1、GPT-5.4 mini 和 nano 驱动 AI Agent,以低延迟和高可靠性自动化银行支持流程。

中文内容

已翻译professional media英文原文2026-04-01
正文:OpenAI
目录
  • 从 SOP 迈向实时系统
  • 在高风险环境中证明可靠性
  • 展示首日影响,以及未来路径

2026 年 4 月 1 日

初创公司

Gradient Labs 为每位银行客户配备 AI 客户经理

Gradient Labs 使用 GPT‑4.1、GPT‑5.4 mini 和 nano,以高准确率和低延迟运行复杂的金融支持流程。

Soft flowing gradient background in warm orange and yellow blending into teal with a white geometric cube icon beside the text "Gradient Labs" centered across the image.
公司规模:Startup
地区:Europe & UK
行业:Technology, Finance
产品:API

结果

10 倍

收入增长

结果

正文:98%

客户对 AI Agent 体验的满意度

结果

正文:+11%

与次优提供商相比,GPT-4.1 准确率更高

加载中…
分享

在银行业,解决客户问题很少是简单的。欺诈或付款受阻等案例,需要多个团队严格遵循复杂流程。当系统能力不足时,客户会被转接到不同团队、排队等待,并在事关重大的时刻遭遇延迟。

Gradient Labs(在新窗口中打开)正是为处理这种复杂性而构建。这家总部位于伦敦的公司正在构建 AI Agent,让每位银行客户都获得专属客户经理般的体验。该公司由此前在 Monzo 领导 AI 和数据工作的团队创立,其平台基于 OpenAI 模型构建,目前正将生产流量迁移到 GPT‑5.4 mini 和 nano。

“我们在 GPT‑5.4 mini 和 nano 上看到了 500 毫秒的延迟,这正是自然语音对话所需的,”Gradient Labs 联合创始人兼首席科学家 Danai Antoniou 表示。“我们正在把很大一部分工作负载迁移过去。”

“我们同时需要三件事:指令遵循的准确性、低幻觉率,以及函数调用的可靠性,并且都要满足语音延迟约束。OpenAI 是唯一在这三方面都通过的提供商。”
Danai Antoniou,Gradient Labs 联合创始人兼首席科学家

从 SOP 迈向实时系统

在银行业,客户互动受标准操作程序(SOP)约束,这些程序定义了每一步应当发生的事项。

一次典型的客户互动可能如下:

  1. 客户来电报告银行卡被盗。
  2. 系统验证其身份,并实时处理更正和打断。
  3. 验证通过后,系统冻结银行卡并启动换卡流程。
  4. 系统回答后续问题,例如配送时间,并建议下一步操作。

每一步都遵循既定程序,并基于用户输入、上下文、运行中的护栏以及客户和 Agent 的回应实时作出决策,以确保合规。

“模型需要在打断、附和反馈和话题切换之间保持程序状态,同时保持快速生成响应,”Antoniou 表示。“大多数提供商甚至无法尝试做到这一点。”

Gradient Labs 会在其最具挑战性的流程上对提供商进行基准测试,并按他们所称的轨迹准确率进行评估:即系统是否从始至终遵循正确路径。

在他们的一项初始评估中,GPT‑4.1 是唯一达到 97% 轨迹准确率和一致性的模型。次接近的提供商为 88%。

“在金融服务领域,这就是解决一次来电与造成一次合规事件之间的差别,”Antoniou 说。

这一结果影响了 Gradient Labs 的系统设计方式。团队构建了一种混合架构,将 OpenAI 模型用于推理密集型步骤,将较小模型用于更快且确定性的任务,并根据复杂度和延迟约束自适应路由。

在内部,该系统由中央推理 Agent 编排的专业技能组成,使复杂案例能够在不同工作流之间流转而不丢失上下文。

对于每次互动,15 个以上护栏系统并行运行,以确保对话保持在既定程序和合规边界内,包括金融建议检测、脆弱性信号、投诉,以及绕过验证或访问敏感数据的尝试。

在高风险环境中证明可靠性

金融机构不会仅凭信任部署这样的系统。它们需要逐步看到系统在真实环境下能够正确运行。

“你必须从一开始就以无幻觉为目标进行架构设计,”Antoniou 表示。“这需要成为构建过程中的指导原则。”

为了评估新模型和现有模型,团队会重放真实客户对话,并将系统行为与预期流程进行比较。他们还会生成合成对话,在任何内容部署之前测试边缘案例和罕见场景。

Gradient Labs 还让团队能够控制系统的引入方式。他们分析历史支持数据,以绘制一家银行所处理的客户问题类型及其发生频率。随后,团队可以选择 AI 应处理哪些类别,从较低风险的工作流开始,并随着时间逐步扩展。

Dashboard interface for a banking support tool showing a procedure titled Fraud impersonation callback with step by step instructions for verifying suspicious payments. A live call transcript appears on the right with messages between an AI

上线前,客户可以模拟对话,审查系统在不同场景下的响应方式,从而建立其按预期运行的信心。

部署通常从一小部分流量开始,并通过持续监控和自动化检查标记可能需要人工审查的对话。随着系统展现出稳定表现,覆盖范围会逐步扩大。

展示首日影响,以及未来路径

Gradient Labs 的客户报告称,CSAT 分数最高可达 98%,在某些情况下超过其最佳人工 Agent。多数部署在第一天的解决率就超过 50%,即便是争议、账户验证和欺诈等复杂工作流也是如此。

这种影响也体现在公司的增长上。过去一年,Gradient Labs 的收入增长超过 10 倍,并从入站支持扩展到出站和后台流程。

展望未来,Gradient Labs 专注于能够在多次互动之间承载上下文的系统:理解客户历史、跟踪持续问题,并从此前对话中断的地方继续。这一方向与 Gradient Labs 对其与 OpenAI 长期合作关系的思考高度一致。

“我们不只是在为今天选择一个模型。我们是在一个平台上构建,因为我们看到推理模型的发展轨迹与我们的产品方向一致。”
Danai Antoniou,Gradient Labs 联合创始人兼首席科学家

随着模型持续改进,可以安全自动化的流程范围也在扩大。对 Gradient Labs 而言,这意味着更接近这样一种系统:每一次客户互动都能以顶尖人工 Agent 的一致性、判断力和连续性来处理。

原文标题

Gradient Labs gives every bank customer an AI account manager