返回中文阅读流

OpenAI News

Gradient Labs 为每位银行客户配备 AI 客户经理

Gradient Labs 使用 GPT-4.1、GPT-5.4 mini 和 nano 驱动 AI Agent，以低延迟和高可靠性自动化银行支持流程。

中文内容

已翻译professional media英文原文2026-04-01

正文：OpenAI

目录

从 SOP 迈向实时系统
在高风险环境中证明可靠性
展示首日影响，以及未来路径

2026 年 4 月 1 日

初创公司

Gradient Labs 为每位银行客户配备 AI 客户经理

Gradient Labs 使用 GPT‑4.1、GPT‑5.4 mini 和 nano，以高准确率和低延迟运行复杂的金融支持流程。

Soft flowing gradient background in warm orange and yellow blending into teal with a white geometric cube icon beside the text "Gradient Labs" centered across the image.

公司规模：Startup

地区：Europe & UK

行业：Technology, Finance

产品：API

结果

10 倍

收入增长

结果

正文：98%

客户对 AI Agent 体验的满意度

结果

正文：+11%

与次优提供商相比，GPT-4.1 准确率更高

加载中…

分享

在银行业，解决客户问题很少是简单的。欺诈或付款受阻等案例，需要多个团队严格遵循复杂流程。当系统能力不足时，客户会被转接到不同团队、排队等待，并在事关重大的时刻遭遇延迟。

Gradient Labs（在新窗口中打开）正是为处理这种复杂性而构建。这家总部位于伦敦的公司正在构建 AI Agent，让每位银行客户都获得专属客户经理般的体验。该公司由此前在 Monzo 领导 AI 和数据工作的团队创立，其平台基于 OpenAI 模型构建，目前正将生产流量迁移到 GPT‑5.4 mini 和 nano。

“我们在 GPT‑5.4 mini 和 nano 上看到了 500 毫秒的延迟，这正是自然语音对话所需的，”Gradient Labs 联合创始人兼首席科学家 Danai Antoniou 表示。“我们正在把很大一部分工作负载迁移过去。”

“我们同时需要三件事：指令遵循的准确性、低幻觉率，以及函数调用的可靠性，并且都要满足语音延迟约束。OpenAI 是唯一在这三方面都通过的提供商。”

Danai Antoniou，Gradient Labs 联合创始人兼首席科学家

从 SOP 迈向实时系统

在银行业，客户互动受标准操作程序（SOP）约束，这些程序定义了每一步应当发生的事项。

一次典型的客户互动可能如下：

客户来电报告银行卡被盗。
系统验证其身份，并实时处理更正和打断。
验证通过后，系统冻结银行卡并启动换卡流程。
系统回答后续问题，例如配送时间，并建议下一步操作。

每一步都遵循既定程序，并基于用户输入、上下文、运行中的护栏以及客户和 Agent 的回应实时作出决策，以确保合规。

“模型需要在打断、附和反馈和话题切换之间保持程序状态，同时保持快速生成响应，”Antoniou 表示。“大多数提供商甚至无法尝试做到这一点。”

Gradient Labs 会在其最具挑战性的流程上对提供商进行基准测试，并按他们所称的轨迹准确率进行评估：即系统是否从始至终遵循正确路径。

在他们的一项初始评估中，GPT‑4.1 是唯一达到 97% 轨迹准确率和一致性的模型。次接近的提供商为 88%。

“在金融服务领域，这就是解决一次来电与造成一次合规事件之间的差别，”Antoniou 说。

这一结果影响了 Gradient Labs 的系统设计方式。团队构建了一种混合架构，将 OpenAI 模型用于推理密集型步骤，将较小模型用于更快且确定性的任务，并根据复杂度和延迟约束自适应路由。

在内部，该系统由中央推理 Agent 编排的专业技能组成，使复杂案例能够在不同工作流之间流转而不丢失上下文。

对于每次互动，15 个以上护栏系统并行运行，以确保对话保持在既定程序和合规边界内，包括金融建议检测、脆弱性信号、投诉，以及绕过验证或访问敏感数据的尝试。

在高风险环境中证明可靠性

金融机构不会仅凭信任部署这样的系统。它们需要逐步看到系统在真实环境下能够正确运行。

“你必须从一开始就以无幻觉为目标进行架构设计，”Antoniou 表示。“这需要成为构建过程中的指导原则。”

为了评估新模型和现有模型，团队会重放真实客户对话，并将系统行为与预期流程进行比较。他们还会生成合成对话，在任何内容部署之前测试边缘案例和罕见场景。

Gradient Labs 还让团队能够控制系统的引入方式。他们分析历史支持数据，以绘制一家银行所处理的客户问题类型及其发生频率。随后，团队可以选择 AI 应处理哪些类别，从较低风险的工作流开始，并随着时间逐步扩展。

Dashboard interface for a banking support tool showing a procedure titled Fraud impersonation callback with step by step instructions for verifying suspicious payments. A live call transcript appears on the right with messages between an AI

上线前，客户可以模拟对话，审查系统在不同场景下的响应方式，从而建立其按预期运行的信心。

部署通常从一小部分流量开始，并通过持续监控和自动化检查标记可能需要人工审查的对话。随着系统展现出稳定表现，覆盖范围会逐步扩大。

展示首日影响，以及未来路径

Gradient Labs 的客户报告称，CSAT 分数最高可达 98%，在某些情况下超过其最佳人工 Agent。多数部署在第一天的解决率就超过 50%，即便是争议、账户验证和欺诈等复杂工作流也是如此。

这种影响也体现在公司的增长上。过去一年，Gradient Labs 的收入增长超过 10 倍，并从入站支持扩展到出站和后台流程。

展望未来，Gradient Labs 专注于能够在多次互动之间承载上下文的系统：理解客户历史、跟踪持续问题，并从此前对话中断的地方继续。这一方向与 Gradient Labs 对其与 OpenAI 长期合作关系的思考高度一致。

“我们不只是在为今天选择一个模型。我们是在一个平台上构建，因为我们看到推理模型的发展轨迹与我们的产品方向一致。”

Danai Antoniou，Gradient Labs 联合创始人兼首席科学家

随着模型持续改进，可以安全自动化的流程范围也在扩大。对 Gradient Labs 而言，这意味着更接近这样一种系统：每一次客户互动都能以顶尖人工 Agent 的一致性、判断力和连续性来处理。

OpenAI <3 初创公司

Join the community Start building（在新窗口中打开）

继续阅读

Warp customer story 1x1 hero art card

Warp 押注用 GPT-5.5 构建开源

初创公司，2026 年 5 月 27 日

Parloa > Card

Parloa 构建客户愿意交谈的服务 Agent

初创公司，2026 年 5 月 7 日

Descript > 1x1 Card

Descript 如何大规模工程化多语言视频配音

初创公司，2026 年 3 月 6 日

原文标题

Gradient Labs gives every bank customer an AI account manager