OpenAIOpenAI NewsApr 1, 2026, 2:00 AM

Gradient Labs gives every bank customer an AI account manager

A condensed section focused on the key takeaways first.

Original Post

Quick Digest

Summary

A condensed section focused on the key takeaways first.

openaienmodel: gpt-5-mini-2025-08-07

Gradient Labs gives every bank customer an AI account manager

Key Points

  • 500 ms voice latency
  • 97% trajectory accuracy (GPT‑4.1)
  • 15+ parallel compliance guardrails

Summary

Gradient Labs has deployed AI account managers for bank customers using OpenAI models (GPT‑4.1 for reasoning; GPT‑5.4 mini and nano for low-latency voice). The product runs a hybrid architecture that routes reasoning-intensive steps to larger models and deterministic tasks to smaller models, enforces 15+ parallel guardrails for compliance, and is validated by replaying real conversations and synthetic edge-case tests. Deployments start small with simulation and staged rollout, yielding high accuracy, fast voice responses, and strong customer satisfaction.

Key Points

  • Models & performance: GPT‑5.4 mini/nano deliver ~500 ms voice latency; GPT‑4.1 achieved 97% trajectory accuracy in internal evals (vs 88% for next-best). Reported +11% higher accuracy with GPT‑4.1 vs the next provider.
  • Architecture: hybrid routing with a central reasoning agent and specialized skills; smaller models handle deterministic tasks; function-calling reliability and low hallucination rates were primary requirements.
  • Compliance & safety: 15+ guardrail systems run in parallel (fraud detection, verification, vulnerability signals, complaint detection, bypass attempts) to keep conversations within procedures.
  • Testing & rollout: replay of real conversations, synthetic scenario generation, simulation for stakeholders, staged traffic ramps, continuous monitoring and automated human-review flags.
  • Outcomes: day-one deployments often hit >50% resolution for complex workflows, CSAT up to 98%, and company revenue grew 10x as coverage expanded into outbound and back-office.
  • Engineering implications: design for persistent procedure state across interruptions and topic switches, balance latency vs reasoning cost with adaptive routing, instrument trajectory-accuracy benchmarks, and build automated monitoring and human-in-the-loop gates.

Full Translation

Translations

A translation section that keeps the flow of the original article.

openaijamodel: gpt-5-mini-2025-08-07

Gradient Labs、すべての銀行顧客にAIアカウントマネージャーを提供

Gradient Labs、すべての銀行顧客にAIアカウントマネージャーを提供

2026-04-01 — スタートアップ Gradient Labs は、すべての銀行顧客に専任のアカウントマネージャーのような体験を提供するAIエージェントを展開しています。同社は OpenAI モデル(GPT‑4.1、GPT‑5.4 mini、GPT‑5.4 nano)を利用し、複雑な金融サポートワークフローを高精度かつ低レイテンシで実行します。

主要情報

  • 会社規模: Startup
  • 地域: Europe & UK
  • 業界: Technology, Finance
  • 製品: API
  • 主な成果:
    • 10x の収益成長
    • AIエージェント体験で 98% の顧客満足度(CSAT)
    • GPT‑4.1 は次点プロバイダよりも +11% 高精度

概要

銀行における顧客対応は単純ではなく、詐欺や支払いの停止などは複数チームにまたがる複雑な手順に厳密に従う必要があります。システムが不十分だと顧客は担当の切り替えや長い待ち時間に直面します。London 拠点の Gradient Labs は、こうした複雑さを扱うために設計されたAIエージェントで、顧客ごとに専任担当者のような体験を提供することを目指しています。

創業チームは以前 Monzo のAI・データ部門を率いており、プラットフォームは OpenAI モデルを基盤に構築されています。現在は本番トラフィックを GPT‑5.4 mini と nano に移行中です。

“We’re seeing 500-millisecond latency with GPT‑5.4 mini and nano, which is exactly what we need for natural voice conversations,” — Danai Antoniou, Co-Founder and Chief Scientist at Gradient Labs

“We needed three things simultaneously: accuracy at instruction-following, low hallucination rates, and function-calling reliability, all under voice latency constraints. OpenAI was the only provider that passed on all three.” — Danai Antoniou

SOP(標準作業手順)からリアルタイムシステムへ

銀行の顧客対応は各ステップで何を行うべきかを定義した SOP に従います。一般的な顧客対応の流れの例:

  1. 顧客が盗難カードを報告して電話をかける。
  2. システムがリアルタイムで本人確認を行い、訂正や割り込みにも対応する。
  3. 本人確認が完了したらカードを凍結し、再発行を開始する。
  4. 配送予定などの追問に答え、次のステップを提案する。

各ステップは定義済みの手順に従い、意思決定はユーザー入力、文脈、実行中のガードレール、顧客およびエージェントの応答に基づいてリアルタイムで行われ、コンプライアンスが確保されます。

“The model needs to maintain procedure state across interruptions, backchannels, and topic switches while keeping response generation fast. Most providers couldn't even attempt it.” — Danai Antoniou

Gradient Labs は最も難易度の高い手順に対してプロバイダをベンチマーク化し、彼らが "trajectory accuracy"(開始から終了まで正しい経路を辿るか)で評価します。初期評価の一つでは、GPT‑4.1 が唯一 97% の trajectory accuracy と一貫性を達成し、次点は 88% でした。金融サービスではこれは「通話を解決するか、コンプライアンス事案を作るか」の差になります。

この結果を受け、Gradient Labs はハイブリッドアーキテクチャを採用しました。理由付けを必要とするステップには OpenAI のモデルを使い、より速く決定論的なタスクには小型モデルを使ってルーティングを複雑さやレイテンシ制約に応じて切り替える設計です。内部的には専門化されたスキルを中央の reasoning agent がオーケストレーションし、複雑なケースがワークフローをまたいでも文脈を失わないようにしています。

また、各インタラクションでは 15 を超えるガードレールシステムが並列稼働し、会話が定義された手順とコンプライアンス境界内に留まるよう監視しています。これには金融助言の検出、脆弱性シグナル、苦情判定、本人確認回避の試みや機密データへのアクセス試行の検出などが含まれます。

ハイリスク環境での信頼性検証

金融機関はこうしたシステムを信頼だけで導入しません。現実条件下で段階的に正しく振る舞うことを確認する必要があります。Antoniou は「幻覚(hallucinations)を発生させない設計を根本から行う必要がある」と述べています。

Gradient Labs は既存モデル・新規モデルの評価のために実際の顧客会話をリプレイして、システムの挙動を期待される手順と比較します。加えて、稀なケースやエッジケースを検証するために合成会話を生成して展開前にテストします。

導入方法も柔軟で、過去のサポートデータを分析して銀行が扱う問題の種類と発生頻度をマッピングし、AIが担当するカテゴリを選べるようにしています。低リスクのワークフローから開始し、段階的に拡張していきます。運用前には顧客側で会話をシミュレーションして様々なシナリオでの応答を確認し、期待通りに動作するかを検証できます。

本稼働は通常ごく一部のトラフィックから開始され、継続的モニタリングと自動チェックが人的レビューを要する会話をフラグします。時間をかけて、システムが一貫した性能を示すにつれて適用範囲を拡大していきます。

初日からの効果と今後の展望

Gradient Labs の顧客は CSAT が最大 98% に達したと報告しており、場合によってはベストの人間エージェントを上回る成果を出しています。ほとんどの導入は初日から 50% 以上の解決率を示し、異議申し立て、口座確認、詐欺対応といった複雑なワークフローでも同様です。

この効果は同社の成長にも反映され、Inbound サポートから Outbound やバックオフィス業務へと事業を拡大し、過去1年で収益は10倍以上に増加しました。

今後は対話間で文脈を維持できるシステム、つまり顧客の履歴を理解し、進行中の問題を追跡し、前回の会話の続きを引き継げる仕組みの開発に注力しています。これは Gradient Labs が OpenAI と長期的に連携する考え方とも整合しています。

“We’re not just choosing a model for today. We’re building on a platform where we see the trajectory of reasoning models going in the same direction as our product.” — Danai Antoniou

モデルが進化するにつれ、安全に自動化できる手順の範囲は広がります。Gradient Labs にとっての目標は、すべての顧客インタラクションが最高水準の人間エージェントと同等の一貫性、判断、継続性で扱われるシステムに近づくことです。


関連リンク & 参照記事:

  • OpenAI
  • Start building (opens in a new window)
  • 他の関連記事: How Descript engineers multilingual video dubbing at scale / Inside Praktika's conversational approach to language learning / How Higgsfield turns simple ideas into cinematic social videos