Gradient Labs、すべての銀行顧客にAIアカウントマネージャーを提供
2026-04-01 — スタートアップ Gradient Labs は、すべての銀行顧客に専任のアカウントマネージャーのような体験を提供するAIエージェントを展開しています。同社は OpenAI モデル(GPT‑4.1、GPT‑5.4 mini、GPT‑5.4 nano)を利用し、複雑な金融サポートワークフローを高精度かつ低レイテンシで実行します。
主要情報
- 会社規模: Startup
- 地域: Europe & UK
- 業界: Technology, Finance
- 製品: API
- 主な成果:
- 10x の収益成長
- AIエージェント体験で 98% の顧客満足度(CSAT)
- GPT‑4.1 は次点プロバイダよりも +11% 高精度
概要
銀行における顧客対応は単純ではなく、詐欺や支払いの停止などは複数チームにまたがる複雑な手順に厳密に従う必要があります。システムが不十分だと顧客は担当の切り替えや長い待ち時間に直面します。London 拠点の Gradient Labs は、こうした複雑さを扱うために設計されたAIエージェントで、顧客ごとに専任担当者のような体験を提供することを目指しています。
創業チームは以前 Monzo のAI・データ部門を率いており、プラットフォームは OpenAI モデルを基盤に構築されています。現在は本番トラフィックを GPT‑5.4 mini と nano に移行中です。
“We’re seeing 500-millisecond latency with GPT‑5.4 mini and nano, which is exactly what we need for natural voice conversations,”
— Danai Antoniou, Co-Founder and Chief Scientist at Gradient Labs
“We needed three things simultaneously: accuracy at instruction-following, low hallucination rates, and function-calling reliability, all under voice latency constraints. OpenAI was the only provider that passed on all three.”
— Danai Antoniou
SOP(標準作業手順)からリアルタイムシステムへ
銀行の顧客対応は各ステップで何を行うべきかを定義した SOP に従います。一般的な顧客対応の流れの例:
- 顧客が盗難カードを報告して電話をかける。
- システムがリアルタイムで本人確認を行い、訂正や割り込みにも対応する。
- 本人確認が完了したらカードを凍結し、再発行を開始する。
- 配送予定などの追問に答え、次のステップを提案する。
各ステップは定義済みの手順に従い、意思決定はユーザー入力、文脈、実行中のガードレール、顧客およびエージェントの応答に基づいてリアルタイムで行われ、コンプライアンスが確保されます。
“The model needs to maintain procedure state across interruptions, backchannels, and topic switches while keeping response generation fast. Most providers couldn't even attempt it.”
— Danai Antoniou
Gradient Labs は最も難易度の高い手順に対してプロバイダをベンチマーク化し、彼らが "trajectory accuracy"(開始から終了まで正しい経路を辿るか)で評価します。初期評価の一つでは、GPT‑4.1 が唯一 97% の trajectory accuracy と一貫性を達成し、次点は 88% でした。金融サービスではこれは「通話を解決するか、コンプライアンス事案を作るか」の差になります。
この結果を受け、Gradient Labs はハイブリッドアーキテクチャを採用しました。理由付けを必要とするステップには OpenAI のモデルを使い、より速く決定論的なタスクには小型モデルを使ってルーティングを複雑さやレイテンシ制約に応じて切り替える設計です。内部的には専門化されたスキルを中央の reasoning agent がオーケストレーションし、複雑なケースがワークフローをまたいでも文脈を失わないようにしています。
また、各インタラクションでは 15 を超えるガードレールシステムが並列稼働し、会話が定義された手順とコンプライアンス境界内に留まるよう監視しています。これには金融助言の検出、脆弱性シグナル、苦情判定、本人確認回避の試みや機密データへのアクセス試行の検出などが含まれます。
ハイリスク環境での信頼性検証
金融機関はこうしたシステムを信頼だけで導入しません。現実条件下で段階的に正しく振る舞うことを確認する必要があります。Antoniou は「幻覚(hallucinations)を発生させない設計を根本から行う必要がある」と述べています。
Gradient Labs は既存モデル・新規モデルの評価のために実際の顧客会話をリプレイして、システムの挙動を期待される手順と比較します。加えて、稀なケースやエッジケースを検証するために合成会話を生成して展開前にテストします。
導入方法も柔軟で、過去のサポートデータを分析して銀行が扱う問題の種類と発生頻度をマッピングし、AIが担当するカテゴリを選べるようにしています。低リスクのワークフローから開始し、段階的に拡張していきます。運用前には顧客側で会話をシミュレーションして様々なシナリオでの応答を確認し、期待通りに動作するかを検証できます。
本稼働は通常ごく一部のトラフィックから開始され、継続的モニタリングと自動チェックが人的レビューを要する会話をフラグします。時間をかけて、システムが一貫した性能を示すにつれて適用範囲を拡大していきます。
初日からの効果と今後の展望
Gradient Labs の顧客は CSAT が最大 98% に達したと報告しており、場合によってはベストの人間エージェントを上回る成果を出しています。ほとんどの導入は初日から 50% 以上の解決率を示し、異議申し立て、口座確認、詐欺対応といった複雑なワークフローでも同様です。
この効果は同社の成長にも反映され、Inbound サポートから Outbound やバックオフィス業務へと事業を拡大し、過去1年で収益は10倍以上に増加しました。
今後は対話間で文脈を維持できるシステム、つまり顧客の履歴を理解し、進行中の問題を追跡し、前回の会話の続きを引き継げる仕組みの開発に注力しています。これは Gradient Labs が OpenAI と長期的に連携する考え方とも整合しています。
“We’re not just choosing a model for today. We’re building on a platform where we see the trajectory of reasoning models going in the same direction as our product.”
— Danai Antoniou
モデルが進化するにつれ、安全に自動化できる手順の範囲は広がります。Gradient Labs にとっての目標は、すべての顧客インタラクションが最高水準の人間エージェントと同等の一貫性、判断、継続性で扱われるシステムに近づくことです。
関連リンク & 参照記事:
- OpenAI
- Start building (opens in a new window)
- 他の関連記事: How Descript engineers multilingual video dubbing at scale / Inside Praktika's conversational approach to language learning / How Higgsfield turns simple ideas into cinematic social videos