Uberが OpenAI を活用して、ドライバーの収入向上と利用者の予約を高速化
Uberは OpenAI を活用して AI アシスタントと音声機能を搭載し、グローバルなリアルタイムマーケットプレイスにおいてドライバーがより賢く収入を得られ、利用者がより迅速に予約できるようにしています。
企業規模: Enterprise
地域: Global, North America
業界: Technology, Services
製品: API
毎日、数百万人がUberを利用して乗車予約、食事注文、荷物配送、柔軟な収入を得ています。すべてのタップの背後には、交通状況、天候、空港到着、地域イベント、需要によって形作られた複雑なリアルタイムマーケットプレイスがあります。
Uberは大規模に運営されています:1日4,000万件のトリップ、1,000万人のドライバーと配送員、70カ国以上の15,000都市での展開。各都市には独自の運営ダイナミクス、規制、利用者行動があり、グローバルスケールで継続的に適応する必要があるシステムを構成しています。
Uberは長年にわたって機械学習を活用してマーケットプレイスをサポートしてきました。そして今、大規模言語モデルと OpenAI のフロンティアモデルの利点を活かして、Uberはより迅速に複雑なシグナルを推論し、高速な会話応答を提供し、アプリ内の音声体験を実現できるようになりました。
Uberと OpenAI の協業により、Uberはドライバーと配送員の収入機会を簡素化し、利用者の摩擦を軽減する AI 搭載製品を構築できています。また OpenAI のモデルを使用することで、Uberはこれまで以上に迅速に合理化された製品とエクスペリエンスをリリースできます。
「初めて、テクノロジーが解決可能なことを主導しています。かつては手の届かないと思われていた問題が、今では対処可能になりました。」
—Aarathi Vidyasagar、VP of Engineering and Science
複雑なマーケットプレイスデータをドライバーへのリアルタイムガイダンスに変換
ドライバーにとって、柔軟性はUberの最大の強みの一つです。フルタイムで運転する者もいれば、週末だけの者もいます。授業やシフトの合間に運転する者もいます。この柔軟性はまた、ドライバーが常にオプションを評価し、質問を投げかけることを意味します:
- 今、どこにポジショニングすべきか?
- 空港に行く価値があるか?
- 昼間は乗車から配送に切り替えるべきか?
- なぜ今日の収入は異なるのか?
これらの質問に答えるため、Uberは Uber Assistant を開発しました。これはドライバーがプラットフォーム上のライフサイクル全体(オンボーディングと初回トリップから日々の収入最適化まで)を通じてサポートするために設計された AI 搭載アシスタントです。
「ドライバーがマーケットプレイスの要約ビューとリアルタイムインサイトを提供することで、自分たちにとってより良い決定を下せるようにしたいのです」と、Uberのプロダクト管理ディレクターである Dharmin Parikh は述べています。
アシスタントは、収入トレンドとヒートマップのような複雑なデータをシンプルで実行可能なポジショニングインサイトに変換することで、ドライバーがどこでいつ収入を得るかをサポートします。その後、ドライバーは平文で後続の質問をし、カスタマイズされた応答を受け取り、アプリを簡単にナビゲートできます。
Uberの目標は認知的オーバーヘッド(複雑なマーケットプレイスデータを解釈しながら収入を得るために必要な努力)を削減することです。これは新しいドライバーにとって特に価値があることが証明されています。Uberは、AI を使用して Uber のリアルワールドデータを要約し、簡単に伝達することで、試行錯誤だけでなく、ドライバーがワークフローとマーケットプレイスダイナミクスをはるかに速く学習できるようにすることで、ランプアップを加速できることを発見しました。
Uber Assistant は当初、新しいドライバーを最も支援することが期待されていましたが、経験豊富なドライバーもプラットフォーム上での時間を最適化するために後続の質問をするために繰り返し戻ってきました。これはこの製品をオンボーディングツールだけでなく、長期的なユーティリティとして検証しています。
「アシスタントはドライバーが迅速にランプアップするのを支援しており、プラットフォームの仕組みを理解するのに数百のトリップを要する場合と比較して大幅に短縮されています」と Parikh は述べています。
マルチエージェント AI システムでスケール時の信頼を構築
Uberにとって、ドライバーと配送員と相互作用する出力を持つ AI システムを実装する場合、精度、安全性、信頼性、速度は最優先事項です。重要な考慮事項には、応答がポリシー内に留まること、およびレイテンシーがリアルタイムモバイルアプリから期待される標準を満たすことが含まれます。
そのため、Uberは Uber Assistant を3つのコア原則の周りに設計しました:安全性、信頼性、低レイテンシー。
Uberのエンジニアリングチームは、各ユーザーリクエストを最も適切な専門システムにルーティングするマルチエージェントアーキテクチャを構築しました。例えば、収入に関する質問はオンボーディングの質問とは異なる方法で処理でき、マーケットプレイスガイダンスはトランザクション処理とは異なる推論が必要です。このアーキテクチャにより、Uberは各タスクを特定の運用ニーズに最も適したモデルにルーティングでき、各クエリが最も重要なことに適切に焦点を当てて処理されることを保証します。
軽量な分類と高速な応答のため、Uberはより高速な nano/mini モデルを使用します。より複雑なタスクの場合、Uberはより大きな推論モデルを活用します。
Uberはまた AI Guard を開発しました。これはプロンプトと応答をスクリーニングして安全性、プライバシー、セキュリティを促進し、ポリシーを実施し、ハルシネーションを削減し、エクスペリエンス全体で一貫性を維持するのに役立つ内部ガバナンスレイヤーです。
ドライバーが正確で有用な推奨事項を受け取ると、彼らは戻ってきます。より多くの質問をします。繰り返し関与します。そしてプラットフォーム上でより生産的な時間を過ごします。
「ユーザーがシステムを信頼しなければ、すぐに失われます」と Parikh は述べています。「しかし、彼らが価値を見ると、彼らは戻ってきます。」
音声によるアクセシビリティの拡大
Uberは OpenAI Realtime APIs をテクノロジーの次の大きなインターフェースシフトの一つである音声に適用しています。アプリへのタイピングは単純なリクエストには効率的です。しかし、多くの輸送とコマースのニーズはより複雑です。旅行者は「5つの荷物と5人の他の人がいます。空港への素敵な乗車が必要です。何をお勧めしますか?」と言いたいかもしれません。高齢者または視覚障害のある利用者は、メニューをタップするよりも話すことを好むかもしれません。
Uberの新しい音声体験は、これらの瞬間を摩擦のないものにするために設計されています。ユーザーは Uber アプリの「どこへ」検索バーのマイクアイコンをタップして、自然音声を使用して乗車をリクエストできます。システムは Realtime API と他のフロンティアモデルを使用して意図を解釈し、保存された場所と顧客コンテキストを活用し、推奨事項を提供します。同時にアプリ内で音声応答と視覚応答を同期します。
これは、荷物が多いトリップに対して UberXL を提案したり、「家」のような保存された目的地を認識したりすることを意味する可能性があります。
「音声は一度に1つのタスクを完了するという障壁を取り除きます」と Parikh は述べています。「完全な意図を自然に表現でき、システムが結果を調整できます。」
音声はまた、Uberのエコシステム全体でアクセシビリティを拡大し、新しいワークフローのロックを解除します。ドライバー側では、ドライバーがアプリとハンズフリーで相互作用できるようにします。利用者側では、より高速でシンプルな相互作用を望む顧客の摩擦を軽減できます。
「音声はマルチタップの障壁を取り除きます。複数のことを言うことができるからです」と Vidyasagar は述べています。「それはエコシステムのさまざまな部分を接続する能力のロックを解除します。」
注: Voice Booking 機能は今後数週間にわたってロールアウトされます
より高速な反復、より強いチーム、より良い製品
LLM 機能が急速に進化するにつれて、Uberはチームがどのように構築するかも変更しました。組織全体のエンジニアは、プロンプティング、検索システム、評価パイプライン、オーケストレーションフレームワークで作業します。プロダクト、法務、運用、デザインチームはより密接に協力して、ポリシー境界を定義し、出力をテストし、ユーザーエクスペリエンスを改善します。
小さな集中化された AI チームがイノベーションを所有する代わりに、インテリジェンスは現在会社全体に組み込むことができます。
「もはや小さな専門グループがこれをすべて行っているわけではありません」と Vidyasagar は述べています。「多くのチームが貢献できます。構築への障壁が低下したからです。」
そのシフトは実験を加速し、Uberのエコシステム全体で新しいアイデアを生成します。
「すべてのドライブ、すべてのトリップはイベントのシーケンスであり、その微妙さを理解し処理することが LLM が私たちのためにロック解除するものです」と Vidyasagar は述べています。「それは私たちが次に行くべき場所についての多くの情報を与えてくれます。そしてそのロック解除は、私たちが持つスケールで、例外的に強力です。」
マーケットプレイス全体でインテリジェンスをスケーリング
Uber Assistant は現在、実験的なロールアウトで米国ドライバーネットワーク全体に拡張されており、Uberはエクスペリエンスをテストして改善し続けています:
- 数十万の米国ドライバーが Uber Assistant ベータ体験にアクセス可能
- 初期ライフサイクルドライバーのサポート改善 - 新しいドライバーがより多くのトリップのためにより良くポジショニングするのを支援
- 強い繰り返し関与 - ユーザーが成功した相互作用の後に戻ってくる
- プラットフォーム上でのより良い時間利用 - より賢いマーケットプレイスインサイトを通じて
- モデル専門化と継続的な評価システムを通じた高速なプロダクト反復サイクル
新しいドライバーが最初のトリップを得るのを支援することから、より良い収入機会を求める経験豊富なドライバーをガイドすることまで、Uberは OpenAI モデルを使用して仕事をより生産的に、輸送をより円滑に、日常的なロジスティクスをより人間的にしています。
「エンジニアとして、OpenAI はこれらの問題を異なるユニークな方法で解決する能力のロックを解除するだけです」と Vidyasagar は述べています。
仕事の新しい時代に参加
世界中の100万以上のビジネスが OpenAI で意味のある結果を達成しています。