概要

毎日何百万もの人々がUberを利用して乗車を予約し、食事を注文し、荷物を送ったり柔軟に稼いだりしています。タップ一つの背後には、交通、天候、空港到着、地域イベント、需要などに左右される複雑なリアルタイムマーケットプレイスが存在します。Uberは大規模に運営しており、1日あたり4,000万件の乗車、1,000万人のドライバーと配達員、15,000の都市、70か国以上でサービスを提供しています。

長年にわたりUberは機械学習をマーケットプレイス支援に活用してきました。現在、OpenAIのフロンティアモデルと大規模言語モデル（LLM）の恩恵により、複雑なシグナルをより迅速に推論し、高速な会話応答を提供し、アプリ内での音声体験を実現できるようになりました。UberとOpenAIの協業は、ドライバーや配達員の稼ぎやすさを簡素化し、乗客の予約の摩擦を減らすAI搭載プロダクトの構築を加速しています。

「これまで手の届かないと感じられた問題が、テクノロジーの力で初めて解決可能になっている。」 — Aarathi Vidyasagar, VP of Engineering and Science

ドライバー向け：複雑なマーケットプレイスデータをリアルタイムのガイダンスへ

ドライバーにとって柔軟性はUberの大きな強みの一つです。フルタイムで働く人もいれば、週末のみ、授業の合間やシフトの隙間に働く人もいます。この柔軟性は、常に選択肢を評価し続けることを意味します。たとえば: 今どこに待機すべきか？空港まで行く価値はあるか？昼食時にライドからデリバリーに切り替えるべきか？今日の収入がいつもと違って見えるのはなぜか？

これらの質問に答えるために、UberはUber Assistantを開発しました。Uber Assistantは、オンボーディングや初回の乗車から日々の収益最適化まで、ドライバーのライフサイクルを支援するAI搭載アシスタントです。

市場のサマリーやリアルタイムインサイトを提示して、ドライバーが自身でより良い判断を下せるようにする
収益動向やヒートマップなど複雑なデータをシンプルで実行可能な立ち位置の提案に変換
ドライバーは自然言語でフォローアップ質問を行い、カスタマイズされた応答を受け取りアプリ内を容易に操作可能

Uberの目標は認知的負荷（複雑なマーケットプレイスデータを解釈しながら稼ぐために必要な努力）を減らすことです。特に新しいドライバーにとって、AIによるデータの要約とわかりやすい提示は、試行錯誤よりもはるかに速くワークフローと市場のダイナミクスを学習する手助けになります。

「アシスタントは、プラットフォームの仕組みを理解するために数百回の走行を要する代わりに、ドライバーの立ち上がりを速めています。」 — Dharmin Parikh, Director of Product Management

新規ドライバー向けの支援として期待されていた一方で、経験豊富なドライバーもフォローアップ質問や最適化のために繰り返し利用しており、本ツールが単なるオンボーディング用ではなく長期的に価値を提供するユーティリティであることが検証されています。

規模での信頼構築：マルチエージェントAIシステム

Uberにとって、正確性、安全性、信頼性、速度は、ドライバーや配達員とやり取りするAIシステムを導入する際の最重要項目です。主な考慮点は、出力がポリシー内に留まることと、モバイルのリアルタイムアプリが期待するレイテンシーを満たすことです。

UberはUber Assistantを安全性、信頼、低レイテンシの三原則で設計しました。エンジニアリングチームはマルチエージェントアーキテクチャを構築し、各ユーザーリクエストを最も適切な専門システムにルーティングします。たとえば、収益に関する質問はオンボーディングの質問と異なる処理を必要とし、市場ガイダンスはトランザクション的な操作とは異なる推論を要します。この設計により、各タスクを運用上最適なモデルへ割り当てられます。

軽量な分類や高速応答にはナノ／ミニモデルなどの高速モデルを使用
より複雑なタスクには大規模な推論モデルを活用
内部ガバナンス層としてAI Guardを開発し、プロンプトと応答のスクリーニングで安全性、プライバシー、セキュリティを促進、ポリシー適用、幻覚の低減、一貫性の維持を実現

正確で有用な推奨が提供されるとユーザーは戻ってきます。質問を重ね、繰り返し関与し、プラットフォーム上で生産的な時間を増やします。

「ユーザーがシステムを信頼しなければすぐに離れてしまう。しかし価値を感じれば戻ってくる。」 — Parikh

音声でアクセシビリティを広げる

UberはOpenAI Realtime APIsを活用して、次の大きなインターフェース変革の一つである音声に取り組んでいます。アプリへのタイピングは単純なリクエストでは効率的ですが、多くの交通やコマースに関するニーズはより複雑です。たとえば:

「手荷物が5つ、同行者が5人います。空港まで快適な車をお願いします。何を推奨しますか？」
高齢者や視覚障害のある乗客はメニューをタップするより話すことを好む場合がある

新しい音声体験は、こうした瞬間を摩擦のないものにするよう設計されています。ユーザーはUberアプリの「どこへ」検索バーのマイクアイコンをタップして自然な音声で乗車をリクエストできます。システムはRealtime APIとその他のフロンティアモデルを用いて意図を解釈し、保存済みの場所や顧客コンテキストを活用して推奨を行い、アプリ内で音声と視覚の応答を同期させます。

荷物の多い移動ではUberXLを提案するなどの推奨が可能
「自宅」のような保存済み目的地を認識して優先的に扱う
ドライバー側ではハンズフリーでアプリとやり取りできるようにする

「音声は一度に一つのタスクを完了するという障壁を取り除く。自然に完全な意図を表現でき、システムがその結果を編成できる。」 — Parikh

注: Voice Booking機能は今後数週間で展開予定

高速な反復、強いチーム、より良い製品

LLMの能力が急速に進化する中、Uberはチームの構築方法も変えています。組織全体のエンジニアはプロンプト、検索／レトリーバルシステム、評価パイプライン、オーケストレーションフレームワークを扱うようになりました。プロダクト、法務、オペレーション、デザインチームがより密接に協働し、ポリシー境界を定義し、出力をテストし、ユーザー体験を改善しています。

かつては小規模な中央集権的なAIチームがイノベーションを担っていましたが、現在はインテリジェンスを企業全体に埋め込めるようになり、多くのチームが貢献できるようになりました。

「もはや一つの専門グループだけがこれを行うのではない。構築の障壁が下がったことで、多くのチームが貢献できる。」 — Vidyasagar

この変化は実験の加速とアイデアの創出を促します。Vidyasagarは「すべてのドライブ、すべてのトリップは一連のイベントであり、そのニュアンスを理解・処理できるのがLLMだ。私たちの規模でそれが解放されると非常に強力だ」と述べています。

マーケットプレイス全体へのインテリジェンスのスケーリング

Uber Assistantは米国内のドライバーネットワークに対して実験的なロールアウトを拡大しており、Uberは体験のテストと改善を継続しています。主な成果と指標は以下の通りです。

数十万人の米国ドライバーがUber Assistantのベータ体験にアクセス可能
新規ライフサイクルドライバーのサポート強化により、より多くの乗車に繋がるポジショニングの向上
成功したインタラクションの後に繰り返し利用が発生するなどの高いリピートエンゲージメント
よりスマートなマーケットプレイスインサイトによるプラットフォーム上での時間利用の改善
モデル専門化と継続的評価システムによる製品反復サイクルの高速化

新しいドライバーの初回乗車支援から、より良い収入機会を求める経験豊富なドライバーへのガイドまで、UberはOpenAIのモデルを使って働き方をより生産的にし、交通をよりシームレスにし、日常のロジスティクスをより人間的にしています。

「エンジニアとして、OpenAIはこれらの問題を異なる・独自の方法で解く能力を解放してくれる。」 — Vidyasagar

世界中で100万を超える企業がOpenAIで有意な成果を上げています。詳細はContact salesへお問い合わせください。

Uber uses OpenAI to help people earn smarter and book faster

Summary

Summary

Key Points

Practical notes for engineers

Translations

概要

ドライバー向け：複雑なマーケットプレイスデータをリアルタイムのガイダンスへ

規模での信頼構築：マルチエージェントAIシステム

音声でアクセシビリティを広げる

高速な反復、強いチーム、より良い製品

マーケットプレイス全体へのインテリジェンスのスケーリング