Gemini API ツーリングの更新: コンテキスト循環、ツールの組み合わせ、Gemini 3向け Maps グラウンディング
開発者は、1つの Gemini API リクエスト内で関数呼び出しと組み込みツール(例: Google Search)を組み合わせて、エージェント的で複雑なツール利用アプリケーションを構築できるようになりました。
Mariano Cocirio(Product Manager, Google DeepMind)
Philipp Schmid(Developer Relations Engineer, Google DeepMind)
概要
エージェント的なワークフローがスケールすると、オーケストレーションがボトルネックになり得ます。今回のアップデートでは、組み込みツール(Google Search や Google Maps など)とカスタム関数を単一リクエストで組み合わせられるようにし、ツール呼び出しやターンを跨いだコンテキスト循環(context circulation)を可能にし、さらに Gemini 3 ファミリー向けに Google Maps を用いた Grounding を拡張しました。
API の新しいツーリング機能
組み込みツールとカスタムツールを同一インタラクションで併用
以前は、組み込みツール(例: Google Search)を使うタイミングとカスタム関数を使うタイミングを慎重に設計する必要がありました。今回からは、組み込みツールと独自のカスタムツールを同じリクエストに渡せます。これにより、Gemini が Google Search で公開データを取得した直後にバックエンドを呼び出すなど、別のオーケストレーション手順を挟まずに処理を切り替えられます。結果としてエンドツーエンドのレイテンシが低下し、エージェントのアーキテクチャが簡素化されます。
- 開発者リクエストの上位項目だった機能
- file search、Google Maps、Search、カスタム関数を組み合わせられる
組み込みツール間のコンテキスト循環(Cross-tool context circulation)
複数ステップのワークフローでは、あるツールの出力を別のツールの入力として使う必要があります。組み込みツールのコンテキスト循環は、各ツール呼び出しとそのレスポンスをモデルのコンテキスト内に保持するため、後続のステップがそのデータにアクセスして推論に利用できます。
- 例: 組み込みツールでリアルタイムの天気データを取得し、そのコンテキストを会場予約用のカスタムツールに渡す
ツール呼び出し用のレスポンス ID
非同期のツール実行や並列関数呼び出しを扱う際のデバッグ性と正確なマッピングを向上させるため、すべてのツール呼び出しに一意の呼び出し識別子(id)を導入しました。これにより、モデルが要求した特定のツール呼び出しとクライアント側の正確なレスポンスを対応付けられます。
id によって並列実行時のレスポンス追跡が簡単に
- 複数ツールを組み合わせたフローのデバッグ性向上
ここには Grounding with Google Search を使ったマルチツール組み合わせフローのコードスニペットの例が入ります。
組み込みツーリングの拡張
Gemini 3 ファミリー向けの Grounding with Google Maps
位置情報コンテキストはモダンなエージェント構築において重要な要素です。本日より、Gemini 3 ファミリーのモデルで Google Maps を用いた Grounding をサポートします。これにより、選択した Gemini 3 モデルで Maps をツールとして有効化し、最新の空間データ、ローカルビジネス情報、通勤時間、施設情報などにアクセスして、より正確で位置認識型の応答を提供できます。
- Maps を使って内部在庫 API と組み合わせるなど、複雑なエージェント的ワークフローを実現可能
Interactions API の推奨
これらのワークフローは generateContent API でもサポートされていますが、サーバー側ステート管理と統一された推論トレースを活かすために、新しい Interactions API の利用を推奨します。
まとめ
今回の変更により、開発者は単一のリクエストで組み込みツールとカスタム関数を柔軟に組み合わせ、ツール呼び出し間でコンテキストを循環させ、Gemini 3 向けに Google Maps ベースの Grounding を利用して、より高度でスケーラブルなエージェントを構築できるようになりました。
Start building today.