OpenAIGemini2026/05/19 17:45

Gemini 3.5: frontier intelligence with action

要点だけを先に読めるように短く再構成したセクションです。

元記事

Quick Digest

要約

要点だけを先に読めるように短く再構成したセクションです。

openaijamodel: gpt-5-mini-2025-08-07

Gemini 3.5:実行力を備えたフロンティア知能

Key Points

  • 3.5 Flash公開
  • エージェント主導ワークフロー
  • 4倍のトークン/秒

Summary

Gemini 3.5 Flash を本日公開。エージェント指向の長期ワークフローとコーディングに最適化され、フロンティアモデルに匹敵する性能をFlashシリーズの高速性で提供します。3.5 Pro は社内で運用中で、来月展開予定です。

Key Points

  • 提供状況: Geminiアプリ/Search の AI モード、Google Antigravity、Gemini API(AI Studio、Android Studio)、Gemini Enterprise Agent Platform、Gemini Enterprise で利用可能。
  • 性能指標: Terminal‑Bench 2.1 = 76.2%、GDPval‑AA = 1656 Elo、MCP Atlas = 83.6%、CharXiv Reasoning = 84.2%。出力トークン/秒は他フロンティアモデル比で4倍。
  • エージェント機能: Antigravity ハーネスとサブエージェントで長期・並列ワークフローを実行(コードモダナイズ、ゲーム実装、資産分類、並列UI/グラフィックス生成等)。
  • コスト効率: 長期タスクでは多くの場合、他フロンティアモデルの半分以下のコストで実行可能。
  • セーフティ: Frontier Safety Framework に準拠。サイバー/CBRN 対策の強化と解釈可能性ツールで内部推論のチェックを支援。
  • エンジニア向け実務アドバイス: まず小規模プロトタイプで Antigravity + サブエージェントを検証し、レイテンシ・吞吐・コストをベンチマークしてから本番展開することを推奨。

Full Translation

翻訳

原文の流れを保ったまま読める翻訳セクションです。

openaijamodel: gpt-5-mini-2025-08-07

Gemini 3.5:行動を伴うフロンティア知能

著者: Koray Kavukcuoglu(CTO, Google DeepMind / Chief AI Architect, Google)、Jeff Dean(Chief Scientist, Google DeepMind / Google Research)、Oriol Vinyals(Vice President, Google DeepMind)、Noam Shazeer(Vice President, Google DeepMind)

公開日: 2026-05-19

概要

今日、我々はフロンティア知能と行動(action)を組み合わせた最新のモデルファミリー「Gemini 3.5」を発表します。本シリーズは、より高度なエージェント構築における大きな前進を示します。まずは「3.5 Flash」を公開します。これはエージェントやコーディングにおいてフロンティア級の性能を提供し、実世界で有用な複雑な長期タスクに優れた能力を発揮します。

3.5 Flashは本日から世界中の多数のユーザーが利用可能です:

  • 一般向け: Gemini app と AI Mode in Google Search
  • 開発者向け: Google Antigravity(エージェント優先の開発プラットフォーム)、Gemini API(Google AI Studio と Android Studio)
  • 企業向け: Gemini Enterprise Agent Platform と Gemini Enterprise

同時に、社内で既に使われている「3.5 Pro」も鋭意開発中で、来月より展開を予定しています。

3.5 Flash:エージェントとコーディングにおけるフロンティア性能

Gemini 3.5 Flashは、複数の次元で大型フラッグシップモデルに匹敵する知能を、Flashシリーズで期待される速度で提供します。エージェント性能とコーディング性能の両面で最も強力なモデルであり、以下のようなベンチマークでGemini 3.1 Proを上回ります:

  • Terminal-Bench 2.1: 76.2%
  • GDPval-AA: 1656 Elo
  • MCP Atlas: 83.6%
  • マルチモーダル理解: CharXiv Reasoning 84.2%

出力トークン毎秒(tokens per second)の観点では、他のフロンティアモデルより4倍高速です。Artificial Analysis indexの右上(高性能かつ高速)に位置し、品質と待ち時間(レイテンシー)を両立することを示しています。

3.5 Flash:大規模エージェントタスク

この速度と性能のバランスにより、3.5 Flashは長期にわたるエージェントタスクに最適です。かつては開発者に数日、監査者に数週間を要していた作業を、3.5 Flashは短時間で、しばしば他のフロンティアモデルの半分以下のコストで支援します。迅速に計画・構築・反復を行い、アプリ開発、コードベースの保守、財務書類の準備などの実世界問題を解決します。

また、更新されたAntigravityハーネスと組み合わせることで、3.5 Flashは共同サブエージェントを展開して、大規模で要求の高いユースケースに対応する強力なエンジンになります。監督下では、マルチステップのワークフローやコーディングタスクを信頼性を持って実行しつつフロンティア性能を維持します。

Antigravityを用いた実例

  • Antigravityによるハーネスで、動的な基準に基づき非構造化資産を自動でリネームおよび分類するマルチステップワークフローを実行
  • Antigravityで2つのエージェントを用い、AlphaZeroの論文を要約し、完全にプレイ可能なゲームを6時間でコーディング
  • 混沌としたレガシーコードベースをNext.jsに変換
  • サブエージェントを使って新しい都市景観(city landscapes)を生成
  • ビルダーとプレイヤーの2エージェントが自己改善ループで連携し、ゲームを開発

リッチなグラフィックスとインタラクティブUI

Gemini 3の強力なマルチモーダル基盤により、3.5 FlashはよりリッチでインタラクティブなウェブUIやグラフィックを生成します。

  • AI Studio上で研究論文向けのインタラクティブなアニメーションを生成
  • テキスト記述をインタラクティブなハードウェア表現に変換(AI Studio)
  • 複数のコンセプトを並列実行して、学校の募金イベント向けのフルブランディングコンセプトを構築(AI Studio)
  • チェックアウトフローの異なるUXアプローチを60秒で生成(AI Studio)

実世界のインパクト

3.5 Flashのエージェント機能は、開発者や企業にとって既に有意義な進展をもたらしています。モデルシリーズ開発に際し、我々は業界パートナーと緊密に協力し、ワークフロー上の手間や複雑さが生じる箇所を把握しました。パートナーは以下のような効果を報告しています:

  • Shopify: サブエージェントを並列実行して長期にわたる複雑なデータ解析を行い、より正確なグローバルなマーチャント成長予測を実現
  • Macquarie Bank: 100ページ超の複雑な書類を推論し、関連情報を取り出して信頼性の高い推奨を低レイテンシで提供し、オンボーディングを加速
  • Salesforce: Agentforceに3.5 Flashを統合し、複数のサブエージェントがコンテキストを保持して複雑でマルチターンのツール呼び出しを実行することで、企業タスクの自動化を信頼性高く実現
  • Ramp: マルチモーダル理解と過去パターンの推論を組み合わせ、複雑な請求書に対するよりスマートで信頼性の高いOCRを実現
  • Xero: サプライヤの特定や1099税フォームの情報収集など、複雑で数週間に及ぶワークフローを自律的に管理し、小規模事業者の煩雑な事務を自動化
  • Databricks: エージェント的ワークフローでリアルタイム情報を監視・取得し、膨大なデータセット上で推論して問題を診断・修正提案を実施

パーソナルAIエージェント: Gemini Spark

3.5 Flashは現在、Gemini appとAI Mode in Searchのデフォルトモデルです。I/Oでは、日常生活にフロンティア級の知能をもたらす新機能を実演しました。新しいパーソナルAIエージェント「Gemini Spark」は3.5 Flashを採用し、24時間稼働でユーザーの指示のもと行動を取ります。

  • Gemini Sparkは本日から信頼できるテスターにロールアウトを開始
  • 米国のGoogle AI Ultra加入者向けにベータ提供を来週開始予定

Gemini Sparkは以下のような支援を行います(例示):

  • デジタル生活のナビゲーションやタスク代行
  • 継続的な情報収集・整理と実行支援
  • コーディングや書類処理などのエージェントタスクの自動化

また、3.5 Flashの強化されたエージェントコーディング能力はSearch上でもより知的な体験を提供し、24/7動作する情報エージェントや、より動的なジェネレーティブUI体験を実現します。

(例)Searchは3.5 Flashを使ってGyroidパターンを説明するインタラクティブなビジュアルを構築します。

フロンティアセーフガード

Gemini 3.5は我々の Frontier Safety Framework に基づいて開発されました。サイバーおよびC BRN(化学・生物・放射線)に関する保護を強化しており、有害なコンテンツ生成や、安全な問い合わせへの誤った応答拒否が発生しにくくなっています。これを実現するために、より高度な安全トレーニングや緩和策、そしてAIの内部推論をチェック・理解するための解釈可能性ツールを導入しています。

提供状況

Gemini 3.5 Flashは以下を通じて一般提供中です:

  • Google Antigravity
  • Gemini API(Google AI Studio, Android Studio)
  • Gemini Enterprise Agent Platform
  • Gemini Enterprise
  • Gemini app および AI Mode in Search(一般ユーザー向け)

Geminiチーム一同、皆さんがどんなものを作るか楽しみにしています。