OpenAIGeminiMay 19, 2026, 5:45 PM

Gemini 3.5: frontier intelligence with action

A condensed section focused on the key takeaways first.

Original Post

Quick Digest

Summary

A condensed section focused on the key takeaways first.

openaienmodel: gpt-5-mini-2025-08-07

Gemini 3.5: frontier intelligence with action

Key Points

  • Frontier agentic and coding performance
  • Approximately 4× faster output throughput
  • Available now across app, API, Antigravity and enterprise

Summary

Gemini 3.5 (launching with 3.5 Flash) combines frontier reasoning, coding and multimodal understanding with high-throughput execution for agentic workflows. 3.5 Flash delivers flagship-level accuracy on benchmarks while providing up to 4× higher output throughput, making it suited for long-horizon, multi-step tasks at lower latency and cost. It is available today across the Gemini app, AI Mode in Search, Google Antigravity, the Gemini API (AI Studio, Android Studio) and enterprise platforms; 3.5 Pro is rolling out next month.

Key Points

  • Performance: matches or exceeds prior flagship results on agentic and coding benchmarks (Terminal-Bench 2.1: 76.2%; GDPval-AA: 1656 Elo; MCP Atlas: 83.6%; CharXiv Reasoning: 84.2%) while delivering ~4× token/sec throughput.
  • Agent orchestration: optimized for long‑horizon workflows via the Antigravity harness and subagents to plan, build, iterate and execute multi-step tasks (examples: codebase migration to Next.js, game development, automated asset categorization).
  • Multimodal outputs: generates richer interactive UIs, animations and hardware mockups; speeds up UX and branding iterations.
  • Real-world adoption: deployed with partners (Shopify, Macquarie Bank, Salesforce, Ramp, Xero, Databricks) for forecasting, document reasoning, OCR, onboarding and data diagnostics.
  • Personal agents & Search: powers Gemini Spark (personal 24/7 agent) and enhanced AI Mode experiences in Search.
  • Safety: developed under the Frontier Safety Framework with strengthened cyber and CBRN safeguards, safety training, mitigations and interpretability tools for inner reasoning checks.
  • Availability: 3.5 Flash is generally available now; 3.5 Pro is in internal use and planned public rollout next month.

Practical guidance for engineers

  • Use cases: choose 3.5 Flash for latency-sensitive agentic workflows, heavy multimodal generation, and coding tasks where throughput reduces wall time.
  • Integration: access via Gemini API (AI Studio/Android Studio) for direct model calls or use Antigravity for orchestrating subagents; use Gemini Enterprise for enterprise deployments and governance.
  • Cost & benchmarking: expect significant time/cost reductions for long workflows (often <50% cost vs other frontier models); validate with representative end-to-end benchmarks and monitor orchestration overhead.
  • Safety operations: enable provided interpretability and safety controls when enabling tool-calling or continuous agents; apply enterprise governance and review risk profiles before production rollout.

Full Translation

Translations

A translation section that keeps the flow of the original article.

openaijamodel: gpt-5-mini-2025-08-07

Gemini 3.5:行動を伴うフロンティア知能

著者: Koray Kavukcuoglu(CTO, Google DeepMind / Chief AI Architect, Google)、Jeff Dean(Chief Scientist, Google DeepMind / Google Research)、Oriol Vinyals(Vice President, Google DeepMind)、Noam Shazeer(Vice President, Google DeepMind)

公開日: 2026-05-19

概要

今日、我々はフロンティア知能と行動(action)を組み合わせた最新のモデルファミリー「Gemini 3.5」を発表します。本シリーズは、より高度なエージェント構築における大きな前進を示します。まずは「3.5 Flash」を公開します。これはエージェントやコーディングにおいてフロンティア級の性能を提供し、実世界で有用な複雑な長期タスクに優れた能力を発揮します。

3.5 Flashは本日から世界中の多数のユーザーが利用可能です:

  • 一般向け: Gemini app と AI Mode in Google Search
  • 開発者向け: Google Antigravity(エージェント優先の開発プラットフォーム)、Gemini API(Google AI Studio と Android Studio)
  • 企業向け: Gemini Enterprise Agent Platform と Gemini Enterprise

同時に、社内で既に使われている「3.5 Pro」も鋭意開発中で、来月より展開を予定しています。

3.5 Flash:エージェントとコーディングにおけるフロンティア性能

Gemini 3.5 Flashは、複数の次元で大型フラッグシップモデルに匹敵する知能を、Flashシリーズで期待される速度で提供します。エージェント性能とコーディング性能の両面で最も強力なモデルであり、以下のようなベンチマークでGemini 3.1 Proを上回ります:

  • Terminal-Bench 2.1: 76.2%
  • GDPval-AA: 1656 Elo
  • MCP Atlas: 83.6%
  • マルチモーダル理解: CharXiv Reasoning 84.2%

出力トークン毎秒(tokens per second)の観点では、他のフロンティアモデルより4倍高速です。Artificial Analysis indexの右上(高性能かつ高速)に位置し、品質と待ち時間(レイテンシー)を両立することを示しています。

3.5 Flash:大規模エージェントタスク

この速度と性能のバランスにより、3.5 Flashは長期にわたるエージェントタスクに最適です。かつては開発者に数日、監査者に数週間を要していた作業を、3.5 Flashは短時間で、しばしば他のフロンティアモデルの半分以下のコストで支援します。迅速に計画・構築・反復を行い、アプリ開発、コードベースの保守、財務書類の準備などの実世界問題を解決します。

また、更新されたAntigravityハーネスと組み合わせることで、3.5 Flashは共同サブエージェントを展開して、大規模で要求の高いユースケースに対応する強力なエンジンになります。監督下では、マルチステップのワークフローやコーディングタスクを信頼性を持って実行しつつフロンティア性能を維持します。

Antigravityを用いた実例

  • Antigravityによるハーネスで、動的な基準に基づき非構造化資産を自動でリネームおよび分類するマルチステップワークフローを実行
  • Antigravityで2つのエージェントを用い、AlphaZeroの論文を要約し、完全にプレイ可能なゲームを6時間でコーディング
  • 混沌としたレガシーコードベースをNext.jsに変換
  • サブエージェントを使って新しい都市景観(city landscapes)を生成
  • ビルダーとプレイヤーの2エージェントが自己改善ループで連携し、ゲームを開発

リッチなグラフィックスとインタラクティブUI

Gemini 3の強力なマルチモーダル基盤により、3.5 FlashはよりリッチでインタラクティブなウェブUIやグラフィックを生成します。

  • AI Studio上で研究論文向けのインタラクティブなアニメーションを生成
  • テキスト記述をインタラクティブなハードウェア表現に変換(AI Studio)
  • 複数のコンセプトを並列実行して、学校の募金イベント向けのフルブランディングコンセプトを構築(AI Studio)
  • チェックアウトフローの異なるUXアプローチを60秒で生成(AI Studio)

実世界のインパクト

3.5 Flashのエージェント機能は、開発者や企業にとって既に有意義な進展をもたらしています。モデルシリーズ開発に際し、我々は業界パートナーと緊密に協力し、ワークフロー上の手間や複雑さが生じる箇所を把握しました。パートナーは以下のような効果を報告しています:

  • Shopify: サブエージェントを並列実行して長期にわたる複雑なデータ解析を行い、より正確なグローバルなマーチャント成長予測を実現
  • Macquarie Bank: 100ページ超の複雑な書類を推論し、関連情報を取り出して信頼性の高い推奨を低レイテンシで提供し、オンボーディングを加速
  • Salesforce: Agentforceに3.5 Flashを統合し、複数のサブエージェントがコンテキストを保持して複雑でマルチターンのツール呼び出しを実行することで、企業タスクの自動化を信頼性高く実現
  • Ramp: マルチモーダル理解と過去パターンの推論を組み合わせ、複雑な請求書に対するよりスマートで信頼性の高いOCRを実現
  • Xero: サプライヤの特定や1099税フォームの情報収集など、複雑で数週間に及ぶワークフローを自律的に管理し、小規模事業者の煩雑な事務を自動化
  • Databricks: エージェント的ワークフローでリアルタイム情報を監視・取得し、膨大なデータセット上で推論して問題を診断・修正提案を実施

パーソナルAIエージェント: Gemini Spark

3.5 Flashは現在、Gemini appとAI Mode in Searchのデフォルトモデルです。I/Oでは、日常生活にフロンティア級の知能をもたらす新機能を実演しました。新しいパーソナルAIエージェント「Gemini Spark」は3.5 Flashを採用し、24時間稼働でユーザーの指示のもと行動を取ります。

  • Gemini Sparkは本日から信頼できるテスターにロールアウトを開始
  • 米国のGoogle AI Ultra加入者向けにベータ提供を来週開始予定

Gemini Sparkは以下のような支援を行います(例示):

  • デジタル生活のナビゲーションやタスク代行
  • 継続的な情報収集・整理と実行支援
  • コーディングや書類処理などのエージェントタスクの自動化

また、3.5 Flashの強化されたエージェントコーディング能力はSearch上でもより知的な体験を提供し、24/7動作する情報エージェントや、より動的なジェネレーティブUI体験を実現します。

(例)Searchは3.5 Flashを使ってGyroidパターンを説明するインタラクティブなビジュアルを構築します。

フロンティアセーフガード

Gemini 3.5は我々の Frontier Safety Framework に基づいて開発されました。サイバーおよびC BRN(化学・生物・放射線)に関する保護を強化しており、有害なコンテンツ生成や、安全な問い合わせへの誤った応答拒否が発生しにくくなっています。これを実現するために、より高度な安全トレーニングや緩和策、そしてAIの内部推論をチェック・理解するための解釈可能性ツールを導入しています。

提供状況

Gemini 3.5 Flashは以下を通じて一般提供中です:

  • Google Antigravity
  • Gemini API(Google AI Studio, Android Studio)
  • Gemini Enterprise Agent Platform
  • Gemini Enterprise
  • Gemini app および AI Mode in Search(一般ユーザー向け)

Geminiチーム一同、皆さんがどんなものを作るか楽しみにしています。