OpenAIGeminiMay 29, 2026, 5:30 PM

9 demos of Gemini Omni and Gemini 3.5 in action

A condensed section focused on the key takeaways first.

Original Post

Quick Digest

Summary

A condensed section focused on the key takeaways first.

openaienmodel: gpt-5-mini-2025-08-07

9 demos of Gemini Omni and Gemini 3.5 in action

Key Points

  • Multimodal video editing via natural language
  • 3.5 Flash for fast, agentic multi-step workflows
  • Antigravity enables deployable subagents and Search integration

Summary

Google announced two complementary model families at I/O 2026: Gemini Omni, a multimodal generator focused on video-first creation and conversational video editing, and Gemini 3.5 Flash, a fast, agentic model family optimized for multi-step workflows, coding, and deployable subagents via the Antigravity harness.

Key Points

  • Gemini Omni

    • Multimodal inputs (text, image, audio, video) to generate and iteratively edit high-quality videos via natural language prompts.
    • Edits are conversational and stateful: characters, physics, camera angles and prior scene context are preserved across turns.
    • Useful for rapid creative prototyping, automated content transformations, and pipeline integration for video generation/editing.
  • Gemini 3.5 Flash

    • Balances frontier reasoning with low latency (Flash series speeds) to execute long-horizon, multi-step agentic workflows.
    • Powers Antigravity-based subagents for coordinated, supervised task execution (e.g., asset renaming/categorization, agentic coding).
    • Enables generative UIs, interactive visualizations, and background information agents (integrated into Search and Gemini app).
  • Availability & integrations

    • Gemini Omni Flash rolling out to Google AI Plus/Pro/Ultra subscribers, YouTube Shorts/Create, and upcoming developer/enterprise APIs.
    • Gemini 3.5 Flash is generally available via Google Antigravity, the Gemini API in AI Studio, Android Studio, Enterprise Agent Platform, and rolling out in the Gemini app and Search (AI Mode).

Practical suggestions for engineers

  • Try 3.5 Flash in AI Studio/Antigravity for building agentic pipelines and automated multi-step workflows.
  • Evaluate Omni for programmatic video-editing or content-generation pipelines where iterative, stateful edits reduce manual post-production.
  • Plan for integrations via the Gemini API and Antigravity harness; prioritize user consent, content provenance, and resource/latency budgeting when deploying agentic services.

Full Translation

Translations

A translation section that keeps the flow of the original article.

openaijamodel: gpt-5-mini-2025-08-07

Gemini Omni と Gemini 3.5 の実演:9つのデモ

概要

2026年の Google I/O で発表された最新モデル、Gemini Omni と Gemini 3.5 ファミリー(特に 3.5 Flash)を紹介します。Gemini Omni は映像を含むマルチモーダル入力から高品質な映像生成・編集を対話的に行えるモデルで、Gemini 3.5(3.5 Flash)はエージェント的なワークフロー実行能力に優れたモデルです。本記事では、これらのモデルが何をできるかを示す9つのデモと主要機能をまとめます。

Gemini Omni

  • マルチモーダル入力:images、audio、video、text を組み合わせて利用可能。
  • 会話ベースの映像編集:自然言語で指示を与えるだけで、前の編集内容を踏まえつつ連続的に映像を改変できます。キャラクターや物理挙動の一貫性を保ち、シーンの履歴を記憶します。
  • できることの例:特定要素のみの変更、新キャラクターやオブジェクトの追加、瞬間をまったく別のものに変換するなど、撮影では実現できなかった創作が可能。

デモとプロンプト例

  • プロンプト(編集指示)の連続適用でシーンを細かくリファイン:
    • Prompt: Make the sculpture out of bubbles.

    • Prompt: Reimagine the action.

    • Prompt: Dim the lights in the room.

    • Prompt: Put a black and white checkerboard room inside a glass sphere that floats tracking above the hand, inside it contains a recursive representation of the same hand holding the sphere, creating an infinite recursive of rooms. Camera slowly gets closer into the sphere, creating a video loop.

  • 編集の積み重ねの例(キャプション的に示されたワークフロー):
    • Prompt: A video of a violinist playing a song.

    • Prompt: Transport the violinist to the image environment

    • Prompt: Make the violin invisible

    • Prompt: Change the camera angle to be over the violinist’s shoulder.

  • ポイント:何度のターンでも元のシーンの文脈を失わず、環境、角度、スタイル、細部を変更できる。

Gemini 3.5 Flash

  • 目的:エージェント的(agentic)な長期・多段階タスクを高速かつ高性能に実行するためのモデル。Flash シリーズ特有の低遅延と高性能のバランスを備えています。
  • Antigravity ハーネスとの組み合わせ:Antigravity と組み合わせることで、協調するサブエージェントを展開し、大規模かつ要求の厳しいユースケースで多段階ワークフローやコーディングタスクを信頼性高く実行できます。

応用例

  • 自動タグ付け・名称変更ワークフロー:動的基準に基づき、非構造化アセットを自動でリネーム・カテゴライズするマルチステップ処理を実行。
  • インタラクティブな Web UI/グラフィックス生成:Gemini 3 を基盤に、3.5 Flash は短時間で複数のUX案を生成(例:AI Studio で 60 秒以内にチェックアウトフローの異なるUX案を生成)。
  • パーソナル AI エージェントと新しいインテリジェント体験:
    • 3.5 Flash は世界中の Gemini アプリと Search の AI Mode のデフォルトモデルとして稼働。
    • 検索内の情報エージェント(information agents)はバックグラウンドで 24/7 動作し、必要な情報を的確なタイミングで収集・要約、関連リンクを添えて報告します。これらはまず Google AI Pro & Ultra サブスクライバー向けに夏に提供開始予定です。
  • カスタム生成 UI:Search 内で質問に最適な形式の応答(視覚ツールやシミュレーションを含むカスタム生成 UI)をその場で構築。今夏には全ユーザー向けに無料で提供予定。
  • 継続タスク向けミニアプリ:結婚式の計画やフィットネスルーティンなど、ダッシュボード、トラッカー、ミニアプリを Search 上で作成・継続利用可能。最初は米国の Google AI Pro/Ultra サブスクライバー向けに展開。

具体的なユースケース(文例)

  • 情報エージェント:ユーザーのお気に入りアスリートがスニーカーコラボやシグネチャードロップを発表した際に通知・更新を行う。
  • Gemini Spark(Gemini 3.5 と Antigravity ハーネスで動作する個人用 AI):
    • 24/7 動作し、Gmail、Docs、Slides など Workspace と深く統合してユーザーのデジタルライフを支援。
    • 例:Gemini Spark がナッツフリーのスナック候補を作成し、Instacart に追加する。

利用と展開状況

  • Gemini Omni Flash:Gemini アプリと Google Flow 経由で、Google AI Plus、Pro、Ultra の加入者へグローバルに展開中。YouTube Shorts と YouTube Create App のユーザーには無償提供中。今後数週間で開発者・企業向けに API 経由で展開予定。
  • Gemini 3.5 Flash:一般提供中。利用可能経路は以下の通り:
    • Google Antigravity
    • Gemini API(Google AI Studio と Android Studio)
    • Gemini Enterprise Agent Platform
    • Gemini Enterprise
    • AI Mode in Search(全ユーザー向け)
    • Gemini app(グローバル展開中)

まとめ

Gemini Omni はクリエイティブなマルチモーダル制作と会話ベースの映像編集を可能にし、Gemini 3.5 Flash は高速で高性能なエージェント的ワークフローとコーディング能力を提供します。両者を組み合わせることで、クリエイションから自動化・実行までの幅広いユースケースが現実化しています。