OpenAIGemini2026/02/26 16:00

Build with Nano Banana 2, our best image generation and editing model

要点だけを先に読めるように短く再構成したセクションです。

元記事

Quick Digest

要約

要点だけを先に読めるように短く再構成したセクションです。

openaijamodel: gpt-5-mini-2025-08-07

Nano Banana 2(Gemini 3.1 Flash Image)リリース概要

Key Points

  • 高忠実度生成
  • 画像内テキストローカライズ
  • 512pxと新アスペクト比

Summary

Nano Banana 2(Gemini 3.1 Flash Image)は、高忠実度の画像生成と高速な高度編集を狙ったFlashモデルのアップデートです。Web画像検索を用いた視覚的グラウンディング、画像内テキストの高精度レンダリングと多言語ローカライズ、より細かいクリエイティブ制御(アスペクト比、解像度、推論レベル)を提供します。エンジニアはGemini API(Google AI Studio)やVertex AIなどで有償APIキーを用いて導入できます。

Key Points

  • 生成と編集
    • 高忠実度のレンダリング(鮮やかなライティング、豊かな質感、細部のシャープネス)
    • 高速編集パイプライン向けに新たに512px解像度を追加(既存の1K/2K/4Kと併用)
  • 視覚的グラウンディングと知識
    • Web画像検索を活用して実世界参照に基づく詳細な描写が可能(例: "Window Seat" デモ)
  • テキスト処理とローカライズ
    • 画像内テキストのレンダリング精度向上と画像内での多言語翻訳/ローカライズ(例: "Global Ad Localizer")
  • クリエイティブ制御
    • ネイティブアスペクト比の追加(例: 4:1, 1:4, 8:1, 1:8 を含む)
    • 指示遵守性の向上(複雑な多段プロンプトに対する安定した適合)
    • 思考レベル(Minimal/High/Dynamic)を設定してレンダリング前の推論深度を調整可能
  • 導入と運用
    • 利用は有償APIキーが必要。Gemini API(Google AI Studio)、Vertex AI(エンタープライズ)、Google Antigravity、Firebaseで利用可能
    • 開発者向けにドキュメント、アプリギャラリー、クックブックが提供されている

Practical notes for engineers

  • 早期プロトタイプや大量イテレーション: まず512pxで試し、品質要件に応じて1K/2K/4Kへスケール
  • 多言語広告やUI画像: 画像内ローカライズを用いてテキストと視覚要素を同時に翻訳/調整
  • 複雑プロンプトの安定化: 思考レベルをHigh/Dynamicにして出力一貫性と指示遵守を強化
  • 導入手順: 有償APIキー取得 → Gemini API経由で呼び出し → 必要ならVertex AIへ展開

Links / Next steps

  • 開発開始: Gemini API の開発者ドキュメント、AI Studioのアプリギャラリー、クックブックを参照して実装・検証を開始してください。

Full Translation

翻訳

原文の流れを保ったまま読める翻訳セクションです。

openaijamodel: gpt-5-mini-2025-08-07

Nano Banana 2で構築する — 当社最高の画像生成・編集モデル

概要

Nano Banana 2 (Gemini 3.1 Flash Image) が登場しました。高品質な画像生成と高速な高度編集を実現する新しい Flash モデルで、優れた価格対性能比でスケールしたビジュアル作成を可能にします。Google AI Studio または Gemini API を使って今日から構築を開始できます(このモデルを Google AI Studio で使用するには有料の api key が必要です)。

生成された要約は Google AI によるものです。Generative AI は実験的技術です。

主な改善点と機能

改良された世界知識

Nano Banana 2 は Gemini モデルの広範な世界知識を活用し、ウェブ検索の画像を取り入れてより詳細な描写を生成できます。実例として、世界のロケーションとライブ天気データを参照してフォトリアリスティックな窓の景色を作るデモアプリ「Window Seat」を公開しています。

高度なテキストレンダリングとローカリゼーション

ダイナミックな UI ジェネレータやクリエイティブツールでは、文字が鮮明で正確であることが重要です。Nano Banana 2 は以前の Flash 画像モデルからアップグレードされ、より信頼できるテキストレンダリングを提供します。大量生成やクリエイティブ系アプリでも、テキストはアートワークと同等の精度でレンダリングされます。

また、画像内でのローカリゼーション(in-image localization)をサポートしており、画像内でテキストを生成・翻訳して複数言語に対応できます。例として、広告を各国向けに翻訳するデモ「Global Ad Localizer」を公開しており、翻訳テキストのレンダリングだけでなく、ビジュアル自体の理解とローカライズも同時に行います。

より高いクリエイティブ制御と一貫性

Nano Banana 2 は速度と視覚的忠実度を提供し、鮮やかなライティング、リッチなテクスチャ、シャープなディテールを実現します。以下の高度なクリエイティブ機能で高忠実度出力の制御が可能です:

  • ネイティブアスペクト比: 既存のすべてのアスペクト比にネイティブ対応し、今回新たに 4:1、1:4、8:1、1:8 を追加しました。サポートされるアスペクト比の一覧はドキュメントを参照してください。
  • 新しい 512px 解像度: 効率化のための新しい解像度階層。既存の 1K、2K、4K に加わり、低遅延での迅速な反復や大規模なパイプラインに適します。
  • 改善された指示順守: 複雑で多層的な開発者プロンプトに対してモデルがより厳密に従います。これにより、アプリが要求した画像が生成されやすくなります。
  • 思考レベルの設定(Configurable thinking levels): モデルの推論(reasoning)をより細かく制御できます。Minimal (default)High/Dynamic を切り替えて、レンダリング前に複雑なプロンプトをモデルに検討させることができ、出力品質とプロンプトの順守性が大きく向上します。

デモ「Pet Passport」は、ペットの写真を1枚取り込み、有名なランドマークを巡る世界旅行に連れて行くようなフォトを生成します。ペットの外見を各地で一貫して維持します。さらに、カスタム出力のための複数のクリエイティブコントロール設定も用意しています。

本番運用向け:開発者の声

すでにパートナー企業が Nano Banana 2 をプロダクションワークフローに統合し、ビジュアル機能をスケールするための素晴らしいイノベーションを見せています。

今すぐ構築を始める

Nano Banana 2 は有料の api key で今日から利用できます。利用可能な場所:

  • Gemini API(Google AI Studio から利用可能)
  • エンタープライズ向け展開:Vertex AI
  • その他利用先:Google Antigravity、Firebase

はじめに役立つリソース:

  • Gemini API developer docs をすぐに確認する
  • Nano Banana 2 を使って Google AI Studio のアプリギャラリーを探索し、アプリを構築する
  • Google AI Studio でモデルを実験・テストする
  • Cookbook を参照して実践的な例を学ぶ

私たちは Nano Banana 2 で皆さんが何を作るかを見るのを楽しみにしています。

POSTED IN: AI Gemini models