OpenAIGemini2026/02/18 16:00

A new way to express yourself: Gemini can now create music

要点だけを先に読めるように短く再構成したセクションです。

元記事

Quick Digest

要約

要点だけを先に読めるように短く再構成したセクションです。

openaijamodel: gpt-5-mini-2025-08-07

Geminiが音楽生成に対応 — Lyria 3で30秒トラックを作成可能に

Key Points

  • Lyria 3で30秒トラック生成
  • テキスト・画像から作曲可能
  • SynthIDでAI生成を検証

Summary

GeminiアプリにGoogle DeepMindの音楽生成モデル「Lyria 3」がベータ導入され、テキストや画像/動画から30秒のオリジナル楽曲(カバーアート付き)を素早く生成できます。生成音声には不可視の識別子「SynthID」が埋め込まれ、アップロードによる検証やGeminiの推論による確認が可能です。機能は18歳以上のユーザー向けに多言語で提供され、サブスクライバーはより高い利用上限が適用されます。生成は実験的で、既存アーティストの模倣ではなく独自表現を目指す設計です。

Key Points

  • モデル: Lyria 3(歌詞自動生成、スタイル/ボーカル/テンポ等の創作コントロール、高度な楽曲生成)
  • 入力: テキスト/画像/動画からのマルチモーダル生成。例: "写真を基に犬の歌を作る"。
  • 出力: 30秒トラック+Nano Banana生成のカバーアート。共有・ダウンロードが容易。
  • 検証: すべての生成トラックにSynthIDを埋め込み。ファイルをアップロードしてAI生成かを確認可能。
  • 利用範囲: Geminiアプリのベータ(デスクトップ先行、数日内にモバイル展開)、対象は18歳以上、対応言語あり(英語/独/西/仏/ヒンディー/日本語/韓国語/ポルトガル語)
  • 安全策: 権利保護のためフィルタや報告手段を用意。特定アーティスト名は“インスピレーション”として扱い、直接模倣しない方針。
  • 運用注意: 実験的機能・利用規約と禁止利用ポリシー順守が必須。サブスクライバー向けに利用上限の拡張あり。

Practical notes for engineers

  • 実装側で扱う想定: 30秒の短尺オーディオ生成ワークフロー、メタデータにSynthIDが付与される点をログ/トレーシング設計に組み込む。
  • 検証APIはGeminiアプリ内のアップロード+推論フロー。外部システムでの自動検出を行う場合はSynthIDの仕様やエクスポート挙動を確認する必要あり。
  • 権利・フィルタリング要件を踏まえた出力チェックとユーザー報告フローを組み込むことを推奨。

Full Translation

翻訳

原文の流れを保ったまま読める翻訳セクションです。

openaijamodel: gpt-5-mini-2025-08-07

自己表現の新しい方法:Geminiが音楽を生成できるようになりました

自己表現の新しい方法:Geminiが音楽を生成できるようになりました

Geminiアプリに、Google DeepMindの最新生成音楽モデル「Lyria 3」がベータで導入されました。テキストでアイデアを説明するか写真をアップロードするだけで、Geminiがその内容に応じた30秒の楽曲とカスタムカバーアートを数秒で生成します。生成されたトラックには、Googleが開発した識別用の不可視ウォーターマーク「SynthID」が埋め込まれます。

生成AIは実験的な技術です。

主なポイント

  • Lyria 3を使って、テキストや画像からカスタム音楽(30秒)を作成できます。
  • 歌詞はプロンプトに基づいて自動生成されるため、独自の歌詞を用意する必要はありません。
  • スタイル、ボーカル、テンポなど、より細かなクリエイティブコントロールが可能です。
  • より現実的で音楽的に複雑なトラックが作れます。
  • すべてのGemini生成トラックにはSynthIDが埋め込まれ、AI生成かどうかを検証できます。
  • 利用は18歳以上のユーザー向けで、英語、German、Spanish、French、Hindi、Japanese、Korean、Portugueseに対応。Google AI Plus、Pro、Ultraの加入者はより高い利用上限があります。

使い方(概要)

  • テキストからトラック

    • ジャンル、ムード、内輪ネタ、思い出などを具体的に説明して、歌詞つきやインストゥルメンタルの短い楽曲を作成します。例:「母との子どもの頃の楽しい思い出をテーマに、アフロビート風で本物のアフリカの雰囲気を感じさせる曲を作って」
  • 写真・動画からトラック

    • 写真や動画をアップロードすると、その素材に合わせたムードの歌詞やサウンドを用いてトラックを作曲します。例:「これらの写真を使って、森でハイキングする犬Duncanについての曲を作って」
  • 出力仕様

    • Geminiアプリは30秒のトラックを生成し、カスタムカバーアートはNano Bananaによって作成されます。生成したトラックはダウンロードや共有リンクで簡単に友人と共有できます。
    • 目的は音楽の傑作を作ることではなく、手軽でユニークな自己表現の手段を提供することです。

YouTubeとの連携

  • クリエイターはYouTubeのDream TrackでLyria 3を利用できます。米国を皮切りに他国のYouTubeクリエイターにも展開され、Shortsのサウンドトラック作成品質が向上します。

新しいオーディオ検証機能

  • Geminiアプリで生成されたすべてのトラックにはSynthIDが埋め込まれます。
  • Geminiアプリでは画像・動画に加えてオーディオの検証機能も提供されます。ファイルをアップロードして「Google AIで生成されたか」を尋ねると、SynthIDの有無をチェックし、Geminiが独自の推論により回答します。

責任ある開発と利用ポリシー

  • 2023年のLyria公開以来、音楽コミュニティとの協働や実験(例:Music AI Sandbox)を通じて責任ある開発を進めてきました。
  • Lyria 3は既存アーティストを模倣することを目的とせず、オリジナル表現を促進するよう設計されています。プロンプトで特定アーティスト名が挙げられた場合は、そのスタイルやムードを幅広い創作的インスピレーションとして扱い、直接的な模倣は行いません。
  • 出力は既存コンテンツと照合するフィルタにかけられますが、完璧ではない可能性があるため、権利侵害の疑いがあるコンテンツは報告できます。
  • 本機能の利用には利用規約およびGen AI prohibited use policiesの順守が必要で、他者の知的財産権やプライバシー権の侵害は禁止されています。

利用可能性

  • Lyria 3はGeminiアプリで18歳以上の全ユーザー向けに提供されます。対応言語はEnglish、German、Spanish、French、Hindi、Japanese、Korean、Portugueseで、今後さらに言語と品質の拡張を予定しています。
  • デスクトップ版は本日より展開、モバイルアプリには数日かけて順次展開されます。
  • Google AI Plus、Pro、Ultraの加入者は利用上限が高く設定されています。

まずは試してみる

日常に楽しくカスタムなサウンドトラックを追加するために、ぜひお試しください:

gemini.google.com


投稿カテゴリ: Gemini App、AI