openaijamodel: gpt-5-mini-2025-08-07
Geminiが音楽生成に対応 — Lyria 3で30秒トラックを作成可能に
Key Points
- Lyria 3で30秒トラック生成
- テキスト・画像から作曲可能
- SynthIDでAI生成を検証
Summary
GeminiアプリにGoogle DeepMindの音楽生成モデル「Lyria 3」がベータ導入され、テキストや画像/動画から30秒のオリジナル楽曲(カバーアート付き)を素早く生成できます。生成音声には不可視の識別子「SynthID」が埋め込まれ、アップロードによる検証やGeminiの推論による確認が可能です。機能は18歳以上のユーザー向けに多言語で提供され、サブスクライバーはより高い利用上限が適用されます。生成は実験的で、既存アーティストの模倣ではなく独自表現を目指す設計です。
Key Points
- モデル: Lyria 3(歌詞自動生成、スタイル/ボーカル/テンポ等の創作コントロール、高度な楽曲生成)
- 入力: テキスト/画像/動画からのマルチモーダル生成。例: "写真を基に犬の歌を作る"。
- 出力: 30秒トラック+Nano Banana生成のカバーアート。共有・ダウンロードが容易。
- 検証: すべての生成トラックにSynthIDを埋め込み。ファイルをアップロードしてAI生成かを確認可能。
- 利用範囲: Geminiアプリのベータ(デスクトップ先行、数日内にモバイル展開)、対象は18歳以上、対応言語あり(英語/独/西/仏/ヒンディー/日本語/韓国語/ポルトガル語)
- 安全策: 権利保護のためフィルタや報告手段を用意。特定アーティスト名は“インスピレーション”として扱い、直接模倣しない方針。
- 運用注意: 実験的機能・利用規約と禁止利用ポリシー順守が必須。サブスクライバー向けに利用上限の拡張あり。
Practical notes for engineers
- 実装側で扱う想定: 30秒の短尺オーディオ生成ワークフロー、メタデータにSynthIDが付与される点をログ/トレーシング設計に組み込む。
- 検証APIはGeminiアプリ内のアップロード+推論フロー。外部システムでの自動検出を行う場合はSynthIDの仕様やエクスポート挙動を確認する必要あり。
- 権利・フィルタリング要件を踏まえた出力チェックとユーザー報告フローを組み込むことを推奨。