Google DeepMind、Lyria 3を公開 — 写真・テキストから30秒AI音楽をリアルタイム生成
Original: Google DeepMind Launches Lyria 3: Generate 30-Second Music Tracks from Photos and Text View original →
概要
Google DeepMindは2026年2月18日、最新の音楽生成AIモデル「Lyria 3」をGeminiアプリに公開した。テキストプロンプトや画像を入力するだけで、ボーカルと歌詞を含む高品質な30秒のトラックをリアルタイムで生成できる。
主な機能
- マルチモーダル入力: テキストまたは写真から音楽を生成
- 自動歌詞・ボーカル生成: プロンプトに基づき歌詞とボーカルを自動生成
- スタイルコントロール: ジャンル、ボーカルスタイル、テンポの細かな調整が可能
- 多言語ボーカル: 英語、ドイツ語、スペイン語、フランス語、ヒンディー語、日本語、韓国語、ポルトガル語対応
- SynthIDウォーターマーク: AI生成音楽に自動的に透かしを挿入し、検出を可能にする
利用方法
Lyria 3はGeminiアプリでベータ公開中。Google AI ProおよびUltraユーザーが優先アクセス可能。開発者はGemini APIとGoogle AI Studioからプレビューアクセスできる。
安全性・倫理
生成されたすべてのトラックにはSynthIDウォーターマークが埋め込まれ、AI生成かどうかを検証できる。Geminiアプリでは、アップロードした音声ファイルのAI生成有無も確認可能だ。
Related Articles
Googleは2026-02-18、Lyria 3をGeminiアプリへベータ展開すると発表した。テキストや画像入力から30-secondトラックを生成し、全生成音声にSynthIDを埋め込むことで識別可能性を確保する方針を示した。
Microsoft Threat Intelligenceは2026年3月6日、攻撃者が調査、phishing、malware開発、侵害後分析までAIを活用していると報告した。AIはまだ大規模な完全自律侵入を実現していないが、攻撃の速度・規模・持続性をすでに押し上げているという整理だ。
r/LocalLLaMAで、Whisperが無音区間で文章を生成する問題に対し、Silero VADやprompt履歴遮断、blocklistを組み合わせた運用対策が公開された。
Comments (0)
No comments yet. Be the first to comment!