Google DeepMind, Lyria 3 공개 — 사진·텍스트로 30초 AI 음악 즉시 생성
Original: Google DeepMind Launches Lyria 3: Generate 30-Second Music Tracks from Photos and Text View original →
개요
Google DeepMind가 2026년 2월 18일, 최신 음악 생성 AI 모델 Lyria 3를 Gemini 앱에 공개했다. 텍스트 프롬프트나 이미지를 입력하면 보컬과 가사까지 포함된 완성도 높은 30초 음악 트랙을 생성한다.
주요 기능
- 멀티모달 입력: 텍스트 또는 이미지를 기반으로 음악 생성
- 자동 가사·보컬 생성: 프롬프트에서 자동으로 가사와 보컬을 작성
- 스타일 제어: 장르, 보컬 스타일, 템포 등 세부 조절 지원
- 다국어 보컬: 영어, 독일어, 스페인어, 프랑스어, 힌디어, 일본어, 한국어, 포르투갈어 지원
- SynthID 워터마킹: AI 생성 음악임을 감지할 수 있는 디지털 워터마크 자동 삽입
이용 방법
Lyria 3는 현재 Gemini 앱에서 베타로 제공 중이며, Google AI Pro 및 Ultra 사용자가 우선 이용 가능하다. Gemini Developer API와 Google AI Studio를 통해서도 개발자 미리보기 접근이 가능하다.
안전성
생성된 모든 트랙에는 SynthID 워터마크가 삽입돼 AI 생성 여부를 확인할 수 있다. Gemini에 파일을 업로드하면 AI 생성 여부를 검증해주는 기능도 함께 제공된다.
Related Articles
Google DeepMind의 새 훈련 구조가 중요한 이유는 데이터센터 경계 자체가 최전선 병목이 되고 있기 때문이다. Decoupled DiLoCo는 2-5Gbps 광역 링크 위에서 4개 미국 지역에 걸쳐 12B Gemma 모델을 학습했고, 기존 동기화 방식보다 20배 넘게 빠르면서 평균 정확도는 64.1%로 기준선 64.4%에 거의 붙었다.
이미지 생성 모델이 시각 이해의 중심으로 들어왔다. DeepMind는 Nano Banana Pro 기반 Vision Banana가 소규모 instruction tuning만으로 Segment Anything, Depth Anything 계열과 겨루며 여러 2D·3D 과제에서 state-of-the-art 성능을 냈다고 소개했다.
Hacker News에서 화제가 된 GitHub 저장소는 Gemini 이미지의 SynthID watermark를 신호 처리만으로 감지하고 약화할 수 있다고 주장했다. 다만 토론은 성과 자체보다 Google의 공식 detector와 맞대조하지 않았다는 점, 그리고 watermark 기반 provenance가 본질적으로 얼마나 취약한지에 더 집중됐다.
Comments (0)
No comments yet. Be the first to comment!