#video-generation

AI Hacker News 3d ago 1 min read

FLUX 3, 영상·오디오·액션을 한 모델에 묶은 이유

시각 생성 모델 논의가 이미지 품질 비교를 넘어, 영상·소리·행동 예측을 같은 backbone에 넣을 수 있느냐로 옮겨갔다.

Sciences Hacker News Jul 10, 2026 1 min read

뇌 영역을 가장 강하게 자극하는 AI 영상, NEvo가 던진 불편한 질문

AI가 만든 영상으로 특정 시각 뇌 영역의 반응을 최대화한다는 연구에 관심과 불안이 동시에 붙었다. NEvo는 뇌의 “digital twin”을 보상 함수처럼 쓰며, 연구 도구와 superstimulus 사이의 경계를 드러낸다.

#neuroai #video-generation #brain

AI Jul 8, 2026 1 min read

Meta Muse Image, Instagram·WhatsApp까지 들어온 agentic 이미지 모델

Meta가 Muse Image를 Meta AI, meta.ai, 미국 Instagram Stories, 일부 국가의 WhatsApp에 투입했다. 이미지 생성 모델이 검색·코드 실행·자기수정을 쓰고, Arena 기준 3개 이미지 작업에서 모두 2위에 오른 점이 핵심이다.

#meta #muse #image-generation

AI X/Twitter Jul 8, 2026 1 min read

NVIDIA MOTIVE, video model 학습 clip 선별로 74.1% 선호도 확보

NVIDIA Research의 MOTIVE는 video model fine-tuning에서 움직임에 실제로 기여하는 clip을 골라내는 방법이다. ICML 2026 Outstanding Paper Honorable Mention을 받았고, base model 대비 74.1% human preference를 기록했다.

#nvidia #video-generation #icml-2026

AI X/Twitter May 25, 2026 1 min read

Meituan LongCat 1.5, 음성 기반 아바타 영상을 MIT 모델로 공개한 실험과 쟁점

Meituan LongCat 팀이 음성·이미지·텍스트 기반 아바타 영상 모델 LongCat-Video-Avatar 1.5를 공개했다. Hugging Face 모델 카드는 MIT 라이선스와 Diffusers 사용 예시를 제공한다.

#meituan #longcat #video-generation

AI X/Twitter May 21, 2026 1 min read

Google, 모든 입력에서 영상 생성하는 Gemini Omni 공개

구글 딥마인드가 Google I/O 2026에서 텍스트·이미지·오디오·영상 등 모든 입력으로 영상을 생성하는 Gemini Omni를 공개했다. Gemini의 지능과 구글 생성형 미디어 기술의 결합으로, Gemini 앱과 YouTube Shorts를 통해 즉시 이용 가능하다.

#google #gemini #video-generation

AI May 20, 2026 1 min read

구글 I/O 2026: 대화 한 마디로 영상 편집하는 Gemini Omni 공개

구글이 I/O 2026 키노트(5월 19일)에서 Gemini Omni를 발표했다. Sora·Runway 등 기존 AI 영상 생성기와 달리 물리 환경의 인과관계를 이해하는 '세계 모델'로, 자연어 명령만으로 배경·조명·카메라 앵글을 실시간 수정하는 대화형 편집이 핵심이다. 발표 당일 Veo를 대체해 Google AI 구독자에게 즉시 제공됐다.

#google #gemini #video-generation

AI Hacker News May 16, 2026 1 min read

NVIDIA, 720p 1분 영상 생성 2.6B 오픈소스 월드 모델 공개

NVIDIA 연구팀이 최대 1분 길이의 720p 해상도 영상을 생성할 수 있는 2.6B 파라미터 오픈소스 월드 모델 SANA-WM을 공개했다. 상대적으로 작은 모델 크기와 오픈소스 공개가 특징이다.

#video-generation #nvidia #open-source

AI Reddit May 12, 2026 1 min read

Google 비디오 모델 'Omni' 유출 — 텍스트 일관성에 주목

Google의 새 비디오 생성 모델 'Omni'의 유출 영상이 공개됐다. 기존 비디오 생성 모델의 약점으로 지적되어온 텍스트 렌더링의 일관성이 크게 개선된 것으로 보인다.

#google #video-generation #omni

AI Apr 11, 2026 1 min read

Google, 개발자용 저비용 video model 'Veo 3.1 Lite' 출시

Google은 Veo 3.1 Lite를 자사에서 가장 비용 효율적인 video generation model로 공개했다. Veo 3.1 Fast 대비 50% 미만의 비용에 같은 속도를 제공하며, paid tier의 Gemini API와 Google AI Studio를 통해 더 많은 고빈도 video app 시나리오를 겨냥한다.

#google #veo #video-generation

AI Reddit Apr 5, 2026 1 min read

Netflix VOID video object deletion 모델이 Reddit에서 화제

Reddit에서 확산된 Netflix VOID는 video에서 물체뿐 아니라 그 물체가 만든 interaction까지 제거하려는 open research model이다. CogVideoX 기반 2-pass pipeline, Gemini+SAM2 mask 생성, 40GB+ VRAM 요구사항이 기술적 핵심이다.

#video-editing #video-generation #inpainting

AI X/Twitter Apr 4, 2026 1 min read

Together AI, Wan 2.7 video 생성·연장·편집 워크플로를 단일 API로 통합

Together AI는 2026년 4월 3일 Alibaba Cloud의 Wan 2.7이 자사 플랫폼에 들어온다고 밝혔다. 함께 공개된 제품 글은 text-to-video를 지금 바로 제공하고, image-to-video·reference-to-video·video edit를 같은 API·인증·과금 표면 위로 확장하겠다고 설명한다.

#together-ai #wan-2-7 #video-generation