#video-generation

RSSフィード

AI Hacker News 3d ago 1 min read

FLUX 3、画像生成から動画・音声・行動予測まで広げる構想

注目点はサンプルの見栄えだけではなく、生成と行動予測を同じmultimodal backboneに載せるという設計思想にある。

#flux #multimodal #video-generation

Sciences Hacker News Jul 10, 2026 1 min read

脳領域を最大刺激するAI動画、NEvoが投げた不穏な問い

議論は、研究上の有用性と悪用への不安に分かれた。NEvoは視覚脳のdigital twinを報酬モデルのように使い、対象領域の予測活性を最大化するAI生成動画を探索する。

#neuroai #video-generation #brain

AI Jul 8, 2026 1 min read

Meta Muse Image、InstagramとWhatsAppへ入るtool-using画像生成

MetaはMuse ImageをMeta AI、meta.ai、米国のInstagram Stories、一部国のWhatsAppに投入した。検索、コード実行、自己修正、Content Sealを備えた画像生成がソーシャル面に入る点が大きい。

#meta #muse #image-generation

AI X/Twitter Jul 8, 2026 1 min read

NVIDIA MOTIVE、motion重視のclip選別で74.1% preferenceを獲得

NVIDIA ResearchのMOTIVEは、video modelのfine-tuningで動きを改善するclipを特定する手法だ。ICML 2026で評価され、base modelに対して74.1%のhuman preferenceを示した。

#nvidia #video-generation #icml-2026

AI X/Twitter May 25, 2026 1 min read

Meituan LongCat 1.5、音声駆動アバター動画をMITモデルとして公開、検証競争の基準に

Meituan LongCat TeamがLongCat-Video-Avatar 1.5を公開した。Hugging FaceにはMITライセンス、Diffusers利用例、音声・画像・テキストから動画を作るタグが並ぶ。

#meituan #longcat #video-generation

AI X/Twitter May 21, 2026 1 min read

Google DeepMind、あらゆる入力から動画を生成するGemini Omniを発表

Google DeepMindはGoogle I/O 2026にて、テキスト・画像・音声・動画などあらゆる入力から動画を生成するGemini Omniを発表した。GeminiのインテリジェンスとGoogleのメディア生成システムを統合し、GeminiアプリやYouTube Shortsで即日利用可能だ。

#google #gemini #video-generation

AI May 20, 2026 1 min read

Google I/O 2026: 会話でビデオを編集できる「世界モデル」Gemini Omni登場

GoogleがI/O 2026（5月19日）で「世界モデル」Gemini Omniを発表した。Sora・Runwayなど既存のAI動画生成ツールと異なり、物理環境の因果関係を理解した上で自然言語の指示に応じてシーンを編集できる。VeoをGeminiアプリで置き換え、同日から提供開始となった。

#google #gemini #video-generation

AI Hacker News May 16, 2026 1 min read

NVIDIA、720p・1分動画生成可能な2.6Bオープンソース世界モデル「SANA-WM」を公開

NVIDIA Labsが、最大1分・720p解像度の動画を生成できる2.6Bパラメータのオープンソース世界モデル「SANA-WM」を公開した。比較的小さなモデルサイズとオープンソース公開が動画生成研究のアクセシビリティを高める。

#video-generation #nvidia #open-source

AI Reddit May 12, 2026 1 min read

GoogleのビデオモデルOmniが流出 — テキスト一貫性に注目集まる

Googleの未発表ビデオ生成モデル「Omni」と見られる映像が流出し、r/singularityで1,300票以上を集めた。既存モデルの弱点だったテキストレンダリングの一貫性が大幅に改善されているとして注目された。

#google #video-generation #omni

AI Apr 11, 2026 1 min read

Google、開発者向け低コスト video model「Veo 3.1 Lite」を投入

Google は Veo 3.1 Lite を、自社で最も cost-effective な video generation model として発表した。Veo 3.1 Fast の 50% 未満のコストで同じ speed を提供し、paid tier の Gemini API と Google AI Studio を通じて高ボリュームの video app 開発を狙う。

#google #veo #video-generation

AI Reddit Apr 5, 2026 1 min read

NetflixのVOID video object deletion modelがRedditで話題

Redditで広がったNetflixのVOIDは、videoからobjectだけでなく、そのobjectが生んだinteractionまで除去しようとするopen research modelだ。CogVideoXベースの2-pass pipeline、Gemini+SAM2によるmask生成、40GB+ VRAM要件が技術的な核心になっている。

#video-editing #video-generation #inpainting

AI X/Twitter Apr 4, 2026 1 min read

Together AI、Wan 2.7のvideo生成・継続・編集workflowを単一APIに集約

Together AIは2026年4月3日、Alibaba CloudのWan 2.7を自社platformに導入すると発表した。併せて公開された製品記事では、text-to-videoを今すぐ提供し、image-to-video、reference-to-video、video editを同じAPI・認証・課金面に広げていく方針を示している。

#together-ai #wan-2-7 #video-generation