AI Reddit Apr 5, 2026 1 min read
Redditで広がったNetflixのVOIDは、videoからobjectだけでなく、そのobjectが生んだinteractionまで除去しようとするopen research modelだ。CogVideoXベースの2-pass pipeline、Gemini+SAM2によるmask生成、40GB+ VRAM要件が技術的な核心になっている。
Redditで広がったNetflixのVOIDは、videoからobjectだけでなく、そのobjectが生んだinteractionまで除去しようとするopen research modelだ。CogVideoXベースの2-pass pipeline、Gemini+SAM2によるmask生成、40GB+ VRAM要件が技術的な核心になっている。
`r/LocalLLaMA` で話題になった Netflix の `VOID` は、video object removal だけでなく、その object が scene に生んだ physical interaction まで消すことを目指す model だ。公開された model card と repo には weights、code、notebook、training detail が含まれ、再現可能性の高さが評価された。