GoogleのビデオモデルOmniが流出 — テキスト一貫性に注目集まる
Original: A new video model "Omni" from Google is leaked, user notes text coherence View original →
流出の内容
GoogleのビデオモデルOmniとされる映像がr/singularityに投稿され、1,300票超を集めた。正式発表前の映像であり、Googleの次世代ビデオ生成技術の一端を示すものとして注目を集めた。
テキスト一貫性の改善
最も注目されたのはテキストレンダリングだ。Sora、Kling、Gen-3など既存のビデオ生成モデルはフレーム間でのテキスト一貫性に苦労してきた。Omniはこの点で顕著な改善を示しているとユーザーらが分析した。
競合状況
GoogleはVeo 2などでビデオ生成分野での存在感を高めてきた。テキスト一貫性の問題を解決したモデルが登場すれば、広告・動画制作などの実用途で大きな差別化要因となる。
今後の展開
Googleは正式なOmniの発表を行っていない。流出映像の真偽と全機能は未確認だが、Google I/Oなどのイベントでの正式発表が期待されている。
Related Articles
米国防総省がOpenAI・Google・Microsoft・AWS・Oracle・Nvidia・SpaceXと機密軍事ネットワーク(IL6/IL7)へのAI展開契約を締結した。安全ガイドラインの維持を主張したAnthropicは「サプライチェーンリスク」として排除された。
TNWは、GoogleがMarvellと2種類のAI chipを協議していると報じた。signed contractはまだないが、memory processing unitとinference向けTPUの構想は、AIコストの重心がtrainingからinferenceへ移ったことを示す。
Googleは、企業向けAIが試験導入から本番運用へ移ったというサインを出した。4月22日のCloud Next記事で、顧客の直接API利用は毎分160億トークンを超え、2026年の機械学習計算投資の過半がCloud事業へ向かうと示した。
Comments (0)
No comments yet. Be the first to comment!