Zero-shot World Modelsにr/MachineLearningが突っ込んだchild comparison
Original: Zero-shot World Models Are Developmentally Efficient Learners [R] View original →
r/MachineLearning threadで取り上げられたのは、Zero-shot World Models Are Developmentally Efficient Learnersという論文だ。現在のAI systemはvisual competenceに膨大なdataを必要とする一方、子どもは限られた経験からdepth、motion、object coherence、physical interactionを理解し始める。この対比が投稿のhookになった。
論文が提案するのはZero-shot Visual World Model、ZWMだ。arXiv abstractによれば、appearanceとdynamicsを分けるsparse temporally-factored predictor、approximate causal inferenceによるzero-shot estimation、そしてinferenceを組み合わせて複雑な能力を作ることが中心原理になっている。single childのfirst-person experienceから学習し、複数のphysical understanding benchmarkで能力を示すという。
Redditの反応は好奇心だけでは終わらなかった。上位コメントは、子どもはrandom weightsから始まるわけではないと指摘した。genetics、early development、長い進化で形作られたnetwork topologyがあり、その上に学習が乗るという見方だ。別のコメントは、Single-child BabyViewが約132 hoursなら、なぜそれをより長く生きた子どもの能力と比べるのかと問うた。
このskepticismは論文を弱めるというより、読むべき論点を分けてくれる。ひとつはtechnical claimで、限られたegocentric visual dataからphysical structureを学び、zero-shotで新しいtaskへgeneralizeできるか。もうひとつはdevelopmental claimで、それを子どもの理解とどこまで比較できるかだ。前者は強くても、後者には慎重な条件づけが必要になる。
このthreadの良さは、「child-like data efficiency」という言葉をそのまま受け取らなかった点にある。data-efficient AIは重要な目標だが、子どもにはbiological priorsとembodied historyがある。その差を見た上で読むと、ZWMの問いはむしろ鋭くなる。少ないdataで多くを推論するには、どんな構造が必要なのか。
Related Articles
生命科学AIは文献支援から実行可能な研究workflowへ進んでいる。OpenAIはGPT-RosalindがMedChemBench 27.5%、GeneBench 21.6%、LabWorkBench 63.2%を記録したと示した。
Microsoft Discoveryが6月2日に一般提供へ移行した。科学・工学R&Dで専門agent、組織知、シミュレーション、検証データをつなぎ、研究者向けローカルアプリもpreviewで公開された。
Anthropicは科学AIの課題を、モデルの推論力だけでなくデータ検索基盤の問題として示した。NCBI Virusの検索課題では、gget virusを加えると精度がほぼ100%まで上がった。