Google DeepMind、AGI進捗を測るcognitive frameworkとKaggle hackathonを公開

何が提案されたか

Google DeepMindは2026年3月17日、AGIの進捗を測るためのcognitive frameworkを公開した。既存のbenchmark leaderboard中心の見方ではAGI議論が単純化されすぎるとして、よりcognitive scienceに根ざした評価の枠組みを示している。

このframeworkが挙げる10のcanonical cognitive capabilitiesは、perception、generation、attention、learning、memory、reasoning、metacognition、executive functions、problem solving、social cognitionだ。研究チームは、個別benchmarkの点数だけではなく、AI systemがこれらの能力で人間分布に対してどこに位置するかを見るべきだと述べている。

評価はどう行うのか

論文では、broad task poolとheld-out evaluation setを作り、同じ課題でhuman dataも集め、AI performanceを人間分布に対して位置づける3-stage protocolを提案している。さらにDeepMindは、frameworkをpaperで終わらせずKaggle hackathonも同時に開始した。対象はlearning、metacognition、attention、executive functions、social cognitionの5能力で、submissionsは2026年3月17日から4月16日まで、結果発表は6月1日、prize poolは$200,000とされている。

この点が重要なのは、AGI議論を「どのmodelが一つの試験で勝ったか」というheadlineから外し、どの種類のcognitionが測定され、どこに評価の空白があるかを細かく見る方向へ押し出しているからだ。特にmetacognitionやexecutive functionsは、現在の商用benchmarkで相対的に手薄な領域として扱われている。

なぜ重要か

今後、frontier modelの比較が単一scoreではなくcapability profile中心へ移れば、研究者、enterprise buyer、policy関係者は各systemの強みと弱みをより具体的に読めるようになる。さらにKaggle hackathonを通じて評価設計そのものを外部研究者へ開いたことは、benchmark governanceが戦略領域になりつつあることを示している。

Google DeepMind、AGI進捗を測るcognitive frameworkとKaggle hackathonを公開

何が提案されたか

評価はどう行うのか

なぜ重要か

Related Articles

Google DeepMind、AGI評価をグローバルKaggleチャレンジへ拡張

Google DeepMind、AGI進捗を測るcognitive frameworkを提案

Google DeepMindのAletheia、研究レベルの未解決数学問題を6問自律的に解決

Comments (0)

Leave a Comment

Related Articles

Google DeepMind、AGI評価をグローバルKaggleチャレンジへ拡張

Google DeepMind、AGI進捗を測るcognitive frameworkを提案

Google DeepMindのAletheia、研究レベルの未解決数学問題を6問自律的に解決
AI Reddit Mar 3, 2026 1 min read