Google DeepMindのAletheia、研究レベルの未解決数学問題を6問自律的に解決

数学コンペを超えて

Google DeepMindのAletheia AIエージェントが、単なる数学競技問題を超えた真の未解決数学研究問題に取り組む能力を示しています。r/singularityでスコア291を獲得したこの成果に関する投稿は、AIが真の数学的研究能力に近づいているかどうかについて大きな議論を巻き起こしました。

主な成果

FirstProof Challenge：専門家の過半数評価により、研究レベルの未解決数学問題10問中6問を自律的に解決
Bloom's Erdős Conjectures：700問の未解決問題の半自律的評価で4問の未解決問題を解決
自律的研究論文：算術幾何学における固有値（eigenweight）の構造定数を計算する完全AI自律論文を生成

Aletheiaの仕組み

AlethiaはGemini Deep Thinkを基盤とし、3つのコンポーネントからなるエージェント・ハーネスを使用しています：候補解を提案するGenerator、欠陥を検出するVerifier、エラーを修正するReviser。このアーキテクチャは推論時計算量を増やすほど性能が向上し、2025年7月のIMOゴールドメダルレベルから始まり、現在はIMO-ProofBench Advancedで最大90%のスコアを記録しています。

数学コミュニティの反応

フィールズ賞受賞者のTerence Taoをはじめとする一流数学者たちが、Aletheiaの成果を認め「価値ある研究協力者」と表現しました。Aletheiaはまだ多くの問題に苦戦していますが、その成功はAI支援研究における質的な飛躍を示しています。

AI Mar 19, 2026 1 min read

Google DeepMind、AGI進捗を測るcognitive frameworkを提案

Google DeepMindは2026年3月17日、AGIへの進捗を評価するための新しいcognitive scienceベースのframeworkを公開し、それを実用benchmarkへ落とし込むためのKaggle hackathonを開始した。10のcognitive abilityを定義し、human baselineとの比較を推奨し、community-built evaluationに総額20万ドルの賞金を設定している。

#google-deepmind #agi #evaluation

AI Reddit Feb 23, 2026 1 min read

デミス・ハサビス: "1911年の知識でAIを学習させ、一般相対性理論を発見できれば真のAGI"

DeepMindのCEOデミス・ハサビスは、真のAGIを判断するテストとして、1911年の知識のみで学習したAIが、1915年のアインシュタインのように一般相対性理論を独自に導出できるかどうかを提案した。これは単なるパターンマッチングではなく、真の科学的発見能力を測る基準だ。

#agi #deepmind #hassabis

AI X/Twitter Mar 18, 2026 1 min read

Google DeepMind、AGI評価をグローバルKaggleチャレンジへ拡張

Google DeepMindはXで、賞金総額20万ドルのKaggle hackathonを立ち上げ、AI向けの新しいcognitive evaluationを募集すると発表した。リンク先のGoogle記事は、この取り組みが単一benchmarkではなく、10のcognitive ability全体でAGIの進捗を測るより大きな枠組みの一部だと説明している。

#google-deepmind #kaggle #agi