デミス・ハサビス: "1911年の知識でAIを学習させ、一般相対性理論を発見できれば真のAGI"
Original: Demis Hassabis: "The kind of test I would be looking for is training an AI system with a knowledge cutoff of, say, 1911, and then seeing if it could come up with general relativity, like Einstein did in 1915. That's the kind of test I think is a true test of whether we have a full AGI system" View original →
アインシュタインテスト: AGI判別の究極の基準
DeepMindのCEOデミス・ハサビスが、AGI(人工汎用知能)の達成を判断する具体的で説得力のあるテストを提案し、AI研究コミュニティで大きな注目を集めている。
ハサビスはYouTubeのインタビューでこう述べた。「私が求めるテストは、例えば1911年を知識のカットオフに設定してAIシステムを学習させ、1915年にアインシュタインがやったように、そのAIが一般相対性理論を自力で導き出せるかどうかを確認することです。それが、私たちが完全なAGIシステムを持っているかどうかを真に試すテストだと思います。」
このテストが意味する理由
この提案の核心は、単純な暗記やパターン認識ではなく、真の科学的推論と創造的発見の能力を測定する点にある。一般相対性理論は、1911年時点の物理学データと数学的ツールを組み合わせて全く新しい概念体系を構築したものであり、既存情報の再組み合わせを超えた根本的な洞察を必要とした。
- 1911年以前の物理学: ニュートン力学、特殊相対性理論(1905年)、電磁気学
- 1915年のアインシュタインの業績: 等価原理に基づく重力と時空間曲率の統合
- 求められる能力: 既存のパラダイムを超えた創造的な概念化
現在のAIとAGIの距離
現在の大規模言語モデル(LLM)は既存の概念を組み合わせて説明することには長けているが、全く新しい物理理論を独自に構築する能力はまだ証明されていない。ハサビスのテストはこの違いを明確に示している。
r/singularityで2,800以上のアップボートを獲得したこの発言は、AI研究の究極の目標と現在の技術との間のギャップについての深い議論を巻き起こした。
AGIの定義をめぐる議論
ハサビスの提案は、AGIの定義がいかに多様であるかも示している。OpenAIが「ほとんどの経済的に価値ある作業」を実行できるシステムとAGIを定義する一方、ハサビスは科学的発見能力というより厳格な基準を提示している。この区別はAI開発の進捗をどう測定・評価するかに大きな影響を与える。
Related Articles
arXivが、LLMによるハルシネーションや誤結果を検証せずに掲載した論文の著者全員に対し、最長1年間の投稿禁止処分を開始した。AI生成コンテンツに対する学術的責任の基準を明確化する重要な方針転換だ。
2024年に複雑度理論を用いて「機械学習では人間レベルの分類器を学習できない」と主張した論文(Ingenia定理)が、同じ学術誌Computational Brain & Behaviorで反論論文により否定された。証明は「回復不可能な誤り」を含むと指摘されている。
Google DeepMindのシエラレオネ実験では、問題への取り組み方を尋ねるGeminiクエリが68%から90%へ増えた。8週間、12校、1,763人を対象にしたRCTで、教育AIの評価軸が行動変化へ移っている。