Demis Hassabis:「真のAGIテストはAIが一般相対性理論を独自に導出できるか」
Original: Demis Hassabis: "The kind of test I would be looking for is training an AI system with a knowledge cutoff of, say, 1911, and then seeing if it could come up with general relativity, like Einstein did in 1915. That's the kind of test I think is a true test of whether we have a full AGI system" View original →
HassabisのAGIテスト提案
Google DeepMind CEOのDemis Hassabisが、真のAGI(汎用人工知能)を判定するための具体的なベンチマークを提案し、Reddit r/singularityで1,800以上のポイントを獲得し大きな反響を呼んでいます。
アインシュタインテスト
Hassabisは次のように述べました。
「私が求めるテストは、例えば1911年をナレッジカットオフとしてAIシステムを訓練し、その後アインシュタインが1915年にしたように、AIが一般相対性理論を自力で導出できるかを見ることです。これが完全なAGIシステムを持っているかどうかの真のテストだと思います。」
このテストが意味を持つ理由
このベンチマークは単なるパターン認識や暗記をはるかに超えるものです。アインシュタインの一般相対性理論は、データ分析から導かれたのではなく、異なる物理原理を根本的に新しい方法で統合した深い直観と新規推論によるものでした。
Hassabisの基準では、現在のLLMはこのテストに合格しないでしょう。現在のAIは既存知識の統合と要約には優れていますが、全く新しい物理原理を第一原理から発見する能力はまだ示されていません。
AGI研究への示唆
この発言はDeepMindがAGIの目標をどう考えているかを垣間見せます。タスクパフォーマンスの測定ではなく、人類の知識の境界を拡張できるシステムこそがAGIだという認識です。このフレームワークは、多くの現行AGIベンチマークよりもはるかに高い基準を設定しています。
Related Articles
DeepMindのCEOデミス・ハサビスは、真のAGIを判断するテストとして、1911年の知識のみで学習したAIが、1915年のアインシュタインのように一般相対性理論を独自に導出できるかどうかを提案した。これは単なるパターンマッチングではなく、真の科学的発見能力を測る基準だ。
Anthropicは2026年3月6日、Claude Opus 4.6がFirefox脆弱性CVE-2026-2796のテスト用exploitを作成した過程を公開した。Anthropicはこれを実運用の攻撃自動化ではなく、frontier modelのcyber capabilityがどこまで近づいているかを示す早期警告として位置づけている。
r/MachineLearningで共有された新しいarXiv論文は、非公式のmodel access providerが研究結果と運用上の信頼性の両方を揺るがすと指摘している。
Comments (0)
No comments yet. Be the first to comment!