Demis Hassabis:「真のAGIテストはAIが一般相対性理論を独自に導出できるか」
Original: Demis Hassabis: "The kind of test I would be looking for is training an AI system with a knowledge cutoff of, say, 1911, and then seeing if it could come up with general relativity, like Einstein did in 1915. That's the kind of test I think is a true test of whether we have a full AGI system" View original →
HassabisのAGIテスト提案
Google DeepMind CEOのDemis Hassabisが、真のAGI(汎用人工知能)を判定するための具体的なベンチマークを提案し、Reddit r/singularityで1,800以上のポイントを獲得し大きな反響を呼んでいます。
アインシュタインテスト
Hassabisは次のように述べました。
「私が求めるテストは、例えば1911年をナレッジカットオフとしてAIシステムを訓練し、その後アインシュタインが1915年にしたように、AIが一般相対性理論を自力で導出できるかを見ることです。これが完全なAGIシステムを持っているかどうかの真のテストだと思います。」
このテストが意味を持つ理由
このベンチマークは単なるパターン認識や暗記をはるかに超えるものです。アインシュタインの一般相対性理論は、データ分析から導かれたのではなく、異なる物理原理を根本的に新しい方法で統合した深い直観と新規推論によるものでした。
Hassabisの基準では、現在のLLMはこのテストに合格しないでしょう。現在のAIは既存知識の統合と要約には優れていますが、全く新しい物理原理を第一原理から発見する能力はまだ示されていません。
AGI研究への示唆
この発言はDeepMindがAGIの目標をどう考えているかを垣間見せます。タスクパフォーマンスの測定ではなく、人類の知識の境界を拡張できるシステムこそがAGIだという認識です。このフレームワークは、多くの現行AGIベンチマークよりもはるかに高い基準を設定しています。
Related Articles
Anthropicは2026年3月31日、豪州政府とAI safety研究およびAustralia National AI Plan支援に関するMOUを締結したと発表した。Australia AI Safety Instituteとの協力、Economic Indexデータ共有、豪州研究機関とのAUD$3 million規模の提携が含まれるとしている。
DeepMindのCEOデミス・ハサビスは、真のAGIを判断するテストとして、1911年の知識のみで学習したAIが、1915年のアインシュタインのように一般相対性理論を独自に導出できるかどうかを提案した。これは単なるパターンマッチングではなく、真の科学的発見能力を測る基準だ。
OpenAIの2026年4月6日のX投稿は、external researchersとengineers向けのSafety Fellowshipを発表した。OpenAIによれば、このpilot programは2026年9月14日から2027年2月5日まで実施され、safety evaluation、robustness、privacy-preserving methods、agentic oversightなどを優先分野とする。
Comments (0)
No comments yet. Be the first to comment!