Google DeepMindのAletheia、研究レベルの未解決数学問題を6問自律的に解決
Original: Google DeepMind's "Aletheia" just solved 6 open research-level math problems. Is this the AGI moment we've been waiting for? View original →
数学コンペを超えて
Google DeepMindのAletheia AIエージェントが、単なる数学競技問題を超えた真の未解決数学研究問題に取り組む能力を示しています。r/singularityでスコア291を獲得したこの成果に関する投稿は、AIが真の数学的研究能力に近づいているかどうかについて大きな議論を巻き起こしました。
主な成果
- FirstProof Challenge:専門家の過半数評価により、研究レベルの未解決数学問題10問中6問を自律的に解決
- Bloom's Erdős Conjectures:700問の未解決問題の半自律的評価で4問の未解決問題を解決
- 自律的研究論文:算術幾何学における固有値(eigenweight)の構造定数を計算する完全AI自律論文を生成
Aletheiaの仕組み
AlethiaはGemini Deep Thinkを基盤とし、3つのコンポーネントからなるエージェント・ハーネスを使用しています:候補解を提案するGenerator、欠陥を検出するVerifier、エラーを修正するReviser。このアーキテクチャは推論時計算量を増やすほど性能が向上し、2025年7月のIMOゴールドメダルレベルから始まり、現在はIMO-ProofBench Advancedで最大90%のスコアを記録しています。
数学コミュニティの反応
フィールズ賞受賞者のTerence Taoをはじめとする一流数学者たちが、Aletheiaの成果を認め「価値ある研究協力者」と表現しました。Aletheiaはまだ多くの問題に苦戦していますが、その成功はAI支援研究における質的な飛躍を示しています。
Related Articles
r/MachineLearningで共有された新しいarXiv論文は、非公式のmodel access providerが研究結果と運用上の信頼性の両方を揺るがすと指摘している。
Anthropicは、Claude Opus 4.6がMozillaとの2週間の協業でFirefox脆弱性22件を発見したと発表した。Mozillaはそのうち14件をhigh severityと分類し、Firefox 148.0で修正を配布した。
Googleは3月 5日、Google AI Center Berlinを開設し、Google DeepMind、Google Research、Google Cloudのteamsと研究者、企業、policy leadersを結ぶhubとして運営すると説明した。あわせてTUMとHelmholtz Munichとの長期research partnershipも発表した。
Comments (0)
No comments yet. Be the first to comment!