Google DeepMindのAI数学共同研究者、数十年来未更新のラムゼー数5問を更新
Google DeepMindはGeminiを基盤とするマルチエージェントシステム「AI Co-Mathematician」を発表し、最大20年間更新されていなかったラムゼー数5問の下限値を改善。数学AI評価の最難関ベンチマークで新記録を樹立した。
FrontierMath Tier 4で48%——全AIモデル最高スコア
AI Co-MathematicianはFrontierMath Tier 4で48%を達成し、これまで公開されたすべてのAIシステムを上回る最高スコアを記録した。このベンチマークは数十年間AIが突破できないよう設計された研究レベルの数学問題で構成されている。
ラムゼー数5問の下限値を更新
AlphaEvolveは一度の実行で5つの古典的ラムゼー数の下限値を改善した:
- R(3,13):60 → 61(11年間保持されていた記録)
- R(3,18):99 → 100(20年間保持されていた記録)
- R(4,13):138 → 139、R(4,14):147 → 148、R(4,15):158 → 159
仕組み
AlphaEvolveは答えを生成するだけでなく、アルゴリズムそのものを進化的に改善する。候補プログラムの集団を評価し、大規模言語モデルで有望な解を変異させる自己改善サイクルを採用。50以上の未解決数学問題で75%は最高水準の解を再発見し、20%では既存の結果を上回った。論文はarXiv:2605.06651で公開中。
Related Articles
Google DeepMindの創薬スピンオフIsomorphic Labsが創薬AI「IsoDDE」の技術レポートを公開。コロンビア大の研究者は「AlphaFold 4規模の大躍進」と評価し、J&J・Eli Lilly・Novartisと数十億ドル規模のパートナーシップを締結している。
UCLAの研究チームが、マウス実験で物理的リハビリの効果を完全に再現する初の薬物DDL-920を発見した。Nature Communicationsに掲載されたこの研究は、脳卒中回復医療に新たな道を開く可能性がある。
HNはこの話を「AIがまた勝った」ではなく、人間が見落としていた道筋をモデルが指さした事例として受け取った。GPT-5.4 Proの粗い下書きを数学者が拾い上げて磨き直す流れこそが、スレッドの熱源だった。
Comments (0)
No comments yet. Be the first to comment!