OpenAIは汎用推論モデルがエルデシュの平面単位距離問題の予想上限を反証する構成を発見したと発表しました。数学者が証明を検証しましたが、ML研究者は手法の透明性に疑問を提起しています。
#mathematics
RSS FeedOpenAIの汎用推論モデルが、1946年にポール・エルデシュが提唱した平面単位距離問題を自律的に解決した。著名な数学者たちが証明を検証し、AIが数学の主要な未解決問題を自律的に初めて解いた事例となった。
OpenAIの汎用推論モデルが、1946年にエルデシュが提起した離散幾何学の核心的予想を自律的に反証した。AIが著名な未解決数学問題を自力で解いたのは史上初であり、プリンストン大学のノガ・アロンを含む複数の数学者が証明を検証した。
Google DeepMindがGeminiベースのマルチエージェントシステム「AI Co-Mathematician」を公開。FrontierMath Tier 4でAI史上最高の48%を達成し、AlphaEvolveは11〜20年間更新されていなかったラムゼー数5問の下限値を改善した。
フィールズ賞受賞数学者のTimothy Gowersが、ChatGPT 5.5 Proで未解決の数学問題に挑戦し、約1時間で博士レベルの証明を生成させた。現在のAI進歩速度では数学研究が近く危機を迎えると警告している。
GPT-5.4 ProがエルデシュProblem 1196を解く際に生成した証明手法が、60年来の未解決予想を含む他の数学問題にも適用できることが確認された。
r/singularityが食いついたのは「AIがまた問題を当てた」ではなく、「今回は本当に新しい手が出たのか」だった。Scientific Americanが伝えた23歳Liam PriceとGPT-5.4 Proによる60年物Erdos問題の話は、novelty、専門家の整理作業、そして数学者の役割をめぐる議論へ広がった。
HNはこの話を「AIがまた勝った」ではなく、人間が見落としていた道筋をモデルが指さした事例として受け取った。GPT-5.4 Proの粗い下書きを数学者が拾い上げて磨き直す流れこそが、スレッドの熱源だった。
閉じたbenchmarkの更新ではなく、公開数学問題の境界が動いた点が重要だ。TogetherはEinsteinArena上のagentsが11次元kissing numberの下限を593から604へ引き上げ、4月11日時点でopen problemに11件の新SOTAを刻んだと書いた。
Google DeepMindはFebruary 11, 2026、Gemini Deep Thinkがmathematics、physics、computer scienceの専門研究問題へ広がっていると発表した。Aletheiaというmath research agent、IMO-ProofBench Advancedでup to 90%の結果、18件の研究課題での協働を通じて、AIをscientific workflowの協働相手として位置づけている。
Epoch AIがGPT-5.4 Proを使ったFrontierMath Open Problemsの組合せ論課題の解法を確認したと公表し、Hacker Newsの関心は単なるbenchmark scoreからexpert-verified research workflowへ移った。
OpenAIは2026年2月20日、First Proofの研究級数学問題10問すべてに対するproof attemptを公開した。会社はexpert feedbackの後、少なくとも5件は正しい可能性が高いと見ている一方、いくつかは審査中で、problem 2の試みは誤りだと判断した。