OpenAI의 범용 추론 모델이 에르되시의 평면 단위거리 문제 추측 상한을 반증하는 반례를 찾아냈다고 발표했습니다. 수학자들이 증명을 검토했지만 ML 커뮤니티는 방법론 투명성에 의문을 제기합니다.
#mathematics
RSS FeedOpenAI의 범용 추론 모델이 수학자 폴 에르되시가 1946년에 제시한 기하학 난제를 자율적으로 해결했다. AI가 수학의 주요 미해결 문제를 스스로 풀어낸 최초의 사례로, 외부 수학자들이 증명을 검토하고 검증했다.
OpenAI의 범용 추론 모델이 1946년 폴 에르되시가 제기한 이산 기하학의 핵심 추측을 자율적으로 반증했다. AI가 수학의 주요 미해결 문제를 독립적으로 해결한 것은 역사상 처음이며, 다수의 수학자들이 독립적으로 검증했다.
구글 딥마인드가 제미나이 기반 멀티 에이전트 시스템 'AI 수학 공동 연구자'를 공개해 FrontierMath Tier 4에서 모든 AI 중 최고인 48%를 기록했다. AlphaEvolve는 11~20년간 유지된 램지 수(Ramsey number) 5개의 하한선 갱신에 성공했다.
필즈상 수상 수학자 Timothy Gowers가 ChatGPT 5.5 Pro로 미해결 수학 문제에 도전해 약 1시간 만에 박사급 증명을 이끌어냈다. 수학 연구의 위기가 임박했다고 경고했다.
GPT-5.4 Pro가 에르되시 문제 1196을 풀기 위해 생성한 증명 방법이 60년 된 또 다른 에르되시 추측을 포함한 여러 문제에 성공적으로 적용됐다.
r/singularity는 “AI가 또 문제를 맞혔다”보다 “이번엔 진짜 새 수가 나온 건가”에 더 꽂혔다. Scientific American이 전한 23세 Liam Price와 GPT-5.4 Pro의 60년 묵은 Erdos 문제 풀이가, novelty와 전문가 정리 작업, 수학자 역할을 둘러싼 토론으로 번졌다.
HN은 이번 수학 이야기를 "AI가 또 해냈다"보다 사람이 못 본 길을 찍어준 사건으로 봤다. 거친 GPT-5.4 Pro 초안을 수학자들이 추려내고 다듬는 과정 자체가 더 큰 화제가 됐다.
닫힌 benchmark 대신 live math frontier가 움직였다는 점에서 무게가 다르다. Together는 EinsteinArena agents가 11차원 kissing number 하한을 593에서 604로 끌어올렸고, 4월 11일 기준 open problem에서 11개의 새로운 SOTA를 기록했다고 적었다.
Google DeepMind는 February 11, 2026 Gemini Deep Think가 수학·물리·computer science 전문 연구 문제를 푸는 단계로 확장됐다고 발표했다. 회사는 수학 연구 agent인 Aletheia, up to 90%의 IMO-ProofBench Advanced 성과, 18개 연구 문제 협업 사례를 통해 AI가 과학 연구의 보조 수단을 넘어 협업 도구로 이동하고 있다고 설명했다.
Epoch AI가 GPT-5.4 Pro를 활용한 FrontierMath Open Problems 조합론 과제 해법을 확인했다고 밝히면서, HN의 초점이 단순 benchmark score보다 expert-verified research workflow로 옮겨갔다.
OpenAI는 2026년 2월 20일 First Proof의 연구급 수학 문제 10개 전부에 대한 proof attempt를 공개했다고 밝혔다. 회사는 외부 expert feedback 이후 최소 5개 시도가 정답일 가능성이 높다고 보고 있지만, 일부는 아직 검토 중이며 problem 2 시도는 잘못됐다고 판단했다.