Google DeepMind의 Aletheia, 전문가 수준 미해결 수학 문제 6개 풀어내
Original: Google DeepMind's "Aletheia" just solved 6 open research-level math problems. Is this the AGI moment we've been waiting for? View original →
수학 연구의 새로운 경계
Google DeepMind가 개발한 AI 수학 연구 에이전트 Aletheia가 인류 최전선의 수학 연구에 기여하는 능력을 다시 한번 증명했습니다. r/singularity에서 291점을 획득한 이 소식은 AI가 단순한 경시대회 문제를 넘어 진정한 연구 수준의 수학 문제를 풀 수 있음을 보여주는 사례로 큰 주목을 받았습니다.
주요 성과
- FirstProof Challenge: 전문 수학자들이 출제한 연구 수준 수학 문제 10개 중 6개를 자율적으로 해결하여 전문가 심사단 과반수 인정 획득
- Bloom's Erdős Conjectures: 700개 미해결 문제의 반자율 평가에서 4개 미해결 문제 해결
- 자율 연구 논문: 산술 기하학의 고유값(eigenweight) 구조 상수를 계산하는 완전 AI 자율 논문 생성
기술적 구조
Aletheia는 Gemini Deep Think를 기반으로 세 가지 구성 요소로 이루어진 에이전트 하네스를 활용합니다: 후보 해법을 제안하는 Generator, 오류를 검토하는 Verifier, 그리고 오류를 수정하는 Reviser입니다. 이 구조는 추론 시간 계산량을 확장할수록 성능이 향상되며, 2025년 7월 IMO 금메달 수준 달성 이후 IMO-ProofBench Advanced에서 최대 90%의 점수를 기록하고 있습니다.
수학 커뮤니티의 반응
Fields Medal 수상자 테렌스 타오(Terence Tao)를 비롯한 수학자들이 Aletheia를 가치 있는 연구 협력자로 인정했습니다. Aletheia는 아직 많은 문제에서 어려움을 겪지만, 이번 성과는 AI 지원 연구에서 질적인 도약을 나타냅니다.
Related Articles
Google DeepMind는 2026년 3월 17일, AGI 진전을 평가하기 위한 새로운 cognitive science 기반 framework를 공개하고 이를 실제 benchmark로 바꾸기 위한 Kaggle hackathon을 시작했다고 밝혔다. 이 제안은 10개의 cognitive ability를 정의하고 human baseline과의 비교를 권장하며, community-built evaluation에 총 20만 달러 상금을 건다.
중요한 점은 AI 노동 리스크가 추상적 예측이 아니라 사용자 응답 데이터로 좁혀지고 있다는 데 있다. Anthropic은 81,000건 응답을 분석해 AI exposure가 높은 직무군에서 displacement 우려 언급이 약 3배 높다고 밝혔다.
r/MachineLearning은 이 글을 또 하나의 AGI 선언문처럼 소비하지 않았다. 댓글의 톤은 놀람보다 세미나에 가까웠고, learning mechanics가 실제 연구 프로그램이 될 수 있는지에 관심이 몰렸다.
Comments (0)
No comments yet. Be the first to comment!