Google DeepMind, Gemini Deep Think를 Olympiad 이후 수학·물리·computer science 연구 파트너로 확장

Original: Accelerating Mathematical and Scientific Discovery with Gemini Deep Think View original →

Read in other languages: English日本語
Sciences Mar 8, 2026 By Insights AI 2 min read 1 views Source

Google DeepMind가 February 11, 2026에 공개한 Gemini Deep Think 글은 benchmark 성능 자랑에서 실제 research workflow 주장으로 무게중심을 옮긴 발표다. 회사는 expert mathematician와 scientist의 지도 아래 Gemini Deep Think가 이제 mathematics, physics, computer science 전반의 전문 연구 문제 해결을 돕고 있다고 설명했다. 이는 더 이상 contest 스타일의 단발성 문제풀이가 아니라, literature 조사, 오류 검증, 반복 수정이 들어가는 open-ended research 작업을 목표로 한다는 점에서 의미가 크다.

Google DeepMind는 이번 발표를 2025년 International Mathematics Olympiad Gold-medal standard와 이후 International Collegiate Programming Contest 성과의 연장선으로 제시한다. 하지만 February 2026 업데이트는 거기서 한 걸음 더 나간다. 회사는 두 편의 새 논문과 함께 Aletheia라는 내부 math research agent를 공개했다. 설명에 따르면 Aletheia는 Gemini Deep Think에 natural-language verifier, iterative revision loop, Google Search, web browsing을 결합해 후보 해법의 결함을 찾고, 잘못된 시도는 버리며, spurious citation이나 계산 오류를 줄이도록 설계됐다.

평가 수치도 공격적이다. Google DeepMind는 inference-time compute를 늘릴수록 Gemini Deep Think가 IMO-ProofBench Advanced에서 최대 90%까지 도달했고, internal FutureMath Basic benchmark의 PhD-level exercise에서도 같은 scaling trend가 이어졌다고 말했다. 더 중요한 것은 단순 점수가 아니라 결과물이다. 회사는 arithmetic geometry의 eigenweights에 관한 autonomous paper, independent sets에 대한 human-AI collaboration paper, 그리고 Bloom's Erdos Conjectures database의 open problem 700개를 semi-autonomous 방식으로 검토해 4개의 open question에 autonomous solution을 냈다고 소개했다.

computer science와 physics 사례도 구체적이다. Google DeepMind는 Gemini Deep Think가 algorithms, combinatorial optimization, information theory, economics, physics를 포함한 18개의 연구 문제에 기여했다고 밝혔다. 예시로는 continuous mathematics 도구를 끌어와 Max-Cut과 Steiner Tree의 정체를 풀어낸 사례, online submodular optimization에서 10년 넘게 유지된 직관을 반례로 뒤집은 결과, ML optimization의 adaptive penalty 효과 해명, AI token allocation을 위한 auction theory 확장, 그리고 cosmic-string radiation 계산에서 singular integral을 다루는 새로운 접근이 제시됐다.

물론 주의할 점도 있다. 이는 Google DeepMind가 정리한 공동 연구의 성격이지, AI가 연구자를 독립적으로 대체했다는 주장은 아니다. 회사도 AI-assisted math taxonomy에서 가장 높은 수준의 breakthrough novelty를 주장하지 않는다고 명시했다. 그럼에도 이번 발표가 high-signal인 이유는 frontier model을 verification loop, browsing, domain expert oversight가 붙은 scientific collaborator로 재정의하기 때문이다. 이 결과가 peer review와 외부 재현을 통과한다면, Gemini Deep Think는 contest 성능을 넘어 실제 research production으로 들어가는 대표 사례 중 하나가 될 수 있다.

Share:

Related Articles

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.