데미스 하사비스: "1911년 지식으로 학습된 AI가 일반 상대성이론을 발견할 수 있다면 진정한 AGI"
Original: Demis Hassabis: "The kind of test I would be looking for is training an AI system with a knowledge cutoff of, say, 1911, and then seeing if it could come up with general relativity, like Einstein did in 1915. That's the kind of test I think is a true test of whether we have a full AGI system" View original →
아인슈타인 테스트: AGI 판별의 궁극적 기준
DeepMind CEO 데미스 하사비스가 AGI(인공 일반 지능) 달성 여부를 판별하는 구체적이고 설득력 있는 테스트를 제시해 AI 연구 커뮤니티에서 큰 주목을 받고 있다.
하사비스는 YouTube 인터뷰에서 다음과 같이 밝혔다. "내가 찾는 테스트의 종류는 예를 들어 1911년으로 지식 한계를 설정하고 AI 시스템을 학습시킨 다음, 1915년 아인슈타인이 그랬던 것처럼 일반 상대성이론을 스스로 도출할 수 있는지를 보는 것입니다. 그게 바로 우리가 완전한 AGI 시스템을 가졌는지를 판단하는 진정한 테스트라고 생각합니다."
왜 이 테스트가 의미 있는가
이 제안의 핵심은 단순 암기나 패턴 인식이 아닌 진정한 과학적 추론과 창의적 발견 능력을 측정한다는 데 있다. 일반 상대성이론은 1911년 당시의 물리학 데이터와 수학적 도구들을 조합해 완전히 새로운 개념 체계를 구축한 것으로, 기존 정보의 재조합이 아닌 근본적으로 새로운 통찰을 요구한다.
- 1911년 이전 물리학: 뉴턴 역학, 특수 상대성이론(1905), 전자기학
- 1915년 아인슈타인의 성취: 등가 원리를 바탕으로 시공간 곡률과 중력을 통합
- 요구되는 능력: 기존 패러다임을 뛰어넘는 창의적 개념화
현재 AI의 한계와 AGI의 거리
현재 대규모 언어 모델(LLM)들은 이미 존재하는 개념들을 놀라울 정도로 잘 조합하고 설명하지만, 완전히 새로운 물리적 이론을 독자적으로 구축하는 능력은 아직 입증되지 않았다. 하사비스의 테스트는 이러한 차이를 명확히 드러낸다.
r/singularity 커뮤니티에서 2,800개 이상의 추천을 받으며 폭발적인 반응을 얻은 이 발언은, AI 연구의 궁극적 목표와 현재 기술의 간극에 대한 심도 있는 논의를 촉발시켰다.
AGI 정의 논쟁
하사비스의 제안은 AGI에 대한 정의 자체가 얼마나 다양할 수 있는지도 보여준다. OpenAI는 '대부분의 경제적으로 가치 있는 작업'을 수행할 수 있는 시스템으로 AGI를 정의하는 반면, 하사비스는 과학적 발견 능력이라는 보다 엄격한 기준을 제시하고 있다.
Related Articles
2024년 'Ingenia 정리'를 통해 머신러닝으로는 인간 수준 성능이 불가능하다고 주장한 논문이 반박됐다. 해당 증명의 오류를 보여주는 논문이 같은 저널 Computational Brain & Behavior에 게재됐다.
arXiv가 LLM이 생성한 오류(허위 참고문헌, 잘못된 결과 등)를 검수 없이 그대로 실은 논문에 대해 저자 전원에게 1년 제출 금지 처분을 내리기 시작했다. AI 생성 콘텐츠의 학문적 책임 소재를 명확히 하는 이정표적 조치다.
Google DeepMind의 Sierra Leone 교실 실험에서 학생들의 문제 접근 질문 비중이 68%에서 90%로 늘었다. 8주간 1,763명을 대상으로 한 RCT라는 점에서 교육용 AI 논의가 사용감이 아니라 행동 변화 지표로 이동했다.