Google DeepMind, AGI 진전을 재기 위한 cognitive framework와 Kaggle hackathon 공개

무슨 일이 있었나

Google DeepMind는 2026년 3월 17일 AGI 진전을 측정하기 위한 cognitive framework를 공개했다. 발표는 기존 benchmark leaderboard 중심 접근이 AGI 논의를 과도하게 단순화한다고 보고, 인지과학에 기반한 더 구조적인 평가 틀을 제안한다.

DeepMind가 제시한 핵심은 10개의 canonical cognitive capabilities다: perception, generation, attention, learning, memory, reasoning, metacognition, executive functions, problem solving, social cognition. 연구진은 개별 benchmark의 점수만 볼 것이 아니라, AI system이 이 능력들에서 인간 분포 대비 어느 수준에 있는지 매핑해야 한다고 설명했다.

어떻게 측정하겠다는 것인가

논문은 broad task pool과 held-out evaluation set을 만들고, 같은 과제에 대해 human data도 수집해 AI 성능을 사람 분포와 직접 비교하는 3-stage protocol을 제안한다. DeepMind는 이 framework를 paper로만 끝내지 않고 Kaggle hackathon도 함께 열었다. 대상은 learning, metacognition, attention, executive functions, social cognition의 5개 능력이며, submissions는 2026년 3월 17일부터 4월 16일까지 받고 결과는 6월 1일 발표될 예정이다. prize pool은 $200,000이다.

이는 AGI 담론을 "모델이 특정 시험에서 1위를 했다"는 식의 headline에서 벗어나, 어떤 종류의 cognition이 실제로 측정됐고 무엇이 아직 비어 있는지 더 분해해서 보자는 제안이다. 특히 metacognition이나 executive functions 같은 항목은 현재 상용 benchmark에서 상대적으로 빈칸이 큰 영역으로 지목된다.

왜 중요한가

이 프레임은 AI 업계의 성능 발표 문법 자체를 바꿀 가능성이 있다. 앞으로 frontier model 비교가 단일 점수보다 capability profile 중심으로 이동하면, 모델 개발자와 enterprise buyer 모두 시스템의 강점과 약점을 더 구체적으로 읽을 수 있다. 동시에 Kaggle hackathon을 통해 DeepMind가 평가 설계 자체를 외부 연구자에게 열었다는 점도, benchmark 거버넌스를 넓히려는 신호로 볼 수 있다.

Google DeepMind, AGI 진전을 재기 위한 cognitive framework와 Kaggle hackathon 공개

무슨 일이 있었나

어떻게 측정하겠다는 것인가

왜 중요한가

Related Articles

Google DeepMind, AGI 평가를 글로벌 Kaggle 챌린지로 확장

Google DeepMind, AGI 진전을 재는 cognitive framework 제안

Google DeepMind의 Aletheia, 전문가 수준 미해결 수학 문제 6개 풀어내

Comments (0)

Leave a Comment

Related Articles

Google DeepMind, AGI 평가를 글로벌 Kaggle 챌린지로 확장

Google DeepMind, AGI 진전을 재는 cognitive framework 제안

Google DeepMind의 Aletheia, 전문가 수준 미해결 수학 문제 6개 풀어내
AI Reddit Mar 3, 2026 1 min read