Google DeepMind, AGI 진전을 재기 위한 cognitive framework와 Kaggle hackathon 공개

Original: Measuring progress toward AGI: A cognitive framework View original →

Read in other languages: English日本語
AI Mar 20, 2026 By Insights AI 1 min read Source

무슨 일이 있었나

Google DeepMind는 2026년 3월 17일 AGI 진전을 측정하기 위한 cognitive framework를 공개했다. 발표는 기존 benchmark leaderboard 중심 접근이 AGI 논의를 과도하게 단순화한다고 보고, 인지과학에 기반한 더 구조적인 평가 틀을 제안한다.

DeepMind가 제시한 핵심은 10개의 canonical cognitive capabilities다: perception, generation, attention, learning, memory, reasoning, metacognition, executive functions, problem solving, social cognition. 연구진은 개별 benchmark의 점수만 볼 것이 아니라, AI system이 이 능력들에서 인간 분포 대비 어느 수준에 있는지 매핑해야 한다고 설명했다.

어떻게 측정하겠다는 것인가

논문은 broad task pool과 held-out evaluation set을 만들고, 같은 과제에 대해 human data도 수집해 AI 성능을 사람 분포와 직접 비교하는 3-stage protocol을 제안한다. DeepMind는 이 framework를 paper로만 끝내지 않고 Kaggle hackathon도 함께 열었다. 대상은 learning, metacognition, attention, executive functions, social cognition의 5개 능력이며, submissions는 2026년 3월 17일부터 4월 16일까지 받고 결과는 6월 1일 발표될 예정이다. prize pool은 $200,000이다.

이는 AGI 담론을 "모델이 특정 시험에서 1위를 했다"는 식의 headline에서 벗어나, 어떤 종류의 cognition이 실제로 측정됐고 무엇이 아직 비어 있는지 더 분해해서 보자는 제안이다. 특히 metacognition이나 executive functions 같은 항목은 현재 상용 benchmark에서 상대적으로 빈칸이 큰 영역으로 지목된다.

왜 중요한가

이 프레임은 AI 업계의 성능 발표 문법 자체를 바꿀 가능성이 있다. 앞으로 frontier model 비교가 단일 점수보다 capability profile 중심으로 이동하면, 모델 개발자와 enterprise buyer 모두 시스템의 강점과 약점을 더 구체적으로 읽을 수 있다. 동시에 Kaggle hackathon을 통해 DeepMind가 평가 설계 자체를 외부 연구자에게 열었다는 점도, benchmark 거버넌스를 넓히려는 신호로 볼 수 있다.

Share: Long

Related Articles

AI sources.twitter 2d ago 1 min read

Google DeepMind는 X에서 20만 달러 상금 규모의 Kaggle hackathon을 열어 AI용 새로운 cognitive evaluation을 만들겠다고 밝혔다. 연결된 Google 글은 이 노력이 단일 benchmark가 아니라 10개의 cognitive ability 전반에서 AGI 진행 상황을 측정하려는 더 큰 프레임워크의 일부라고 설명한다.

AI 1d ago 1 min read

Google DeepMind는 2026년 3월 17일, AGI 진전을 평가하기 위한 새로운 cognitive science 기반 framework를 공개하고 이를 실제 benchmark로 바꾸기 위한 Kaggle hackathon을 시작했다고 밝혔다. 이 제안은 10개의 cognitive ability를 정의하고 human baseline과의 비교를 권장하며, community-built evaluation에 총 20만 달러 상금을 건다.

AI Reddit Mar 3, 2026 1 min read

Google DeepMind의 AI 수학 연구 에이전트 Aletheia가 FirstProof Challenge에서 전문가 심사단이 인정한 연구 수준 수학 문제 10개 중 6개를 자율적으로 해결했습니다. Gemini Deep Think 기반의 이 에이전트는 테렌스 타오 등 수학자들로부터 가치 있는 연구 협력자로 인정받고 있습니다.

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.