Google, Gemini 3.1 Pro 출시 — ARC-AGI-2 추론 성능 2배 이상 향상

개요

Google이 2026년 2월 19일 Gemini 3.1 Pro를 출시했다. 이번 업데이트는 Gemini 3 Pro의 핵심 추론 능력을 전면 업그레이드한 모델로, 기존에는 Gemini 3 Deep Think에서만 제공되던 고급 추론 기능을 일반 사용자에게도 확대 제공한다.

주요 성능 지표

Google에 따르면 Gemini 3.1 Pro는 ARC-AGI-2 벤치마크에서 77.1%를 기록했다. 이는 이전 Gemini 3 Pro 대비 2배 이상 향상된 수치다. ARC-AGI-2는 추상적 추론과 일반화 능력을 평가하는 대표적인 AI 벤치마크로, 현재 가장 까다로운 평가 기준 중 하나로 꼽힌다.

주요 활용 영역

복합 시각 추론: 복잡한 주제에 대한 시각적 설명 생성
데이터 종합 및 분석: 대규모 비정형 데이터의 통찰 도출
창의적 프로젝트: 멀티모달 생성 및 아이디에이션 지원
에이전트 워크플로우: 다단계 자율 태스크 처리

이용 가능 플랫폼

Gemini 3.1 Pro는 현재 프리뷰 상태로 배포 중이며 일반 공개(GA)는 추후 예정이다:

Gemini 앱 (전체 사용자)
NotebookLM (Pro 및 Ultra 구독자)
개발자 도구: Google AI Studio, Vertex AI, Gemini Enterprise, Android Studio, CLI

버전 체계 변경

이번 출시는 Google의 AI 모델 버전 체계에서도 의미 있는 변화를 보여준다. 기존 중간 업데이트에서 사용하던 ".5" 대신 ".1" 증분 방식을 채택하며, 보다 빈번한 모델 갱신 주기를 예고하고 있다.

출처: 9to5Google | Google Blog

LLM Feb 24, 2026 1 min read

Google, Gemini 3.1 Pro 출시 — ARC-AGI-2 77.1% 달성, 추론 성능 2배 향상

Google DeepMind가 2월 19일 Gemini 3.1 Pro를 공개했다. 전작 대비 ARC-AGI-2 점수가 31.1%에서 77.1%로 2배 이상 향상됐으며, 100만 토큰 컨텍스트 창과 SWE-Bench Verified 80.6%를 기록했다.

#google #gemini #benchmark

LLM May 22, 2026 1 min read

Google I/O 2026: Gemini 3.5 Flash 공개 — 플래그십 성능에 Flash 속도

Google이 I/O 2026에서 Gemini 3.5 Flash를 GA 출시했다. Gemini 3.1 Pro를 코딩·에이전트 벤치마크에서 능가하면서도 출력 속도는 4배 빠르고 비용은 40% 저렴하다.

#google #gemini #product-launch

LLM May 23, 2026 1 min read

Google I/O 2026: 개인 AI 에이전트 Gemini Spark 등장과 Gemini 3.5 Flash 성능 공개

Google이 5월 19일 Google I/O 2026에서 개인 AI 에이전트 Gemini Spark와 Gemini 3.1 Pro를 모든 벤치마크에서 앞서는 Gemini 3.5 Flash를 동시 공개했다. Spark는 기기가 꺼진 상태에서도 24시간 작동하며 Gmail 직접 이메일·크롬 웹 작업까지 처리하는 상시 에이전트로, 다음 주 미국 AI Ultra 구독자부터 베타 제공된다.