Google, Gemini 3.1 Pro 출시 — ARC-AGI-2 추론 성능 2배 이상 향상
개요
Google이 2026년 2월 19일 Gemini 3.1 Pro를 출시했다. 이번 업데이트는 Gemini 3 Pro의 핵심 추론 능력을 전면 업그레이드한 모델로, 기존에는 Gemini 3 Deep Think에서만 제공되던 고급 추론 기능을 일반 사용자에게도 확대 제공한다.
주요 성능 지표
Google에 따르면 Gemini 3.1 Pro는 ARC-AGI-2 벤치마크에서 77.1%를 기록했다. 이는 이전 Gemini 3 Pro 대비 2배 이상 향상된 수치다. ARC-AGI-2는 추상적 추론과 일반화 능력을 평가하는 대표적인 AI 벤치마크로, 현재 가장 까다로운 평가 기준 중 하나로 꼽힌다.
주요 활용 영역
- 복합 시각 추론: 복잡한 주제에 대한 시각적 설명 생성
- 데이터 종합 및 분석: 대규모 비정형 데이터의 통찰 도출
- 창의적 프로젝트: 멀티모달 생성 및 아이디에이션 지원
- 에이전트 워크플로우: 다단계 자율 태스크 처리
이용 가능 플랫폼
Gemini 3.1 Pro는 현재 프리뷰 상태로 배포 중이며 일반 공개(GA)는 추후 예정이다:
- Gemini 앱 (전체 사용자)
- NotebookLM (Pro 및 Ultra 구독자)
- 개발자 도구: Google AI Studio, Vertex AI, Gemini Enterprise, Android Studio, CLI
버전 체계 변경
이번 출시는 Google의 AI 모델 버전 체계에서도 의미 있는 변화를 보여준다. 기존 중간 업데이트에서 사용하던 ".5" 대신 ".1" 증분 방식을 채택하며, 보다 빈번한 모델 갱신 주기를 예고하고 있다.
출처: 9to5Google | Google Blog
Related Articles
Google AI Developers가 Android 개발 전용 LLM 평가 체계인 Android Bench를 공개했다. 첫 결과에서는 Gemini 3.1 Pro가 1위를 차지했고, benchmark, dataset, test harness도 함께 공개됐다.
Google DeepMind가 2월 19일 Gemini 3.1 Pro를 공개했다. 전작 대비 ARC-AGI-2 점수가 31.1%에서 77.1%로 2배 이상 향상됐으며, 100만 토큰 컨텍스트 창과 SWE-Bench Verified 80.6%를 기록했다.
OpenAI가 GPT-5.2를 발표하며 400K 토큰 컨텍스트 윈도우와 AIME 2025 수학 벤치마크 100% 달성을 선보였다. GPT-5.2 Thinking 버전은 GDPval 벤치마크에서 전문가 대비 70.9% 승률을 기록했다.
Comments (0)
No comments yet. Be the first to comment!