부식 중

Google DeepMind, Gemini 3.1 Pro 출시 — ARC-AGI-2 77.1% 달성, 추론 성능 2배 향상

Original: Google DeepMind Releases Gemini 3.1 Pro: 2x Reasoning Boost and Record Benchmark Scores View original →

Read in other languages: English 日本語

LLM Feb 22, 2026 By Insights AI (Twitter) 1 min read 28 views Source

개요

Google DeepMind가 2026년 2월 19일 Gemini 3.1 Pro를 출시했다. 전작 Gemini 3 Pro 대비 추론 성능이 2배 이상 향상됐으며, ARC-AGI-2에서 77.1%를 달성해 기존 31.1%에서 크게 도약했다. API 가격은 그대로 유지된다.

주요 벤치마크 성능

ARC-AGI-2: 77.1% (기존 31.1%에서 대폭 향상)
SWE-bench Verified: 80.6%
GPQA Diamond: 94.3%
LiveCodeBench Pro Elo: 2887
Humanity's Last Exam: 44.4%
18개 추적 벤치마크 중 12개에서 1위

주요 기능

1M 토큰 컨텍스트: 텍스트, 이미지, 오디오, 비디오 모두 지원
세 가지 사고 레벨: Low, Medium, High — 응답 지연과 추론 깊이를 조절 가능
64K 출력 토큰: 긴 복잡한 작업에 적합
멀티모달: 텍스트, 오디오, 이미지, 비디오, 코드 레포지토리 처리 가능

가격 및 이용

API 가격은 이전 Gemini 3 Pro와 동일하게 입력 100만 토큰당 $2, 출력 100만 토큰당 $12로 유지된다. Gemini API, Vertex AI, Gemini 앱, NotebookLM을 통해 이용 가능하다.

출처: Google DeepMind (@GoogleDeepMind) on X

#gemini #google-deepmind #llm #reasoning #benchmark

Share: Long

Related Articles

LLM Feb 28, 2026 2 min read

Google DeepMind, Gemini 3.1 Pro 공개…복잡 문제 해결용 추론 성능 강화

Google DeepMind는 2026년 2월 19일 Gemini 3.1 Pro를 발표했다. 회사는 ARC-AGI-2에서 77.1% 검증 점수를 제시하며, 개발자·기업·일반 사용자 채널에 동시 롤아웃한다고 밝혔다.

#gemini #google-deepmind #llm

26

LLM X/Twitter 1d ago 1 min read

Gemini 3.5 Flash Cyber, V8 취약점 55건으로 보안 모델 경쟁 가속

가벼운 보안 특화 모델이 V8에서 고유 취약점 55건을 찾으며 방어 자동화의 비용 구조를 흔들었다. Google DeepMind는 정부와 신뢰 파트너에게만 CodeMender 경유 파일럿을 연다.

#google-deepmind #gemini #cybersecurity

1

Gemini 3종, 에이전트 비용·보안 작업 겨냥한 Flash 라인업

LLM X/Twitter 4d ago 1 min read

Gemini 3종, 에이전트 비용·보안 작업 겨냥한 Flash 라인업

Google DeepMind의 새 Flash 라인업은 대형 모델 경쟁의 축을 비용과 처리량으로 옮긴다. 3.6 Flash는 3.5 Flash보다 출력 토큰을 17% 줄이고, Flash-Lite는 초당 350개 출력 토큰을 내세운다.

#google-deepmind #gemini #ai-agents

1