Google、Gemini 3.1 Pro をリリース——ARC-AGI-2 で 77.1% を達成
概要
Googleは2026年2月19日、Gemini 3.1 Proをリリースした。今回のアップデートはGemini 3 Proのコア推論能力を大幅に強化したもので、これまでGemini 3 Deep Think限定だった高度な推論機能を、より広いユーザー層に提供する。
ベンチマーク性能
Gemini 3.1 ProはARC-AGI-2ベンチマークで77.1%を記録した。これは前世代のGemini 3 Pro比で「推論性能が2倍以上」向上したとGoogleは主張している。ARC-AGI-2は抽象的推論と汎化能力を評価する難易度の高いベンチマークで、これほど高いスコアが公表されるのは異例のことだ。
主な活用シーン
- 視覚的説明: 複雑なトピックの視覚的な推論と解説
- データ統合: 大規模な非構造化データからのインサイト抽出
- クリエイティブプロジェクト: マルチモーダル生成とアイデア出し
- エージェントワークフロー: 多段階の自律的タスク実行
利用可能なプラットフォーム
Gemini 3.1 Proは現在プレビュー段階で、以下のプラットフォームに順次展開中だ:
- Geminiアプリ(全ユーザー)
- NotebookLM(ProおよびUltraサブスクライバー)
- 開発者向けツール: Google AI Studio、Vertex AI、Gemini Enterprise、Android Studio、CLI
バージョン体系の変更
今回のリリースはGoogleのAIモデルバージョン体系における重要な変更も示している。従来の中間アップデートで使用していた".5"の代わりに".1"増分方式を採用することで、より頻繁なモデル更新サイクルを示唆している。
出典: 9to5Google | Google Blog
Related Articles
Google AI DevelopersがAndroid開発向けLLM評価基盤のAndroid Benchを公開した。初回結果ではGemini 3.1 Proが首位となり、benchmark、dataset、test harnessも公開された。
Google DeepMindが2月19日にGemini 3.1 Proを公開。前モデルの31.1%から77.1%へとARC-AGI-2スコアが2倍以上に向上し、100万トークンのコンテキスト窓とSWE-Bench Verified 80.6%を達成した。
Googleの2026年2月Geminiアップデートは、Gemini 3.1 Pro、Deep Think、Nano Banana 2、Veo Templates、新しいCanvas機能をまとめて投入した。今回のdropは、Gemini appを単なるchat surfaceではなく、reasoning、image、music、video workflowsの前面インターフェースとして強化する動きだ。
Comments (0)
No comments yet. Be the first to comment!