Google、Gemini 3.1 Pro をリリース——ARC-AGI-2 で 77.1% を達成
概要
Googleは2026年2月19日、Gemini 3.1 Proをリリースした。今回のアップデートはGemini 3 Proのコア推論能力を大幅に強化したもので、これまでGemini 3 Deep Think限定だった高度な推論機能を、より広いユーザー層に提供する。
ベンチマーク性能
Gemini 3.1 ProはARC-AGI-2ベンチマークで77.1%を記録した。これは前世代のGemini 3 Pro比で「推論性能が2倍以上」向上したとGoogleは主張している。ARC-AGI-2は抽象的推論と汎化能力を評価する難易度の高いベンチマークで、これほど高いスコアが公表されるのは異例のことだ。
主な活用シーン
- 視覚的説明: 複雑なトピックの視覚的な推論と解説
- データ統合: 大規模な非構造化データからのインサイト抽出
- クリエイティブプロジェクト: マルチモーダル生成とアイデア出し
- エージェントワークフロー: 多段階の自律的タスク実行
利用可能なプラットフォーム
Gemini 3.1 Proは現在プレビュー段階で、以下のプラットフォームに順次展開中だ:
- Geminiアプリ(全ユーザー)
- NotebookLM(ProおよびUltraサブスクライバー)
- 開発者向けツール: Google AI Studio、Vertex AI、Gemini Enterprise、Android Studio、CLI
バージョン体系の変更
今回のリリースはGoogleのAIモデルバージョン体系における重要な変更も示している。従来の中間アップデートで使用していた".5"の代わりに".1"増分方式を採用することで、より頻繁なモデル更新サイクルを示唆している。
出典: 9to5Google | Google Blog
Related Articles
Google DeepMindが2月19日にGemini 3.1 Proを公開。前モデルの31.1%から77.1%へとARC-AGI-2スコアが2倍以上に向上し、100万トークンのコンテキスト窓とSWE-Bench Verified 80.6%を達成した。
Googleは4月21日、Deep ResearchをGemini 3.1 Proベースへ引き上げ、MCP接続とMaxモードを加えた。Web検索、アップロード済みファイル、ライセンスデータを一つの調査フローにまとめたい金融・ライフサイエンス向けの動きだ。
Google DeepMindは2026年3月26日、Gemini 3.1 Flash LiveをGemini LiveとGoogle Search Liveへ順次展開し、開発者はGoogle AI Studioから利用を始められると発表した。Googleはこれを自社最高品質のaudio modelと位置づけ、低latency、向上したtonal understanding、ComplexFuncBench Audio 90.8%を打ち出している。
Comments (0)
No comments yet. Be the first to comment!