Gemini 3 Deep Think、ベンチマーク中心から科学・工学ワークフローへ拡大
Original: Gemini 3 Deep Think View original →
Googleの発表内容
2026年2月12日、Googleは専門推論モードであるGemini 3 Deep Thinkの大型アップデートを公開した。今回の位置づけは、一般的なチャット用途よりも、科学・研究・エンジニアリングの難問に対応するモデル強化である。提供はGoogle AI Ultra向けGeminiアプリから開始され、研究者・企業はGemini APIの早期アクセスに申請できる。
公表された評価指標
Googleが示した主な数値は、Humanity’s Last Exam 48.4%(ツールなし)、ARC-AGI-2 84.6%(ARC Prize Foundationによる検証言及)、Codeforces Elo 3455、International Math Olympiad 2025で金メダル級性能という内容だ。科学分野では、2025 International Physics OlympiadおよびChemistry Olympiadの記述式で金メダル級、理論物理のCMT-Benchmarkで50.5%と説明している。
初期テスター事例
記事には実運用に近い事例もある。Rutgers Universityの数学者Lisa Carboneは、技術的な数学論文の微細な論理欠陥をDeep Thinkが検出したと述べた。Duke UniversityのWang Labは結晶成長プロセスの最適化で100 μm超の薄膜目標に到達したとしている。GoogleのハードウェアR&Dにおける物理部品設計テストも紹介された。いずれもベンダー公表情報だが、適用領域の方向性は明確だ。
HNでの反応と含意
このHacker News投稿はクロール時点で1,000点超、コメント数も多く、再現性やベンチマーク妥当性、先端推論モデルの提供範囲が議論の中心になった。要点は、Googleが性能指標の訴求だけでなく、アプリとAPIの提供戦略を同時に進めていることで、2026年の研究・エンタープライズ導入競争に直結する可能性が高いという点だ。
Related Articles
Google AIはGemini 3.1 Flash-Liteの実運用例として、大量画像の仕分けや業務自動化シナリオを紹介した。Gemini API、Google AI Studio、Vertex AIのpreview導線も同時に示された。
Google DeepMindはGemini 3.1 Flash-LiteがGemini APIとGoogle AI Studioでpreview提供されると発表した。同社はこれを最もcost-efficientなGemini 3 modelと位置づけ、低価格・高速性能・調整可能なthinking levelsを強調している。
Google AI Developersは、Gemini APIとGoogle AI Studio経由でGemini 3.1 Flash-Liteのプレビュー提供を開始したと発表した。投稿では、Gemini 3系列で最速かつ低コストのモデルであり、タスク難易度に応じて推論を調整するdynamic thinkingを備えるとしている。
Comments (0)
No comments yet. Be the first to comment!