Gemini 3 Deep Think、ベンチマーク中心から科学・工学ワークフローへ拡大

Original: Gemini 3 Deep Think View original →

Read in other languages: 한국어English
LLM Feb 14, 2026 By Insights AI (HN) 1 min read 1 views Source

Googleの発表内容

2026年2月12日、Googleは専門推論モードであるGemini 3 Deep Thinkの大型アップデートを公開した。今回の位置づけは、一般的なチャット用途よりも、科学・研究・エンジニアリングの難問に対応するモデル強化である。提供はGoogle AI Ultra向けGeminiアプリから開始され、研究者・企業はGemini APIの早期アクセスに申請できる。

公表された評価指標

Googleが示した主な数値は、Humanity’s Last Exam 48.4%(ツールなし)、ARC-AGI-2 84.6%(ARC Prize Foundationによる検証言及)、Codeforces Elo 3455、International Math Olympiad 2025で金メダル級性能という内容だ。科学分野では、2025 International Physics OlympiadおよびChemistry Olympiadの記述式で金メダル級、理論物理のCMT-Benchmarkで50.5%と説明している。

初期テスター事例

記事には実運用に近い事例もある。Rutgers Universityの数学者Lisa Carboneは、技術的な数学論文の微細な論理欠陥をDeep Thinkが検出したと述べた。Duke UniversityのWang Labは結晶成長プロセスの最適化で100 μm超の薄膜目標に到達したとしている。GoogleのハードウェアR&Dにおける物理部品設計テストも紹介された。いずれもベンダー公表情報だが、適用領域の方向性は明確だ。

HNでの反応と含意

このHacker News投稿はクロール時点で1,000点超、コメント数も多く、再現性やベンチマーク妥当性、先端推論モデルの提供範囲が議論の中心になった。要点は、Googleが性能指標の訴求だけでなく、アプリとAPIの提供戦略を同時に進めていることで、2026年の研究・エンタープライズ導入競争に直結する可能性が高いという点だ。

Share:

Related Articles

LLM sources.twitter 2d ago 1 min read

Google DeepMindはGemini 3.1 Flash-LiteがGemini APIとGoogle AI Studioでpreview提供されると発表した。同社はこれを最もcost-efficientなGemini 3 modelと位置づけ、低価格・高速性能・調整可能なthinking levelsを強調している。

LLM sources.twitter Mar 5, 2026 1 min read

Google AI Developersは、Gemini APIとGoogle AI Studio経由でGemini 3.1 Flash-Liteのプレビュー提供を開始したと発表した。投稿では、Gemini 3系列で最速かつ低コストのモデルであり、タスク難易度に応じて推論を調整するdynamic thinkingを備えるとしている。

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.