Google、Gemini in Sheets が SpreadsheetBench 70.48%でSOTA到達と発表
Original: R to @GoogleWorkspace: While we don't have favorites, the evolution of Gemini in Google Sheets might be our most impressive yet. Gemini in Google Sheets has achieved a state-of-the-art benchmark, achieving a 70.48% success rate on the full SpreadsheetBench dataset. This performance not only exceeds competitors but nears human expert ability. We accomplished this by equipping Gemini with better verbalization and enhanced coding capabilities. With these, Gemini can now natively build complex models and dashboards, solve your most complex optimization problems, and verify its own work for expert-level precision. Read more about Sheets here: https://blog.google/products-and-platforms/products/workspace/gemini-google-sheets-state-of-the-art View original →
XでGoogleが示したポイント
Google AIは2026年3月10日、Gemini in Google Sheetsが完全版のSpreadsheetBenchで70.48%を達成したと発表した。Googleはこれをstate of the artだと説明し、human expert performanceに近い水準だと主張している。単なるformula補助やautofill支援より踏み込んだメッセージだ。
同時にGoogleは、この成果をより広いWorkspace戦略の中で位置づけた。先行する投稿では、Docs、Sheets、Slides、Driveそれぞれのdata modelと利用者ニーズに合わせてGeminiを調整する必要があったと説明している。つまりSheetsの今回の成果は、汎用chatを埋め込む段階から、構造化された業務環境向けのdomain-tuned behaviorへ進んでいることを示す。
Googleブログの補足
Googleの公式ブログによれば、70.48%という結果は、Gemini in Sheetsにより強いverbalizationとcoding capabilityを持たせたことで実現したという。Googleは、その結果としてモデルが単にformulaを生成するだけでなく、complex modelやdashboardをネイティブに構築し、optimization problemを解き、自身の作業を検証できるようになったと説明している。
- Googleは、完全版SpreadsheetBenchで競合システムを上回ったとしている。
- また、そのスコアはspreadsheet taskにおけるhuman expert abilityに近いとも述べている。
- Googleはこの進展を、一般的なGemini強化ではなく、Workspace内のproduct-specific model adaptationの成果として位置づけている。
なぜ企業ワークフローに重要か
Spreadsheetは、AIがassistant的な補助からdelegated analytical workへ進めるかを測る代表的なenterprise領域だ。formula suggestionは便利だが、本当の価値はシステムが表の構造を理解し、目的を推論し、モデルを組み立て、出力の整合性まで確認できるときに生まれる。Googleが今回示したのは、その移行が現実味を帯びてきたというシグナルだ。
もしこのbenchmark向上が実運用でも再現されるなら、意味はSheetsだけにとどまらない。Workspace内でのproduct-specific tuningは、今後の競争が汎用的なlanguage-model IQではなく、文書、spreadsheet、presentation、knowledge storeのnative structureにどれだけ深く結びつけられるかへ移る可能性を示している。
Related Articles
Googleは4月21日、Deep ResearchをGemini 3.1 Proベースへ引き上げ、MCP接続とMaxモードを加えた。Web検索、アップロード済みファイル、ライセンスデータを一つの調査フローにまとめたい金融・ライフサイエンス向けの動きだ。
4月24日のGemini Dropは、新モデル単体よりも日常利用の囲い込みが本題だ。Mac向けネイティブアプリ、Notebooks統合、Personal Intelligenceの拡大、無料の3分Lyria 3 Pro、対話型ビジュアルでGeminiは常駐アシスタントに近づく。
Google DeepMindは2026年3月26日、Gemini 3.1 Flash LiveをGemini LiveとGoogle Search Liveへ順次展開し、開発者はGoogle AI Studioから利用を始められると発表した。Googleはこれを自社最高品質のaudio modelと位置づけ、低latency、向上したtonal understanding、ComplexFuncBench Audio 90.8%を打ち出している。
Comments (0)
No comments yet. Be the first to comment!