Google、Gemini in Sheets が SpreadsheetBench 70.48%でSOTA到達と発表
Original: R to @GoogleWorkspace: While we don't have favorites, the evolution of Gemini in Google Sheets might be our most impressive yet. Gemini in Google Sheets has achieved a state-of-the-art benchmark, achieving a 70.48% success rate on the full SpreadsheetBench dataset. This performance not only exceeds competitors but nears human expert ability. We accomplished this by equipping Gemini with better verbalization and enhanced coding capabilities. With these, Gemini can now natively build complex models and dashboards, solve your most complex optimization problems, and verify its own work for expert-level precision. Read more about Sheets here: https://blog.google/products-and-platforms/products/workspace/gemini-google-sheets-state-of-the-art View original →
XでGoogleが示したポイント
Google AIは2026年3月10日、Gemini in Google Sheetsが完全版のSpreadsheetBenchで70.48%を達成したと発表した。Googleはこれをstate of the artだと説明し、human expert performanceに近い水準だと主張している。単なるformula補助やautofill支援より踏み込んだメッセージだ。
同時にGoogleは、この成果をより広いWorkspace戦略の中で位置づけた。先行する投稿では、Docs、Sheets、Slides、Driveそれぞれのdata modelと利用者ニーズに合わせてGeminiを調整する必要があったと説明している。つまりSheetsの今回の成果は、汎用chatを埋め込む段階から、構造化された業務環境向けのdomain-tuned behaviorへ進んでいることを示す。
Googleブログの補足
Googleの公式ブログによれば、70.48%という結果は、Gemini in Sheetsにより強いverbalizationとcoding capabilityを持たせたことで実現したという。Googleは、その結果としてモデルが単にformulaを生成するだけでなく、complex modelやdashboardをネイティブに構築し、optimization problemを解き、自身の作業を検証できるようになったと説明している。
- Googleは、完全版SpreadsheetBenchで競合システムを上回ったとしている。
- また、そのスコアはspreadsheet taskにおけるhuman expert abilityに近いとも述べている。
- Googleはこの進展を、一般的なGemini強化ではなく、Workspace内のproduct-specific model adaptationの成果として位置づけている。
なぜ企業ワークフローに重要か
Spreadsheetは、AIがassistant的な補助からdelegated analytical workへ進めるかを測る代表的なenterprise領域だ。formula suggestionは便利だが、本当の価値はシステムが表の構造を理解し、目的を推論し、モデルを組み立て、出力の整合性まで確認できるときに生まれる。Googleが今回示したのは、その移行が現実味を帯びてきたというシグナルだ。
もしこのbenchmark向上が実運用でも再現されるなら、意味はSheetsだけにとどまらない。Workspace内でのproduct-specific tuningは、今後の競争が汎用的なlanguage-model IQではなく、文書、spreadsheet、presentation、knowledge storeのnative structureにどれだけ深く結びつけられるかへ移る可能性を示している。
Related Articles
Google DeepMindは2026年3月3日、Gemini 3.1 Flash-Liteを発表し、低価格と高速性を前面に出した。Google AI StudioとVertex AIでpreview提供され、高頻度・低遅延の開発ワークロードを主な対象とする。
Google AIはGemini 3.1 Flash-Liteの実運用例として、大量画像の仕分けや業務自動化シナリオを紹介した。Gemini API、Google AI Studio、Vertex AIのpreview導線も同時に示された。
Google DeepMindはGemini 3.1 Flash-LiteがGemini APIとGoogle AI Studioでpreview提供されると発表した。同社はこれを最もcost-efficientなGemini 3 modelと位置づけ、低価格・高速性能・調整可能なthinking levelsを強調している。
Comments (0)
No comments yet. Be the first to comment!