Google、Gemini in Sheets が SpreadsheetBench 70.48%でSOTA到達と発表

Original: R to @GoogleWorkspace: While we don't have favorites, the evolution of Gemini in Google Sheets might be our most impressive yet. Gemini in Google Sheets has achieved a state-of-the-art benchmark, achieving a 70.48% success rate on the full SpreadsheetBench dataset. This performance not only exceeds competitors but nears human expert ability. We accomplished this by equipping Gemini with better verbalization and enhanced coding capabilities. With these, Gemini can now natively build complex models and dashboards, solve your most complex optimization problems, and verify its own work for expert-level precision. Read more about Sheets here: https://blog.google/products-and-platforms/products/workspace/gemini-google-sheets-state-of-the-art View original →

Read in other languages: 한국어English
LLM Mar 12, 2026 By Insights AI 1 min read Source

XでGoogleが示したポイント

Google AIは2026年3月10日、Gemini in Google Sheetsが完全版のSpreadsheetBench70.48%を達成したと発表した。Googleはこれをstate of the artだと説明し、human expert performanceに近い水準だと主張している。単なるformula補助やautofill支援より踏み込んだメッセージだ。

同時にGoogleは、この成果をより広いWorkspace戦略の中で位置づけた。先行する投稿では、Docs、Sheets、Slides、Driveそれぞれのdata modelと利用者ニーズに合わせてGeminiを調整する必要があったと説明している。つまりSheetsの今回の成果は、汎用chatを埋め込む段階から、構造化された業務環境向けのdomain-tuned behaviorへ進んでいることを示す。

Googleブログの補足

Googleの公式ブログによれば、70.48%という結果は、Gemini in Sheetsにより強いverbalizationcoding capabilityを持たせたことで実現したという。Googleは、その結果としてモデルが単にformulaを生成するだけでなく、complex modelやdashboardをネイティブに構築し、optimization problemを解き、自身の作業を検証できるようになったと説明している。

  • Googleは、完全版SpreadsheetBenchで競合システムを上回ったとしている。
  • また、そのスコアはspreadsheet taskにおけるhuman expert abilityに近いとも述べている。
  • Googleはこの進展を、一般的なGemini強化ではなく、Workspace内のproduct-specific model adaptationの成果として位置づけている。

なぜ企業ワークフローに重要か

Spreadsheetは、AIがassistant的な補助からdelegated analytical workへ進めるかを測る代表的なenterprise領域だ。formula suggestionは便利だが、本当の価値はシステムが表の構造を理解し、目的を推論し、モデルを組み立て、出力の整合性まで確認できるときに生まれる。Googleが今回示したのは、その移行が現実味を帯びてきたというシグナルだ。

もしこのbenchmark向上が実運用でも再現されるなら、意味はSheetsだけにとどまらない。Workspace内でのproduct-specific tuningは、今後の競争が汎用的なlanguage-model IQではなく、文書、spreadsheet、presentation、knowledge storeのnative structureにどれだけ深く結びつけられるかへ移る可能性を示している。

出典: Google AI X投稿, Google Workspaceブログ

Share:

Related Articles

LLM sources.twitter 2d ago 1 min read

Google DeepMindはGemini 3.1 Flash-LiteがGemini APIとGoogle AI Studioでpreview提供されると発表した。同社はこれを最もcost-efficientなGemini 3 modelと位置づけ、低価格・高速性能・調整可能なthinking levelsを強調している。

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.