腐食中

Google、Gemini in Sheets が SpreadsheetBench 70.48%でSOTA到達と発表

Original: R to @GoogleWorkspace: While we don't have favorites, the evolution of Gemini in Google Sheets might be our most impressive yet. Gemini in Google Sheets has achieved a state-of-the-art benchmark, achieving a 70.48% success rate on the full SpreadsheetBench dataset. This performance not only exceeds competitors but nears human expert ability. We accomplished this by equipping Gemini with better verbalization and enhanced coding capabilities. With these, Gemini can now natively build complex models and dashboards, solve your most complex optimization problems, and verify its own work for expert-level precision. Read more about Sheets here: https://blog.google/products-and-platforms/products/workspace/gemini-google-sheets-state-of-the-art View original →

Read in other languages: 한국어English
LLM Mar 12, 2026 By Insights AI 1 min read 6 views Source

XでGoogleが示したポイント

Google AIは2026年3月10日、Gemini in Google Sheetsが完全版のSpreadsheetBench70.48%を達成したと発表した。Googleはこれをstate of the artだと説明し、human expert performanceに近い水準だと主張している。単なるformula補助やautofill支援より踏み込んだメッセージだ。

同時にGoogleは、この成果をより広いWorkspace戦略の中で位置づけた。先行する投稿では、Docs、Sheets、Slides、Driveそれぞれのdata modelと利用者ニーズに合わせてGeminiを調整する必要があったと説明している。つまりSheetsの今回の成果は、汎用chatを埋め込む段階から、構造化された業務環境向けのdomain-tuned behaviorへ進んでいることを示す。

Googleブログの補足

Googleの公式ブログによれば、70.48%という結果は、Gemini in Sheetsにより強いverbalizationcoding capabilityを持たせたことで実現したという。Googleは、その結果としてモデルが単にformulaを生成するだけでなく、complex modelやdashboardをネイティブに構築し、optimization problemを解き、自身の作業を検証できるようになったと説明している。

  • Googleは、完全版SpreadsheetBenchで競合システムを上回ったとしている。
  • また、そのスコアはspreadsheet taskにおけるhuman expert abilityに近いとも述べている。
  • Googleはこの進展を、一般的なGemini強化ではなく、Workspace内のproduct-specific model adaptationの成果として位置づけている。

なぜ企業ワークフローに重要か

Spreadsheetは、AIがassistant的な補助からdelegated analytical workへ進めるかを測る代表的なenterprise領域だ。formula suggestionは便利だが、本当の価値はシステムが表の構造を理解し、目的を推論し、モデルを組み立て、出力の整合性まで確認できるときに生まれる。Googleが今回示したのは、その移行が現実味を帯びてきたというシグナルだ。

もしこのbenchmark向上が実運用でも再現されるなら、意味はSheetsだけにとどまらない。Workspace内でのproduct-specific tuningは、今後の競争が汎用的なlanguage-model IQではなく、文書、spreadsheet、presentation、knowledge storeのnative structureにどれだけ深く結びつけられるかへ移る可能性を示している。

出典: Google AI X投稿, Google Workspaceブログ

Share: Long

Related Articles

LLM sources.twitter Mar 30, 2026 1 min read

Google DeepMindは2026年3月26日、Gemini 3.1 Flash LiveをGemini LiveとGoogle Search Liveへ順次展開し、開発者はGoogle AI Studioから利用を始められると発表した。Googleはこれを自社最高品質のaudio modelと位置づけ、低latency、向上したtonal understanding、ComplexFuncBench Audio 90.8%を打ち出している。

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.