Google, Gemini in Sheets가 SpreadsheetBench 70.48%로 SOTA 달성했다고 발표
Original: R to @GoogleWorkspace: While we don't have favorites, the evolution of Gemini in Google Sheets might be our most impressive yet. Gemini in Google Sheets has achieved a state-of-the-art benchmark, achieving a 70.48% success rate on the full SpreadsheetBench dataset. This performance not only exceeds competitors but nears human expert ability. We accomplished this by equipping Gemini with better verbalization and enhanced coding capabilities. With these, Gemini can now natively build complex models and dashboards, solve your most complex optimization problems, and verify its own work for expert-level precision. Read more about Sheets here: https://blog.google/products-and-platforms/products/workspace/gemini-google-sheets-state-of-the-art View original →
X에서 Google이 강조한 내용
Google AI는 2026년 3월 10일 Gemini in Google Sheets가 전체 SpreadsheetBench에서 70.48%를 기록했다고 밝혔다. Google은 이를 state of the art 결과라고 설명하며 human expert performance에 근접한다고 주장했다. 단순히 수식 추천이나 autofill 보조를 넘어서겠다는 메시지다.
동시에 회사는 이 결과를 더 넓은 Workspace 전략 안에 배치했다. 선행 게시물에서 Google은 Docs, Sheets, Slides, Drive 각각의 data model과 사용자 요구에 맞게 Gemini를 조정해야 했다고 밝혔다. 즉 이번 Sheets 발표는 생산성 앱 안에 generic chat을 넣는 수준이 아니라, 구조화된 업무 환경에 맞춘 domain-tuned behavior로 나아가고 있음을 보여준다.
Google 블로그가 추가한 내용
Google의 공식 블로그는 70.48% 점수가 더 강한 verbalization과 coding capability를 Gemini in Sheets에 부여한 결과라고 설명한다. 회사에 따르면 이 조합을 통해 모델은 단순한 formula 생성에 그치지 않고, complex model과 dashboard를 직접 만들고, optimization problem을 풀고, 자신의 결과를 스스로 검증할 수 있다.
- Google은 전체 SpreadsheetBench 기준으로 경쟁 시스템을 앞섰다고 설명한다.
- 또한 해당 점수가 spreadsheet task에서 human expert ability에 근접한다고 주장한다.
- 회사는 이를 일반적인 Gemini 성능 향상보다, Workspace 내부의 product-specific model adaptation 성과로 해석하고 있다.
왜 기업 실무에 중요한가
Spreadsheet는 AI가 assistant를 넘어 delegated analytical work로 이동할 수 있는지를 보여주는 대표적인 enterprise 시험대다. formula suggestion도 유용하지만, 실제 비즈니스 가치는 시스템이 표 구조를 이해하고, 목표를 추론하고, 모델을 구성하고, 출력이 일관적인지 점검할 수 있을 때 나온다. Google이 이번에 강조한 변화가 바로 그 전환점이다.
이 benchmark 향상이 실제 운영에서도 재현된다면 의미는 Sheets 하나로 끝나지 않는다. Workspace 안의 product-specific tuning은 AI 생산성 경쟁이 단순한 language-model IQ보다, 문서·스프레드시트·프레젠테이션·지식 저장소의 native structure를 얼마나 깊게 이해하고 연결하느냐로 이동하고 있음을 보여준다.
Related Articles
Google의 2026년 2월 Gemini 업데이트는 Gemini 3.1 Pro, Deep Think, Nano Banana 2, Veo Templates, 새 Canvas 기능을 한 번에 묶어 내놓았다. 이번 드롭은 Gemini 앱을 단순 채팅창이 아니라 reasoning, image, music, video workflows의 전면 인터페이스로 밀어 올리려는 전략을 보여준다.
Google DeepMind는 2026년 3월 3일 Gemini 3.1 Flash-Lite를 공개하며 더 낮은 가격과 더 빠른 성능을 강조했다. Google은 이 모델을 AI Studio와 Vertex AI에서 preview로 제공하며, 고빈도 처리와 일정 수준의 추론을 동시에 겨냥한다고 설명했다.
Google AI가 Gemini 3.1 Flash-Lite의 고용량 이미지 분류 및 비즈니스 자동화 활용 사례를 제시했다. 모델은 Gemini API, Google AI Studio, Vertex AI preview 경로로 확장되고 있다.
Comments (0)
No comments yet. Be the first to comment!