Google DeepMind、高頻度・低コスト処理向けGemini 3.1 Flash-Liteを公開

Original: 3.1 Flash-Lite outperforms 2.5 Flash with faster performance at a lower price. New ‘thinking levels’ let you dial in reasoning to adapt for different tasks, while still being able to handle complex workloads - like generating UI and dashboards or creating simulations. View original →

Read in other languages: 한국어English
LLM Mar 7, 2026 By Insights AI 1 min read 2 views Source

X投稿の要点

Google DeepMindは2026年3月3日、Gemini 3.1 Flash-LiteがGemini 2.5 Flashより低価格で、かつ高速だとXで発表した。投稿では同時に“thinking levels”も強調されており、開発者がタスクごとにreasoning量とlatency、コストのバランスを調整できる設計だと分かる。Googleはこのモデルを、単なる廉価版ではなく、UI生成やdashboard生成、simulation作成のような複雑な作業もこなせる高処理量向けtierとして位置付けている。

Google公式ブログは、その商用的な狙いをより明確にしている。Googleによれば、Gemini 3.1 Flash-LiteはGoogle AI StudioのGemini APIVertex AIでpreview提供を開始した。価格は入力100万tokensあたり0.25ドル出力100万tokensあたり1.50ドルで、Artificial Analysis基準では2.5 Flash比でtime to first tokenが2.5倍高速、出力速度が45%向上したとしている。

model cardが示す仕様

Google DeepMindのmodel cardでは、3.1 Flash-LiteをGemini 3 familyに属するnatively multimodal reasoning modelと説明している。Gemini 3 Proをベースとし、最大100万tokenのcontext window64K output tokensを持つ。想定用途はtranslationやclassificationのような高頻度・低遅延ワークロードだが、公開benchmarkではGPQA Diamond 86.9%、MMMU-Pro 76.8%、LiveCodeBench 72.0%、output speed 363 tokens/sという数値も掲載されている。

なぜ重要なのか

このリリースが重要なのは、production AIの経済性がますます低価格・高処理量tierで決まるようになっているからだ。多くの企業機能や消費者向け機能は最大モデルを必要としていない。必要なのは、予測可能なlatency、調整可能なreasoning、そして大量リクエストでも成立する価格体系だ。Googleは今回、その層をtranslation、moderation、classification、lightweightなagent作業までカバーできる形で狙っている。

またthinking levelsの導入も実務上大きい。廉価モデルとより深く考えるモデルを完全に分けるのではなく、同じserving tier内でreasoning depthを調整できれば、開発者はmodel routingを単純化しつつ、コストと性能の最適化をより運用的に行える。今回の価値は単なる価格の低下ではなく、安価なtierでもreasoning制御を持ち込んだ点にある。

出典: Google DeepMind X投稿, Google公式ブログ, Google DeepMind model card

Share:

Related Articles

LLM sources.twitter 2d ago 1 min read

Google DeepMindはGemini 3.1 Flash-LiteがGemini APIとGoogle AI Studioでpreview提供されると発表した。同社はこれを最もcost-efficientなGemini 3 modelと位置づけ、低価格・高速性能・調整可能なthinking levelsを強調している。

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.