Google DeepMind、高頻度・低コスト処理向けGemini 3.1 Flash-Liteを公開
Original: 3.1 Flash-Lite outperforms 2.5 Flash with faster performance at a lower price. New ‘thinking levels’ let you dial in reasoning to adapt for different tasks, while still being able to handle complex workloads - like generating UI and dashboards or creating simulations. View original →
X投稿の要点
Google DeepMindは2026年3月3日、Gemini 3.1 Flash-LiteがGemini 2.5 Flashより低価格で、かつ高速だとXで発表した。投稿では同時に“thinking levels”も強調されており、開発者がタスクごとにreasoning量とlatency、コストのバランスを調整できる設計だと分かる。Googleはこのモデルを、単なる廉価版ではなく、UI生成やdashboard生成、simulation作成のような複雑な作業もこなせる高処理量向けtierとして位置付けている。
Google公式ブログは、その商用的な狙いをより明確にしている。Googleによれば、Gemini 3.1 Flash-LiteはGoogle AI StudioのGemini APIとVertex AIでpreview提供を開始した。価格は入力100万tokensあたり0.25ドル、出力100万tokensあたり1.50ドルで、Artificial Analysis基準では2.5 Flash比でtime to first tokenが2.5倍高速、出力速度が45%向上したとしている。
model cardが示す仕様
Google DeepMindのmodel cardでは、3.1 Flash-LiteをGemini 3 familyに属するnatively multimodal reasoning modelと説明している。Gemini 3 Proをベースとし、最大100万tokenのcontext windowと64K output tokensを持つ。想定用途はtranslationやclassificationのような高頻度・低遅延ワークロードだが、公開benchmarkではGPQA Diamond 86.9%、MMMU-Pro 76.8%、LiveCodeBench 72.0%、output speed 363 tokens/sという数値も掲載されている。
なぜ重要なのか
このリリースが重要なのは、production AIの経済性がますます低価格・高処理量tierで決まるようになっているからだ。多くの企業機能や消費者向け機能は最大モデルを必要としていない。必要なのは、予測可能なlatency、調整可能なreasoning、そして大量リクエストでも成立する価格体系だ。Googleは今回、その層をtranslation、moderation、classification、lightweightなagent作業までカバーできる形で狙っている。
またthinking levelsの導入も実務上大きい。廉価モデルとより深く考えるモデルを完全に分けるのではなく、同じserving tier内でreasoning depthを調整できれば、開発者はmodel routingを単純化しつつ、コストと性能の最適化をより運用的に行える。今回の価値は単なる価格の低下ではなく、安価なtierでもreasoning制御を持ち込んだ点にある。
出典: Google DeepMind X投稿, Google公式ブログ, Google DeepMind model card
Related Articles
GoogleはMarch 3, 2026、Gemini 3.1 Flash-LiteをGemini 3系で最速かつ最もコスト効率の高いモデルとして発表した。previewはGoogle AI StudioとVertex AIで始まり、価格は$0.25/1M input tokens、$1.50/1M output tokensだ。
Google DeepMindはGemini 3.1 Flash-LiteがGemini APIとGoogle AI Studioでpreview提供されると発表した。同社はこれを最もcost-efficientなGemini 3 modelと位置づけ、低価格・高速性能・調整可能なthinking levelsを強調している。
Google AIはGemini 3.1 Flash-Liteの実運用例として、大量画像の仕分けや業務自動化シナリオを紹介した。Gemini API、Google AI Studio、Vertex AIのpreview導線も同時に示された。
Comments (0)
No comments yet. Be the first to comment!