Google、Gemini 3.1 Flash-Liteをpreview公開低コスト大量処理を狙う

GoogleはMar 03, 2026、Gemini 3.1 Flash-Liteを発表し、Gemini 3 seriesで最も高速かつcost-efficientなmodelだと説明した。Gemini API経由のGoogle AI Studioと、enterprise向けのVertex AIでpreview提供が始まっている。今回の発表でGoogleが強調したのは、最高性能のflagshipというより、大規模なproduct workloadを効率良く回すための運用性だ。

価格は$0.25/1M input tokensと$1.50/1M output tokens。Googleによれば、Gemini 3.1 Flash-Liteは2.5 Flash比で2.5X faster Time to First Answer Token、45% higher output speedを実現しつつ、qualityは同等かそれ以上を維持するという。translation、moderation、support automationのように呼び出し回数が多く、cost ceilingが重要な領域では特に意味の大きい改善だ。

性能指標

Arena.aiでElo 1432。
GPQA Diamond 86.9%。
MMMU Pro 76.8%。
AI StudioとVertex AIでthinking levelsを提供。

Googleが示した用途も実務寄りだ。high-volume translation、content moderation、user interfaceやdashboard generation、simulations、multi-step business tasksが挙げられている。early usersとしてLatitude、Cartwheel、Wheringも紹介された。これはFlash-Liteを単なるdemo modelではなく、product teamがそのまま組み込めるlow-latency foundationとして押し出していることを示す。

今回の発表は、model競争の軸が単一benchmarkの高さから、latency、price、managed infrastructureとの統合へ移っていることをよく表している。Googleの数値が実運用でも維持されるなら、Gemini 3.1 Flash-Liteは常時稼働するAI機能を設計する開発者にとって有力なdefault候補になるだろう。

Google、Gemini 3.1 Flash-Liteをpreview公開低コスト大量処理を狙う

性能指標

Related Articles

Google、Developer Knowledge APIとMCP Serverを公開 Gemini Code Assistにチーム知識を接続

Google AI Developers、Android Bench公開　Android開発向けLLM評価基盤を提示

Google、Gemini API に project spend caps と自動 tier upgrade を導入

Related Articles

Google、Developer Knowledge APIとMCP Serverを公開 Gemini Code Assistにチーム知識を接続
LLM Mar 13, 2026 1 min read

Google AI Developers、Android Bench公開　Android開発向けLLM評価基盤を提示
LLM X/Twitter Mar 8, 2026 1 min read

Google、Gemini API に project spend caps と自動 tier upgrade を導入
LLM Mar 17, 2026 1 min read

性能指標

Related Articles

Google、Developer Knowledge APIとMCP Serverを公開 Gemini Code Assistにチーム知識を接続

Google AI Developers、Android Bench公開 Android開発向けLLM評価基盤を提示

Google、Gemini API に project spend caps と自動 tier upgrade を導入

Google AI Developers、Android Bench公開　Android開発向けLLM評価基盤を提示