LLM X/Twitter Mar 6, 2026 1 min read
Google DeepMindは2026年3月3日、XでGemini 3.1 Flash-Liteを発表した。公式ブログではpreview提供、入力1M tokensあたり$0.25・出力1M tokensあたり$1.50の価格、低遅延志向の設計が示されている。
Google DeepMindは2026年3月3日、XでGemini 3.1 Flash-Liteを発表した。公式ブログではpreview提供、入力1M tokensあたり$0.25・出力1M tokensあたり$1.50の価格、低遅延志向の設計が示されている。
AlibabaのQwenチームがQwen 3.5 Smallをリリースした。r/LocalLLaMAで1,000以上のアップボートを記録したこの発表は、高性能小型モデルへのコミュニティの高い関心を反映している。
r/LocalLLaMAではQwen3.5-122B-A10B公開直後から、GGUF提供時期、量子化方式、実運用スループットの議論が加速した。モデルカードでは122B total/10B activatedのMoE構成、Apache-2.0、262,144トークンの標準contextが示されている。