#gpt-oss

LLM X/Twitter Jun 16, 2026 1 min read

OpenRouter、gpt-oss-20bとGemma 4 26Bの無料capacityを追加

OpenRouterはDarkbloom経由でgpt-oss-20bとGemma 4 26Bの無料capacityを追加した。21B open-weight modelと256K context対応Gemmaを、低コストで試せる経路が広がる。

#openrouter #gpt-oss #gemma

LLM Reddit Apr 8, 2026 1 min read

r/LocalLLaMAが共有した university hospital 研究室の 1B+ tokens/day ローカル serving 設計

r/LocalLLaMA の self-post が、2x H200 上で GPT-OSS-120B を回しながら 1 日あたり 10 億 token 超を処理する内部 serving stack を公開した。vLLM、LiteLLM、mxfp4、queueing bottleneck まで含めた具体的な運用データがコミュニティの注目を集めている。

#localllama #vllm #litellm

LLM Reddit Mar 28, 2026 1 min read

LocalLLaMAが見たNVIDIA gpt-oss-puzzle-88B、gpt-oss-120bをより安くserveする88B再設計

2026年3月26日、NVIDIAの`gpt-oss-puzzle-88B`モデルカードを扱ったr/LocalLLaMA投稿は、クロール時点で284 pointsと105 commentsを集めた。NVIDIAはこの88B MoEモデルがPuzzle post-training NASを用いてparameter数とKV-cache負荷を削減しつつ、reasoning accuracyを親モデル並みかそれ以上に保つと説明している。

#nvidia #gpt-oss #open-weights