HNがDeepSeek V4に飛びついた理由はきれいな発表ページではなかった。表のリンクがAPI docsで、実際の重みとbaseモデルがすでにHugging Faceに並んでいたことが一気に火を付けた。
#open-weights
RSS Feed重要なのは、open-weight 27B dense modelがはるかに大きいcoding systemとagent taskで正面比較されていることだ。Qwenのmodel cardではSWE-bench VerifiedがQwen3.6-27Bで77.2、Qwen3.5-397B-A17Bで76.2、licenseはApache 2.0となっている。
LocalLLaMAはQwen3.6-27Bを単なるmodel cardではなく、すぐquantizeして手元で試せるownershipの話として受け止めた。
HNはKimi K2.6を、benchmark表よりも「open-weight coding agentが長い実務を耐えられるか」という問いで読んだ。12時間、13時間のcoding事例が注目を集める一方、速度、provider品質、benchmarkの現実味もすぐに問われた。
重要なのは、Alibabaが multimodal coding model を API 限定ではなく open weights として出した点だ。投稿は Qwen3.6-35B-A3B が35B total parameters、3B active parameters、Apache 2.0 license を持つと示し、ブログでは SWE-bench Verified 73.4 と Terminal-Bench 2.0 51.5 が示された。
HNが反応したのはopen weightsの実用面だった。35B MoEでactive parameterが3Bという形が、本当にcoding agentの仕事を支えられるのか。QwenはQwen3.5-35B-A3Bからの改善を示し、コメントはGGUF変換、Macのmemory制約、open modelだけのbenchmark表をどう読むかへ進んだ。
LocalLLaMA がこの話題に集まったのは、MiniMax が M2.7 ライセンス不安を静めようとしたからだ。ただ、スレッドの空気は「言い方が柔らかくなった」よりも、「self-hosted の商用利用が結局どこまで許されるのかはまだ曖昧だ」というものだった。
r/LocalLLaMAではMiniMax M2.7公開直後から、Hugging FaceのLICENSEが商用利用を禁じているためopen sourceとは言いにくいという指摘が広がった。
Mistral AIは2026年3月26日、Voxtral TTSがexpressive speech、9言語対応、低latency、容易なvoice adaptationを備えると述べた。3月23日のlaunch postでは、4B-parameterモデルが約3秒のreference audioからcustom voice adaptationを行い、約70msのmodel latencyと最大2分のnative audio generationをサポートすると説明している。
r/artificialの投稿はGoogle DeepMindのGemma 4公開を取り上げた。Gemma 4はApache 2.0の下でadvanced reasoningとagentic workflow向け機能をまとめたopen-weight familyで、Googleは4つのサイズ、larger modelで最大256K context、そしてHugging Faceからllama.cppまでのday-one supportを打ち出している。
2026年3月にr/LocalLLaMAで123 pointsと25 commentsを集めた `voxtral-voice-clone` は、MistralのVoxtral-4B-TTS-2603から欠けていたcodec encoderを学習し、`ref_audio` を使う zero-shot voice cloning を復元しようとするプロジェクトだ。
2026年3月26日、NVIDIAの`gpt-oss-puzzle-88B`モデルカードを扱ったr/LocalLLaMA投稿は、クロール時点で284 pointsと105 commentsを集めた。NVIDIAはこの88B MoEモデルがPuzzle post-training NASを用いてparameter数とKV-cache負荷を削減しつつ、reasoning accuracyを親モデル並みかそれ以上に保つと説明している。