重要なのは、agent競争が大きなmodelだけでなく、呼び出せるtool catalogへ移っていることだ。Clement Delangueは、agentが100万のHugging Face Spacesを呼び出せると数字で示した。
#huggingface
RSS FeedPrismMLは、open modelを小さくする鍵がarchitectureだけでなくweight formatにもあると示した。Ternary Bonsaiは1.58 bitsで8B、4B、1.7Bを出し、8B variantは1.75GBとされている。
Vulmonの2026年4月7日のX postは、Hugging Face Transformers Trainerのcheckpoint loadingにおけるarbitrary code execution問題、CVE-2026-1839を取り上げた。CVE.orgによれば、v5.0.0rc3より前の版はPyTorch 2.6未満で細工されたrng_state.pthからcode executionが起こり得て、fixはweights_only=Trueの追加である。
r/LocalLLaMAで拡散した Hugging Face Transformers の PR #44760 は、Mistral 4 を 128 experts、4 active experts、tokenあたり 6.5B activated parameters、256k context を備えた hybrid instruct/reasoning model として示している。
Hugging FaceはSpring 2026レポートで、13 million users、more than 2 million public models、over 500,000 public datasetsに達したと説明した。オープンAIは急拡大している一方、利用は少数のartifactに集中し、中国と独立開発者の存在感が強まっているという分析だ。
2026年3月4日、LocalLLaMAの高スコア投稿でMicrosoftのopen-weight multimodalモデルPhi-4-Reasoning-Vision-15Bが共有され、実運用観点の議論が広がった。
r/LocalLLaMAではQwen3.5-122B-A10B公開直後から、GGUF提供時期、量子化方式、実運用スループットの議論が加速した。モデルカードでは122B total/10B activatedのMoE構成、Apache-2.0、262,144トークンの標準contextが示されている。
r/LocalLLaMAの高スコア投稿を通じて、Hugging Face公開のQwen3.5-397B-A17Bが急速に共有された。モデルカードの397B/17B構成と約1Mトークン拡張コンテキストが主要論点になっている。