#mixture-of-experts

LLM Reddit Mar 25, 2026 1 min read

r/LocalLLaMAが注目したGigaChat 3.1 open weights、10Bから702Bまで

r/LocalLLaMAがGigaChat 3.1に強く反応したのは、ローカル向けの 10B A1.8B MoE と frontier-scale の 702B MoE をともに MIT terms で公開し、どちらも from scratch で学習したと打ち出しているからだ。

#open-weights #gigachat #mixture-of-experts

LLM Reddit Mar 25, 2026 1 min read

LocalLLaMAで注目されたMITライセンスのGigaChat 3.1、702Bと10Bを公開

LocalLLaMAでは、クラスタ向けの702B MoEモデルと軽量導入向けの10B MoEモデルを組み合わせたMITライセンスのGigaChat 3.1公開が注目を集めた。

#gigachat #open-weights #multilingual

LLM Hacker News Mar 23, 2026 1 min read

Flash-MoE、48GB MacBook Proで397B Qwenを動かす実験を公開

Hacker Newsで注目を集めたFlash-MoEは、SSDストリーミングとMetalカーネルを使ってQwen3.5-397B-A17Bを48GB M3 MaxノートPCで対話可能な速度まで動かす手法を示した。

#llm #mixture-of-experts #metal

LLM Reddit Mar 12, 2026 1 min read

r/LocalLLaMAが見たNVIDIA Nemotron 3 Super公開

NVIDIAのNemotron 3 Superは、120B total / 12B activeのhybrid Mamba-Transformer MoE、native 1M-token context、そしてopen weights・datasets・recipesを前面に出している。LocalLLaMA discussionは、そのopennessとefficiency claimが実際のhome-lab deploymentに結びつくかを中心に見ていた。

#nvidia #open-weights #mixture-of-experts