議論の焦点は「encoder-free」が実際のモデル構造で何を意味するのかに集まった。
議論の焦点は「encoder-free」が実際のモデル構造で何を意味するのかに集まった。
LocalLLaMAで注目されたのは、OCRの新奇性よりも公開重み、セルフホスト、低い実行要件という実務面だった。
DeepSeekがDeepSeek-V4-Pro(総パラメータ1.6兆、アクティブ49B)とV4-Flash(284B/13B)を公開した。両モデルはMITライセンスで100万トークンコンテキストに対応するMixture-of-Expertsモデル。V4-Proはこれまでで最大のオープンウェイトモデルとなり、価格はGPT-5.4やClaude Sonnet 4.6の半分以下だ。
HNはMistral Medium 3.5を単なるモデル追加として見なかった。4GPU自前運用、オープンウェイト、遠隔コーディングエージェントの組み合わせが議論の中心だった。
LocalLLaMAが真っ先に掴んだのは数字より形だった。Mistral Medium 3.5はreasoning、coding、agent作業を一つにまとめつつ、「これは自分でも回せるかもしれない」と思わせた。その感触がスレッドを熱くした。
ローカル運用まで見据えたオープンウェイトのコードモデルはまだ少ない。Poolsideは単一GPU級の33B総量 / 3B活性MoE「Laguna XS.2」を前面に出し、技術解説ではSWE-bench Pro 44.5%を掲げた。
LocalLLaMAがこの話題に強く反応したのは、単なる謝罪文だったからではない。hosted modelでは、同じモデルを使っているつもりでも、実体験はデフォルト設定やプロンプト層、セッション管理で静かに変わりうると再確認されたからだ。
LocalLLaMAはDeepSeek V4の公開をただ喜んだわけではない。スレッドはすぐに1M context、activated parameters、実機での成立条件の話へ流れ、MIT licenseへの好感もそこに重なった。
重要なのは、open model陣営で長いcontextと実運用向けの二層構成が同時に出てくる例がまだ少ないことだ。DeepSeekは1M context、1.6T・49B Pro、284B・13B Flashという数字を一度に示した。
LocalLLaMAが盛り上がったのは、単なるベンチマーク更新ではなかった。公式スコアも強いが、本当の熱量はFP8やGGUF、VRAM適合の話がすぐ始まったことにあった。2026年4月25日時点でスレッドは1,688ポイント、603コメントだった。
LocalLLaMAがこの投稿を押し上げたのは、皆がベンチマークを信じたからではない。27Bのオープンモデルがエージェント型タスクで急に競争圏へ入ったように見え、その重要さと怪しさが同時に出たことで議論が熱くなった。
個人情報フィルタリングはAI開発の周辺機能ではなく本体になった。OpenAIの1.5BオープンウェイトPrivacy Filterは128,000トークンを端末内で処理し、補正版PII-Masking-300kでF1 97.43%を示した。