IBM Granite 4.1、8Bで32B MoE級　HNの論点はtool calling

Granite 4.1の面白さは、IBMがまたモデルを増やしたという話では終わらない。今回は3B、8B、30Bのdenseなdecoder-only言語モデルに加えて、speech、vision、embedding、Guardianまでまとめて更新された。言語モデル側の焦点も、派手なreasoning演出よりinstruction followingとtool callingに置かれている。だからHNでも、発表そのものより「その構成で本当に現場を回せるのか」という話にすぐ移った。

公式ブログでIBMが前に出した数字も、その読み方を後押しした。Granite 4.1 8B instructは、instruction followingとtool callingで旧Granite 4.0の32B MoEに匹敵するか上回る場面があるという。さらに学習には約15兆トークンを使い、コンテキスト長は最大512K、ライセンスはApache 2.0。より複雑な構造で性能を誇示するより、導入しやすいdense構成で企業向けの安定運用を狙うメッセージが強い。

HNのコメント欄も、その実務感に反応していた。論点はベンチマーク表の順位ではなく、commodity hardwareでどこまで速く回るか、denseモデルがMoEから実用面の主導権を取り返しつつあるのか、30B帯がホームラボでは本当のsweet spotではないか、といったところに集まった。small modelをautocompleteや軽いagent作業に振る視点、vision系の小型モデルを“sleeper”として見る視点も出ていた。

結局このリリースが示しているのは、オープンモデル競争の軸が少し変わってきたということだ。長い思考過程を見せることだけではなく、stableなtool use、読みやすい遅延、抑えた運用コストで日常業務をこなせるかが同じくらい重要になっている。HNがGranite 4.1を押し上げた理由も、モデルカードの追加ではなく、「8B denseでどこまで仕事が片づくのか」という実戦の問いにあった。

Source: IBM Research · Hacker News discussion

IBM Granite 4.1、8Bで32B MoE級　HNの論点はtool calling

Related Articles

Granite 4.1、LocalLLaMAが見たのは巨大推論ではなく企業向けの実務型

DeepSeekのvisual primitives、LocalLLaMAが沸いたのは仕組みと削除の速さ

128B denseでざわついたLocalLLaMA　Mistral Medium 3.5の本当の刺さりどころ

Comments (0)

Leave a Comment

Related Articles

Granite 4.1、LocalLLaMAが見たのは巨大推論ではなく企業向けの実務型
LocalLLaMAがGranite 4.1に反応したのは、IBMがいまの流行と逆の方向へ振ったからだ。3B・8B・30Bのdenseモデルを中心に、instruction following、tool calling、運用コスト、予測可能な挙動を前面に出し、「実サービス向け」の空気が強かった。

DeepSeekのvisual primitives、LocalLLaMAが沸いたのは仕組みと削除の速さ

128B denseでざわついたLocalLLaMA　Mistral Medium 3.5の本当の刺さりどころ