LocalLLaMAがGranite 4.1に反応したのは、IBMがいまの流行と逆の方向へ振ったからだ。3B・8B・30Bのdenseモデルを中心に、instruction following、tool calling、運用コスト、予測可能な挙動を前面に出し、「実サービス向け」の空気が強かった。
#tool-calling
RSS FeedLocalLLaMAがこの投稿を評価したのは、『Gemma 4は何となく弱い』で終わらなかったからだ。nullableなJSON Schemaが空のtypeに潰れるという具体的な壊れ方を切り出し、小さなJinja修正でtool callingが戻るところまで持っていった。
r/LocalLLaMAのthreadはlocal tool calling失敗談を、OpenWebUI、native tool calls、quant、runtime、wrapperのチェックリストへ変えた。
約350ポイントを集めたLocalLLaMA投稿は、Gemma 4 26B A3Bが適切なruntime設定と組み合わさると、ローカルのcoding-agentやtool-calling workflowで非常に強く感じられると主張している。投稿者は他のローカルモデル環境で経験したprompt cachingやfunction callingの問題と対比して語っている。
Together AIは2026年3月19日、自社のfine-tuningサービスがtool call、reasoning、vision-language workflowをネイティブに支援すると発表した。リンク先のTogether AIブログは、100B+ parameter model、最大100GB dataset、大規模MoE modelで最大6倍のthroughput、学習前のcost estimateと実行中のETAまで含まれると説明している。
Together AIは2026年3月19日、fine-tuningサービスがtool calling、reasoning、vision-language model学習に対応し、MoEアーキテクチャで最大6倍高いthroughputを実現すると発表した。公式記事では大規模モデル対応、100GBデータセット、事前コスト見積もり、学習中ETAも説明している。
LocalLLaMAの人気投稿は Open WebUI の Open Terminal を取り上げる。Dockerまたはbare metal実行層により、ローカルモデルがコマンド実行、ファイル編集、成果物返却をチャット内で行える。
r/LocalLLaMAで注目された投稿は、2026年2月20日にマージされたllama.cpp PR #19765を共有した。Qwen3-Coder-Next向けの暫定修正としてparser統合に加え、parallel tool callingとJSON schema対応を改善している。