#tool-calling

LLM Reddit Jun 16, 2026 1 min read

vLLMのQwen3+ streaming parser、local agent運用の痛点へ

LocalLLaMAで注目されたのは、小さく見えるvLLM nightlyのparser修正だ。Qwen3.6-27Bのmid-turn停止やstreaming tool call失敗は、local agent loopでは実害が大きい。

LLM Reddit Apr 30, 2026 1 min read

Granite 4.1、LocalLLaMAが見たのは巨大推論ではなく企業向けの実務型

LocalLLaMAがGranite 4.1に反応したのは、IBMがいまの流行と逆の方向へ振ったからだ。3B・8B・30Bのdenseモデルを中心に、instruction following、tool calling、運用コスト、予測可能な挙動を前面に出し、「実サービス向け」の空気が強かった。

#ibm #granite #tool-calling

LLM Reddit Apr 29, 2026 1 min read

Gemma 4のtool callingが崩れた理由、LocalLLaMAが突き止めた小さなJinjaバグ

LocalLLaMAがこの投稿を評価したのは、『Gemma 4は何となく弱い』で終わらなかったからだ。nullableなJSON Schemaが空のtypeに潰れるという具体的な壊れ方を切り出し、小さなJinja修正でtool callingが戻るところまで持っていった。

#gemma-4 #tool-calling #json-schema

LLM Reddit Apr 19, 2026 1 min read

Local tool callingの現実チェック、r/LocalLLaMAはmodelよりharnessを疑った

r/LocalLLaMAのthreadはlocal tool calling失敗談を、OpenWebUI、native tool calls、quant、runtime、wrapperのチェックリストへ変えた。

#local-llm #tool-calling #qwen

LLM Reddit Apr 7, 2026 1 min read

LocalLLaMAユーザー、Gemma 4 26B A3Bでローカル tool calling が安定したと報告

約350ポイントを集めたLocalLLaMA投稿は、Gemma 4 26B A3Bが適切なruntime設定と組み合わさると、ローカルのcoding-agentやtool-calling workflowで非常に強く感じられると主張している。投稿者は他のローカルモデル環境で経験したprompt cachingやfunction callingの問題と対比して語っている。

#gemma-4 #local-llm #tool-calling

LLM X/Twitter Mar 23, 2026 1 min read

Together AI、tool calling・reasoning・VLM fine-tuningを拡張　100B+ modelと最大6倍 throughputを支援

Together AIは2026年3月19日、自社のfine-tuningサービスがtool call、reasoning、vision-language workflowをネイティブに支援すると発表した。リンク先のTogether AIブログは、100B+ parameter model、最大100GB dataset、大規模MoE modelで最大6倍のthroughput、学習前のcost estimateと実行中のETAまで含まれると説明している。

#together-ai #fine-tuning #tool-calling

LLM X/Twitter Mar 22, 2026 1 min read

Together AI、tool calling・reasoning・VLM fine-tuning拡張　大規模MoE学習を高速化

Together AIは2026年3月19日、fine-tuningサービスがtool calling、reasoning、vision-language model学習に対応し、MoEアーキテクチャで最大6倍高いthroughputを実現すると発表した。公式記事では大規模モデル対応、100GBデータセット、事前コスト見積もり、学習中ETAも説明している。

#together-ai #fine-tuning #tool-calling

LLM Reddit Mar 8, 2026 1 min read

Open WebUIのOpen Terminalが、ローカルモデルに“本物の実行環境”を与える

LocalLLaMAの人気投稿は Open WebUI の Open Terminal を取り上げる。Dockerまたはbare metal実行層により、ローカルモデルがコマンド実行、ファイル編集、成果物返却をチャット内で行える。

#open-webui #tool-calling #qwen

LLM Reddit Feb 21, 2026 1 min read

Reddit技術トピック: llama.cpp PR #19765がマージ、Qwen3-Coder-Nextのparser経路を整理

r/LocalLLaMAで注目された投稿は、2026年2月20日にマージされたllama.cpp PR #19765を共有した。Qwen3-Coder-Next向けの暫定修正としてparser統合に加え、parallel tool callingとJSON schema対応を改善している。

#llama-cpp #qwen3-coder-next #parser