#qwen

RSSフィード

LLM Hacker News Jun 30, 2026 1 min read

Qwen 3.6 27B、local開発モデルの現実的なsweet spotか

開発者の関心は、localモデルが日常作業にどこまで使えるかに向かった。

#qwen #local-llm #developer-tools

12

LLM Hacker News Jun 20, 2026 1 min read

Local QwenはOpusの劣化版ではなく、別の運用モデル

Alex Ellisの記事は、local LLMをベンチマーク順位ではなく、事業でのコスト、制御、agent運用の信頼性から捉えた点で読まれた。

#qwen #local-llm #coding-agents

13

Humanoid Robots Jun 18, 2026 1 min read

Qwen-Robot Suite、見るAIから動くAIへ移る3モデル構成

Qwenはrobotics向けfoundation modelをnavigation、manipulation、world modelingの3系統でまとめた。Qwen-Robot Suiteの焦点は、物理世界を理解するAIを実際の行動へ接続するagent stackだ。

#qwen #robotics #embodied-ai

14

LLM Reddit Jun 16, 2026 1 min read

vLLMのQwen3+ streaming parser、local agent運用の痛点へ

LocalLLaMAで注目されたのは、小さく見えるvLLM nightlyのparser修正だ。Qwen3.6-27Bのmid-turn停止やstreaming tool call失敗は、local agent loopでは実害が大きい。

#vllm #qwen #tool-calling

19

LLM Hacker News Jun 16, 2026 1 min read

ローカルモデル、趣味の実行環境からcoding workflowへ

HNの論点は、local LLMがfrontier modelを完全に置き換えるかではなかった。Gemma、Qwen、agentic coding、メモリ制約、コスト、privacyをどう組み合わせるかに議論が集まった。

#local-llm #agentic-coding #gemma

16

LLM Reddit Jun 2, 2026 1 min read

Qwen3.6-27Bのlocal agent実験、計画は有望でも実行にはgateが必要

Redditで注目されたのは、Claude代替という見出しよりもtool call error rate 12%という具体的な限界だった。

#qwen #local-ai #agents

27

LLM Reddit May 22, 2026 1 min read

Qwen3.6 35BがスキルベースプロンプティングでワークフローCreate

LocalLLaMAで話題になったポストで、Qwen3.6 35B A3BがCodexとpiエージェントを組み合わせたスキルベースプロンプティングにより、VPS管理やPDF変換などの複雑なワークフローを自動化した体験が共有されました。

#qwen #local-llm #workflow

20

LLM Reddit May 22, 2026 1 min read

12GB VRAMでQwen3.6 35BをIk_llama.cppで110 tok/s達成

LocalLLaMAコミュニティユーザーがRTX 4070 Super 12GBでQwen3.6 35B A3BモデルをIk_llama.cppフォークを使用して110トークン/秒で実行することに成功しました。CPU オフロード最適化に優れたこのフォークは標準llama.cppより大幅に高いパフォーマンスを示しました。

#llama-cpp #qwen #local-llm

24

LLM Hacker News May 20, 2026 1 min read

Qwen3.7-Max、エージェントフロンティアでGPT-5.4と同等水準に

AlibabaのQwenチームがエージェント重視のフロンティアモデルQwen3.7-Maxを公開した。Artificial Analysis評価でGPT 5.4に迫る5位を記録し、オープンウェイトフロンティアモデルの新基準を示している。

#qwen #alibaba #llm

21

LLM Reddit May 10, 2026 1 min read

12GB VRAMでQwen3.6 35Bを毎秒80トークン以上で動かす設定を公開

LocalLLAMAユーザーが、llama.cppのMTP機能を使い、12GB VRAMのGPUでQwen3.6 35B A3Bモデルを毎秒80トークン超・128Kコンテキストで動かす設定を公開した。

#local-llm #qwen #llama-cpp

24

LLM Reddit May 6, 2026 1 min read

Qwen 3.6 27BのMTPで推論速度2.5倍、48GBで262kコンテキスト実現

llama.cppの新MTP対応PRを使ってQwen 3.6 27Bの推論速度を2.5倍に高める方法がLocalLLaMAで共有された。48GBで26万2,000トークンのコンテキストが利用可能になる。

#qwen #mtp #local-llm

22

LLM Reddit May 3, 2026 1 min read

RTX 3090一枚でSimpleQA 95.7%達成：Qwen3.6-27B＋エージェンティック検索

ローカルLLM研究者が、単一のRTX 3090でQwen3.6-27Bとエージェンティック検索を組み合わせ、SimpleQA 95.7%を完全ローカル環境で達成した。

#qwen #local-llm #rtx-3090

28