腐食中
RTX 3090一枚でSimpleQA 95.7%達成:Qwen3.6-27B+エージェンティック検索
Original: We are finally there: Qwen3.6-27B + agentic search; 95.7% SimpleQA on a single 3090, fully local View original →
成果
r/LocalLLaMAで297票を集めたLDR(Local Deep Research)メンテナーの投稿によると、RTX 3090(24GB)単体でQwen3.6:27bとエージェンティック検索を組み合わせ、SimpleQA 95.7%を達成した。
構成
- ハードウェア: RTX 3090, 24GB
- モデル: Ollama経由のQwen3.6:27b
- 戦略: LangGraphエージェント(ツール呼び出し+並列サブトピック分解)
意義
SimpleQAはフロンティアモデルが90〜98%台を出すベンチマーク。コンシューマーGPU一枚で95.7%を達成したことは重要なマイルストーンだ。エージェンティック検索とローカルLLMの組み合わせが次世代ローカルAIの中心パターンになりつつある。
Related Articles
LLM Reddit 18h ago 1 min read
LocalLLaMAで注目されたのは、小さく見えるvLLM nightlyのparser修正だ。Qwen3.6-27Bのmid-turn停止やstreaming tool call失敗は、local agent loopでは実害が大きい。
LLM Hacker News 18h ago 1 min read
HNの論点は、local LLMがfrontier modelを完全に置き換えるかではなかった。Gemma、Qwen、agentic coding、メモリ制約、コスト、privacyをどう組み合わせるかに議論が集まった。
LLM Reddit May 1, 2026 1 min read
LocalLLaMAが見た本題は最高速ではなかった。RTX 3090一枚で218K文脈まで伸ばし、長いtool outputでも落ちにくくした構成が評価された。