#qwen

RSS 피드

LLM Hacker News Jun 30, 2026 1 min read

Qwen 3.6 27B, local 개발용 모델의 현실적 sweet spot인가

privacy와 비용을 잡으려는 개발자들이 Qwen 3.6 27B의 “충분히 쓸 만한” 지점을 파고들었다.

#qwen #local-llm #developer-tools

LLM Hacker News Jun 20, 2026 1 min read

Local Qwen은 Opus의 하위 호환이 아니라 다른 도구라는 주장

Alex Ellis의 글이 주목받은 이유는 local LLM을 benchmark 순위가 아니라 실제 사업과 agent 작업의 비용·통제 문제로 다뤘기 때문이다.

#qwen #local-llm #coding-agents

Humanoid Robots Jun 18, 2026 1 min read

Qwen-Robot Suite, 보기에서 행동으로 넘어가는 로봇용 foundation model 묶음

Qwen이 로봇용 foundation model을 navigation, manipulation, world modeling 세 갈래로 묶었다. Qwen-RobotNav, Qwen-RobotManip, Qwen-RobotWorld는 physical AI의 병목을 “인식”에서 “행동”으로 옮겨 놓는 release다.

#qwen #robotics #embodied-ai

LLM Reddit Jun 16, 2026 1 min read

Qwen3+ streaming parser, LocalLLaMA가 반긴 작은 vLLM 수정

Qwen3.6-27B를 vLLM에서 agent loop로 돌리던 사용자들이 멈춤과 streaming tool call 오류에 예민하게 반응했다. nightly parser 수정은 작지만, 로컬 에이전트 운용에서는 체감이 큰 문제를 겨냥한다.

#vllm #qwen #tool-calling

LLM Hacker News Jun 16, 2026 1 min read

로컬 모델, 이제 코딩 에이전트의 보조 엔진으로 충분한가

HN의 관심은 “로컬 LLM이 프런티어 모델을 대체했나”보다 “어떤 작업부터 로컬로 내려올 수 있나”에 모였다. Gemma 4와 Qwen 계열을 둘러싼 체감 성능, 비용, 프라이버시 논의가 한꺼번에 붙었다.

#local-llm #agentic-coding #gemma

LLM Reddit Jun 2, 2026 1 min read

Qwen3.6-27B로 2주간 agent orchestration, 실행보다 계획에 강한 이유

LocalLLaMA의 관심은 “Claude 대체”보다 tool call 오류율 12%라는 구체적 한계에 모였다.

#qwen #local-ai #agents

LLM Reddit May 22, 2026 1 min read

Qwen3.6 35B, 업무 방식을 바꾸다 — 스킬 기반 프롬프팅 실전 활용기

LocalLLaMA에서 Qwen3.6 35B A3B 모델이 업무 워크플로우를 바꿨다는 경험담이 화제입니다. Codex로 작업을 수행하고 과정을 스킬 문서로 기록해 pi 에이전트에 공급하는 방식으로 VPS 관리, PDF 변환 등을 자동화했습니다.

#qwen #local-llm #workflow

LLM Reddit May 22, 2026 1 min read

RTX 4070 12GB에서 35B 모델 110 tok/s — ik_llama.cpp 최적화 효과

LocalLLaMA에서 RTX 4070 Super 12GB로 Qwen3.6 35B A3B 모델을 110 토큰/초로 구동하는 데 성공한 벤치마크가 공유됐습니다. MTP 지원과 CPU 오프로딩 최적화에 특화된 ik_llama.cpp 포크 덕분입니다.

#llama-cpp #qwen #local-llm

LLM Hacker News May 20, 2026 1 min read

Qwen3.7-Max, 에이전트 최전선에서 GPT-5.4와 어깨 나란히

Alibaba Qwen 팀이 에이전트 중심 설계의 신모델 Qwen3.7-Max를 공개했다. Artificial Analysis 평가에서 GPT 5.4와 동급인 5위를 기록하며 오픈 웨이트 프론티어 모델의 새 기준을 제시했다.

#qwen #alibaba #llm

LLM Reddit May 10, 2026 1 min read

12GB VRAM으로 Qwen3.6 35B 모델 초당 80 토큰 달성

llama.cpp MTP 기능을 활용해 12GB VRAM GPU에서 Qwen3.6 35B A3B 모델을 초당 80토큰 이상, 128K 컨텍스트로 실행하는 설정이 공유됐다.

#local-llm #qwen #llama-cpp

LLM Reddit May 6, 2026 1 min read

Qwen 3.6 27B + MTP로 로컬 추론 속도 2.5배 향상, 48GB에서 262k 컨텍스트

llama.cpp의 새 MTP 지원 PR을 활용해 Qwen 3.6 27B의 추론 속도를 2.5배 높이는 방법이 공유됐다. 48GB 메모리에서 262,000 토큰 컨텍스트로 로컬 에이전틱 코딩이 가능해졌다.

#qwen #mtp #local-llm

LLM Reddit May 3, 2026 1 min read

RTX 3090 하나로 SimpleQA 95.7%: Qwen3.6-27B + 에이전틱 검색의 위력

로컬 LLM 연구자가 단일 RTX 3090에서 Qwen3.6-27B와 에이전틱 검색을 결합해 SimpleQA 벤치마크 95.7%를 달성했다.

#qwen #local-llm #rtx-3090