#rtx-3090

LLM Reddit May 3, 2026 1 min read

RTX 3090 하나로 SimpleQA 95.7%: Qwen3.6-27B + 에이전틱 검색의 위력

로컬 LLM 연구자가 단일 RTX 3090에서 Qwen3.6-27B와 에이전틱 검색을 결합해 SimpleQA 벤치마크 95.7%를 달성했다.

#qwen #local-llm #rtx-3090

23

LLM Reddit May 1, 2026 1 min read

3090 한 장에서 218K 문맥, LocalLLaMA가 속도보다 안정성에 반응한 이유

LocalLLaMA가 본 포인트는 최고 속도가 아니었다. RTX 3090 한 장으로 218K 문맥을 밀어 올리고 긴 tool output에서도 덜 무너지는 구성이 더 중요했다.

#qwen #rtx-3090 #vllm

23

LLM Reddit Apr 28, 2026 1 min read

RTX 3090에서 거의 2배, LocalLLaMA가 Luce DFlash에 몰린 이유

LocalLLaMA는 이 글을 또 하나의 벤치마크 이미지로 넘기지 않았다. 단일 RTX 3090에서 Qwen3.6-27B 처리량을 평균 1.98배까지 끌어올렸고, 재학습 없이 긴 컨텍스트까지 버틴다는 점이 스레드의 열기를 만들었다.

#qwen #speculative-decoding #gguf

30