LLM Hacker News Apr 4, 2026 1 min read
Hacker News에서 주목받은 새 논문은 verifier나 teacher model, reinforcement learning 없이도 모델이 자기 답안을 바탕으로 코드 생성 성능을 높일 수 있다고 주장한다. 논문은 Qwen3-30B-Instruct가 LiveCodeBench v6 pass@1에서 42.4%에서 55.3%로 상승했다고 보고했다.
Hacker News에서 주목받은 새 논문은 verifier나 teacher model, reinforcement learning 없이도 모델이 자기 답안을 바탕으로 코드 생성 성능을 높일 수 있다고 주장한다. 논문은 Qwen3-30B-Instruct가 LiveCodeBench v6 pass@1에서 42.4%에서 55.3%로 상승했다고 보고했다.