LLM Hacker News Apr 5, 2026 1 min read
Hacker Newsで上位に入った投稿が、Apple研究者による simple self-distillation 論文を押し上げた。verifier model や reinforcement learning なしで code generation の pass@1 を改善できるという主張だ。
Hacker Newsで上位に入った投稿が、Apple研究者による simple self-distillation 論文を押し上げた。verifier model や reinforcement learning なしで code generation の pass@1 を改善できるという主張だ。