Skip to content

#diffusion-models

RSS Feed
LLM Hacker News Apr 14, 2026 1 min read

Hacker News 댓글은 이 논문을 단순한 diffusion text demo가 아니라, 기존 autoregressive serving stack에 얹을 수 있는 더 빠른 LLM 후보로 읽고 있다. 프로젝트 페이지는 I-DLM-8B가 AIME-24 69.6, LiveCodeBench-v6 45.7, 그리고 high concurrency에서 2.9-4.1x throughput을 제시한다고 설명한다.

Sciences Hacker News Mar 30, 2026 1 min read

2026년 3월 Hacker News에서 120 points와 33 comments를 모은 글은 Hamilton-Jacobi-Bellman equation에 대한 깊은 기술 해설을 전면에 올렸다. 이 글은 continuous-time reinforcement learning과 diffusion model을 별개의 ML 기법이 아니라 같은 control theory 구조 위에서 이해할 수 있다고 주장한다.

LLM Reddit Mar 1, 2026 1 min read

r/MachineLearning의 프로젝트 공유 글(점수 71, 댓글 12)은 Karpathy의 <code>Microgpt</code>에서 영감을 받은 최소 텍스트 diffusion 구현을 소개했다. 작성자는 143줄 NumPy 버전부터 413줄 PyTorch Transformer 버전까지 같은 diffusion loop를 비교 가능한 형태로 공개했다.