r/MachineLearning이 이 글을 밀어 올린 이유는 성능 과시가 아니었다. MacBook Air M2에서 tiny Shakespeare로 7.5M 파라미터 diffusion LM을 직접 돌려 본 기록이, 어려운 개념을 갑자기 손에 잡히게 만들었다.
#diffusion
RSS FeedRAD-2는 diffusion 기반 driving planner를 generator-discriminator 구조로 다시 짰다. imitation-only training이 약한 지점에 reinforcement learning feedback을 넣었고, strong diffusion planner 대비 collision rate 56% 감소와 complex urban traffic 실주행 배치를 보고했다.
PyTorch는 2026년 4월 8일 X에서 Diffusers와 TorchAO 기반 MXFP8/NVFP4 quantization이 NVIDIA B200에서 diffusion latency를 줄일 수 있다고 밝혔다. 동반 blog는 selective quantization과 regional compilation을 현실적인 latency-memory 최적화 조합으로 제시한다.
r/MachineLearning에서 공유된 MIT 2026 course는 flow matching과 diffusion models를 강의 영상, 수학 노트, coding exercises로 묶어 제공한다. 새 과정은 latent spaces, diffusion transformers, discrete diffusion language models까지 범위를 넓혔다.
r/singularity는 Meituan의 LongCat-Image-Edit-Turbo를 조명했다. 이 모델은 단 8 NFEs로 high-quality 결과를 내세우는 distilled open-source image editor이며, Apache 2.0 Hugging Face 모델과 공개 arXiv 보고서, 그리고 benchmark framing에 대한 커뮤니티 검증이 함께 따라붙고 있다.
AI 스타트업 Inception Labs가 확산(diffusion) 기반 언어 모델 Mercury 2를 공개했다. 기존 자기회귀 방식을 탈피해 병렬 정제 방식을 사용하며, 속도와 비용 양면에서 주요 경쟁사를 압도한다.
Qwen 팀이 생성과 편집을 하나의 파이프라인으로 통합한 7B 이미지 모델을 공개했습니다. 네이티브 2K 해상도, 실제 텍스트 렌더링, 멀티패널 만화 생성 등을 지원하며, 20B였던 v1 대비 크기를 대폭 줄여 추론 속도를 크게 개선했습니다.