r/MachineLearningがこの投稿を押し上げたのは性能自慢のためではない。tiny Shakespeareを使い、M2 Airで7.5Mパラメータの diffusion LM を動かした記録が、難しい概念を急に手で触れるものへ変えたからだ。
#diffusion
RSS FeedRAD-2はdiffusion-based driving plannerをgenerator-discriminator構造に組み替え、imitation-only trainingの弱点にreinforcement learning feedbackを入れた。strong diffusion planner比でcollision rate 56%低下、complex urban trafficでの実配備も報告している。
HNでは「Diffusionでも品質を落とさずに済むのでは」という一点にすぐ火が付いた。I-DLMは並列寄りの生成速度とAR級の品質を両立できると主張していて、その話が実際のinference stackで通るのかまで議論が広がった。
PyTorchは2026年4月8日のXで、DiffusersとTorchAOによるMXFP8/NVFP4 quantizationがNVIDIA B200上のdiffusion latencyを下げられると説明した。併載blogはselective quantizationとregional compilationを実務向けのlatency-memory最適化レシピとして位置づけている。
r/MachineLearning で共有された MIT 2026 course は、flow matching と diffusion models を lecture videos、数理ノート、coding exercises と一緒に提供する。新しい版では latent spaces、diffusion transformers、discrete diffusion language models まで扱う。
r/singularityは、Meituan の LongCat-Image-Edit-Turbo を取り上げた。これは 8 NFEs で high-quality な結果をうたう distilled open-source image editor で、Apache 2.0 の Hugging Face model、公開された arXiv report、そして benchmark framing への community の検証が同時に走っている。
AIスタートアップのInception Labsが、拡散(diffusion)ベースの言語モデル「Mercury 2」をリリースした。NVIDIA Blackwell GPUで秒間1,009トークンを処理し、速度・コスト両面で主要競合モデルを大幅に上回る性能を示している。