#dflash - Insights

LLM Reddit Apr 14, 2026 1 min read

Reddit、Apple SiliconでQwen3.5を4倍級に高速化するDFlash実装に注目

LocalLLaMAでは、この投稿が派手なspeed screenshotではなく、baselineを見直してから公開されたengineering workとして受け止められた。2026年4月13日の投稿では、stock MLX基準でQwen3.5-9Bの2048 tokens生成が30.96 tok/sから127.07 tok/sへ上がり、acceptanceは89.36%と報告された。

#dflash #speculative-decoding #mlx