LLM Hacker News 3h ago 1 min read DeepSeek DSpark、LLM推論の詰まりを「検証長」で解く試み 注目点は単なる高速化ではなく、どのdraft tokenを検証するかにある。DeepSeekはDSparkによりDeepSeek-V4でユーザーごとの生成速度が60〜85%向上したと説明している。 #deepseek#speculative-decoding#llm-inference 1