LLM Hacker News 3h ago 1 min read
관심은 단순한 속도 수치보다 “어떤 토큰을 검증할 것인가”에 모였다. DSpark는 speculative decoding의 낭비를 줄여 DeepSeek-V4에서 사용자 체감 생성 속도를 60~85% 높였다고 설명한다.
관심은 단순한 속도 수치보다 “어떤 토큰을 검증할 것인가”에 모였다. DSpark는 speculative decoding의 낭비를 줄여 DeepSeek-V4에서 사용자 체감 생성 속도를 60~85% 높였다고 설명한다.