DeepSeek-V4 Launch Watch: 공개 가중치와 day-0 serving

DeepSeek-V4 공개와 LMSYS의 H200 day-0 serving benchmark를 묶어, open-weight frontier model이 출시 직후 어떤 배포·처리량 신호를 보였는지 시간순으로 정리합니다.

Share: Long

AI sources.twitter 7h ago 1 min read

DeepSeek-V4, 1M context와 1.6T·284B 이중 구조를 공개 가중치로 열었다

중요한 점은 open model 진영에서 긴 context와 실제 배포용 구성을 함께 내놓는 경우가 드물다는 데 있다. DeepSeek는 1M context, 1.6T·49B Pro, 284B·13B Flash라는 숫자를 한 번에 제시했다.

#deepseek #open-weights #llm

AI sources.twitter 7h ago 1 min read

LMSYS, DeepSeek-V4 Day-0 지원에서 H200 266 tok/s 성능을 제시

중요한 점은 model launch의 성패가 가중치보다 serving과 training 지원에서 갈린다는 데 있다. LMSYS는 Day-0 stack이 B200에서 199 tok/s, H200에서 266 tok/s를 기록했고 900K context에서도 흐름이 유지된다고 적었다.

#lmsys #deepseek #benchmarks