DeepSeek가 V4-Pro API의 75% 할인 가격을 상시 요금으로 바꾸며 고성능 LLM API의 가격 압박을 키웠다. 이미지 기준 출력 단가는 100만 토큰당 $3.48에서 $0.87로 내려간다.
DeepSeek가 V4-Pro API의 75% 할인 가격을 상시 요금으로 바꾸며 고성능 LLM API의 가격 압박을 키웠다. 이미지 기준 출력 단가는 100만 토큰당 $3.48에서 $0.87로 내려간다.
Bloomberg에 따르면 DeepSeek이 102억 9천만 달러 규모의 투자 유치를 추진 중입니다. 창업자 량원펑은 단기 수익화보다 오픈소스 AI 개발과 AGI 목표를 계속 추구하겠다는 의지를 공개적으로 밝혔습니다.
에이전트 벤치마크 FoodTruck Bench에서 DeepSeek V4 Pro가 GPT-5.2와 사실상 동등한 성능을 기록했다. GPT-5.2 테스트 대비 10주 만에, 비용은 약 17배 저렴하다.
DeepClaude는 Claude Code의 에이전트 루프를 그대로 유지하면서 AI 모델만 DeepSeek V4 Pro로 교체하는 오픈소스 도구다. 출력 토큰 기준 $15/M에서 $0.87/M으로 17배 저렴해진다.
DeepSeek이 DeepSeek-V4-Pro와 V4-Flash 두 가지 모델을 공개했다. Pro는 1.6조 파라미터(활성 49B)의 Mixture-of-Experts 구조로, 현재까지 공개된 오픈웨이트 모델 중 최대 규모다. 가격은 GPT-5.4와 Gemini 3.1 Pro 대비 절반 이하로, 비용 효율성이 핵심 차별점이다.
LocalLLaMA가 크게 반응한 건 DeepSeek가 점과 박스를 추론 단위로 끌어올렸기 때문이다. 저장소가 곧바로 비공개로 바뀌면서 관심은 더 커졌다.
이 사안이 커진 이유는 모델 복제 논쟁이 더 이상 로비 문서와 기업 간 공방에 머물지 않기 때문이다. Reuters는 4월 26일 미국 국무부가 전 세계 외교 공관에 DeepSeek를 포함한 중국 AI 기업의 증류 의혹을 외국 정부에 설명하라고 지시했다고 보도했다.
캐시 적중 요금은 장문 컨텍스트 제품의 원가를 좌우하기 때문에 이번 인하는 파급력이 크다. DeepSeek는 전체 API 시리즈의 입력 캐시 가격을 기존의 10분의 1로 낮췄고 V4-Pro 75% 할인도 유지한다고 적었다.
중요한 점은 model launch의 성패가 가중치보다 serving과 training 지원에서 갈린다는 데 있다. LMSYS는 Day-0 stack이 B200에서 199 tok/s, H200에서 266 tok/s를 기록했고 900K context에서도 흐름이 유지된다고 적었다.
중요한 점은 open model 진영에서 긴 context와 실제 배포용 구성을 함께 내놓는 경우가 드물다는 데 있다. DeepSeek는 1M context, 1.6T·49B Pro, 284B·13B Flash라는 숫자를 한 번에 제시했다.
HN은 이번 스레드를 단순한 모델 공개로 보지 않았다. API 문서보다 먼저 Hugging Face 가중치와 base 모델이 모습을 드러내자, 커뮤니티의 관심은 홍보보다 실물 검증으로 곧장 옮겨갔다.
LocalLLaMA가 반긴 건 또 하나의 성능표가 아니라, MoE 배관을 실제로 더 빠르게 돌릴 수 있는 공개 인프라였다. 댓글도 DeepSeek가 내부 성과를 묶어두지 않고 통신·커널 작업을 밖으로 내놓는 데 꽂혔다.