#deepseek

LLM Hacker News Jun 28, 2026 1 min read

DeepSeek DSpark, LLM 추론 병목을 “검증 길이”에서 다시 잡은 이유

관심은 단순한 속도 수치보다 “어떤 토큰을 검증할 것인가”에 모였다. DSpark는 speculative decoding의 낭비를 줄여 DeepSeek-V4에서 사용자 체감 생성 속도를 60~85% 높였다고 설명한다.

#deepseek #speculative-decoding #llm-inference

AI News Jun 17, 2026 1 min read

DeepSeek 첫 외부 자금 $7.4B, 창업자 통제권 실험의 무대

중국 AI 대표주자가 첫 외부 자금 조달에서 $7.4B와 $50B 이상 가치 평가를 확보했다는 보도가 나왔다. 더 눈에 띄는 부분은 투자자 대부분이 의결권 없이 5년 락업을 받아들이는 구조다.

#deepseek #funding #china-ai

LLM X/Twitter May 24, 2026 1 min read

DeepSeek V4-Pro API 가격 75% 인하, 임시 할인이 기본가로 고정

DeepSeek가 V4-Pro API의 75% 할인 가격을 상시 요금으로 바꾸며 고성능 LLM API의 가격 압박을 키웠다. 이미지 기준 출력 단가는 100만 토큰당 $3.48에서 $0.87로 내려간다.

#deepseek #v4-pro #api-pricing

AI Reddit May 22, 2026 1 min read

DeepSeek, 약 14조 원 투자 유치 추진 — 오픈소스·AGI 노선 공식 선언

Bloomberg에 따르면 DeepSeek이 102억 9천만 달러 규모의 투자 유치를 추진 중입니다. 창업자 량원펑은 단기 수익화보다 오픈소스 AI 개발과 AGI 목표를 계속 추구하겠다는 의지를 공개적으로 밝혔습니다.

#deepseek #funding #agi

LLM Reddit May 5, 2026 1 min read

DeepSeek V4 Pro, 프론티어 대비 17배 저렴하면서 GPT-5.2와 성능 동률

에이전트 벤치마크 FoodTruck Bench에서 DeepSeek V4 Pro가 GPT-5.2와 사실상 동등한 성능을 기록했다. GPT-5.2 테스트 대비 10주 만에, 비용은 약 17배 저렴하다.

#deepseek #benchmark #llm

LLM Hacker News May 4, 2026 1 min read

Claude Code 몸체에 DeepSeek 두뇌 이식 — DeepClaude 등장

DeepClaude는 Claude Code의 에이전트 루프를 그대로 유지하면서 AI 모델만 DeepSeek V4 Pro로 교체하는 오픈소스 도구다. 출력 토큰 기준 $15/M에서 $0.87/M으로 17배 저렴해진다.

#claude-code #deepseek #developer-tools

LLM Hacker News May 2, 2026 1 min read

DeepSeek V4, 프런티어급 성능에 1/10 가격 — 1.6조 파라미터 오픈웨이트 공개

DeepSeek이 DeepSeek-V4-Pro와 V4-Flash 두 가지 모델을 공개했다. Pro는 1.6조 파라미터(활성 49B)의 Mixture-of-Experts 구조로, 현재까지 공개된 오픈웨이트 모델 중 최대 규모다. 가격은 GPT-5.4와 Gemini 3.1 Pro 대비 절반 이하로, 비용 효율성이 핵심 차별점이다.

#deepseek #llm #open-weights

LLM Reddit May 1, 2026 1 min read

DeepSeek 시각 토큰 추론, LocalLLaMA가 더 크게 반응한 건 아이디어와 삭제 타이밍

LocalLLaMA가 크게 반응한 건 DeepSeek가 점과 박스를 추론 단위로 끌어올렸기 때문이다. 저장소가 곧바로 비공개로 바뀌면서 관심은 더 커졌다.

#deepseek #multimodal #visual-reasoning

AI Apr 27, 2026 1 min read

美 국무부, AI 증류 논란 외교전으로… DeepSeek 정조준

이 사안이 커진 이유는 모델 복제 논쟁이 더 이상 로비 문서와 기업 간 공방에 머물지 않기 때문이다. Reuters는 4월 26일 미국 국무부가 전 세계 외교 공관에 DeepSeek를 포함한 중국 AI 기업의 증류 의혹을 외국 정부에 설명하라고 지시했다고 보도했다.

#deepseek #distillation #policy

LLM Apr 26, 2026 1 min read

DeepSeek, 전체 API 입력 캐시 가격을 10분의 1로 낮춰 추론 비용 경쟁 압박 확대

캐시 적중 요금은 장문 컨텍스트 제품의 원가를 좌우하기 때문에 이번 인하는 파급력이 크다. DeepSeek는 전체 API 시리즈의 입력 캐시 가격을 기존의 10분의 1로 낮췄고 V4-Pro 75% 할인도 유지한다고 적었다.

#deepseek #api-pricing #caching

AI X/Twitter Apr 25, 2026 1 min read

LMSYS, DeepSeek-V4 Day-0 지원에서 H200 266 tok/s 성능을 제시

중요한 점은 model launch의 성패가 가중치보다 serving과 training 지원에서 갈린다는 데 있다. LMSYS는 Day-0 stack이 B200에서 199 tok/s, H200에서 266 tok/s를 기록했고 900K context에서도 흐름이 유지된다고 적었다.

#lmsys #deepseek #benchmarks

AI X/Twitter Apr 25, 2026 1 min read

DeepSeek-V4, 1M context와 1.6T·284B 이중 구조를 공개 가중치로 열었다

중요한 점은 open model 진영에서 긴 context와 실제 배포용 구성을 함께 내놓는 경우가 드물다는 데 있다. DeepSeek는 1M context, 1.6T·49B Pro, 284B·13B Flash라는 숫자를 한 번에 제시했다.

#deepseek #open-weights #llm