DeepSeek V4 등장, LocalLLaMA가 먼저 계산한 건 메모리

모델 공개보다 먼저 시작된 건 RAM 계산

r/LocalLLaMA에서 DeepSeek V4 글이 크게 오른 이유는 단순한 “신모델 출시”가 아니었다. Hugging Face에 컬렉션이 열리자마자 커뮤니티는 성능보다 먼저 하드웨어 수지타산으로 들어갔다. top comment부터 “머신 조립할 때 RAM을 더 안 넣은 게 이렇게 후회된 적이 없다”는 반응이 붙었고, 다른 댓글은 농담처럼 “이제 0.01bit quant가 필요하다”고 받았다. 이 분위기 자체가 오픈웨이트 시장의 현재를 잘 보여준다.

DeepSeek 모델 카드에 따르면 이번 preview 계열은 두 갈래다. DeepSeek-V4-Pro는 1.6T parameters 중 49B activated, DeepSeek-V4-Flash는 284B parameters 중 13B activated 구조이며, 둘 다 1M tokens context를 지원한다. 아키텍처 쪽 핵심 업그레이드는 CSA + HCA hybrid attention, mHC, Muon optimizer다. 모델 카드는 특히 1M context에서 V4-Pro가 DeepSeek-V3.2 대비 single-token inference FLOPs 27%, KV cache 10% 수준만 요구한다고 설명한다. 사전학습 규모는 32T tokens 이상으로 적혀 있다.

커뮤니티가 꽂힌 포인트

LocalLLaMA는 숫자만 보고 끝내지 않았다. 한쪽에서는 MIT license를 반겼고, 다른 쪽에서는 coding·agentic benchmark 표를 끌어와 성능 위치를 따졌다. 모델 카드에 따르면 V4-Pro Max는 LiveCodeBench 93.5, Terminal Bench 2.0 67.9, SWE Verified 80.6, MCPAtlas 73.6 같은 수치를 제시한다. 하지만 스레드의 정서는 “와, 이게 frontier랑 붙네”에서 끝나지 않았다. “Flash를 로컬에서 돌리려면 대체 얼마나 부자여야 하냐”는 반응이 동시에 올라온다. 즉, 성능 호평과 배치 비용 계산이 한 문장 안에서 같이 움직였다.

왜 중요한가

오픈 모델 경쟁은 이제 leaderboard 숫자만으로는 설명이 안 된다. activated parameter 수, context window, license, KV cache 요구량, 실제 self-host 가능성이 함께 평가된다. DeepSeek V4 스레드가 보여준 것도 그것이다. 커뮤니티는 단순히 “좋아 보인다”가 아니라 “내 장비로 어디까지 가능하냐”를 먼저 묻는다. 그 질문을 버티는 모델이 오픈웨이트 생태계에서 오래 남는다. DeepSeek V4가 던진 신호는 분명하다. frontier급 ambitions를 말하려면 성능표뿐 아니라, 긴 context와 배치 현실까지 같이 설계해야 한다.

출처: DeepSeek-V4-Flash 모델 카드 · r/LocalLLaMA 스레드

DeepSeek V4 등장, LocalLLaMA가 먼저 계산한 건 메모리

모델 공개보다 먼저 시작된 건 RAM 계산

커뮤니티가 꽂힌 포인트

왜 중요한가

Related Articles

DeepSeek V4에 HN 폭주, 문서 링크보다 더 크게 번진 건 곧바로 뜬 가중치

Qwen3.6-35B-A3B, HN이 주목한 건 3B active MoE의 코딩 성능이었다

LocalLLaMA가 본 NVIDIA gpt-oss-puzzle-88B, gpt-oss-120b를 더 싸게 서빙하려는 88B 재설계

Comments (0)

Leave a Comment

Related Articles

DeepSeek V4에 HN 폭주, 문서 링크보다 더 크게 번진 건 곧바로 뜬 가중치

Qwen3.6-35B-A3B, HN이 주목한 건 3B active MoE의 코딩 성능이었다
LLM Hacker News Apr 16, 2026 1 min read

LocalLLaMA가 본 NVIDIA gpt-oss-puzzle-88B, gpt-oss-120b를 더 싸게 서빙하려는 88B 재설계
LLM Reddit Mar 28, 2026 2 min read