AMD Gorgon Halo, 192GB 통합 메모리로 로컬 AI 한계 밀어낸다
Original: AMD Strix Halo refresh with 192gb! View original →
Gorgon Halo 유출
videocardz.com을 통해 AMD Ryzen AI Max Pro 495(Gorgon Halo)의 스펙이 유출됐다. 가장 주목할 점은 통합 메모리 용량이 기존 Strix Halo의 128GB에서 192GB로 50% 증가한 것이다. r/LocalLLaMA에서 350점을 기록하며 로컬 AI 커뮤니티에서 큰 주목을 받았다.
왜 중요한가
로컬 LLM 추론에서 통합 메모리 용량은 구동 가능한 모델 크기를 직접 결정한다. 현재 Strix Halo 128GB로는 70B 모델을 4비트 양자화로 겨우 올릴 수 있는 수준이다. 192GB가 되면 훨씬 큰 모델을 더 높은 정밀도로 구동하거나, 복수의 모델을 동시에 메모리에 적재하는 것도 가능해진다.
특히 Radeon 8065S iGPU를 탑재한다는 점도 주목할 만하다. GPU 성능 향상과 대용량 메모리의 조합은 로컬 추론 속도와 배치 처리 능력을 동시에 높일 것으로 기대된다.
출시 일정
현재로서는 공식 발표나 출시 일정이 나오지 않은 유출 정보다. 커뮤니티에서는 2026년 하반기 출시를 예상하고 있으며, Apple Silicon M4 Max(128GB)와의 비교가 활발히 이뤄지고 있다.
Related Articles
HN이 이 RAM shortage story에 붙은 이유는 HBM 수요가 AI data center 밖의 phones, laptops, handhelds 가격까지 밀어 올린다는 불편한 연결고리였다.
r/artificial의 최근 글은 Claude Code leak를 단순 해프닝이 아니라 AI agent 설계 교본처럼 읽어야 한다는 관점을 제시했다. 핵심은 model weights가 아니라 memory, permissions, tool orchestration, multi-agent coordination 같은 실제 product layer가 드러났다는 점이다.
Hacker News front page에 오른 EE Times 인터뷰는 AMD가 ROCm, Triton, OneROCm, open-source 전략으로 CUDA 의존도를 단계적으로 낮추려는 접근을 정리한다. 핵심은 화려한 호환성 선언보다 vLLM과 SGLang이 자연스럽게 돌아가는 boring한 software 완성도다.
Comments (0)
No comments yet. Be the first to comment!