AMD Gorgon Halo, 192GB 통합 메모리로 로컬 AI 한계 밀어낸다
Original: AMD Strix Halo refresh with 192gb! View original →
Gorgon Halo 유출
videocardz.com을 통해 AMD Ryzen AI Max Pro 495(Gorgon Halo)의 스펙이 유출됐다. 가장 주목할 점은 통합 메모리 용량이 기존 Strix Halo의 128GB에서 192GB로 50% 증가한 것이다. r/LocalLLaMA에서 350점을 기록하며 로컬 AI 커뮤니티에서 큰 주목을 받았다.
왜 중요한가
로컬 LLM 추론에서 통합 메모리 용량은 구동 가능한 모델 크기를 직접 결정한다. 현재 Strix Halo 128GB로는 70B 모델을 4비트 양자화로 겨우 올릴 수 있는 수준이다. 192GB가 되면 훨씬 큰 모델을 더 높은 정밀도로 구동하거나, 복수의 모델을 동시에 메모리에 적재하는 것도 가능해진다.
특히 Radeon 8065S iGPU를 탑재한다는 점도 주목할 만하다. GPU 성능 향상과 대용량 메모리의 조합은 로컬 추론 속도와 배치 처리 능력을 동시에 높일 것으로 기대된다.
출시 일정
현재로서는 공식 발표나 출시 일정이 나오지 않은 유출 정보다. 커뮤니티에서는 2026년 하반기 출시를 예상하고 있으며, Apple Silicon M4 Max(128GB)와의 비교가 활발히 이뤄지고 있다.
Related Articles
HN이 이 RAM shortage story에 붙은 이유는 HBM 수요가 AI data center 밖의 phones, laptops, handhelds 가격까지 밀어 올린다는 불편한 연결고리였다.
개인화 AI의 경쟁축이 대화창 안 답변에서 장기 기억 품질로 이동한다. OpenAI는 미국 Plus·Pro 사용자에게 새 메모리를 먼저 적용하고, Free 확장을 위해 연산 비용을 약 5배 낮췄다고 설명했다.
공간 추론 에이전트의 핵심이 도구 목록보다 행동 인터페이스일 수 있다는 결과가 나왔다. NVIDIA Research의 SpatialClaw는 20개 벤치마크에서 기존 에이전트보다 11.2점 높고, 6개 VLM 백본 전반에서 일관된 향상을 보였다.