AMD Gorgon Halo, 192GB 통합 메모리로 로컬 AI 한계 밀어낸다

Gorgon Halo 유출

videocardz.com을 통해 AMD Ryzen AI Max Pro 495(Gorgon Halo)의 스펙이 유출됐다. 가장 주목할 점은 통합 메모리 용량이 기존 Strix Halo의 128GB에서 192GB로 50% 증가한 것이다. r/LocalLLaMA에서 350점을 기록하며 로컬 AI 커뮤니티에서 큰 주목을 받았다.

왜 중요한가

로컬 LLM 추론에서 통합 메모리 용량은 구동 가능한 모델 크기를 직접 결정한다. 현재 Strix Halo 128GB로는 70B 모델을 4비트 양자화로 겨우 올릴 수 있는 수준이다. 192GB가 되면 훨씬 큰 모델을 더 높은 정밀도로 구동하거나, 복수의 모델을 동시에 메모리에 적재하는 것도 가능해진다.

특히 Radeon 8065S iGPU를 탑재한다는 점도 주목할 만하다. GPU 성능 향상과 대용량 메모리의 조합은 로컬 추론 속도와 배치 처리 능력을 동시에 높일 것으로 기대된다.

출시 일정

현재로서는 공식 발표나 출시 일정이 나오지 않은 유출 정보다. 커뮤니티에서는 2026년 하반기 출시를 예상하고 있으며, Apple Silicon M4 Max(128GB)와의 비교가 활발히 이뤄지고 있다.

AI Hacker News Apr 20, 2026 1 min read

AI data center가 끌어올린 RAM 부족, HN은 consumer hardware 비용을 봤다

HN이 이 RAM shortage story에 붙은 이유는 HBM 수요가 AI data center 밖의 phones, laptops, handhelds 가격까지 밀어 올린다는 불편한 연결고리였다.

#ai-infrastructure #memory #hbm

AI X/Twitter Jun 5, 2026 1 min read

ChatGPT 메모리, 미국 Plus·Pro부터 요약 검토와 5배 효율 구조로 전환

개인화 AI의 경쟁축이 대화창 안 답변에서 장기 기억 품질로 이동한다. OpenAI는 미국 Plus·Pro 사용자에게 새 메모리를 먼저 적용하고, Free 확장을 위해 연산 비용을 약 5배 낮췄다고 설명했다.

#openai #chatgpt #memory

AI X/Twitter 5d ago 1 min read

SpatialClaw, 20개 공간 추론 벤치마크에서 기존 에이전트보다 11.2점 우위

공간 추론 에이전트의 핵심이 도구 목록보다 행동 인터페이스일 수 있다는 결과가 나왔다. NVIDIA Research의 SpatialClaw는 20개 벤치마크에서 기존 에이전트보다 11.2점 높고, 6개 VLM 백본 전반에서 일관된 향상을 보였다.

#nvidia #spatialclaw #agents