개인화 AI의 경쟁축이 대화창 안 답변에서 장기 기억 품질로 이동한다. OpenAI는 미국 Plus·Pro 사용자에게 새 메모리를 먼저 적용하고, Free 확장을 위해 연산 비용을 약 5배 낮췄다고 설명했다.
#memory
RSS Feed댓글의 관심은 “AI 서버 투자”가 스마트폰과 노트북 가격표까지 건드리는 공급망 메커니즘에 모였다.
arXiv에 공개된 Δ-Mem 논문이 HN에서 142점을 기록했다. 고정 크기 온라인 메모리 상태를 통해 LLM의 장기 기억 능력을 크게 향상시키며, MemoryAgentBench에서 기준 대비 1.31배 성능 개선을 달성했다.
닌텐도(7974.T) 주가가 약 8% 급락했다. 스위치 2 본체 가격을 인상하고 메모리 공급 위기 심화를 이유로 연간 콘솔 판매 전망을 낮췄기 때문이다. AI 수요 확대와 이란발 공급망 교란이 겹치며 낸드·D램 조달 비용이 높아진 것이 직접 원인이다.
AMD Ryzen AI Max Pro 495(코드명 Gorgon Halo)가 192GB 통합 메모리를 탑재한 것으로 유출됐다. 기존 Strix Halo의 128GB에서 50% 늘어난 용량으로, 더 큰 AI 모델을 로컬에서 구동할 수 있게 된다.
중요한 점은 agent가 매번 상태를 잃는 문제를 managed product 안으로 끌어왔다는 데 있다. Anthropic는 4월 23일 public beta를 시작하며 agent가 모든 session에서 배울 수 있다고 적었다.
HN이 이 RAM shortage story에 붙은 이유는 HBM 수요가 AI data center 밖의 phones, laptops, handhelds 가격까지 밀어 올린다는 불편한 연결고리였다.
왜 중요한가: 장시간 실행되는 agent는 모든 메시지를 다시 넣지 않고도 이전 상태를 기억해야 한다. Cloudflare는 private beta로 공개한 Agent Memory가 context window를 채우지 않으면서 필요한 정보를 다시 제공한다고 설명했다.
Hacker News에서 화제가 된 OpenClaw 비판 글은 약 1,000건의 deployment 관찰을 바탕으로, persistent agent의 핵심 문제는 flashy demo가 아니라 memory reliability라고 주장한다.
Databricks AI Research는 2026년 4월 10일 Memory Scaling for AI Agents를 공개하며, real-world agent 성능은 더 긴 reasoning보다 external memory 축적과 retrieval 품질에 더 크게 좌우될 수 있다고 주장했다. 글은 labeled 예제, user log, organizational knowledge로 정확도와 효율이 함께 개선되는 결과를 제시한다.
r/singularity의 인기 글은 MemPalace를 무료 AI memory system으로 띄웠지만, 실제 핵심은 repo가 96.6% raw score와 optional rerank 100%를 스스로 다시 구분해 적은 correction note에 있다.
r/artificial의 최근 글은 Claude Code leak를 단순 해프닝이 아니라 AI agent 설계 교본처럼 읽어야 한다는 관점을 제시했다. 핵심은 model weights가 아니라 memory, permissions, tool orchestration, multi-agent coordination 같은 실제 product layer가 드러났다는 점이다.