Hacker News가 짚은 personal AI agent의 한계, memory reliability
Original: OpenClaw’s memory is unreliable, and you don’t know when it will break View original →
Hacker News가 반응한 글의 핵심
2026-04-10 Hacker News에서 주목받은 글은 "OpenClaw의 memory는 unreliable하고, 언제 깨지는지도 알 수 없다"는 매우 직설적인 비판이다. 글쓴이는 NonBioS 관점에서 roughly 1,000건의 OpenClaw deployment를 인프라를 통해 봤고, 별도로 여러 engineer와 founder가 몇 주 단위로 실제 활용을 시도한 사례도 들여다봤다고 설명한다.
핵심 주장은 OpenClaw가 가짜라는 것이 아니다. 원문도 software가 설치되고, 실행되고, WhatsApp이나 Discord와 연결되고, Claude와 GPT를 붙일 수 있으며, shell command도 수행한다고 적는다. 비판은 더 좁고도 치명적이다. persistent personal agent가 쓸모 있으려면 시간이 지나도 중요한 context를 유지해야 하는데, 글쓴이는 OpenClaw의 memory behavior가 너무 unreliable해서 무엇을 잃어버렸는지 사용자가 미리 알 수 없다고 본다.
왜 memory가 product 문제로 바뀌는가
글은 운영 관점의 단순한 예를 든다. agent가 어떤 planning thread를 따라가다가 누가 초대를 거절했는지를 잊은 채 update message를 보내면, 사용자는 잘못된 정보가 전파된 뒤에야 문제를 눈치챌 수 있다. 요점은 분명하다. 결과를 매번 사람이 검수해야 한다면, 그 시스템은 autonomous agent라기보다 권한만 늘어난 chatbot에 가깝다는 것이다.
저자는 이것이 다음 release에서 고쳐질 작은 bug가 아니라 long-horizon agent의 구조적 문제라고 본다. context window는 차고, retrieval layer는 중요한 세부사항을 놓칠 수 있고, file 기반 memory 구조는 인간처럼 핵심만 남기는 방식을 그대로 재현하지 못한다는 것이다. 글에 따르면 실제로 꾸준히 성립한 use case는 daily news summary 정도였고, 그것도 훨씬 단순한 tool 체인으로 이미 구현 가능한 작업에 가깝다.
이 비판이 한 프로젝트를 넘어 중요한 이유
이 글의 가장 유용한 점은 OpenClaw 자체를 깎아내리는 데 있지 않다. 오히려 long-lived AI agent가 text를 잘 생성하고 tool을 호출하는 것만으로는 부족하다는 engineering constraint를 선명하게 보여준다. stable memory, safe permission, context failure를 일찍 드러내는 recovery model이 갖춰져야만 calendar, email, messaging, shell 같은 실제 권한 연결이 의미를 갖는다.
그래서 이 Hacker News 토론은 개인 AI의 현재 위치를 보여주는 지표에 가깝다. agent를 띄우는 것보다 더 어려운 일은, 긴 작업 시간축에서도 coherence를 유지하고, failure mode를 숨기지 않고, 사람이 모든 단계를 재검수하지 않아도 되는 수준의 신뢰를 만드는 것일 수 있다.
Source links: Hacker News thread, Original essay.
Related Articles
개인화 AI의 경쟁축이 대화창 안 답변에서 장기 기억 품질로 이동한다. OpenAI는 미국 Plus·Pro 사용자에게 새 메모리를 먼저 적용하고, Free 확장을 위해 연산 비용을 약 5배 낮췄다고 설명했다.
r/singularity에서 주목받은 Anthropic의 2026-02-18 연구는 Claude Code와 public API의 대규모 상호작용 데이터를 바탕으로, 자율 실행 시간·auto-approve 패턴·위험 도메인 분포를 정량적으로 제시했다.
앤스로픽이 클로드 코드·API의 수백만 건 상호작용 분석 결과, 99.9번째 백분위 세션 지속 시간이 25분에서 45분으로 두 배 증가하는 등 AI 에이전트 자율성이 실제 환경에서 급격히 높아지고 있음을 확인했습니다.