WUPHF 에이전트 위키에 HN 주목, 더 어려운 건 공유보다 신뢰
Original: Show HN: A Karpathy-style LLM wiki your agents maintain (Markdown and Git) View original →
HN은 WUPHF를 단순한 multi-agent 데모로 소비하지 않았다. README는 이 프로젝트를 "AI 직원들을 위한 Slack"처럼 소개하지만, 실제로 더 눈길을 끈 부분은 memory 설계다. 각 agent는 자기 notebook을 갖고, 팀 전체는 공유 wiki를 쓴다. 중요한 점은 흐름이다. 임시 관찰은 notebook에 남기고, 오래 쓸 사실이나 플레이북만 wiki로 올린다. 메모를 쌓는 것이 아니라, 무엇을 승격할지 고르는 구조다.
이 설계가 흥미로운 이유는 local-first 구현 때문이다. 새 설치는 markdown과 git 기반 wiki를 기본으로 쓰고, 저장소는 ~/.wuphf/wiki/에 놓인다. README는 typed fact, append-only log, lookup, contradiction lint까지 전면에 내세운다. 다시 말해 agent memory를 벡터 DB 뒤에 숨기지 않는다. cat, grep, git log로 사람이 직접 읽고 추적할 수 있는 artifact로 만들겠다는 방향이다.
HN 댓글은 왜 이 주제가 지금 뜨거운지 잘 보여준다. 한 댓글은 24시간 안에 프런트페이지에 올라온 세 번째 LLM wiki라고 적었다. 그만큼 agent memory가 설계 경쟁이 됐다는 뜻이다. 동시에 회의론도 뚜렷했다. 메모는 원래 사람이 자료를 비판적으로 읽고 자기 모델에 맞게 다듬는 과정인데, 그걸 왜 자동화하느냐는 질문이 나왔다. 더 날카로운 걱정은 "garbage facts in, garbage briefs out"이다. agent가 자기 노트를 자기 손으로 승격하기 시작하면, 몇 달 뒤에는 자신 있게 틀린 사실이 쌓일 수 있다는 지적이다.
그래서 WUPHF가 만든 대화는 단순히 agent를 더 많이 붙이는 문제가 아니다. memory를 많이 저장하는 일은 이미 어렵지 않다. 진짜 어려운 건 무엇을 믿을 수 있느냐이다. WUPHF는 chat 잔여물을 공유 기억으로 바꾸는 방식을 꽤 구체적으로 제시했고, HN은 그 설계가 유용할 수 있다는 점과 함께 신뢰 관리가 더 큰 병목이라는 점을 동시에 짚었다. 출처는 GitHub 저장소와 HN 토론이다.
Related Articles
기업 RAG의 약점은 답을 모르는 것이 아니라, 필요한 근거가 다른 저장소에 흩어졌을 때 너무 일찍 멈추는 데 있다. Google Research는 충분한 문맥을 검사하고 다시 검색하는 Agentic RAG로 factuality 데이터셋 정확도를 최대 34% 높였다고 밝혔다.
530점 넘게 오른 관심은 “Claude가 보안 버그를 찾는다”보다, 팀마다 직접 고쳐 쓸 수 있는 harness의 모양에 모였다.
오픈 모델 경쟁이 단순 성능표에서 장시간 에이전트 비용으로 이동하고 있다. NVIDIA는 Nemotron 3 Ultra가 550B MoE 구조로 5배 빠른 추론과 최대 30% 낮은 복잡 작업 비용을 낸다고 밝혔다.