Claude Code와 Cowork 같은 에이전트가 실제 업무 권한을 얻으면서, 위험의 초점은 모델 설득이 아니라 실행 환경 통제로 이동했다. Anthropic은 사용자 승인 프롬프트의 93%가 그대로 통과된다는 수치를 근거로 샌드박스와 격리를 전면에 세웠다.
#sandboxing
RSS FeedHN은 Codex의 새 방향을 “무엇을 할 수 있나”보다 “어디까지 컴퓨터를 맡겨도 되나”로 읽었다. desktop agent, non-developer workflow, sandbox, 민감한 file 접근이 댓글의 핵심이었다.
Hacker News에서 Anthropic의 Claude Mythos Preview system card가 화제가 되며, 논의는 추상적 x-risk보다 exploit capability와 sandbox·least-privilege 현실로 옮겨 갔다.
2026년 3월 Hacker News에서 Stanford SCS의 `jai`가 604 points와 313 comments를 기록했다. 이 도구는 현재 작업 디렉터리는 그대로 쓰게 두고, 나머지 home 영역은 overlay 또는 숨김 처리해 AI agent의 파일 손상 범위를 줄이려는 Linux용 containment 도구다.
Cloudflare는 2026년 3월 24일 Dynamic Workers가 AI가 생성한 코드를 보안이 적용된 경량 isolate 안에서 실행할 수 있게 하며, 이 접근이 기존 container보다 100배 빠르다고 밝혔다. Cloudflare 블로그는 이 기능이 유료 Workers 사용자를 대상으로 open beta에 들어갔고, <code>globalOutbound: null</code>로 직접적인 외부 인터넷 접근을 차단할 수 있다고 설명한다.
2026년 3월 17일 Show HN의 zeroboot 글은 크롤링 시점 303 points와 69 comments를 기록했다. 프로젝트는 copy-on-write 스냅샷 포킹으로 실제 KVM microVM 격리를 제공하며, p50 0.79 ms 스폰과 샌드박스당 약 265 KB 메모리를 주장한다.
2026년 3월 18일 NVIDIA NemoClaw 관련 Hacker News 게시물은 231 points와 185 comments를 기록했다. 이 alpha 프로젝트는 NVIDIA OpenShell과 Agent Toolkit 위에 OpenClaw를 얹어 policy control과 cloud-routed inference를 갖춘 sandboxed environment에서 always-on assistant를 실행하도록 설계됐다.
Hacker News에서 주목받은 Agent Safehouse는 macOS의 sandbox-exec를 활용해 local coding agent를 프로젝트 범위 안으로 제한하는 오픈소스 보안 레이어다.
Hacker News에서 주목받은 Agent Safehouse는 Claude Code, Codex 같은 agent를 macOS의 <code>sandbox-exec</code> 기반 deny-first sandbox 안에서 실행하는 도구다. project 단위 접근만 기본 허용하고 민감한 경로는 kernel 레벨에서 차단하며, 단일 Bash script와 Apache 2.0 license로 배포된다.
r/MachineLearning에서 반응을 얻은 IronClaw는 sandboxed tool execution, encrypted credential handling, database-backed policy controls를 중심에 둔 Rust 기반 AI agent runtime이다. 이 글이 주목받은 이유는 agent security를 prompt 문제보다 systems 문제로 다루기 때문이다.
2026년 2월 28일 HN 토론은 NanoClaw 보안 모델을 중심으로, untrusted-agent 전제를 둔 container isolation과 실행 권한 최소화 원칙을 집중 조명했다.
Hacker News에서 102점으로 상위권에 오른 Docker의 NanoClaw 샌드박스 가이드는, AI 에이전트를 호스트와 분리해 운영하는 실무 패턴을 단계별로 보여줍니다. 특히 파일시스템 격리와 프록시 기반 API 키 주입을 결합한 점이 핵심입니다.