Anthropic, Managed Agents 설계 공개... 장기 실행 agent를 session·harness·sandbox로 분리

Original: New on the Engineering Blog: Building Managed Agents—our hosted service for long-running agents—meant solving an old problem in computing: how to design a system for “programs as yet unthought of.” Read more: https://www.anthropic.com/engineering/managed-agents View original →

Read in other languages: English日本語
LLM Apr 9, 2026 By Insights AI 1 min read Source

Anthropic는 2026년 4월 8일 X post에서 Engineering Blog의 Managed Agents 글을 소개했다. Managed Agents는 Claude Platform에서 장기 실행 agent 작업을 대신 운영하는 hosted service다. Anthropic는 핵심 문제를 “programs as yet unthought of”를 위한 시스템 설계라고 설명하며, 모델과 harness가 바뀌어도 오래 버틸 수 있는 interface 중심 구조를 선택했다고 밝혔다. 하나의 container에 agent를 통째로 묶는 대신 session, harness, sandbox를 분리해 가상화했다는 것이 설명의 출발점이다.

이 구조의 의미는 failure 처리 방식, 배포 유연성, security에서 드러난다. Anthropic는 “brain”을 “hands”와 persistent session log에서 분리해 harness가 durable event stream에서 다시 시작할 수 있고, execution sandbox도 독립적으로 실패하고 복구할 수 있도록 했다고 설명했다. 회사는 이 설계 덕분에 p50 time-to-first-token이 약 60% 줄고 p95는 90% 이상 감소했다고 적었다. 또한 고객이 자체 VPC 안의 자원에 Claude를 연결할 때 Anthropic 측 orchestration 가정을 그대로 강요하지 않아도 되는 구조가 됐다고 밝혔다.

분리 설계가 중요한 이유

Anthropic는 이 재설계가 agent system의 security boundary도 강화한다고 주장한다. untrusted code가 더 이상 장기 credential과 같은 위치에서 실행되지 않으며, MCP tools용 OAuth token은 별도 vault에 두고 Git credential은 sandbox 초기화 과정에서만 연결할 수 있다는 설명이다. 장기 실행 agent는 이제 단순 benchmark보다 failure 복구, 작업 재개, 민감한 인프라 처리 능력으로 평가되는 경우가 많다. 그런 점에서 Managed Agents는 Claude를 둘러싼 packaging 변경이 아니라 운영 계층 자체를 다시 설계한 신호에 가깝다.

Share: Long

Related Articles

LLM Mar 26, 2026 1 min read

Anthropic는 2026년 2월 25일 Vercept를 인수해 Claude의 computer use capability를 강화한다고 밝혔다. 회사는 이번 거래를 Sonnet 4.6의 OSWorld 72.5% 성과와 live application 안에서 행동하는 agent 전략의 연장선으로 설명했다.

LLM sources.twitter Mar 28, 2026 2 min read

AnthropicAI는 2026년 3월 24일 Claude를 frontend와 장기 실행 software engineering 작업에 더 안정적으로 쓰기 위한 multi-agent harness 글을 다시 부각했다. 해당 Anthropic Engineering 글은 initializer agent, incremental coding session, progress log, structured feature list, browser-based testing으로 context-window drift와 premature completion을 줄이는 방법을 설명한다.

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.