Anthropic、長時間実行agent向けManaged Agents設計を公開
Original: New on the Engineering Blog: Building Managed Agents—our hosted service for long-running agents—meant solving an old problem in computing: how to design a system for “programs as yet unthought of.” Read more: https://www.anthropic.com/engineering/managed-agents View original →
Anthropicは2026年4月8日のX postで、Engineering Blogに掲載したManaged Agentsの設計記事を紹介した。Managed Agentsは、Claude Platform上で長時間にわたるagent作業を実行するhosted serviceだ。Anthropicは問題設定を“programs as yet unthought of”のためのsystem designだと表現し、modelやharnessが変わっても寿命の長いinterfaceを中心に設計したと説明している。agent全体を1つのcontainerに密結合させるのではなく、session、harness、sandboxを分離してvirtualizeしたことが出発点だ。
この構成の意味は、failure handling、deployment flexibility、securityの3点に表れている。Anthropicは“brain”を“hands”およびpersistent session logから切り離し、harnessがdurable event streamから再起動できるようにし、execution sandboxも独立して失敗と回復ができるようにしたという。記事では、この設計によってp50 time-to-first-tokenが約60%改善し、p95は90%以上改善したと説明している。さらに、顧客が自社VPC内のresourceへClaudeを接続する場合でも、Anthropic側のorchestration assumptionsをそのまま押し付けずに済む構造になったと述べた。
なぜ分離が重要なのか
Anthropicは、この再設計がagent systemのsecurity boundaryも改善すると主張する。untrusted codeはもはや長期credentialと同じ場所で実行されず、MCP tools向けのOAuth tokenは別vaultに置き、Git credentialはsandbox初期化時だけ配線できるという。長時間実行agentは、もはや単純なbenchmarkだけでなく、failureからの回復、作業の再開、機密インフラの安全な取り扱いで評価される段階に入っている。そう考えるとManaged Agentsは、Claudeの周辺機能を包み直したものではなく、運用層そのものを作り替える試みとして読むべきだ。
Related Articles
Claude Opus 4.8の初期評価は、コーディングだけでなく実務型エージェント作業に広がっている。Artificial AnalysisはGDPval-AAで1890点、GPT-5.5 xhighを121点上回ったとした。
Anthropicは5月29日、Claude Platform on AWSでManaged Agentsのwebhooks、multiagent orchestration、self-hosted sandboxesを利用可能にした。Claude APIのAWS展開は、単なるモデル呼び出しからagent運用基盤へ広がっている。
Claudeは2026年4月8日のXで、Managed Agentsにより task、tool、guardrail を定義すれば Anthropic 側が agent infrastructure を運用すると説明した。Anthropic の公式資料では、cloud-hosted かつ versioned な agent のための composable API 群として位置付けられ、outcomes、memory、multi-agent orchestration の一部は limited research preview とされている。
Comments (0)
No comments yet. Be the first to comment!