Anthropic、frontend designと長時間software engineering向けmulti-agent harnessを詳解

2026年3月24日、AnthropicはXでClaudeをfrontend designと長時間のautonomous software engineeringにより適応させるためのmulti-agent harnessを扱う新しいEngineering Blog記事を公開した。リンク先の Harness design for long-running application development は、より強いdesign tasteをどう引き出すか、そして長いcoding sessionのcoherenceをどう維持して実際のapplication完成まで持っていくかという2つの問題を、かなり実務的に整理している。

Anthropicによれば、最初の鍵は主観的なdesign判断を採点可能な形に変えることだった。design harnessではgenerator agentとevaluator agentを分け、evaluatorがdesign quality、originality、craft、functionalityで出力を採点する。Anthropicはgenerationごとに5から15回のiterationを回し、長いrunでは4時間に達したと説明する。creationとcritiqueを分離すると、Claudeは安全だが平凡なlayoutから離れ、より個性的な方向へ進みやすくなったという。

この考え方はfull-stack developmentにも拡張された。Anthropicが説明する構成はplanner、generator、evaluatorの3-agent systemだ。plannerは短いproduct promptをより詳細なspecへ広げ、generatorがappを作り、evaluatorはPlaywright MCPで実際に動くproductを操作してcontractに沿って検証する。記事内のretro game maker例では、solo runは20分と$9だった一方、full harness runは6時間と$200を要したが、より完成度の高いproductになったとされる。さらにOpus 4.6で行ったbrowser DAW実験では、約3時間50分と$124.70をかけつつ、以前必要だったsprint構造なしでも長時間のcoherentな作業を続けられたとAnthropicは述べている。

この投稿が重要なのは、agent performanceを単なるmodel capabilityではなくengineering systemsの問題として扱っている点だ。Anthropicの結論は、すべての作業に最大限複雑なorchestrationが必要だというものではない。むしろmodelが向上すると、古いharness要素の一部は不要になり、新しい組み合わせがより野心的なworkflowを可能にするという話だ。coding agentをproductionに近い水準へ押し上げたいチームにとって、この文章はprompt design、役割分離、evaluation、context managementの相互作用をかなり具体的に示す一次資料になっている。

出典: Anthropic X投稿 · Anthropic Engineering Blog

Anthropic、frontend designと長時間software engineering向けmulti-agent harnessを詳解

Related Articles

Anthropic、長時間software engineering向けmulti-agent Claude harnessを再提示

KPMGとAnthropicがグローバル提携、27万6,000人の従業員にClaude導入

Claudeがセッション中に「寝てください」を繰り返す — Anthropicも原因不明

Comments (0)

Leave a Comment

Related Articles

Anthropic、長時間software engineering向けmulti-agent Claude harnessを再提示
LLM X/Twitter Mar 28, 2026 1 min read

KPMGとAnthropicがグローバル提携、27万6,000人の従業員にClaude導入
AnthropicとKPMGは5月19日にグローバル戦略提携を発表した。KPMG全社員27万6,000人がDigital GatewayでClaudeにアクセスでき、税務・PE・サイバーセキュリティ領域から優先展開される。

Claudeがセッション中に「寝てください」を繰り返す — Anthropicも原因不明