Claude Code、Team/Enterprise向けのマルチエージェントCode Reviewを投入
Original: Introducing Code Review, a new feature for Claude Code. View original →
2026年3月9日、ClaudeはXでClaude CodeへのCode Review追加を発表した。これはpull requestが開くたびに複数agentを投入してバグを探す機能で、Anthropicは自社の多くのPRですでに使っているreview workflowを製品化したものだと説明している。提供形態はTeamとEnterprise向けのresearch previewだ。
Anthropicによれば、この仕組みは速度よりdepthを重視する。PRが作成されると複数agentが変更内容を並列に読み、疑わしい問題を再検証してfalse positiveを減らし、severity順に整理したうえで1本のhigh-signal summary commentと必要なinline commentを返す。さらにPRの規模や複雑さに応じてreviewの深さを変え、小さな変更には軽い確認、大きな変更や高リスクのdiffにはより多くのagentと深い分析を割り当てる。
Anthropicは内部運用データも公開した。この仕組みの導入前はsubstantive review commentが付くPRは16%だったが、導入後は54%に上がったという。変更行数が1,000行を超えるPRでは84%にfindingが付き、平均7.5件のissueが出た。50行未満のPRでは31%にfindingが付き、平均0.5件だった。Anthropicはengineerがincorrectと判断するfindingは1%未満だとしている。
X threadには導入検討に必要な運用情報も含まれていた。1件あたりのreview時間は平均約20分で、beta期間の価格はtoken usage課金で1 reviewあたり平均$15-25だという。Anthropicはこれを既存のopen-source Claude Code GitHub Actionの置き換えではなく、より高コストだがより深いreview optionとして位置づけている。詳細はClaudeのCode Review発表で確認できる。
Related Articles
HNで注目されたのは「Claudeがバグを見つける」話だけでなく、各チームが自分の対象に合わせて作り替えるharnessの形だった。
Claude Fable 5がGDPval-AAで1932点を記録し、エージェント型の実業務ベンチマークで首位に立った。Anthropic系モデルが上位4枠のうち3枠を占め、長時間タスクの評価軸がさらに重要になっている。
KPMGはAnthropicと戦略的提携を結び、全世界27万6,000人以上の従業員にClaudeを提供する。税務・法律向けAIワークフローをDigital Gatewayに統合する。