アンソロピック研究：実際の環境でAIエージェントの自律性が急速に拡大中

実環境におけるAIエージェント自律性の計測

2026年2月19日、アンソロピックはClaude CodeおよびパブリックAPIを通じた数百万件のリアルタイムやり取りを分析し、AIエージェントの自律性の現状を把握する研究を発表しました。

2025年10月から2026年1月の間に、99.9パーセンタイルのセッション継続時間が25分未満から45分超へとほぼ倍増しました。研究者は「既存モデルは実際の使用で発揮している以上の自律性能力を持っている」と結論付けています。

新規ユーザーは約20%のアクションを自律承認するのに対し、熟練ユーザーは約40%を承認します。熟練ユーザーは個別アクション承認からセッション全体を監視する方式へとシフトしながらも、より頻繁に介入します。

パブリックAPIにおけるエージェントのツール呼び出しの約50%がソフトウェアエンジニアリング分野であり、医療・金融・カスタマーサービスでの活用も広がっています。

アクションの80%には許可要求や人間レビューなどの安全策が設けられており、取り消し不能なアクションは0.8%にとどまります。研究者はエージェントが高リスク領域へ拡大するにつれ、デプロイ後の監視基盤の整備が重要になると勧告しています。

AI X/Twitter Jul 15, 2026 1 min read

AnthropicはカナダのAI研究に1,000万CADを投じる。Amii、Mila、Vectorに加え医療機関や大学も含まれ、Claudeの研究利用が安全性、医療、公共分野へ広がる。

AI X/Twitter Mar 23, 2026 1 min read

Anthropicは3月18日にXで、約8万1千人の Claude ユーザーが参加した1週間の qualitative interview study を公開した。実利用者が AI に何を望み、何を恐れているかを示す大規模な一次資料だ。

AI Reddit Feb 19, 2026 1 min read

r/singularityで拡散したAnthropicの2026-02-18研究は、Claude Codeとpublic APIの実データを基に、自律実行時間、auto-approve傾向、リスク領域での利用状況を提示した。