Claude Opus 4.7、ロボット犬課題を前年の人間チーム比で約20倍速く処理

AIエージェントの評価は、IDE内の課題から実機ロボットへ広がり始めている。AnthropicはProject Fetch第2段階で、Claude Opus 4.7が四足歩行ロボット犬をプログラムする課題に単独で取り組み、前年のOpus 4.1支援付き人間チームより約20倍速かったと示した。

Anthropicの元ツイートは、Opus 4.7が"~20x faster"だったと記している。ただし同じ投稿は、ロボット犬がビーチボールを取ってくる最終目標には失敗したとも明記した。ここが重要で、今回の結果は完全なロボット知能ではなく、未知のハードウェアをコードで動かす速度の変化を測るものだ。

Project FetchはAnthropicのFrontier Red Teamによる実験で、ロボット専門家ではない参加者が四足歩行ロボットを扱う状況を作る。そこでは、API文書の理解、センサーの読み取り、制御コードの修正、物理環境での検証が連続して起きる。モデルが得意なソフトウェア推論と、現実世界の摩擦や遅延の間にある差が見えやすい。

次に注目すべきなのは、単にボールを取れるかどうかだけではない。人間の介入回数、別のロボットでの再現性、安全停止の設計、速さと脆さの交換関係が評価の中心になる。進歩が続けば、ロボット開発現場ではまず統合コードを書く高速な支援役として導入され、その後により大きな自律性が試されるはずだ。