Claude Opus 4.7、ロボット犬課題を前年の人間チーム比で約20倍速く処理
Original: Claude Opus 4.7 Runs Robodog Task About 20x Faster Than Prior Human Team View original →
AIエージェントの評価は、IDE内の課題から実機ロボットへ広がり始めている。AnthropicはProject Fetch第2段階で、Claude Opus 4.7が四足歩行ロボット犬をプログラムする課題に単独で取り組み、前年のOpus 4.1支援付き人間チームより約20倍速かったと示した。
Anthropicの元ツイートは、Opus 4.7が"~20x faster"だったと記している。ただし同じ投稿は、ロボット犬がビーチボールを取ってくる最終目標には失敗したとも明記した。ここが重要で、今回の結果は完全なロボット知能ではなく、未知のハードウェアをコードで動かす速度の変化を測るものだ。
Project FetchはAnthropicのFrontier Red Teamによる実験で、ロボット専門家ではない参加者が四足歩行ロボットを扱う状況を作る。そこでは、API文書の理解、センサーの読み取り、制御コードの修正、物理環境での検証が連続して起きる。モデルが得意なソフトウェア推論と、現実世界の摩擦や遅延の間にある差が見えやすい。
次に注目すべきなのは、単にボールを取れるかどうかだけではない。人間の介入回数、別のロボットでの再現性、安全停止の設計、速さと脆さの交換関係が評価の中心になる。進歩が続けば、ロボット開発現場ではまず統合コードを書く高速な支援役として導入され、その後により大きな自律性が試されるはずだ。
Related Articles
Qwenはrobotics向けfoundation modelをnavigation、manipulation、world modelingの3系統でまとめた。Qwen-Robot Suiteの焦点は、物理世界を理解するAIを実際の行動へ接続するagent stackだ。
Figure AIのFigure 03ロボットが5月15日、外部介入ゼロで約50時間連続の荷物仕分けを完了した。搭載型ニューラルネットHelix-02のみで完全自律稼働し、無人物流現場の実現可能性を証明した。
OpenAIはロボティクスを研究テーマから、ハードウェア・運用・システム・MLを横断する採用計画へ移した。Sam Altmanの投稿は216万回超表示、1.1万件超のいいねを集め、物理世界AIへの転換点を示している。