同一の管理画面タスクをビジョンエージェントとAPIエージェントで比較したところ、ビジョン方式は約45倍高コストで、詳細なウォークスルーなしにはタスク完了も不可能だった。
#computer-use
RSS FeedHNが面白がったのはハック感そのものよりインフラだった。CuaのmacOS向けbackground driverは、agentが別アプリで動いている間もカーソル、focus、Spaceを奪わないところに価値があると受け取られた。
Felix Riesebergは2026年3月17日のX投稿で、Claude Coworkのresearch preview機能としてDispatchを紹介し、computer上で動き続ける1本のpersistent conversationをphoneからも扱えると説明した。その後Anthropicは3月23日、Claude CoworkとClaude Codeにcomputer useを追加し、Dispatchがlocal files、connectors、plugins、desktop appsまで扱うcross-device workflowになると明らかにした。
Anthropicは2026年3月30日、Claude Codeでcomputer useがresearch previewとして利用可能になったと発表した。Claude Codeのドキュメントによれば、この機能はmacOS上でClaudeがCLIからアプリを開き、UIをクリックし、画面を確認できるようにし、native appのテスト、visual debugging、GUI専用ツールの操作を想定している。
Anthropicは2026年2月25日、Claudeのcomputer use capabilityを強化するためVerceptを買収したと発表した。Sonnet 4.6のOSWorld 72.5%という改善と、live application内で行動するagent戦略を結び付けた発表だ。
r/singularityはAnthropicのDispatch + computer use公開をphone-first AI coworkerへの実際のproduct shiftとして受け止めた。一方でmacOS-only rolloutとscreen-driven automationの限界も同時に議論した。
Perplexityは2026年3月19日、Perplexity Computerがhealth apps、wearable devices、lab results、medical recordsに接続できるようになったと発表した。同社は、そのデータを使って個別ツールを作成したり、health dashboardで一元管理したりできるとしている。
OpenAIは2026-03-05のX投稿で、GPT-5.4 ThinkingとGPT-5.4 Proの展開開始を発表した。公式記事では、1M-token context、native computer use、tool search、そしてspreadsheet・document・presentation業務の強化を備えたprofessional-work向けモデルとして位置づけている。
PerplexityはPerplexity Computerをtextだけでなくvoiceでも操作できるようにしたと発表した。進行中のtaskを声で修正し、方向転換できるspoken control loopがwebベースのagent workflowに入った形だ。
AnthropicがシアトルのAIスタートアップVerceptを買収し、Claudeのコンピュータ使用能力を強化すると発表。VerceptのデスクトップAI制御技術とチームがClaude開発に統合される。
Hacker Newsで注目されたFDM-1発表は、1,100万時間規模の映像データを用いたvideo-native computer action学習を提示した。IDMによる自動ラベリングと大規模forking VM評価基盤が技術的な中核とされる。