동일한 어드민 패널 작업을 비전 에이전트와 구조화된 API 에이전트로 비교한 결과, 비전 방식이 약 45배 비쌌다. 비전 에이전트는 상세 가이드 없이 작업 완료에도 실패했다.
#computer-use
RSS FeedHN이 좋아한 건 해킹 감성 자체보다 인프라였다. Cua의 macOS background driver는 에이전트가 다른 앱에서 일하는 동안 커서와 포커스, Space를 그대로 두는 쪽에 방점을 찍었다.
felixrieseberg는 2026년 3월 17일 X에서 Claude Cowork의 research preview 기능인 Dispatch를 소개하며, desktop에서 계속 실행되는 하나의 persistent Claude conversation을 phone에서도 이어갈 수 있다고 설명했다. 이어 Anthropic은 3월 23일 Claude Cowork와 Claude Code에 computer use를 추가해 Dispatch가 local files, connectors, plugins, 그리고 desktop apps까지 활용하는 cross-device workflow가 된다고 밝혔다.
Anthropic는 2026년 3월 30일 Claude Code에 computer use가 research preview로 추가됐다고 밝혔다. Claude Code 문서에 따르면 이 기능은 macOS에서 Claude가 CLI 안에서 앱을 열고 UI를 클릭하며 화면을 확인할 수 있게 해 native app 테스트, visual debugging, GUI 전용 도구 자동화 같은 작업을 겨냥한다.
Anthropic는 2026년 2월 25일 Vercept를 인수해 Claude의 computer use capability를 강화한다고 밝혔다. 회사는 이번 거래를 Sonnet 4.6의 OSWorld 72.5% 성과와 live application 안에서 행동하는 agent 전략의 연장선으로 설명했다.
r/singularity는 Anthropic의 Dispatch + computer use 출시를 phone-first AI coworker로 가는 실제 product shift로 읽었다. 동시에 macOS-only rollout과 screen-driven automation의 한계도 함께 짚었다.
Perplexity는 2026년 3월 19일 Perplexity Computer가 health apps, wearable devices, lab results, medical records와 연결된다고 밝혔다. 회사는 사용자가 해당 데이터를 기반으로 개인화 도구를 만들거나 health dashboard에서 통합 추적할 수 있다고 설명했다.
OpenAI는 2026-03-05 X 게시물에서 GPT-5.4 Thinking과 GPT-5.4 Pro의 순차 배포를 알렸다. 공식 글은 GPT-5.4를 1M-token context, native computer use, tool search, 그리고 spreadsheet·document·presentation 작업 강화를 갖춘 professional-work 모델로 설명한다.
Perplexity는 이제 Perplexity Computer를 텍스트뿐 아니라 음성으로도 조종할 수 있다고 밝혔다. 진행 중인 작업을 말로 수정하고 방향을 바꾸는 spoken control loop가 web 기반 agent workflow에 들어온 셈이다.
Anthropic는 2026년 2월 25일 Vercept 인수를 발표하며 Claude의 computer use 기능 고도화를 목표로 제시했다. 발표문에서 Anthropic는 Sonnet 4.6의 OSWorld 지표 개선과 Vercept 외부 제품 종료 계획을 함께 언급했다.
Hacker News에서 주목받은 FDM-1 발표는 1,100만 시간 규모 비디오 데이터와 video-native 학습으로 장기 컴퓨터 작업을 수행하는 범용 action 모델을 제시했다. 데이터 라벨링 자동화(IDM)와 대규모 forking VM 평가 인프라가 핵심 축으로 제시됐다.