Codex for almost everything、HNはdesktop agentの便利さよりsandboxを見た
Original: Codex for almost everything View original →
HN threadでのCodex for almost everythingは、coding toolの拡張というよりdesktop agentの境界テストとして読まれた。何ができるかという話はすぐに、どこまでcomputerやappを触らせるべきかという話へ移った。
開発者とnon-developerでは見え方が違う。すでにterminal内のCodexでfile edit、test、refactorを回している人は、diffやtoolingで結果を確認できる。一方、GUI agentがcodeやartifactを裏側に隠し、prompt interactionだけを前面に置く流れには不安が出た。実体のあるcodeが「途中のruntime」のように扱われると、開発者は便利さよりcontrol lossを感じやすい。
HNが最も強く反応したのはsandboxだった。desktop agentがSlack、browser、file system、design toolを横断すると、便利さとリスクは同じaccessから生まれる。sensitive fileを読むのか、permission promptはどれくらい細かいのか、local machineで実行されるactionをどこまで隔離するのか。demoでは一瞬で流れる部分こそ、実運用では中心問題になる。
もちろん懐疑だけではない。長年CLIを使ってきたユーザーが、以前なら自分で打っていたterminal作業を最近はCodexに頼むようになった、と書いていた。十分にrobustなGUI agentができれば、複数appをまたぐ細かな操作を減らせる。software engineerだけでなく、computer操作そのものを自然語workflowに変える可能性はある。
それでもthreadの重心は慎重だ。「everything」に近づくほど、必要なのはmodel能力だけではない。action log、限定されたpermission、簡単なrollback、そしてsandboxが特別設定ではなく普通に感じられるdefaultが要る。HNはdesktop agentを拒んでいるのではない。広いaccessを与えても安心できるproduct architectureを求めている。
Related Articles
Claude CodeやCoworkが実作業の権限を持つほど、リスク管理は説得文ではなく実行環境の制御に寄る。Anthropicは、Claude Codeの権限プロンプトが約93%承認されていたと明かした。
NVIDIA Veraはfull productionに入り、x86 CPU比でtask completionを1.8倍にすると説明された。OpenAI、Anthropic、SpaceXAI、ByteDance、CoreWeave、OCIなどが採用・評価先として挙がる。
Codexは開発支援から職種別workflowの表面へ広がっている。OpenAIは新pluginに62アプリと110スキルを束ね、Business・Enterprise向けSites previewも始めた。