Codex for almost everything、HNはdesktop agentの便利さよりsandboxを見た

HN threadでのCodex for almost everythingは、coding toolの拡張というよりdesktop agentの境界テストとして読まれた。何ができるかという話はすぐに、どこまでcomputerやappを触らせるべきかという話へ移った。

開発者とnon-developerでは見え方が違う。すでにterminal内のCodexでfile edit、test、refactorを回している人は、diffやtoolingで結果を確認できる。一方、GUI agentがcodeやartifactを裏側に隠し、prompt interactionだけを前面に置く流れには不安が出た。実体のあるcodeが「途中のruntime」のように扱われると、開発者は便利さよりcontrol lossを感じやすい。

HNが最も強く反応したのはsandboxだった。desktop agentがSlack、browser、file system、design toolを横断すると、便利さとリスクは同じaccessから生まれる。sensitive fileを読むのか、permission promptはどれくらい細かいのか、local machineで実行されるactionをどこまで隔離するのか。demoでは一瞬で流れる部分こそ、実運用では中心問題になる。

もちろん懐疑だけではない。長年CLIを使ってきたユーザーが、以前なら自分で打っていたterminal作業を最近はCodexに頼むようになった、と書いていた。十分にrobustなGUI agentができれば、複数appをまたぐ細かな操作を減らせる。software engineerだけでなく、computer操作そのものを自然語workflowに変える可能性はある。

それでもthreadの重心は慎重だ。「everything」に近づくほど、必要なのはmodel能力だけではない。action log、限定されたpermission、簡単なrollback、そしてsandboxが特別設定ではなく普通に感じられるdefaultが要る。HNはdesktop agentを拒んでいるのではない。広いaccessを与えても安心できるproduct architectureを求めている。

Codex for almost everything、HNはdesktop agentの便利さよりsandboxを見た

Related Articles

Claudeエージェントの安全策、プロンプトから隔離設計へ

AI agentの詰まりはGPUだけではない、NVIDIA VeraがCPU側を1.8倍へ

Codex役割別プラグイン、62アプリと110スキルで業務エージェント範囲を本格拡大する新しい展開へ