Codex for almost everything、HNはdesktop agentの便利さよりsandboxを見た
Original: Codex for almost everything View original →
HN threadでのCodex for almost everythingは、coding toolの拡張というよりdesktop agentの境界テストとして読まれた。何ができるかという話はすぐに、どこまでcomputerやappを触らせるべきかという話へ移った。
開発者とnon-developerでは見え方が違う。すでにterminal内のCodexでfile edit、test、refactorを回している人は、diffやtoolingで結果を確認できる。一方、GUI agentがcodeやartifactを裏側に隠し、prompt interactionだけを前面に置く流れには不安が出た。実体のあるcodeが「途中のruntime」のように扱われると、開発者は便利さよりcontrol lossを感じやすい。
HNが最も強く反応したのはsandboxだった。desktop agentがSlack、browser、file system、design toolを横断すると、便利さとリスクは同じaccessから生まれる。sensitive fileを読むのか、permission promptはどれくらい細かいのか、local machineで実行されるactionをどこまで隔離するのか。demoでは一瞬で流れる部分こそ、実運用では中心問題になる。
もちろん懐疑だけではない。長年CLIを使ってきたユーザーが、以前なら自分で打っていたterminal作業を最近はCodexに頼むようになった、と書いていた。十分にrobustなGUI agentができれば、複数appをまたぐ細かな操作を減らせる。software engineerだけでなく、computer操作そのものを自然語workflowに変える可能性はある。
それでもthreadの重心は慎重だ。「everything」に近づくほど、必要なのはmodel能力だけではない。action log、限定されたpermission、簡単なrollback、そしてsandboxが特別設定ではなく普通に感じられるdefaultが要る。HNはdesktop agentを拒んでいるのではない。広いaccessを与えても安心できるproduct architectureを求めている。
Related Articles
MIT Open Agentic Web conferenceの参加者まとめがr/artificialで響いたのは、agentを高性能chatbotではなくnetwork participantとして捉えているからだ。6つの論点はidentity、coordination、data provenance、そしてautonomy theaterよりexpert leverageのほうが機能しているという見立てに集中している。
OpenAIはMarch 31, 2026、$122 billionの資金調達を完了し、post-money valuationは$852 billionになったと発表した。今回の資金はcompute expansion、enterprise growth、ChatGPT・Codex・agent workflowsを束ねるunified AI superapp戦略の加速に充てられる。
Hacker NewsではAnthropicのClaude Mythos Preview system cardをきっかけに、抽象的なAI riskよりも exploit capability と sandbox・least-privilege 設計の現実をめぐる議論が前面に出た。
Comments (0)
No comments yet. Be the first to comment!