Claude管理エージェントの不具合、HNが噛みついたのはトークン課金と信頼
Original: Regression: malware reminder on every read still causes subagent refusals View original →
Hacker Newsはこれをありふれたバグ報告として流さなかった。空気はむしろ信頼の破綻に近い。リンク先のGitHub issueによると、Claude Managed Agentsではファイルを読むたびにReadへmalware reminderが差し込まれ、その結果として余計なトークンを消費し、しかも一部のセッションではコード修正そのものを断る。HN投稿者が最初から金の話をしたのは自然だ。まず課金が発生し、そのあと作業が止まるからである。
この件が刺さった理由は細部がかなり具体的だからだ。GitHub issueのタイトル自体が、以前の修正がv2.1.92では効いたのにv2.1.111では維持されなかったと示している。報告された流れも単純だ。エージェントはファイルを読み、マルウェア観点の追加推論を行い、そのファイルがマルウェアではないと判断したあとでも、注入された文言を根拠にコードの補強や記述を拒否する。管理型のコーディングエージェントに期待されるのは静的解析だけではない。なのに安全ラッパーが読むたびに走れば、拒否が出る前から請求だけが膨らむ。
- 問題は単発チャットではなく管理型コーディングセッションで報告された
- 論点はすべての
Readに付くmalware reminderにある - issue報告では無害なコードでも読んだあと編集拒否が起きる
- HN議論はすぐに一件のバグから見えないエージェント原価の話へ広がった
コミュニティ議論が面白かったのは、拒否バグさえ直せば終わりとは見なさなかった点だ。毎回マルウェア確認を入れる設計そのものが、大きいリポジトリでは文脈を太らせ、余計な推論を増やし、処理量を落とすという指摘が続いた。もう一つ繰り返し出たテーマは透明性である。利用者は出力と請求額は見えるが、その間にどの注入プロンプトやtool call、どのharness文言が入ったのかは十分に見えないことが多い。だからこの話は一社の不具合報告を超えて、安全層、課金、エージェントUXが実務でどうぶつかるかを示す例になった。
要点はマルウェア検査が悪いという話ではない。管理型エージェントの制御は利用者が読める形であるべきだ、ということだ。いつガードレールが発火し、いくら余計にかかるのかが読めるなら、チームは追加制約にも耐える。だが無害なコードが無害だと確認するためにトークンを使い、最後には本来頼んだコーディング作業を断るエージェントに、長く金は払わない。 出典リンク: Hacker Newsスレッド, GitHub issue.
Related Articles
Anthropicは2026年3月30日、Claude Codeでcomputer useがresearch previewとして利用可能になったと発表した。Claude Codeのドキュメントによれば、この機能はmacOS上でClaudeがCLIからアプリを開き、UIをクリックし、画面を確認できるようにし、native appのテスト、visual debugging、GUI専用ツールの操作を想定している。
OpenAIが狙っているのは会話品質の小幅改善ではなく、長時間タスクの自動化だ。公開値ではGPT-5.5がTerminal-Bench 2.0で82.7%に達し、GPT-5.4を7.6ポイント上回り、Codexではより少ないトークンで動くとされる。
OpenAIが前に出したのは単なる性能更新ではない。Terminal-Bench 2.0で82.7%、SWE-Bench Proで58.6%を示しつつ、GPT-5.4級のレイテンシーを保つとして、長い作業を任せるコーディングエージェントの基準を押し上げた。
Comments (0)
No comments yet. Be the first to comment!