HNで注目されたのは「Claudeがバグを見つける」話だけでなく、各チームが自分の対象に合わせて作り替えるharnessの形だった。
#security
RSS FeedOpenAIは6月4日、ChatGPTのLockdown Modeを全ログインユーザーとワークスペースに提供し、API生成リクエストでは入力・出力のmoderationスコアを同じ応答で受け取れるようにした。prompt injection対策が製品機能として見える位置に出てきた。
LocalLLaMAでは、抽象的なAI脆弱性の話より、FastAPI・Starlette系のagentサーバーが外部公開されていないかに関心が集まった。
Claude CodeやCoworkが実作業の権限を持つほど、リスク管理は説得文ではなく実行環境の制御に寄る。Anthropicは、Claude Codeの権限プロンプトが約93%承認されていたと明かした。
Megalodonは約6時間で5,718件の悪性commitを5,561件のGitHub repositoryに投入した。狙われたのはアプリ本体だけではなく、cloud credentialやCI secretを持つGitHub Actions workflowだった。
TrapDoorは5月22日以降、npm、PyPI、Crates.ioに34個超の悪性パッケージを広げた。注目点は認証情報の窃取だけでなく、.cursorrulesやCLAUDE.mdを使ってAIコーディング支援ツールまで攻撃経路に入れたことだ。
Redditの議論は恐怖より検証可能性に向かった。マイク、スピーカー、圧縮を通って命令が安定して届くかが焦点だ。
PerplexityはmacOS・Linux向けの読み取り専用スキャナーBumblebeeをオープンソース化した。危険なパッケージ、MCP設定、エディタ拡張、ブラウザ拡張を、パッケージマネージャーを起動せずに確認する。
Githubは2026年5月20日、社内エンジニアがVS Codeマーケットプレイスに掲載されていた毒入り拡張「Nx Console」(公開からわずか11分で削除)をインストールしたことで、内部リポジトリ約3,800件が流出したと公式に認めた。脅威グループTeamPCPが犯行を認めており、1Password・Claude Code・AWSなどの認証情報が窃取されたとみられる。
Valveは、ユーザーデータを盗むマルウェアが含まれていた無料ホラーゲーム「Beyond The Dark」をSteamから削除した。ゲームをダウンロードしたプレイヤーは個人情報漏洩の可能性がある。
CloudflareがProject GlasswingでAnthropicのセキュリティ特化モデルMythos Previewを自社インフラに実戦テスト。Mythosは複数の低深刻度バグを連結して実際に動作するエクスプロイトを生成でき、シニアセキュリティ研究者レベルの推論能力を示した。
Linus Torvalds氏がAI搭載の脆弱性発見ツールによる重複バグレポートの洪水がLinuxカーネルセキュリティメーリングリストを管理不能な状態にしていると警告。AI検出バグは定義上秘密ではないとして、レポートだけでなくパッチを作成するよう研究者に求めた。