AI Apr 23, 2026 1 min read
OpenAIが今回お金をかけたのは、もっとも厄介な失敗形だ。GPT-5.5 Bio Bug Bountyは、Codex Desktop上のGPT-5.5でバイオ安全性の5問すべてを一度に破る万能プロンプトに$25,000を設定し、正式テストを4月28日に始める。
OpenAIが今回お金をかけたのは、もっとも厄介な失敗形だ。GPT-5.5 Bio Bug Bountyは、Codex Desktop上のGPT-5.5でバイオ安全性の5問すべてを一度に破る万能プロンプトに$25,000を設定し、正式テストを4月28日に始める。
520ポイント、132コメントを集めたHacker Newsのスレッドで、Berkeleyの研究者は8つの主要AI agent benchmarkが実タスクを解かなくてもharnessの弱点で高得点化できると主張した。
Anthropicは2026年4月7日に Claude Mythos Preview の security 評価を公開し、major OS と browser 全体での zero-day 発見と exploit 化能力を強調した。Hacker News では、frontier LLM の進歩が defensive tooling と offensive risk を同時に押し上げる転換点として受け止められている。
OpenAIはMarch 9, 2026にPromptfoo買収計画を発表した。Promptfooのsecurity testingとevaluation技術をOpenAI Frontierへ統合し、prompt injection、jailbreak、data leak、tool misuseなどのenterprise riskを開発段階から扱えるようにする方針だ。