Skip to content
AI Reddit May 2, 2026 1 min read

英国AI安全機関(AISI)の評価によると、OpenAIのGPT-5.5は人間専門家が最大12時間を要する複雑な多段階企業ネットワーク侵入シミュレーションをわずか11分、1.73ドルで完了した。AnthropicのClaude Mythosに続いて基準を達成した2番目のモデルとなり、AIサイバー能力の向上が業界全体のトレンドである事を示している。

LLM Reddit Apr 14, 2026 1 min read

r/singularityで広がったAISIの評価は、Claude Mythos Previewがexpert CTFだけでなくmulti-stage cyber rangeでも一段進んだことを示した。重要なのは漠然とした危険論ではなく、32-stepのcorporate attack simulationをend to endで完了した最初のmodelが出たという点だ。