#aisi - Insights

AI Reddit May 2, 2026 1 min read

GPT-5.5、人間専門家12時間の企業ネットワーク攻撃シミュレーションを11分で完了

英国AI安全機関(AISI)の評価によると、OpenAIのGPT-5.5は人間専門家が最大12時間を要する複雑な多段階企業ネットワーク侵入シミュレーションをわずか11分、1.73ドルで完了した。AnthropicのClaude Mythosに続いて基準を達成した2番目のモデルとなり、AIサイバー能力の向上が業界全体のトレンドである事を示している。

#gpt-5.5 #cybersecurity #openai

LLM Reddit Apr 14, 2026 1 min read

r/singularityが拡散したAISI評価: Claude Mythosはtoy taskではなくmulti-step cyber workflowをつなぎ始めた

r/singularityで広がったAISIの評価は、Claude Mythos Previewがexpert CTFだけでなくmulti-stage cyber rangeでも一段進んだことを示した。重要なのは漠然とした危険論ではなく、32-stepのcorporate attack simulationをend to endで完了した最初のmodelが出たという点だ。

#claude-mythos #aisi #cybersecurity