Fable 5停止、論点は「狭いjailbreak」で商用モデルを止める基準
Original: Statement on US government directive to suspend access to Fable 5 and Mythos 5 View original →
AnthropicがFable 5とMythos 5へのアクセス停止を発表し、Hacker Newsでは週末最大級のAI議論になった。焦点は単なるサービス停止ではない。政府がfrontier modelの提供を止めるには、どの程度の技術的根拠と手続きが必要なのかという問題だ。
同社によると、米政府は国家安全保障上の権限に基づき、外国籍の人物によるFable 5とMythos 5へのアクセス停止を指示した。外国籍のAnthropic従業員も対象に含まれる。Anthropicは遵守のため、両モデルを全顧客向けに停止する必要があるとしている。他のモデルは影響を受けない。
技術面の争点はjailbreakの性質にある。Anthropicは、問題視されたものを狭いnon-universal jailbreakと説明し、特定のコードベースを読ませて脆弱性を修正させる程度のものだと位置づける。その能力はFableやMythos固有ではなく、他の公開モデルでも一般に可能だという主張だ。
HNの議論は、AI安全性と行政手続きの境界を掘り下げた。Anthropicも危険な展開を政府が止められる仕組み自体は否定していない。ただし、その仕組みは透明で、公正で、技術的事実に根ざしているべきだという立場を示している。
今回の件は前例になり得る。狭い回避手法の疑いだけで大規模な商用モデルを止める基準ができれば、frontier modelの公開リスクは大きく変わる。一方で政府対応が遅れれば、実害が拡大する可能性もある。難しいのは、その中間にある手続きの設計だ。
出典: Anthropic statement. HN議論: item 48511072.
Related Articles
Claude Corpsは、1,000人のearly-career fellowsを400以上のnonprofitへ12カ月配置する$150m規模の取り組みだ。AI導入をモデル提供ではなく現場の人材投資として扱う。
Anthropicが2028年のグローバルAIリーダーシップに関する2つのシナリオを示す論文を公開した。従来のAGI安全研究ではなく、半導体輸出規制と米中競争を中心とした地政学的警告文として注目を集めている。
AnthropicはAI政策レポートを発表し、民主主義国家が2028年までに中国に対するAI優位性を確保する必要性を強調した。AIを地政学的な戦略資産と位置づけ、官民協力を求めている。