#ai-safety

AI sources.twitter Feb 25, 2026 1 min read

Anthropicは2026年2月24日、Responsible Scaling Policy(RSP)3.0を公開しました。従来の閾値ベースの安全運用を維持しつつ、Frontier Safety RoadmapとRisk Reportを軸に、透明性と説明責任を強化する構成へ更新しています。

AI Reddit Feb 22, 2026 1 min read

刑事事件の通常業務でGoogle NotebookLMに法執行報告書をアップロードした弁護士が、Gmail、Google Voice番号、写真など全Googleアカウントを停止されました。テキストのみのアップロードにもかかわらず即座のアカウント全体停止が発生し、AIプラットフォームのコンテンツモデレーションの構造的問題を露呈しています。

© 2026 Insights. All rights reserved.