Anthropic는 Mar 6, 2026, Claude가 식별한 취약점에 적용할 disclosure policy를 공개했다. 기본 공개 시한은 90일이고, actively exploited critical bug에는 7일 대응 목표와 human review 요건을 둔다.
#security
Anthropic는 2026년 3월 6일 Mozilla와의 협업을 통해 Claude Opus 4.6이 2주 동안 Firefox 취약점 22건을 찾아냈고, 이 중 14건이 고위험군이라고 밝혔다. 공개된 설명은 프런티어 모델이 벤치마크를 넘어 실제 취약점 발굴에도 의미 있는 성과를 내기 시작했음을 시사한다.
Anthropic은 2026년 3월 5일 성명을 통해 Department of War의 공급망 리스크 지정 통보를 받았다고 밝혔다. 회사는 조치의 적용 범위가 제한적이라고 설명하면서도 법적 대응과 전환 지원을 병행하겠다고 했다.
r/artificial에서 공유된 Ars Technica 보도는 LLM 기반 비식별 해제 연구를 조명했다. 논문은 최대 68% recall, 최대 90% precision을 보고하며, 기존 고전적 deanonymization 대비 성능 우위를 주장한다.
Cloud Imperium Games는 January 21, 2026 공격으로 일부 백업 시스템이 읽기 전용으로 노출됐다고 밝혔다. 회사는 비밀번호·결제정보는 영향이 없었고, 현재 공개 유출 정황은 확인되지 않았다고 설명했다.
2026년 2월 28일 HN 토론은 NanoClaw 보안 모델을 중심으로, untrusted-agent 전제를 둔 container isolation과 실행 권한 최소화 원칙을 집중 조명했다.
OpenAI와 Paradigm이 스마트컨트랙트 취약점 탐지·패치·익스플로잇 능력을 평가하는 EVMbench를 발표했다. GPT-5.3-Codex는 exploit 모드에서 72.2%를 기록해 GPT-5의 31.9% 대비 큰 격차를 보였다.
Hacker News 상위권에 오른 Truffle Security 분석은, 공개용으로 배포되던 Google API key가 Gemini API 활성화 이후 민감 권한으로 전환될 수 있다고 주장한다. 글은 2,863개 live key 사례와 대응 체크리스트를 함께 제시했다.
OpenAI가 AI 에이전트가 고위험 스마트 컨트랙트 취약점을 탐지·익스플로잇·패치하는 능력을 측정하는 새로운 벤치마크 EVMbench를 출시했습니다.
OpenAI가 AI 에이전트가 고위험 스마트 컨트랙트 취약점을 탐지·익스플로잇·패치하는 능력을 측정하는 새로운 벤치마크 EVMbench를 출시했습니다.
OpenAI가 AI 에이전트가 고위험 스마트 컨트랙트 취약점을 탐지·익스플로잇·패치하는 능력을 측정하는 새로운 벤치마크 EVMbench를 출시했습니다.
연구진이 AI가 생성한 가짜 얼굴이 실제 사람 얼굴보다 더 '진짜 같아' 보이는 수준에 도달했다고 경고했다. 이는 딥페이크 탐지와 디지털 신뢰 기반에 심각한 위협을 제기한다.