530점 넘게 오른 관심은 “Claude가 보안 버그를 찾는다”보다, 팀마다 직접 고쳐 쓸 수 있는 harness의 모양에 모였다.
#security
RSS FeedOpenAI는 6월 4일 ChatGPT Lockdown Mode를 모든 로그인 사용자와 워크스페이스에 제공하고, API 생성 요청에는 입력·출력 moderation 점수를 함께 받을 수 있게 했다. AI agent가 외부 서비스에 닿는 시대에 데이터 유출 방어가 제품 기능으로 올라왔다.
LocalLLaMA의 관심은 “AI 도구 취약점”이라는 큰 말보다 FastAPI·Starlette 기반 agent 서버가 실제로 노출돼 있는지에 모였다.
Claude Code와 Cowork 같은 에이전트가 실제 업무 권한을 얻으면서, 위험의 초점은 모델 설득이 아니라 실행 환경 통제로 이동했다. Anthropic은 사용자 승인 프롬프트의 93%가 그대로 통과된다는 수치를 근거로 샌드박스와 격리를 전면에 세웠다.
Megalodon 캠페인은 6시간 동안 5,718개 악성 commit을 5,561개 GitHub 저장소에 밀어 넣었다. 공격자는 애플리케이션 코드보다 GitHub Actions workflow를 노려 cloud credential과 CI secret을 빼내는 구조를 택했다.
npm, PyPI, Crates.io에 걸친 34개 악성 패키지가 지갑 파일, SSH 키, 클라우드 토큰을 노렸다. 더 큰 쟁점은 .cursorrules와 CLAUDE.md까지 건드려 AI 코딩 도구가 공격자의 지시를 읽게 만들려 했다는 점이다.
Reddit의 논점은 공포보다 검증 가능성에 있었다. 마이크·스피커·압축을 통과해 명령이 얼마나 안정적으로 먹히는지가 핵심이다.
Perplexity가 macOS·Linux 개발자 머신을 읽기 전용으로 점검하는 Bumblebee를 오픈소스로 공개했다. npm, PyPI, Go modules, MCP 설정, VS Code 계열 확장, 브라우저 확장까지 한 번에 보는 공급망 대응 도구다.
해커 그룹 TeamPCP가 VS Code 마켓플레이스에 올린 독성 Nx Console 확장(게시 11분 만에 삭제)을 통해 GitHub 직원 PC를 침해하고 내부 저장소 약 3,800개를 탈취했다고 GitHub이 5월 20일 확인했다. 1Password·Anthropic Claude Code·AWS 자격증명이 유출됐으며, 공격자는 5만 달러에 데이터를 판매 시도 중이다.
Valve가 사용자 데이터를 탈취하는 악성코드가 내장된 무료 공포 게임 'Beyond The Dark'를 Steam에서 제거했다. 게임을 설치한 플레이어들의 개인 정보 유출 가능성이 제기됐다.
Cloudflare가 Anthropic의 보안 특화 모델 Mythos Preview를 자사 인프라에 실전 테스트한 결과를 공개했다. Mythos는 개별 저위험 버그들을 연결해 실제로 동작하는 익스플로잇을 생성할 수 있으며, 이는 시니어 보안 연구자 수준의 추론 능력을 보여준다.
리누스 토발즈가 AI 기반 버그 헌팅 도구들이 동일한 취약점 리포트를 대량 중복 생성해 Linux 커널 보안 메일링 리스트가 사실상 관리 불가 상태에 이르렀다고 경고했다. 토발즈는 AI 탐지 버그를 그냥 제출하지 말고 패치를 만들어 진정한 가치를 더하라고 촉구했다.