Skip to content

ChatGPT Lockdown Mode 전면 적용… prompt injection 방어가 기본 논점으로

Original: Release notes View original →

Read in other languages: English日本語
LLM Jun 6, 2026 By Insights AI 1 min read Source

AI agent가 웹, 파일, 외부 서비스에 접근할수록 보안 설정은 부가 기능이 아니라 기본 설계 문제가 된다. OpenAI는 2026년 6월 4일 release notes에서 ChatGPT Lockdown Mode를 모든 로그인 사용자와 워크스페이스에 제공한다고 밝혔다. 같은 날 API 쪽에는 Responses API와 Chat Completions API의 generation request에서 moderation 점수를 함께 받을 수 있는 기능도 추가됐다.

Lockdown Mode는 prompt injection으로 인한 데이터 유출 위험을 낮추기 위한 선택형 고급 보안 설정이다. 이 모드를 켜면 ChatGPT는 live web browsing, deep research, agent mode, file downloads, 일부 웹 기반 이미지 지원처럼 네트워크와 외부 서비스에 닿는 기능을 제한한다. 개인 사용자는 Settings > Security에서 켤 수 있고, 워크스페이스 관리자는 멤버 접근을 역할 기반으로 설정할 수 있다.

개발자 쪽 변화도 작지 않다. OpenAI는 generation request에 moderation 객체를 넘기면 모델 입력과 생성 출력에 대한 moderation 결과를 같은 응답에서 받을 수 있다고 설명했다. 별도 검사 호출을 붙이는 방식보다 애플리케이션 흐름 안에서 위험 점수를 다루기 쉬워진다. 특히 사용자 입력, 도구 호출, 모델 출력이 빠르게 이어지는 agent형 앱에서는 지연과 누락이 곧 보안 구멍이 된다.

이번 업데이트는 화려한 모델 성능 경쟁보다 현실적인 운영 문제에 가깝다. 기업은 모델이 무엇을 할 수 있는지만 보지 않고, 어떤 경로를 닫고 어떤 위험 점수를 남길 수 있는지 묻기 시작했다. 다음 관전 포인트는 Lockdown Mode 같은 제한 설정이 선택형으로 남을지, 고위험 워크스페이스와 규제 산업에서 기본값으로 요구될지다.

Share: Long

Related Articles