OpenAI, 더 빠른 coding·subagent용 GPT-5.4 mini·nano 출시
Original: Introducing GPT‑5.4 mini and nano View original →
OpenAI는 March 17, 2026 자사 소형 모델 라인업을 확장하며 GPT-5.4 mini와 GPT-5.4 nano를 발표했다. 회사는 두 모델을 GPT-5.4의 강점을 더 빠르고 효율적인 형태로 옮긴 "most capable small models yet"라고 설명했다. 핵심 메시지는 분명하다. 대규모 reasoning이 항상 가장 큰 모델에서만 돌아갈 필요는 없으며, high-volume workload에서는 latency와 cost가 제품 경험을 좌우한다는 것이다.
공개된 수치에서 가장 눈에 띄는 모델은 GPT-5.4 mini다. OpenAI에 따르면 이 모델은 GPT-5 mini보다 2x 이상 빠르게 동작하면서 coding, reasoning, multimodal understanding, tool use 전반에서 개선됐다. benchmark에서도 차이가 분명하다. SWE-Bench Pro (Public)는 54.4%로 GPT-5 mini의 45.7%를 앞섰고, Terminal-Bench 2.0은 60.0% 대 38.2%, Toolathlon은 42.9% 대 26.9%를 기록했다. computer use 관련 OSWorld-Verified에서도 72.1%로 GPT-5 mini의 42.0%보다 높았다.
작은 모델을 실제 workflow에 넣으려는 의도
OpenAI는 mini를 단순한 저가형 fallback이 아니라 subagent workload를 맡는 실전용 모델로 배치하고 있다. 발표문은 Codex에서 더 큰 모델이 계획과 최종 판단을 맡고, GPT-5.4 mini subagents가 codebase search, large file review, supporting document processing 같은 좁은 작업을 병렬로 처리하는 구조를 직접 제시했다. 이런 설명은 OpenAI가 작은 모델을 cost-saving 옵션이 아니라 agent system의 운영 단위로 보고 있음을 보여준다.
GPT-5.4 nano는 더 공격적으로 speed와 price에 맞춰졌다. OpenAI는 nano를 classification, data extraction, ranking, 그리고 더 단순한 coding subagents에 권장한다고 밝혔다. 동시에 이 모델도 GPT-5 nano 대비 의미 있는 업그레이드라고 설명했다. 공개 benchmark에서 nano는 SWE-Bench Pro (Public) 52.4%, Toolathlon 35.5%, GPQA Diamond 82.8%를 기록했다. 가장 작은 라인업이지만 단순한 룰 기반 보조기가 아니라, 일정 수준의 coding·tool use·reasoning을 감당하는 작업자 모델로 위치가 잡혀 있다.
배포 범위와 가격
배포 전략도 뚜렷하다. GPT-5.4 mini는 API, Codex, ChatGPT에 즉시 제공되며 400k context window를 지원한다. API에서는 text와 image input, tool use, function calling, web search, file search, computer use, skills를 지원하고 입력 1M token당 $0.75, 출력 1M token당 $4.50으로 책정됐다. Codex에서는 GPT-5.4 quota의 30%만 사용한다. 반면 GPT-5.4 nano는 API 전용이며 입력 1M token당 $0.20, 출력 1M token당 $1.25다.
이번 발표는 작은 모델 전략이 단순한 경량화 경쟁을 넘어섰음을 보여준다. OpenAI는 responsive coding assistant, computer use system, multimodal app, subagent orchestration 같은 실전 시나리오에 맞춰 model mix를 세분화하고 있다. 비용과 속도 때문에 작은 모델을 고르는 것이 아니라, 빠른 반응성과 충분한 tool competence가 필요한 제품에는 작은 모델이 더 적합하다는 메시지를 전면에 내세운 셈이다.
Related Articles
OpenAI가 2026년 3월 17일 GPT-5.4 mini와 nano를 공개했다. 회사는 두 모델을 coding, tool use, multimodal reasoning, high-volume subagent workload에 맞춘 저지연 소형 모델로 설명했다.
OpenAI는 2026년 3월 17일 X에서 GPT-5.4 mini가 ChatGPT, Codex, API에 출시됐다고 밝혔다. 회사는 mini를 더 빠른 coding과 multimodal 작업용 모델로 소개했고, 함께 공개한 공식 글에서는 API 전용 GPT-5.4 nano도 추가했다.
OpenAI Developers는 X에서 GPT-5.4 mini와 nano가 개발자 워크플로우용 GPT-5.4 계열에 합류한다고 밝혔다. OpenAI는 mini를 API·Codex·ChatGPT용 고속 coding·tool-use 모델로, nano를 더 가벼운 API 작업용 최저가 옵션으로 포지셔닝하고 있다.
Comments (0)
No comments yet. Be the first to comment!