GPT-5.5에 HN 들썩, 관건은 "끝까지 가는가"
Original: GPT-5.5 View original →
HN이 본 포인트는 "더 똑똑한가"가 아니라 "끝까지 해내는가"
HN에서 GPT-5.5 글이 빠르게 올라간 이유는 숫자 자체보다도, 실제로 컴퓨터 앞에서 맡긴 일을 끝까지 밀어붙일 수 있느냐는 기대 때문이었다. 댓글 흐름도 비슷했다. 코딩 성능이 얼마나 올랐는지보다 롤아웃 속도, API 시점, 보안 작업에 바로 써볼 수 있는지 같은 운영 현실에 반응이 몰렸다.
OpenAI 설명을 보면 GPT-5.5는 코딩, 온라인 조사, 데이터 분석, 문서 작성, 소프트웨어 조작처럼 여러 단계를 오가는 작업에서 GPT-5.4보다 높은 완성도를 노린 모델이다. Terminal-Bench 2.0 82.7%, OSWorld-Verified 78.7%, GDPval wins or ties 84.9%, CyberGym 81.8% 같은 수치도 붙었다. 중요한 지점은 속도다. 더 큰 모델인데도 GPT-5.4와 비슷한 토큰 지연을 유지했고, 같은 Codex 작업을 더 적은 토큰으로 끝내는 쪽에 초점이 맞춰졌다.
HN 토론이 재미있었던 건 이 모델을 또 하나의 대형 출시로 읽지 않았다는 점이다. 한 댓글은 점진적 롤아웃을 짚었고, 다른 댓글은 아직 API가 열리지 않았다는 점을 아쉬워했다. 또 다른 반응은 Mythos 같은 보안 특화 모델과 비교하면서, GPT-5.5가 공격·방어 실험에도 바로 의미 있는지 시험해보겠다는 쪽이었다. 커뮤니티가 본 건 홍보 문구보다 작업 흐름 변화였다.
- 긴 작업을 중간에 멈추지 않고 이어가는가
- 도구 사용과 검증을 스스로 반복하는가
- API, 가격, 배포 일정이 실제 도입 속도를 막지 않는가
그래서 HN의 온도는 단순한 환호와는 조금 달랐다. 성능 점프는 인정하면서도, 결국 판단 기준은 내 워크플로에 바로 들어오느냐였다. GPT-5.5는 모델 자체보다 에이전트형 작업을 어디까지 믿고 넘길 수 있는지, 그 기준선을 한 단계 올린 사례로 읽혔다.
Related Articles
중요한 점은 OpenAI가 GPT-5.5를 단순 채팅 업그레이드가 아니라 agent workflow의 핵심 모델로 배치했다는 데 있다. 메인 트윗 2분 뒤 OpenAI Developers는 ChatGPT와 Codex 적용을 확인했고 API 제공도 뒤따른다고 적었다.
OpenAI는 Codex를 매주 300만 명이 넘는 developers가 쓰고 있다고 밝히며, desktop app을 code editor 밖으로 확장했다. 이번 update에는 macOS background computer use, in-app browser, gpt-image-1.5 image generation, 90개+ plugins, PR review workflow, SSH devboxes alpha, automations, memory preview가 포함됐다.
이건 단순한 이용자 숫자 기사가 아니라 유통 전략 기사에 가깝다. OpenAI는 4월 초 주간 개발자 300만명 이상이던 Codex가 2주 만에 400만명을 넘겼고, 이 수요를 Codex Labs와 7개 GSI 파트너 체제로 받아내겠다고 했다.
Comments (0)
No comments yet. Be the first to comment!