GPT-5.5 API 공개에 HN 들썩, 성능보다 먼저 나온 가격·태도 논쟁
Original: OpenAI releases GPT-5.5 and GPT-5.5 Pro in the API View original →
HN은 GPT-5.5를 환영 배너보다 시험대에 먼저 올렸다. 출발점은 OpenAI API changelog였지만 대화는 곧바로 실전 사용기로 넘어갔다. OpenAI는 GPT-5.5와 GPT-5.5 Pro를 API에 넣었고, HN 사용자들은 그 순간부터 editor와 agent 안에서 바로 눌러봤다. 새 모델 소개보다 지금 업무에 넣으면 어디서 좋아지고 어디서 삐끗하나가 먼저 화제가 됐다.
가장 날카로운 반응은 benchmark가 아니라 태도였다. 한 개발자는 production 이슈를 따라가던 중 트랜잭션과 rollback을 명시해 달라고 하자 모델이 뼈대만 남긴 SQL을 내놨다고 적었다. 다른 사용자는 WordPress와 Gravity Forms 기준의 자체 benchmark에서 성능 대비 값이 너무 약하다고 지적했다. 반대로 지능 자체는 매우 높고 속도도 빨라졌다는 평가도 있었다. 문제는 그 지능이 긴 수정 루프, editor integration, 실제 코드 변경까지 그대로 이어지느냐였다.
가격도 바로 논쟁거리가 됐다. HN은 컨텍스트 길이별 토큰 요금을 꺼내 Claude Opus와 비교했고, 큰 창에서 요금이 뛰는 만큼 체감 효율이 나오느냐를 따졌다. 작은 쟁점 같지만 신뢰와 연결된 질문도 있었다. OpenAI가 API 배포에는 추가 안전장치가 필요하다고 말한 직후 거의 바로 공개한 흐름을 두고, 사용자는 실제 운영 준비가 어디까지 끝난 것인지 궁금해했다. HN은 출시 문구보다 비용, 제한, 배포 타이밍이 실제 경험과 맞아떨어지는지를 더 중하게 봤다.
그래서 이 스레드는 신제품 축하회가 아니었다. HN이 본 GPT-5.5는 트로피 모델이 아니라 곧바로 요금서와 프롬프트로 검증해야 하는 비싼 도구였다. 분위기도 단순 찬반이 아니었다. 좋다면 왜 좋은지, 비싸다면 어디서 비싼지, 코딩 모델로 매일 쓸 수 있다면 어떤 증거가 필요한지를 따지는 쪽에 더 가까웠다. 출처는 OpenAI API changelog와 HN 토론이다.
Related Articles
OpenAI가 겨냥한 지점은 채팅이 아니라 장기 작업 자동화다. 공개 수치 기준으로 GPT-5.5는 Terminal-Bench 2.0에서 82.7%를 기록해 GPT-5.4보다 7.6%p 높았고, Codex에서는 더 적은 토큰으로 같은 일을 밀어붙인다고 적었다.
중요한 점은 GPT-5.5 출시 직후 나온 첫 외부 benchmark readout 가운데 하나라는 점이다. Artificial Analysis는 GPT-5.5가 자사 Intelligence Index에서 3점 차 선두로 올라섰지만 전체 지수 실행 비용은 여전히 약 20% 비싸졌다고 적었다.
OpenAI가 내세운 핵심은 단순 성능 업데이트가 아니다. Terminal-Bench 2.0 82.7%, SWE-Bench Pro 58.6%와 함께 GPT-5.4급 지연을 유지한다고 밝히며, 길고 지저분한 작업을 맡기는 코딩 에이전트 경쟁의 기준을 다시 올렸다.
Comments (0)
No comments yet. Be the first to comment!