OpenAI GPT-5.5 가동, Terminal-Bench 82.7%로 Codex 장기 작업 상향

Original: Introducing GPT-5.5. A new class of intelligence for real work and powering agents, built to understand complex goals, use tools, check its work, and carry more tasks through to completion. It marks a new way of getting computer work done. Now available in ChatGPT and Codex. View original →

Read in other languages: English 日本語

LLM Apr 25, 2026 By Insights AI 1 min read 28 views Source

OpenAI는 4월 23일 원문 트윗에서 GPT-5.5를 실무용 지능의 새 단계로 규정했다. 핵심은 채팅 답변 품질이 아니다. 복잡한 목표를 오래 붙들고, 도구를 쓰고, 자기 결과를 다시 확인하면서 작업을 끝까지 끌고 가는 모델이라는 점이다. 투입 대상도 ChatGPT와 Codex로 나뉘었고, 더 어려운 문제를 겨냥한 GPT-5.5 Pro도 함께 붙었다.

공식 소개 페이지에선 수치가 더 선명하다. Terminal-Bench 2.0에서 82.7%로 GPT-5.4의 75.1%를 넘었고, 장기 코딩 평가인 Expert-SWE에서도 73.1%를 기록했다. OpenAI는 동시에 GPT-5.4와 같은 토큰당 지연 시간을 유지하면서 Codex 작업에는 더 적은 토큰을 쓴다고 적었다. 이 조합이 중요한 이유는 단순하다. 에이전트가 재시도와 대기 시간에 덜 묶인 채 더 긴 일을 맡을 수 있기 때문이다.

계정 맥락도 분명하다. 메인 OpenAI 계정은 대형 제품 투입을 올리는 창구이고, @OpenAIDevs는 API와 개발자 후속 정보를 붙이는 역할을 맡는다. 이번에도 그런 이중 구조가 보였다. 메인 트윗이 방향을 던졌고, 개발자 계정이 API 반영과 토큰 효율을 보강했다. 소개 페이지에 따르면 Codex에서는 400K 컨텍스트도 제공된다. 짧은 질의응답보다 실제 컴퓨터 작업을 겨냥한 릴리스라는 뜻이다.

이제 볼 지점은 외부 검증이다. 사내 벤치마크의 격차가 실제 저장소, 브라우저 자동화, 내부 리서치 워크플로에서도 그대로 재현되는지가 중요하다. 가격 대비 성능도 같이 봐야 한다. 지연 시간은 유지하고 토큰 사용량까지 줄인다면, 기업이 에이전트에게 넘기는 작업의 기준선이 바뀔 수 있다. 반대로 대규모 실사용에서 효율이 무너지면 이번 출시의 의미는 훨씬 작아진다.

LLM X/Twitter Jul 10, 2026 1 min read

GPT-5.6 Sol, ChatGPT·Codex·API 전면 배포와 80.0 coding agent 지표

OpenAI가 GPT-5.6 Sol·Terra·Luna를 ChatGPT, Codex, API에 풀기 시작했다. 스레드에는 Coding Agent Index 80.0, Claude Fable 5 대비 +2.8점, 비용 약 3분의 1 절감이라는 비교가 함께 제시됐다.

#openai #gpt-5-6 #codex

LLM X/Twitter 2d ago 1 min read

ChatGPT Voice, 데스크톱에서 Codex와 다중 agent 제어까지 확장한 음성 작업 방식

ChatGPT Voice가 macOS와 Windows 데스크톱 앱에 들어오며 음성만으로 Codex와 ChatGPT Work의 여러 agent를 조율할 수 있게 됐다. 조회수 260만 회를 넘긴 이 트윗은 음성 인터페이스가 단순 대화에서 작업 실행 계층으로 이동하는 신호다.

#openai #chatgpt #voice

LLM X/Twitter Mar 16, 2026 1 min read

OpenAI, Codex에 subagents 도입… 병렬·전문화 워크플로우 전면화

OpenAIDevs는 2026년 3월 16일 Codex에 subagents가 추가됐다고 밝혔다. 이 기능은 메인 context를 가볍게 유지하면서 specialized agent에 작업을 병렬 분산하고, 실행 중인 각 thread를 따로 steer할 수 있게 해주며, 공식 문서에는 PR review와 CSV batch fan-out 패턴까지 이미 정리돼 있다.

#openai #codex #subagents

Related Articles

GPT-5.6 Sol, ChatGPT·Codex·API 전면 배포와 80.0 coding agent 지표

ChatGPT Voice, 데스크톱에서 Codex와 다중 agent 제어까지 확장한 음성 작업 방식

OpenAI, Codex에 subagents 도입… 병렬·전문화 워크플로우 전면화