Claude Opus 4.8 fast mode, 2.5배 속도와 3분의 1 가격으로 재조정
Original: Claude Opus 4.8 fast mode cuts price by 3x while running 2.5x faster View original →
Opus 4.8의 실사용 비용은 모델 점수만큼 중요하다. Claude 공식 계정은 fast mode가 Opus 4.8에서 제공되며, 같은 모델을 약 2.5배 빠르게 실행하고 이전보다 세 배 저렴해졌다고 밝혔다. Claude Code에서는 /fast로 켤 수 있고, API 접근은 계정 담당자나 대기 명단을 통해 요청하는 방식이다.
트윗의 핵심 문구는 “2.5x the speed”, “three times cheaper”다.
원문 트윗은 모델 성능 발표 직후 나온 운영 조건 업데이트다. Claude 계정은 Anthropic의 일반 소비자·개발자용 제품 소식을 전하는 채널로, Opus 4.8 출시 당일에는 모델 품질, fast mode, Claude Code 기능을 나눠 설명했다. fast mode 링크는 Claude의 접근 신청 페이지로 이어진다.
Anthropic의 출시 글에 따르면 Opus 4.8 일반 가격은 Opus 4.7과 같은 $5 per million input tokens, $25 per million output tokens다. 반면 fast mode는 $10 per million input tokens, $50 per million output tokens로 제시됐다. 이 숫자는 일반 사용보다 비싸지만, 이전 fast mode 대비 3분의 1 수준이라는 점이 핵심이다. 지연 시간이 병목인 에이전트 작업이나 Claude Code 세션에서는 처리 시간이 줄어드는 효과가 비용 계산을 바꿀 수 있다.
다음 관전 포인트는 fast mode가 실제 작업에서 품질 저하 없이 충분한 속도 이득을 내는지다. Opus 4.8은 high effort를 기본값으로 삼고, 어려운 장기 작업에는 xhigh 또는 max effort를 권한다. 따라서 개발팀은 fast mode를 단순히 더 빠른 스위치로 보기보다, 코드 리뷰·마이그레이션·반복 분석처럼 지연 시간과 검증 비용이 함께 중요한 작업에서 별도 평가해야 한다.
Related Articles
Anthropic과 KPMG가 5월 19일 글로벌 전략 동맹을 체결했다. KPMG 전 직원 27만 6천 명이 Digital Gateway를 통해 Claude에 접근하며, 조세·사모펀드·사이버보안 분야 에이전트 워크플로우에 우선 적용된다.
Anthropic이 Opus 4.6를 2.5배 빠르게 실행하는 Fast Mode를 출시했다. r/singularity에서 527점을 기록하며 큰 관심을 받았으며, 동일 모델 품질에 속도만 향상시킨 접근법이 주목받고 있다.
새 Opus는 같은 가격, 더 싼 fast mode, Claude Code의 dynamic workflows로 논점이 좁혀졌다. 커뮤니티 반응은 “대형 발표”보다 실제 agent 작업에서 체감될 개선 폭을 따지는 쪽에 가까웠다.
Comments (0)
No comments yet. Be the first to comment!