Anthropic, Claude Opus 4.6·Sonnet 4.6 공개…코딩·추론 성능 강화
Original: Introducing Claude Opus 4.6 and Sonnet 4.6 View original →
Anthropic은 2026년 2월 18일(현지 시간) “Introducing Claude Opus 4.6 and Sonnet 4.6”을 통해 최신 주력 모델 2종을 공개했다. 발표에 따르면 두 모델은 claude.ai와 Anthropic API를 통해 제공되며, 동일한 아키텍처 안에서 빠른 응답과 깊은 추론을 병행할 수 있는 하이브리드 사용성을 유지한다. 실무 관점에서 중요한 점은 모델 변경이 단순 성능 수치 경쟁이 아니라, 장시간 코딩 작업과 복잡한 추론 흐름에서의 안정성을 높이는 방향으로 설명되었다는 것이다.
Anthropic은 Opus 4.6을 “world’s best coding model”로 소개하며 SWE-bench 74.5%, Terminal-bench 47.4%(2026년 2월 17일 기준) 결과를 제시했다. Sonnet 4.6은 비용 대비 성능 균형을 강조하며 대규모 배포에 적합한 선택지로 포지셔닝됐다. 또한 두 모델 모두에서 코드 생성 시 지름길(shortcut) 선택을 줄이고, 대규모 코드베이스 이해 및 리팩터링의 일관성을 개선했다고 밝혔다. 이는 에이전트형 개발 워크플로에서 재시도 비용을 낮추는 요소로 해석할 수 있다.
보안 측면도 이번 릴리스의 핵심 메시지다. Anthropic은 dynamic threat prevention 보호 계층을 도입해 프롬프트 인젝션, 데이터 유출(exfiltration), 에이전트 오용 시나리오에 대응한다고 설명했다. 동시에 Claude Opus 4.5에서 적용했던 ASL-3 수준의 배포 보안 조치를 Opus 4.6에도 유지한다고 명시했다. 기업 고객 입장에서는 성능 향상 자체보다, 모델 업데이트 주기 속에서도 보안 통제와 운영 기준이 연속성을 갖는지가 더 중요할 수 있는데, Anthropic은 이 지점을 전면에 내세웠다.
제품 사용성 변화도 눈에 띈다. 발표문은 extended output limit를 64k tokens로 확장했다고 밝혔고, 장문 분석·코드 수정·다단계 계획 수립 같은 업무에서 모델이 중간 맥락을 잃지 않도록 개선했다고 설명했다. 제공 채널은 Anthropic API뿐 아니라 Amazon Bedrock, Google Cloud의 Vertex AI까지 포함된다. 결과적으로 이번 릴리스는 2026년 LLM 경쟁이 “최고 점수 모델”에서 “장기 작업 신뢰성 + 배포 보안 + 멀티클라우드 접근성”의 조합으로 이동하고 있음을 보여주는 사례다.
Related Articles
Anthropic는 2026년 3월 6일 Mozilla와의 협업을 통해 Claude Opus 4.6이 2주 동안 Firefox 취약점 22건을 찾아냈고, 이 중 14건이 고위험군이라고 밝혔다. 공개된 설명은 프런티어 모델이 벤치마크를 넘어 실제 취약점 발굴에도 의미 있는 성과를 내기 시작했음을 시사한다.
Anthropic은 Claude for Excel과 Claude for PowerPoint가 열린 파일 사이에서 대화 문맥을 공유한다고 밝혔다. 동시에 add-in 내부 Skills와 Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry 경유 배포를 추가해 enterprise workflow 통합 범위를 넓혔다.
Anthropic는 X에서 Claude Opus 4.6이 BrowseComp 평가 중 benchmark를 인식한 사례를 공개했다. Engineering blog는 이를 web-enabled model testing 전반의 eval integrity 문제로 확장해 설명한다.
Comments (0)
No comments yet. Be the first to comment!