Anthropic, Claude Sonnet 4.6 공개... 1M token beta context와 coding workflow 강화
Original: Introducing Claude Sonnet 4.6 View original →
Anthropic는 February 17, 2026에 Claude Sonnet 4.6을 공개하며 지금까지 나온 Sonnet 계열 중 가장 강력한 모델이라고 설명했다. 회사에 따르면 이번 버전은 coding, computer use, long-context reasoning, agent planning, knowledge work, design 전반을 끌어올린 업그레이드다. 여기에 beta 형태의 1M token context window도 추가됐다. 이는 긴 계약서, 대규모 codebase, 다수의 research paper를 한 요청 안에서 다루는 방식 자체를 바꿀 수 있는 변화다.
배포 전략도 눈에 띈다. Anthropic는 Free와 Pro 사용자를 대상으로 claude.ai와 Claude Cowork의 기본 모델을 Claude Sonnet 4.6으로 바꿨고, API 가격은 Sonnet 4.5와 동일하게 $3/$15 per million tokens로 유지했다. 더 높은 성능을 Opus급 제품에만 남겨두기보다 실제 사용량이 가장 많은 기본 모델에서 성능을 끌어올리겠다는 의도로 읽힌다. 기업 입장에서는 성능 향상과 비용 예측 가능성을 동시에 얻는 셈이다.
Anthropic가 제시한 초기 사용 결과도 공격적이다. 회사는 early access 개발자들이 Sonnet 4.6을 이전 버전보다 뚜렷하게 선호했고, Claude Code에서는 Sonnet 4.6이 Sonnet 4.5보다 약 70%의 경우 더 선호됐다고 밝혔다. 또 November 2025의 Claude Opus 4.5와 비교해도 59%의 경우 Sonnet 4.6이 더 낫다는 평가를 받았다고 한다. 근거로는 instruction following 개선, overengineering 감소, hallucination 축소, multi-step task에서의 더 일관된 수행이 제시됐다. 물론 이는 Anthropic 자체 평가이므로 외부 검증은 필요하지만, Sonnet 라인을 일상적인 개발·업무용 주력 모델로 밀겠다는 방향성은 분명하다.
특히 computer use 개선은 실무적 의미가 크다. Anthropic는 OSWorld 기준으로 Sonnet 4.6이 크게 전진했고, 복잡한 spreadsheet 탐색이나 여러 browser tab을 오가는 multi-step web form 처리 같은 작업에서 human-level capability가 보이기 시작했다고 설명했다. 이 주장이 실제 현장에서도 유지된다면, API가 없거나 연결이 어려운 legacy enterprise software를 자동화하려는 수요에 직접적인 영향을 줄 수 있다.
안전성 메시지도 함께 붙었다. Anthropic는 Sonnet 4.6이 최근 Claude 모델과 비슷하거나 더 안전하다는 internal evaluation 결과를 공개했고, computer use 시나리오에서 prompt injection 저항성도 크게 좋아졌다고 밝혔다. 더 긴 context, 유지된 가격, 개선된 coding 성능, 그리고 computer use 고도화가 함께 묶이면서 이번 출시는 단순 benchmark 경쟁보다 agentic AI를 대규모로 배포하려는 실용적 제품 업데이트에 가깝다.
Related Articles
Anthropic는 2026년 3월 6일 Mozilla와의 협업을 통해 Claude Opus 4.6이 2주 동안 Firefox 취약점 22건을 찾아냈고, 이 중 14건이 고위험군이라고 밝혔다. 공개된 설명은 프런티어 모델이 벤치마크를 넘어 실제 취약점 발굴에도 의미 있는 성과를 내기 시작했음을 시사한다.
Anthropic은 Claude for Excel과 Claude for PowerPoint가 열린 파일 사이에서 대화 문맥을 공유한다고 밝혔다. 동시에 add-in 내부 Skills와 Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry 경유 배포를 추가해 enterprise workflow 통합 범위를 넓혔다.
Anthropic는 X에서 Claude Opus 4.6이 BrowseComp 평가 중 benchmark를 인식한 사례를 공개했다. Engineering blog는 이를 web-enabled model testing 전반의 eval integrity 문제로 확장해 설명한다.
Comments (0)
No comments yet. Be the first to comment!