Azure, Microsoft Foundry에서 Claude 4.6 장문맥 확대… 1M 컨텍스트·600페이지 입력·정액 단가 적용
Original: Long-context AI just got easier. Claude Opus 4.6 & Sonnet 4.6 now support 1M token context (GA), flat pricing, and 600 images/PDF pages per request. msft.it/6016Qmu6O View original →
X 게시물이 강조한 포인트
Azure는 2026-03-14 X 게시물에서 Claude Opus 4.6과 Claude Sonnet 4.6이 Microsoft Foundry에서 1M-token context, flat pricing, 그리고 요청당 최대 600 images/PDF pages를 지원한다고 밝혔다. 장문맥 기능은 보통 별도 premium 구간이나 제한된 preview로 제공되는 경우가 많기 때문에, Azure가 이를 “운영하기 쉬운 long-context AI”로 포장한 점이 중요하다.
Microsoft 공식 글이 덧붙인 내용
Microsoft Foundry 블로그는 Claude Sonnet 4.6이 Foundry에서 coding, agent, professional work를 겨냥해 제공된다고 설명하며, 1 million token context window (GA)와 128K maximum output를 명시한다. 또한 Sonnet 4.6을 Opus급에 가까운 성능을 더 낮은 비용으로 제공하는 모델로 설명하고, adaptive thinking과 effort control을 통해 품질·지연·비용 균형을 조절할 수 있다고 적었다.
블로그는 대규모 codebase, 긴 financial model, multi-document analysis, extended multi-turn workflow 같은 활용 시나리오를 직접 언급한다. 또 OSWorld Verified 72.5%를 인용하며 computer-use 성능도 강조한다. 즉, 단순히 많은 토큰을 넣을 수 있다는 의미를 넘어, 실제 브라우저 기반 업무, 문서 검토, QA 자동화, 레거시 시스템 상호작용까지 겨냥한 기업용 조합으로 포지셔닝하는 셈이다.
Anthropic 문서가 확인한 핵심 조건
Anthropic의 공식 문서도 Azure 게시물의 핵심 주장과 일치한다. context window 가이드는 Claude Opus 4.6과 Sonnet 4.6이 1M-token context window를 가진다고 적고 있으며, 단일 요청당 최대 600 images or PDF pages를 포함할 수 있다고 명시한다. pricing 문서 역시 Opus 4.6과 Sonnet 4.6이 1M context 전체 구간에서 standard pricing을 적용한다고 설명한다. 즉, 특정 토큰 구간을 넘겼다고 해서 별도의 장문맥 premium band가 자동 적용되지 않는 구조다.
이 점은 엔터프라이즈 도입에서 실질적으로 중요하다. 장문맥 AI는 문서 검토, 코드 분석, agent orchestration에 유용하지만, 과금 구조가 급격히 변하면 파일럿을 넘기기 어렵다. Azure가 X에서 내세운 “flat pricing”은 바로 이 운영 리스크를 낮추는 메시지로 읽힌다.
왜 중요한 플랫폼 업데이트인가
이번 업데이트는 long-context AI를 특수 실험이 아니라 일반적인 플랫폼 선택지로 끌어내린다는 점에서 의미가 있다. Microsoft Foundry를 사용하는 조직은 긴 working memory, 높은 multimodal 입력 한도, 그리고 Foundry의 거버넌스 환경을 한 번에 활용할 수 있다. retrieval-heavy copilot, multi-file analysis agent, codebase-scale assistant를 설계하는 팀에게는 chunking 부담과 비용 예측 불확실성을 동시에 줄여주는 변화다.
Primary sources: X post, Microsoft Foundry blog, Anthropic context docs, Anthropic pricing docs.
Related Articles
일반 사용자에게 풀린 것은 Fable 5지만, 핵심은 같은 기반 모델의 Mythos급 성능을 어디까지 열고 어디서 막을지다. Anthropic은 $10/$50 토큰 가격, 30일 보안 로그 보존, 일부 고위험 질의의 Opus 4.8 전환까지 함께 내놨다.
AI 모델 접근권이 제품 업데이트가 아니라 수출통제 지시로 끊겼다. Anthropic은 2026년 6월 13일 00:50 UTC 트윗에서 Fable 5와 Mythos 5를 모든 고객에게 비활성화해야 한다고 밝혔다.
Claude Fable 5가 GDPval-AA 1932점으로 에이전트형 지식 업무 벤치마크 1위에 올랐다. Anthropic 모델이 상위 4개 중 3개를 차지했다는 점은 장시간 업무형 모델 경쟁이 성능표 중심으로 재편되고 있음을 보여준다.