Anthropic는 Opus 4.6과 Sonnet 4.6에 1M context를 general availability로 제공하고, long-context premium 없이 기본 가격을 적용한다고 밝혔다. Hacker News에서는 단순 사양 증가보다 실제 배포 economics 변화에 더 큰 관심이 모였다.
LLM
Google는 Google AI Ultra·Pro subscribers를 대상으로 Docs, Sheets, Slides, Drive용 Gemini beta 기능 rollout을 시작한다. Gemini가 파일·이메일·웹을 바탕으로 작업물을 만들고 편집할 수 있게 되며, Drive에는 AI Overview와 Ask Gemini 기능이 추가된다.
Perplexity는 March 11, 2026에 Sandbox API를 Agent API tool이자 standalone service로 제공하겠다고 밝혔다. 기존 문서가 Agent API를 명시적 tool configuration을 갖춘 multi-provider interface로 설명하고 있는 만큼, 이번 업데이트는 code execution을 orchestration의 핵심 primitive 쪽으로 끌어온다.
Together AI는 March 13, 2026에 Open Deep Research v2를 fully free & open source로 공개했다고 밝혔다. 함께 공개된 blog는 multi-hop web research를 위한 planner와 self-reflection workflow, 그리고 code 및 evaluation asset을 설명한다.
r/MachineLearning의 한 글은 Meta의 COCONUT 성과가 recycled hidden state 자체보다 curriculum 설계와 sequential processing에서 왔을 가능성이 크다고 주장한다.
r/LocalLLaMA의 한 글은 QLoRA로 조정한 14B Qwen coder가 Ada compilation 작업에서 frontier proprietary model보다 높은 수치를 냈다고 주장하며, niche 언어용 전문 코딩 모델의 가능성을 보여줬다.
Hacker News에서는 2026년 3월 12일 올라온 분석 글을 계기로, LLM 코딩 성능이 SWE-bench test 통과율보다 maintainer merge 기준에서 훨씬 약하게 보인다는 문제의식이 확산됐다.
2026년 3월 9일 제출된 arXiv 논문 Ares는 multi-step LLM agent에서 단계별 reasoning effort를 동적으로 조절하는 방식을 제안했다. 저자들은 fixed high-effort 대비 reasoning token 사용량을 최대 52.7% 줄이면서 성공률 저하는 작았다고 보고했다.
IBM은 2026년 3월 9일 Granite 4.0 1B Speech를 공개했다. 절반 수준의 파라미터로 이전 모델보다 더 높은 영어 전사 정확도, speculative decoding 기반 빠른 추론, 일본어를 포함한 다국어 지원을 제공한다고 밝혔다.
OpenAI는 2026-03-05 X 게시물에서 GPT-5.4 Thinking과 GPT-5.4 Pro의 순차 배포를 알렸다. 공식 글은 GPT-5.4를 1M-token context, native computer use, tool search, 그리고 spreadsheet·document·presentation 작업 강화를 갖춘 professional-work 모델로 설명한다.
Azure는 2026-03-14 X 게시물에서 Claude Opus 4.6과 Sonnet 4.6의 1M 토큰 컨텍스트, flat pricing, 600 image/PDF page 입력 지원을 강조했다. Microsoft와 Anthropic 공식 문서는 이 세 가지 조건이 실제로 적용된다고 확인한다.
최근 r/LocalLLaMA에서 주목받은 글은 커뮤니티가 이미 400개가 넘는 모델에 대해 거의 1만 건에 이르는 Apple Silicon 벤치마크를 제출했다고 주장한다. 이 글이 중요한 이유는 흩어진 체감담을 넘어, M-series 칩과 context 길이별 패턴을 비교할 수 있는 공유 데이터셋이 생기기 시작했기 때문이다.