Claude는 2026년 4월 8일 X에서 Managed Agents가 task, tool, guardrail 정의만으로 agent 인프라를 Anthropic 쪽에서 운영한다고 설명했다. Anthropic 공식 자료는 이를 cloud-hosted, versioned agent를 위한 composable API 모음으로 설명하며, outcomes, memory, multi-agent orchestration 일부는 limited research preview로 제공된다고 적고 있다.
#api
RSS FeedMeta는 2026년 4월 8일 Meta Superintelligence Labs의 첫 모델 Muse Spark를 공개했다. 이 모델은 이미 Meta AI 앱과 웹을 구동하고 있으며, WhatsApp, Instagram, Facebook, Messenger, AI glasses로도 확장될 예정이다.
Claude는 2026년 4월 9일 advisor strategy를 Claude Platform beta로 공개했다. Sonnet 또는 Haiku가 단일 Messages API request 안에서 Opus에 계획 조언을 요청할 수 있게 하며, Anthropic은 이 구성이 Sonnet 단독 대비 SWE-bench Multilingual을 2.7포인트 높이고 task당 비용은 11.9% 낮췄다고 설명한다.
r/artificial의 한 토론 글은 email, phone number, browser, computer, memory, payments, SaaS access 같은 사람의 기본 업무 능력이 빠르게 agent용 API primitive로 재구성되고 있다고 정리한다.
Google는 Mar 17, 2026 agent workflow를 위한 Gemini API 업데이트를 공개했다. 이번 변경으로 built-in tool과 custom function을 한 request에서 함께 쓰고, tool output을 context에 유지하며, Gemini 3에서 Maps grounding까지 활용할 수 있게 됐다.
2026년 3월 17일 Hacker News에서 GPT-5.4 mini·nano 공개 글이 236 points와 143 comments를 모았다. OpenAI는 mini를 Codex·API·ChatGPT용 고속 coding/tool-use 모델로, nano를 classification·extraction·subagent용 저가 tier로 배치하고 있다.
Google은 Gemini API 개발자를 위해 Project Spend Caps, 개편된 Usage Tiers, 새 billing dashboard를 AI Studio에 추가했다. Paid usage로 넘어가는 팀이 비용과 확장 조건을 더 예측 가능하게 관리하도록 설계된 업데이트다.
Perplexity는 2026년 3월 11일 Agent API를 공개하며 search, tool execution, multi-model orchestration을 하나의 managed runtime으로 묶겠다고 밝혔다. 이번 출시는 Perplexity를 단순 답변 인터페이스보다 production agent workflow용 인프라에 더 가깝게 위치시킨다.
OpenAI는 2026-03-05 X 게시물에서 GPT-5.4 Thinking과 GPT-5.4 Pro의 순차 배포를 알렸다. 공식 글은 GPT-5.4를 1M-token context, native computer use, tool search, 그리고 spreadsheet·document·presentation 작업 강화를 갖춘 professional-work 모델로 설명한다.
Google DeepMind는 Gemini 3.1 Flash-Lite가 Gemini API와 Google AI Studio를 통해 preview로 제공된다고 밝혔다. 회사는 이를 가장 cost-efficient한 Gemini 3 모델로 소개하며, 더 낮은 가격과 더 빠른 성능, 조절 가능한 thinking levels를 강조했다.
OpenAI는 GPT-5.4 Thinking을 ChatGPT에, GPT-5.4를 API와 Codex에, GPT-5.4 Pro를 ChatGPT와 API에 배포하기 시작했다. reasoning, coding, native computer use를 최대 1M-token context와 함께 하나의 professional-work model로 묶었다는 점이 핵심이다.
OpenAI Developers가 GPT-5.4 API용 프롬프팅 가이드를 업데이트했다. tool use, structured outputs, verification loops, 장기 워크플로우 패턴을 정리해 production-grade agents의 안정적인 실행을 지원하는 데 초점을 맞췄다.