Google의 Antigravity 2.0 플랫폼이 96개 AI 에이전트를 동원해 단 12시간, 1,000달러 미만의 토큰 비용으로 운영 체제를 처음부터 만들었다. 완성된 OS는 실제로 둠(Doom)까지 실행 가능하다.
#multi-agent
RSS FeedSakana AI가 여러 모델을 묶는 오케스트레이션을 연구 개념이 아니라 상용 API 상품으로 꺼냈다. 베타 수치만 보면 fugu-ultra는 SWEPro 54.2, GPQAD 95.1로 GPT 5.4 high와 Gemini 3.1 high를 각각 앞서는 구간을 만들었다.
r/artificial의 최근 글은 Claude Code leak를 단순 해프닝이 아니라 AI agent 설계 교본처럼 읽어야 한다는 관점을 제시했다. 핵심은 model weights가 아니라 memory, permissions, tool orchestration, multi-agent coordination 같은 실제 product layer가 드러났다는 점이다.
GitHub는 4월 5일 X post에서 Squad를 조명했다. 이 open-source 프로젝트는 GitHub Copilot 위에서 저장소 안에 미리 구성된 AI team을 초기화하며, GitHub는 thin coordinator, versioned repo file 기반 shared memory, parallel specialist agent라는 구조를 핵심 패턴으로 설명한다.
Cursor 3는 local·cloud agent, multi-repo context, PR handoff를 하나의 interface로 묶어 AI coding을 multi-agent orchestration 문제로 재정의한다.
Together Research는 2026년 3월 27일 divide-and-conquer를 적용한 더 작은 모델이 long-context task에서 GPT-4o single-shot를 맞추거나 앞설 수 있다고 밝혔다. Together 블로그와 arXiv 논문은 이 방법이 planner-worker-manager 구조와 task, model, aggregator noise 분석에 기반한다고 설명한다.
Anthropic는 2026년 3월 24일 새로운 Engineering Blog 글을 통해 Claude를 frontend design와 장시간 autonomous software engineering에 더 잘 맞추기 위해 multi-agent harness를 어떻게 썼는지 설명했다. 이 글은 planning, generation, evaluation 역할을 분리하고, 단일 agent 대비 뚜렷한 성능 향상을 제시한다.
GitHub는 2026-03-19에 GitHub Copilot 기반 오픈소스 프로젝트 Squad를 소개했다. 별도 orchestration stack 없이 저장소 안에서 역할별 AI agent 팀을 구성한다는 점이 핵심이다.
GitHub는 2026년 3월 9일 X를 통해 multi-agent 시스템 설계 가이드를 다시 강조했다. 회사는 대부분의 실패가 모델 성능이 아니라 구조 부족에서 발생한다며 typed schema, action schema, Model Context Protocol을 핵심 제어 장치로 제시했다.
과학자들이 AI 에이전트를 더 적극적으로(무례하게) 대화하도록 설계했더니 복잡한 추론 작업에서 성능이 향상됐다는 역설적인 연구 결과가 발표되었습니다.
일론 머스크 xAI CEO가 Grok 4.2 공개 베타를 출시했다. 4개의 전문 AI 에이전트(Grok·Harper·Benjamin·Lucas)가 협업하는 멀티 에이전트 아키텍처와 매주 자동 개선되는 빠른 학습 시스템을 탑재해 환각 오류율이 65% 감소했다.
OpenAI CEO 샘 알트만이 퍼스널 AI 에이전트 앱 OpenClaw 창업자 피터 슈타인베르거의 OpenAI 합류를 발표했다. 멀티 에이전트 미래를 선도하겠다는 OpenAI의 전략적 인재 영입이다.