Perplexity는 2026년 3월 31일 leading-edge AI system의 security, trustworthiness, practical defense를 연구하는 Secure Intelligence Institute를 출범한다고 밝혔다. Institute 페이지는 이 작업이 수백만 사용자와 수천 enterprise를 지원한 운영 경험에 기반하며, Purdue의 Ninghui Li 교수가 이끌고 BrowseSafe와 NIST 기반 AI agent security 논문 같은 초기 연구 성과도 포함한다고 설명한다.
#agents
RSS Feed
OpenAI Developers는 최신 Codex usage data를 바탕으로 developers가 refactor와 architecture planning 같은 장시간 작업을 밤에 맡기는 경향이 강하다고 밝혔다. 후속 reply에서는 오후 11시에 시작한 task가 다른 task보다 3+ hours 실행될 가능성이 60% 더 높다고 설명했다.
Databricks는 2026년 3월 24일 Lakewatch를 multimodal telemetry를 수집하고 business data와 결합해 AI agent로 탐지·조사·대응을 자동화하는 새로운 open agentic SIEM으로 발표했다. Databricks는 Lakewatch가 Adobe와 Dropbox를 포함한 고객과 함께 Private Preview에 들어가며, AI-driven 공격에 대응하려면 방어도 machine-speed 구조가 필요하다고 주장했다.
2026년 3월 r/singularity에서 203 points와 82 comments를 모은 글은 Symbolica의 Agentica SDK가 ARC-AGI-3에서 미검증 36.08%를 기록했다는 주장에 주목했다. 핵심 수치는 182개의 playable level 중 113개 해결, 25개 게임 중 7개 완주, 그리고 chain-of-thought baseline 대비 훨씬 낮은 보고 비용이었다.
OpenAI는 2026년 2월 27일 Amazon과의 multi-year strategic partnership을 발표하며 Amazon의 $50B 투자, Amazon Bedrock 기반 agent runtime 공동 추진, 약 2 gigawatts 규모의 Trainium capacity 계획을 공개했다. 이번 계약은 OpenAI의 enterprise agent 전략을 AWS 유통과 인프라에 더 깊게 연결한다.
GitHub는 2026년 3월 28일 Copilot CLI가 plan mode, /fleet, autopilot 조합으로 터미널에서 robust한 test suite를 만들 수 있다고 밝혔다. 관련 GitHub docs는 /fleet를 병렬 subagent 실행으로, autopilot을 autonomous multi-step completion으로 설명하고 있어, 이번 post는 CLI 안에서의 multi-agent testing workflow를 보여 주는 구체적 사례다.
AnthropicAI는 2026년 3월 24일 Claude를 frontend와 장기 실행 software engineering 작업에 더 안정적으로 쓰기 위한 multi-agent harness 글을 다시 부각했다. 해당 Anthropic Engineering 글은 initializer agent, incremental coding session, progress log, structured feature list, browser-based testing으로 context-window drift와 premature completion을 줄이는 방법을 설명한다.
Hacker News에서 화제가 된 `.claude` 폴더 가이드는 Claude Code 설정을 repo 안의 운영 자산으로 다루는 방식을 보여준다. `CLAUDE.md`, rules, commands, skills, agents를 분리해 관리하면 prompt 반복을 줄일 수 있지만, 동시에 instruction governance가 새 과제로 떠오른다.
Anthropic는 2026년 3월 23일 모든 long-horizon task가 다수 agent 분할에 적합한 것은 아니라고 밝혔다. 연결된 연구 글에서 Anthropic는 Claude Opus 4.6, persistent memory, orchestration pattern, test oracle을 활용해 differentiable cosmological Boltzmann solver를 구현하는 방식을 설명한다.
OpenAI는 GPT-5.4를 전문 업무용으로 가장 강력하고 효율적인 frontier model로 소개했다. reasoning, coding, computer use를 함께 끌어올리면서 ChatGPT, API, Codex 전반에 동시에 배치한 점이 핵심이다.
GitHub repo와 arXiv paper가 관심을 끈 이유는 self-improvement를 슬로건이 아니라 editable code loop로 보여주기 때문이다. task agent와 meta agent가 하나의 program 안에서 함께 바뀐다.
George Larson의 글은 저렴한 AI agent demo라기보다, 작은 footprint와 public/private 분리, tiered inference, 명시적인 blast-radius control을 갖춘 intentional agent system으로 읽혔다.