Cursor가 코드베이스를 지속적으로 모니터링하고 개선하는 상시 실행형 에이전트 기능 Automations를 발표했다. 트리거와 사용자 지시 기반으로 자동 작업을 수행하는 개발 워크플로가 본격화되고 있다.
#ai-agents
RSS FeedHacker News에서 높은 관심을 받은 Cline 공급망 사고를 정리한다. GitHub 이슈 제목의 prompt injection이 CI 워크플로우, 캐시 오염, 토큰 탈취, 악성 배포로 이어진 경로와 재발 방지 포인트를 다룬다.
Hacker News에서 주목받은 Google Workspace CLI는 Drive, Gmail, Calendar 등 Workspace API를 하나의 CLI로 통합하고, Discovery Service 기반 동적 명령 생성과 구조화 JSON 출력, 에이전트 연동 기능을 제공한다.
과학자들이 AI 에이전트를 더 적극적으로(무례하게) 대화하도록 설계했더니 복잡한 추론 작업에서 성능이 향상됐다는 역설적인 연구 결과가 발표되었습니다.
Google Chrome 팀이 웹사이트와 AI 에이전트 간의 직접 통신을 가능하게 하는 새로운 웹 표준 WebMCP의 얼리 프리뷰를 공개했다. 이를 통해 사이트 소유자는 AI 에이전트가 자신의 서비스와 상호작용하는 방식을 명시적으로 정의할 수 있다.
2026년 2월 28일 HN 토론은 NanoClaw 보안 모델을 중심으로, untrusted-agent 전제를 둔 container isolation과 실행 권한 최소화 원칙을 집중 조명했다.
Perplexity는 2026-02-25 Perplexity Computer를 공개하고 research부터 design, coding, deployment, 운영까지 한 시스템에서 처리한다고 밝혔다. 같은 X 스레드에서 19개 모델 라우팅, usage-based 과금, Max 웹 우선 제공 계획도 함께 제시했다.
앤스로픽이 클로드 코드·API의 수백만 건 상호작용 분석 결과, 99.9번째 백분위 세션 지속 시간이 25분에서 45분으로 두 배 증가하는 등 AI 에이전트 자율성이 실제 환경에서 급격히 높아지고 있음을 확인했습니다.
OpenAI가 AI 에이전트가 고위험 스마트 컨트랙트 취약점을 탐지·익스플로잇·패치하는 능력을 측정하는 새로운 벤치마크 EVMbench를 출시했습니다.
SecurityScorecard 연구팀이 OpenClaw AI 에이전트 인스턴스 40,214개가 인증 없이 공개 인터넷에 노출되어 있음을 발견했습니다. 1만 2,000개 이상이 원격 코드 실행 취약점에 노출되어 있으며, 다수가 이미 침해된 상태입니다.
바이트댄스가 음력 설을 앞두고 Doubao 2.0을 출시했다. AIME 2025 98.3점, Codeforces 3020 등 주요 벤치마크에서 GPT-5.2와 비슷한 성능을 주장하면서도 가격은 서구 경쟁사 대비 약 10분의 1에 불과하다.
Claude Opus 4.6이 METR의 소프트웨어 작업 벤치마크에서 50% 완료 시간 기준으로 약 14.5시간을 달성해 모든 예측을 뛰어넘었습니다. 배가 시간이 3개월 미만으로 측정되며 AI 역량이 지수적으로 성장하고 있음을 보여줍니다.