Cloudflare가 Anthropic의 보안 특화 모델 Mythos Preview를 자사 인프라에 실전 테스트한 결과를 공개했다. Mythos는 개별 저위험 버그들을 연결해 실제로 동작하는 익스플로잇을 생성할 수 있으며, 이는 시니어 보안 연구자 수준의 추론 능력을 보여준다.
#cloudflare
RSS FeedCloudflare가 2026년 Q1 실적에서 3개월간 AI 사용량 600% 증가를 발표하면서 에이전틱 AI 구조조정의 일환으로 직원 1,100명(전체의 20%)을 해고한다고 밝혔다.
Cloudflare가 1,100명 이상을 감축한다고 발표했다. 비용 절감이 아닌 AI 에이전트 시대를 위한 조직 재설계라고 설명하며 3개월간 사내 AI 사용량이 600% 증가했다고 밝혔다.
Cloudflare와 Stripe가 협력해 AI 에이전트가 클라우드 계정 생성, 도메인 등록, 결제, 배포를 인간 개입 없이 처리할 수 있는 새 프로토콜을 공개했다. 에이전트 인프라 자율화의 새 이정표다.
Cloudflare는 traffic 상위 200,000개 domain을 scan해 AI usage preference 선언은 4%, Markdown content negotiation은 3.9%, MCP Server Card와 API Catalog 노출은 15개 미만이라는 결과를 냈다. Agent Readiness score는 agent web을 감사 가능한 checklist로 바꾼다.
Cloudflare가 paid plan 고객에게 AI training crawler를 최신 canonical URL로 301 redirect하는 기능을 열었다. 자체 docs에서 30일간 AI crawler 방문 4.8M회를 본 뒤, deprecated content를 학습 데이터로 흘려보내는 문제를 HTTP status code로 막겠다는 접근이다.
중요한 점은 Cloudflare가 GPU를 더 사는 문제가 아니라 LLM serving의 memory-bandwidth 병목을 직접 줄이려 한다는 데 있다. 글은 Llama 3.1 8B에서 15-22% 모델 크기 감소, 약 3GB VRAM 절감, 공개 GPU kernel을 제시한다.
왜 중요한가: 장시간 실행되는 agent는 모든 메시지를 다시 넣지 않고도 이전 상태를 기억해야 한다. Cloudflare는 private beta로 공개한 Agent Memory가 context window를 채우지 않으면서 필요한 정보를 다시 제공한다고 설명했다.
HN의 관심은 “Cloudflare가 AI를 한다”가 아니라, 14개 이상 provider를 묶는 inference layer가 agent 개발자의 실제 배관 문제를 줄여주느냐였다. Cloudflare 글은 AI Gateway, Workers AI binding, multimodal model catalog를 한 흐름으로 묶었고, 댓글은 OpenRouter와의 차이, pricing 신뢰도, model catalog의 일관성을 따졌다.
Cloudflare가 Workers AI에서 Kimi K2.5를 3x faster로 만들었다고 밝혔다. p90 time per token은 약 100 ms에서 20-30 ms로 내려갔고, prompt cache hit ratio는 peak 기준 60%에서 80%로 올랐다.
Cloudflare가 AutoRAG를 AI Search로 바꾸며 agent용 retrieval을 별도 infra 작업에서 Workers binding으로 끌어왔다. Open beta 기간에는 built-in storage, vector index, BM25 hybrid search, cross-instance search를 무료 한도 안에서 쓸 수 있다.
HN은 Cloudflare Email Service를 agent feature보다 “또 하나의 email sender”로 해석했다. 댓글은 Workers integration, SES 대안, spam, MTA-STS, sending limit 같은 낡지만 중요한 문제로 모였다.