CloudflareがProject GlasswingでAnthropicのセキュリティ特化モデルMythos Previewを自社インフラに実戦テスト。Mythosは複数の低深刻度バグを連結して実際に動作するエクスプロイトを生成でき、シニアセキュリティ研究者レベルの推論能力を示した。
#cloudflare
RSS FeedCloudflareが2026年Q1決算で過去3ヶ月のAI利用量が600%増加したと発表。同時にエージェント型AI再編の一環として全従業員の20%にあたる1,100人の解雇を発表した。
Cloudflareが世界で1,100人以上のレイオフを発表。コスト削減ではなくAIエージェント時代に向けた組織再設計と位置付け、3ヶ月でAI利用量が600%増加したと明かした。
CloudflareとStripeが共同設計した新プロトコルにより、AIエージェントがクラウドアカウント作成・ドメイン登録・課金・デプロイを人手なしで処理できるようになった。
Cloudflareはtraffic上位200,000 domainsをscanし、AI usage preferenceの宣言は4%、Markdown content negotiationは3.9%、MCP Server CardsとAPI Catalogsは15 sites未満だと示した。Agent Readiness scoreはagent webを監査できるchecklistにする。
Cloudflareはpaid plan向けに、verified AI training crawlerをcanonical URLへ301 redirectする機能を出した。自社docsで30日間にAI crawler訪問4.8M回を見たうえで、deprecated contentをtraining dataへ流さないためのHTTP layerの対策に踏み込んだ。
重要なのは、CloudflareがLLM servingの制約をGPU台数ではなくmemory-bandwidthの問題として扱っている点だ。記事はLlama 3.1 8Bで15-22%のmodel-size reduction、約3GBのVRAM削減、公開GPU kernelsを示した。
なぜ重要か: 長時間動くagentには、全メッセージを再投入せずに状態を保持する仕組みが必要になる。Cloudflareはprivate betaのAgent Memoryで、context windowを埋めずに必要な情報を再利用できると説明した。
HNが見ていたのは「CloudflareがAIをやる」という話ではなく、14以上のproviderを束ねるinference layerがagent appの運用を本当に楽にするかだった。CloudflareはAI Gateway、Workers AI bindings、multimodal catalogを一つのplatformとして描き、コメント欄はOpenRouterとの差、pricingの正確さ、catalogの重なりを詰めた。
CloudflareはWorkers AI上のKimi K2.5をagent workload向けに3x fasterにしたと説明した。p90 time per tokenは約100 msから20-30 msへ下がり、peak時のinput token cache hit ratioは60%から80%へ上がった。
CloudflareはAutoRAGをAI Searchへ再構成し、agentがWorkersから作成・検索できるretrieval primitiveにした。Open betaではBM25とvectorのhybrid search、built-in storage、metadata boosting、cross-instance searchを具体的な無料枠で試せる。
HNはCloudflare Email Serviceをagent向けfeatureというより、新しいemail senderとして読んだ。Workers連携、SES代替、spam、MTA-STS、sending limitという古くて重い問題に議論が集まった。