Cloudflare Agent Memory、agentの記憶をcontext window外で管理する

Original: Today we're announcing the private beta of Agent Memory, a managed service that extracts information from agent conversations and makes it available when it’s needed, without filling up the context window. https://cfl.re/41ZzNat View original →

Read in other languages: 한국어 English

LLM Apr 17, 2026 By Insights AI 1 min read 23 views Source

この投稿が示した変化

Cloudflareの2026年4月17日のX投稿は、Agents Weekの焦点を実行基盤からmemory managementへ広げた。中核の主張は、Agent Memoryがextracts information from agent conversationsするという点である。すべての会話履歴をpromptへ戻すのではなく、必要な情報を後から使えるようにする製品方向だ。

Cloudflareのアカウントは、infrastructure、security、Workers、developer platformの更新を頻繁に発信する。今週はWorkers、Durable Objects、AI Gatewayなどをproduction agentsの部品として位置づけてきた。Agent Memoryはその流れの中で、memoryをprompt engineeringの技巧ではなくmanaged infrastructureとして扱うものだ。

リンク先ブログで分かること

Cloudflareのブログは、Agent MemoryをAI agentsにpersistent memoryを与えるmanaged serviceと説明している。現在はprivate betaで、単なる保存先ではない。何を記憶し、何を忘れ、いつagentへ戻すかを扱う層として設計されている。この違いは大きい。単純なmemory systemは古い情報やノイズまで残し、モデル入力の品質を下げることがあるからだ。

実装の方向性はCloudflareの既存agent stackとつながる。Workersは実行、Durable Objectsはstate、AI Gatewayはmodel callsの前段を担える。Agent Memoryはそこに長期的な知識を加えながら、prompt bloatを抑える役割を持つ。support agent、inbox agent、research assistant、workflow botを作るチームにとって、臨時のsummaryよりAPIとして扱えるmemory layerの方が運用しやすい。

次に見るべき点

難しいのはpolicyとevaluationである。運用側はretention、deletion、user visibility、tenant separationを制御する必要がある。さらに、memory retrievalが実際にtask successを上げるのか、単にもっともらしい背景を追加するだけなのかも検証しなければならない。pricing、beta access、productionでのmemory inspectionとredactionが次の注目点になる。

出典: source tweet, Cloudflare blog.

LLM Apr 11, 2026 1 min read

Cloudflare、Workers AI に Kimi K2.5 を投入　256k context で agent infrastructure を大型 model へ拡張

Cloudflareは2026年3月19日、Workers AI に Moonshot AI の Kimi K2.5 を追加して large-model tier に入った。durable agent execution、large-context inference、lower-cost open model deployment を 1 つの stack にまとめる戦略が中心だ。

#cloudflare #workers-ai #kimi-k2.5

LLM X/Twitter Mar 22, 2026 1 min read

Cloudflare、Workers AIにKimi K2.5投入　agent coding reviewコスト77%削減を提示

Cloudflareは2026年3月20日、Kimi K2.5をWorkers AIに載せ、Cloudflare Developer Platform上でend-to-end agentを構築・運用できると発表した。公式ブログでは256k context、multi-turn tool calling、vision inputs、structured outputsに加え、1日7B tokensを処理する内部security review agentで77%のコスト削減を示している。

#cloudflare #workers-ai #kimi-k2-5

LLM Hacker News Apr 17, 2026 1 min read

Cloudflareのagent inference layer、HNは配管として見た

HNが見ていたのは「CloudflareがAIをやる」という話ではなく、14以上のproviderを束ねるinference layerがagent appの運用を本当に楽にするかだった。CloudflareはAI Gateway、Workers AI bindings、multimodal catalogを一つのplatformとして描き、コメント欄はOpenRouterとの差、pricingの正確さ、catalogの重なりを詰めた。

#cloudflare #agents #inference

この投稿が示した変化

リンク先ブログで分かること

次に見るべき点

Related Articles

Cloudflare、Workers AI に Kimi K2.5 を投入 256k context で agent infrastructure を大型 model へ拡張

Cloudflare、Workers AIにKimi K2.5投入 agent coding reviewコスト77%削減を提示

Cloudflareのagent inference layer、HNは配管として見た

Cloudflare、Workers AI に Kimi K2.5 を投入　256k context で agent infrastructure を大型 model へ拡張

Cloudflare、Workers AIにKimi K2.5投入　agent coding reviewコスト77%削減を提示