Cloudflare AI Platform에 HN이 물은 것: agent inference의 배관인가, 또 다른 router인가
Original: Cloudflare's AI Platform: an inference layer designed for agents View original →
Cloudflare's AI Platform thread는 302점까지 올라갔지만, 반응은 단순한 제품 환호가 아니었다. 원문 Cloudflare 글은 AI Gateway를 중심으로 여러 model provider를 한 inference layer에서 호출하게 만들고, Workers AI binding integration과 expanded catalog, multimodal models를 추가했다는 설명을 내놨다. HN은 이것을 agent 시대의 배관으로 볼 수 있는지 먼저 물었다.
긍정적인 쪽은 Cloudflare가 이미 CDN, Workers, storage, observability를 가진 회사라는 점에 주목했다. agent application은 model call만으로 끝나지 않는다. request routing, latency, logs, fallback, cost visibility, edge runtime과의 연결이 같이 필요하다. 그런 의미에서 AI Gateway가 Workers와 더 가까워지는 것은 developer workflow상 의미가 있다.
하지만 thread의 더 큰 에너지는 회의적인 질문에서 나왔다. 한 댓글은 이것이 Cloudflare networking을 얹은 OpenRouter에 가까운 것 아니냐고 물었다. 다른 사용자는 production app에서 flagship model pricing이 부정확하게 보였다는 경험을 들며, inference layer가 믿을 수 있으려면 catalog와 price metadata의 정확성이 먼저라고 지적했다. 또 Workers AI model list와 새 AI model catalog 사이의 overlap이 명확하지 않다는 혼란도 나왔다.
이 논쟁이 유용한 이유는 agent infra의 승부가 model 수만으로 끝나지 않기 때문이다. 개발자는 “어떤 model을 부를 수 있나”보다 “그 호출을 운영 중에 얼마나 예측 가능하게 관리할 수 있나”를 본다. Cloudflare가 강한 영역은 network와 developer platform이지만, HN이 요구한 것은 더 구체적이다. routing이 쉬워지는 만큼 billing, observability, model availability도 같은 수준으로 단단해야 한다는 것이다.
Related Articles
왜 중요한가: 장시간 실행되는 agent는 모든 메시지를 다시 넣지 않고도 이전 상태를 기억해야 한다. Cloudflare는 private beta로 공개한 Agent Memory가 context window를 채우지 않으면서 필요한 정보를 다시 제공한다고 설명했다.
Cloudflare는 2026년 3월 24일 Dynamic Workers가 AI가 생성한 코드를 보안이 적용된 경량 isolate 안에서 실행할 수 있게 하며, 이 접근이 기존 container보다 100배 빠르다고 밝혔다. Cloudflare 블로그는 이 기능이 유료 Workers 사용자를 대상으로 open beta에 들어갔고, <code>globalOutbound: null</code>로 직접적인 외부 인터넷 접근을 차단할 수 있다고 설명한다.
Cloudflare는 2026년 3월 19일 Workers AI에 Moonshot AI의 Kimi K2.5를 추가하며 large-model tier로 올라섰다. durable agent execution, large-context inference, lower-cost open model deployment를 하나의 stack으로 묶겠다는 전략이 핵심이다.
Comments (0)
No comments yet. Be the first to comment!