Zai의 ZCube 사례에서 관심은 새 GPU가 아니라 같은 GPU·같은 software stack으로 throughput 15%와 first-token tail latency 40.6% 개선을 냈다는 점에 모였다.
#infrastructure
RSS FeedDigitalBridge $DBRG는 에너지 인프라 투자사 ArcLight Capital Partners를 $1.05B에 인수하기로 했다. 대가는 현금 $750M과 주식 $300M이며, 합산 운용자산은 $100B 이상으로 제시됐다.
관심은 GPU 가격 자체보다 HBM이 AI 인프라 비용 구조를 얼마나 강하게 흔들고 있는지에 모였다.
골드만삭스 얼터너티브스 보고서에 따르면 에이전트 AI 시스템은 일반 챗봇 대비 60~130배의 에너지를 소비한다. 미국은 2028년까지 데이터센터용 전력이 45기가와트 부족해지며, 기술 인력 60만 명 공백도 AI 확장의 핵심 병목으로 지목됐다.
The Information 보도에 따르면 앤트로픽이 구글 클라우드와 5년간 2,000억 달러 규모의 TPU 컴퓨트 계약을 체결했다. 구글 클라우드 미수주 잔액(4,600억 달러+)의 40% 이상을 단일 AI 기업이 차지하는 이례적 규모다.
전 트위터 CEO 파라그 아그라왈이 창업한 Parallel Web Systems가 세콰이아 주도 1억 달러 시리즈B를 마감했다. 기업 가치 20억 달러로, 5개월 만에 7.4억 달러에서 3배 상승했다.
소프트뱅크가 AI와 로봇 기술을 결합한 신설 법인 Roze를 독립시키고 미국 증시 상장을 추진한다. ABB 로보틱스 통합과 자율 데이터센터 건설이 핵심 사업이며, 목표 기업가치는 1000억 달러다.
Meta가 AWS Graviton 코어 수천만 개를 들여오며 AI 인프라 전쟁의 축을 GPU 밖으로 넓혔다. 회사는 에이전트형 AI가 계획 수립, 툴 호출, 데이터 이동 같은 CPU 집약 구간을 키우고 있다며 Graviton5를 핵심 조합으로 제시했다.
Google DeepMind의 새 훈련 구조가 중요한 이유는 데이터센터 경계 자체가 최전선 병목이 되고 있기 때문이다. Decoupled DiLoCo는 2-5Gbps 광역 링크 위에서 4개 미국 지역에 걸쳐 12B Gemma 모델을 학습했고, 기존 동기화 방식보다 20배 넘게 빠르면서 평균 정확도는 64.1%로 기준선 64.4%에 거의 붙었다.
Google은 기업용 AI가 시범 운영을 지나 실제 운영 단계로 넘어갔다는 신호를 던졌다. 4월 22일 Cloud Next 글에서 고객 직접 API 호출이 분당 160억 토큰을 넘었고, 2026년 머신러닝 연산 투자 가운데 절반 이상이 클라우드 사업으로 향한다고 적었다.
Cerebras가 2024년 철회했던 IPO를 다시 추진한다. TechCrunch 보도에 따르면 회사는 2025 revenue $510M, 2025 adjusted basis net income $237.8M을 filing에 적었고, AWS 및 OpenAI 관련 대형 수요가 AI chip 시장의 Nvidia 의존을 흔드는 변수로 떠올랐다.
Anthropic는 April 6, 2026에 Google과 Broadcom으로부터 2027 시작 예정인 next-generation TPU capacity를 multi-gigawatt 단위로 확보했다고 밝혔다. run-rate revenue가 $30 billion을 넘고 million-dollar customers가 February 이후 두 배로 늘어난 상황에서, 이번 계약은 infrastructure scale과 demand surge를 함께 보여준다.