구글이 에이전트 시대용 AI 칩 전략을 한 장짜리 로드맵으로 밀지 않겠다고 선언했다. 8세대 TPU를 학습용 8t와 추론용 8i로 나누면서, 지연시간·메모리·전력 문제를 칩 수준에서 갈라 해결하겠다는 계산이다.
#tpu
RSS Feed에이전트 경쟁이 이제 모델 비교를 넘어 운영 스택 경쟁으로 넘어갔다. Google Cloud는 2026년 4월 24일 공개한 Cloud Next '26 총정리에서 Gemini Enterprise Agent Platform, Workspace Intelligence, TPU 8t·8i, Virgo Network를 한 묶음으로 내세우며 기업용 AI를 플랫폼 단위로 재정의했다.
Google DeepMind의 새 훈련 구조가 중요한 이유는 데이터센터 경계 자체가 최전선 병목이 되고 있기 때문이다. Decoupled DiLoCo는 2-5Gbps 광역 링크 위에서 4개 미국 지역에 걸쳐 12B Gemma 모델을 학습했고, 기존 동기화 방식보다 20배 넘게 빠르면서 평균 정확도는 64.1%로 기준선 64.4%에 거의 붙었다.
Google은 8세대 TPU를 훈련용 8t와 추론용 8i로 분리했다. 8t는 pod당 연산 nearly 3x와 121 ExaFlops를, 8i는 19.2 Tb/s 인터커넥트와 최대 5x 낮은 온칩 지연을 내세우며, 에이전트 시대에 학습과 서빙의 하드웨어 요구가 완전히 갈렸음을 보여준다.
HN은 이번 TorchTPU 글을 클라우드 홍보물로 읽지 않았다. 관심은 딱 하나였다. PyTorch 사용자가 초기화만 `tpu`로 바꿨을 때 정말 PyTorch처럼 움직이느냐였다.
HN은 TPU 8t·8i를 단순한 초대형 숫자 경쟁보다, 에이전트 시대에 학습용과 추론용 실리콘이 갈라지기 시작한 신호로 읽었다. 댓글도 전력 효율, 메모리 병목, 지연 시간 같은 운영 포인트에 더 오래 머물렀다.
Anthropic는 April 6, 2026에 Google과 Broadcom으로부터 2027 시작 예정인 next-generation TPU capacity를 multi-gigawatt 단위로 확보했다고 밝혔다. run-rate revenue가 $30 billion을 넘고 million-dollar customers가 February 이후 두 배로 늘어난 상황에서, 이번 계약은 infrastructure scale과 demand surge를 함께 보여준다.
Anthropic는 2027년부터 가동될 multiple gigawatts 규모의 차세대 TPU capacity를 위해 Google과 Broadcom과 새 계약을 맺었다고 밝혔다. 회사는 이를 Claude 수요 급증과 enterprise 고객 확대에 대응하는 최대 compute 약속으로 규정했다.
Anthropic은 2026년 4월 7일 Google·Broadcom과 차세대 TPU 용량을 수 기가와트 규모로 확보하는 계약을 맺었다고 밝혔다. 같은 발표에서 연환산 매출이 300억 달러를 넘었고, 연간 100만 달러 이상을 쓰는 기업 고객도 1,000곳을 넘어섰다고 설명했다.
약 240포인트를 받은 Hacker News 스레드는 Anthropic이 2027년부터 Google·Broadcom과 함께 multiple gigawatts 규모의 차세대 TPU capacity를 확보한다고 밝힌 4월 6일 발표에 주목했다. 동시에 run-rate revenue 300억 달러 돌파와 연간 100만 달러 이상을 쓰는 기업 고객 1,000곳 이상이라는 수치도 함께 화제가 됐다.
Hacker News에 오른 Nanocode는 tokenizer training, pretraining, synthetic data generation, agentic SFT, DPO를 pure JAX와 TPU workflow로 묶어 Claude Code 스타일 coding model을 재현하려는 end-to-end open project다.