GoogleがAIチップを一枚看板で押し切る戦略をやめた。第8世代TPUを学習向け8tと推論向け8iに分け、エージェント時代の遅延・メモリ・電力を別々に最適化しにきた。
#tpu
RSS Feed企業向けAIの勝負は、モデル単体の比較から運用スタック全体の設計へ移っている。Google Cloudは2026年4月24日のCloud Next '26総括で、Gemini Enterprise Agent Platform、Workspace Intelligence、TPU 8t・8i、Virgo Networkを一体のエージェント基盤として打ち出した。
Google DeepMindの新しい学習方式が重要なのは、データセンター境界そのものが最前線の制約になっているからだ。Decoupled DiLoCoは2-5Gbpsの広域回線上で米国4地域にまたがる12B Gemmaを学習し、従来の同期方式より20倍超高速で、平均精度64.1%と基準線64.4%にほぼ並んだ。
Googleは第8世代TPUを学習用8tと推論用8iに分けた。8tはpod当たりnearly 3xの計算性能と121 exaflopsを、8iは19.2 Tb/sの相互接続と最大5x低いオンチップ遅延を掲げ、エージェント時代に学習とサービングの要件が完全に分かれたことを示している。
HNはTorchTPUを単なるクラウド宣伝として読まなかった。焦点は一つで、PyTorch利用者が `tpu` に切り替えた時に本当に自然な開発体験になるのかだった。
HNはTPU 8tと8iを巨大な数値競争としてではなく、エージェント時代のインフラが学習用と推論用に分かれ始めた合図として読んだ。コメントも電力効率、メモリ壁、遅延の話に長く留まった。
AnthropicはApril 6, 2026、GoogleとBroadcomから2027開始予定のnext-generation TPU capacityをmulti-gigawatt単位で確保したと発表した。run-rate revenueが$30 billionを超え、million-dollar customersがFebruary以降で倍増する中、この契約はinfrastructure scaleと需要拡大の両方を映している。
Anthropic は、2027年から順次稼働する multiple gigawatts 規模の次世代 TPU capacity について Google と Broadcom と新たな契約を結んだと発表した。Claude 需要の急増と enterprise 顧客の拡大を受けた、同社最大の compute 投資だとしている。
Anthropicは2026年4月7日、GoogleおよびBroadcomと次世代TPU capacityを数ギガワット規模で確保する契約を結んだと発表した。同時にrun-rate revenueが300億ドルを超え、年換算100万ドル超を使う企業顧客も1,000社を上回ったと説明している。
約240ポイントのHacker Newsスレッドは、Anthropicが2027年からGoogleとBroadcom経由でmultiple gigawatts規模の次世代TPU capacityを確保すると発表した4月6日のニュースに注目を集めた。run-rate revenueが300億ドルを超え、年換算100万ドル超を使う企業顧客が1,000社を超えたという数字も同時に議論を呼んだ。
Hacker Newsで注目された Nanocode は、tokenizer training、pretraining、synthetic data generation、agentic SFT、DPOを pure JAX と TPU workflow にまとめ、Claude Code 風の coding model を再現しようとする end-to-end open project だ。