LocalLLaMAで注目されたのは、同じGPU・同じmodel・同じsoftware stackのまま、throughput 15%増とfirst-token P99 latency 40.6%減を主張した点だった。
#infrastructure
RSS FeedDigitalBridge $DBRGは、エネルギーインフラ投資会社ArcLight Capital Partnersを$1.05Bで買収する。対価は現金$750Mと株式$300Mで、統合後AUMは$100B超となる。
議論はGPUそのものより、HBMがAIインフラのコスト構造をどこまで押し上げるかに向かった。
ゴールドマン・サックス・オルタナティブスの報告書は、エージェントAIシステムが通常のチャットモデルより最大130倍のエネルギーを消費すると警告。米国は2028年までに45GWの電力不足と技術労働者60万人の欠員に直面すると試算している。
The Informationの報道によると、AnthropicはGoogle Cloudと5年間で2,000億ドルのコンピュートリソース契約を締結した。Google Cloudの未達成残高4,600億ドル超の40%以上を単一顧客が占める異例の規模だ。
元Twitter CEOのParag Agrawalが創業したParallel Web Systemsが4月29日、Sequoia主導の1億ドルシリーズBを完了した。評価額は20億ドルで、5ヶ月前のシリーズAから3倍増。AIエージェント向け検索APIに特化したインフラを提供する。
ソフトバンクがAI・ロボティクス専門の新会社Rozeを分社化し、2026年後半に米国で最大1000億ドル規模のIPOを目指すことが明らかになった。データセンター建設の自動化とABBロボティクスの統合が中核事業となる。
マイクロソフト・メタ・アルファベット・アマゾンの第1四半期決算が出揃い、AI向け設備投資の合計が7250億ドルを超える見通しとなった。前年4100億ドルからほぼ倍増となる。
MetaがAWS Gravitonコアを数千万単位で導入し、AIインフラ競争の主戦場をGPUの外側へ広げた。Metaは、エージェントAIが計画・ツール呼び出し・データ移動といったCPU集約処理を膨らませているとして、Graviton5を次の運用基盤に据える。
Google DeepMindの新しい学習方式が重要なのは、データセンター境界そのものが最前線の制約になっているからだ。Decoupled DiLoCoは2-5Gbpsの広域回線上で米国4地域にまたがる12B Gemmaを学習し、従来の同期方式より20倍超高速で、平均精度64.1%と基準線64.4%にほぼ並んだ。
Googleは、企業向けAIが試験導入から本番運用へ移ったというサインを出した。4月22日のCloud Next記事で、顧客の直接API利用は毎分160億トークンを超え、2026年の機械学習計算投資の過半がCloud事業へ向かうと示した。
Cerebrasが2024年に取り下げたIPOへ再び動いた。TechCrunchによると、2025 revenueは$510Mで、AWS data centersや$10B超と報じられたOpenAI dealが、Nvidia依存のAI compute市場に新しい試金石を作っている。