#distributed-training

AI X/Twitter Apr 25, 2026 1 min read

DeepMind、4地域で12B訓練　同期型より20倍速い分散学習へ

Google DeepMindの新しい学習方式が重要なのは、データセンター境界そのものが最前線の制約になっているからだ。Decoupled DiLoCoは2-5Gbpsの広域回線上で米国4地域にまたがる12B Gemmaを学習し、従来の同期方式より20倍超高速で、平均精度64.1%と基準線64.4%にほぼ並んだ。

#google-deepmind #gemma #distributed-training

#distributed-training

DeepMind、4地域で12B訓練 同期型より20倍速い分散学習へ

DeepMind、4地域で12B訓練　同期型より20倍速い分散学習へ