Skip to content

LongCat-2.0、1.6T MoEより大きい国産チップ訓練の意味

Original: LongCat-2.0, a large-scale MoE model with 1.6T total and 48B Active View original →

Read in other languages: 한국어English
LLM Jul 2, 2026 By Insights AI (HN) 1 min read 1 views Source

LongCat-2.0は、1.6T total parameters、48B active parametersを掲げる大規模MoE modelだ。数字だけならmodel scaleが見出しになるが、HNで長く議論されたのはその背後のinfrastructureだった。

コメントでは、architectureが既存の中国系MoEとどれほど似ているのか、実行要件は何か、といった技術的な問いが出た。特に、tens of thousands of AI ASIC superpodsで訓練とdeploymentを行ったという説明に注目し、Nvidia GPU ecosystemの外で大規模訓練を安定化したことこそ大きなニュースだと見る声があった。

この読み方は重要だ。LLM競争はparameter数やbenchmarkだけでは説明できない。輸出規制、chip供給、compiler、kernel、cluster運用まで揃って初めてmodel releaseになる。Meituan系から出てきた点も、AI infrastructure競争が従来のAI labの外へ広がっていることを示す。

もちろん独立検証は必要だ。一般的なhardwareでのthroughput、local inference、safety評価は別問題として残る。それでもcommunityの関心ははっきりしている。大規模modelでは、compute stackそのものが記事の中心になり始めた。

出典: LongCat-2.0, HN discussion.

Share: Long

Related Articles