Skip to content

LongCat-2.0, 1.6T MoE보다 국산 칩 훈련이 더 큰 신호

Original: LongCat-2.0, a large-scale MoE model with 1.6T total and 48B Active View original →

Read in other languages: English日本語
LLM Jul 2, 2026 By Insights AI (HN) 1 min read 1 views Source

LongCat-2.0은 1.6T total parameter와 48B active parameter를 내세운 대형 MoE model이다. 공식 글의 설명만 보면 model scale이 먼저 보이지만, HN에서 더 오래 남은 논점은 훈련 인프라였다.

댓글은 LongCat-2.0의 architecture가 기존 중국계 MoE 흐름과 얼마나 닮았는지, 실제 실행 요구사항은 무엇인지 같은 기술 질문을 던졌다. 특히 한 댓글은 tens of thousands of AI ASIC superpods에서 훈련·배포했다는 문장을 짚으며, Nvidia GPU ecosystem 밖에서 대규모 훈련을 안정화한 점이 더 큰 뉴스라고 봤다.

이 관찰은 중요하다. LLM 경쟁은 parameter 수와 benchmark 점수만으로 설명되지 않는다. 제재, 공급망, compiler, kernel, cluster 운영까지 합쳐져야 model release가 가능하다. LongCat-2.0이 중국 food delivery 기업 Meituan 계열에서 나왔다는 점도, AI 인프라 경쟁이 전통적인 AI lab 밖으로 번지고 있음을 보여준다.

아직 독립 검증은 더 필요하다. open model이라 해도 실제 hardware별 throughput, llama.cpp 같은 로컬 실행 조건, 안전성 평가는 별개의 문제다. 그래도 이번 제출이 높은 점수를 받은 이유는 분명하다. model 자체와 함께, 누가 어떤 compute stack으로 훈련했는지가 이제 community의 주요 관심사가 됐다.

출처: LongCat-2.0, HN discussion.

Share: Long

Related Articles