Skip to content

#italian-nlp

RSS Feed
LLM Reddit Apr 8, 2026 1 min read

r/MachineLearning에서 주목한 Dante-2B는 2×H200 위에서 scratch부터 훈련 중인 2.1B 규모의 Italian/English dense model이다. 이 프로젝트는 Italian에 맞춘 tokenizer 효율, 300B token corpus, 그리고 phase 2 이후 weights·tokenizer·pipeline 전체를 open release하겠다는 계획을 핵심으로 내세운다.