LLM Reddit Apr 8, 2026 1 min read
r/MachineLearning で注目された Dante-2B は、2×H200 上で scratch から訓練されている 2.1B 規模の Italian/English dense model だ。Italian 向け tokenizer 効率、300B token corpus、そして phase 2 後に weights・tokenizer・pipeline を open release する計画が柱になっている。