이미지 생성 모델이 가장 자주 무너지는 지점은 글자와 레이아웃이라서 이번 업데이트는 실무 영향이 크다. Qwen은 신모델을 내놓으며 텍스트-투-이미지 글로벌 9위와 다국어 타이포그래피 개선을 함께 내세웠다.
#multilingual
RSS Feedr/MachineLearning에 올라온 Dante-2B 진행 보고는 Italian 형태와 token 효율을 위해 tokenizer부터 다시 설계한 2.1B bilingual LLM의 1단계 학습 결과를 공유한다.
Cohere는 Apache 2.0 기반 2B ASR 모델 Transcribe를 공개하며 음성 인식 경쟁에 정면 진입했다. 14개 언어 지원, Hugging Face 배포, 그리고 5.42 평균 WER 리더보드 기록이 핵심 포인트다.
r/LocalLLaMA는 GigaChat 3.1에 강하게 반응했다. 이번 공개는 local-friendly 10B A1.8B MoE와 702B frontier-scale MoE를 모두 아우르며, 둘 다 MIT terms 아래 공개됐고 둘 다 scratch부터 학습했다고 제시됐다.
Meta의 Omnilingual MT 논문이 Hacker News에서 다시 떠오르며 machine translation을 200개 언어 수준에서 1,600개 언어 수준으로 확장하려는 시도가 주목받았다. 핵심은 모델 크기 경쟁보다 translation specialization, 데이터 파이프라인, evaluation coverage를 함께 재구성했다는 점이다.
2026년 3월 9일 LocalLLaMA에서는 Fish Audio S2가 fine-grained inline control, multilingual 지원, SGLang 기반 streaming stack을 함께 제시한 점이 주목을 받았다.
LocalLLaMA에서 크게 주목받은 Sarvam AI의 발표는 Apache 2.0 기반의 reasoning model인 Sarvam 30B와 Sarvam 105B를 공개한다. 회사는 두 모델이 India에서 scratch부터 학습됐고, Mixture-of-Experts 구조를 바탕으로 reasoning, coding, agentic workflow, Indian-language 성능을 겨냥했다고 설명한다.
Cohere가 인도 AI 정상회의에서 70개 이상 언어를 지원하는 소형 오픈 웨이트 모델 'Tiny Aya'를 발표했다. 33.5억 파라미터로 인터넷 연결 없이도 노트북에서 구동 가능하며 MIT 라이선스로 자유롭게 활용할 수 있다.
Hacker News에서 높은 반응을 얻은 글은 동일한 정책 의미라도 언어가 바뀌면 guardrail 점수가 36-53%까지 달라질 수 있다고 보고하며, 다국어 안전성 평가의 구조적 공백을 지적한다.