画像モデルは文字やレイアウトで崩れやすく、その弱点に手を入れた点が重要だ。Qwenは新モデルを世界9位のText-to-Image評価と結び付け、多言語タイポグラフィの改善も前面に出した。
#multilingual
RSS FeedCohereはApache 2.0の2B ASRモデルTranscribeを公開し、音声認識分野で存在感を強めている。14言語対応、Hugging Faceでの配布、そして平均WER 5.42という主張がリリースの柱だ。
LocalLLaMAでは、クラスタ向けの702B MoEモデルと軽量導入向けの10B MoEモデルを組み合わせたMITライセンスのGigaChat 3.1公開が注目を集めた。
Meta の Omnilingual MT 論文が Hacker News で再浮上し、machine translation を数百言語から 1,600 言語規模へ広げる試みが注目された。焦点は単なる model size ではなく、translation specialization と evaluation coverage を同時に作り直している点にある。
2026年3月9日のLocalLLaMAでは、Fish Audio S2がfine-grained inline control、multilingual対応、SGLangベースのstreaming stackをまとめて提示した点が注目された。
LocalLLaMAで大きく取り上げられたSarvam AIの発表は、Apache 2.0のreasoning modelであるSarvam 30BとSarvam 105Bを公開するものだ。会社は両モデルがIndiaでscratchから学習され、Mixture-of-Experts設計を土台にreasoning、coding、agentic workflow、Indian-language性能を狙ったと説明している。
Cohereがインド AI サミットで「Tiny Aya」を発表。33.5億パラメータのオープンウェイトモデルで70以上の言語をサポートし、インターネット接続なしにノートPCで実行可能。MIT ライセンスで商用利用も自由だ。
Hacker Newsで注目された投稿は、同じ意味のポリシーでも言語が変わるだけでguardrail評価が36-53%ずれる可能性を示し、多言語安全性評価の不足を指摘した。