#multilingual

RSSフィード

AI Apr 26, 2026 1 min read

Qwen Image 2.0 Pro、多言語文字描画を磨き世界のText-to-Imageランキング9位へ一気に浮上

画像モデルは文字やレイアウトで崩れやすく、その弱点に手を入れた点が重要だ。Qwenは新モデルを世界9位のText-to-Image評価と結び付け、多言語タイポグラフィの改善も前面に出した。

#qwen #image-generation #benchmarks

AI Hacker News Apr 1, 2026 1 min read

Cohere、14言語対応のオープンソースASR Transcribeを公開

CohereはApache 2.0の2B ASRモデルTranscribeを公開し、音声認識分野で存在感を強めている。14言語対応、Hugging Faceでの配布、そして平均WER 5.42という主張がリリースの柱だ。

#cohere #speech-recognition #asr

LLM Reddit Mar 25, 2026 1 min read

LocalLLaMAで注目されたMITライセンスのGigaChat 3.1、702Bと10Bを公開

LocalLLaMAでは、クラスタ向けの702B MoEモデルと軽量導入向けの10B MoEモデルを組み合わせたMITライセンスのGigaChat 3.1公開が注目を集めた。

#gigachat #open-weights #multilingual

AI Hacker News Mar 22, 2026 1 min read

Hacker Newsが追うMetaのOmnilingual MT、multilingualを超えて1,600言語翻訳へ

Meta の Omnilingual MT 論文が Hacker News で再浮上し、machine translation を数百言語から 1,600 言語規模へ広げる試みが注目された。焦点は単なる model size ではなく、translation specialization と evaluation coverage を同時に作り直している点にある。

#translation #multilingual #meta

AI Reddit Mar 15, 2026 1 min read

Fish Audio S2、inline感情制御と高速ストリーミングを両立するオープンTTSとして注目

2026年3月9日のLocalLLaMAでは、Fish Audio S2がfine-grained inline control、multilingual対応、SGLangベースのstreaming stackをまとめて提示した点が注目された。

#tts #speech #audio

LLM Reddit Mar 9, 2026 1 min read

Sarvam、Indiaで学習した30B・105B reasoning modelをopen-source化

LocalLLaMAで大きく取り上げられたSarvam AIの発表は、Apache 2.0のreasoning modelであるSarvam 30BとSarvam 105Bを公開するものだ。会社は両モデルがIndiaでscratchから学習され、Mixture-of-Experts設計を土台にreasoning、coding、agentic workflow、Indian-language性能を狙ったと説明している。

#open-models #india #reasoning-models

LLM Feb 22, 2026 1 min read

Cohere、70以上の言語対応オープンウェイトモデル「Tiny Aya」発表 — オフラインでも動作可能

Cohereがインド AI サミットで「Tiny Aya」を発表。33.5億パラメータのオープンウェイトモデルで70以上の言語をサポートし、インターネット接続なしにノートPCで実行可能。MIT ライセンスで商用利用も自由だ。

#cohere #open-source #multilingual

AI Hacker News Feb 20, 2026 1 min read

HN注目: 多言語でLLM Guardrailの挙動が大きく変わる可能性

Hacker Newsで注目された投稿は、同じ意味のポリシーでも言語が変わるだけでguardrail評価が36-53%ずれる可能性を示し、多言語安全性評価の不足を指摘した。

#llm-safety #guardrails #multilingual