IBM、Granite 4.0 1B Speech公開 小型多言語音声モデルでedge導入を狙う
Original: Granite 4.0 1B Speech: Compact, Multilingual, and Built for the Edge View original →
公開されたもの
IBM Graniteチームは2026年3月9日、Granite 4.0 1B SpeechをHugging Face上で公開した。これはresource-constrainedな環境を想定したcompact speech-language modelで、主な用途はautomatic speech recognition (ASR)とbidirectional automatic speech translation (AST)だ。IBMはenterprise applicationやedge deploymentを主要な利用シナリオとして示しており、単に大規模cloud向けの音声AIではなく、実際に配備しやすいサイズを前面に出している。
発表によれば、このモデルは前世代のgranite-speech-3.3-2bの約半分のparameterで、英語transcription accuracyを改善し、speculative decodingによりinferenceも高速化したという。対応言語は英語、フランス語、ドイツ語、スペイン語、ポルトガル語、日本語に広がり、今回の新要素として日本語ASRとkeyword list biasingが加わった。名前やacronymの認識強化はenterprise workloadで実用上の価値が高い。
性能と配布条件
IBMはGranite 4.0 1B SpeechがOpenASR leaderboardで1位になったと説明している。また、標準的な英語ASR benchmarkで低いword error rateを示し、より大きなモデル群と比べても競争力があると主張している。もちろん、これらはブログとmodel cardに基づく評価であり、実環境の雑音条件、端末差、言語ごとのばらつきは今後の外部検証が必要だ。
配布面では、モデルはApache 2.0で公開され、transformersとvLLMをnative supportするとされる。IBMはproductionで追加のrisk detectionが必要な場合、Granite Guardianとの併用を推奨している。これはモデル単体ではなく、deployment stackとgovernanceまで含めてenterprise adoptionを意識した設計といえる。
なぜ重要か
音声AIの話題は大型multimodal modelに集中しがちだが、実運用ではhardware cost、latency、privacy、offline性が重要になる。小型で多言語対応のopen modelは、voice support、現場端末、on-device assistant、工場や医療のworkflow automationなどで現実的な選択肢になりやすい。
特に日本語ASR対応は、日本市場や多言語企業にとって意味がある。大きいモデルほど良いという単純な競争ではなく、配備しやすさと十分な精度を両立する方向が強まっていることを、このリリースは示している。外部検証は今後必要だが、open enterprise speech modelの実用性が一段上がったと見る価値はある。
Related Articles
NVIDIAは2026年3月11日、120B parameter級の open model Nemotron 3 Super を発表した。NVIDIAは、1M-token context、hybrid MoE architecture、最大5倍の throughput により、agentic AI の context explosion と thinking tax を抑えると説明している。
r/LocalLLaMAの実験投稿は、MacBook Air上のQwen 3.5 0.8Bをtest feedback loopとLoRAで回し、13個のself-generated repair pairだけでholdout sliceを16/50から28/50へ押し上げたというtinyforgeの事例を共有した。
新しいllama.cpp変更は<code>--reasoning-budget</code>をtemplate stubではなくsampler側の実制御へ変える。LocalLLaMA threadでは、長いthink loopを削ることとanswer qualityを守ることのtradeoff、とくにlocal Qwen 3.5環境での意味が集中的に議論された。
Comments (0)
No comments yet. Be the first to comment!