NVIDIAは2026年3月17日のGTC 2026で、通信事業者がAI gridを構築し始めていると説明した。latency、cost、data localityが重要なinferenceをnetwork edgeへ近づけ、通信事業者のAI monetization基盤にしようという構想だ。
#edge-ai
RSS Feed2026年3月19日にHacker Newsへ投稿されたKitten TTSスレッドは、クロール時点で512ポイントと172件のコメントを集めた。KittenMLは15M、40M、80MのONNX音声合成モデル、8つのEnglish voice、24kHz出力、CPU推論を前面に出している。
Kitten TTS v0.8は、CPUで動く15Mから80MのONNX音声モデルとしてHacker Newsで注目を集め、実運用性や学習データへの質問も呼び込んだ。
IBMは2026年3月9日、Granite 4.0 1B Speechを公開した。前世代の約半分のparameterで英語ASR精度を改善し、speculative decodingによる高速化、日本語を含む多言語対応を打ち出している。
Microsoft Researchは、tiny language modelsを用いた推論拡張の新成果を公表した。2-bit量子化とternary weight設計、最大8倍高速化・4倍メモリ削減という効率指標を前面に出し、edge実装の実用性を訴求している。
Show HNでMoonshine Voiceが拡散した。プロジェクトはリアルタイム音声向けに、精度と遅延の両立を狙う実装を前面に出している。
ESP32マイクロコントローラ上でわずか888KB未満で動作するClaw系パーソナルAIアシスタント「zclaw」がGitHubで公開されました。Hacker Newsで161ポイントを獲得し、エッジAIの可能性を示しています。
LocalLLaMAの高反応投稿でKitten TTS v0.8が注目を集めた。80M/40M/14Mの公開モデルとCPU実行、最小25MB未満という軽量性が論点になっている。
r/MachineLearningの投稿は、同じ重み・同じONNX export条件でも、Snapdragon 5機種でオンデバイス精度が91.8%から71.2%まで広がったと報告した。