#onnx

LLM Reddit Mar 26, 2026 1 min read

Liquid AIのブラウザ推論デモをLocalLLaMAが注目した理由

LocalLLaMAのpostは、Liquid AIのLFM2-24B-A2BがM4 Max browserで約50 tokens per secondと主張し、79 pointsと11 commentsを集めた。communityの関心はsparse MoE architecture、ONNX packaging、そしてWebGPUがlocal AI deployment targetをどこまで広げるかに向かった。

#liquid-ai #webgpu #onnx

AI Hacker News Mar 20, 2026 1 min read

Hacker NewsでKitten TTSが話題、25MB級のCPU向け軽量音声モデルに注目

2026年3月19日にHacker Newsへ投稿されたKitten TTSスレッドは、クロール時点で512ポイントと172件のコメントを集めた。KittenMLは15M、40M、80MのONNX音声合成モデル、8つのEnglish voice、24kHz出力、CPU推論を前面に出している。

#text-to-speech #edge-ai #onnx

AI Hacker News Mar 20, 2026 1 min read

Hacker Newsで注目された超小型CPU向けTTS、Kitten TTS v0.8

Kitten TTS v0.8は、CPUで動く15Mから80MのONNX音声モデルとしてHacker Newsで注目を集め、実運用性や学習データへの質問も呼び込んだ。

#tts #onnx #edge-ai

AI Reddit Feb 18, 2026 1 min read

Reddit ML報告: 同一INT8 ONNXモデルでもSnapdragon世代で精度が大きく乖離

r/MachineLearningの投稿は、同じ重み・同じONNX export条件でも、Snapdragon 5機種でオンデバイス精度が91.8%から71.2%まで広がったと報告した。

#edge-ai #quantization #snapdragon