HNはローカル推論、APIキー不要、プライバシー面のうまみをすぐ理解した。その一方で、ブラウザAIが実用品になるには保存容量とハードウェア条件がまだ重いという反応も強かった。
#on-device
RSS FeedLocalLLaMAで伸びた理由は、単なる「新モデルが強い」という話ではなかった。投稿者はM5 Max 128GB環境で、普段ならOpusやCodexに任せるworkloadをQwen 3.6で試したとし、実用上のポイントとしてpreserve_thinkingを有効にする必要を挙げた。
Google AI Edge TeamはApril 2, 2026、Gemma 4がApache 2.0 licenseの下でphone、desktop、edge hardwareへmulti-step agentic workflowを持ち込むと発表した。今回のlaunchはopen models、Agent Skills、LiteRT-LM deployment toolingを組み合わせている。
RedditではGoogleのGemma 4 edge展開が注目され、on-device Agent SkillsとLiteRT-LM runtimeが話題になった。1.5GB未満のmemory、128K context、Raspberry Pi 5とQualcomm NPUのbenchmarkが主要ポイントだ。
Apfel を扱った Show HN 投稿は今回の 2026年4月4日クロールで 513 points と 117 comments を集め、Apple の on-device foundation model を CLI、chat interface、OpenAI-compatible local server として使える Swift ツールに関心が集まった。
LocalLLaMAの高反応投稿でKitten TTS v0.8が注目を集めた。80M/40M/14Mの公開モデルとCPU実行、最小25MB未満という軽量性が論点になっている。