#edge-ai

LLM Hacker News 8h ago 1 min read

8ドルのESP32で28.9M LLM、鍵はflashに置く重み

小さなmicrocontrollerでLLMを動かす実験の焦点は、賢さではなくmemory layoutだ。25M parametersをflashに置き、tokenごとに必要な行だけ読む。

AI 5d ago 1 min read

Cosmos 3 Edge、4B世界モデルでphysical AIをedgeへ寄せる

NVIDIAのSIGGRAPH発表は、physical AIをクラウド上のデモからedge配備へ寄せる内容だった。4BのCosmos 3 Edge、Synthetic Video Detector NIM、Nemotron 3 Ultraを使うDGX Station agent stackが中心だ。

#nvidia #cosmos #physical-ai

AI Jun 16, 2026 1 min read

軌道上VLMが初の対象探索、衛星データの詰まりを宇宙で減らす道

衛星画像は地上に下ろしてから分析する、という前提が揺らぎ始めた。YAM-9上でGemma 3ベースのVLMが自然言語クエリに応じて関心領域を探した初報告事例だ。

#space-ai #vlm #gemma

LLM X/Twitter Jun 7, 2026 1 min read

Gemma 4 QAT、エッジ向けモデルのメモリを1GB目標まで圧縮

GoogleはGemma 4 QATチェックポイントを公開し、エッジ端末と消費者向けGPUでのローカル推論を狙う。モバイル形式ではGemma 4 E2Bのメモリが1GBまで下がる。

#google #gemma #qat

LLM Hacker News May 30, 2026 1 min read

Liquid AI、38Tトークン学習のMoEモデルLFM2.5を公開

Liquid AIがLFM2.5 8B-A1Bを発表。M5 Maxで毎秒253トークン、モバイルで30トークン、H100で18,500トークンの推論速度を達成し、同サイズの密なモデルを凌駕する性能を示した。

#liquid-ai #llm #moe

LLM Reddit Apr 17, 2026 1 min read

Ternary Bonsai、LocalLLaMAはcompression claimの比較軸を疑った

LocalLLaMAは1.58-bit modelの約束に反応したが、threadはすぐに厳しい問いへ向かった。比較相手がquantized Qwen peersではなくfull-precision baselineなら公平なのか。

#model-compression #local-llms #bonsai

AI Apr 14, 2026 1 min read

軌道上のGPU clusterが商用段階へ、Nvidia Orin 40基で顧客18社

宇宙data centerはまだ未来の言葉に近いが、宇宙inferenceはもう事業の形を取り始めている。Keplerのclusterは10基の衛星にNvidia Orin 40基を載せ、顧客18社を得て、space computeをpitch deckの外へ引き出した。

#kepler #space-computing #nvidia

AI Apr 14, 2026 1 min read

DeepX、on-device AI chipを軸に韓国IPOの準備へ

AI siliconへの投資熱がdata center大手の外まで広がるかを測る場面が来た。Reutersによれば、韓国のDeepXは国内上場の準備に入り、2026年前半のfunding round完了後にIPO主幹事を選び、その先のU.S. listingも視野に入れている。

#deepx #ai-chips #ipo

LLM Reddit Apr 6, 2026 1 min read

Reddit が注目した Parlor、Gemma 4 E2B で動くリアルタイムのローカル音声・視覚 assistant

LocalLLaMA のデモ投稿は、Gemma 4 E2B で speech と vision を理解し、Kokoro で text-to-speech を行う Parlor を紹介した。README では Apple M3 Pro 上で end-to-end latency 約 2.5-3.0 秒、decode speed 約 83 tokens/sec とされている。

#llm #multimodal #edge-ai

LLM Reddit Apr 5, 2026 1 min read

Gemma 4のon-device Agent Skills展開にRedditが注目

RedditではGoogleのGemma 4 edge展開が注目され、on-device Agent SkillsとLiteRT-LM runtimeが話題になった。1.5GB未満のmemory、128K context、Raspberry Pi 5とQualcomm NPUのbenchmarkが主要ポイントだ。

#gemma #edge-ai #on-device

LLM X/Twitter Apr 2, 2026 1 min read

Google、Gemma 4 を公開… Apache 2.0 license と最大 256K context を提供

Googleは2026年4月2日、Gemma 4を自社で最も強力なopen model familyだと発表し、Gemini 3と同じ技術基盤から構築されたと説明した。GoogleはE2B、E4B、26B MoE、31B Denseを用意し、function-calling、structured JSON output、最大256K context、Apache 2.0 licenseを提供するとしている。

#google #gemma #open-models

LLM Reddit Apr 2, 2026 1 min read

Redditが試したPrismML Bonsai 1-bitモデル、発表以上に軽いlocal LLM

r/LocalLLaMAの反応は、PrismML Bonsai の発表が単なる compression headline 以上に受け止められていることを示している。会社の end-to-end 1-bit 設計の主張と、実際の利用者が感じた使い勝手の改善が同時に語られている。

#bonsai #1-bit #edge-ai