#gemma4

LLM Reddit Apr 15, 2026 1 min read

LocalLLaMAが反応した Gemma-4 audio 対応、llama-server で STT をそのまま回す流れ

LocalLLaMAでこのthreadが伸びたのは、local agent 構成から別建ての音声パイプラインを一つ減らせる期待があるからだ。投稿では llama-server が Gemma-4 E2A と E4A で STT を扱えるようになったとされ、comment はすぐに Whisper や Voxtral との実用比較へ進んだ。

#llama.cpp #gemma4 #speech-to-text

LLM Reddit Apr 4, 2026 1 min read

LocalLLaMA、RTX 5090 1枚で Gemma 4 31B の 256K context benchmark を共有

`r/LocalLLaMA` の benchmark post は、TurboQuant KV cache compression により RTX 5090 1 枚で Gemma 4 31B を 256K context まで動かしたと主張する。速度だけでなく VRAM usage、Windows/MSVC build fix、KV quant の品質懸念まで共有している点が注目された。

#gemma4 #llama.cpp #kv-cache

LLM Hacker News Apr 4, 2026 1 min read

HNで注目された Mac mini 向け Ollama + Gemma 4 実践セットアップ

Apple Silicon の Mac mini で Ollama と Gemma 4 を運用する実践 gist が HN で注目された。投稿者は `gemma4:26b` が 24GB unified memory をほぼ使い切ると述べ、default 8B model と preload/keep-alive 設定を現実的な運用案として示した。

#ollama #gemma4 #mac-mini