#ollama

LLM Reddit May 6, 2026 1 min read

Ollamaに認証不要のメモリ漏洩脆弱性「Bleeding Llama」が発見

セキュリティ研究会社Cyeraが、Ollamaで認証なしにメモリを漏洩させられる深刻な脆弱性「Bleeding Llama」を発見した。ネットワーク公開している場合は即時パッチが必要だ。

LLM Hacker News Apr 16, 2026 1 min read

HNはOllama批判をlocal LLMツールの信頼テストとして読んだ

HNが強く反応したのは、wrapperの好き嫌いではなく、local LLM stackで誰がcreditとcontrolを握るのかという違和感だった。Sleeping Robotsの記事は、Ollamaがllama.cppの上で広がりながら attribution、model packaging、cloud routing、model storageで信頼を削ったと批判し、コメント欄では「それでもUXは強い」という反論も出た。

#local-llm #ollama #llama-cpp

LLM Reddit Apr 15, 2026 1 min read

48GB GPUよりXiaomiのスマホ1台、Redditが沸いたヘッドレスGemma 4サーバー

Redditが沸いたのは、また一台ハイエンドGPU機が出てきたからではなく、スマホをGemma 4サーバーに変えてしまったからだ。盛り上がりの中心はpeak benchmarkではなく、身近なhardwareでもlocal inferenceを回せるという手触りにあった。

#local-llm #android #gemma

LLM Hacker News Apr 14, 2026 1 min read

Hacker Newsが注目したGemma 4 local-agent実験: Codex CLIをcloud外で動かす現実的レシピ

Daniel VaughanのGemma 4検証は、local modelが本当にCodex CLIのagentとして使えるのかを、具体的な設定値と失敗パターンまで含めて示した。ポイントはApple SiliconではOllamaを避け、llama.cppと`--jinja`、KV cache quantization、`web_search = "disabled"`を組み合わせる必要があったことだ。

#gemma-4 #codex-cli #local-llm

LLM Hacker News Apr 4, 2026 1 min read

HNで注目された Mac mini 向け Ollama + Gemma 4 実践セットアップ

Apple Silicon の Mac mini で Ollama と Gemma 4 を運用する実践 gist が HN で注目された。投稿者は `gemma4:26b` が 24GB unified memory をほぼ使い切ると述べ、default 8B model と preload/keep-alive 設定を現実的な運用案として示した。

#ollama #gemma4 #mac-mini

LLM Hacker News Apr 1, 2026 1 min read

Ollama、Apple Silicon向けMLXベース実装をプレビュー公開

2026年3月31日にHacker Newsで上位に入ったOllamaのMLX発表は、Apple Siliconでのローカルcoding agent性能を押し上げる試みだ。MLX、NVFP4、改良されたcache戦略を組み合わせ、macOS上のローカル推論ボトルネックを減らすことを狙っている。

#ollama #mlx #apple-silicon

LLM Hacker News Mar 31, 2026 1 min read

Ollama、Apple Silicon向けMLX previewを公開ローカルLLM性能を大幅強化

Ollamaが2026年3月30日にApple Silicon向けのMLX previewを公開した。MLX、NVFP4、改良されたcacheを組み合わせ、prefillとdecodeの両方を高速化したとしてHacker Newsでも注目を集めた。

#ollama #mlx #apple-silicon

LLM X/Twitter Mar 27, 2026 1 min read

Ollama modelsがVS CodeのGitHub Copilot Chat model pickerに入る

Ollamaは2026年3月26日、VS CodeがGitHub Copilot経由でOllamaと統合され、localまたはcloudのOllama modelsをeditor内で直接選べるようになったと述べた。Ollama docsによれば、VS Code 1.113+、GitHub Copilot Chat 0.41.0+、Ollama v0.18.3+で、GitHub Copilot Freeだけでもcustom model selectionを有効にできる。

#ollama #github-copilot #vscode

LLM Hacker News Mar 27, 2026 1 min read

Hacker Newsが見直したproduction RAGの現実、local modelで451GBを扱う方法

Andros Fenollosaの振り返りがHacker Newsで反応を集めたのは、production RAGをprompt demoではなくdataと運用の問題として描いたからだ。

#rag #llamaindex #chromadb

LLM X/Twitter Mar 21, 2026 1 min read

Ollama、MiniMax-M2.7:cloudを提供　coding・agent workflow向け

Ollamaは2026年3月18日、MiniMax-M2.7をcloud経由で提供し、Claude CodeとOpenClawから起動できると発表した。Ollamaのライブラリページは、このモデルをcoding・agent workflow・professional productivity向けと位置づけ、SWE-Pro、VIBE-Pro、Terminal Bench 2、GDPval-AA、Toolathonの成績を示している。

#ollama #minimax #coding-models

LLM X/Twitter Mar 21, 2026 1 min read

Ollama、NVIDIA Nemotron-Cascade-2を公開　local・agent workflow向け30B MoE reasoning modelを提供

Ollamaは2026年3月20日、NVIDIAのNemotron-Cascade-2を自社のlocal model stackで実行できるようになったと発表した。公式モデルページでは、3B activated parameterを使うopen 30B MoE modelとして紹介し、thinking・instructモードとOpenClaw・Codex・Claude向け導線を示している。

#ollama #nvidia #nemotron-cascade-2

LLM Reddit Mar 10, 2026 1 min read

r/LocalLLaMA、M1 ProでQwen 3.5 9Bを実際のローカルagentとして試す

高スコアのLocalLLaMA投稿では、16GBのM1 Pro上でQwen 3.5 9Bがmemory recallと基本的なtool callingを実運用向けにこなしつつ、creative reasoningでは依然としてfrontier modelに及ばなかったと報告された。

#qwen #local-llm #ollama