Ollama、Apple Silicon向けMLXベース実装をプレビュー公開

2026年3月31日、Ollamaの新しいMLXランタイムを扱ったHacker News投稿は605ポイント、328件のコメントを集めた。リンク先は2026年3月30日に公開されたOllamaの発表で、Apple Silicon向けビルドをAppleのMLX framework上で動かし、unified memoryをより効率よく使うという内容だ。

公式発表によれば、このpreviewは単なるデモではなく、ローカルcoding agentとagentic workflowを主な対象としている。Ollamaは、新しいスタックによってtime to first tokenとdecode速度の両方が改善し、M5、M5 Pro、M5 MaxではGPU Neural Acceleratorsも活用できると説明している。公開時のデモではNVFP4で量子化したAlibabaのQwen3.5-35B-A3Bを使い、Ollamaは0.19でint4 quantization時にprefill 1851 token/s、decode 134 token/sまでさらに伸びる可能性があると述べた。

今回の発表で重要な点

Apple Silicon向け推論経路をMLXベースに組み直した。
NVFP4対応により、品質を維持しながらmemory bandwidthとstorage負荷の低減を狙う。
conversation間のcache再利用、intelligent checkpoints、smarter evictionを追加し、長時間のagentセッションに最適化した。
現時点のpreviewはQwen3.5 codingモデル中心で、32GB超のunified memoryを持つMacが推奨される。

注目すべきなのは単純なtoken速度だけではない。Claude Code、OpenCode、Codexのようなツールは大きなsystem promptやtool traceを何度も送り直すため、ローカル実行では待ち時間が目立ちやすい。Ollamaはcacheをbranch間で再利用し、promptの節目にcheckpointを残すことで、その種の遅さを抑えようとしている。つまり今回の更新は、ローカルagentを日常の開発フローに入れやすくするための基盤整備として見るべきだ。

もっとも、公開されている数値はベンダーが示したlaunch-dayデータであり、旧世代のM-series機や実際のIDE連携で同じ傾向が出るかは別途検証が必要だ。それでもHacker Newsで反応が大きかったのは、開発者がconsumer Macとcloud inferenceの間の距離を縮めるローカルLLMスタックを求めていたからだ。今回のMLX移行は、その期待にかなり直接的に応える発表だと言える。

コミュニティソース: Hacker News議論。一次ソース: Ollamaブログ。

Ollama、Apple Silicon向けMLXベース実装をプレビュー公開

今回の発表で重要な点

Related Articles

Ollama、Apple Silicon向けMLX previewを公開ローカルLLM性能を大幅強化

r/LocalLLaMA、M1 ProでQwen 3.5 9Bを実際のローカルagentとして試す

LocalLLaMA、Apple SiliconでDFlashによりQwen推論が2〜3倍高速化と報告

Comments (0)

Leave a Comment

Related Articles

Ollama、Apple Silicon向けMLX previewを公開ローカルLLM性能を大幅強化
LLM Hacker News Mar 31, 2026 1 min read

r/LocalLLaMA、M1 ProでQwen 3.5 9Bを実際のローカルagentとして試す
LLM Reddit Mar 10, 2026 1 min read

LocalLLaMA、Apple SiliconでDFlashによりQwen推論が2〜3倍高速化と報告
LLM Reddit Apr 11, 2026 1 min read

今回の発表で重要な点

Related Articles

Ollama、Apple Silicon向けMLX previewを公開 ローカルLLM性能を大幅強化

r/LocalLLaMA、M1 ProでQwen 3.5 9Bを実際のローカルagentとして試す

LocalLLaMA、Apple SiliconでDFlashによりQwen推論が2〜3倍高速化と報告

Comments (0)

Leave a Comment

Ollama、Apple Silicon向けMLX previewを公開ローカルLLM性能を大幅強化