LLM Reddit Mar 31, 2026 1 min read
r/LocalLLaMAで共有された新しい実験は、Apple Neural Engineをllama.cppのprefill経路へつなぐ試みだ。公式upstream機能ではないが、M4 ProでCPU比の大きな加速値が示され、コミュニティの関心を集めた。
r/LocalLLaMAで共有された新しい実験は、Apple Neural Engineをllama.cppのprefill経路へつなぐ試みだ。公式upstream機能ではないが、M4 ProでCPU比の大きな加速値が示され、コミュニティの関心を集めた。