LLM Hacker News Apr 3, 2026 1 min read
Lemonadeは GPU・NPU向けの OpenAI-compatible serverとして local AI inferenceをまとめ、everyday PCで open modelを導入しやすくすることを狙う。
Lemonadeは GPU・NPU向けの OpenAI-compatible serverとして local AI inferenceをまとめ、everyday PCで open modelを導入しやすくすることを狙う。
LocalLLaMAでは、2026年3月11日に公開されたFastFlowLMとLemonadeの更新により、AMD XDNA 2 NPUでLinux上のLLM実行経路がかなり具体化したと受け止められた。
Mac Mini M4を持つ開発者がClaudeの助けを借りてAppleの非公開Neural Engine(ANE) APIをリバースエンジニアリングし、CoreMLを迂回してANE上で110Mパラメータ版Microgptモデルの訓練に成功した。