LLM Hacker News Apr 3, 2026 1 min read
Lemonade는 GPU·NPU를 겨냥한 OpenAI-compatible server로 local AI inference를 패키징해, everyday PC에서 open model 배포를 더 쉽게 하려는 스택이다.
Lemonade는 GPU·NPU를 겨냥한 OpenAI-compatible server로 local AI inference를 패키징해, everyday PC에서 open model 배포를 더 쉽게 하려는 스택이다.
LocalLLaMA 커뮤니티는 2026년 3월 11일 공개된 FastFlowLM·Lemonade 업데이트를 통해 AMD XDNA 2 NPU의 Linux 지원 경로가 구체화됐다고 평가했다.
Mac Mini M4를 보유한 개발자가 Claude의 도움을 받아 Apple의 비공개 Neural Engine(ANE) API를 역설계하고, 이를 활용해 110M 파라미터 Microgpt 모델을 훈련시키는 데 성공했다.