#ggml

LLM Reddit Mar 31, 2026 1 min read

LocalLLaMA에서 떠오른 llama.cpp용 Apple Neural Engine backend 실험

r/LocalLLaMA에서 공유된 새 실험은 Apple Neural Engine을 llama.cpp의 prefill 경로에 연결하려는 시도다. 공식 upstream 기능은 아니지만, M4 Pro 기준 CPU 대비 큰 폭의 가속 수치가 제시되며 커뮤니티의 관심을 끌었다.

#llama.cpp #apple-silicon #ane

LLM Reddit Feb 22, 2026 1 min read

ggml.ai 팀, Hugging Face 합류 발표... llama.cpp 오픈소스 유지·확장 강조

r/LocalLLaMA 고반응 글이 ggml.ai 팀의 Hugging Face 합류 소식을 확산시켰다. GitHub 공지는 ggml/llama.cpp의 full-time 유지보수 지속과 Local AI 생태계 확장을 핵심 메시지로 제시했다.

#ggml #llama-cpp #hugging-face

LLM Hacker News Feb 21, 2026 1 min read

HN 주목: ggml.ai 팀의 Hugging Face 합류와 함께 llama.cpp 오픈 거버넌스 유지 선언

Hacker News 고득점 스레드는 ggml-org/llama.cpp 공지 #19759를 조명했다. ggml.ai 핵심 팀은 Hugging Face에 합류하지만, ggml/llama.cpp는 기존처럼 오픈소스·커뮤니티 중심으로 운영된다고 명시했다.

#llama-cpp #ggml #hugging-face

LLM Reddit Feb 20, 2026 1 min read

Reddit 주목: ik_llama.cpp의 IQ*_K 계열을 llama.cpp 본선으로 옮기는 Draft PR 등장

LocalLLaMA에서 주목받은 PR #19726은 ik_llama.cpp의 IQ*_K 계열 quantization 경로를 mainline llama.cpp로 포팅하는 초안으로, CPU backend 구현과 초기 KLD 비교를 함께 제시했다.

#llama-cpp #quantization #ggml