#model-compression

LLM Reddit Apr 17, 2026 2 min read

Ternary Bonsai, LocalLLaMA는 압축 claim의 공정성을 먼저 따졌다

LocalLLaMA는 1.58-bit model의 가능성에 반응했지만, thread는 곧 어려운 질문으로 향했다. 비교 대상이 quantized Qwen peers가 아니라 full-precision baseline이면 공정한가.

#model-compression #local-llms #bonsai

LLM Reddit Apr 1, 2026 1 min read

PrismML, 1-bit Bonsai로 온디바이스 LLM 압축 경쟁에 진입

r/LocalLLaMA에서 주목받은 PrismML의 1-bit Bonsai는 8.2B 파라미터를 1.15GB로 줄인 end-to-end 1-bit LLM을 전면에 내세운다. 온디바이스 배포, throughput, energy efficiency를 동시에 노린 launch라는 점이 핵심이다.

#prismml #1-bit-llm #edge-ai