#efficiency

LLM Hacker News Apr 1, 2026 1 min read

Show HN: 1-Bit Bonsai가 던진 질문, 초저메모리 LLM은 edge에서 어디까지 갈 수 있나

Hacker News에 올라온 Prism ML의 1-Bit Bonsai는 1.15GB 8B model부터 iPhone급 1.7B model까지, 1-bit weight로 edge inference economics를 다시 쓰겠다는 시도다. 핵심은 parameter count보다 intelligence density와 hardware fit을 전면에 내세운 점이다.

#edge-ai #1-bit-llm #inference

LLM Mar 14, 2026 2 min read

Ares 논문, LLM agent 추론 비용 최대 52.7% 절감 제시

2026년 3월 9일 제출된 arXiv 논문 Ares는 multi-step LLM agent에서 단계별 reasoning effort를 동적으로 조절하는 방식을 제안했다. 저자들은 fixed high-effort 대비 reasoning token 사용량을 최대 52.7% 줄이면서 성공률 저하는 작았다고 보고했다.

#llm-agents #reasoning #efficiency

LLM Feb 11, 2026 2 min read

DeepSeek mHC 아키텍처, AI 모델 스케일링의 근본 문제 해결... 훈련 안정성 혁신

DeepSeek가 mHC(Manifold-Constrained Hyper-Connections) 아키텍처를 발표하며 트랜스포머의 훈련 불안정성 문제를 해결했다. 6-7% 연산 오버헤드만으로 안정적인 대규모 모델 훈련이 가능해졌다.

#deepseek #research #architecture