Show HN: Timber, 고전 ML 모델을 초소형 C 바이너리로 컴파일해 초저지연 추론 제시

Timber가 제시한 접근

2026년 3월 Show HN에 공개된 Timber는 LLM이 아닌 고전 ML 추론 경로를 겨냥한 오픈소스 컴파일러 프로젝트다. README에 따르면 XGBoost, LightGBM, scikit-learn, CatBoost, ONNX 트리 연산자 모델을 입력으로 받아 Python 런타임 의존성 없이 실행 가능한 C99 추론 바이너리를 생성한다. 기본 제공 서버는 Ollama 호환 API를 제공해 별도 서빙 계층 없이도 빠르게 배포할 수 있도록 설계됐다.

프로젝트는 사기 탐지, 리스크 점수화, 엣지 디바이스처럼 예측 가능하고 지연 민감한 환경을 주요 사용처로 제시한다. 예시 모델 기준 컴파일 결과물 크기를 약 48KB 수준으로 제시한 점도 눈에 띈다.

컴파일 파이프라인과 인터페이스

문서 기준 파이프라인은 파서 → 중간표현(IR) → 최적화 → C99 코드 생성 → 네이티브 컴파일 순서다. 최적화 단계에는 dead-leaf elimination, threshold quantization, constant-feature folding, branch sorting 등이 포함된다. 서빙 측면에서는 /api/predict, /api/models, /api/health 같은 엔드포인트를 제공한다.

이미 트리 기반 모델 운영 체계를 갖춘 팀이라면, hot path에서 Python을 제거해 배포 크기·콜드스타트·지연 특성을 통제하기 쉬워질 수 있다는 점이 핵심 포인트다.

성능 수치 해석

프로젝트가 공개한 벤치마크는 단일 샘플 약 2마이크로초 추론, Python XGBoost 대비 약 336배 속도 향상을 주장한다(Apple M2 Pro, 50-tree 분류기 시나리오). ONNX Runtime, Treelite 비교 수치도 함께 제공된다. 다만 이는 작성자 환경 기준이므로 실제 도입 전에는 자체 데이터 전처리, 네트워크 오버헤드, 배치 전략을 반영한 재현 검증이 필요하다.

HN 토론에서 나온 쟁점

해당 HN 글은 199점, 댓글 33개를 기록했다. 반응은 두 갈래였다. 하나는 “생성형 AI 일변도에서 고전 ML 인프라 개선이 반갑다”는 평가, 다른 하나는 “현업 병목은 추론보다 전처리 파이프라인”이라는 실무 관점이다. 결국 Timber의 가치는 워크로드 성격에 따라 달라진다. 반복 점수화가 병목인 환경에서는 이점이 크고, 특징 생성이 병목인 환경에서는 효과가 제한될 수 있다.

Timber repository · Hacker News discussion

Show HN: Timber, 고전 ML 모델을 초소형 C 바이너리로 컴파일해 초저지연 추론 제시

Timber가 제시한 접근

컴파일 파이프라인과 인터페이스

성능 수치 해석

HN 토론에서 나온 쟁점

Related Articles

Wasm에서 GPU로 zero-copy inference, HN은 “어디서 빨라지나”를 물었다

학습용과 추론용을 갈랐다, TPU 8t·8i에 HN이 주목한 지점

LMSYS, DeepSeek-V4 Day-0 지원에서 H200 266 tok/s 성능을 제시

Comments (0)

Leave a Comment

Related Articles

Wasm에서 GPU로 zero-copy inference, HN은 “어디서 빨라지나”를 물었다
AI Hacker News Apr 20, 2026 1 min read

학습용과 추론용을 갈랐다, TPU 8t·8i에 HN이 주목한 지점

LMSYS, DeepSeek-V4 Day-0 지원에서 H200 266 tok/s 성능을 제시