Show HN: Timber、古典MLモデルを小型Cバイナリ化して超低遅延推論を狙う

Timberが示した方向性

2026年3月のShow HNで公開されたTimberは、LLM推論ではなく古典的なMLモデル推論を対象にしたオープンソースのコンパイラプロジェクトだ。READMEではXGBoost、LightGBM、scikit-learn、CatBoost、ONNXのツリー系モデルを入力に、Python実行環境へ依存しないC99推論成果物を生成できるとしている。標準のサーバーはOllama互換APIを備え、既存アプリへの組み込みを容易にする設計になっている。

用途としては、不正検知、リスクスコアリング、エッジ推論など、低遅延と決定論的挙動が重視される領域を想定。サンプルでは約48KBのコンパイル済みバイナリ例も示されている。

パイプライン構成とAPI

公開ドキュメント上の流れは、パース → 中間表現（IR） → 最適化 → C99生成 → ネイティブコンパイル。最適化にはdead-leaf elimination、threshold quantization、constant-feature folding、branch sortingが含まれる。推論サーバーは/api/predict、/api/models、/api/healthなどのエンドポイントを提供する。

既にツリーモデルを本番運用している組織にとっては、ホットパスからPythonを外すことで、レイテンシ・起動時間・配布サイズの制御性を高められる可能性がある。

性能主張の読み方

プロジェクトが提示したベンチマークでは、単一サンプル約2マイクロ秒、Python XGBoost比で約336倍高速という結果が示される（Apple M2 Pro、50木分類器の条件）。ONNX RuntimeやTreeliteとの比較値も併記されている。もっとも、これらは作成者環境の数値であり、実導入時は前処理コスト、I/O、配信方式を含めた再検証が必要だ。

Hacker Newsでの議論

この投稿はクロール時点で199ポイント、33コメント。反応は「生成AI偏重の中で古典MLインフラ改善は有益」という支持と、「実務ボトルネックは推論より前処理」という慎重論に分かれた。要するにTimberの価値はワークロード依存で、反復スコアリングが支配的な環境では有効性が高く、特徴量生成が支配的な環境では効果が限定される可能性がある。

Timber repository · Hacker News discussion

Show HN: Timber、古典MLモデルを小型Cバイナリ化して超低遅延推論を狙う

Timberが示した方向性

パイプライン構成とAPI

性能主張の読み方

Hacker Newsでの議論

Related Articles

WasmからGPUへのzero-copy inference、HNは速度差の実体を問うた

TPU 8tと8i、HNが見た本質は「学習用と推論用を分けたこと」

LMSYS、DeepSeek-V4 Day-0対応でH200 266 tok/sの実測スループットを示した

Comments (0)

Leave a Comment

Related Articles

WasmからGPUへのzero-copy inference、HNは速度差の実体を問うた
AI Hacker News Apr 20, 2026 1 min read

TPU 8tと8i、HNが見た本質は「学習用と推論用を分けたこと」

LMSYS、DeepSeek-V4 Day-0対応でH200 266 tok/sの実測スループットを示した
重要なのは、model launchの成否がweightsだけでなくservingとtrainingの支援に左右されることだ。LMSYSはDay-0 stackでB200 199 tok/s、H200 266 tok/sを示し、900K contextでも落ち込みが小さいと書いた。