Kreuzberg v4.5、Rust-nativeで文書レイアウト抽出を高速化
Original: Kreuzberg v4.5.0: We loved Docling's model so much that we gave it a faster engine View original →
r/LocalLLaMAの投稿は、クロール時点で50ポイント、21コメントだった。投稿によれば、KreuzbergはMITライセンスのopen-source document intelligence frameworkで、Rust実装を中心にPython、TypeScript/Node.js、PHP、Ruby、Java、C#、Go、Elixir、R、C、WASMを含む12言語向けbindingを提供する。88以上のformatからtext、structure、metadataを抽出し、OCRとembeddingsまで処理できることを基本機能としている。
v4.5の最大の変更点は、文書を単なるtext sourceではなく、layoutとtableを持つ構造化オブジェクトとして扱うようになったことだ。投稿では、DoclingのRT-DETR v2 layout model、いわゆるDocling HeronをRust-native pipelineに組み込んだと説明している。tableを含むページでは、検出領域を切り出してTATR(Table Transformer)を実行し、推定されたcell gridをPDF text positionと突き合わせてmarkdown tableを再構成する。
benchmarkの説明はかなり具体的だ。academic papers、government/legal docs、invoices、OCR scans、edge casesを含む171件のPDFで、KreuzbergはStructure F1 42.1%、Text F1 88.9%、平均処理時間1,032 ms/docを記録したという。比較対象として示されたDoclingは41.7%、86.7%、2,894 ms/docで、投稿の主張をそのまま受け取れば、品質は同等以上で平均2.8倍前後高速ということになる。
速度改善の理由として、Kreuzbergはnative text layerがあるPDFではpdfiumを使って文字単位の位置情報とfont metadataを保持し、text layerがない場合はTesseract OCRへ自動fallbackする。推論にはONNX Runtime、ページ並列化にはRayonを使う。さらにbroken font CMap tablesによる"co mputer"のような崩れを修正するpage-level respacingで、影響テスト文書のgarbled linesを406から0へ減らしたと説明している。multi-backend OCR、PaddleOCR v2の18,000+文字多言語モデル、extraction result cachingも追加された。
- binding: 12言語
- 対応format: 88+
- benchmark: 171 PDFs, 1,032 ms/doc, Structure F1 42.1%, Text F1 88.9%
このリリースが重要なのは、document AIが単なるOCR競争ではなく、layout understanding、table recovery、多言語fallback、運用効率を同時に求めるsystems problemになっているからだ。KreuzbergはそれをPython中心ではなくRust-nativeな配布形態で解こうとしている。すでにDoclingを使っているチームにとっても、v4.5は単なるwrapperではなく、実測比較に値するアップデートと言えそうだ。
Related Articles
2026年3月9日のLocalLLaMAでは、Fish Audio S2がfine-grained inline control、multilingual対応、SGLangベースのstreaming stackをまとめて提示した点が注目された。
Anthropicは2026年3月17日、AIの高度化に伴ってopen source securityの重要性が増していると述べた。X投稿では、AIが依存するソフトウェア基盤を守るためLinux Foundationに寄付すると説明している。
2026年3月19日にHacker Newsで注目を集めたagent-satは、weighted MaxSAT benchmarkを相手にAIエージェントが実験とコード改良を繰り返すopen-source projectだ。READMEによれば、2024 MaxSAT Evaluationの229インスタンス中220件を解き、5件でcompetition bestを上回り、1件はnovel solveだという。
Comments (0)
No comments yet. Be the first to comment!