#parsebench

AI X/Twitter Apr 23, 2026 1 min read

ParseBench、Kaggleで2,000企業ページと16.7万OCR ruleをagent評価向けに公開

重要なのは、enterprise OCRの失敗がacademic PDF benchmarkより早くagentを壊すことだ。LlamaIndexはParseBenchがhuman-verifiedの約2,000ページと16.7万超のrulesで14手法をKaggle上で比較すると述べた。

#llamaindex #parsebench #ocr

AI X/Twitter Apr 19, 2026 1 min read

ParseBench、実企業文書OCR agentを16.7万規則で検証するbenchmarkを示した

重要なのは、document agentsがtables、chart values、visual groundingを失うと業務判断が崩れることだ。ParseBenchは約2,000ページのenterprise documents、167K+ rule-based tests、14 methodsの評価を示す。

#llamaindex #parsebench #ocr