重要なのは、enterprise OCRの失敗がacademic PDF benchmarkより早くagentを壊すことだ。LlamaIndexはParseBenchがhuman-verifiedの約2,000ページと16.7万超のrulesで14手法をKaggle上で比較すると述べた。
#llamaindex
RSS FeedAI X/Twitter Apr 23, 2026 1 min read
LLM X/Twitter Apr 22, 2026 1 min read
重要なのは、document agentsがPDF parsing段階でtablesやcolumnsを失うとreasoningも壊れることだ。LiteParseはheavy layout modelではなくmonospace grid projectionを使い、codeをopen sourceで公開している。
AI X/Twitter Apr 19, 2026 1 min read
重要なのは、document agentsがtables、chart values、visual groundingを失うと業務判断が崩れることだ。ParseBenchは約2,000ページのenterprise documents、167K+ rule-based tests、14 methodsの評価を示す。
LLM Hacker News Mar 27, 2026 1 min read
Andros Fenollosaの振り返りがHacker Newsで反応を集めたのは、production RAGをprompt demoではなくdataと運用の問題として描いたからだ。
LLM Reddit Mar 9, 2026 1 min read
LocalLLaMAの議論と関連GitHub issueは、LlamaIndexがnested componentでmodelを明示注入しない場合にOpenAI-by-default挙動でlocal-first RAG開発者を混乱させうると指摘している。maintainer側はこの挙動が以前から文書化されていると説明する一方、communityはsovereign deployment向けのより厳しいfail-fast modeを求めている。