#document-ai

LLM Reddit Apr 24, 2026 2 min read

OCR에서 비싼 최신 모델이 늘 답은 아니라는 결과, r/MachineLearning 반응

r/MachineLearning이 이 글에 주목한 이유는 “누가 1등인가”보다 “문서 추출에서 너무 비싼 모델을 습관처럼 쓰고 있지 않나”를 숫자로 건드렸기 때문이다. 반복 실행, cost-per-success, critical-field 정확도까지 붙으면서 비용 논쟁이 한층 구체화됐다.

#ocr #benchmarks #llms

LLM Reddit Mar 29, 2026 1 min read

r/LocalLLaMA가 포착한 IBM Granite 4.0 3B Vision, 문서 추출용 소형 VLM

r/LocalLLaMA가 IBM의 Granite-4.0-3B-Vision에 주목했다. 이 소형 VLM은 범용 chat보다 chart, table, document key-value extraction에 맞춰 설계됐다.

#vlm #document-ai #ibm

AI Reddit Mar 22, 2026 1 min read

Kreuzberg v4.5, Docling 레이아웃 모델을 Rust 파이프라인으로 가속

r/LocalLLaMA에서 소개된 Kreuzberg v4.5는 문서 구조 인식과 테이블 추출을 강화한 Rust 기반 document intelligence 프레임워크다. 작성자는 Docling 품질에 맞먹거나 일부 구간에서 앞서는 결과를 더 낮은 메모리 사용량과 함께 제시했다.

#document-ai #ocr #rust

AI Hacker News Feb 12, 2026 1 min read

GLM-OCR: 복잡한 문서 이해를 위한 초경량 멀티모달 OCR 모델

불과 0.9B 파라미터로 복잡한 문서 레이아웃, 표, 코드, 수식을 처리하는 오픈소스 OCR 시스템 GLM-OCR이 공개되었습니다. OmniDocBench V1.5에서 94.62점으로 1위를 차지하며 실용성과 효율성을 입증했습니다.

#ocr #multimodal #document-ai