기업 RAG의 약점은 답을 모르는 것이 아니라, 필요한 근거가 다른 저장소에 흩어졌을 때 너무 일찍 멈추는 데 있다. Google Research는 충분한 문맥을 검사하고 다시 검색하는 Agentic RAG로 factuality 데이터셋 정확도를 최대 34% 높였다고 밝혔다.
#rag
RSS FeedGoogle이 Gemini API 파일 검색 도구를 멀티모달로 확장했다. 이미지, 오디오, 동영상을 포함한 다양한 파일 유형에 대한 효율적인 RAG 시스템을 구축할 수 있게 됐다.
Hacker News는 model-agnostic memory라는 약속에 끌렸지만, 스레드의 진짜 열기는 “이게 context pollution을 어떻게 막나”라는 질문에서 나왔다. memory가 늘수록 더 지저분해지는 것 아니냐는 회의가 빠르게 붙었다.
Cloudflare가 AutoRAG를 AI Search로 바꾸며 agent용 retrieval을 별도 infra 작업에서 Workers binding으로 끌어왔다. Open beta 기간에는 built-in storage, vector index, BM25 hybrid search, cross-instance search를 무료 한도 안에서 쓸 수 있다.
MongoDB는 2026년 3월 20일 Heidi의 AI scribe가 18개월 동안 190개국 이상에서 81 million clinical consultations까지 확장됐다고 밝혔다. 연결된 공식 사례는 Atlas와 Atlas Vector Search가 이질적인 의료 데이터를 통합하고, RAG를 수행하며, healthcare 환경에서 무중단 확장을 가능하게 했다고 설명한다.
Mintlify는 docs assistant가 여러 page에 걸친 답변과 exact syntax를 찾는 상황에서 chunked RAG의 한계를 느껴 Chroma 기반 virtual filesystem `ChromaFs`를 만들었다고 설명했다. 세션 생성 시간을 약 46초에서 100ms로 줄였고, HN에서는 filesystem-first retrieval이 agent에 더 잘 맞는다는 반응이 이어졌다.
Andros Fenollosa의 회고가 Hacker News에서 반응을 얻은 이유는 production RAG를 prompt demo가 아니라 데이터와 운영 문제로 다뤘기 때문이다.
Hacker News에서 주목받은 Skylar Payne의 글은 AI 시스템이 커질수록 팀들이 DSPy의 핵심 패턴을 다시 구현하게 된다고 주장한다. 동시에 HN 토론에서는 Python 중심성, prompt optimization의 위치, evals 설계 비용이 adoption을 늦추는 현실적 이유로 함께 지적됐다.
IBM Granite는 2026-03-20 Mellea 0.4.0과 Granite 4.0 Micro용 Granite Libraries 3종을 공개했다. prompt-only orchestration 대신 구조화되고 safety-aware한 workflow를 만들려는 팀에 초점을 둔 release다.
Google은 2026년 3월 10일 Gemini Embedding 2를 public preview로 공개했다. 회사는 이 모델이 text, image, 그리고 PDF 같은 mixed multimodal 문서를 하나의 embedding space에서 처리하며, benchmark score를 68.32와 53.3까지 끌어올리면서도 가격과 차원 수는 유지한다고 밝혔다.
Hacker News에서는 CodeWall이 2026년 3월 9일 공개한 McKinsey Lilli 침해 보고서가 빠르게 확산됐다. 보고서는 autonomous agent가 unauthenticated endpoint, SQL injection, prompt-layer 접근을 연쇄적으로 이용해 production DB까지 도달했다고 주장한다.
Hacker News에서 화제가 된 Amine Raji의 local ChromaDB 실험은, RAG 보안의 핵심이 prompt 자체보다 source corpus 오염과 ingestion 검증에 있을 수 있음을 보여준다.