#rag

LLM 4d ago 1 min read

Google Agentic RAG, 답 못 찾는 검색을 34% 정확도 개선으로

기업 RAG의 약점은 답을 모르는 것이 아니라, 필요한 근거가 다른 저장소에 흩어졌을 때 너무 일찍 멈추는 데 있다. Google Research는 충분한 문맥을 검사하고 다시 검색하는 Agentic RAG로 factuality 데이터셋 정확도를 최대 34% 높였다고 밝혔다.

#google #rag #agents

AI Hacker News May 10, 2026 1 min read

Gemini API 파일 검색, 멀티모달 RAG 지원으로 확장

Google이 Gemini API 파일 검색 도구를 멀티모달로 확장했다. 이미지, 오디오, 동영상을 포함한 다양한 파일 유형에 대한 효율적인 RAG 시스템을 구축할 수 있게 됐다.

#google #gemini #rag

AI Hacker News Apr 26, 2026 1 min read

오픈소스 agent memory Stash, HN이 바로 찌른 약점

Hacker News는 model-agnostic memory라는 약속에 끌렸지만, 스레드의 진짜 열기는 “이게 context pollution을 어떻게 막나”라는 질문에서 나왔다. memory가 늘수록 더 지저분해지는 것 아니냐는 회의가 빠르게 붙었다.

#agent-memory #mcp #pgvector

LLM Apr 17, 2026 1 min read

Cloudflare AI Search, agent마다 BM25와 vector index를 붙인다

Cloudflare가 AutoRAG를 AI Search로 바꾸며 agent용 retrieval을 별도 infra 작업에서 Workers binding으로 끌어왔다. Open beta 기간에는 built-in storage, vector index, BM25 hybrid search, cross-instance search를 무료 한도 안에서 쓸 수 있다.

#cloudflare #rag #agents

AI X/Twitter Apr 14, 2026 1 min read

MongoDB, Heidi AI scribe가 Atlas 위에서 81M clinical consultations까지 확장됐다고 강조

MongoDB는 2026년 3월 20일 Heidi의 AI scribe가 18개월 동안 190개국 이상에서 81 million clinical consultations까지 확장됐다고 밝혔다. 연결된 공식 사례는 Atlas와 Atlas Vector Search가 이질적인 의료 데이터를 통합하고, RAG를 수행하며, healthcare 환경에서 무중단 확장을 가능하게 했다고 설명한다.

#mongodb #healthcare-ai #vector-search

LLM Hacker News Apr 4, 2026 1 min read

Mintlify, docs assistant의 RAG를 virtual filesystem으로 교체

Mintlify는 docs assistant가 여러 page에 걸친 답변과 exact syntax를 찾는 상황에서 chunked RAG의 한계를 느껴 Chroma 기반 virtual filesystem `ChromaFs`를 만들었다고 설명했다. 세션 생성 시간을 약 46초에서 100ms로 줄였고, HN에서는 filesystem-first retrieval이 agent에 더 잘 맞는다는 반응이 이어졌다.

#rag #agents #docs

LLM Hacker News Mar 27, 2026 1 min read

Hacker News가 다시 조명한 production RAG의 현실, local model로 451GB를 다루는 법

Andros Fenollosa의 회고가 Hacker News에서 반응을 얻은 이유는 production RAG를 prompt demo가 아니라 데이터와 운영 문제로 다뤘기 때문이다.

#rag #llamaindex #chromadb

LLM Hacker News Mar 23, 2026 2 min read

DSPy 채택은 더딘데, 팀들은 왜 같은 LLM 패턴을 다시 만들까

Hacker News에서 주목받은 Skylar Payne의 글은 AI 시스템이 커질수록 팀들이 DSPy의 핵심 패턴을 다시 구현하게 된다고 주장한다. 동시에 HN 토론에서는 Python 중심성, prompt optimization의 위치, evals 설계 비용이 adoption을 늦추는 현실적 이유로 함께 지적됐다.

#dspy #llm-engineering #hacker-news

LLM Mar 21, 2026 1 min read

IBM Granite, Mellea 0.4.0과 Granite Libraries 공개

IBM Granite는 2026-03-20 Mellea 0.4.0과 Granite 4.0 Micro용 Granite Libraries 3종을 공개했다. prompt-only orchestration 대신 구조화되고 safety-aware한 workflow를 만들려는 팀에 초점을 둔 release다.

#ibm #granite #rag

LLM Mar 16, 2026 1 min read

Google, Gemini Embedding 2 public preview 시작... 첫 natively multimodal embedding 모델

Google은 2026년 3월 10일 Gemini Embedding 2를 public preview로 공개했다. 회사는 이 모델이 text, image, 그리고 PDF 같은 mixed multimodal 문서를 하나의 embedding space에서 처리하며, benchmark score를 68.32와 53.3까지 끌어올리면서도 가격과 차원 수는 유지한다고 밝혔다.

#google #embeddings #multimodal

AI Hacker News Mar 14, 2026 2 min read

Hacker News, McKinsey Lilli를 노린 AI 보안형 SQL injection 사례에 주목

Hacker News에서는 CodeWall이 2026년 3월 9일 공개한 McKinsey Lilli 침해 보고서가 빠르게 확산됐다. 보고서는 autonomous agent가 unauthenticated endpoint, SQL injection, prompt-layer 접근을 연쇄적으로 이용해 production DB까지 도달했다고 주장한다.

#ai-security #sql-injection #rag

LLM Hacker News Mar 13, 2026 1 min read

RAG 문서 오염 공격, 왜 output filter보다 ingestion 통제가 중요한가

Hacker News에서 화제가 된 Amine Raji의 local ChromaDB 실험은, RAG 보안의 핵심이 prompt 자체보다 source corpus 오염과 ingestion 검증에 있을 수 있음을 보여준다.

#rag #security #retrieval