MongoDB는 2026년 3월 20일 Heidi의 AI scribe가 18개월 동안 190개국 이상에서 81 million clinical consultations까지 확장됐다고 밝혔다. 연결된 공식 사례는 Atlas와 Atlas Vector Search가 이질적인 의료 데이터를 통합하고, RAG를 수행하며, healthcare 환경에서 무중단 확장을 가능하게 했다고 설명한다.
#vector-search
RSS FeedAI X/Twitter Apr 14, 2026 1 min read
LLM X/Twitter Apr 10, 2026 2 min read
Google Cloud Tech는 2026년 4월 10일 BigQuery의 autonomous embedding generation preview를 소개했다. BigQuery는 source text가 바뀔 때 embedding column을 자동 갱신하고, 이후 vector index와 AI.SEARCH 흐름으로 바로 연결할 수 있게 한다.
LLM Reddit Mar 29, 2026 2 min read
2026년 3월 r/singularity에서 공유된 Google Research의 TurboQuant 글은 114 points와 18 comments를 얻었다. Google은 이 방법이 needle 계열 작업에서 KV cache 메모리를 최소 6배 줄이고, 학습 없이 3-bit cache 압축과 H100 기준 최대 8배 attention-logit 속도 향상을 보여준다고 설명한다.
AI Hacker News Mar 25, 2026 1 min read
Hacker News는 filtered HNSW search를 바로잡고 공격적인 vector compression을 추가한 DuckDB community extension을 주목했다. 이로써 실제 SQL filters 아래에서 retrieval workloads를 더 예측 가능하게 만든다.
LLM Hacker News Mar 25, 2026 1 min read
Hacker News에서 주목받은 TurboQuant는 재학습 없이 KV cache를 3-bit까지 줄이면서 검색과 long-context inference의 메모리 병목을 완화하려는 Google Research의 압축 기법이다.