Anthropicは科学AIの課題を、モデルの推論力だけでなくデータ検索基盤の問題として示した。NCBI Virusの検索課題では、gget virusを加えると精度がほぼ100%まで上がった。
#retrieval
RSS Feed
Perplexityはagent検索を、固定APIの連続呼び出しではなくPython codeで組み立てる方式へ移した。CVE vendor advisoryの事例では、token使用量が288.7Kから42.9Kへ85.1%減ったとしている。
重要なのは、retrieval stackがtext-only searchからmultimodal memoryへ移っている点だ。Google AI StudioはGemini Embedding 2がGAとなり、text、image、video、audio、documentsの5入力を1つのmodel pathで扱うと示した。
重要なのは、search AIでは流暢な回答だけでなくfactualityとcitation qualityが評価軸になることだ。PerplexityはSFT + RL pipelineにより、Qwen modelsがより低いcostでGPT modelsのfactualityに並ぶ、または上回ると述べた。
Databricks AI Researchは2026年4月10日、Memory Scaling for AI Agents を公開し、real-world agent の性能はより長い reasoning よりも external memory の蓄積と retrieval 品質に左右されうると論じた。記事は labeled example、user log、organizational knowledge によって精度と効率が同時に改善する結果を示している。
Mintlify は docs assistant が複数 page にまたがる答えや exact syntax を拾いにくいという chunked RAG の限界から、Chroma 上の virtual filesystem `ChromaFs` を構築したと説明した。session creation を約 46 秒から約 100ms に縮め、HN では filesystem-first retrieval が agent に合うという反応が目立った。
Hacker Newsは、filtered HNSW search を修正し、強力な vector compression を追加する DuckDB の community extension を取り上げた。これにより、実運用の SQL filter 下でも retrieval workload の挙動がより予測しやすくなる。
Google AI Studioは2026-03-12のX投稿でGemini Embedding 2を紹介し、Googleの2026-03-10ブログ記事はこのmodelがtext、images、video、audio、documentsを単一のembedding spaceへ写像すると説明している。GoogleはGemini APIとVertex AIでpublic preview提供中で、multimodal retrievalとclassificationを主な用途に挙げている。
新しい r/LocalLLaMA スレッドは、Graph-RAG の multi-hop QA における bottleneck が retrieval ではなく reasoning かもしれないという結果を押し上げた。structured prompting と graph-based context compression を組み合わせれば、open な Llama 8B が plain 70B baseline に対抗できるという主張が核だ。
r/artificialの投稿は、long-running agent memoryには別のvector DBよりもdecay、reinforcement、selective forgettingが必要かもしれないと主張し、retrieval qualityと人間の記憶モデルをめぐる議論を促した。
Hacker Newsで注目されたAmine Rajiのlocal ChromaDB実験は、RAGの安全性がpromptそのものよりもsource corpusの汚染とingestion検証に左右される可能性を示している。
Perplexityは2026-02-26のX投稿で`pplx-embed-v1`と`pplx-embed-context-v1`の提供開始を発表した。0.6B/4B構成、INT8/Binary出力、retrieval特化のベンチマーク主張が中心だ。