看到2026年RAG进展的总结,我最大的感触是:长上下文没杀死RAG,但RAG自己进化了。先说混合检索,这其实不是新概念,但今年终于成了标配——稀疏检索(BM25类)与稠密检索(向量)的融合不再是锦上添花,而是解决“高精度召回”与“语义泛化”冲突的必选项。从我个人的实践来看,单纯依赖Embedding在低频实体或罕见术语上翻车率极高,加上传统关键词检索后,命中率直接提升了15%以上。

更值得关注的是Agentic RAG。这不再是简单的“检索-生成”流水线,而是让LLM自主决定何时检索、检索什么、如何多步推理。我在最近的项目里试过把路由决策交给Agent,处理多层嵌套的行业合规问题时,答案准确率比固定Pipeline高了近20%。当然,代价是延迟和成本上升,这是2026年的新坑:你必须在智能度和资源消耗之间做取舍。

文档预处理依然是被低估的环节。很多团队花大精力调模型,却忽略了解析PDF时表格断裂、段落错位的问题——这些数据质量问题直接导致检索结果“看似相关实则无用”。我的经验是,预处理投入至少占RAG项目总时间的30%,否则后续优化都是空中楼阁。

最后抛两个问题:1. Agentic RAG的决策逻辑如何避免“过度检索”导致的成本失控?2. 混合检索中稀疏与稠密的权重分配,大家有没有经验性的调优阈值?欢迎讨论。从趋势看,RAG正在从“工具”演变为“架构”,2026年之后的竞争焦点会转向检索策略的自动化和可解释性。

技术分析 #实践经验