浅谈 RAG（RAG 已死？）

最新推荐文章于 2026-06-21 22:01:11 发布

原创最新推荐文章于 2026-06-21 22:01:11 发布 · 196 阅读

5 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#人工智能 #java #prompt #github #LLM

过去一段时间，一直在各种项目里断断续续跟 RAG 打交道。

从最开始“把文档切一切、向量化、检索出来”这个最基础的流程，到后来接触多路召回、查询翻译、查询路由、自我纠正这类技巧，踩过不少坑，也逐渐摸清楚了这个领域的一些技术脉络。最近我把相关内容重新整理了一遍，先挖个坑，后面再慢慢填。这里先聊一个相对大的框架。

先说背景：RAG 到底是什么

RAG 的全称是 Retrieval Augmented Generation，也就是检索增强生成。名字其实已经把核心说得很直白了：不是只靠模型自己生成，而是先检索，再生成。前面的阶段是数据处理和存储，核心是把 LLM 的内在参数化知识和外部非参数化知识结合起来。

如果再拆细一点，我理解的 RAG 不只是“查一下资料然后回答”这么简单，它至少包含这样几个阶段：

数据处理
数据存储
信息检索
上下文增强
最终生成

所以，RAG 本质上并不是一个单点技术，而是一整套围绕“信息怎么被找到、怎么被组织、怎么被送进模型”的方法论。

“RAG 已死”？

最近这段时间，“RAG 已死”这种说法时不时就会冒出来。但如果把 RAG 理解得稍微广义一点，这个判断其实并不成立。

凡是跟 context builder 相关、凡是为模型构建有效上下文的信息系统，我都倾向于把它放进 RAG 这个大框架里看。

比如现在 Agent 体系里常见的 memory、session history、user profile、skill，甚至一些更偏个性化和状态化的上下文信息，本质上都在做同一件事：让模型在当前任务里拿到更合适的信息。

从这个角度看，RAG 没死，它只是早就不再局限于“知识库检索”这一个小盒子里了。准确地说，它在扩边界，也在长系统。

RAG 与 Agent：本质上是“知”与“行”

比喻一下，RAG 是“知”，Agent 是“行”。

知者行之始，行者知之成。

RAG 解决的是“知识从哪里来”的问题。它负责把正确的信息、合适的信息、此时此刻需要的信息，拉到上下文里。

Agent 解决的是“行动如何发生”的问题。它面对的是一个不确定环境，需要持续做决策、调用工具、推进状态，直到目标达成，或者确认这件事当前无法达成。

所以两者在架构上其实是互补关系。

没有“知”，“行”的效果会大打折扣。一个不会查、不会补充上下文、不会更新认知的 Agent，执行能力再强，也容易在错误信息上越跑越远。

反过来，RAG 也不只是一个被动模块。纯 RAG 更像是“你问我答”；但放进 Agent 体系里之后，它会变成一种主动能力，也就是 Agent 会自己判断什么时候该查、查什么、查到了怎么处理、是否还需要继续查。

所以我更愿意把它们理解成一句话：RAG 提供知识能力，Agent 提供决策与执行能力。分开看都能成立，合起来才更像一个完整系统。

下一阶段：RAG 和 Agent 可能会怎么演进

如果继续往下看，我觉得 AI 下一阶段的演进，未必只是“参数更大、速度更快”，而是会越来越像一个真正意义上的数字大脑，甚至数字社会。

RAG 的演进方向

下一阶段的 RAG，不会只是“检索几段资料塞进上下文”这么朴素，它更可能演化成大模型的外部记忆系统。像人脑一样，它会逐步具备短期记忆、长期记忆、情境记忆，甚至某种程度上的遗忘机制。它不只是回答前查一下资料，而是会持续吸收用户历史、任务过程、环境变化和多模态信息，然后自动判断什么该记住，什么该压缩，什么该淘汰，最后沉淀成一个会成长的知识底座。

Agent 的演进方向

Agent 也不会长期停留在今天这种“执行器”的形态。它更可能往多 Agent 协作的方向发展，变得像一个数字组织，彼此之间通过分工、协商、博弈和复盘形成群体智能。

到了那一步，真正有价值的可能就不再是某一个超级模型单打独斗，而是“模型 + 记忆 + 工具 + 多 Agent 协作”组成的完整智能系统。

再发挥一点想象力，可能会形成一种持续在线、持续学习、持续行动的数字生命体雏形。它既像大脑，也像团队；既会调用知识，也会积累经验；甚至会通过模拟、试错和“做梦式推演”提前预演未来的行动路径。

到那时候，AI 的核心竞争力可能就不是“谁更会回答问题”，而是“谁更像人类大脑，谁更像人类社会，谁更能在复杂环境中长期稳定地自主运转”，实实在在的创造价值。

想象力再大一点，目前的 RAG 只是把外部数据“喂”给模型，像是一个人在考试前翻书。未来的演进方向，可能是“数字基因重组”。到时候AI 不再需要实时检索，而是将获取的关键知识像“基因编辑”一样，直接通过梯度更新或权重修正，内化到自己的神经网络参数中。

它不再是“查阅资料”，而是真正地“学会了”。就像你学会了骑自行车，你不需要回忆“教程”，你的身体（模型参数）本身就是知识的载体。未来的 AI 将具备“瞬时进化”的能力——读完一本量子力学著作，它的“大脑结构”就物理性地改变了，成为了一个量子力学专家，而不是一个拿着书的普通人。

写在最后

过去这段时间研究 RAG 下来，我最大的感受是：RAG 不是一个固定的技术点，而是一个持续演进的思想。

它的核心始终没有变，就是把 LLM 的内在参数化知识和外部非参数化知识结合起来。只要这个需求还在，无论外面再叠加多少模块，比如查询转换、多路召回、自我修正，甚至未来更复杂的记忆机制和协作机制，它本质上都还是在这个框架下继续演进。

所以与其急着讨论“RAG 死没死”，不如先想清楚一件事：我们到底还需不需要让模型更好地获得信息、组织信息、使用信息。

只要这个问题的答案还是“需要”，那 RAG 就不会消失。它只会继续升级，而且大概率会以一种比今天更大、更深、更像智能系统基础设施的方式存在下去。