1. 从“外挂”到“大脑”:RAG的进化之路
如果你最近在捣鼓大语言模型,想把公司文档、产品手册或者自己的学习笔记喂给AI,让它能“记住”并回答相关问题,那你大概率已经接触过RAG了。RAG,检索增强生成,在过去一两年里几乎是解决大模型“幻觉”和知识陈旧问题的标准答案。它的思路很直观:给大模型配一个“外挂知识库”。当用户提问时,系统不是让大模型凭空想象,而是先去这个外挂知识库里翻找最相关的资料片段,然后把问题和这些资料一起交给大模型,让它“看着资料”回答问题。
这个模式我用了很久,确实解决了大问题。比如,你想让AI帮你分析一份最新的行业报告,或者回答关于公司内部某个冷门产品的技术细节,传统的通用大模型要么瞎编,要么说不知道。但接上RAG之后,它就能从你提供的文档里找到依据,给出有据可查的回答。这感觉就像给一个博闻强记但记忆截止到某个日期的学者,配了一位随时能查阅最新档案的助理。
然而,在实际项目里踩过几次坑之后,我发现这个“外挂助理”有时候也挺死板的。它基本上就是个“一问一答”的流程:你提问,它检索,然后生成。整个过程是线性的、一次性的。如果第一次检索没找到关键信息,或者检索到的信息彼此矛盾,系统往往就卡住了,给出的答案质量会大打折扣。更麻烦的是,面对复杂问题,比如“对比我们产品A和竞品B、C在过去三个季度的市场表现,并分析原因”,传统的RAG可能会一股脑地扔回来一堆关于A、B、C的零散信息片段,让大模型自己“硬凑”答案,效果很难保证。
这其实就是传统RAG的局限性:它缺乏“判断力”和“主动性”。它不会主动思考:“用户这个问题,我到底该去查数据库,还是该去网上搜一下最新新闻?”“我第一次找到的这份资料够权威吗?需不需要再找其他资料交叉验证?”“用户的问题里‘市场表现’具体指什么?是销量、口碑还是股价?我需要先明确一下。” 它只是一个被动的、执行固定流程的工具。
而Agentic RAG(智能体驱动的RAG),要解决的就是这个问题。它不再满足于只当一个“外挂知识库”,而是试图给整个系统装上“大脑”,让系统自己能思考、能决策、能调用各种工具去完成复杂任务。你可以把它理解为,把那个被动的“档案助理”,升级成了一个拥有多种技能、懂得主动规划和分析的“资深分析师”。这个分析师不仅会查档案,还会上网搜索、计算数据、判断信息质量,甚至会在没搞清楚问题时,先向你追问几个细节。
2. 核心蜕变:智能体给RAG带来了什么?
那么,这个“资深分析师”到底比“档案助理”强在哪里呢?关键在于,智能体的引入,让RAG流程从静态、线性变成了动态、循环迭代的。我们来看看几个最关键的升级点。
2.1 动态查询规划与路由:先动脑,再动手
在普通RAG里,处理用户查询基本是“条件反射”式的。用户输入一个问题,系统立马将其转换成向量,然后去向量数据库里做相似度搜索。但很多问题并非这么简单。
举个例子,用户问:“苹果公司最新财报显示营收增长了,这对我们的芯片供应链会有什么潜在影响?” 一个智能的Agentic RAG系统会先进行“思考”(Reasoning):
- 要回答这个问题,我需要两类信息:一是苹果公司最新的财报细节(特别是营收增长来源和未来展望),二是我们公司与苹果在芯片供应链上的具体合作关系。
- 第一类信息(苹果财报)是公开的、动态的,很可能不在我本地的向量知识库里,或者即使有也过时了。因此,最合适的工具是调用搜索引擎API去获取最新的新闻报道或财报摘要。
- 第二类信息(我们的供应链合同)属于公司内部高度机密,肯定存储在内部的向量化知识库中。
- 所以,我需要并行或先后使用两个工具:网络搜索和内部知识库检索。
这个过程就是查询路由(Query Routing) 和查询重写(Query Rewriting)。智能体会根据对问题的理解,自动规划检索路径,决定调用哪个或哪几个工具,甚至会将一个复杂问题拆解成多个子查询,分别用最合适的方式去获取信息。它不会把所有问题都粗暴地塞给向量数据库。
我在一个金融资讯分析项目中实践过这一点。当用户查询“美联储加息预期”时,智能体会判断:历史加息规律和影响分析可以从本地知识库(向量数据库)获取;而“预期”涉及未来,必须调用实时金融数据API获取最新的利率期货定价和华尔街分析师预测报告。两者结合,才能给出既有深度又有时效性的分析。
2.2 迭代式检索与自我验证:不满足于“第一次”
传统RAG是一次性检索,好坏就那一锤子买卖。但智能体具备迭代能力。它拿到初步的检索结果后,会像一个严谨的研究员一样,对其进行评估。
自我验证(Self-Verification) 是其中关键一环。智能体可能会自问:“我检索到的这几段资料,能充分回答用户的问题吗?它们之间有没有矛盾?信息源是否可靠?” 如果评估结果不理想,比如信息碎片化、缺少关键数据,或者发现资料之间对同一事实的描述有冲突,智能体会主动发起新一轮检索(R


978

被折叠的 条评论
为什么被折叠?



