如果你平时会看一些 Agent 或 AI 应用相关的内容,应该多少见过这些词:RAG、Agentic RAG、AI Memory。这些名词看起来有点技术范,但它们描述的能力,其实已经出现在很多 AI 产品里:
- 你在运营商 App 里问机器人客服“怎么开票”“怎么改套餐”时,它可能会先查帮助中心、FAQ 或产品文档,再告诉你该怎么操作;
- 你向 DeepSeek、豆包这类带联网能力的 AI 提问时,它们在回答前会先搜索相关网页,还会根据搜索结果判断要不要继续查更多资料;
- ChatGPT、Gemini 这类 AI 助手,会在一定程度上记住你的写作偏好、常聊的话题和上下文。这样,在下次和你再交流,它们能快速跟上你的话题;
这些能力背后,对应的就是 RAG、Agentic RAG 和 AI Memory。

图注:RAG、Agentic RAG、AI Memory 的示意图。在实际使用中,可能会对它们进行组合使用。
简单来说,你可以这么理解它们仨:
- RAG 是“先查资料,再回答”;
- Agentic RAG 是“让 AI 自己决定怎么查”;
- AI Memory 是“把有用的上下文留下来,之后继续用”。
下面我们一个个展开,来看看它们到底是什么。
RAG:先查资料再回答

RAG,全称是 Retrieval-Augmented Generation,中文一般叫“检索增强生成”。
你可以先把 RAG 理解成一句话:AI 回答前,会先查资料。这里的“资料”,指的是模型自身知识之外的信息。它可以是产品文档、接口说明、FAQ、内部制度、历史工单,也可以是网页、数据库或是其他可检索的数据源。
RAG 具体的工作流程可以看下面这张图。用户提问之后,系统会先把问题转成适合检索的形式,再去知识库里找相关内容,最后把这些内容交给大模型去生成回答。

这张图前半段的 Query、Embedding Model、Vectors、Vector DB,这 4 个模块主要是在做“检索”操作:把用户问题转成向量,再从知识库里找相近的内容。后半段的 Context、LLM、Final Response,是在做“生成”操作:把找回来的资料放进上下文,让模型基于这些资料去回答用户问题。
在企业场景里,RAG 的常见用法是把公司内部资料整理成知识库。一旦用户开始提问,系统就从知识库里找出相关片段,再把这些片段和问题一起交给模型去生成回答。
所以,RAG 很适合解决这些问题:
- “这个接口怎么调用?”
- “退款规则是什么?”
- “某个功能限制在哪里写过?”
这些问题的答案一般都在文档里,AI 要做的就是先把它找出来,再和用户讲清楚。
不过,RAG 也不是万能的。它很多时候更像“问一句,查一下”:用户提问,系统检索,然后生成回答。如果查到的资料准确,回答就比较靠谱;如果资料一开始就找错了,连带着回答也会跑偏。
Agentic RAG:让 AI 自己决定怎么查

如果说普通 RAG 是一条固定流程:问题来了,系统先检索知识库里的相关内容,再把这些内容交给模型生成回答。

那么 Agentic RAG 就是带脑子、更灵活的 RAG。它不一定一上来就开始检索内容,而是会先做判断:这个问题要不要查资料?如果要查,应该查哪些?是网页资料,还是数据库,或者是 API?查到的结果是不是不够?如果不够,要不要继续换一个地方查?
在 Agentic RAG 里,检索不再只是一个固定步骤,而是 Agent 完成任务时可以主动调用的工具。
下面,我们来看这么一个例子,用户问:“帮我看看这个客户最近为什么投诉变多了。”
普通 RAG 可能会围绕“客户”“投诉”“变多”这些关键词,找出几段相关文档,再生成回答。Agentic RAG 则会把问题拆开:先查最近一个月的工单记录,再看投诉中有哪些共同关键词;接着查有没有产品版本更新,或者服务日志里有没有异常。如果这些信息还不够,它还可以继续换数据源查线索。

图注:Agentic RAG 的变化,不只是接入更多数据源,而是让 Agent 参与“该怎么查”的判断。
所以,Agentic RAG 更适合处理复杂任务,比如故障排查、客户分析、项目状态总结、业务报告生成。
这些问题通常不是检索一次就能回答得了,需要连续做几步判断才行。
AI Memory:把有用的上下文留下来

虽然 Agentic RAG 很灵活,但如果它没有 Memory 记忆,下次还是可能从零开始。

举个例子,你告诉一个 AI Coding 助手开发要求:“这个项目用的是 Next.js。”“接口请求统一走我们封装好的 request 方法。”“组件样式不要新写一套,优先用现有的 Design System。”“测试文件放在对应模块的 __tests__ 目录里。”
如果它没有 Memory,这些要求可能只在当前对话中生效。下次再用同一个 AI Coding 工具,你还得重新交代一遍要求。
AI Memory 要解决的,就是把这些有用的上下文留下来。它可以记住用户偏好、项目进度、历史反馈,或者之前已经确认过的结论。这些信息不一定写在正式文档里,很多都来自一次次对话和修改。
所以,Memory 不是简单地“再建一个知识库”。更像是让 Agent 多了一种能力:不仅能读取信息,也能把重要信息写下来,后面还能复用。
不过,Memory 也不是记得越多越好。真正难的是管理:什么该记,什么不该记;什么时候更新,什么时候忘掉;如果记错了,怎么修正。

图注:Memory 的难点,不是存下所有信息,而是判断哪些信息应该长期影响 Agent。
如果什么都记,Memory 很快会变成垃圾堆;如果记错了,也可能长期影响后续回答。
所以,Memory 的关键不是“记住更多”,而是“记得更准,也忘得更对”。
小结

RAG、Agentic RAG 和 AI Memory 不是简单替代关系。
- RAG 解决的是:AI 怎么接入外部知识。
- Agentic RAG 解决的是:复杂问题里,AI 怎么自己决定查什么。
- AI Memory 解决的是:哪些上下文应该留下来,之后继续用。
它们合在一起,回答的是同一个问题:AI 怎么从“回答当前问题”,变成“参与长期工作”。RAG 让它会查资料;Agentic RAG 让它更会查资料;Memory 让它能带着过去的上下文继续工作。
当这三者组合起来,AI 才更像一个长期协作的助手,而不只是一个每次都要重新介绍背景的聊天窗口。
普通人如何抓住AI大模型的风口?
领取方式在文末
为什么要学习大模型?
目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。
目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!
最后
只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!
在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】

大模型全套学习资料展示
自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!
01 教学内容

-
从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!
-
大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事!
02适学人群
应届毕业生: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。
零基础转型: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界。
业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型。

vx扫描下方二维码即可
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!
03 入门到进阶学习路线图
大模型学习路线图,整体分为5个大的阶段:

04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)

05 行业报告+白皮书合集
收集70+报告与白皮书,了解行业最新动态!

06 90+份面试题/经验
AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)

07 deepseek部署包+技巧大全

由于篇幅有限
只展示部分资料
并且还在持续更新中…
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】


647

被折叠的 条评论
为什么被折叠?



