RAG 的总结整理

最新推荐文章于 2025-09-04 10:00:42 发布

原创

最新推荐文章于 2025-09-04 10:00:42 发布 · 1.2k 阅读

标签

RAG，全称为 Retrieval-Augmented Generation，即检索增强生成。它是一种结合了检索和生成的技术方法，将传统的基于检索的问答系统和基于自然语言生成的技术相结合，提升了 AI 系统在回答自然语言问题时的准确性和可靠性。

在这里插入图片描述

基础背景

优势

RAG 具有多方面的显著优势，使其在自然语言处理领域中占据重要地位。

知识更新灵活性高。与传统的微调方法相比，RAG 无需对整个模型进行大规模的重新训练，只需更新知识库中的数据，就能让模型获取到最新的知识信息。例如，在金融领域，市场数据和法规政策不断变化，RAG 系统可以及时将新的股票行情、政策法规等信息纳入知识库，使模型能够快速适应这些变化，为用户提供基于最新信息的准确回答。
可扩展性强。RAG 能够轻松应对大规模数据的处理需求，随着检索语料库规模的不断扩大，其性能不会受到明显影响。这是因为它可以灵活地从海量数据中检索出与问题相关的信息，而无需像一些传统模型那样在数据量增加时面临性能瓶颈。以大型电商平台的客服系统为例，随着商品种类和用户数量的不断增加，相关的知识库也在持续扩充，但 RAG 系统依然能够高效地检索和利用这些知识，为用户提供精准的购物咨询服务。
RAG 在处理复杂任务和开放领域问题时表现出色。它能够从广泛的知识源中检索信息，为模型提供丰富的上下文，从而更好地理解和处理复杂的自然语言任务。无论是多轮对话、长篇文档的理解与生成，还是涉及多个领域知识的综合性问题，RAG 都能通过检索相关信息，为生成准确、全面的回答提供有力支持。例如，在智能写作助手应用中，当用户需要撰写一篇关于科技发展趋势的文章时，RAG 可以从众多的科技文献、新闻报道、行业分析等资料中检索相关信息，并整合到生成的文章中，使文章内容更加丰富、有深度。

不足

RAG 对文档质量的依赖程度较高。如果知识库中的文档内容不准确、过时、存在噪声或格式不规范，将会直接影响检索的准确性和生成答案的质量。例如，在一个技术文档知识库中，如果部分文档存在错误的技术参数或过时的技术描述，RAG 系统在检索和利用这些文档时，可能会生成错误的技术解答，误导用户。而且，文档的切分粒度也会对模型性能产生影响，如果切分不当，可能导致信息碎片化或关键信息被分割在不同的块中，影响检索效果。
RAG 还可能产生不准确的回答。即使检索到的文档本身信息准确，但由于模型在整合和生成答案过程中的局限性，仍然可能出现回答不准确的情况。例如，当需要对检索到的多个信息片段进行综合推理和判断时，模型可能会出现失误，导致生成的答案与实际情况不符。此外，如果检索到的文档与问题的相关性判断不准确，也会使生成的答案偏离主题或无法满足用户的需求。