centos7上使用Docker+ RagFlow + ollama + 数据集搭建自己的AI问答机器人（2025-09）

原创

已于 2025-09-18 15:38:40 修改 · 1.2k 阅读

标签

#docker #ragflow

于 2025-09-18 15:34:11 首次发布

什么是RAG

RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合信息检索与文本生成的智能技术，旨在解决传统大语言模型（LLM）的局限性。以下是通俗易懂的解释：

检索（Retrieval）
当用户提问时，系统先从外部知识库（如文档、数据库、企业私有数据）中快速查找与问题最相关的片段。例如，问“公司2023年营收多少”，系统会从财报文档中检索出具体数字。
增强生成（Augmented Generation）
将检索到的真实数据与用户问题一起输入大语言模型，模型基于这些可信信息生成回答，而非仅依赖训练时的静态知识。这样能避免“幻觉”（编造信息），确保答案准确且有据可依。

用户提问（Query）
比如：“介绍一下中国的新能源政策”。
检索阶段（Retrieval）
系统会把问题转成 embedding 向量，然后去知识库（向量数据库或全文搜索引擎）检索最相关的文档片段（chunks）。
增强输入（Augmentation）
把检索到的文档片段附加到用户问题后面，构造成一个 提示（prompt）。
```
用户问题 + [相关文档内容]
```
生成阶段（Generation）
把增强后的 prompt 输入到大语言模型中，模型基于问题和文档上下文生成回答。
答案输出（Answer）
最终给出一个带有依据的答案，甚至能附带引用出处。

想象一个“学霸+图书馆员”的组合：

RAG的核心价值在于让AI真正“懂”你的数据，而非仅依赖通用知识。像RAGFlow这样的工具，正是将RAG技术落地为易用的系统，帮助企业快速构建智能问答服务。

… 来源ChatGPT

RAGFlow 是一个开源的 Retrieval-Augmented Generation（检索增强生成，RAG）引擎，由 Infiniflow 团队开发。它特别强调「深度文档理解」（deep document understanding）。([GitHub][1])
目的是把复杂、格式多样的数据（PDF、Word、表格、扫描件、ppt、图片等）处理好，构建知识库，使得当用户查询时，能够检索相关内容，并由大语言模型（LLM）基于这些检索到的内容生成答案，并带有可信的引用出处。([ragflow.io][2])
它也支持 Agent 模型／工作流，意味着可以把检索＋生成结合一些自动化任务、推理、脚本执行等能力。([GitHub][1])

下面是 RAGFlow 的主要特性：

功能	描述
深文档理解 (Deep Document Understanding)	能够处理复杂格式的文档，包括扫描件、图片、表格，做 OCR、版面（layout）分析、表格解析等。([GitHub][1])
多数据源与异构格式支持	支持 Word、Slides、Excel、TXT、Markdown、图片、PPT 等多种类型文件。([GitHub][1])
文档切分（Chunking／Template-based chunking）	文档被切分成“块”，有多种模板可选，能够针对