技术背景介绍
在许多问答应用中,用户往往希望通过一番对话来获取信息,这要求应用程序具备一定的“记忆能力”,能够记住过去的提问和回答,并在回答当前问题时加以利用。这种能力涉及到对话历史管理、检索增强生成(RAG)等技术。
在本文中,我们将探讨如何将历史对话信息整合到问答逻辑中。我们将介绍两种方法:
- Chains:在每次查询时执行检索步骤。
- Agents:赋予大型语言模型(LLM)在执行检索步骤时的自主决策权。
核心原理解析
Chains与Agents的差别
Chains是在每次请求中严格遵循预设的检索路径。而Agents则利用LLM的推理能力,在执行过程中动态调整,可能会跳过某些检索步骤,或多次检索来更好地回答问题。
构建存储与检索系统
对于知识的外源检索,我们将使用Chroma向量存储来缓存博客内容,并通过OpenAI嵌入模型对其进行索引,以便于查询。
代码实现演示
以下是一个完整的代码实现在Python中:
import bs4
from langchain import hub
from langchain.chains import create_retrieval_chain, create_history_aware_retriever
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain_chroma import Chroma
from langchain_community.document_loaders import WebBaseLoader
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain_openai import ChatOpenAI, OpenAIEmbeddings
from langchain_text_splitters import RecursiveCharacterTextSplitter


5328

被折叠的 条评论
为什么被折叠?



