创建一个拥有上下文记忆的RAG 链和agent应用 | 🦜️🔗 LangChain

type

status

date

slug

summary

category

icon

password

comment

Status

创建一个拥有上下文记忆的RAG 链和agent应用_哔哩哔哩_bilibili

本视频中在RAG链式调用的基础上添加了整合历史消息的逻辑。然后构建了一个能够自主决定是否调用知识库查询工具的agent智能体。相关文档https://capricious-sesame-e56.notion.site/RAG-agent-LangChain-5bee3a6c760b4c5c818f76f12c2976b4?pvs=4代码仓库https://gitee.com/hi_tom/huia, 视频播放量 3204、弹幕量 0、点赞数 109、投硬币枚数 64、收藏人数 341、转发人数 37, 视频作者小灰的AI笔记, 作者简介探索AI的无限可能，相关视频：【2025大模型电影教程】桥本有菜(新有菜) 大模型学习路线 LLM+GPTo3+RAG+LangChain+Agent+Qwen，跟电脑F盘的女神一起操练—9，【全748集】目前B站最全最细的AI大模型零基础全套教程，2025最新版，包含所有干货！七天就能从小白到大神！少走99%的弯路！存下吧！很难找全的！，【2025大模型电影教程】桥本有菜(新有菜) 大模型学习路线 LLM+GPTo3+RAG+LangChain+Agent+Qwen，跟F盘的女神一起操练—11，【GraphRAG RAG LLM 小白电影教程——二部曲】三上悠亚大模型学习路线+langchain+Agent+Qwen，跟电脑F盘的女神一起操练起来—11，居然有比LangChain还好用的多Agent应用开发框架？，AI Agent教程2024年最新版，手把手带你从0→1构建一个独属于你的智能体！，第一个智能体｜Coze AI｜2025扣子手把手教程，基于LLamaindex轻松实现RAG多知识库智能问答，2025 年将是智能体（agent）爆发之年，扣子保姆级教程|超详细的AI应用搭建教程

https://www.bilibili.com/video/BV1zD421M7CA/?spm_id_from=333.999.0.0

在许多问答形式的应用程序中，允许用户进行多轮对话，这意味着应用程序需要记忆过去问题和答案，并且按照一定的方法将它们整合到当前对话中。

在本指南中，我们着重添加整合历史消息的逻辑。有关聊天历史管理的更多细节，请参阅这里。

我们将介绍两种方法：

链式方法，其中我们总是执行检索步骤；

agent方法，在这种方法中，我们让LLM自行决定是否以及如何执行检索步骤（或多个步骤）。

对于外部知识来源，我们将使用同一篇文章，来自Lilian Weng的LLM动力自主代理博客，来自RAG教程。

设置

依赖

我们将在本教程中使用OpenAI嵌入模型和Chroma矢量存储，但这里演示的所有内容都可以使用langchain提供的任何嵌入模型，VectorStore向量存储或Retriever检索器。

我们需要设置环境变量OPENAI_API_KEY，可以直接设置，也可以从.env文件中加载，方法如下：

LangSmith

使用LangChain构建的许多应用程序将都包含多个步骤和多次调用LLM调用。随着这些应用程序变得越来越复杂，能够检查chain或agent内部发生的细节变得至关重要。我们可以使用LangSmith查看应用程序的内部细节。

请注意，LangSmith并非必需，它只是在我们开发调试应用的时候非常有用。如果想使用可以在官网注册后申请秘钥，每个月都会有一定的免费使用额度，足够我们学习和测试，将key设置在的环境变量中就可以轻松使用LangSmith，

Chains

首先让我们看一下上一讲提到的问答应用，本地知识库的文章还是使用LLM Powered Autonomous Agents 这篇文章。

我们使用了内置的chain构造函数create_stuff_documents_chain和create_retrieval_chain， rag_chain 的组成成员：

retriever检索器；

prompt提示词模板；

LLM。

这将简化合并聊天记录的过程。

添加历史对话

上面我们构建的链是使用输入问题来检索知识库相关的上下文，但在对话环境中，用户的问题可能是基于对话的上下文才。例如：

Human: "What is Task Decomposition?"
AI: "Task decomposition involves breaking down complex tasks into smaller and simpler steps to make them more manageable for an agent or model."
Human: "What are common ways of doing it?"

为了理解第二个问题，我们的应用需要理解 "it" 代指的是 "Task Decomposition."

We'll need to update two things about our existing app:

在我们现有的应用代码中我们需要更改两块内容：

Prompt: 更新我们的提示词模板，去支持历史消息作为输入。

Contextualizing questions（将问题放在上下文中重新表述）: 添加一个子链，它获取最新的用户问题，并将其放在聊天记录的上下文中重新表述。这可以简单地被看作是构建一个新的“历史对话”的检索器。

之前的流程：

query -> retriever

之后的流程：

(query, conversation history) -> LLM -> rephrased query -> retriever

将问题放在上下文中重新表述

首先，我们需要定义一个子链，它接收历史消息和最新用户问题，并且如果问题中涉及历史信息，就重新表述问题。

我们将需要传入一个包含名为“chat_history”的 MessagesPlaceholder 提示词模板变量。这样，我们可以使用“chat_history”输入键将消息列表传递给提示词模板，并且插入这些消息在系统消息之后和最新问题之前。

我们在代码中使用了 create_history_aware_retriever 函数，组成的retriever链会依次调用 prompt | llm | StrOutputParser() | retriever。调用链需要传入 input 和 chat_history 参数，他的输出形式与retriever相同。

API 调用:create_history_aware_retriever | MessagesPlaceholder

这个链中，在执行本地知识库检索器的前面，添加根据历史对话重新生成的问题表述，以便检索过程能够整合对话的上下文。

现在我们可以建立完整的问答链。只需要更新检索器为我们的新history_aware_retriever。

我们还是使用 create_stuff_documents_chain 来生成一个 question_answer_chain，这个链其实只需要关注模型输入输出的内容，关于知识库具体的查询逻辑并不关心。需要传入的参数：知识库检索上下文 context, 历史对话chat_history 和输入问题 input 。

我们使用 create_retrieval_chain 方法构建最终的 rag_chain。构建方法需要传入history_aware_retriever和question_answer_chain 。调用rag_chain 时需要传入：问题input和历史对话chat_history，输出包括：问题input、历史对话chat_history、知识库检索到的上下文context和最终回答 answer。

API 调用:create_retrieval_chain | create_stuff_documents_chain

让我们尝试调用一下。下面我们提出一个问题和一个需要上下文的后续问题，看看是否能够返回正确的回答。

langsmith