langchain学习笔记之消息存储在内存中的实现方法
langchain学习笔记之消息存储在内存中的实现方法
- 引言
- 背景
- 消息存储在内存的实现方法
- 消息完整存储:完整代码
引言
本节将介绍 langchain \text{langchain} langchain将历史消息存储在内存中的实现方法。
背景
在与大模型交互过程中,经常出现消息管理方面的问题。一些大模型的上下文窗口包含的 token \text{token} token数量往往是有限的,如何将有限的大模型 memory \text{memory} memory合理利用是十分关键的问题。
再比如,在与大模型交互时,可能会产生一系列连续的对话,这些对话往往不是独立的,我们更期望大模型能够合理找出这些对话之间的语义联系,并从而给出更符合要求的答案。
消息存储在内存的实现方法
基于上述背景,第一个朴素的想法是:与大模型连续交互的过程中,大模型能够认识到若干个prompt之间的语义联系,从而给出合理的回复。
- 准备工作:将模型、
prompt以及初始chain的部分进行定义,其中使用MessagePlaceholder给交互过程中产生的历史信息留下位置:
from langchain_community.llms import Tongyi
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder def get_model():return Tongyi(model_name="tongyi-7b-chinese",temperature=0.5,max_tokens=100,)def get_runnable_chain():chat_prompt = ChatPromptTemplate.from_messages([("system","你是一个擅长{field_input}的智能助理,返回结果不超过200字。"),# 历史消息相关的placeholderMessagesPlaceholder(variable_name="history"),("human","{prompt_input}")])llm = get_model()# 创建一个chain式调用,和历史信息相关的可运行chainrunnable = chat_prompt | llmreturn runnable
- 创建一个
store_message字典,在与大模型交互交互过程中,将历史会话记录存储在字典中:
store_message = {}
- 在用户
prompt过程中,设置一个名为session_id的参数,目的是将相同session_id的prompt归结为具有语义联系的prompt。定义函数:get_session_history,该函数的目的是:将store_message中当前session_id包含的所有交互信息获取出来。若未获取消息,即session_id第一次出现在store_message中,则需要新创建一个ChatMessageHistory的对象,将消息存入其中:
from langchain_community.chat_message_histories import ChatMessageHistory
from langchain_core.chat_history import InMemoryChatMessageHistorydef get_session_history(session_id: str) -> InMemoryChatMessageHistory:if session_id not in store_message:store_message[session_id] = ChatMessageHistory()return store_message[session_id]
- 创建一个包含历史会话记录的运行器:通过
RunnableWithMessageHistory类,通过history的标识,将get_session_history中获取的历史会话记录,结合当前交互步骤的prompt_input(该部分中包含session_id),映射在MessagePlaceHolder中,并最终生成包含交互历史记录的runnable_chain:
from langchain_core.runnables.history import RunnableWithMessageHistorymessage_history_runnable = RunnableWithMessageHistory(runnable=get_runnable_chain(),get_session_history=get_session_history,input_messages_key="prompt_input",history_messages_key="history")
- 最终使用该
runnable_chain进行交互。示例:
response_1 = message_history_runnable.stream(input={"field_input": "历史科普","prompt_input": "简单介绍一下李白"},config={"configurable": {"session_id": "libai_introduction"}})for chunk in response_1:print(chunk, end="", flush=True)
首先是通过field_input对大模型进行角色定义,并提出prompt以及当前交互步骤的session_id。返回结果如下:
李白(701-762),字太白,号青莲居士,唐代著名诗人。出生于中亚碎叶城,少年时迁居四川。他性格豪放不羁,好饮酒作乐,游历名山大川,留下大量诗篇。其诗歌风格飘逸洒脱、意境开阔,充满浪漫主义色彩,善于运用夸张手法和奇特想象。李白与杜甫并称“李杜”,代表作品有《将进酒》、《静夜思》、《望庐山瀑布》等,对后世影响深远。安史之乱爆发后,因参与永王李璘起兵而获罪流放,晚年生活困顿,在当涂病逝。
- 继续执行,第二次交互的
respense_2表示如下:
response_2 = message_history_runnable.stream(input={"field_input": "历史科普","prompt_input": "他具体受到哪些政治迫害?"},config={"configurable": {"session_id": "libai_introduction"}})
需要注意的是,仅从response_2交互自身,我们无法知晓prompt_input中的他描述的具体是谁,但由于与response_1共享同一个session_id,结合历史会话信息,能够得到这个他描述的是李白。返回结果如下:
李白在安史之乱期间因卷入永王李璘的起兵事件而遭受政治迫害。756年,永王李璘起兵东下,李白应邀加入其幕府。然而,李璘与唐肃宗争夺帝位失败,李白因此获罪被捕入狱。虽经友人营救得以免死,但仍被流放夜郎(今贵州一带)。后因朝廷大赦,李白途中遇赦返回,但晚年生活穷困潦倒,最终客死当涂。这次政治牵连对李白的晚年生活和创作产生了重大影响。
创建一个反例:基于response_2,若prompt_input不变,但调整session_id:
response_3 = message_history_runnable.stream(input={"field_input": "历史科普","prompt_input": "他具体受到哪些政治迫害?"},config={"configurable": {"session_id": "libai_politics"}})
预期结果是:大模型不清楚这个他指代的是谁。返回结果如下:
你提到的政治迫害对象不明确呢。如果你是指历史上某个特定人物遭受的政治迫害,比如屈原,他因谗言被楚怀王疏远,放逐汉北;或岳飞被秦桧以“莫须有”的罪名陷害等,你可以具体说说你关注的人物哦,这样我能更准确作答。
至少和李白没什么关系~
消息完整存储:完整代码
# 引入聊天信息历史记录
from langchain_community.chat_message_histories import ChatMessageHistory
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain_core.chat_history import InMemoryChatMessageHistory
from langchain_community.llms import Tongyi# 用于储存历史会话记录
store_message = {}def get_model():return Tongyi(model_name="tongyi-7b-chinese",temperature=0.5,max_tokens=100,)def get_runnable_chain():chat_prompt = ChatPromptTemplate.from_messages([("system","你是一个擅长{field_input}的智能助理,返回结果不超过200字。"),# 历史消息相关的placeholderMessagesPlaceholder(variable_name="history"),("human","{prompt_input}")])llm = get_model()runnable = chat_prompt | llmreturn runnable# 获取历史会话
def get_session_history(session_id: str) -> InMemoryChatMessageHistory:if session_id not in store_message:# 没有查到session_id,使用ChatMessageHistory做一个初始化store_message[session_id] = ChatMessageHistory()return store_message[session_id]message_history_runnable = RunnableWithMessageHistory(runnable=get_runnable_chain(),get_session_history=get_session_history,input_messages_key="prompt_input",history_messages_key="history")if __name__ == '__main__':response_1 = message_history_runnable.stream(input={"field_input": "历史科普","prompt_input": "简单介绍一下李白"},config={"configurable": {"session_id": "libai_introduction"}})for chunk in response_1:print(chunk, end="", flush=True)print("\n")print("-----" * 30)response_2 = message_history_runnable.stream(input={"field_input": "历史科普","prompt_input": "他具体受到哪些政治迫害?"},config={"configurable": {"session_id": "libai_introduction"}})for chunk in response_2:print(chunk, end="", flush=True)print("\n")print("-----" * 30)response_3 = message_history_runnable.stream(input={"field_input": "历史科普","prompt_input": "他具体受到哪些政治迫害?"},config={"configurable": {"session_id": "libai_politics"}})for chunk in response_3:print(chunk, end="", flush=True)
观察一下执行了三次交互后的store_message:
{'libai_introduction': InMemoryChatMessageHistory(messages=[HumanMessage(content='简单介绍一下李白', additional_kwargs={}, response_metadata={}), AIMessage(content='李白(701-762),字太白,号青莲居士,唐代伟大诗人。生于绵州昌隆,祖籍陇西成纪。其诗风豪放飘逸,想象丰富,语言流转自然,音律和谐多变。他喜好饮酒作乐,常与友人畅饮赋诗,留下“斗酒诗百篇”的佳话。代表作有《静夜思》《望庐山瀑布》等。李白一生游历名山大川,交友广泛,曾任翰林供奉,后因卷入永王李璘事件被流放夜郎,途中遇赦返回,晚年生活困顿,病逝于当涂。他与杜甫并称为“李杜”,对后世影响深远。', additional_kwargs={}, response_metadata={}), HumanMessage(content='他具体受到哪些政治迫害?', additional_kwargs={}, response_metadata={}), AIMessage(content='李白在安史之乱期间,因卷入永王李璘的起兵事件而遭受政治迫害。永王李璘是唐玄宗之子,在安禄山叛乱时,他试图争夺帝位,李白误以为他是中兴之主,便加入其幕府。然而,永王兵败后,李白被指控参与谋反,获罪下狱,后被判流放夜郎(今贵州一带)。幸而在流放途中遇赦免,得以返回。这次政治风波对李白晚年生活影响极大,也使他失去了仕途机会。', additional_kwargs={}, response_metadata={})]), 'libai_politics': InMemoryChatMessageHistory(messages=[HumanMessage(content='他具体受到哪些政治迫害?', additional_kwargs={}, response_metadata={}), AIMessage(content='你提到的政治迫害对象不明确呢。如果你是指历史上某个特定人物遭受的政治迫害,比如屈原,他因谗言被楚怀王疏远,放逐汉北;或岳飞被秦桧以“莫须有”的罪名陷害等,你可以具体说说你关注的人物哦,这样我能更准确作答。', additional_kwargs={}, response_metadata={})])
}
很明显,store_message中的两个session_id:libai_introduction和libai_politics相互独立。
相关文章:
langchain学习笔记之消息存储在内存中的实现方法
langchain学习笔记之消息存储在内存中的实现方法 引言背景消息存储在内存的实现方法消息完整存储:完整代码 引言 本节将介绍 langchain \text{langchain} langchain将历史消息存储在内存中的实现方法。 背景 在与大模型交互过程中,经常出现消息管理方…...
布隆过滤器(简单介绍)
布隆过滤器(Bloom Filter) 是一种高效的概率型数据结构,用于快速判断一个元素是否可能存在于某个集合中。它的核心特点是空间效率极高,但存在一定的误判率(可能误报存在,但不会漏报)。 核心原理…...
Qt中基于开源库QRencode生成二维码(附工程源码链接)
目录 1.QRencode简介 2.编译qrencode 3.在Qt中直接使用QRencode源码 3.1.添加源码 3.2.用字符串生成二维码 3.3.用二进制数据生成二维码 3.4.界面设计 3.5.效果展示 4.注意事项 5.源码下载 1.QRencode简介 QRencode是一个开源的库,专门用于生成二维码&…...
SpringBoot教程(三十二) SpringBoot集成Skywalking链路跟踪
SpringBoot教程(三十二) | SpringBoot集成Skywalking链路跟踪 一、Skywalking是什么?二、Skywalking与JDK版本的对应关系三、Skywalking下载四、Skywalking 数据存储五、Skywalking 的启动六、部署探针 前提: Agents 8.9.0 放入 …...
IntelliJ IDEA 接入 AI 编程助手(Copilot、DeepSeek、GPT-4o Mini)
IntelliJ IDEA 接入 AI 编程助手(Copilot、DeepSeek、GPT-4o Mini) 📊 引言 近年来,AI 编程助手已成为开发者的高效工具,它们可以加速代码编写、优化代码结构,并提供智能提示。本文介绍如何在 IntelliJ I…...
【机器学习】深入浅出KNN算法:原理解析与实践案例分享
在机器学习中,K-最近邻算法(K-Nearest Neighbors, KNN)是一种既直观又实用的算法。它既可以用于分类,也可以用于回归任务。本文将简单介绍KNN算法的基本原理、优缺点以及常见应用场景,并通过一个简单案例帮助大家快速入…...
vscode的一些实用操作
1. 焦点切换(比如主要用到使用快捷键在编辑区和终端区进行切换操作) 2. 跳转行号 使用ctrl g,然后输入指定的文件内容,即可跳转到相应位置。 使用ctrl p,然后输入指定的行号,回车即可跳转到相应行号位置。...
JavaEE基础 Tomcat与Http (下)
目录 1.HTTP 协议 1.1 HTTP 协议概念 1.2. 无状态协议 1.3. HTTP1.0 和 HTTP1.1 1.4 请求协议和响应协议 编辑 1.5 请求协议 1.5.1 常见的请求协议 1.5.2 GET 请求 1.5.3 POST请求 1.5.4 响应协议 1.HTTP 协议 Http浏览器访问东西都是遵循的Http协议。 1.1 HTTP 协议…...
【Linux】【进程】epoll内核实现总结+ET和LT模式内核实现方式
【Linux】【网络】epoll内核实现总结ET和LT模式内核实现方式 1.epoll的工作原理 eventpoll结构 当某一进程调用epoll_create方法时,Linux内核会创建一个eventpoll结构体,这个结构体中有两个成员与epoll的使用方式密切相关. struct eventpoll{..../*红…...
英码科技基于昇腾算力实现DeepSeek离线部署
DeepSeek-R1 模型以其创新架构和高效能技术迅速成为行业焦点。如果能够在边缘进行离线部署,不仅能发挥DeepSeek大模型的效果,还能确保数据处理的安全性和可控性。 英码科技作为AI算力产品和AI应用解决方案服务商,积极响应市场需求࿰…...
测试常见问题汇总-检查表(持续完善)
WEB页面常见的问题 按钮功能的实现:返回按钮是否可以正常返回 信息保存提交后,系统是否给出“成功”的提示信息,列表数据是否自动刷新 没有勾选任何记录直接点【删除】,是否给出“请先选择记录”的提示 删除是否有删除确认框 …...
【SQL】SQL约束
🎄约束 📢作用:是用于限制存储再表中的数据。可以再创建表/修改表时添加约束。 📢目的:保证数据库中数据的正确、有效性和完整性。 📢对于一个字段可以同时添加多个约束。 🎄常用约束: 约束分类 约束 描述关键字非…...
解决 `pip is configured with locations that require TLS/SSL` 错误
问题描述 在使用 pip 安装 Python 包时,可能会遇到以下错误: WARNING: pip is configured with locations that require TLS/SSL, however the ssl module in Python is not available.这意味着 Python 的 ssl 模块未正确安装或配置,导致 p…...
如何commit后更新.gitignore实现push
目录 步骤 1: 更新 .gitignore 文件 步骤 2: 移除已追踪的大文件 步骤 3: 提交更改 步骤 4: 尝试推送 注意事项 如果已经执行了git commit,但后来意识到需要更新.gitignore文件以排除某些不应该被追踪的大文件或目录,并希望在不丢失现有提交记录的情…...
Python 面向对象的三大特征
前言:本篇讲解面向对象的三大特征(封装,继承,多态),还有比较细致的(类属性类方法,静态方法),分步骤讲解,比较适合理清楚三大特征的思路 面向对象的…...
机器学习_18 K均值聚类知识点总结
K均值聚类(K-means Clustering)是一种经典的无监督学习算法,广泛应用于数据分组、模式识别和降维等领域。它通过将数据划分为K个簇,使得簇内相似度高而簇间相似度低。今天,我们就来深入探讨K均值聚类的原理、实现和应用…...
从低清到4K的魔法:FlashVideo突破高分辨率视频生成计算瓶颈(港大港中文字节)
论文链接:https://arxiv.org/pdf/2502.05179 项目链接:https://github.com/FoundationVision/FlashVideo 亮点直击 提出了 FlashVideo,一种将视频生成解耦为两个目标的方法:提示匹配度和视觉质量。通过在两个阶段分别调整模型规模…...
Nuclei 使用手册
Nuclei 是一个开源的快速、高效的漏洞扫描工具,主要用于网络安全领域的漏洞检测。它由 go 语言开发,设计目的是为了高效地扫描 Web 应用程序、网络服务等目标,帮助安全研究人员、渗透测试人员以及红队成员发现潜在的漏洞。 下载链接…...
python学opencv|读取图像(六十七)使用cv2.convexHull()函数实现图像轮廓凸包标注
【1】引言 前序学习进程中,已经初步探索了对图像轮廓的矩形标注和圆形标注: python学opencv|读取图像(六十五)使用cv2.boundingRect()函数实现图像轮廓矩形标注-CSDN博客 但实际上,这两种标注方法都是大致的&#x…...
基于SpringBoot的“高校创新创业课程体系”的设计与实现(源码+数据库+文档+PPT)
基于SpringBoot的“高校创新创业课程体系”的设计与实现(源码数据库文档PPT) 开发语言:Java 数据库:MySQL 技术:SpringBoot 工具:IDEA/Ecilpse、Navicat、Maven 系统展示 系统整体功能图 系统首页界面 个人中心界…...
前端带样式导出excel表格,html表格生成带样式的excel表格
众所周知,前端生成表格通常是用xlsx、excel.js等js库,但这些库想要生成时增加excel样式会很麻烦。 有这么一个js库把html表格连样式带数据一并导出为excel表格: html-table-to-excel npm install html-table-to-excel 使用 html表格: <…...
人形机器人 - 仿生机器人核心技术与大小脑
以下是针对仿生机器人核心技术的结构化总结,涵盖通用核心技术与**“大脑-小脑”专用架构**两大方向: 一、机器人通用核心技术 这些技术是仿生机器人实现功能的基础,与生物体的“身体能力”对应: 1. 感知与交互技术 多模态传感器融合 视觉:3D视觉(如RGB-D相机)、动态目…...
【Linux】【网络】Libevent 内核实现简略版
【Linux】【网络】Libevent 内核实现简略版 1 event_base结构–>相当于Reactor 在使用libevent之前,就必须先创建这个结构。 以epoll为例: 1.1evbase void* evbase-->epollop结构体(以epoll为例) libevent通过一个void…...
大数据学习(49) - Flink按键分区状态(Keyed State)
&&大数据学习&& 🔥系列专栏: 👑哲学语录: 承认自己的无知,乃是开启智慧的大门 💖如果觉得博主的文章还不错的话,请点赞👍收藏⭐️留言📝支持一下博主哦ᾑ…...
架构——LVS负载均衡主要模式及其原理、服务水平、优缺点
LVS(Linux Virtual Server)是一款高性能的开源负载均衡软件,支持多种负载均衡模式。以下是其主要模式及其原理、服务水平、优缺点: 1. NAT 模式(Network Address Translation) 原理: 请求流程…...
【React组件通讯双重视角】函数式 vs 类式开发指南
目录 前言 正文 父组件向子组件传值 函数式写法 类式写法 子组件向父组件传值 函数式写法 类式写法 兄弟组件通信 函数式写法 类式写法 跨层级通信(使用Context) 函数式写法 类式写法 进阶通讯方式(补充说明…...
VScode内接入deepseek包过程(本地部署版包会)
目录 1. 首先得有vscode软件 2. 在我们的电脑本地已经部署了ollama,我将以qwen作为实验例子 3. 在vscode上的扩展商店下载continue 4. 下载完成后,依次点击添加模型 5. 在这里可以添加,各种各样的模型,选择我们的ollama 6. 选…...
Ubuntu虚拟机NDK编译ffmpeg
目录 一、ffmpeg源码下载1、安装git(用于下载ffmpeg源码)2、创建源码目录,下载ffmpeg源码 二、下载ubuntu对应的NDK,并解压到opt下1、下载并解压2、配置 ~/.bashrc 三、源码编译、1、创建编译脚本2、脚本文件内容3、设置可执行权限并运行4、编译的结果在…...
机器学习:k近邻
所有代码和文档均在golitter/Decoding-ML-Top10: 使用 Python 优雅地实现机器学习十大经典算法。 (github.com),欢迎查看。 K 邻近算法(K-Nearest Neighbors,简称 KNN)是一种经典的机器学习算法,主要用于分类和回归任务…...
js第十二题
题十二:轮播图 要求: 1.鼠标不在图片上方时,进行自动轮播,并且左右箭头不会显示;当鼠标放在图片上方时,停止轮播,并且左右箭头会显示; 2.图片切换之后,图片中下方的小…...
