当前位置: 首页 > news >正文

langchain学习笔记之消息存储在内存中的实现方法

langchain学习笔记之消息存储在内存中的实现方法

  • 引言
  • 背景
  • 消息存储在内存的实现方法
  • 消息完整存储:完整代码

引言

本节将介绍 langchain \text{langchain} langchain将历史消息存储在内存中的实现方法。

背景

在与大模型交互过程中,经常出现消息管理方面的问题。一些大模型的上下文窗口包含的 token \text{token} token数量往往是有限的,如何将有限的大模型 memory \text{memory} memory合理利用是十分关键的问题。

再比如,在与大模型交互时,可能会产生一系列连续的对话,这些对话往往不是独立的,我们更期望大模型能够合理找出这些对话之间的语义联系,并从而给出更符合要求的答案。

消息存储在内存的实现方法

基于上述背景,第一个朴素的想法是:与大模型连续交互的过程中,大模型能够认识到若干个prompt之间的语义联系,从而给出合理的回复。

  • 准备工作:将模型、prompt以及初始chain的部分进行定义,其中使用MessagePlaceholder交互过程中产生的历史信息留下位置:
from langchain_community.llms import Tongyi
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder	def get_model():return Tongyi(model_name="tongyi-7b-chinese",temperature=0.5,max_tokens=100,)def get_runnable_chain():chat_prompt = ChatPromptTemplate.from_messages([("system","你是一个擅长{field_input}的智能助理,返回结果不超过200字。"),# 历史消息相关的placeholderMessagesPlaceholder(variable_name="history"),("human","{prompt_input}")])llm = get_model()# 创建一个chain式调用,和历史信息相关的可运行chainrunnable = chat_prompt | llmreturn runnable
  • 创建一个store_message字典,在与大模型交互交互过程中,将历史会话记录存储在字典中:
store_message = {}
  • 在用户prompt过程中,设置一个名为session_id的参数,目的是将相同session_idprompt归结为具有语义联系的prompt。定义函数:get_session_history,该函数的目的是:将store_message中当前session_id包含的所有交互信息获取出来。若未获取消息,即session_id第一次出现在store_message,则需要新创建一个ChatMessageHistory的对象,将消息存入其中:
from langchain_community.chat_message_histories import ChatMessageHistory
from langchain_core.chat_history import InMemoryChatMessageHistorydef get_session_history(session_id: str) -> InMemoryChatMessageHistory:if session_id not in store_message:store_message[session_id] = ChatMessageHistory()return store_message[session_id]
  • 创建一个包含历史会话记录的运行器:通过RunnableWithMessageHistory类,通过history的标识,将get_session_history中获取的历史会话记录,结合当前交互步骤的prompt_input(该部分中包含session_id),映射在MessagePlaceHolder中,并最终生成包含交互历史记录的runnable_chain:
from langchain_core.runnables.history import RunnableWithMessageHistorymessage_history_runnable = RunnableWithMessageHistory(runnable=get_runnable_chain(),get_session_history=get_session_history,input_messages_key="prompt_input",history_messages_key="history")
  • 最终使用该runnable_chain进行交互。示例:
response_1 = message_history_runnable.stream(input={"field_input": "历史科普","prompt_input": "简单介绍一下李白"},config={"configurable": {"session_id": "libai_introduction"}})for chunk in response_1:print(chunk, end="", flush=True)

首先是通过field_input对大模型进行角色定义,并提出prompt以及当前交互步骤的session_id。返回结果如下:

李白(701-762),字太白,号青莲居士,唐代著名诗人。出生于中亚碎叶城,少年时迁居四川。他性格豪放不羁,好饮酒作乐,游历名山大川,留下大量诗篇。其诗歌风格飘逸洒脱、意境开阔,充满浪漫主义色彩,善于运用夸张手法和奇特想象。李白与杜甫并称“李杜”,代表作品有《将进酒》、《静夜思》、《望庐山瀑布》等,对后世影响深远。安史之乱爆发后,因参与永王李璘起兵而获罪流放,晚年生活困顿,在当涂病逝。
  • 继续执行,第二次交互的respense_2表示如下:
response_2 = message_history_runnable.stream(input={"field_input": "历史科普","prompt_input": "他具体受到哪些政治迫害?"},config={"configurable": {"session_id": "libai_introduction"}})

需要注意的是,仅从response_2交互自身,我们无法知晓prompt_input中的描述的具体是谁,但由于与response_1共享同一个session_id,结合历史会话信息,能够得到这个描述的是李白。返回结果如下:

李白在安史之乱期间因卷入永王李璘的起兵事件而遭受政治迫害。756年,永王李璘起兵东下,李白应邀加入其幕府。然而,李璘与唐肃宗争夺帝位失败,李白因此获罪被捕入狱。虽经友人营救得以免死,但仍被流放夜郎(今贵州一带)。后因朝廷大赦,李白途中遇赦返回,但晚年生活穷困潦倒,最终客死当涂。这次政治牵连对李白的晚年生活和创作产生了重大影响。

创建一个反例:基于response_2,若prompt_input不变,但调整session_id

response_3 = message_history_runnable.stream(input={"field_input": "历史科普","prompt_input": "他具体受到哪些政治迫害?"},config={"configurable": {"session_id": "libai_politics"}})

预期结果是:大模型不清楚这个他指代的是谁。返回结果如下:

你提到的政治迫害对象不明确呢。如果你是指历史上某个特定人物遭受的政治迫害,比如屈原,他因谗言被楚怀王疏远,放逐汉北;或岳飞被秦桧以“莫须有”的罪名陷害等,你可以具体说说你关注的人物哦,这样我能更准确作答。

至少和李白没什么关系~

消息完整存储:完整代码

# 引入聊天信息历史记录
from langchain_community.chat_message_histories import ChatMessageHistory
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain_core.chat_history import InMemoryChatMessageHistory
from langchain_community.llms import Tongyi# 用于储存历史会话记录
store_message = {}def get_model():return Tongyi(model_name="tongyi-7b-chinese",temperature=0.5,max_tokens=100,)def get_runnable_chain():chat_prompt = ChatPromptTemplate.from_messages([("system","你是一个擅长{field_input}的智能助理,返回结果不超过200字。"),# 历史消息相关的placeholderMessagesPlaceholder(variable_name="history"),("human","{prompt_input}")])llm = get_model()runnable = chat_prompt | llmreturn runnable# 获取历史会话
def get_session_history(session_id: str) -> InMemoryChatMessageHistory:if session_id not in store_message:# 没有查到session_id,使用ChatMessageHistory做一个初始化store_message[session_id] = ChatMessageHistory()return store_message[session_id]message_history_runnable = RunnableWithMessageHistory(runnable=get_runnable_chain(),get_session_history=get_session_history,input_messages_key="prompt_input",history_messages_key="history")if __name__ == '__main__':response_1 = message_history_runnable.stream(input={"field_input": "历史科普","prompt_input": "简单介绍一下李白"},config={"configurable": {"session_id": "libai_introduction"}})for chunk in response_1:print(chunk, end="", flush=True)print("\n")print("-----" * 30)response_2 = message_history_runnable.stream(input={"field_input": "历史科普","prompt_input": "他具体受到哪些政治迫害?"},config={"configurable": {"session_id": "libai_introduction"}})for chunk in response_2:print(chunk, end="", flush=True)print("\n")print("-----" * 30)response_3 = message_history_runnable.stream(input={"field_input": "历史科普","prompt_input": "他具体受到哪些政治迫害?"},config={"configurable": {"session_id": "libai_politics"}})for chunk in response_3:print(chunk, end="", flush=True)

观察一下执行了三次交互后的store_message:

{'libai_introduction': InMemoryChatMessageHistory(messages=[HumanMessage(content='简单介绍一下李白', additional_kwargs={}, response_metadata={}), AIMessage(content='李白(701-762),字太白,号青莲居士,唐代伟大诗人。生于绵州昌隆,祖籍陇西成纪。其诗风豪放飘逸,想象丰富,语言流转自然,音律和谐多变。他喜好饮酒作乐,常与友人畅饮赋诗,留下“斗酒诗百篇”的佳话。代表作有《静夜思》《望庐山瀑布》等。李白一生游历名山大川,交友广泛,曾任翰林供奉,后因卷入永王李璘事件被流放夜郎,途中遇赦返回,晚年生活困顿,病逝于当涂。他与杜甫并称为“李杜”,对后世影响深远。', additional_kwargs={}, response_metadata={}), HumanMessage(content='他具体受到哪些政治迫害?', additional_kwargs={}, response_metadata={}), AIMessage(content='李白在安史之乱期间,因卷入永王李璘的起兵事件而遭受政治迫害。永王李璘是唐玄宗之子,在安禄山叛乱时,他试图争夺帝位,李白误以为他是中兴之主,便加入其幕府。然而,永王兵败后,李白被指控参与谋反,获罪下狱,后被判流放夜郎(今贵州一带)。幸而在流放途中遇赦免,得以返回。这次政治风波对李白晚年生活影响极大,也使他失去了仕途机会。', additional_kwargs={}, response_metadata={})]), 'libai_politics': InMemoryChatMessageHistory(messages=[HumanMessage(content='他具体受到哪些政治迫害?', additional_kwargs={}, response_metadata={}), AIMessage(content='你提到的政治迫害对象不明确呢。如果你是指历史上某个特定人物遭受的政治迫害,比如屈原,他因谗言被楚怀王疏远,放逐汉北;或岳飞被秦桧以“莫须有”的罪名陷害等,你可以具体说说你关注的人物哦,这样我能更准确作答。', additional_kwargs={}, response_metadata={})])
}

很明显,store_message中的两个session_idlibai_introductionlibai_politics相互独立。

相关文章:

langchain学习笔记之消息存储在内存中的实现方法

langchain学习笔记之消息存储在内存中的实现方法 引言背景消息存储在内存的实现方法消息完整存储:完整代码 引言 本节将介绍 langchain \text{langchain} langchain将历史消息存储在内存中的实现方法。 背景 在与大模型交互过程中,经常出现消息管理方…...

怎么在智能合约中植入deepseek

怎么在智能合约中植入deepseek 这里写目录标题 怎么在智能合约中植入deepseek方法概述具体步骤1. 部署大语言模型到链下2. 创建预言机(Oracle)a. 部署预言机节点b. 创建自定义预言机接口(Custom Oracle)3. 设计智能合约a. 编写Solidity代码b. 部署智能合约4. 调用流程注意事…...

驱动开发系列37 - Linux Graphics 2D 绘制流程(二)- 画布创建和窗口关联

一:概述 前面介绍Pixmap表示一块画布,是绘制发生的地方,本节看看驱动程序如何为画布分配内存/显存,以及如何与窗口关联的。 二:为画布分配BO 在系统启动时(用户登录系统之后,会重启Xorg),在 Xorg 服务器初始化时,要为屏幕创建根窗口的 Pixmap,并绑定到 GPU framebu…...

B. Longest Divisors Interval

time limit per test 2 seconds memory limit per test 256 megabytes Given a positive integer nn, find the maximum size of an interval [l,r][l,r] of positive integers such that, for every ii in the interval (i.e., l≤i≤rl≤i≤r), nn is a multiple of ii. …...

前端与后端的对接事宜、注意事项

前端与后端的对接事宜、注意事项 一、对接核心流程(完整生命周期) #mermaid-svg-6yzij6OD8DKqiMLD {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-6yzij6OD8DKqiMLD .error-icon{fill:#552222;}#mermaid-svg-6yzi…...

【第13章:自监督学习与少样本学习—13.2 少样本学习(FSL)与元学习(Meta-Learning)的基础理论与应用案例】

凌晨三点的急诊室,值班医生李大夫正在使用AI辅助诊断系统——面对一张仅有3个标注病例的罕见皮肤病影像,系统竟然给出了95%置信度的准确诊断。这种"见微知著"的超能力,正是少样本学习技术创造的医学奇迹。 一、突破数据荒漠:少样本学习的生存法则 1.1 从人类学习…...

函数防抖和节流

所谓防抖,就是指触发事件后在 n 秒内函数只能执行一次, 如果在 n 秒内又触发了事件,则会重新计算函数执行时间, 短时间高频率触发只有最后一次触发成功 开发使用场景: 搜索框防抖 fn代表要被防抖或者节流的函数&#x…...

linux--关于linux文件IO(2) open、read、lseek、stat

open 在linux中的读写文件有对应的命令。在终端中输入man 2 open可以打开open的手册页,注意man 2是linux自己的函数的一些手册,man 3是C库的手册 打开手册页之后找到open函数的用法如下: #以下是需要的库文件,man 2 open打开直接…...

利用xtquant高效获取财务数据:量化分析的重要补充

利用xtquant高效获取财务数据:量化分析的重要补充 在量化交易领域,虽然市场行情数据是核心,但财务数据作为企业基本面的重要反映,同样不可忽视。通过深入分析企业的财务报表,投资者可以更好地理解企业的经营状况和未来…...

Unity UI个人总结

个人总结,太简单的直接跳过。 一、缩放模式 1.固定像素大小 就是设置一个100x100的方框,在1920x1080像素下在屏幕中长度占比1/19,在3840x2160,方框在屏幕中长度占比1/38。也就是像素长款不变,在屏幕中占比发生变化 2.…...

Javascript的数据类型

Javascript的数据类型 1.基本数据类型1.1七种基本数据类型1.2单独说说BigInt‌1.3其它注意点 2.引用数据类型3.基本数据类型和引用数据类型的区别4.双等于号和三等于号的区别5.Javascript的类型转换机制5.1显示转换(强制转换)5.2隐式转换(1)减、乘、除(2)加(加法要区别算,因为不…...

Day3 25/2/16 SUN

【一周刷爆LeetCode,算法大神左神(左程云)耗时100天打造算法与数据结构基础到高级全家桶教程,直击BTAJ等一线大厂必问算法面试题真题详解(马士兵)】https://www.bilibili.com/video/BV13g41157hK?p4&v…...

欧洲分组加密算法之Kasumi

目录 (1)FL函数 (2)FO函数 (3)FI函数 密钥扩展算法 欧洲分组加密算法之Kasumi Kasumi分组密码算法是由欧洲标准机构ETSI(European Telecommunications Standards Institute)下属的安全算法组于1999年设计的,被用于构造A5/3、GEA3、f8和f9算法,参与移动通信系统无线…...

vue使用v-chart的实践心得

开发Vue2和Vue3时,我们常常需要将数据以图表的形式展示给用户,而 V-Chart 作为一个轻量级且易于集成的图表库,是 Vue 开发的首选。这篇文章,我将写一下关于我在使用这方面的心得。 echarts官网:https://echarts.apach…...

Endnote使用笔记——持续更新

(1)如果样式库里没有想要的期刊格式,可以到这个网址进行下载,并放在本地安装Endnote的文件下边的styles文件里: https://endnote.com/downloads/styles/ (2)EndNote导入参考文献时,关…...

Tetragon:一款基于eBPF的运行时环境安全监控工具

关于Tetragon Tetragon是一款基于eBPF的运行时环境安全监控工具,该工具可以帮助广大研究人员检测并应对安全重大事件,例如流程执行事件、系统调用活动、I/O活动(包括网络和文件访问等)。 在 Kubernetes 环境中使用时,…...

CAS单点登录(第7版)23.Webflow 管理

如有疑问,请看视频:CAS单点登录(第7版) Webflow 管理 概述 Webflow定制 CAS 使用 Spring Webflow 对登录和注销协议进行脚本处理。Spring Web Flow 构建在 Spring MVC 之上,并允许实现 Web 应用程序的“流”。流封装…...

word文档中标题的自动编号问题

最近研究了下标题自动编号,记录下来,以备后用。 (1)从编号1开始,如: 1 ------------------------ 标题1 1.1 ------------------- 标题2 1.1.1 ------------------- 标题3 1.1.1.1 ------------------- 标题…...

kkFileView二开之pdf转图片接口

kkFileView二开之Pdf转图片接口 kkFileView二开系列文章:1 kkFileView源码下载及编译2 Pdf转图片接口2.1 背景2.2 分析2.2 接口开发2.2.1 编写Pdf转图片方法2.2.2 编写转换接口 2.3 接口测试2.3.1 Pdf文件准备2.3.2 pdf2Image 3 部署 kkFileView二开系列文章&#x…...

利用亚马逊云科技RDS for SQL Server配置向量数据存储

生成式人工智能(AI)正迎来又一个快速发展期,引起了开发者们的广泛关注。将生成式能力集成到商业服务和解决方案中变得非常重要。当前的生成式AI解决方案是机器学习和深度学习模型逐步进化迭代的结果。从深度学习到生成式AI的质变飞跃主要是由…...

Docker 离线安装指南

参考文章 1、确认操作系统类型及内核版本 Docker依赖于Linux内核的一些特性,不同版本的Docker对内核版本有不同要求。例如,Docker 17.06及之后的版本通常需要Linux内核3.10及以上版本,Docker17.09及更高版本对应Linux内核4.9.x及更高版本。…...

调用支付宝接口响应40004 SYSTEM_ERROR问题排查

在对接支付宝API的时候,遇到了一些问题,记录一下排查过程。 Body:{"datadigital_fincloud_generalsaas_face_certify_initialize_response":{"msg":"Business Failed","code":"40004","sub_msg…...

模型参数、模型存储精度、参数与显存

模型参数量衡量单位 M:百万(Million) B:十亿(Billion) 1 B 1000 M 1B 1000M 1B1000M 参数存储精度 模型参数是固定的,但是一个参数所表示多少字节不一定,需要看这个参数以什么…...

2025年能源电力系统与流体力学国际会议 (EPSFD 2025)

2025年能源电力系统与流体力学国际会议(EPSFD 2025)将于本年度在美丽的杭州盛大召开。作为全球能源、电力系统以及流体力学领域的顶级盛会,EPSFD 2025旨在为来自世界各地的科学家、工程师和研究人员提供一个展示最新研究成果、分享实践经验及…...

学校招生小程序源码介绍

基于ThinkPHPFastAdminUniApp开发的学校招生小程序源码,专为学校招生场景量身打造,功能实用且操作便捷。 从技术架构来看,ThinkPHP提供稳定可靠的后台服务,FastAdmin加速开发流程,UniApp则保障小程序在多端有良好的兼…...

postgresql|数据库|只读用户的创建和删除(备忘)

CREATE USER read_only WITH PASSWORD 密码 -- 连接到xxx数据库 \c xxx -- 授予对xxx数据库的只读权限 GRANT CONNECT ON DATABASE xxx TO read_only; GRANT USAGE ON SCHEMA public TO read_only; GRANT SELECT ON ALL TABLES IN SCHEMA public TO read_only; GRANT EXECUTE O…...

生成 Git SSH 证书

🔑 1. ​​生成 SSH 密钥对​​ 在终端(Windows 使用 Git Bash,Mac/Linux 使用 Terminal)执行命令: ssh-keygen -t rsa -b 4096 -C "your_emailexample.com" ​​参数说明​​: -t rsa&#x…...

ServerTrust 并非唯一

NSURLAuthenticationMethodServerTrust 只是 authenticationMethod 的冰山一角 要理解 NSURLAuthenticationMethodServerTrust, 首先要明白它只是 authenticationMethod 的选项之一, 并非唯一 1 先厘清概念 点说明authenticationMethodURLAuthenticationChallenge.protectionS…...

unix/linux,sudo,其发展历程详细时间线、由来、历史背景

sudo 的诞生和演化,本身就是一部 Unix/Linux 系统管理哲学变迁的微缩史。来,让我们拨开时间的迷雾,一同探寻 sudo 那波澜壮阔(也颇为实用主义)的发展历程。 历史背景:su的时代与困境 ( 20 世纪 70 年代 - 80 年代初) 在 sudo 出现之前,Unix 系统管理员和需要特权操作的…...

【碎碎念】宝可梦 Mesh GO : 基于MESH网络的口袋妖怪 宝可梦GO游戏自组网系统

目录 游戏说明《宝可梦 Mesh GO》 —— 局域宝可梦探索Pokmon GO 类游戏核心理念应用场景Mesh 特性 宝可梦玩法融合设计游戏构想要素1. 地图探索(基于物理空间 广播范围)2. 野生宝可梦生成与广播3. 对战系统4. 道具与通信5. 延伸玩法 安全性设计 技术选…...