当前位置: 首页 > article >正文

python-langchain框架(1-8-2 缓存机制——验证缓存的效果)

当用户提出一个常见问题时首次调用大模型需要经历网络传输、排队等待、模型推理等完整链路响应时间通常在1至3秒。这个时长已超过人类对“流畅交互”的心理阈值200毫秒用户会明显感知到“卡顿”和“等待焦虑”。而启用缓存后相同问题的后续请求直接从本地数据库读取结果响应时间骤降至10毫秒以内——这种“无感秒回”的体验让用户感觉系统始终在线、反应迅捷极大提升了产品专业度和信任感。下面看看这段代码就能清晰的体现使用缓存后能提升的用户体验。同一个问题问大模型三次第一次没有缓存后两次有缓存12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667importosimporttimefromlangchain_community.cacheimportSQLiteCachefromlangchain_openaiimportChatOpenAIfromlangchain.globalsimportset_llm_cache, get_llm_cache# 1. 清理旧缓存确保演示纯净CACHE_DBlangchain_demo.dbifos.path.exists(CACHE_DB):os.remove(CACHE_DB)print(f 已清理旧缓存: {CACHE_DB})# 2. 启用缓存 set_llm_cache(SQLiteCache(database_pathCACHE_DB))print(f 缓存已启用: {get_llm_cache()}\n)# 3. 配置 LLM llmChatOpenAI(api_keyos.getenv(DEEPSEEK_API_KEY),base_urlos.getenv(BASE_URL),# Deepseek 的 API 基础地址modeldeepseek-v3:671b,# Deepseek 对话模型可选deepseek-chat-pro 等高级模型temperature0.7,# 温度参数0-1越低越稳定max_tokens1024# 最大生成 tokens)# 4. 核心演示函数 defdemonstrate_cache_effect(query:str, repeat:int3):演示缓存效果首次调用慢 vs 后续调用快Args:query: 要提问的问题repeat: 重复调用次数第1次未缓存后续应命中缓存print(*60)print(f 测试问题: \{query}\)print(f 将重复调用 {repeat} 次第1次无缓存后续应命中缓存)print(*60\n)durations[]foriinrange(repeat):print(f\n[第 {i 1} 次调用])starttime.perf_counter()# 高精度计时# 关键使用完全相同的输入触发缓存responsellm.invoke(query)duration(time.perf_counter()-start)*1000# 转为毫秒durations.append(duration)# 判断是否命中缓存通过耗时阈值粗略判断is_cachedi 0# 首次通常 500ms缓存通常 50msifi 0:print(缓存命中,耗时str(duration))else:print(真实请求,耗时str(duration))print(f 回答: {response.content[:60]}...)# 5. 执行演示 if__name____main__:# 测试标准问题确保完全相同的字符串demonstrate_cache_effect(太阳系哪个行星最大, repeat3)运行结果已清理旧缓存: langchain_demo.db缓存已启用: langchain_community.cache.SQLiteCache object at 0x000001D668B50410测试问题: 太阳系哪个行星最大将重复调用 3 次第1次无缓存后续应命中缓存[第 1 次调用]真实请求,耗时17445.118000000093回答: 太阳系中最大的行星是**木星**。以下是关于木星的一些关键信息### 木星的基本特征1. **体积与质量** ...[第 2 次调用]缓存命中,耗时410.93799999998737回答: 太阳系中最大的行星是**木星**。以下是关于木星的一些关键信息### 木星的基本特征1. **体积与质量** ...[第 3 次调用]

相关文章:

python-langchain框架(1-8-2 缓存机制——验证缓存的效果)

当用户提出一个常见问题时,首次调用大模型需要经历网络传输、排队等待、模型推理等完整链路,响应时间通常在1至3秒。这个时长已超过人类对“流畅交互”的心理阈值(200毫秒),用户会明显感知到“卡顿”和“等待焦虑”。而…...

FPGA新手避坑:用Quartus Prime 23.1的FIFO IP核实现跨时钟域传输(附仿真代码)

FPGA跨时钟域传输实战:Quartus Prime 23.1 FIFO IP核深度解析 第一次在Quartus Prime里拖拽FIFO IP核时,看着满屏的参数选项,我对着屏幕发呆了十分钟——到底该选同步还是异步?深度设多少合适?为什么仿真时数据总对不上…...

VisualCppRedist AIO:一个文件解决Windows运行库的十年难题

VisualCppRedist AIO:一个文件解决Windows运行库的十年难题 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 你是否曾在打开心爱的游戏或专业软件时&a…...

轻量级加密新选择:tiny-AES-c深度解析

轻量级加密新选择:tiny-AES-c深度解析 【免费下载链接】tiny-AES-c Small portable AES128/192/256 in C 项目地址: https://gitcode.com/gh_mirrors/ti/tiny-AES-c 在嵌入式系统与物联网设备等资源受限环境中,数据安全面临着独特挑战。轻量级AES…...

2024年实测:火狐浏览器上这3款广告过滤插件,谁才是真正的网页加速器?

2024年火狐浏览器广告过滤插件终极对决:谁才是网页加速王者? 在数字时代,网页浏览速度直接影响着我们的工作效率和上网体验。对于火狐浏览器用户来说,选择一款高效的广告过滤插件不仅能屏蔽恼人的广告,更能显著提升页面…...

【OpenCore Configurator】:解决黑苹果配置难题的智能化解决方案

【OpenCore Configurator】:解决黑苹果配置难题的智能化解决方案 【免费下载链接】OpenCore-Configurator A configurator for the OpenCore Bootloader 项目地址: https://gitcode.com/gh_mirrors/op/OpenCore-Configurator OpenCore Configurator作为一款针…...

Verilog有限状态机实战:5分钟搞定红绿灯控制器(附完整代码)

Verilog有限状态机实战:从红绿灯控制器掌握FPGA设计精髓 红绿灯控制器是数字电路设计的经典案例,也是学习Verilog有限状态机(FSM)的最佳切入点。作为FPGA初学者,你可能已经看过各种理论讲解,但真正动手时依…...

从参数化几何到气动分析:OpenVSP航空设计工具深度解析

从参数化几何到气动分析:OpenVSP航空设计工具深度解析 【免费下载链接】OpenVSP A parametric aircraft geometry tool 项目地址: https://gitcode.com/gh_mirrors/ope/OpenVSP 在航空工程领域,如何将概念设计快速转化为可分析的几何模型一直是技…...

深圳地铁大数据客流分析系统:如何用开源技术栈破解千万级乘客的交通治理难题

深圳地铁大数据客流分析系统:如何用开源技术栈破解千万级乘客的交通治理难题 【免费下载链接】SZT-bigdata 深圳地铁大数据客流分析系统🚇🚄🌟 项目地址: https://gitcode.com/gh_mirrors/sz/SZT-bigdata 深圳地铁作为中国…...

LangChain-AI应用开发框架(四)

目录 一.LangChain软件包安装 二.LangChain能力详解 1.本章节环境说明 2.目标与内容 三.详细过程 1.步骤1: a.申请API key并配置环境变量 b.配置环境变量 步骤2:定义大模型 a.安装OpenAI包 b.定义大模型 步骤3:定义消息列表 步骤4&#xff…...

从点云数据到3D实例分割:手把手带你跑通Mask3D在S3DIS数据集上的完整流程

从点云数据到3D实例分割:手把手带你跑通Mask3D在S3DIS数据集上的完整流程 在三维视觉领域,点云实例分割一直是极具挑战性的任务。想象一下,当你面对一个杂乱无章的办公室场景点云数据时,如何让算法不仅能识别出桌椅、电脑等物体&a…...

LIN总线‘智能调度’到底怎么玩?一个汽车雨刮案例讲透事件触发与偶发帧

LIN总线智能调度实战:汽车雨刮系统的动态事件处理与性能优化 雨滴敲击挡风玻璃的瞬间,现代汽车的智能雨刮系统已经完成了从感知到响应的全套动作。这背后是LIN总线在主从架构下对事件触发、偶发调度和诊断插入的精密协调——本文将用工程视角拆解这套机制…...

linux——消息队列发送和读取函数

int msgsnd(int msqid, const void *msgp, size_t msgsz, int msgflg); //读取消息,成功返回消息数据的长度,失败返回‐1 参数: msgid:消息队列的ID msgp:指向消息的指针,常用结构体msgbuf如下: struct msgbuf { lon…...

Python自动化办公:3分钟搞定Outlook邮件批量导出(附完整代码)

Python自动化办公:3分钟搞定Outlook邮件批量导出(附完整代码) 每天早晨打开Outlook,面对堆积如山的未读邮件,你是否也感到一阵窒息?市场部的周报、客户的需求变更、财务部的报销提醒……重要信息散落在上百…...

Win11Debloat:Windows系统深度优化工具的全方位解决方案

Win11Debloat:Windows系统深度优化工具的全方位解决方案 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter and …...

5款轻量级效率工具让你的文字识别效率提升300%:Umi-OCR完全指南

5款轻量级效率工具让你的文字识别效率提升300%:Umi-OCR完全指南 【免费下载链接】Umi-OCR OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内…...

Cisco Packet Tracer实战:从零搭建一个带冗余和ACL策略的企业网络(附完整配置命令)

Cisco Packet Tracer企业网络实战:冗余架构与ACL策略深度解析 第一次在Packet Tracer中搭建完整企业网络时,我被VLAN间通信、HSRP热备切换和ACL策略的连锁反应彻底难住了。记得那个深夜,当错误配置的ACL导致整个财务部门网络瘫痪时&#xff0…...

WebPlotDigitizer完全指南:从图表图像提取数据的终极解决方案

WebPlotDigitizer完全指南:从图表图像提取数据的终极解决方案 【免费下载链接】WebPlotDigitizer Computer vision assisted tool to extract numerical data from plot images. 项目地址: https://gitcode.com/gh_mirrors/we/WebPlotDigitizer 你是否曾经面…...

仿真波形截图](https://example.com/waveform.jpg

永磁同步电机全速域无位置传感器控制仿真,高频注入改进滑膜控制,PMSM矢量控制仿真 1,在零低速域,采用无数字滤波器高频方波注入法,减少滤波的相位影响,且对凸极性要求不高; 2,在中高…...

1989-2017 年泛北极和北方地区冬季原位土壤 CO2 通量的综合分析

Synthesis of Winter In Situ Soil CO2 Flux in pan-Arctic and Boreal Regions, 1989-2017 简介 本数据集综合了来自泛北极和北方多年冻土区多个地点的冬季(9 月至次年 4 月)原位土壤 CO₂通量测量数据。这些原位数据来自 1989 年至 2017 年间开展的 …...

别再只盯着LSB了:用Python实战对比空间域与DCT/DWT变换域水印的鲁棒性

别再只盯着LSB了:用Python实战对比空间域与DCT/DWT变换域水印的鲁棒性 数字水印技术作为信息隐藏领域的重要分支,其核心挑战始终是如何在不可见性与抗攻击能力之间找到最佳平衡点。传统教材和理论课程往往将LSB(最低有效位)算法作…...

基于MATLAB的车牌识别之旅:模板匹配法实战

基于MATLAB,使用模板匹配法实现车牌的识别 具体包括将原图灰度化,边缘检测,腐蚀操作,车牌区域定位,车牌区域矫正,二值化,均值滤波,切割,字符匹配,最终显示车牌…...

时序数据库选型避坑指南:从写入性能到查询优化的5个关键指标对比(含IoTDB实测数据)

时序数据库选型实战:5个关键指标与IoTDB性能深度评测 当工业互联网平台每秒需要处理百万级传感器数据时,传统数据库的写入瓶颈往往成为系统崩溃的导火索。某汽车制造厂的案例颇具代表性——他们在初期选型时过度关注查询功能,结果系统上线后频…...

利用快马ai快速原型开发openclaw类网页数据抓取chrome插件

利用AI快速原型开发OpenClaw类网页数据抓取Chrome插件 最近在做一个数据采集的小项目,需要从电商网站抓取商品信息。传统做法要手动写各种XPath和CSS选择器,费时费力。后来发现用InsCode(快马)平台的AI辅助开发,可以快速实现一个类似OpenCla…...

YOLO26涨点改进| ICCV 2025 | 独家创新首发、特征融合改进篇| 引入I-SCA / V-SCA特征融合模块,含多种创新改进,助力图像融合、小目标检测、图像分割、图像分类高效涨点改进

一、本文介绍 🔥本文给大家介绍使用 I-SCA 和 V-SCA 模块(IVSCAM)改进 YOLO26 网络模型的核心作用,是在特征提取与融合阶段增强不同层级或不同来源特征之间的交互能力,使模型能够以更明确的引导方式突出关键目标区域。其中,I-SCA 更适合强化类似显著区域、热目标或高响…...

K8s混沌工程叛变:随机宕机暴露的职场PUA

在云原生架构席卷软件世界的今天,Kubernetes(K8s)以其强大的编排能力,成为分布式系统稳定运行的基石。随之兴起的混沌工程,则扮演着“压力测试师”的角色,通过主动注入Pod宕机、网络延迟等故障,…...

元宇宙遗产:那些永远无法测试的AR社交漏洞

测试的疆界与永恒的盲区在软件测试领域,我们习惯于与已知作战。我们制定详尽的测试用例,模拟用户行为,构建自动化脚本,利用AI生成攻击向量,力求覆盖每一个可预见的边界和异常。漏洞扫描、渗透测试、模糊测试、代码审查…...

YOLO26涨点改进| ICCV 2025 | 独家创新首发、注意力改进篇| 引入CBSM通道增强与智能空间映射模块,含多种创新改进,助力图像融合、红外小目标检测、图像分割、图像分类高效涨点

一、本文介绍 🔥本文给大家介绍使用 CBSM通道增强与智能空间映射模块 改进YOLO26网络模型,作用在于对输入特征进行通道增强与空间映射,使浅层图像信息能够更好地适配深层语义特征,从而提升特征表达质量并减少特征不匹配问题。其优势体现在能够有效抑制背景噪声、强化关键…...

保姆级教程:在ROS Noetic下用DWA算法让无人机在已知地图里自动巡航(附完整配置文件)

无人机自主导航实战:ROS Noetic中DWA算法的深度配置与避坑指南 当你在Gazebo仿真环境中看着无人机缓缓升起,准备开始它的首次自主飞行时,那种期待与忐忑交织的感觉,想必每个ROS开发者都深有体会。本文将从实战角度出发&#xff0c…...

72小时数字记忆拯救计划:GetQzonehistory全方位备份方案

72小时数字记忆拯救计划:GetQzonehistory全方位备份方案 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 记忆保卫战:当十年说说面临消失危机 "您的QQ空间数…...