当前位置：首页 > news >正文

总结之LangChain（三）——模型IO缓存

news 2026/2/9 18:25:33

一、聊天模型缓存

LangChain为聊天模型提供了一个可选的缓存层。这有两个好处：

如果您经常多次请求相同的完成结果，它可以通过减少您对LLM提供程序的API调用次数来帮您节省费用。
它可以通过减少您对LLM提供程序的API调用次数来加快您的应用程序速度。

from langchain_openai import ChatOpenAIllm = ChatOpenAI()

from langchain.globals import set_llm_cache

内存缓存

%%time 是一个魔术命令，用于在代码中测量代码块的执行时间。它是Python编程语言中的一个内置命令，可以用来计算代码块的执行时间。通过在代码块前加上"%%time"，可以获取代码块的执行时间信息，包括总时间、CPU时间和内存使用情况等。
注意：%%time是Jupyter Notebook和IPython环境的特性，标准Python脚本(.py)或其他非交互式Python环境中无法直接使用。如果你在非Jupyter环境下需要类似功能，可以使用time模块来手动计时。

%%time
from langchain.cache import InMemoryCacheset_llm_cache(InMemoryCache())# 第一次，它尚未在缓存中，所以需要更长的时间
llm.predict("明天天气怎么样")

%%time
# 第二次，由于已存在于缓存中，因此速度更快
llm.predict("明天天气怎么样")

完整示例代码

from langchain_openai import ChatOpenAI
from langchain.cache import InMemoryCache
from langchain.globals import set_llm_cache
import time
llm = ChatOpenAI(api_key="sk-XXXXX")set_llm_cache(InMemoryCache())start_time = time.time()print(llm.predict("明天天气怎么样？"))
end_time = time.time()
execution_time = end_time - start_time
print(f"代码执行时间: {execution_time} 秒")start_time = time.time()
print(llm.predict("明天天气怎么样？"))
end_time = time.time()
execution_time = end_time - start_time
print(f"代码执行时间: {execution_time} 秒")

结果

抱歉，我无法提供明确的明天天气预报，因为我无法访问实时天气数据。建议你查看天气预报应用或网站，以获取最新的天气信息。
代码执行时间: 5.457608938217163 秒
抱歉，我无法提供明确的明天天气预报，因为我无法访问实时天气数据。建议你查看天气预报应用或网站，以获取最新的天气信息。
代码执行时间: 0.0010001659393310547 秒

当然，可以结合我们的Chain来使用，如下：

from langchain_openai import ChatOpenAI
from langchain.cache import InMemoryCache
from langchain.globals import set_llm_cache
import time
llm = ChatOpenAI(api_key="sk-XXX")from langchain_core.prompts import ChatPromptTemplate
prompt = ChatPromptTemplate.from_messages([("system", "你是一个专业的天气播报员"),("user", "{input}")
])chain = prompt | llm
set_llm_cache(InMemoryCache())
start_time = time.time()print(chain.invoke("明天天气怎么样？"))
end_time = time.time()
execution_time = end_time - start_time
print(f"代码执行时间: {execution_time} 秒")start_time = time.time()
print(chain.invoke("明天天气怎么样？"))
end_time = time.time()
execution_time = end_time - start_time
print(f"代码执行时间: {execution_time} 秒")

结果

content='明天的天气预报如下：\n- 地点：[请提供具体地点]\n- 天气：[晴/多云/阴/雨/雪/雾等]\n- 温度范围：[最高温度]℃ 到 [最低温度]℃\n- 风力风向：[风力等级]，[风向]\n\n请提供具体地点，我可以帮您查询更详细的天气情况。' response_metadata={'token_usage': {'completion_tokens': 131, 'prompt_tokens': 33, 'total_tokens': 164}, 'model_name': 'gpt-35-turbo', 'system_fingerprint': 'fp_811936bd4f', 'finish_reason': 'stop', 'logprobs': None} id='run-c07a049c-727d-47bc-a6c4-89135ff279c6-0' usage_metadata={'input_tokens': 33, 'output_tokens': 131, 'total_tokens': 164}
代码执行时间: 3.432565689086914 秒
content='明天的天气预报如下：\n- 地点：[请提供具体地点]\n- 天气：[晴/多云/阴/雨/雪/雾等]\n- 温度范围：[最高温度]℃ 到 [最低温度]℃\n- 风力风向：[风力等级]，[风向]\n\n请提供具体地点，我可以帮您查询更详细的天气情况。' response_metadata={'token_usage': {'completion_tokens': 131, 'prompt_tokens': 33, 'total_tokens': 164}, 'model_name': 'gpt-35-turbo', 'system_fingerprint': 'fp_811936bd4f', 'finish_reason': 'stop', 'logprobs': None} id='run-c07a049c-727d-47bc-a6c4-89135ff279c6-0' usage_metadata={'input_tokens': 33, 'output_tokens': 131, 'total_tokens': 164}
代码执行时间: 0.0029997825622558594 秒```

程序或者脚本运行周期结束，缓存失效。

SQLite缓存

from langchain_openai import ChatOpenAI
from langchain.cache import SQLiteCache
from langchain.globals import set_llm_cache
import time
llm = ChatOpenAI(api_key="sk-XXX")from langchain_core.prompts import ChatPromptTemplate
prompt = ChatPromptTemplate.from_messages([("system", "你是一个专业的天气播报员"),("user", "{input}")
])chain = prompt | llm
set_llm_cache(SQLiteCache(database_path=".langchain.db"))
start_time = time.time()print(chain.invoke("明天天气怎么样？"))
end_time = time.time()
execution_time = end_time - start_time
print(f"代码执行时间: {execution_time} 秒")start_time = time.time()
print(chain.invoke("明天天气怎么样？"))
end_time = time.time()
execution_time = end_time - start_time
print(f"代码执行时间: {execution_time} 秒")

结果

content='明天的天气预报如下：预计会有阵雨，气温介于20-25摄氏度之间，风力较强，东北风，风速大约在20-25公里/小时。请注意携带雨具并做好防风保暖措施。' response_metadata={'token_usage': {'completion_tokens': 90, 'prompt_tokens': 33, 'total_tokens': 123}, 'model_name': 'gpt-35-turbo-16k', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None} id='run-55940874-2056-44e8-90e2-c0163b218ced-0' usage_metadata={'input_tokens': 33, 'output_tokens': 90, 'total_tokens': 123}
代码执行时间: 2.634726047515869 秒
content='明天的天气预报如下：预计会有阵雨，气温介于20-25摄氏度之间，风力较强，东北风，风速大约在20-25公里/小时。请注意携带雨具并做好防风保暖措施。' response_metadata={'token_usage': {'completion_tokens': 90, 'prompt_tokens': 33, 'total_tokens': 123}, 'model_name': 'gpt-35-turbo-16k', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None} id='run-55940874-2056-44e8-90e2-c0163b218ced-0' usage_metadata={'input_tokens': 33, 'output_tokens': 90, 'total_tokens': 123}
代码执行时间: 0.23708701133728027 秒

总结之LangChain（三）——模型IO缓存

一、聊天模型缓存

内存缓存

SQLite缓存

相关文章：

总结之LangChain（三）——模型IO缓存

判断一个Java服务是不是GateWay

三次插值曲线--插值技术

python循环结构

深入理解Netty的Pipeline机制：原理与实践详解

直方图均衡化示例

私域电商新纪元：消费增值模式的创新与成功实践

Java——IO流（一）-（6/8）：字节流-FileInputStream 每次读取多个字节（示例演示）、一次读取完全部字节（方式一、方式二，注意事项）

服务器SSH 免密码登录

Linux安装MySQL以及远程连接

SQL Server 数据库分页技术详解：选择最佳方法优化查询性能”。

electron录制-镜头缩放、移动

红队内网攻防渗透：内网渗透之内网对抗：信息收集篇自动项目本机导出外部打点域内通讯PillagerBloodHound

2024最新IDEA插件开发+发布全流程 SelectCamelWords[选中驼峰单词]（idea源代码）

【网络安全】网络安全基础精讲 - 网络安全入门第一篇

初识 GPT-4 和 ChatGPT

【C语言】解决C语言报错：Array Index Out of Bounds

【C++】一个极简但完整的C++程序

Lua迭代器详解（附加红点功能实例）

锂磷硫（LPS）属于硫化物固态电解质 Li7P3S11是代表性产品

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

调用支付宝接口响应40004 SYSTEM_ERROR问题排查

【WiFi帧结构】

《用户共鸣指数（E）驱动品牌大模型种草：如何抢占大模型搜索结果情感高地》

生成 Git SSH 证书

DIY｜Mac 搭建 ESP-IDF 开发环境及编译小智 AI

【RockeMQ】第2节｜RocketMQ快速实战以及核⼼概念详解（二）

关于 WASM：1. WASM 基础原理

GitHub 趋势日报 (2025年06月06日)

NPOI Excel用OLE对象的形式插入文件附件以及插入图片