当前位置：首页 > news >正文

pytorch框架保存和加载模型

news 文章来源：https://blog.csdn.net/Supremelv/article/details/141090253 2025/5/15 12:11:12

在 PyTorch 中，有几种常见的方法来保存和加载模型，具体方法取决于你想保存什么内容（例如，只保存模型的权重，还是保存整个模型）。下面我将介绍几种常见的保存和加载模型的方法。

1、保存和加载模型的 `state_dict`

state_dict 是一个简单的 Python 字典对象，它将每一层的参数映射到其对应的张量（tensor）。这是最推荐的保存方式，因为它只保存模型的权重和参数，而不依赖于模型的代码结构。
保存模型的 state_dict：

import torch
import torch.nn as nn# 假设我们有一个模型
model = nn.Linear(10, 2)# 保存模型的 state_dict
torch.save(model.state_dict(), 'model.pth')

加载模型的 state_dict：

import torch
import torch.nn as nn# 假设我们有相同结构的模型
model = nn.Linear(10, 2)# 加载 state_dict
model.load_state_dict(torch.load('model.pth'))# 使用模型
model.eval()

2、保存和加载整个模型

这种方法不仅保存了模型的权重和参数，还保存了模型的结构。因此，整个模型在加载时不需要再定义模型结构。尽管这提供了更大的便利性，但也有一些缺点，比如文件可能与代码过于耦合（会保存模型的类和结构，如果代码发生变化可能无法加载）。
保存整个模型：

import torch
import torch.nn as nn# 假设我们有一个模型
model = nn.Linear(10, 2)# 保存整个模型
torch.save(model, 'model_entire.pth')

加载整个模型：

import torch# 加载整个模型
model = torch.load('model_entire.pth')# 使用模型
model.eval()

3、保存和加载 checkpoint（保存更多的训练状态）

如果你希望保存更多的训练信息，例如优化器状态、当前的 epoch 以及训练损失等，以便后续继续训练，可以保存一个包含多个内容的字典。
保存 checkpoint：

import torch
import torch.nn as nn
import torch.optim as optim# 假设我们有一个模型和优化器
model = nn.Linear(10, 2)
optimizer = optim.SGD(model.parameters(), lr=0.001)# 保存 checkpoint
checkpoint = {'epoch': 10,'model_state_dict': model.state_dict(),'optimizer_state_dict': optimizer.state_dict(),'loss': 0.5,
}torch.save(checkpoint, 'checkpoint.pth')

加载 checkpoint：

import torch
import torch.nn as nn
import torch.optim as optim# 假设我们有相同结构的模型和优化器
model = nn.Linear(10, 2)
optimizer = optim.SGD(model.parameters(), lr=0.001)# 加载 checkpoint
checkpoint = torch.load('checkpoint.pth')
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
epoch = checkpoint['epoch']
loss = checkpoint['loss']# 恢复训练
model.train()

4、动态量化后的模型保存与加载

如果你对模型进行了量化（如动态量化），你可能需要保存量化后的模型。保存和加载方法与保存 state_dict 类似。
动态量化模型：

import torch
import torch.nn as nn# 假设我们有一个模型
model = nn.Linear(10, 2)# 进行动态量化
quantized_model = torch.quantization.quantize_dynamic(model, {nn.Linear}, dtype=torch.qint8
)# 保存量化后的模型
torch.save(quantized_model.state_dict(), 'quantized_model.pth')

加载量化模型：

import torch
import torch.nn as nn# 重新定义与量化前相同的模型结构
model = nn.Linear(10, 2)# 加载量化后的模型权重
model.load_state_dict(torch.load('quantized_model.pth'))
model.eval()

总结

保存 state_dict：最常用和推荐的方式，只保存模型参数，需手动重新定义模型结构后加载。
保存整个模型：保存模型结构和参数，一次性加载整个模型，但依赖于模型的代码结构。
保存 checkpoint：适合长时间训练的场景，保存更多状态以便后续继续训练。
保存量化后的模型：用于保存经过量化处理的模型，节省存储空间并提升推理速度。

不同的保存方式适合不同的使用场景，推荐使用 state_dict 来保存模型权重，尤其是在需要在不同环境或版本中加载模型时。

pytorch框架保存和加载模型

在 PyTorch 中，有几种常见的方法来保存和加载模型，具体方法取决于你想保存什么内容（例如，只保存模型的权重，还是保存整个模型）。下面我将介绍几种常见的保存和加载模型的方法。 1、保存和加载模型的 state…...

编程日记 2024/8/11 23:53:08

开发输出防护栏以检测GPT-4o幻觉

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领…...

编程日记 2024/8/11 23:52:07

代码复现，代码改进，算法复现，模型复现

目前空闲可接硕士，博士，代码复现，改进代码，文献复现，算法复现，模型复现，文章复现，科研复现，可定制创新点，对比，模块，创新思路&#xf…...

编程日记 2024/8/11 23:50:05

基于STM32开发的智能机器人系统

目录引言环境准备工作硬件准备软件安装与配置系统设计系统架构硬件连接代码实现初始化代码控制代码应用场景自动导航机器人家用服务机器人常见问题及解决方案常见问题解决方案结论 1. 引言智能机器人通过整合传感器、控制器和执行机构，能够自主完成环境感…...

编程日记 2024/8/11 23:48:03

【数据结构题目】循环队列，以及队列实现栈的模拟

前言： 🌟🌟Hello家人们，这期讲解数据结构队列的基础知识，希望你能帮到屏幕前的你。 📚️上期博客在这里：http://t.csdnimg.cn/oOkvk 📚️感兴趣的小伙伴看一看小编主页：G…...

编程日记 2024/8/11 23:42:57

大数据CloudSim应用实践：基于CloudSimExamle6.java修改（超详细教程）

文章目录大数据CloudSim应用实践：基于CloudSimExamle6.java修改（超详细教程）1 准备1.1 操作系统1.2 软件 2 安装JDK2.1 安装JDK 3 配置Eclipse集成开发环境3.1 启动Eclipse3.2 配置Java运行时环境JRE 4 创建Java项目4.1 创建项目4.2 导入jar…...

编程日记 2024/8/11 23:41:56

完美解决浏览器的输入框自动填入时，黄色背景问题，以及图标被遮住问题（最新）

用图说话↓↓↓ 首先用代码解决黄色背景问题，box-shadow颜色设置透明即可，延时渲染时间可修改为更久 :deep(input:-webkit-autofill) {box-shadow: 0 0 0 1000px transparent !important;/* 浏览器记住密码的底色的颜色 */-webkit-text-fill-color: #f…...

编程日记 2024/8/11 23:40:55

C 语言中的头文件

1、C 语言中 include <> 与include “” 的区别? #include < > 引用的是编译器的类库路径里面的头文件。 #include " " 引用的是你程序目录的相对路径中的头文件，如果在程序目录没有找到引用的头文件则到编译器的类库路径的目录下找该头文…...

编程日记 2024/8/11 23:39:53

数据结构复杂度

文章目录一. 数据结构前言1.1 数据结构1.2 算法二. 算法效率2.1 时间复杂度2.1.1 T(N)函数式2.1.2 大O的渐进表示法 2.2 空间复杂度2.3 常见复杂度比较 2.3 复杂度算法题1.2. 一. 数据结构前言 1.1 数据结构什么是数据结构呢？打开一个人的主页，有很…...

编程日记 2024/8/11 23:38:52

MySQL基础篇

一、MySQL概述 MySQL是一个数据库管理系统，由瑞典MySQL AB公司开发，属于Oracle推出的产品。MySQL是最流行的关系型数据库管理系统之一，在WEB应用方面，MySQL是最好的RDBMS（关系数据库管理系统） &#xff0c…...

编程日记 2024/8/11 23:37:51

详解C++中的四种强制转换reinterpret_cast / const_cast / static_cast / dynamic_cast

目录 1.reinterpret_cast 2.const_cast 3.static_cast 4.dynamic_cast 例子 C中存在四种强制转换：reinterpret_cast / const_cast / static_cast / dynamic_cast 1.reinterpret_cast 格式 ： reinterpret_cast<type_id> (expression) 用于类型…...

编程日记 2024/8/11 23:36:50

Word中加载Mathtype后粘贴复制快捷键(Ctrl+C/V)不能使用

操作环境 windows 11操作系统 word版本2021 mathtype版本7.4 这个问题只出现在word中，在excel和ppt中都不存在这个问题，而且之前在另一台电脑中使用word2016版本并没有这种问题的，然后网上搜了一下有不少人有这种问题，word直接取…...

编程日记 2024/8/11 23:35:49

Linux硬件-bios

作者介绍：简历上没有一个精通的运维工程师。希望大家多多关注作者，下面的思维导图也是预计更新的内容和当前进度(不定时更新)。在Linux的服务器领域，我们能接触的到硬件其实挺多的，但是在这些硬件我们根据我们的需要去使用的时候…...

编程日记 2024/8/11 23:33:48

VisionPro二次开发学习笔记12-使用CogToolGroup控件进行图像检测

本示例演示了如何通过图像数据库使用 CogImageFileTool，并将其放入 CogToolGroup 中，对于数据库中的每个图像运行一次检测. 当用户按下 RunTest 按钮时，程序执行以下操作： 如果工具组中没有 CogImageFileTools，它将显…...

编程日记 2024/8/11 23:32:42

mfc140u.dll丢失的科学修复手段，简单又方便的mfc140u.dll修复

遇到 "缺失 mfc140u.dll 文件" 的提示时可能会让你疑惑，但不用担心。这个文件是 Microsoft Visual C 2015 的重要组成部分，对运行特定程序非常关键。幸运的是，解决这一问题并不难。本文将简单指导你如何恢复或修复丢失的 mfc140u.d…...

编程日记 2024/8/11 23:31:41

RabbitMQ、Kafka对比（超详细），Kafka、RabbitMQ、RocketMQ的区别

文章目录一、kafka和rabbitmq全面对比分析1.1 简介1.2 kafka和rabbitmq全面对比分析1.3 影响因素二、RabbitMQ、Kafka主要区别2.1 详解/主要区别2.1.1 设计目标和适用场景2.1.2 架构模型方面2.1.3 吞吐量和性能2.1.4 消息存储和持久化2.1.5 消息传递保证2.1.6 集群负载均衡方…...

编程日记 2024/8/11 23:25:35

【案例35】销售订单公式问题导致系统宕机

问题现象经过顾问反馈，发现系统现在出现卡顿，NCC一直在转圈。问题分析远程排查，发现在服务器从机上defalut-7发生了内存溢出，宕机。生成了宕机日志。分析结果如下： 销售订单相关操作，vo太多了导致…...

编程日记 2024/8/11 23:24:34

编程-设计模式 4：建造者模式

设计模式 4：建造者模式定义与目的定义：建造者模式将一个复杂对象的构建与其表示分离，使得同样的构建过程可以创建不同的表示。目的：该模式主要用于创建复杂对象时，这些对象的创建过程可能涉及多个步骤，…...

编程日记 2024/8/11 23:18:27

百度文心一言API调用，千帆大模型获取API Key和API Secret图解

百度文心一言大模型调用教程，获取文心一言API Key和API Secret的方法，码笔记mabiji.com告诉大家在百度智能云的千帆大模型平台创建应用，即可获取文心一言的API Key和API Secret，详细流程如下： 1、在百度智能云的千帆大…...

编程日记 2024/8/11 23:16:26

kafka下载|安装

1、下载kafka https://kafka.apache.org/downloads 2、安装kafka 解压下载的kafka安装包即可 tar -xvf kafka_2.13-3.7.0.tgz -C /usr/local/3、查看kafka目录 bin目录：存放了脚本 config目录：主要存放了配置文件...

编程日记 2024/8/11 23:15:24

贪心算法part03

134 加油站在一条环路上有 N 个加油站，其中第 i 个加油站有汽油 gas[i] 升。你有一辆油箱容量无限的的汽车，从第 i 个加油站开往第 i1 个加油站需要消耗汽油 cost[i] 升。你从其中的一个加油站出发，开始时油箱为空。如果你可以绕环路行…...

编程日记 2024/8/11 23:13:23

以树莓集团的视角：探索AI技术如何重塑数字媒体产业发展

在科技日新月异的今天，AI技术如同一股不可阻挡的潮流，正深刻改变着我们的世界，尤其是数字媒体产业发展。作为数字产业生态链的杰出建设者，树莓集团始终站在时代前沿，积极探索AI技术如何为数字媒体产业注入新活力。在树…...

编程日记 2024/8/11 23:12:21

package.json的和的区别，以及|| 和 | 的区别

在 package.json 文件中的 scripts 字段里，&& 和 & 用于连接不同的命令，它们的区别在于命令执行的方式和效果： &&： 用于串联两个命令，第一个命令成功（退出码为 0）后&#x…...

编程日记 2024/8/11 23:11:20

Wireshark_DNS_v7.0

Wireshark_DNS_v7.0 一、 nslookup 前置 nslookup 是一个网络命令行工具，用于查询域名系统（DNS）中的域名解析记录。通过使用 nslookup，你可以获取某个域名的IP地址，或者获取与某个IP地址关联的域名信息。查看域名…...

编程日记 2024/8/11 23:10:19

阿里云的CentOS系统上安装Docker

在阿里云的CentOS系统上安装Docker的详细步骤如下： 一、前置条件确保系统内核版本：Docker要求CentOS系统的内核版本高于3.10。你可以通过执行uname -r命令来查看当前系统的内核版本。卸载旧版本的Docker（如果已安装）&#xff1…...

编程日记 2024/8/11 23:09:17

力扣面试经典100题

进阶，其他解法数组 88. 合并两个有序数组 - 力扣（LeetCode） 1、按非递减顺序合并两个数组从末尾开始，用while分没到两个数组头，到第一个数组头，到第二个数组头三种情况 class Solution { public:voi…...

编程日记 2024/8/11 23:08:16

python打怪练习

1. 求一个数的幂值 def mi(a, b):c afor i in range(b-1):a a * creturn aprint(mi(2, 4))2. 输出斐波那契数列 def feibonaqi(n):l []a 1b 1for i in range(n):l.append(a)l.append(b)a b ab a bprint(l)feibonaqi(5)3. 输出特定字典数据 keys [name, old, score…...

编程日记 2024/8/11 23:07:16