当前位置：首页 > news >正文

PyTorch|保存与加载自己的模型

news 2026/2/9 23:32:47

训练好一个模型之后，我们往往要对其进行保存，除非下次用时想再次训练一遍。

下面以一个简单的回归任务来详细讲解模型的保存和加载。

来看这样一组数据：

x=torch.linspace(-1,1,50)x=x.view(50,1)y=x.pow(2)+0.3*torch.rand(50).view(50,1)

画图：

plt.scatter(x.numpy(),y.numpy())

很显然，x与y基本呈二次函数关系，那么接下来我们就来拟合整个函数。

import torchimport matplotlib.pyplot as pltimport torch.nn as nnimport torch.optim as optimx=torch.linspace(-1,1,50)x=x.view(50,1)y=x.pow(2)+0.3*torch.rand(50).view(50,1)net1=nn.Sequential(nn.Linear(1,10),                  nn.ReLU(),                  nn.Linear(10,1))criterion=nn.MSELoss()optimizer=optim.SGD(net1.parameters(),lr=0.2)#训练模型for i in range(1000):    pred=net1(x)    loss=criterion(pred,y)    optimizer.zero_grad()    loss.backward()    optimizer.step()
#测试模型net1.eval()with torch.no_grad():    y1=net1(x)    plt.plot(x.numpy(),y1.numpy(),'r-')    plt.scatter(x.numpy(),y.numpy())

结果似乎不错！

这里我们得到了一个网络net1，它可以被当作一个二次函数，用于描述之前的x，y数据的关系。

得到这个网络后，我们想保存它，主要有两种方式：

1，保存整个网络，包括训练后的各个层的参数

#保存整个网络，包括训练后的各个层的参数torch.save(net1,'net1weight.pkl')

2，只保存训练好的网络的参数，速度更快

#只保存训练好的网络的参数，速度更快torch.save(net1.state_dict(),'net1_params.pkl')

假设我们按第一种方式保存，那么下次想要使用次网络时需要这样做：

network=torch.load('net1weight.pkl')

#测试模型network.eval()with torch.no_grad():    y1=network(x)    plt.plot(x.numpy(),y1.numpy(),'b-')    plt.scatter(x.numpy(),y.numpy())

假设我们按第二种方式保存，那么下次想要使用次网络时需要这样做：

network=nn.Sequential(nn.Linear(1,10),                  nn.ReLU(),                  nn.Linear(10,1))network.load_state_dict(torch.load('net1_params.pkl'))

#测试模型network.eval()with torch.no_grad():    y1=network(x)    plt.plot(x.numpy(),y1.numpy(),'g-')    plt.scatter(x.numpy(),y.numpy())

可以看出，第二次首先需要构造出一个一模一样的模型，接着再导入参数即可。当然，这只是个简单的回归模型，其它模型保存与加载同样如此。

总结一下：

模型保存与导入有两种方式：

方式一：

#模型保存torch.save(net1,'net1weight.pkl')#模型导入network=torch.load('net1weight.pkl')

方式二：

#模型保存torch.save(net1.state_dict(),'net1_params.pkl')#模型导入network.load_state_dict(torch.load('net1_params.pkl'))

PyTorch|保存与加载自己的模型

训练好一个模型之后，我们往往要对其进行保存，除非下次用时想再次训练一遍。下面以一个简单的回归任务来详细讲解模型的保存和加载。来看这样一组数据： xtorch.linspace(-1,1,50)xx.view(50,1)yx.pow(2)0.3*torch.rand(50).view(50,1) 画…...

编程日记 2024/1/8 20:51:58

javaScript：Math工具类方法

1 Math工具类方法: >和其他的类的不同，Math并不是一个构造函数，也就是无法通过new来创建Math的实例 >Math表示的数学，在Math对象中存储了一组数学运算相关的常量的和方法 >这些常量和方法可以直接通过Math来访问 >比如Math.P…...

编程日记 2024/1/8 20:48:55

ffmpeg转码新技能

ffmpeg转码新技能 mp3转wavmp4转gif mp3转wav 今天发现之前用ffmpeg转码不好使了。今天发现一个ffmpeg转码新的用法非常简单 ffmpeg -i 0104.mp3 -f wav 0104.wav mp4转gif 同学求助将mp4转gif。我先用剪影把mp4的多余黑边去除。然后用ffmpeg将mp4转出了gif ffmpeg -i shu…...

编程日记 2024/1/8 20:46:52

Docker学习笔记（一）：Docker命令总结

Docker命令总结一、Docker介绍1.1 镜像与容器区别二、Docker命令一、Docker介绍 Docker是一个开源的应用容器引擎，它允许开发者在几乎任何环境中运行应用程序，而无需担心运行环境的问题。Docker的核心概念是容器，它可以将应用程序及其依赖…...

编程日记 2024/1/8 20:45:51

JavaWeb——后端案例

五、案例 1. 开发规范—Restful REST（Representational State Transfer），表述性状态转换，是一种软件架构风格注： REST是风格，是约定方式，不是规定，可以打破描述模块的功能通常使…...

编程日记 2024/1/8 20:44:50

【CSS】浅学一下filter

目录 1、基本概念 2、用法 3、应用案例更加智能的阴影效果： 元素、网页置灰元素强调、高亮毛玻璃效果调整网页sepia 褐色值可以实现护眼效果 1、基本概念 CSS filter 属性将模糊或颜色偏移等图形效果（对比度、亮度、饱和度、模糊等等&#…...

编程日记 2024/1/8 20:37:43

Commander One for Mac：强大的双窗格文件管理器，让你的工作效率倍增！

Commander One for Mac是一款功能强大的文件管理工具，具有以下主要功能： 双窗格设计：主界面分为两个窗格，用户可以在左侧窗格中导航和浏览文件系统的目录结构，在右侧窗格中查看文件和文件夹的内容。文件操作&#xff…...

编程日记 2024/1/8 20:29:36

leetcode09-机器人能否返回原点

题目链接： https://leetcode.cn/problems/robot-return-to-origin/?envTypestudy-plan-v2&envIdprogramming-skills 思路： 循环遍历，模拟即可代码： class Solution {public boolean judgeCircle(String moves) {int n m…...

编程日记 2024/1/8 20:24:31

sublim安装Autoprefixer插件

有时候在写css样式的时候，分不清哪些属性需要前缀，哪些不需要写前缀，sublime text这款编辑器下安装autoprefixer这款插件可以省去很多问题，写起来也很方便。1 确保系统已经安装node.js 可直接去官网上下载并安装，我的系…...

编程日记 2024/1/8 20:23:30

虚拟机Linux硬盘扩容

扩容前(20G)： 扩容后(60G)： 步骤： 1. 点击虚拟机 -> 设置 -> 硬件 -> 硬盘(SCSI) -> 扩展(E)... -> 输入想要扩容大大小 -> 扩展(E) 2. 运行虚拟机，查看根目录属于那个文件系统，我的是 /dev/sda1…...

编程日记 2024/1/8 20:20:27

设计模式④ ：分开考虑

一、前言有时候不想动脑子，就懒得看源码又不像浪费时间所以会看看书，但是又记不住，所以决定开始写"抄书"系列。本系列大部分内容都是来源于《图解设计模式》（【日】结城浩著）。该系列文章可随意转载。 …...

编程日记 2024/1/8 20:16:23

独占锁ReentrantLock的原理

类图结构 ReentrantLock是可重入的独占锁，同时只能有一个线程可以获取该锁，其他获取该锁的线程会被阻塞而被放入该锁的AQS阻塞队列里面。首先看下ReentrantLock的类图以便对它的实现有个大致了解。从类图可以看到，ReentrantLock最终还是使…...

编程日记 2024/1/8 20:13:21

影响代理IP稳定性的因素有哪些？

代理IP作为一种网络服务，在生活中扮演着各种各样的角色。它们可以用于保护隐私、突破访问限制、提高网络安全性等。代理IP的稳定性受到多种因素的影响，下面和大家探讨一下影响代理IP稳定性的因素。 1、网络环境：代理IP所处的网络环境对它的稳…...

编程日记 2024/1/8 20:12:20

使用Docker-compose快速构建Nacos服务

在微服务架构中，服务的注册与发现扮演着至关重要的角色。Nacos（Naming and Configuration Service）是阿里巴巴开源的服务注册与发现组件，致力于支持动态配置管理和服务发现。最近，一位朋友表达了对搭建一套Nacos开发环…...

编程日记 2024/1/8 20:06:12

【Python】不一样的Ansible（一）

不一样的Ansible——进阶学习前言正文概念Ansible CorePlugins和Modules 插件插件类型编写自定义插件基本要求插件选项文档标准编写插件添加一个本地插件注册为内置插件指定插件目录其他一些技巧更改Strategy 结语前言 Ansible 是一个极其简单的 IT 自动化引擎&#xff0c…...

编程日记 2024/1/8 20:04:09

分布式图文详解！

分布式理论 1. 说说CAP原则？ CAP原则又称CAP定理，指的是在一个分布式系统中，Consistency（一致性）、 Availability（可用性）、Partition tolerance（分区容错性）这3个基本…...

编程日记 2024/1/8 19:57:03

Unity SRP 管线【第五讲：自定义烘培光照】

文章目录一、自定义烘培光照1. 烘培光照贴图2. 获取光照贴图3. 获取物体在光照贴图上的UV坐标4. 采样光照贴图二、自定义光照探针三、 Light Probe Proxy Volumes（LPPV）四、Meta Pass五、自发光烘培一、自定义烘培光照细节内容详见catlikecoding.c…...

编程日记 2024/1/8 19:55:01

CentOS快速安装Mysql5.7（Alibaba Cloud Linux兼容）

1、安装在线下载 http://dev.mysql.com/get/mysql57-community-release-el7-10.noarch.rpm 下载rpm安装包 [roottheo bin]# cd /usr/local [roottheo local]# wget http://dev.mysql.com/get/mysql57-community-release-el7-10.noarch.rpm安装rpm [roottheo local]# rpm -iv…...

编程日记 2024/1/8 19:47:55

【css】快速实现鼠标悬浮变色效果

<div class"nav-item"><div class"ic-img"></div><div>切换</div> </div>.nav-item {width: 100rem;height: 45rem;line-height: 45rem;display: flex;text-align: center;justify-content: center;align-items: cent…...

编程日记 2024/1/8 19:46:54

21. Mysql 事件或定时任务，解放双手，轻松实现自动化

文章目录概念常见操作事件调度器操作查看事件创建事件删除事件启动与关闭事件精选示例构造实时数据定时统计数据总结参考资料概念 Mysql 事件是一种在特定时间点自动执行的数据库操作，也可以称呼为定时任务，它可以自动执行更新数据、插入数据、删除…...

编程日记 2024/1/8 19:44:52

多云管理“拦路虎”：深入解析网络互联、身份同步与成本可视化的技术复杂度

一、引言：多云环境的技术复杂性本质企业采用多云策略已从技术选型升维至生存刚需。当业务系统分散部署在多个云平台时，基础设施的技术债呈现指数级积累。网络连接、身份认证、成本管理这三大核心挑战相互嵌套：跨云网络构建数据…...

编程新知 2026/2/8 16:53:48

Android Wi-Fi 连接失败日志分析

1. Android wifi 关键日志总结 (1) Wi-Fi 断开 (CTRL-EVENT-DISCONNECTED reason3) 日志相关部分： 06-05 10:48:40.987 943 943 I wpa_supplicant: wlan0: CTRL-EVENT-DISCONNECTED bssid44:9b:c1:57:a8:90 reason3 locally_generated1解析： CTR…...

编程新知 2025/9/14 19:44:52

相机Camera日志分析之三十一：高通Camx HAL十种流程基础分析关键字汇总（后续持续更新中）

【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：有对最普通的场景进行各个日志注释讲解，但相机场景太多，日志差异也巨大。后面将展示各种场景下的日志。通过notepad++打开场景下的日志，通过下列分类关键字搜索，即可清晰的分析不同场景的相机运行流程差异…...

编程新知 2025/11/20 7:13:43

三体问题详解

从物理学角度，三体问题之所以不稳定，是因为三个天体在万有引力作用下相互作用，形成一个非线性耦合系统。我们可以从牛顿经典力学出发，列出具体的运动方程，并说明为何这个系统本质上是混沌的，无法得到一般解…...

编程新知 2025/10/19 5:14:05

Spring AI 入门：Java 开发者的生成式 AI 实践之路

一、Spring AI 简介在人工智能技术快速迭代的今天，Spring AI 作为 Spring 生态系统的新生力量，正在成为 Java 开发者拥抱生成式 AI 的最佳选择。该框架通过模块化设计实现了与主流 AI 服务（如 OpenAI、Anthropic）的无缝对接&…...

编程新知 2025/12/25 18:03:56

音视频——I2S 协议详解

I2S 协议详解 I2S (Inter-IC Sound) 协议是一种串行总线协议，专门用于在数字音频设备之间传输数字音频数据。它由飞利浦（Philips）公司开发，以其简单、高效和广泛的兼容性而闻名。 1. 信号线 I2S 协议通常使用三根或四根信号线&a…...

编程新知 2026/2/1 2:08:53

代码规范和架构【立芯理论一】（2025.06.08）

1、代码规范的目标代码简洁精炼、美观，可持续性好高效率高复用，可移植性好高内聚，低耦合没有冗余规范性，代码有规可循，可以看出自己当时的思考过程特殊排版，特殊语法，特殊指令，必须…...

编程新知 2026/1/28 11:47:09

PHP 8.5 即将发布：管道操作符、强力调试

前不久，PHP宣布了即将在 2025 年 11 月 20 日正式发布的 PHP 8.5！作为 PHP 语言的又一次重要迭代，PHP 8.5 承诺带来一系列旨在提升代码可读性、健壮性以及开发者效率的改进。而更令人兴奋的是，借助强大的本地开发环境 ServBay&am…...

编程新知 2026/1/31 8:53:50

OD 算法题 B卷【正整数到Excel编号之间的转换】

文章目录正整数到Excel编号之间的转换正整数到Excel编号之间的转换 excel的列编号是这样的：a b c … z aa ab ac… az ba bb bc…yz za zb zc …zz aaa aab aac…; 分别代表以下的编号1 2 3 … 26 27 28 29… 52 53 54 55… 676 677 678 679 … 702 703 704 705;…...

编程新知 2025/8/31 2:33:30

pgsql：还原数据库后出现重复序列导致“more than one owned sequence found“报错问题的解决

问题： pgsql数据库通过备份数据库文件进行还原时，如果表中有自增序列，还原后可能会出现重复的序列，此时若向表中插入新行时会出现“more than one owned sequence found”的报错提示。点击菜单“其它”-》“序列”，…...

编程新知 2026/2/9 22:03:57

相关文章：