当前位置：首页 > news >正文

学习率调整策略 | PyTorch 深度学习实战

news 2025/7/9 16:43:12

前一篇文章，深度学习里面的而优化函数 Adam，SGD，动量法，AdaGrad 等 | PyTorch 深度学习实战

本系列文章 GitHub Repo: https://github.com/hailiang-wang/pytorch-get-started

本篇文章内容来自于强化学习必修课：引领人工智能新时代【梗直哥瞿炜】

PyTorch 学习率调整策略

常见的学习率调节器
- 学习率衰减
- 指数衰减
- 余弦学习率调节
- 预热
示例程序
- 执行结果
- - 没有使用学习率自动调节时
  - 使用了学习率自动调节
  - 结论
常见学习率调节器
Links

常见的学习率调节器

在这里插入图片描述

学习率衰减

在这里插入图片描述

指数衰减

在这里插入图片描述

余弦学习率调节

实现学习率循环降低或升高的效果

在这里插入图片描述

预热

在这里插入图片描述

示例程序

下面以指数衰减调节器（ExponentialLR）为例子，展示同样的数据条件下：不衰减学习率和衰减学习率两种情况下，损失函数loss的收敛情况。

import torch
torch.manual_seed(777)'''
Learning rate scheduler
'''
import matplotlib.pyplot as plt
import numpy as np
import torch.nn as nn
from torch.utils.data import DataLoader, TensorDataset # 构造数据集加载器
from torch.utils.data import random_split # 划分数据集torch.manual_seed(777)# for reproducibility为了重复使用############################
# 生成数据
############################# 定义函数
def f(x,y):return x**2 + 2*y**2# 定义初始值
num_samples = 1000 # 1000 个样本点
X = torch.rand(num_samples) # 均匀分布
Y = torch.rand(num_samples)
Z = f(X,Y) + 3 * torch.randn(num_samples)# Concatenates a sequence of tensors along a new dimension.
# All tensors need to be of the same size.
# https://pytorch.org/docs/stable/generated/torch.stack.html
dataset = torch.stack([X,Y,Z], dim=1)
# print(dataset.shape) # torch.Size([1000, 3])# split data, 按照 7:3 划分数据集
train_size = int(0.7 * len(dataset))
test_size = len(dataset) - train_sizetrain_dataset, test_dataset = random_split(dataset=dataset, lengths=[train_size, test_size])# 将数据封装为数据加载器
# narrow 函数对数据进行切片操作，
# 
train_dataloader = DataLoader(TensorDataset(train_dataset.dataset.narrow(1,0,2), train_dataset.dataset.narrow(1,2,1)), batch_size=32, shuffle=False)
test_dataloader = DataLoader(TensorDataset(test_dataset.dataset.narrow(1,0,2), test_dataset.dataset.narrow(1,2,1)), batch_size=32, shuffle=False)############################
# 模型定义
############################# 定义一个简单的模型
class Model(nn.Module):def __init__(self):super().__init__()self.hidden = nn.Linear(2, 8)self.output = nn.Linear(8, 1)def forward(self, x):x = torch.relu(self.hidden(x))return self.output(x)############################
# 模型训练
############################# 超参数
num_epochs = 100
learning_rate = 0.1 # 学习率，调大一些更直观# 定义损失函数
loss_fn = nn.MSELoss()# 通过两次训练，对比有无调节器的效果
for with_scheduler in [False, True]:# 定义训练和测试误差数组train_losses = []test_losses = []# 初始化模型model = Model()# 定义优化器optimizer = torch.optim.SGD(model.parameters(), lr = learning_rate)# 定义学习率调节器scheduler = torch.optim.lr_scheduler.ExponentialLR(optimizer=optimizer, gamma=0.99)# 迭代训练for epoch in range(num_epochs):# 设定模型工作在训练模式model.train()train_loss = 0# 遍历训练集for inputs, targets in train_dataloader:# 预测、损失函数、反向传播optimizer.zero_grad()outputs = model(inputs)loss = loss_fn(outputs, targets)loss.backward()optimizer.step()# 记录 losstrain_loss += loss.item()# 计算 loss 并记录到训练误差train_loss /= len(train_dataloader)train_losses.append(train_loss)# 在测试数据集上评估model.eval()test_loss = 0with torch.no_grad():# 遍历测试集for inputs, targets in test_dataloader:# 预测、损失函数outputs = model(inputs)loss = loss_fn(outputs, targets)# 记录 losstest_loss += loss.item()# 计算 loss 并记录到测试误差test_loss /= len(test_dataloader)test_losses.append(test_loss)# 是否更新学习率if with_scheduler:scheduler.step()# 绘制训练和测试误差曲线plt.figure(figsize= (8, 4))plt.plot(range(num_epochs), train_losses, label="Train")plt.plot(range(num_epochs), test_losses, label="Test")plt.title("{0} lr_scheduler".format("With " if with_scheduler else "Without"))plt.legend()# plt.ylim((1,2))plt.show()

执行结果

没有使用学习率自动调节时

在这里插入图片描述

使用了学习率自动调节

在这里插入图片描述

结论

使用了学习率自动调节，学习的速度更快，收敛速度更快。

常见学习率调节器

## 学习率衰减，例如每训练 100 次就将学习率降低为原来的一半
scheduler = torch.optim.lr_scheduler.StepLR(optimizer=optimizer, step_size=100, gamma=0.5)
## 指数衰减法，每次迭代将学习率乘上一个衰减率
scheduler = torch.optim.lr_scheduler.ExponentialLR(optimizer=optimizer,gamma=0.99)
## 余弦学习率调节，optimizer 初始学习率为最大学习率，eta_min 是最小学习率，T_max 是最大的迭代次数
scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(optimizer=optimizer, T_max=100, eta_min=0.00001)
## 自定义学习率，通过一个 lambda 函数自定义实现学习率调节器
scheduler = torch.optim.lr_scheduler.LambdaLR(optimizer=optimizer, lr_lambda=lambda epoch: 0.99 ** epoch)
## 预热
warmup_steps = 20
scheduler = torch.optim.lr_scheduler.LambdaLR(optimizer=optimizer, lr_lambda=lambda t: min(t/warmup_steps, 0.001))

学习率调整策略 | PyTorch 深度学习实战

前一篇文章，深度学习里面的而优化函数 Adam，SGD，动量法，AdaGrad 等 | PyTorch 深度学习实战本系列文章 GitHub Repo: https://github.com/hailiang-wang/pytorch-get-started 本篇文章内容来自于强化学习必修课：引…...

编程日记 2025/2/11 10:24:49

DeepSeekMoE 论文解读：混合专家架构的效能革新者

论文链接：DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models 目录一、引言二、背景知识（一）MoE架构概述（二）现有MoE架构的问题三、DeepSeekMoE架构详解（一&a…...

编程日记 2025/2/11 10:22:47

以下是基于巨控GRM241Q-4I4D4QHE模块的液位远程控制系统技术方案：

以下是基于巨控GRM241Q-4I4D4QHE模块的液位远程控制系统技术方案： 一、系统概述本系统采用双巨控GRM241Q模块构建4G无线物联网络，实现山上液位数据实时传输至山下水泵站，通过预设逻辑自动控制水泵启停，同时支持APP远程监控及人工…...

编程日记 2025/2/11 10:20:43

示例： 配置JVM参数运行 #前台运行 java -XX:MetaspaceSize-128m -XX:MaxMetaspaceSize-128m -Xms1024m -Xmx1024m -Xmn256m -Xss256k -XX:SurvivorRatio8 - XX:UseConcMarkSweepGC -jar /jar包路径 #后台运行 nohup java -XX:MetaspaceSize-128m -XX:MaxMetaspaceS…...

编程日记 2025/2/11 10:18:40

2.10日学习总结

题目一： AC代码 #include <stdio.h>#define N 1000000typedef long long l;int main() {int n, m;l s 0;l a[N 1], b[N 1];int i 1, j 1;scanf("%d %d", &n, &m);for (int k 1; k < n; k) {scanf("%lld", &a[k]);…...

编程日记 2025/2/11 10:15:36

疯狂前端面试题(四)

一、Ajax、JSONP、JSON、Fetch 和 Axios 技术详解 1. Ajax（异步 JavaScript 和 XML） 什么是 Ajax？ Ajax 是一种用于在不刷新页面的情况下与服务器进行数据交互的技术。它通过 XMLHttpRequest 对象实现。优点 - 支持同步和异步请求。 - 能…...

编程日记 2025/2/11 10:14:34

YOLOv11-ultralytics-8.3.67部分代码阅读笔记-metrics.py

metrics.py ultralytics\utils\metrics.py 目录 metrics.py 1.所需的库和模块 2.def bbox_ioa(box1, box2, iouFalse, eps1e-7): 3.def box_iou(box1, box2, eps1e-7): 4.def bbox_iou(box1, box2, xywhTrue, GIoUFalse, DIoUFalse, CIoUFalse, eps1e-7): 5.def mas…...

编程日记 2025/2/11 10:11:28

SuperCopy解除网页禁用复制功能插件安装和使用

点击下载《SuperCopy解除网页禁用复制功能插件》 1. 前言在当今数字化时代，网络已成为我们获取信息和知识的主要渠道。互联网如同一片浩瀚无垠的知识海洋，蕴藏着无数的资源，从学术论文到生活小窍门，从专业教程到娱乐资讯&#…...

编程日记 2025/2/11 10:08:19

UP-VLA：具身智体的统一理解与预测模型

25年1月来自清华大学和上海姚期智研究院的论文“UP-VLA: A Unified Understanding and Prediction Model for Embodied Agent”。视觉-语言-动作 (VLA) 模型的最新进展，利用预训练的视觉语言模型 (VLM) 来提高泛化能力。VLM 通常经过视觉语言理解任务的预训练&…...

编程日记 2025/2/11 10:07:17

Unity 基于状态机的逻辑控制详解

状态机是游戏开发中常用的逻辑控制方法，它可以将复杂的逻辑分解成多个独立的状态，并通过状态转移来控制逻辑的执行流程。本文将详细介绍如何在 Unity 中基于状态机实现逻辑控制，并提供技术详解和代码实现。一、状态机简介 1.1 基本概念状…...

编程日记 2025/2/11 10:05:09

傅里叶单像素成像技术研究进展

摘要：计算光学成像，通过光学系统和信号处理的有机结合与联合优化实现特定成像特性的成像系统，摆脱了传统成像系统的限制，为光学成像技术添加了浓墨重彩的一笔，并逐步向简单化与智能化的方向发展。单像素成像(Single-Pi…...

编程日记 2025/2/11 9:59:58

IDEA接入DeepSeek

IDEA 目前有多个途径可以接入deepseek，比如CodeGPT或者Continue，这里借助CodeGPT插件接入，CodeGPT目前用的人最多，相对更稳定一、安装 1.安装CodeGPT idea插件市场找到CodeGPT并安装 2.创建API Key 进入deepseek官网&#xf…...

编程日记 2025/2/11 9:55:54

前端如何判断浏览器 AdBlock/AdBlock Plus（最新版）广告屏蔽插件已开启拦截

2个月前AdBlock/AdBlock Plus疑似升级了一次因为自己主要负责面对海外的用户项目，发现以前的检测AdBlock/AdBlock Plus开启状态方法已失效了，于是专门研究了一下。并尝试了很多方法。已失效的老方法 // 定义一个检测 AdBlock 的函数 function chec…...

编程日记 2025/2/11 9:54:52

macOS 上部署 RAGFlow

在 macOS 上从源码部署 RAGFlow-0.14.1：详细指南一、引言 RAGFlow 作为一款强大的工具，在人工智能领域应用广泛。本文将详细介绍如何在 macOS 系统上从源码部署 RAGFlow 0.14.1 版本，无论是开发人员进行项目实践，还是技术爱好者…...

编程日记 2025/2/11 9:52:47

如何在Kickstart自动化安装完成后ISO内拷贝文件到新系统或者执行命令

如何在Kickstart自动化安装完成后ISO内拷贝文件到新系统或者执行命令需求在自动化安装操作系统完成后，需要对操作系统进行配置需要拷贝一些文件到新的操作系统中需要运行一些脚本问题分析 Linux安装操作系统时，实际上是将ISO镜像文件中的操作系统…...

编程日记 2025/2/11 9:51:40

在服务器部署JVM后，如何评估JVM的工作能力，比如吞吐量

在服务器部署JVM后，评估其工作能力（如吞吐量）可以通过以下步骤进行： 1. 选择合适的基准测试工具 JMH (Java Microbenchmark Harness)：适合微基准测试，测量特定代码片段的性能。Apache JMeter：…...

编程日记 2025/2/11 9:49:34

攻防世界32 very_easy_sql【SSRF/SQL时间盲注】

不太会，以后慢慢看被骗了，看见very_easy就点进来了，结果所有sql能试的全试了一点用都没有打开源代码发现有个use.php 好家伙，这是真的在考sql吗...... 制作gopher协议的脚本： import urllib.parsehost "12…...

编程日记 2025/2/11 9:47:24

STM32G474--Whetstone程序移植(双精度)笔记

1 获取Whetstone程序 Whetstone程序，我用github被墙了，所以用了KK的方式。获取的程序目录如上所示。 2 新建STM32工程配置如上，生成工程即可。 3 在生成的工程中添加并修改Whetstone程序 3.1 实现串口打印功能在生成的usart.c文件中…...

编程日记 2025/2/11 9:44:17

【DeepSeek × Postman】请求回复

新建一个集合在 Postman 中创建一个测试集合 DeepSeek API Test，并创建一个关联的测试环境 DeepSeek API Env，同时定义两个变量 base_url 和 api_key 的步骤如下： 1. 创建测试集合 DeepSeek API Test 打开 Postman。点击左侧导航栏中的 Co…...

编程日记 2025/2/11 9:39:05

开源身份和访问管理方案之keycloak（一）快速入门

文章目录什么是IAM什么是keycloakKeycloak 的功能核心概念client管理 OpenID Connect 客户端 Client Scoperealm roleAssigning role mappings分配角色映射Using default roles使用默认角色Role scope mappings角色范围映射 UsersGroupssessionsEventsKeycloak Policy创建策略…...

编程日记 2025/2/11 9:35:56

JavaSec-RCE

简介 RCE(Remote Code Execution)，可以分为:命令注入(Command Injection)、代码注入(Code Injection) 代码注入 1.漏洞场景：Groovy代码注入 Groovy是一种基于JVM的动态语言，语法简洁，支持闭包、动态类型和Java互操作性&#xff0c…...

编程新知 2025/7/8 5:01:55

Vue记事本应用实现教程

文章目录 1. 项目介绍2. 开发环境准备3. 设计应用界面4. 创建Vue实例和数据模型5. 实现记事本功能5.1 添加新记事项5.2 删除记事项5.3 清空所有记事 6. 添加样式7. 功能扩展：显示创建时间8. 功能扩展：记事项搜索9. 完整代码10. Vue知识点解析10.1 数据绑…...

编程新知 2025/6/15 12:05:47

使用VSCode开发Django指南

使用VSCode开发Django指南一、概述 Django 是一个高级 Python 框架，专为快速、安全和可扩展的 Web 开发而设计。Django 包含对 URL 路由、页面模板和数据处理的丰富支持。本文将创建一个简单的 Django 应用，其中包含三个使用通用基本模板的页面。在此…...

编程新知 2025/7/8 19:20:28

树莓派超全系列教程文档--(61)树莓派摄像头高级使用方法

树莓派摄像头高级使用方法配置通过调谐文件来调整相机行为使用多个摄像头安装 libcam 和 rpicam-apps依赖关系开发包文章来源： http://raspberry.dns8844.cn/documentation 原文网址配置大多数用例自动工作，无需更改相机配置。但是，一…...

编程新知 2025/7/9 12:59:42

Spark 之入门讲解详细版（1）

1、简介 1.1 Spark简介 Spark是加州大学伯克利分校AMP实验室（Algorithms, Machines, and People Lab）开发通用内存并行计算框架。Spark在2013年6月进入Apache成为孵化项目，8个月后成为Apache顶级项目，速度之快足见过人之处&…...

编程新知 2025/7/9 12:59:44

css实现圆环展示百分比，根据值动态展示所占比例

代码如下 <view class""><view class"circle-chart"><view v-if"!!num" class"pie-item" :style"{background: conic-gradient(var(--one-color) 0%,#E9E6F1 ${num}%),}"></view><view v-else …...

编程新知 2025/7/8 21:31:50

三维GIS开发cesium智慧地铁教程（5）Cesium相机控制

一、环境搭建 <script src"../cesium1.99/Build/Cesium/Cesium.js"></script> <link rel"stylesheet" href"../cesium1.99/Build/Cesium/Widgets/widgets.css"> 关键配置点： 路径验证：确保相对路径.…...

编程新知 2025/6/21 4:17:55

PHP和Node.js哪个更爽?

先说结论，rust完胜。 php：laravel，swoole，webman，最开始在苏宁的时候写了几年php，当时觉得php真的是世界上最好的语言，因为当初活在舒适圈里，不愿意跳出来，就好比当初活在…...

编程新知 2025/7/7 10:48:47

【SpringBoot】100、SpringBoot中使用自定义注解+AOP实现参数自动解密

在实际项目中，用户注册、登录、修改密码等操作，都涉及到参数传输安全问题。所以我们需要在前端对账户、密码等敏感信息加密传输，在后端接收到数据后能自动解密。 1、引入依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId...

编程新知 2025/6/17 4:52:56

Neo4j 集群管理：原理、技术与最佳实践深度解析

Neo4j 的集群技术是其企业级高可用性、可扩展性和容错能力的核心。通过深入分析官方文档，本文将系统阐述其集群管理的核心原理、关键技术、实用技巧和行业最佳实践。 Neo4j 的 Causal Clustering 架构提供了一个强大而灵活的基石，用于构建高可用、可扩展且一致的图数据库服务…...

编程新知 2025/7/4 0:49:28

PyTorch 学习率调整策略

常见的学习率调节器

学习率衰减

指数衰减

余弦学习率调节

预热

示例程序

执行结果

没有使用学习率自动调节时

使用了学习率自动调节

结论

常见学习率调节器

Links

相关文章：