当前位置：首页 > article >正文

深度学习04 数据增强、调整学习率

article 2026/4/20 8:02:33

数据增强

常用的数据增强方法

调整学习率

学习率

调整学习率

调整学习率的方法

有序调整

等间隔调整

多间隔调整

指数衰减

余弦退火

自适应调整

自定义调整

数据增强

数据增强是通过对训练数据进行各种变换（如旋转、翻转、裁剪等），生成新的训练样本，从而增加数据的多样性。它的主要目的是：

提高模型的泛化能力。
防止过拟合。
在数据量不足的情况下，有效扩展数据集。

常用的数据增强方法

随机翻转（Random Flip）
水平翻转：RandomHorizontalFlip 垂直翻转：RandomVerticalFlip
随机旋转（Random Rotation）：
随机旋转一定角度，例如 RandomRotation(30) 表示在 [-30°, 30°] 范围内随机旋转。
随机裁剪（Random Crop）：
随机裁剪图像的一部分，例如 RandomResizedCrop(256) 表示随机裁剪并调整大小为 256x256。
颜色变换（Color Jitter）：
随机调整亮度、对比度、饱和度和色调，例如 ColorJitter(brightness=0.4, contrast=0.4, saturation=0.4, hue=0.1)。
高斯噪声（Gaussian Noise）：
为图像添加随机噪声。
归一化（Normalization）：
将图像像素值归一化到特定范围，例如 Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])。

例如：定义训练集和验证集的图像的数据增强模型

data_transforms = {'train':   transforms.Compose([  # transforms.Compose用于将多个图像预处理操作整合在一起transforms.Resize([300,300]),   # 使图像变换大小transforms.RandomRotation(45),   # 随机旋转，-42到45度之间随机选transforms.CenterCrop(256),    # 从中心开始裁剪[256.256]transforms.RandomHorizontalFlip(p=0.5),  # 随机水平旋转，随机概率为0.5transforms.RandomVerticalFlip(p=0.5),  # 随机垂直旋转，随机概率0.5transforms.ColorJitter(brightness=0.2,contrast=0.1,saturation=0.1,hue=0.1),   # 随机改变图像参数，参数分别表示 亮度、对比度、饱和度、色温transforms.RandomGrayscale(p=0.1),  # 概率转换成灰度率，3通道就是R=G=Btransforms.ToTensor(),   # 将PIL图像或NumPy ndarray转换为tensor类型，并将像素值的范围从[0, 255]缩放到[0.0, 1.0]，默认把通道维度放在前面transforms.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225])  # 给定均值和标准差对图像进行标准化，前者为均值，后者为标准差，三个值表示三通道图像]),'valid':  # 验证集transforms.Compose([   # 整合图像处理的操作transforms.Resize([256,256]),   # 缩放图像尺寸transforms.ToTensor(),   # 转换为torch类型transforms.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225])    # 标准化])
}

嵌套定义好的数据增强模型

training_data=food_dataset(file_path=r'./train.txt',transform=data_transform['train'])
test_data=food_dataset(file_path=r'./test.txt',transform=data_transform['valid'])

调整学习率

学习率

定义

学习率是优化算法（如 SGD、Adam）中的一个超参数，控制模型参数的更新步长。
作用
- 如果学习率太大，可能导致参数更新过快，无法收敛甚至发散。
- 如果学习率太小，训练速度会变慢，可能陷入局部最优。
重要性：合适的学习率是模型训练成功的关键。

调整学习率

学习率调整（Learning Rate Scheduling） 是优化模型训练的关键技术之一。深度学习中的学习率决定了模型参数在每次更新时的步长大小，合适的学习率可以加速收敛并提高模型的性能。常用的学习率有0.1、0.01以及0.001等，学习率越大则权重更新越快。一般来说，我们希望在训练初期学习率大一些，使得网络收敛迅速，在训练后期学习率小一些，使得网络更好的收敛到最优解。

目的

调整学习率的目的是为了能够更好地优化模型，避免训练过程中出现的一些问题，如梯度爆炸或梯度消失、训练过程陷入局部极小值等

调整学习率的方法

不同方法调整学习率所对应的横轴epoch值与纵轴学习率的关系如图

PyTorch 提供了多种学习率调度器，位于 torch.optim.lr_scheduler 模块中。

有序调整

等间隔调整

多间隔调整

指数衰减

余弦退火

自适应调整

自定义调整

深度学习04 数据增强、调整学习率

目录数据增强常用的数据增强方法调整学习率学习率调整学习率调整学习率的方法有序调整等间隔调整多间隔调整指数衰减余弦退火自适应调整自定义调整数据增强数据增强是通过对训练数据进行各种变换（如旋转、翻转、裁剪等）&am…...

编程日记 2026/4/16 8:20:33

Python 自然语言处理（NLP）和文本挖掘的常规操作过程

Python 自然语言处理（NLP）和文本挖掘自然语言处理（NLP）和文本挖掘是数据科学中的重要领域，涉及对文本数据的分析和处理。Python 提供了丰富的库和工具，用于执行各种 NLP 和文本挖掘任务。以下是一些常见的…...

编程日记 2026/4/16 6:39:52

掌握SQLite_轻量级数据库的全面指南

1. 引言 1.1 SQLite简介 SQLite 是一个嵌入式关系型数据库管理系统，它不需要单独的服务器进程或系统配置。它的设计目标是简单、高效、可靠，适用于各种应用场景，尤其是移动设备和嵌入式系统。 1.2 为什么选择SQLite 轻量级：文件大小通常在几百KB到几MB之间。无服务器架构…...

编程日记 2026/4/13 23:46:15

PH热榜 | 2025-02-16

1. Cal.com Routing 标语：根据客户线索，系统会智能地自动安排约会。介绍：告别繁琐的排期！Cal.com 推出了新的路由功能，能更智能地分配预约，让你的日程安排更顺畅。这项功能运用智能逻辑和深入的数据分析…...

编程日记 2026/4/17 12:58:43

数据库基本概念及基本使用

数据库基本概念什么是数据库： 数据库特点： 常见的数据库软件： 不同的公司进行不同的实践，生成了不同的产品。比如买汽车，汽车只是一个概念，你要买哪个牌子哪个型号的汽车，才是真正的汽车的一…...

编程日记 2026/4/10 18:12:01

gozero实现数据库MySQL单例模式连接

在 GoZero 框架中实现数据库的单例连接可以通过以下步骤来完成。GoZero 使用 gorm 作为默认的数据库操作框架，接下来我会展示一个简单的单例模式实现。 ### 1. 定义数据库连接的单例结构首先，你需要定义一个数据库连接的结构体，并在初始化…...

编程日记 2026/4/13 23:27:16

CSS flex布局列表单个元素点击本行下插入详情独占一行

技术栈：Vue2 javaScript 简介在实际开发过程中有遇到一个场景：一个list，每行个数固定，点击单个元素后，在当前行与下一行之间插入一行元素详情，便于更直观的查看到对应的数据详情。这种情形&#xff0c…...

编程日记 2026/4/8 3:02:50

无人机航迹规划：梦境优化算法（Dream Optimization Algorithm，DOA）求解无人机路径规划MATLAB

一、梦境优化算法梦境优化算法（Dream Optimization Algorithm，DOA）是一种新型的元启发式算法，其灵感来源于人类的梦境行为。该算法结合了基础记忆策略、遗忘和补充策略以及梦境共享策略，通过模拟人类梦境中的部分记忆…...

编程日记 2026/4/5 7:24:55

权限五张表

重点：权限五张表的设计核心概念： 在权限管理系统中，经典的设计通常涉及五张表，分别是用户表、角色表、权限表、用户角色表和角色权限表。这五张表的设计可以有效地管理用户的权限，确保系统的安全性和灵活性。用户&…...

编程日记 2026/4/20 3:19:34

Docker-数据卷

1.数据卷容器是隔离环境，容器内程序的文件、配置、运行时产生的容器都在容器内部，我们要读写容器内的文件非常不方便。大家思考几个问题： 如果要升级MySQL版本，需要销毁旧容器，那么数据岂不是跟着被销毁了&#xff1…...

编程日记 2026/4/17 0:05:23

在Linux系统下修改Docker的默认存储路径

在Linux系统下修改Docker的默认存储路径可以通过多种方法实现，下边是通过修改daemon.json文件方式实现查看当前Docker存储路径使用命令 docker info | grep "Docker Root Dir" 查看当前Docker的存储路径，默认为 /var/lib/docker 停止Docker…...

编程日记 2025/8/19 12:28:55

IT : 是工作還是嗜好? Delphi 30周年快乐!

又到2月14日了, 自从30多年前收到台湾宝蓝(Borland)公司一大包的3.5 磁盘片, 上面用黑色油性笔写着Delphi Beta开始, Delphi便和我的工作生涯有了密不可分的关系. 一年后Delphi大获成功, 自此对于使用Delphi的使用者来说2月14日也成了一个特殊的日子! 我清楚记得Delphi Beta使用…...

编程日记 2026/4/16 1:46:58

DeepPose

目录摘要 Abstract DeepPose 算法框架损失函数创新点局限性训练过程代码总结摘要 DeepPose是首个将CNN应用于姿态估计任务的模型。该模型在传统姿态估计方法的基础上，通过端到端的方式直接从图像中回归出人体关键点的二维坐标，避免了…...

编程日记 2026/4/10 22:09:59

[HarmonyOS]鸿蒙（添加服务卡片）推荐商品修改卡片UI（内容）

什么是服务卡片 ？ 鸿蒙系统中的服务卡片（Service Card）就是一种轻量级的应用展示形式，它可以让用户在不打开完整应用的情况下，快速访问应用内的特定功能或信息。以下是服务卡片的几个关键点： 轻量级&#…...

编程日记 2026/4/7 2:30:27

DeepSeek R1 本地部署和知识库搭建

一、本地部署 DeepSeek-R1，是幻方量化旗下AI公司深度求索（DeepSeek）研发的推理模型。DeepSeek-R1采用强化学习进行后训练，旨在提升推理能力，尤其擅长数学、代码和自然语言推理等复杂任务。使用DeepSeek R1, 可以大大…...

编程日记 2026/4/13 14:51:35

领域驱动设计叕创新，平安保险申请DDD专利

DDD领域驱动设计批评文集做强化自测题获得“软件方法建模师”称号《软件方法》各章合集见下图： 这个名字拼得妙：领域驱动设计模式。是领域驱动设计？还是设计模式？还是领域驱动设计设计模式？和下面这个知乎文章的…...

编程日记 2026/4/5 16:18:05

团体程序设计天梯赛-练习集——L1-041 寻找250

前言 10分的题，主要的想法就一个，按这个想法可以出几个写法 L1-041 寻找250 对方不想和你说话，并向你扔了一串数…… 而你必须从这一串数字中找到“250”这个高大上的感人数字。输入格式： 输入在一行中给出不知道多少个绝对值…...

编程日记 2026/4/12 1:51:21

动量突破均值回归策略

动量突破均值回归策略：量化交易中的双剑合璧引言在量化交易的世界中，动量策略和均值回归策略是两种经典且广泛应用的策略。动量策略基于“强者恒强”的理念，认为过去表现良好的资产在未来一段时间内仍会继续表现良好；而均值回…...

编程日记 2026/4/14 22:19:41

vue3.x 的provide 与 inject详细解读

在 Vue 3.x 中，provide 和 inject 是一对用于实现依赖注入的 API。它们允许父组件向其所有子组件（无论嵌套多深）传递数据或方法，而不需要通过 props 逐层传递。这在开发复杂组件或高阶组件时非常有用。 1. provide 的基本用法 p…...

编程日记 2026/4/4 18:28:16

C#控制台大小Console.SetWindowSize函数失效解决

在使用C#修改控制台大小相关API会失效. 由于VS将控制台由命令提示符变成了终端，因此在设置大小时会出现问题测试代码： Console.SetWindowSize(100, 50);...

编程日记 2026/4/6 13:03:06

spring boot 对接aws 的S3 服务，实现上传和查询

1.aws S3介绍 AWS S3（Amazon Simple Storage Service）是亚马逊提供的一种对象存储服务，旨在提供可扩展、高可用性和安全的数据存储解决方案。以下是AWS S3的一些主要特点和功能： 1.1. 对象存储对象存储模型：S3使用…...

编程日记 2026/4/9 22:46:06

25/2/16 ＜算法笔记＞ DirectPose

DirectPose 是一种直接从图像中预测物体的 6DoF（位姿：6 Degrees of Freedom）姿态的方法，包括平移和平面旋转。它在目标检测、机器人视觉、增强现实（AR）和自动驾驶等领域中具有广泛应用。相比于传统的位姿估…...

编程日记 2026/4/15 23:49:24

数据结构-8.Java. 七大排序算法(下篇)

本篇博客给大家带来的是排序的知识点, 由于时间有限, 分两天来写, 下篇主要实现最后一种排序算法: 归并排序。同时把中篇剩下的快排非递归实现补上. 文章专栏: Java-数据结构若有问题评论区见欢迎大家点赞评论收藏分享如果你不知道分享给谁,那就分享给薯条. 你们的支持是…...

编程日记 2026/4/6 13:50:20

缓存穿透、缓存击穿、缓存雪崩的区别与解决方案

1. 缓存穿透（Cache Penetration） 定义：大量请求查询数据库中不存在的数据，导致请求绕过缓存直接访问数据库，造成数据库压力过大。场景： 恶意攻击：例如用不存在的用户ID频繁请求。业务误操作…...

编程日记 2026/4/15 12:01:21

DeepSeek私有化部署+JAVA通过API调用离线大模型问答

在当今快速发展的数字化时代，企业对于高效、灵活的技术解决方案需求日益增长。DeepSeek作为一款领先的智能搜索与分析平台，凭借其强大的数据处理能力和精准的搜索结果，已经成为众多企业提升运营效率的得力助手。为了更好地满足企业对数据安全…...

编程日记 2026/4/19 12:18:03

【go语言规范】Gopherfest 2015 | Go Proverbs with Rob Pike的总结

根据 Gopherfest 2015 | Go Proverbs with Rob Pike 的演讲，总结内容如下： 虽然已是十年前的产物，但是proverbs的价值依旧存在以下是整合补充内容后的完整总结，涵盖 Rob Pike 在 Gopherfest 2015 演讲 “Go Proverbs” 中的核心…...

编程日记 2026/2/17 17:42:12

【吾爱出品】针对红警之类老游戏适用WIN10和11的补丁cnc-ddraw7.1汉化版

针对红警之类老游戏适用WIN10和11的补丁cnc-ddraw7.1汉化版链接：https://pan.xunlei.com/s/VOJ8PZd4avMubnDzHQAeZDxWA1?pwdnjwm# 直接复制到游戏安装目录，保持与游戏主程序同目录下。...

编程日记 2026/4/6 10:31:18

内容中台驱动企业数字化内容管理高效协同架构

内容概要在数字化转型加速的背景下，企业对内容管理的需求从单一存储向全链路协同演进。内容中台作为核心支撑架构，通过统一的内容资源池与智能化管理工具，重塑了内容生产、存储、分发及迭代的流程。其核心价值在于打破部门壁垒，…...

编程日记 2026/4/5 15:05:32

【第14章：神经符号集成与可解释AI—14.4 神经符号集成与可解释AI的未来发展趋势与挑战】

想象一下，如果AI既能像人类一样直觉感知（比如一眼认出街角的咖啡店），又能像数学家一样逻辑推理（比如计算最优路线避开拥堵），这个世界会变成什么样？这种“双脑协同”正是神经符号集成技术的终极目标。但现实是，当前99%的AI系统要么只会“死记硬背”数据（如深度学习模…...

编程日记 2026/4/16 22:40:53

[JVM篇]虚拟机性能监控、故障处理工具

虚拟机性能监控、故障处理工具基础故障处理工具 jps（JVM Peocess Status Tool - 虚拟机进程状况工具） jstat(JVM Statistics Monitoring Too - 虚拟机统计信息监视工具) jinfo( Configuration info for Java - Java配置信息工具) jmap(Memory Map for…...

编程日记 2026/2/24 12:36:05

数据增强

常用的数据增强方法

调整学习率

学习率

调整学习率

调整学习率的方法

有序调整

等间隔调整

多间隔调整

指数衰减

余弦退火

自适应调整

自定义调整

相关文章：