当前位置：首页 > news >正文

深度学习中的早停法

news 2025/12/25 10:48:17

早停法（Early Stopping）是一种用于防止模型过拟合的技术，在训练过程中监视验证集（或者测试集）上的损失值。具体设立早停的限制包括两个主要参数：

Patience（耐心）：这是指验证集损失在连续多少个epoch没有显著改善时，才触发早停。当验证集损失连续几个epoch没有下降或者停止减少时，表示模型可能已经过拟合或者陷入局部最优点，这时候早停就会被触发。
Best Loss（最佳损失）：这是指在早停过程中保存的最低验证集损失值。当验证集损失值低于当前最佳损失时，更新最佳损失并重置耐心计数器。如果验证集损失连续不降，耐心计数器超过设定的耐心值时，早停就会被触发，训练过程停止。

早停的具体设立是基于验证集上的损失值 val_loss。每次验证后，如果当前的 val_loss 比 best_loss 还要低，就更新 best_loss 并重置 patience_counter；否则，增加 patience_counter。当 patience_counter 达到设定的 patience 值时，早停被触发，即停止训练过程以防止模型过拟合。

总结来说，早停的设立限制是基于耐心参数和最佳损失值，用来判断模型是否应该停止训练以避免过拟合。

# 训练模型
num_epochs = 200  # 总的训练轮数
best_loss = float('inf')  # 初始化最佳验证损失为正无穷大
patience = 10  # 早停的耐心值
patience_counter = 0  # 耐心计数器for epoch in range(num_epochs):model.train()for geno, pheno in train_loader:optimizer.zero_grad()  # 梯度清零outputs = model(geno)  # 前向传播loss = criterion(outputs.squeeze(), pheno)  # 计算损失loss.backward()  # 反向传播optimizer.step()  # 优化模型参数model.eval()val_loss = 0with torch.no_grad():  # 不计算梯度for geno, pheno in test_loader:outputs = model(geno)  # 前向传播val_loss += criterion(outputs.squeeze(), pheno).item()  # 计算验证损失val_loss /= len(test_loader)  # 计算平均验证损失print(f'Epoch [{epoch + 1}/{num_epochs}], Loss: {loss.item():.4f}, Val Loss: {val_loss:.4f}')scheduler.step(val_loss)  # 更新学习率# 早停法if val_loss < best_loss:best_loss = val_loss  # 更新最佳验证损失patience_counter = 0  # 重置耐心计数器else:patience_counter += 1  # 增加耐心计数器if patience_counter >= patience:  # 如果耐心计数器达到设定的耐心值print("Early stopping triggered")  # 触发早停break

EarlyStopping 类：
- __init__ 方法初始化早停的参数，如 patience（耐心值）、verbose（是否打印消息）和 delta（损失改进的最小变化）。
- __call__ 方法根据验证损失来决定是否更新 best_loss，以及是否增加计数器或者触发早停。
训练循环：
- 训练和验证过程与之前相同。
- 每个epoch结束时，调用 early_stopping 对象，传入当前的验证损失。
- 检查 early_stopping.early_stop 标志，如果为 True，则打印消息并停止训练。

通过使用 EarlyStopping 类，你可以更简洁和模块化地实现早停功能，使代码更易于维护和扩展。

import torch
import numpy as npclass EarlyStopping:def __init__(self, patience=10, verbose=False, delta=0):"""EarlyStopping 初始化.Args:patience (int): 当验证集损失在指定的epoch数内没有减少时触发早停.verbose (bool): 如果为True，则每次验证集损失改进时会打印一条消息.delta (float): 验证集损失改进的最小变化."""self.patience = patienceself.verbose = verboseself.delta = deltaself.best_loss = Noneself.counter = 0self.early_stop = Falsedef __call__(self, val_loss):if self.best_loss is None:self.best_loss = val_losselif val_loss > self.best_loss - self.delta:self.counter += 1if self.verbose:print(f'EarlyStopping counter: {self.counter} out of {self.patience}')if self.counter >= self.patience:self.early_stop = Trueelse:self.best_loss = val_lossself.counter = 0if self.verbose:print(f'Validation loss decreased to {self.best_loss:.6f}. Resetting counter.')# 初始化EarlyStopping对象
early_stopping = EarlyStopping(patience=10, verbose=True)# 训练模型
num_epochs = 200
for epoch in range(num_epochs):model.train()for geno, pheno in train_loader:optimizer.zero_grad()outputs = model(geno)loss = criterion(outputs.squeeze(), pheno)loss.backward()optimizer.step()model.eval()val_loss = 0with torch.no_grad():for geno, pheno in test_loader:outputs = model(geno)val_loss += criterion(outputs.squeeze(), pheno).item()val_loss /= len(test_loader)print(f'Epoch [{epoch + 1}/{num_epochs}], Loss: {loss.item():.4f}, Val Loss: {val_loss:.4f}')scheduler.step(val_loss)# 检查是否触发早停early_stopping(val_loss)if early_stopping.early_stop:print("Early stopping triggered")break

深度学习中的早停法

早停法（Early Stopping）是一种用于防止模型过拟合的技术，在训练过程中监视验证集（或者测试集）上的损失值。具体设立早停的限制包括两个主要参数： Patience（耐心）：这是指验…...

编程日记 2024/8/5 5:09:55

科普文：JUC系列之多线程门闩同步器CountDownLatch的使用和源码

CountDownLatch类位于java.util.concurrent包下，利用它可以实现类似计数器的功能。比如有一个任务A，它要等待其他10个线程的任务执行完毕之后才能执行，此时就可以利用CountDownLatch来实现这种功能了。 CountDownLatch是通过一个计数器来实现…...

编程日记 2024/8/5 5:08:54

foreach循环和for循环在PHP中各有什么优势

在PHP中，foreach循环和for循环都是用来遍历数组的常用结构，但它们各有其优势和使用场景。 foreach循环的优势简化代码：foreach循环提供了一种更简洁的方式来遍历数组，不需要手动控制索引或指针。易于阅读：对于简单的…...

编程日记 2024/8/5 5:06:52

巧用casaos共享挂载自己的外接硬盘为局域网共享

最近入手了个魔改机顶盒，已经刷好了的armbian，虽然是原生的，但是我觉得挺强大的，内置了很多常用的docker和应用，只需要armbian-software 安装就行，缺点就是emmc太小了。买到之后第一时间装上了casaos和1p…...

编程日记 2024/8/5 5:02:46

标题：解码“八股文”：助力、阻力，还是空谈？

标题：解码“八股文”：助力、阻力，还是空谈？ 在程序员的面试与职场发展中，“八股文”一直是一个备受争议的话题。它既是求职者展示自己技术功底的途径，也是一些公司筛选人才的标准之一。但“八股文”在实际…...

编程日记 2024/8/5 5:00:42

语言无界，沟通无限：2024年好用在线翻译工具推荐

随着技术的发展现在的翻译在线工具从基础词句翻译到复杂的文章翻译都不在话下。为了防止你被五花八门的工具挑花眼，我给你介绍几款我用过的便捷、高效、准确的翻译工具吧。 1.福晰翻译端链接直通：https://www.foxitsoftware.cn/fanyi/ 这个软件支持…...

编程日记 2024/8/5 4:58:40

【Golang 面试 - 进阶题】每日 3 题（十八）

✍个人博客：Pandaconda-CSDN博客 📣专栏地址：http://t.csdnimg.cn/UWz06 📚专栏简介：在这个专栏中，我将会分享 Golang 面试中常见的面试题给大家~ ❤️如果有收获的话，欢迎点赞👍收藏…...

编程日记 2024/8/5 4:56:39

二分+dp，CF 1993D - Med-imize

一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 D - Med-imize 二、解题报告 1、思路分析对于n < k的情况直接排序就行对于n > k的情况最终的序列长度一定是 (n - 1) % k 1 这个序列是原数组的一个子序列对于该序列的第一个元素&#xff0…...

编程日记 2024/8/5 4:55:38

三十种未授权访问漏洞复现合集（三）

未授权访问漏洞介绍未授权访问可以理解为需要安全配置或权限认证的地址、授权页面存在缺陷，导致其他用户可以直接访问，从而引发重要权限可被操作、数据库、网站目录等敏感信息泄露。---->目录遍历目前主要存在未授权访问漏洞的有:NFS服务&a…...

编程日记 2024/8/5 4:54:37

数据湖和数据仓库核心概念与对比

随着近几年数据湖概念的兴起，业界对于数据仓库和数据湖的对比甚至争论就一直不断。有人说数据湖是下一代大数据平台，各大云厂商也在纷纷的提出自己的数据湖解决方案，一些云数仓产品也增加了和数据湖联动的特性。但是数据仓库和数据湖的区别到…...

编程日记 2024/8/5 4:50:34

探索WebKit的奥秘：打造高效、兼容的现代网页应用

1. 简介 1.1. 主要特点 WebKit 是一个开源的浏览器引擎，它允许开发者构建高性能、功能丰富的 web 应用程序。WebKit 与 Mozilla Firefox 等使用的 Gecko 引擎、Internet Explorer 使用的 Trident 引擎以及 EdgeHTML 引擎共同构成了现代 web 浏览器的核心技术。 1.2. 学习资…...

编程日记 2024/8/5 4:48:32

【leetcode】平衡二叉树、对称二叉树、二叉树的层序遍历(广度优先遍历）（详解）

Hi~！这里是奋斗的明志，很荣幸您能阅读我的文章，诚请评论指点，欢迎欢迎 ~~ 🌱🌱个人主页：奋斗的明志 🌱🌱所属专栏：数据结构、LeetCode专栏 📚本系…...

编程日记 2024/8/5 4:47:31

最短路径算法：Floyd-Warshall算法

引言在图论中，Floyd-Warshall算法是一种用于计算任意两点之间最短路径的动态规划算法。它适用于加权有向图和无向图，可以处理带有负权重边的图，但要求图中不能有负权重环。本文将详细介绍Floyd-Warshall算法的定义、步骤及其实现。 Floyd-…...

编程日记 2024/8/5 4:46:30

3DM游戏运行库合集离线安装包2024最新版

3DM游戏运行库合集离线安装包是一款由国内最大的游戏玩家论坛社区3DM推出的集成式游戏运行库合集软件，旨在解决玩家在玩游戏时遇到的运行库缺失或错误问题。该软件包含多种常用的系统运行库组件，支持32位和64位操作系统，能够自动识别系统版本…...

编程日记 2024/8/5 4:45:29

【Bigdata】什么是混合型联机分析处理

这是我父亲日记里的文字这是他的生命留下留下来的散文诗几十年后我看着泪流不止可我的父亲已经老得像一个影子 🎵 许飞《父亲写的散文诗》混合型联机分析处理（Hybrid OLAP，简称 HOLAP）是一种结合了多…...

编程日记 2024/8/5 4:44:28

Java 并发编程：volatile 关键字介绍与使用

大家好，我是栗筝i，这篇文章是我的 “栗筝i 的 Java 技术栈” 专栏的第 026 篇文章，在 “栗筝i 的 Java 技术栈” 这个专栏中我会持续为大家更新 Java 技术相关全套技术栈内容。专栏的主要目标是已经有一定 Java 开发经验，并希望进…...

编程日记 2024/8/5 4:43:26

【Spark计算引擎----第三篇（RDD）---《深入理解 RDD：依赖、Spark 流程、Shuffle 与缓存》】

前言： 💞💞大家好，我是书生♡，本阶段和大家一起分享和探索大数据技术Spark—RDD，本篇文章主要讲述了：RDD的依赖、Spark 流程、Shuffle 与缓存等等。欢迎大家一起探索讨论！&#xff0…...

编程日记 2024/8/5 4:41:24

四、日志收集loki+ promtail+grafana

一、简介 Loki是受Prometheus启发由Grafana Labs团队开源的水平可扩展，高度可用的多租户日志聚合系统。开发语言: Google Go。它的设计具有很高的成本效益，并且易于操作。使用标签来作为索引，而不是对全文进行检索，也就是说&…...

编程日记 2024/8/5 4:40:23

xdma的linux驱动编译给arm使用（中断检测-测试程序）

1、驱动链接 XDMA驱动源码官网下载地址为：https://github.com/Xilinx/dma_ip_drivers 下载最新版本的XDMA驱动源码，即master版本，否则其驱动用不了（xdma ip核版本为4.1）。 2、驱动此部分来源于博客：xd…...

编程日记 2024/8/5 4:39:22

探索之路——初识 Vue Router：构建单页面应用的完整指南

目录 1. Vue Router 简介 2. 安装与配置 Vue Router 安装步骤配置路由 3. 在 Vue 应用中使用路由 4. 进阶使用路由守卫懒加载高级路由技术嵌套路由动态路由匹配编程式的路由导航路由懒加载路由元信息在现代前端开发中，单页面应用（SPA）因其出…...

编程日记 2024/8/5 4:38:21

大数据学习栈记——Neo4j的安装与使用

本文介绍图数据库Neofj的安装与使用，操作系统：Ubuntu24.04，Neofj版本：2025.04.0。 Apt安装 Neofj可以进行官网安装：Neo4j Deployment Center - Graph Database & Analytics 我这里安装是添加软件源的方法最新版…...

编程新知 2025/12/22 11:05:42

QMC5883L的驱动

简介本篇文章的代码已经上传到了github上面，开源代码作为一个电子罗盘模块，我们可以通过I2C从中获取偏航角yaw，相对于六轴陀螺仪的yaw，qmc5883l几乎不会零飘并且成本较低。参考资料 QMC5883L磁场传感器驱动 QMC5883L磁力计…...

编程新知 2025/7/21 15:40:47

oracle与MySQL数据库之间数据同步的技术要点

Oracle与MySQL数据库之间的数据同步是一个涉及多个技术要点的复杂任务。由于Oracle和MySQL的架构差异，它们的数据同步要求既要保持数据的准确性和一致性，又要处理好性能问题。以下是一些主要的技术要点： 数据结构差异数据类型差异&#xff…...

编程新知 2025/8/12 3:03:43

【HTML-16】深入理解HTML中的块元素与行内元素

HTML元素根据其显示特性可以分为两大类：块元素(Block-level Elements)和行内元素(Inline Elements)。理解这两者的区别对于构建良好的网页布局至关重要。本文将全面解析这两种元素的特性、区别以及实际应用场景。 1. 块元素(Block-level Elements) 1.1 基本特性 …...

编程新知 2025/11/11 6:28:42

【生成模型】视频生成论文调研

工作清单上游应用方向：控制、速度、时长、高动态、多主体驱动类型工作基础模型WAN / WAN-VACE / HunyuanVideo控制条件轨迹控制ATI~镜头控制ReCamMaster~多主体驱动Phantom~音频驱动Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation速…...

编程新知 2025/9/9 8:40:47

论文笔记——相干体技术在裂缝预测中的应用研究

目录相关地震知识补充地震数据的认识地震几何属性相干体算法定义基本原理第一代相干体技术：基于互相关的相干体技术（Correlation）第二代相干体技术：基于相似的相干体技术（Semblance）基于多道相似的相干体…...

编程新知 2025/12/12 20:26:01

代码随想录刷题day30

1、零钱兑换II 给你一个整数数组 coins 表示不同面额的硬币，另给一个整数 amount 表示总金额。请你计算并返回可以凑成总金额的硬币组合数。如果任何硬币组合都无法凑出总金额，返回 0 。假设每一种面额的硬币有无限个。题目数据保证结果符合 32 位带…...

编程新知 2025/10/4 6:30:56

基于SpringBoot在线拍卖系统的设计和实现

摘要随着社会的发展，社会的各行各业都在利用信息化时代的优势。计算机的优势和普及使得各种信息系统的开发成为必需。在线拍卖系统，主要的模块包括管理员；首页、个人中心、用户管理、商品类型管理、拍卖商品管理、历史竞拍管理、竞拍订单…...

编程新知 2025/12/17 14:33:52

[免费]微信小程序问卷调查系统(SpringBoot后端+Vue管理端)【论文+源码+SQL脚本】

大家好，我是java1234_小锋老师，看到一个不错的微信小程序问卷调查系统(SpringBoot后端Vue管理端)【论文源码SQL脚本】，分享下哈。项目视频演示【免费】微信小程序问卷调查系统(SpringBoot后端Vue管理端) Java毕业设计_哔哩哔哩_bilibili 项…...

编程新知 2025/12/21 14:10:00

Selenium常用函数介绍

目录一，元素定位 1.1 cssSeector 1.2 xpath 二，操作测试对象三，窗口 3.1 案例 3.2 窗口切换 3.3 窗口大小 3.4 屏幕截图 3.5 关闭窗口四，弹窗五，等待六，导航七，文件上传 …...

编程新知 2025/12/21 0:12:12

相关文章：