当前位置：首页 > news >正文

YOLOv8目标检测(三*)_最佳超参数训练

news 2025/7/12 8:55:39

YOLOv8目标检测(一)_检测流程梳理：YOLOv8目标检测(一)_检测流程梳理_yolo检测流程-CSDN博客

YOLOv8目标检测(二)_准备数据集：YOLOv8目标检测(二)_准备数据集_yolov8 数据集准备-CSDN博客

YOLOv8目标检测(三)_训练模型：YOLOv8目标检测(三)_训练模型_yolo data.yaml-CSDN博客

YOLOv8目标检测(三*)_最佳超参数训练：YOLOv8目标检测(三*)_最佳超参数训练_yolo 为什么要选择yolov8m.pt进行训练-CSDN博客

YOLOv8目标检测(四)_图片推理：YOLOv8目标检测(四)_图片推理-CSDN博客

YOLOv8目标检测(五)_结果文件(run/detrct/train)详解：YOLOv8目标检测(五)_结果文件(run/detrct/train)详解_yolov8 yolov8m.pt可以训练什么-CSDN博客

YOLOv8目标检测(六)_封装API接口：YOLOv8目标检测(六)_封装API接口-CSDN博客

YOLOv8目标检测(七)_AB压力测试：YOLOv8目标检测(七)_AB压力测试-CSDN博客

官方文档参考：超参数调整 -Ultralytics YOLO 文档

为什么要最佳超参数训练？

简单来说：

进行最佳超参数训练（Hyperparameter Optimization，HPO）是为了提高模型的性能，确保其在目标任务上的表现尽可能优异。

具体原因如下：

1.提升模型性能

（1）更高的准确性：通过调优学习率、权重衰减、批量大小等超参数，可以显著提高模型的准确性。

（2）更好的泛化能力：合适的超参数能够帮助模型在未见过的数据上表现更好，避免过拟合或欠拟合。

2.加快收敛速度

通过选择合适的学习率等超参数，模型的训练过程可以更快地收敛，从而节省训练时间和计算资源。

3.避免过拟合或欠拟合

超参数如正则化参数、数据增强策略、学习率衰减等会影响模型的复杂度和训练过程，优化这些参数有助于找到合适的平衡点。

4.适配特定任务或数据集

每个任务或数据集都有其独特的特点，默认的超参数可能不适合特定的应用场景。通过超参数搜索，可以为具体的任务定制训练流程。

5.优化资源使用

超参数优化能够找到在性能与计算资源之间的最佳平衡点。例如，通过调节批量大小、网络宽度或深度，可以降低显存占用，同时维持或提升模型性能。

注：笔者首先对数据进行了训练集和验证集的切分，用验证集数据寻找最佳超参数，得到参数后，再把全部数据进行训练。

一、修改脚本

（1）修改model路径

推荐使用yolov8m.pt或者yolov8n.pt等下载好的权重文件。

（2）修改model.tune参数

微调模型参数。

以下代码作用是加载 YOLOv8 的预训练模型，并使用其 tune 方法对指定数据集进行微调。

import warnings
warnings.filterwarnings('ignore')
from ultralytics import YOLOif __name__ == '__main__':model = YOLO('/usr/src/ultralytics/ultralytics/yolov8m.pt')      # 需要修改#model.load('yolov8n.pt') # loading pretrain weightsmodel.tune(data=r'/usr/src/ultralytics/ultralytics/phone.yaml',  # 需要修改# 如果任务是其它的，找到'ultralytics/cfg/default.yaml'修改task可以改成detect, segment, classify, pose# cache=False,imgsz=640,epochs=50,# single_cls=False,      # 是否是单类别检测# batch=4,# close_mosaic=10,# workers=0,device='0',# optimizer='SGD', # resume='',             # 续训设置last.pt的地址# amp=False,             # 如果出现训练损失为Nan可以关闭ampproject='runs/train',# val=False,             #注释false相当属于val=Trueiterations=100,name='exp',)

model.tune参数详细解释

1）data

数据集配置文件的路径，是一个 .yaml 文件。

该文件包含训练集和验证集的路径，以及类别标签信息。例如：

# 数据集路径和类别数
train: /path/to/dataset/train/images     # 训练集的图片路径
val: /path/to/dataset/val/images         # 验证集的图片路径names: ['class1','class2','class3']nc: 3  # 类别数，与 names 的总数一致

2）imgsz

输入图像的尺寸，默认值是 640。
表示将图像缩放到 640x640 的大小后再进行训练或推理。

3）epochs

训练的轮次。
模型会在数据集上迭代指定的次数，可以根据实验需求调整。

4）device

指定训练使用的设备，例如：
- '0'：使用 GPU 0 进行训练。
- 'cpu'：使用 CPU。
如果有多块 GPU，可以指定多个，例如 device='0,1'。

5）project

保存训练结果的路径，默认是 runs/train。
所有实验的模型权重、日志、结果图片等会存储在这个目录下。

6）iterations

每个 epoch 中完成的迭代次数，决定了一轮训练中数据加载的批次总量。
如果数据集较大，可以增加迭代次数，以确保每轮训练更充分。

7）name

当前实验的名字，用于区分不同实验。
实验结果会保存在 project 指定路径下的 exp 文件夹中，例如 runs/train/exp。

8）cache

是否将数据加载到内存中以加速训练。
如果注释掉，默认值为 False。
设置为 True 可以提升加载速度，但会占用大量内存。

9）single_cls

如果数据集中只有一个类别，可以设置为 True。
适合单类别检测任务，例如仅检测某一特定物体。

10）batch

每次训练使用的样本数量（批次大小）。
批次大小越大，对显存要求越高，通常调整到显存能承受的最大值。

11）close_mosaic

控制 Mosaic 数据增强的关闭周期。
Mosaic 是一种将多个图像拼接为一张训练样本的方法，默认在训练后期关闭以稳定模型。

12）workers

数据加载的线程数。
设置为 0 表示不使用多线程加载数据。
如果设置更高的值，可以加快数据加载，但对 CPU 性能有要求。

13）optimizer

优化器的选择，默认是 Adam。
可选值包括 'SGD'、'Adam' 等。

14）resume

用于续训的设置。
如果有中断的训练，可以通过指定 last.pt 的路径继续训练。

15）amp

是否启用混合精度训练（Automatic Mixed Precision）。
默认为 True，可以提升训练速度并减少显存占用。
如果训练过程中出现 NaN 错误，可以关闭它。

16）val

是否在训练过程中进行验证。
如果注释掉 val=False，相当于默认开启验证（val=True）。

二、运行脚本

python train_tune.py

三、查看最佳结果

（1）查看结果文件

训练完成后保存在hyptune_result_tune中，文件夹内容如下

1）weights中存放着权重文件。

2）best_hyperparameters.yaml存放着训练的最佳参数。

3）tune_fitness.png展示了超参数优化过程中，目标函数（ fitness 值）的变化趋势。

这是一幅显示适应度（通常是 AP50 这样的性能指标）与迭代次数的对比图。它可以帮助你直观地了解遗传算法在一段时间内的表现。

什么是fitness？

fitness是衡量模型性能的综合指标，一般是是基于多个评价指标（如精确率、召回率、mAP 等）的加权和。

4）tune_results.csv

部分数据如下

fitness	lr0	lrf	momentum	weight_decay	warmup_epochs	warmup_momentum	box	cls	dfl	hsv_h	hsv_s	hsv_v	translate	scale	fliplr	mosaic
0.7561	0.01074	0.01092	0.87809	0.0005	5	0.6645	3.81906	0.52678	2.53135	0.01114	0.351	0.22014	0.07474	0.59202	0.26175	1
0.75352	0.01074	0.01311	0.88108	0.00048	4.6469	0.60231	3.81906	0.43861	2.57052	0.01134	0.39181	0.22014	0.07474	0.66259	0.27737	0.82468
0.76364	0.00915	0.0102	0.88694	0.00044	3.79998	0.54519	3.57381	0.57831	2.5339	0.01114	0.33132	0.21189	0.07475	0.54387	0.26416	1
0.75078	0.00915	0.0102	0.88697	0.00044	3.80256	0.54519	3.57242	0.57854	2.53504	0.01114	0.33132	0.21198	0.07476	0.54405	0.26416	1
0.76293	0.00928	0.00811	0.86524	0.00042	3.79998	0.54854	3.67781	0.57831	2.4856	0.01166	0.29207	0.23139	0.06951	0.59062	0.23951	0.97602

CSV文件，包含调整过程中每次迭代的详细结果。文件中的每一行代表一次迭代，包括适配度得分、精确度、召回率等指标，以及使用的超参数。

5）tune_scatter_plots.png

这个图文件展示了超参数与目标性能指标的关系。

请注意，初始化为 0 的超参数将不会被调整，如degrees、shear、persprctive、flipud、mixup、copy_paste。

（2）查看最佳参数

查看best_hyperparameters.yaml文件，如下图

四、使用最佳超参数训练

复制修改训练的yaml文件（:改为=）

#修改前训练命令
yolo task=detect mode=train model=yolov8m.yaml data=./data.yaml pretrained=/data/yolov8m.pt imgsz=640 save=True epochs=400 patience=50 resume=True device=0
#修改后训练命令
yolo task=detect mode=train model=yolov8m.yaml data=./data.yaml pretrained=/data/yolov8m.pt imgsz=640 save=True epochs=400 patience=50 resume=True device=0 lr0=0.00976 lrf=0.01153 momentum=0.93626 weight_decay=0.00018 warmup_epochs=4.85722 warmup_momentum=0.95 box=4.18836 cls=0.66206 dfl=2.35773 hsv_h=0.00929 hsv_s=0.25334 hsv_v=0.15979 degrees=0.0 translate=0.09706 scale=0.69983 shear=0.0 perspective=0.0 flipud=0.0 fliplr=0.26921 mosaic=0.97292 mixup=0.0 copy_paste=0.0

注意：训练命令添加最佳超参数后，data.yaml文件别忘了修改成完整的数据集，笔者是先用小部分数据找最佳超参数，再训练完整数据集。

恭喜你学会了如何找到最佳超参数，并使用其进行训练！

YOLOv8目标检测(三*)_最佳超参数训练

YOLOv8目标检测(一)_检测流程梳理：YOLOv8目标检测(一)_检测流程梳理_yolo检测流程-CSDN博客 YOLOv8目标检测(二)_准备数据集：YOLOv8目标检测(二)_准备数据集_yolov8 数据集准备-CSDN博客 YOLOv8目标检测(三)_训练模型：YOLOv8目标检测(三)_训…...

编程日记 2024/12/17 22:48:11

参考 https://blog.csdn.net/Peelarmy/article/details/106872570 https://javaguide.cn/java/basis/spi.html#%E4%BD%95%E8%B0%93-spi SPI SPI(service provider interface)是JDK提供的服务发现机制。以JDBC为例，JDK提供JDBC接口，在包java.sql.*。MY…...

编程日记 2024/12/17 22:47:10

uniappp配置导航栏自定义按钮(解决首次加载图标失败问题)

1.引入iconfont的图标，只保留这两个文件 2.App.vue引入到全局中 import "./static/fonts/iconfont.css"3.pages.json中配置text为图标对应的unicode {"path": "pages/invite/invite","style": {"h5": {"…...

编程日记 2024/12/17 22:41:05

【Apache paimon】-- 集成 hive3.1.3 异常

目录 1、场景再现 Step1：在 hive cli beeline 执行创建 hive paimon 表 Step2：使用 insert into 写入数据 Step3：抛出异常 2、原因分析 Step1：在 yarn resource manager 作业界面查询 hive sql mr job 的 yarn log Step2：搜索job 使用的 zstd jar 版本 Step3：定…...

编程日记 2024/12/17 22:38:01

基于docker部署Nacos最新版本-国内稳定镜像

介绍当前微服务架构常用的配置中心，本文推荐的是阿里云开源的nacos，截止发布本文为止，最新的nacos稳定版本为2.4.3 拉取镜像 //这个是国内目前可以下载的成熟的nacos镜像仓库，默认的docker hub需要不断的翻墙才可以下载 docke…...

编程日记 2024/12/17 22:36:59

云计算中的Hive操作详解

文章目录云计算中的Hive操作详解一、引言二、Hive的基本操作1、创建表2、导入数据3、数据查询4、分区表操作三、使用示例1、字符串处理函数2、数据类型转换四、总结云计算中的Hive操作详解一、引言 Hive是云计算中一个非常重要的组件，它是基于Hadoop的一个数…...

编程日记 2024/12/17 22:33:56

UE4_控件蓝图_制作3D生命血条

一：效果图如下： 二、实现步骤： 1、新建敌人右键蓝图类选择角色， 重命名为BP_Enemytest。双击打开，配置敌人网格体修改位置及朝向效果如下： 选择合适的动画蓝图类： 人物就有了动作&#x…...

编程日记 2024/12/17 22:32:54

11篇--图像边缘检测

图像梯度要学习图像边缘检测，要先了解图像梯度的概念，我们正是通过梯度值来区分边缘像素点的处于边缘附近的像素点与周围像素点的差距很大（不然不会有边缘呈现），所以给边缘附近的的梯度之变化很快，通过…...

编程日记 2024/12/17 22:30:50

宝塔SSL证书申请失败，报错：申请SSL证书错误 module ‘OpenSSL.crypto‘ has no attribute ‘sign‘（已解决）

刚安装宝塔申请SSL就报错：申请SSL证书错误 module OpenSSL.crypto has no attribute sign 面板、插件版本：9.2.0 系统版本：Alibaba Cloud Linux 3.2104 LTS 问题：申请SSL证书错误 module OpenSSL.crypto has no attribute sign…...

编程日记 2024/12/17 22:29:50

(已开源) 详解4D Radar数据集K-Radar

本文介绍一个4D Radar公开数据集：KAIST-Radar（简称K-Radar，由AVELab提供）是一个新型的大规模目标检测数据集和基准测试集，包含35000帧4D雷达张量（4DRT）数据。本文主要贡献有： 本文提…...

编程日记 2024/12/17 22:25:45

基于RK3588机器人控制器+3D视觉传感器的送餐机器人解决方案

送餐机器人通过搭载3D视觉传感器信迈机器人控制器，送餐机器人可以在复杂的餐厅环境中灵活避障通行，极大地提升餐品配送效率，改善用户用餐体验，并显著降低店家经营成本。高峰期送餐难，曾一直是送餐机器人的行业痛点。…...

编程日记 2024/12/17 22:22:42

基于Qwen2-VL模型针对LaTeX OCR任务进行微调训练 - 数据处理

基于Qwen2-VL模型针对LaTeX OCR任务进行微调训练 - 数据处理 flyfish 基于Qwen2-VL模型针对LaTeX_OCR任务进行微调训练_-_LoRA配置如何写基于Qwen2-VL模型针对LaTeX_OCR任务进行微调训练_-_单图推理基于Qwen2-VL模型针对LaTeX_OCR任务进行微调训练_-_原模型_单图推理基于Q…...

编程日记 2024/12/17 22:20:33

Microi吾码｜开源低代码.NET、VUE低代码项目，表单引擎介绍

Microi吾码｜开源低代码.NET、VUE低代码项目，表单引擎介绍一、摘要二、Microi吾码介绍2.1 功能介绍2.2 团队介绍2.3 上线项目案例三、Microi吾码表单引擎是什么？四、Microi吾码表单引擎功能4.1 模块引擎 - 由表单引擎驱动4.2 流程引擎 - 由表…...

编程日记 2024/12/17 22:19:32

[Ubuntu] Linux命令收集

1、移动文件夹内的所有文件和子文件夹： 如果你想移动一个文件夹内的所有内容到另一个目录，但不移动该文件夹本身，你可以使用以下命令： 源：/home/ubuntu/www/demo/web下的所有文件及文件夹； 目标&#xf…...

编程日记 2024/12/17 22:11:25

鸿蒙应用ArkTS开发-利用axios进行网络请求（实现前后端交互）

引言： 我们上一章实现了简单的登录注册页面，今天小编来带着大家实现完整的登录注册功能。一、后端的搭建 Spring Boot介绍：Spring Boot是一个用于简化Spring应用程序开发的开源框架。它通过自动配置、内置服务器和预设的最佳实践&#xff0…...

编程日记 2024/12/17 22:05:17

【开源】使用环信UIKit for uniapp 做一个IM即时聊天应用

环信单群聊 UIKit 是基于环信即时通讯云 IM SDK 开发的一款即时通讯 UI 组件库，提供各种组件实现会话列表、聊天界面、联系人列表及后续界面等功能，帮助开发者根据实际业务需求快速搭建包含 UI 界面的即时通讯应用。本文教大家使用环信 uniapp UIKit 快…...

编程日记 2024/12/17 22:00:12

计算机网络知识点全梳理（一.TCP/IP网络模型）

目录 TCP/IP网络模型概述应用层什么是应用层应用层功能应用层协议传输层什么是传输层传输层功能传输层协议网络层什么是网络层网络层功能网络层协议数据链路层什么是数据链路层数据链路层功能物理层物理层的概念和功能写在前面本系列文…...

编程日记 2024/12/17 21:58:09

神州数码DCME-320 online_list.php存在任意文件读取漏洞

免责声明: 本文旨在提供有关特定漏洞的深入信息，帮助用户充分了解潜在的安全风险。发布此信息的目的在于提升网络安全意识和推动技术进步，未经授权访问系统、网络或应用程序，可能会导致法律责任或严重后果。因此，作者不对读者基于本文内容所采取的任何行为承担责任。读者在…...

编程日记 2024/12/17 21:55:06

神经网络基础-神经网络搭建和参数计算

文章目录 1.构建神经网络2. 神经网络的优缺点 1.构建神经网络在 pytorch 中定义深度神经网络其实就是层堆叠的过程，继承自nn.Module，实现两个方法： __init__方法中定义网络中的层结构，主要是全连接层，并进行初始化。…...

编程日记 2024/12/17 21:50:01

Linux入门攻坚——41、Linux集群系统入门-lvs（2）

lvs-dr：GATEWAY Director只负责请求报文，响应报文不经过Director，直接由RS返回给Client。 lvs-dr的报文路线如上图，基本思路就是报文不会回送Director，第①种情况是VIP、DIP、RIP位于同一个网段，这样&…...

编程日记 2024/12/17 21:41:54

第19节 Node.js Express 框架

Express 是一个为Node.js设计的web开发框架，它基于nodejs平台。 Express 简介 Express是一个简洁而灵活的node.js Web应用框架, 提供了一系列强大特性帮助你创建各种Web应用，和丰富的HTTP工具。使用Express可以快速地搭建一个完整功能的网站。 Expre…...

编程新知 2025/7/11 4:02:52

Java 语言特性(面试系列1)

一、面向对象编程 1. 封装（Encapsulation） 定义：将数据（属性）和操作数据的方法绑定在一起，通过访问控制符（private、protected、public）隐藏内部实现细节。示例： public …...

编程新知 2025/7/8 18:56:27

前端导出带有合并单元格的列表

// 导出async function exportExcel(fileName "共识调整.xlsx") {// 所有数据const exportData await getAllMainData();// 表头内容let fitstTitleList [];const secondTitleList [];allColumns.value.forEach(column > {if (!column.children) {fitstTitleL…...

编程新知 2025/7/9 22:00:24

dedecms 织梦自定义表单留言增加ajax验证码功能

增加ajax功能模块，用户不点击提交按钮，只要输入框失去焦点，就会提前提示验证码是否正确。一，模板上增加验证码 <input name"vdcode"id"vdcode" placeholder"请输入验证码" type"text&quo…...

编程新知 2025/7/10 9:57:51

ESP32 I2S音频总线学习笔记（四）： INMP441采集音频并实时播放

简介前面两期文章我们介绍了I2S的读取和写入，一个是通过INMP441麦克风模块采集音频，一个是通过PCM5102A模块播放音频，那如果我们将两者结合起来，将麦克风采集到的音频通过PCM5102A播放，是不是就可以做一个扩音器了呢…...

编程新知 2025/7/10 20:12:52

Cloudflare 从 Nginx 到 Pingora：性能、效率与安全的全面升级

在互联网的快速发展中，高性能、高效率和高安全性的网络服务成为了各大互联网基础设施提供商的核心追求。Cloudflare 作为全球领先的互联网安全和基础设施公司，近期做出了一个重大技术决策：弃用长期使用的 Nginx，转而采用其内部开发…...

编程新知 2025/7/8 16:00:54

在Ubuntu24上采用Wine打开SourceInsight

1. 安装wine sudo apt install wine 2. 安装32位库支持，SourceInsight是32位程序 sudo dpkg --add-architecture i386 sudo apt update sudo apt install wine32:i386 3. 验证安装 wine --version 4. 安装必要的字体和库（解决显示问题） sudo apt install fonts-wqy…...

编程新知 2025/6/19 4:31:50

省略号和可变参数模板

本文主要介绍如何展开可变参数的参数包 1.C语言的va_list展开可变参数 #include <iostream> #include <cstdarg>void printNumbers(int count, ...) {// 声明va_list类型的变量va_list args;// 使用va_start将可变参数写入变量argsva_start(args, count);for (in…...

编程新知 2025/7/9 0:26:24

给网站添加live2d看板娘

给网站添加live2d看板娘参考文献： stevenjoezhang/live2d-widget: 把萌萌哒的看板娘抱回家 (ノ≧∇≦)ノ | Live2D widget for web platformEikanya/Live2d-model: Live2d model collectionzenghongtu/live2d-model-assets 前言网站环境如下，文章也主…...

编程新知 2025/7/11 18:38:16

在树莓派上添加音频输入设备的几种方法

在树莓派上添加音频输入设备可以通过以下步骤完成，具体方法取决于设备类型（如USB麦克风、3.5mm接口麦克风或HDMI音频输入）。以下是详细指南： 1. 连接音频输入设备 USB麦克风/声卡：直接插入树莓派的USB接口。3.5mm麦克…...

编程新知 2025/7/8 17:49:38