YOLO自定义数据集实现K折交叉验证——K-Fold Cross Validation

实现K折交叉验证(K-Fold Cross Validation)对于YOLO(You Only Look Once)自定义数据集的目标检测任务可以显著提升模型的可靠性和泛化能力。
1. 数据集准备
首先,你需要确保你的数据集符合YOLO的格式,具体来说,每个图像都有相应的标注文件,格式如下:
- 每行包含:
class_id center_x center_y width height。 class_id是类别的编号,center_x、center_y是物体中心的归一化坐标,width和height是物体框的归一化宽度和高度。
假设你已经准备好了数据集(例如自定义的水果检测数据集),其中图像和标注文件分别存储在 images 和 labels 目录下。
2. 必要的Python包
你需要安装一些必要的Python库:
pip install -U ultralytics scikit-learn pandas pyyaml
3. 数据集标注和类定义
假设你有一个 data.yaml 文件,它定义了数据集的路径和类别。一个示例 data.yaml 文件可能如下:
train: ./Fruit-detection/images/train
val: ./Fruit-detection/images/val
names:0: Apple1: Grapes2: Pineapple3: Orange4: Banana5: Watermelon
确保你的数据集标注文件(例如 train 和 val 目录中的标注文件)符合此结构。
4. 数据准备和生成特征向量
你需要先生成一个表示数据集的特征向量(每个图像包含每个类的数量)。以下是生成特征向量的代码:
import pandas as pd
from pathlib import Path
from collections import Counter
import yaml# 设置数据集路径
dataset_path = Path("./Fruit-detection")
labels = sorted(dataset_path.rglob("*labels/*.txt")) # 读取所有标注文件# 读取data.yaml文件,提取类标签
yaml_file = "path/to/data.yaml"
with open(yaml_file, "r", encoding="utf8") as y:classes = yaml.safe_load(y)["names"]# 初始化一个空的DataFrame
cls_idx = sorted(classes.keys())
index = [label.stem for label in labels] # 使用文件名作为索引
labels_df = pd.DataFrame([], columns=cls_idx, index=index)# 统计每个类的实例数量
for label in labels:lbl_counter = Counter()with open(label, "r") as lf:lines = lf.readlines()for line in lines:lbl_counter[int(line.split(" ")[0])] += 1labels_df.loc[label.stem] = lbl_counterlabels_df = labels_df.fillna(0.0) # 填充缺失值为0
5. 使用K折交叉验证进行数据拆分
使用 sklearn.model_selection.KFold 来拆分数据集。这里我们使用5折交叉验证(k=5),你可以根据需要调整 k 的值。
from sklearn.model_selection import KFoldksplit = 5
kf = KFold(n_splits=ksplit, shuffle=True, random_state=20) # 设置随机种子以便结果可复现# 获取数据集的索引拆分
kfolds = list(kf.split(labels_df))# 显示每个fold的训练和验证集
folds_df = pd.DataFrame(index=index, columns=[f"split_{n}" for n in range(1, ksplit + 1)])
for i, (train, val) in enumerate(kfolds, start=1):folds_df[f"split_{i}"].loc[labels_df.iloc[train].index] = "train"folds_df[f"split_{i}"].loc[labels_df.iloc[val].index] = "val"
6. 计算每个fold的标签分布
为了确保每个fold的类别分布平衡,可以计算每个fold中每个类的数量比例。
fold_lbl_distrb = pd.DataFrame(index=[f"split_{n}" for n in range(1, ksplit + 1)], columns=cls_idx)
for n, (train_indices, val_indices) in enumerate(kfolds, start=1):train_totals = labels_df.iloc[train_indices].sum()val_totals = labels_df.iloc[val_indices].sum()# 计算验证集与训练集的标签比例ratio = val_totals / (train_totals + 1e-7) # 避免除0错误fold_lbl_distrb.loc[f"split_{n}"] = ratio
7. 创建K折数据集文件夹和YAML文件
为每个fold创建训练和验证数据集的文件夹,并生成相应的 dataset.yaml 配置文件。
import shutil
import datetimesave_path = Path(dataset_path / f"{datetime.date.today().isoformat()}_{ksplit}-Fold_Cross-val")
save_path.mkdir(parents=True, exist_ok=True)# 创建目录和YAML文件
ds_yamls = []
for split in folds_df.columns:split_dir = save_path / splitsplit_dir.mkdir(parents=True, exist_ok=True)(split_dir / "train" / "images").mkdir(parents=True, exist_ok=True)(split_dir / "train" / "labels").mkdir(parents=True, exist_ok=True)(split_dir / "val" / "images").mkdir(parents=True, exist_ok=True)(split_dir / "val" / "labels").mkdir(parents=True, exist_ok=True)dataset_yaml = split_dir / f"{split}_dataset.yaml"ds_yamls.append(dataset_yaml)with open(dataset_yaml, "w") as ds_y:yaml.safe_dump({"path": split_dir.as_posix(),"train": "train","val": "val","names": classes,}, ds_y)# 复制图像和标签文件到对应的目录
images = sorted((dataset_path / "images").rglob("*"))
for image, label in zip(images, labels):for split, k_split in folds_df.loc[image.stem].items():img_to_path = save_path / split / k_split / "images"lbl_to_path = save_path / split / k_split / "labels"shutil.copy(image, img_to_path / image.name)shutil.copy(label, lbl_to_path / label.name)
8. 训练YOLO模型
创建一个YOLO模型并使用每个fold的数据进行训练。训练完成后,你可以保存模型并记录性能指标。
from ultralytics import YOLOweights_path = "path/to/weights.pt" # YOLO预训练权重文件路径
model = YOLO(weights_path, task="detect")# 训练每个fold的数据
results = {}
batch = 16
epochs = 100
project = "kfold_demo"for k in range(ksplit):dataset_yaml = ds_yamls[k]model.train(data=dataset_yaml, epochs=epochs, batch=batch, project=project)results[k] = model.metrics # 保存训练结果
9. 结果分析
你可以从 results 中提取每个fold的训练指标进行进一步分析。例如,可以计算每个fold的mAP(mean Average Precision)并进行比较,确保模型的稳定性和泛化能力。
结论
通过上述步骤,你可以在YOLO自定义数据集上实现K折交叉验证。K折交叉验证的优点是能够减少模型过拟合的风险,确保模型在不同数据划分上的泛化能力,提升其性能可靠性。
这些步骤是通用的,可以根据自己的数据集进行修改和优化。
相关文章:
YOLO自定义数据集实现K折交叉验证——K-Fold Cross Validation
实现K折交叉验证(K-Fold Cross Validation)对于YOLO(You Only Look Once)自定义数据集的目标检测任务可以显著提升模型的可靠性和泛化能力。 1. 数据集准备 首先,你需要确保你的数据集符合YOLO的格式,具体…...
刚体的力+射线相关知识点+延迟函数
AddForceAtPosition cube0.AddForceAtPosition(Vector3.forward*5,target.transform.position); force:给cube0一个力,控制cube0的移动; position:cube0和所给点的连线力得大小,这个力跟移动方向有夹角,会造成cube0…...
集合家族详情
一、Java集合框架全景图 1.1 核心接口层次结构 graph TDA[Iterable] --> B[Collection]B --> C1[List]B --> C2[Set]B --> C3[Queue]C1 --> D1[ArrayList]C1 --> D2[LinkedList]C2 --> E1[HashSet]C2 --> E2[TreeSet]C3 --> F1[PriorityQueue]G[M…...
go语言简单快速的按顺序遍历kv结构(map)
文章目录 需求描述用map实现按照map的key排序用二维切片实现用结构体实现 需求描述 在go语言中,如果需要对map遍历,每次输出的顺序是不固定的,可以考虑存储为二维切片或结构体。 假设现在需要在页面的下拉菜单中展示一些基础的选项ÿ…...
【竞技宝】LOL-LPL:EDG3-0零封LNG
北京时间2月12日,英雄联盟LPL2025正在如火如荼的进行之中,昨日迎来LNG对阵EDG,以下是本场比赛的详细战报。 第一局: EDG:杰斯、赵信、维克托、女枪、芮尔 LNG:猴子、猪妹、飞机、韦鲁斯、布隆 首局比赛,EDG在蓝色方,LNG在红色方。阵容方面,EDG点出了杰斯、赵信、维克托、女枪…...
在fedora41中安装钉钉dingtalk_7.6.25.4122001_amd64
在Fedora-Workstation-Live-x86_64-41-1.4中安装钉钉dingtalk_7.6.25.4122001_amd64.deb 到官网下载钉钉Linux客户端com.alibabainc.dingtalk_7.6.25.4122001_amd64.deb https://page.dingtalk.com/wow/z/dingtalk/simple/ddhomedownload#/ 一、直接使用dpkg命令安装deb包报错…...
看期货用的指标,可以提示买卖点和K线转折变颜色的主图指标源码下载
A:MA(CLOSE,17)ABS(MA(CLOSE,17)-REF(MA(CLOSE,17),1)); B:MA(CLOSE,17)MA(CLOSE,17)-REF(MA(CLOSE,17),1); 分界线:IF(MA(CLOSE,17)<B,B,MA(CLOSE,17)),COLORFF00FF,LINETHICK2; 操作线:分界线-(EMA(C,3)-分界线),COLOR00FFFF,LINETHICK2; GUP:MA(C,5),COLORWHITE,LINE…...
【PS 2022】Adobe Genuine Service Alert 弹出
电脑总是弹出Adobe Genuine Service Alert弹窗 1. 不关掉弹窗并打开任务管理器,找到Adobe Genuine Service Alert,并右键进入文件所在位置 2 在任务管理器中结束进程并将文件夹中的 .exe 文件都使用空文档替换掉 3. 打开PS不弹出弹窗,解决&a…...
计算机网络知识速记:HTTP1.0和HTTP1.1
计算机网络知识速记:HTTP1.0和HTTP1.1 1. 基本概念 1.1 HTTP1.0 HTTP1.0是1996年发布的第一个正式版本,主要用于客户端与服务器之间的简单请求和响应交互。它的设计理念相对简单,适合处理一些基本的网页服务。 1.2 HTTP1.1 HTTP1.1是HTT…...
30天开发操作系统 第 20 天 -- API
前言 大家早上好,今天我们继续努力哦。 昨天我们已经实现了应用程序的运行, 今天我们来实现由应用程序对操作系统功能的调用(即API, 也叫系统调用)。 为什么这样的功能称为“系统调用”(system call)呢?因为它是由应用程序来调用(操作)系统中的功能来完…...
蓝桥杯(B组)-每日一题(求最大公约数最小公倍数)
题目: 代码展现: #include<iostream> using namespace std; int main() {int m,n,x,y;cin>>m>>n;//输入两个整数int b;bm%n;//取余数xm;//赋值yn;while(b)//当余数不为0的时候{xy;//辗转相除求最小公约数yb;bx%y;}cout<<y<&…...
【DuodooBMS】开源软件:利他也能赚钱,开源MES就是好例子
引一:“开源与商业化”并不矛盾,关键在于为用户提供真正价值! 引二:“永远年轻,永远热泪盈眶。” 当你试图放弃一个你知道是正确的事情的时候,希望你能再看看这句话。 在数字时代,开源软件就像…...
LeetCode3. 无重复字符的最长字串(滑动窗口)
题目概述 给定一个字符串 s ,请你找出其中不含有重复字符的最长子串的长度。 示例 1: 输入: s “abcabcbb” 输出: 3 解释: 因为无重复字符的最长子串是 “abc”,所以其长度为 3。 示例 2: 输入: s “bbbbb” 输出: 1 解释: 因为无重复字符的最长…...
Redis 内存回收机制
Redis 是一个基于内存的键值存储系统,为了避免内存耗尽,Redis 提供了多种内存回收机制。以下是 Redis 内存回收的主要方式: 1. 过期键删除 Redis 支持为键设置过期时间,过期后会自动删除键以释放内存。 1.1 设置过期时间 SET key…...
arduino扩展:Arduino Mega 控制 32 个舵机(参考表情机器人)
参考:表情机器人中使用22个舵机的案例 引言 在电子制作与自动化控制领域,Arduino 凭借其易用性和强大的扩展性备受青睐。Arduino Mega 作为其中功能较为强大的一款开发板,具备丰富的引脚资源,能够实现复杂的控制任务。舵机作为常…...
DeepSeek提问技巧总结
DeepSeek提问技巧总结 1.聚焦核心,细化问题: 提问时应精准明确,避免过于宽泛或模糊。例如不要问“如何学习机器学习?”而应问“零基础如何机器学习”。对于复杂问题,可将其拆解为多个小问题,逐一提问。比…...
基于51单片机的门禁刷卡器proteus仿真
地址:https://pan.baidu.com/s/1j0KAmH5pVGWZWRpT6p5hBg 提取码:1234 仿真图: 芯片/模块的特点: AT89C52/AT89C51简介: AT89C52/AT89C51是一款经典的8位单片机,是意法半导体(STMicroelectron…...
mapbox进阶,添加绘图扩展插件,裁剪线
👨⚕️ 主页: gis分享者 👨⚕️ 感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅! 👨⚕️ 收录于专栏:mapbox 从入门到精通 文章目录 一、🍀前言1.1 ☘️mapboxgl.Map 地图对象1.2 ☘️mapboxgl.Map style属性1.3 ☘️MapboxDraw 绘图控件二、🍀添加绘图扩…...
19.4.6 读写数据库中的二进制数据
版权声明:本文为博主原创文章,转载请在显著位置标明本文出处以及作者网名,未经作者允许不得用于商业目的。 需要北风数据库的请留言自己的信箱。 北风数据库中,类别表的图片字段在【数据表视图】中显示为Bitmap Image࿱…...
PlantUml常用语法
PlantUml常用语法,将从类图、流程图和序列图这三种最常用的图表类型开始。 类图 基础语法 在 PlantUML 中创建类图时,你可以定义类(Class)、接口(Interface)以及它们之间的关系,如继承&#…...
MapReduce到底是个啥?
在聊 MapReduce 之前不妨先看个例子:假设某短视频平台日活用户大约在7000万左右,若平均每一个用户产生3条行为日志:点赞、转发、收藏;这样就是两亿条行为日志,再假设每条日志大小为100个字节,那么一天就会产…...
Winform自定义控件与案例 - 构建炫酷的自定义环形进度条控件
文章目录 1、控件效果2、案例实现1、代码实现2、代码解释3、使用示例 4、总结 1、控件效果 2、案例实现 1、代码实现 代码如下(示例): using System; using System.ComponentModel; using System.Drawing; using System.Drawing.Drawing2D; …...
【SpringBoot苍穹外卖】debugDay03.5
1、AOP面向切面编程 1. Target(ElementType.METHOD) 作用:指定自定义注解可以应用的目标范围。 参数:ElementType 是一个枚举类,定义了注解可以应用的目标类型。 ElementType.METHOD 表示该注解只能用于方法上。 其他常见的 ElementType 值…...
分享在职同时准备系统分析师和教资考试的时间安排
(在职、时间有限、同时备考系统分析师考试和小学信息技术教资面试),以下是详细的备考计划,确保计划的可行性和通过性。 一、总体安排 时间分配: 每周周末(2天)用于系统分析师考试备考。工作日晚…...
flink实时集成利器 - apache seatunnel - 核心架构详解
SeaTunnel(原名 Waterdrop)是一个分布式、高性能、易扩展的数据集成平台,专注于大数据领域的数据同步、数据迁移和数据转换。它支持多种数据源和数据目标,并可以与 Apache Flink、Spark 等计算引擎集成。以下是 SeaTunnel 的核心架…...
视频理解新篇章:Mamba模型的探索与应用
人工智能咨询培训老师叶梓 转载标明出处 想要掌握如何将大模型的力量发挥到极致吗?叶老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具(限时免费)。 1小时实战课程,您将学习到如何轻松上手并有效利用 Llama Facto…...
分形几何表明数学一直存在有首、末的无穷序列
分形几何表明数学一直存在有首、末的无穷序列。一有穷长直线段S可变为锯齿状图形G而由无穷多无穷短直线段连接而成。G和S一样有左、右两个端点。...
DeepSeek 的 API 服务引入 WPS Office
以下是将 DeepSeek 的 API 服务引入 WPS Office 的通用集成教程。以调用 DeepSeek 的 AI 功能(如文本生成、数据分析)为例,假设你需要通过 WPS 的宏或插件调用外部 API: 准备工作 注册 DeepSeek 账号并获取 API Key 访问 DeepSe…...
Python接口自动化测试—接口数据依赖
一般在做自动化测试时,经常会对一整套业务流程进行一组接口上的测试,这时候接口之间经常会有数据依赖,那又该如何继续呢? 那么有如下思路: 抽取之前接口的返回值存储到全局变量字典中。初始化接口请求时,…...
C++ 实践扩展(Qt Creator 联动 Visual Studio 2022)
这里我们将在 VS 上实现 QT 编程,实现如下: 一、Vs 2022 配置(若已安装,可直接跳过) 点击链接:Visual Studio 2022 我们先去 Vs 官网下载,如下: 等待程序安装完成之…...
