当前位置：首页 > news >正文

【保姆级视频教程（二）】YOLOv12训练数据集构建：标签格式转换-划分-YAML 配置避坑指南 | 小白也能轻松玩转目标检测！

news 2026/2/8 22:17:14

【2025全站首发】YOLOv12训练数据集构建：标签格式转换-划分-YAML 配置避坑指南 | 小白也能轻松玩转目标检测！

文章目录

1. 数据集准备
- 1.1 标签格式转换
- 1.2 数据集划分
- 1.3 yaml配置文件创建
2. 训练验证

1. 数据集准备

示例数据集下载链接：PKU-Market-PCB数据集

1.1 标签格式转换

cursor prompt

请撰写一个py脚本。将@Annotations文件夹下的所有类别的xml格式的标注转换成为yolo格式。转换后的标签请新建一个labels文件夹，保存在该文件夹下。

生成的xml2yolo.py脚本内容如下：

import os
import xml.etree.ElementTree as ET
import globdef convert_coordinates(size, box):"""将XML中的边界框坐标转换为YOLO格式"""dw = 1.0/size[0]dh = 1.0/size[1]# XML格式为 xmin, ymin, xmax, ymaxx = (box[0] + box[2])/2.0y = (box[1] + box[3])/2.0w = box[2] - box[0]h = box[3] - box[1]# 归一化x = x*dww = w*dwy = y*dhh = h*dhreturn (x,y,w,h)def convert_xml_to_yolo(xml_path, class_mapping):"""转换单个XML文件到YOLO格式"""tree = ET.parse(xml_path)root = tree.getroot()# 获取图像尺寸size = root.find('size')width = int(size.find('width').text)height = int(size.find('height').text)# 创建对应的txt文件路径txt_path = xml_path.replace('Annotations', 'Labels').replace('.xml', '.txt')# 确保Labels目录存在os.makedirs(os.path.dirname(txt_path), exist_ok=True)with open(txt_path, 'w') as txt_file:# 处理每个目标for obj in root.iter('object'):# 获取类别名称class_name = obj.find('name').text# 获取类别IDif class_name not in class_mapping:continueclass_id = class_mapping[class_name]# 获取边界框坐标xmlbox = obj.find('bndbox')xmin = float(xmlbox.find('xmin').text)ymin = float(xmlbox.find('ymin').text)xmax = float(xmlbox.find('xmax').text)ymax = float(xmlbox.find('ymax').text)# 转换坐标bb = convert_coordinates((width,height), (xmin,ymin,xmax,ymax))# 写入txt文件txt_file.write(f"{class_id} {bb[0]:.6f} {bb[1]:.6f} {bb[2]:.6f} {bb[3]:.6f}\n")def main():# 定义类别映射class_mapping = {'missing_hole': 0,'mouse_bite': 1,'open_circuit': 2,'short': 3,'spur': 4,'spurious_copper': 5}# 获取所有XML文件xml_files = glob.glob('Annotations/*/*.xml')# 转换每个XML文件for xml_file in xml_files:try:convert_xml_to_yolo(xml_file, class_mapping)print(f"成功转换: {xml_file}")except Exception as e:print(f"转换失败 {xml_file}: {str(e)}")if __name__ == "__main__":main()

1.2 数据集划分

cursor prompt

请创建一个py脚本，对数据进行划分。对于image文件夹下的每一个类别按照8:2进行随机划分。请直接生成包含所有图像绝对路径的train.txt和val.txt文件。并输出每个类别训练集验证集的数量。

生成的split_dataset.py脚本内容如下：

import os
import glob
import randomdef split_dataset(image_root='images', train_ratio=0.8, seed=42):"""数据集划分函数:param image_root: 图片根目录路径:param train_ratio: 训练集比例:param seed: 随机种子"""# 设置随机种子保证可重复性random.seed(seed)# 初始化路径列表train_paths = []val_paths = []# 获取所有类别目录class_dirs = [d for d in glob.glob(os.path.join(image_root, '*')) if os.path.isdir(d)]# 初始化统计字典class_stats = {}for class_dir in class_dirs:# 获取类别名称class_name = os.path.basename(class_dir)# 获取当前类别所有图片路径image_paths = glob.glob(os.path.join(class_dir, '*.*'))image_paths = [p for p in image_paths if p.lower().endswith(('.png', '.jpg', '.jpeg', '.bmp'))]# 打乱顺序random.shuffle(image_paths)# 计算分割点split_idx = int(len(image_paths) * train_ratio)# 分割数据集train = image_paths[:split_idx]val = image_paths[split_idx:] if split_idx < len(image_paths) else []# 转换为绝对路径并添加路径分隔符train_paths.extend([os.path.abspath(p) + '\n' for p in train])val_paths.extend([os.path.abspath(p) + '\n' for p in val])# 记录统计信息class_stats[class_name] = {'total': len(image_paths),'train': len(train),'val': len(val)}# 写入文件with open('train.txt', 'w') as f:f.writelines(train_paths)with open('val.txt', 'w') as f:f.writelines(val_paths)# 新增统计信息输出print("\n各类别数据分布：")print("{:<15} {:<10} {:<10} {:<10}".format('类别', '总数', '训练集', '验证集'))for cls, stat in class_stats.items():print("{:<15} {:<10} {:<10} {:<10}".format(cls, stat['total'], stat['train'], stat['val']))# 原有总样本数输出保持不变print(f'\n数据集划分完成！\n训练集样本数: {len(train_paths)}\n验证集样本数: {len(val_paths)}')if __name__ == '__main__':# 使用示例（根据实际情况修改路径）split_dataset(image_root='images')

1.3 yaml配置文件创建

pcb_detect.yaml具体内容如下：

path: E:\project\YOLOv12\dataset\PCB_DATASET # dataset root dir
train: train.txt # train images (relative to 'path') 118287 images
val: val.txt # val images (relative to 'path') 5000 images
test: # 20288 of 40670 images, submit to https://competitions.codalab.org/competitions/20794# Classes
names:0: Missing_hole1: Mouse_bite2: Open_circuit3: Short4: Spur5: Spurious_copper

2. 训练验证

train.py训练验证脚本内容如下：

from ultralytics import YOLOmodel = YOLO('yolov12n.yaml')# Train the model
results = model.train(data='pcb_detect.yaml',epochs=300, batch=4, imgsz=640,scale=0.5,  # S:0.9; M:0.9; L:0.9; X:0.9mosaic=1.0,mixup=0.0,  # S:0.05; M:0.15; L:0.15; X:0.2copy_paste=0.1,  # S:0.15; M:0.4; L:0.5; X:0.6device="0",workers=0,
)# Evaluate model performance on the validation set
metrics = model.val()

遇到``AttributeError: ‘InfiniteDataLoader‘ object has no attribute ‘` 报错，查看解决方案~

【保姆级视频教程（二）】YOLOv12训练数据集构建：标签格式转换-划分-YAML 配置避坑指南 | 小白也能轻松玩转目标检测！

【2025全站首发】YOLOv12训练数据集构建：标签格式转换-划分-YAML 配置避坑指南 | 小白也能轻松玩转目标检测！ 文章目录 1. 数据集准备1.1 标签格式转换1.2 数据集划分1.3 yaml配置文件创建 2. 训练验证 1. 数据集准备示例数据集下载链接：P…...

编程日记 2025/2/28 8:58:22

smolagents学习笔记系列（八）Examples - Master you knowledge base with agentic RAG

这篇文章锁定官网教程中 Examples 章节中的 Master you knowledge base with agentic RAG 文章，主要介绍了如何将 agent 和 RAG 结合使用。官网链接：https://huggingface.co/docs/smolagents/v1.9.2/en/examples/rag； Agentic RAG 在之前的…...

编程日记 2025/2/28 8:57:19

满血版DeepSeek R1使用体验

硅基流动的满血版DeepSeek，通过CheeryStudio可以轻松访问，告别DeepSeek官网服务器繁忙，https://cloud.siliconflow.cn/i/ewlWR6A9 即可注册 https://cloud.siliconflow.cn/i/ewlWR6A9https://cloud.siliconflow.cn/i/ewlWR6A9 一、硅基流动平…...

编程日记 2025/2/28 8:52:13

Java类中的this操作

在Java中，`this` 是一个关键字，用于引用当前对象的实例。它通常在类的方法或构造器中使用，主要有以下几种用途： 1. 区分成员变量和局部变量当成员变量与局部变量同名时，使用 `this` 可以明确引用当前对象的成员变量。 public class Person { private String name; …...

编程日记 2025/2/28 8:47:06

LeetCode刷题---双指针---532

数组中的 k-diff 数对 532. 数组中的 k-diff 数对 - 力扣（LeetCode） 题目给你一个整数数组 nums 和一个整数 k，请你在数组中找出不同的 k-diff 数对，并返回不同的 k-diff 数对的数目。 k-diff 数对定义为一个整数对 (nums[…...

编程日记 2025/2/28 8:33:51

cpp单调栈模板

题目如下如果利用暴力解法，时间复杂度是O（n^2） 只能过60%的数据 AC解法： 利用单调栈的算法，单调栈里存的是之前遍历过的元素的下标，如果满足while的条件就将栈顶元素记录，然后将其弹出&#x…...

编程日记 2025/2/28 8:31:48

PyCharm 的使用 + PyCharm快捷键 + 切换中文界面

2025 - 02 - 27 - 第 62 篇 Author: 郑龙浩 / 仟濹【PyCharm的使用】文章目录如何使用Pycharm1 新建工程，新建 .py 文件，运行2 常用快捷键3 其他快捷键 - DeepSeek 总结如下**代码编辑****导航与定位****查找与替换****运行与调试****代码重构****其…...

编程日记 2025/2/28 8:23:38

SSL/TLS 协议、SSL证书和 SSH协议的区别和联系

下面是 SSL/TLS 协议、SSL证书和 SSH协议的区别和联系，包含它们的英文全称和中文全称： 属性SSL/TLS 协议SSL证书SSH 协议英文全称Secure Sockets Layer / Transport Layer SecuritySecure Sockets Layer CertificateSecure Shell Protocol中文全称安全…...

编程日记 2025/2/28 8:21:35

一个典型的要求: Python | C#实现年月日创建文件夹时分秒对应文件名的保存路径

赶时间先说python: 用年月日作为文件夹: 年月日时分秒保存文件的路径根据年月日创建文件夹年里面包含月月里面包含日检查是否存在没有就去创建最后文件名用时分秒毫秒.txt 这是一个典型的要求: import os from datetime import datetimenow datetime.now()# 获取当…...

编程日记 2025/2/28 8:19:33

知识库功能测试难点

图表交互功能测试难点知识库图表类型多，每种图表交互功能不同。像柱状图，可能有点击柱子查看详细数据、鼠标悬停显示数据提示等交互；折线图除了这些，还可能支持缩放查看不同时间段数据。多种交互操作在不同图表间存在差异&#x…...

编程日记 2025/2/28 8:18:32

如何实现某短视频平台批量作品ID的作品详情采集

声明：本文仅供学习交流使用，请勿用于非法用途。在短视频平台的数据分析和内容监测中，批量采集作品详情是一个常见的需求。本文将介绍如何使用 Python 编写一个高效的爬虫程序，根据批量作品 ID 实现作品详情的批量采集。 1. 需求分析输入：一批作品 ID。输出：每个作品 …...

编程日记 2025/2/28 8:15:29

uniapp中使用leaferui使用Canvas绘制复杂异形表格的实现方法

需求： 如下图，要实现左图的样式，先实现框架，文字到时候往里填就行了，原来的解决方案是想用css,html来实现，发现实现起来蛮麻烦的。我也没找到合适的实现方法，最后换使用canvas来实现&#xff…...

编程日记 2025/2/28 8:12:16

判别分析：原理推导、方法对比与Matlab实战

内容摘要本文深入解析判别分析的三大核心方法——距离判别、Fisher判别与Bayes判别，结合协方差估计、投影优化及贝叶斯决策理论，系统阐述数学原理与实现细节。通过气象数据春早预测、产品厂家分类及城市竞争力评估三大实战案例，完整演示数据…...

编程日记 2025/2/28 8:11:14

PMP项目管理—整合管理篇—4.管理项目知识

文章目录基本信息知识的分类显性知识隐性知识如何分享知识？4W1HITTO输入工具与技术输出经验教训登记册基本信息知识管理指管理显性知识和隐性知识，旨在重复使用现有知识并生成新知识。有助于达成这两个目的的关键活动是知识分享和知识集成&#xf…...

编程日记 2025/2/28 8:09:11

Makefile编写和相关语法规则

makefile基本概念 Makefile 本质上是一个文本文件，它包含了一系列规则和指令，用于告诉构建工具（如 make）如何编译和链接程序，以及如何处理项目中的各种文件。其核心思想是通过定义目标（target）…...

编程日记 2025/2/28 8:04:07

点云 PCL 滤波在自动驾驶的用途。

1.直通滤波 2.体素滤波...

编程日记 2025/2/28 8:03:05

NL2SQL的应用-长上下文模型在处理NL2SQL任务时，相较于传统模型，有哪些显著的优势

大家好，我是微学AI，今天给大家介绍一下NL2SQL的应用-长上下文模型在处理NL2SQL任务时，相较于传统模型，有哪些显著的优势。NL2SQL（自然语言转SQL）技术旨在将用户自然语言提问自动转换为结构化查询语句&#…...

编程日记 2025/2/28 8:02:04

图像处理基础(8)：图像的灰度直方图、直方图均衡化、直方图规定化（匹配）

本文主要介绍了灰度直方图相关的处理，包括以下几个方面的内容： • 利用OpenCV计算图像的灰度直方图，并绘制直方图曲线 • 直方图均衡化的原理及实现 • 直方图规定化（匹配）的原理及实现图像的灰度直方图一…...

编程日记 2025/2/28 8:01:03

探寻数组中两个不重复数字的奥秘：C 语言实战之旅

在编程的世界里，经常会遇到各种各样有趣的问题，今天我们就来探讨一个经典的题目：在一个整数数组中，除了两个数字只出现一次，其余数字都出现了两次，如何高效地找出这两个只出现一次的数字呢？我们…...

编程日记 2025/2/28 7:55:57

Mercury、LLaDA 扩散大语言模型

LLaDA 参考： https://github.com/ML-GSAI/LLaDA https://ml-gsai.github.io/LLaDA-demo/ 在线demo： https://huggingface.co/spaces/multimodalart/LLaDA Mercury 在线demo： https://chat.inceptionlabs.ai/ 速度很快生成...

编程日记 2025/2/28 7:47:48

变量 varablie 声明- Rust 变量 let mut 声明与 C/C++ 变量声明对比分析

一、变量声明设计：let 与 mut 的哲学解析 Rust 采用 let 声明变量并通过 mut 显式标记可变性，这种设计体现了语言的核心哲学。以下是深度解析： 1.1 设计理念剖析安全优先原则：默认不可变强制开发者明确声明意图 let x 5; …...

编程新知 2025/9/28 20:12:12

Keil 中设置 STM32 Flash 和 RAM 地址详解

文章目录 Keil 中设置 STM32 Flash 和 RAM 地址详解一、Flash 和 RAM 配置界面（Target 选项卡）1. IROM1（用于配置 Flash）2. IRAM1（用于配置 RAM）二、链接器设置界面（Linker 选项卡）1. 勾选“Use Memory Layout from Target Dialog”2. 查看链接器参数（如果没有勾选上面…...

编程新知 2026/2/7 0:28:16

数据链路层的主要功能是什么

数据链路层（OSI模型第2层）的核心功能是在相邻网络节点（如交换机、主机）间提供可靠的数据帧传输服务，主要职责包括： 🔑 核心功能详解： 帧封装与解封装封装： 将网络层下发…...

编程新知 2026/2/1 7:31:51

Cloudflare 从 Nginx 到 Pingora：性能、效率与安全的全面升级

在互联网的快速发展中，高性能、高效率和高安全性的网络服务成为了各大互联网基础设施提供商的核心追求。Cloudflare 作为全球领先的互联网安全和基础设施公司，近期做出了一个重大技术决策：弃用长期使用的 Nginx，转而采用其内部开发…...

编程新知 2026/1/29 21:20:51

mysql已经安装，但是通过rpm -q 没有找mysql相关的已安装包

文章目录现象：mysql已经安装，但是通过rpm -q 没有找mysql相关的已安装包遇到 rpm 命令找不到已经安装的 MySQL 包时，可能是因为以下几个原因：1.MySQL 不是通过 RPM 包安装的2.RPM 数据库损坏3.使用了不同的包名或路径4.使用其他包…...

编程新知 2026/2/4 16:17:25

Element Plus 表单(el-form)中关于正整数输入的校验规则

目录 1 单个正整数输入1.1 模板1.2 校验规则 2 两个正整数输入（联动）2.1 模板2.2 校验规则2.3 CSS 1 单个正整数输入 1.1 模板 <el-formref"formRef":model"formData":rules"formRules"label-width"150px"…...

编程新知 2025/11/10 19:08:45

Python ROS2【机器人中间件框架】简介

销量过万TEEIS德国护膝夏天用薄款优惠券冠生园百花蜂蜜428g 挤压瓶纯蜂蜜巨奇严选鞋子除臭剂360ml 多芬身体磨砂膏280g健70%-75%酒精消毒棉片湿巾1418cm 80片/袋3袋大包清洁食品用消毒优惠券AIMORNY52朵红玫瑰永生香皂花同城配送非鲜花七夕情人节生日礼物送女友热卖妙洁棉…...

编程新知 2026/1/29 9:12:46