当前位置：首页 > news >正文

YOLOv5-第Y2周：训练自己的数据集

news 2025/12/20 14:10:06

YOLOv5-第Y2周：训练自己的数据集

YOLOv5-第Y2周：训练自己的数据集
- 一、前言
- 二、我的环境
- 三、准备数据集
- 四、运行 split_train_val.py 文件
- 五、生成 train.txt、test.txt、val.txt 文件
- 六、创建ab.yaml文件
- 七、开始使用自己的数据集训练
- 八、总结

YOLOv5-第Y2周：训练自己的数据集

一、前言

🍨 本文为🔗365天深度学习训练营中的学习记录博客
🍖 原作者：K同学啊

二、我的环境

电脑系统：Windows 10
语言环境：Python 3.8.5
编译器：colab在线编译
深度学习环境：PyTorch

三、准备数据集

文件夹目录结构：

🍦主目录:
paper_ data (创建个文件夹,将数据放到这里)
Annotations (放置我们的.xm文件)
images (放置图片文件)
ImageSets:
Main (会在该文件夹内自动生成train.txt、 val.txt、 test.txt和trainval.txt四个文件,
存放训练集、验证集、测试集图片的名字)

在这里插入图片描述

四、运行 split_train_val.py 文件

ImageSets文件夹下面有个Main子文件夹，其下面存放了 train.txt、val.txt、test.txt和 trainval.txt四个文件，它们是通过split_train_val.py文件来生成的。

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 14 19:08:01 2023@author: admin
"""import os
import random
import argparseparser = argparse.ArgumentParser()#xml文件的地址，根据自己的数据进行修改，xml一班存放在Annotation下
parser.add_argument('--xml_path', default = 'C:\YOLOv5\yolov5-master\paper_data\Annotations', type = str, help = 'input xml label path')#数据集的划分，地址选择自己数据下的ImageSets/Main
parser.add_argument('--txt_path', default = 'C:\YOLOv5\yolov5-master\paper_data\ImageSets/Main', type = str, help = 'output txt label path')opt = parser.parse_args()trainval_percent = 0.9
train_percent = 8 / 9
xmlfilepath = opt.xml_path
txtsavepath = opt.txt_path
total_xml = os.listdir(xmlfilepath)
if not os.path.exists(txtsavepath):os.makedirs(txtsavepath)num = len(total_xml)
list_index = range(num)
tv = int(num * train_percent)
tr = int(tv * train_percent)
trainval = random.sample(list_index, tv)
train = random.sample(trainval, tr)file_trainval = open(txtsavepath + '/trainval.txt', 'w')
file_test = open(txtsavepath + '/test.txt', 'w')
file_train = open(txtsavepath + '/train.txt', 'w')
file_val = open(txtsavepath + '/val.txt', 'w')for i in list_index:name = total_xml[i][:-4] + '\n'if i in trainval:file_trainval.write(name)if i in train:file_train.write(name)else:file_val.write(name)else:file_test.write(name)file_trainval.close()
file_train.close()
file_val.close()
file_test.close()

运行 split_train_val.py 文件后你将得至train.txt、val.txt、test.txt 和 trainval.txt 四个文件，结果如下：
在这里插入图片描述

五、生成 train.txt、test.txt、val.txt 文件

编写voc_label.py文件

# -*- coding: utf-8 -*-
import xml.etree.ElementTree as ET
import os
from os import getcwdsets = ['train', 'val', 'test']
classes = ["pineapple"]   # 改成自己的类别
abs_path = os.getcwd()
print(abs_path)def convert(size, box):dw = 1. / (size[0])dh = 1. / (size[1])x = (box[0] + box[1]) / 2.0 - 1y = (box[2] + box[3]) / 2.0 - 1w = box[1] - box[0]h = box[3] - box[2]x = x * dww = w * dwy = y * dhh = h * dhreturn x, y, w, hdef convert_annotation(image_id):in_file = open('./annotations/%s.xml' % (image_id), encoding='UTF-8')out_file = open('./labels/%s.txt' % (image_id), 'w')tree = ET.parse(in_file)root = tree.getroot()size = root.find('size')w = int(size.find('width').text)h = int(size.find('height').text)for obj in root.iter('object'):difficult = obj.find('difficult').textcls = obj.find('name').textif cls not in classes or int(difficult) == 1:continuecls_id = classes.index(cls)xmlbox = obj.find('bndbox')b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),float(xmlbox.find('ymax').text))b1, b2, b3, b4 = b# 标注越界修正if b2 > w:b2 = wif b4 > h:b4 = hb = (b1, b2, b3, b4)bb = convert((w, h), b)out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')wd = getcwd()
for image_set in sets:if not os.path.exists('./labels/'):os.makedirs('./labels/')image_ids = open('./ImageSets/Main/%s.txt' % (image_set)).read().strip().split()list_file = open('./%s.txt' % (image_set), 'w')for image_id in image_ids:list_file.write(abs_path + '/images/%s.png\n' % (image_id)) # 注意你的图片格式，如果是.jpg记得修改convert_annotation(image_id)list_file.close()

运行voc_label.py文件，你将会得到train.txt、test.txt、val.txt三个文件。

在这里插入图片描述

六、创建ab.yaml文件

本周开始进入yolov5的章节的学习。 ab.yaml文件内容如下:
在这里插入图片描述

七、开始使用自己的数据集训练

python train.py --img 900 --batch 2 --epoch 5 --data paper_data/ab.yaml --cfg models/yolov5s.yaml --weights yolov5s.pt

在这里插入图片描述

文件报错，这里还不知道是什么原因。后续查找修改Bug

八、总结

通过Y1和Y2的学习，学会了yolov5的环境配置以及用自己的数据集训练模型。接下来就是查阅资料，解决Bug。

YOLOv5-第Y2周：训练自己的数据集

YOLOv5-第Y2周：训练自己的数据集 YOLOv5-第Y2周：训练自己的数据集一、前言二、我的环境三、准备数据集四、运行 split_train_val.py 文件五、生成 train.txt、test.txt、val.txt 文件六、创建ab.yaml文件七、开始使用自己的数据集训练八、总结 YOLOv5-第…...

编程日记 2024/1/20 13:48:13

解决fxml图标无法显示

原文地址：https://www.myjinji.top/articles/2023/10/11/1697033367492.html 代码正确无法显示 <Button fx:id"blockButton" onAction"#handleBlockButtonClick"><graphic><FontIcon iconLiteral"win10-add-shopping-cart…...

编程日记 2024/1/20 13:46:11

1.安装 npm insatll react-redux npm install reduxjs/toolkit npm install redux-persist2. 使用React Toolkit创建counterStore并配置持久化 store/modules/counterStore.ts： import { createSlice } from reduxjs/toolkit// 定义状态类型 interface Action {…...

编程日记 2024/1/20 13:44:09

Hive添加第三方Jar包方式总结

一、在 Hive Shell中加入—add jar hdfs dfs -put HelloUDF-1.0.jar /tmp beeline -u "jdbc:hive2://test.bigdata.com:10000" -n "song" -p "" add jar hdfs:///tmp/HelloUDF-1.0.jar; create function HelloUDF as org.example.HelloUDF USIN…...

编程日记 2024/1/20 13:42:07

Linux用户与文件的关系和文件掩码（umask）的作用

文章目录 1 前言2 Linux用户与文件的关系3 文件掩码（umask）4 总结 1 前言阅读本篇文章，你将了解Linux的目录结构，用户与文件的关系，以及文件掩码的作用。为了方便大家理解，本文将通过实例进行演示&#xf…...

编程日记 2024/1/20 13:40:06

JS -- 正则表达式教程

1 概念 ECMAScript 通过 RegExp 类型支持正则表达式。 2 写法 2.1 类似 Perl 的简写语法： let pattern /a/g let pattern2 /a/i2.2 构造函数创建： let pattern new RegExp(a, g) let pattern new RegExp(a, i)上面两种是等价的正则表达式 3 修…...

编程日记 2024/1/20 13:39:05

详细介绍IP 地址、网络号和主机号、ABC三类、ip地址可分配问题、子网掩码、子网划分

1、 IP 地址: 网络之间互连的协议，是由4个字节(32位二进制)组成的逻辑上的地址。将32位二进制进行分组，分成4组，每组8位(1个字节)。【ip地址通常使用十进制表示】ip地址分成四组之后，在逻辑上，分成网络号和主机号 2…...

编程日记 2024/1/20 13:37:03

滚动菜单+图片ListView

目录 Fruit.java FruitAdapter MainActivity activity_main.xml fruit.xml 整体结构 Fruit.java public class Fruit {private String name;private int imageId;public Fruit(String name, int imageId) {this.name name;this.imageId imageId;}public String getNam…...

编程日记 2024/1/20 13:34:00

【4k】4k的webrtc播放示例

目录使用带研发角色的账号，在app端设置下分辨率 ： 4k 点播 ffplay播放看下详细的参数使用带研发角色的账号，在app端设置下分辨率 ： 4k 点播 ffplay播放看下详细的参数...

编程日记 2024/1/20 13:32:59

PMIC 基础知识浅析（四）

PMIC 后端研究现状： 现今针对便携式移动平台的电源管理芯片仍以传统分离型 PMIC为主。根据后端设计的特点，传统分离型 PMIC 又可分三大类。控制芯片与开关 MOSFET 分离型，MOSFET 外置于PCB上，芯片仅提供智能控制功能。此类IC…...

编程日记 2024/1/20 13:29:57

gin+gorm增删改查目录框架

从网上找资料,发现,很多都是直接的结构路由，后端的controller层，还有model层，都是放在了同一个main.go文件中，如果写项目的话，还得自己去拆文件，拆代码，经过查询和自己总结，下面放…...

编程日记 2024/1/20 13:28:56

python进阶（二）导入import 机制 | 导入import 用法工作原理全解析

文章目录 1. 整体概念基本介绍1.1 包package1.2 模块 module 2 基本语法2.1 import直接使用2.2 from 及其用法3.1 as的用法 3 工作原理3.1 搜寻3.2 执行3.3 避免导入模块代码执行参考《Python应该如何导入（import）模块及包》梳理 1. 整体概念基本介绍 …...

编程日记 2024/1/20 13:27:55

极客时间-《罗剑锋的 C++ 实战笔记》文章笔记 + 个人思考

极客时间-《罗剑锋的 C 实战笔记》文章笔记个人思考语言特性06 | auto/decltype：为什么要有自动类型推导？ 语言特性 06 | auto/decltype：为什么要有自动类型推导？ auto 在C 11 引入。为什么说C是静态强类型语言&#xff1f…...

编程日记 2024/1/20 13:26:54

Pytorch 对比TensorFlow 学习：Day 17-18: 循环神经网络（RNN）和LSTM

Day 17-18: 循环神经网络（RNN）和LSTM 在这两天的学习中，我专注于理解循环神经网络（RNN）和长短期记忆网络（LSTM）的基本概念，并学习了它们在处理序列数据时的应用。 1.RNN和LSTM基础…...

编程日记 2024/1/20 13:23:50

Java基础 - 07 Set之Set，AbstractSet

上边几篇，我们对java的List集合进行相关介绍，了解了关于List集合下的相关实现类的方法或者接口。自本篇开始，将围绕java的Set进行介绍，也是对我java知识的巩固吧，处理业务越多，发现自己对基础知识的薄弱&…...

编程日记 2024/1/20 13:20:47

C++17新特性（三）新的标准库组件

1. optional 在编程时，我们经常会遇到可能会返回/传递/使用一个确定类型对象的场景。也就是说，这个对象可能有一个确定类型的值也可能没有任何值。因此，我们需要一种方法来模拟类似指针的语义：通过nullptr表示指针为空。解决方法…...

编程日记 2024/1/20 13:19:46

Spring Boot入门

SpringBoot介绍什么是SpringBoot Spring Boot是由Pivotal团队提供的全新框架，其中“Boot”的意思就是“引导”，Spring Boot 并不是对 Spring 功能上的增强，而是提供了一种快速开发 Spring应用的方式。特点 • 嵌入的 Tomcat&#xff0c…...

编程日记 2024/1/20 13:18:45

【LeetCode】数学精选4题

目录 1. 二进制求和（简单） 2. 两数相加（中等） 3. 两数相除（中等） 4. 字符串相乘（中等） 1. 二进制求和（简单） 从字符串的右端出发向左做加法，…...

编程日记 2024/1/20 13:14:41

【漏洞复现】Hikvision SPON IP网络对讲广播系统命令执行漏洞(CVE-2023-6895)

文章目录前言声明一、系统简介二、漏洞描述三、影响版本四、漏洞复现五、修复建议前言 Hikvision Intercom Broadcasting System是中国海康威视（Hikvision）公司的一个对讲广播系统。声明请勿利用文章内的相关技术从事非法测试，由于传播…...

编程日记 2024/1/20 13:13:40

IDEA在重启springboot项目时没有自动重新build

IDEA在重启springboot项目时没有自动重新build 问题描述当项目里面某些依赖或者插件更新了，target的class文件没有找到，导致不是我们需要的效果。只能手动的清理target文件，麻烦得很 ， 单体项目还好说，一次清理就…...

编程日记 2024/1/20 13:12:40

基于Flask实现的医疗保险欺诈识别监测模型

基于Flask实现的医疗保险欺诈识别监测模型项目截图项目简介社会医疗保险是国家通过立法形式强制实施，由雇主和个人按一定比例缴纳保险费，建立社会医疗保险基金，支付雇员医疗费用的一种医疗保险制度， 它是促进社会文明和进步的…...

编程新知 2025/12/17 20:27:08

理解 MCP 工作流：使用 Ollama 和 LangChain 构建本地 MCP 客户端

🌟 什么是 MCP？ 模型控制协议 (MCP) 是一种创新的协议，旨在无缝连接 AI 模型与应用程序。 MCP 是一个开源协议，它标准化了我们的 LLM 应用程序连接所需工具和数据源并与之协作的方式。可以把它想象成你的 AI 模型和想要使用它…...

编程新知 2025/12/17 11:45:21

LeetCode - 394. 字符串解码

题目 394. 字符串解码 - 力扣（LeetCode） 思路使用两个栈：一个存储重复次数，一个存储字符串遍历输入字符串： 数字处理：遇到数字时，累积计算重复次数左括号处理：保存当前状态&a…...

编程新知 2025/12/19 4:12:14

基于Docker Compose部署Java微服务项目

一. 创建根项目根项目（父项目）主要用于依赖管理一些需要注意的点： 打包方式需要为 pom<modules>里需要注册子模块不要引入maven的打包插件，否则打包时会出问题 <?xml version"1.0" encoding"UTF-8…...

编程新知 2025/12/16 20:52:05

图表类系列各种样式PPT模版分享

图标图表系列PPT模版，柱状图PPT模版，线状图PPT模版，折线图PPT模版，饼状图PPT模版，雷达图PPT模版，树状图PPT模版图表类系列各种样式PPT模版分享：图表系列PPT模板https://pan.quark.cn/s/20d40aa…...

编程新知 2025/12/4 3:48:38

学校时钟系统，标准考场时钟系统，AI亮相2025高考，赛思时钟系统为教育公平筑起“精准防线”

2025年#高考将在近日拉开帷幕，#AI 监考一度冲上热搜。当AI深度融入高考，#时间同步不再是辅助功能，而是决定AI监考系统成败的“生命线”。 AI亮相2025高考，40种异常行为0.5秒精准识别 2025年高考即将拉开帷幕，江西、…...

编程新知 2025/12/9 7:25:28

IP如何挑？2025年海外专线IP如何购买？

你花了时间和预算买了IP，结果IP质量不佳，项目效率低下不说，还可能带来莫名的网络问题，是不是太闹心了？尤其是在面对海外专线IP时，到底怎么才能买到适合自己的呢？所以，挑IP绝对是个技…...

编程新知 2025/10/19 9:49:56

MySQL JOIN 表过多的优化思路

当 MySQL 查询涉及大量表 JOIN 时，性能会显著下降。以下是优化思路和简易实现方法： 一、核心优化思路减少 JOIN 数量数据冗余：添加必要的冗余字段（如订单表直接存储用户名）合并表：将频繁关联的小表合并成…...

编程新知 2025/10/17 22:08:13

STM32HAL库USART源代码解析及应用

STM32HAL库USART源代码解析前言STM32CubeIDE配置串口USART和UART的选择使用模式参数设置GPIO配置DMA配置中断配置硬件流控制使能生成代码解析和使用方法串口初始化__UART_HandleTypeDef结构体浅析HAL库代码实际使用方法使用轮询方式发送使用轮询方式接收使用中断方式发送使用中…...

编程新知 2025/12/13 10:29:27

从物理机到云原生：全面解析计算虚拟化技术的演进与应用

前言：我的虚拟化技术探索之旅我最早接触"虚拟机"的概念是从Java开始的——JVM（Java Virtual Machine）让"一次编写，到处运行"成为可能。这个软件层面的虚拟化让我着迷，但直到后来接触VMware和Doc…...

编程新知 2025/12/19 20:18:47

YOLOv5-第Y2周：训练自己的数据集

YOLOv5-第Y2周：训练自己的数据集

一、前言

二、我的环境

三、准备数据集

四、运行 split_train_val.py 文件

五、生成 train.txt、test.txt、val.txt 文件

六、创建ab.yaml文件

七、开始使用自己的数据集训练

八、总结

相关文章：