当前位置：首页 > news >正文

YOLO 格式数据集制作

news 2026/2/8 18:33:50

1. YOLO简介

2.分割数据集准备

3.代码展示

整理不易，欢迎一键三连！！！

1. YOLO简介

YOLO（You Only Look Once）是一种流行的目标检测和图像分割模型，由华盛顿大学的 Joseph Redmon 和 Ali Farhadi 开发。YOLO 的第一个版本于 2015 年发布，并因其高速度和准确性而迅速流行起来。

YOLO不同版本发行时间

版本	时间
YOLOv1	2015
YOLOv2	2016
YOLOv3	2018
YOLOv4	2020
YOLOv5	2021
YOLOv8	2022

以YOLOv5为例，说明同时支持图像分类、目标识别、图像分割的多任务网络训练的数据准备工作。这几天在网上找了好几天，一边摸索，一边准备自己的数据集，终于搞定了，记录下保姆级数据集准备的教程。

2.分割数据集准备

通常的分割任务中数据集都是一张原始影像对应一张同样尺寸的掩模图像，YOLO最开始是跑目标检测任务，因此常用的数据组织格式都是一张原始影像对应一个json掩膜文件或者一个TXT掩膜文件，这个看不同的目标检测数据格式就知道（COCO /VOC/......），今天以一张影像对应一个txt掩膜为例来做自己的数据集。

------>

从原始的png掩膜转为YOLO需要的txt掩膜文件关键是找到txt文件中的内容和组织方式：

从上面实例txt文件可以看到，第一行的第一个值为“45”，代表类别是45，后面的一堆小数点（0.78...）代表被归一化后的多边形的x,y坐标，归一化的标准是按照原始影像大小进行归一化，比如原始像素坐标为（10，20），原始影像尺寸为100*100，那归一化后的像素坐标为（0.1，0.2）。

回车之后，第二行开始读取第二个目标的类别和位置，以此类推。

3.代码展示

from skimage import io
import cv2
import numpy as npdef mask_to_polygon(mask: np.array, report: bool = False) -> List[int]:contours, _ = cv2.findContours(mask, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)polygons = []for object in contours:coords = []for point in object:coords.append(int(point[0][0]))coords.append(int(point[0][1]))polygons.append(coords)if report:print(f"Number of points = {len(polygons[0])}")return np.array(polygons).ravel().tolist()mask = io.imread('/labels/xxx.png')
polygons = mask_to_polygon(mask, report=True)

函数返回得到的polygons就是一个存放了一张影像中所有目标的多边形位置了，要想得到最终的txt文件，别忘了在前面加上影像类别哦。

如果像简化掩膜要素，就是把距离较近的点删除一些，减少掩膜文件的大小，可以参考下面的文章。

参考：二进制掩膜转txt

官方给出的COCO128-seg数据集：下载链接

YOLO 格式数据集制作

1. YOLO简介

2.分割数据集准备

3.代码展示

欢迎投票，整理不易，一键三连！！！

相关文章：

YOLO 格式数据集制作

基于linux内核的驱动开发

找不到工作的测试员一大把，大厂却招不到优秀软件测试员？高薪难寻测试工程师。

buuctf Basic

赛狐ERP|亚马逊产品缺货怎么办？该如何补救？

《Elasticsearch源码解读与优化实战》张超-读书笔记

编码踩坑——运行时报错java.lang.NoSuchMethodError / 同名类加载问题 / 双亲委派【建议收藏】

软件测试选Python还是Java？

“2023数据安全智能化中国行”活动，开幕即高能

机器人操作规划——Deep Visual Foresight for Planning Robot Motion（2017 ICRA）

go 连接redis集群

LeetCode 146. LRU 缓存

【mac】在m2 mbp上通过Parallels Desktop安装ubuntu22.04

C++类和对象,初见类

Redis常用数据结构及应用场景

C++虚继承内存布局

IO模型--从BIO、NIO、AIO到内核select、poll、epoll剖析

Zebec完成BNB Chain以及Near链上协议部署，多链化进程加速

wpscan常见的使用方法

Tree 底层源码实现（二叉树、递归、迭代）

Linux链表操作全解析

树莓派超全系列教程文档--(62)使用rpicam-app通过网络流式传输视频

DeepSeek 赋能智慧能源：微电网优化调度的智能革新路径

线程与协程

FastAPI 教程：从入门到实践

YSYX学习记录（八）

家政维修平台实战20：权限设计

转转集团旗下首家二手多品类循环仓店“超级转转”开业

将对透视变换后的图像使用Otsu进行阈值化，来分离黑色和白色像素。这句话中的Otsu是什么意思？

【HTML-16】深入理解HTML中的块元素与行内元素