当前位置：首页 > news >正文

YOLOv5分割训练，从数据集标注到训练一条龙解决

news 2026/4/29 14:57:16

最近进行了分割标注，感觉非常好玩，也遇到了很多坑，来跟大家分享一下，老样子有问题评论区留言，我会的就会回答你。

第一步：准备数据集

1、安装标注软件labelme如果要在计算机视觉领域深入的同学，最好先下载好conda，主要作用是可以创建虚拟环境，在虚拟环境中配置python运行的包，避免不同软件运行所需环境相互影响出现未知bug。具体安装congda过程可以在CSDN搜索。conda安装完成后，打开conda创建虚拟环境，name为虚拟环境名称，3.8为要安装的python版本，这里推荐对各个包适配更好的3.8版本。

conda create --name=labelme python=3.8

安装完成后，使用conda activate labelme 进入创建好的虚拟环境,在安装labelme之前先切换pip下载源到国内下载源，我这里使用的清华源。

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

安装labelme

pip install labelme

安装完成后，输入labelme即可打开程序，如下图即为成功
labelme界面
点击上面OpenDir打开存放要标注的图片的文件夹，点击上面CreatePolygons即可进入标注，点击一下便是一个点，把你要进行分割的东西圈起来，就会弹出下面的框，输入你标注的名称。
labelme标注
标注完成后，将json文件和图片保存在一个文件夹内，使用下面脚本。

import json
import glob
import osimport cv2
import numpy as npjson_path = r"D:"; #此处填写存放json文件的地址
labels = ['1','2']#此处填写你标注的标签名称
json_files = glob.glob(json_path + "/*.json")for json_file in json_files:print(json_file)f = open(json_file)json_info = json.load(f)# print(json_info.keys())img = cv2.imread(os.path.join(json_path, json_info["imagePath"]))height, width, _ = img.shapenp_w_h = np.array([[width, height]], np.int32)txt_file = json_file.replace(".json", ".txt")f = open(txt_file, "a")for point_json in json_info["shapes"]:txt_content = ""np_points = np.array(point_json["points"], np.int32)norm_points = np_points / np_w_hnorm_points_list = norm_points.tolist()print()if point_json['label'] == labels[0]:txt_content += "0 " + " ".join([" ".join([str(cell[0]), str(cell[1])]) for cell in norm_points_list]) + "\n"elif point_json['label'] == labels[1]:txt_content += "1 " + " ".join([" ".join([str(cell[0]), str(cell[1])]) for cell in norm_points_list]) + "\n"f.write(txt_content)

使用上面脚本即可将json文件格式转为YOLO训练的txt格式，将图片和txt文件分别放入img文件夹和txt文件夹，使用以下脚本进行划分训练、测试集。

import os
import random
import shutilrootpath = r'D:\a/'#此处为img和txt文件夹存放位置，地址后面要有/结尾set1 = ['images','labels']
set2 = ['train','val']
for s1 in set1:if not os.path.exists(rootpath+s1):os.mkdir(rootpath+s1)for s2 in set2:if not os.path.exists(rootpath+s1+'/'+s2):os.mkdir(rootpath+s1+'/'+s2)# 这是原始图片路径
img_path = rootpath+'img'
# 这是生成的txt路径
txt_path = rootpath+'txt'
file_names = os.listdir(img_path)
l = 0.8
n = len(file_names)
train_files = random.sample(file_names, int(n*l))
for file in file_names:print(file)if not os.path.exists(txt_path+'/'+file[:-3]+'txt'):os.remove(img_path+'/'+file)print(file[:-3]+'txt,不存在')continueif file in train_files:shutil.copy(img_path+'/'+file,rootpath+'images/train/'+file)shutil.copy(txt_path+'/'+file[:-3]+'txt',rootpath+'labels/train/'+file[:-3]+'txt')else:shutil.copy(img_path+'/'+file,rootpath+'images/val/'+file)shutil.copy(txt_path+'/'+file[:-3]+'txt',rootpath+'labels/val/'+file[:-3]+'txt')
print('ok!!')
print(len(train_files))

划分好数据集后会出现下面两个文件夹。
训练文件夹
在YOLOv5文件夹的data文件夹内创建s-seg.yaml文件，将下面内容复制进去。

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: D:\a  # dataset root dir 
train : D:\a\images\train #此处填写上面划分好数据集的images文件夹下train
val: D:\a\images\val #此处填写上面划分好数据集的images文件夹下val# Classes
names : #此处为标签序号和标签名0: 11: 2

完成以上步骤即可进行第二步训练。

第二步：训练模型

打开YOLOv5文件夹内的segment文件夹中的train.py文件，从网上下载yolov5s-seg.pt文件放入该文件夹内，–data改为：

    parser.add_argument('--data', type=str, default=ROOT / 'data/s-seg.yaml', help='dataset.yaml path')

运行即可，训练出的模型在runs文件夹下train-seg文件夹下。

第三步：测试模型

打开YOLOv5文件夹内的segment文件夹中的predict.py文件，更改第243行附近的以下内容。
–weights是刚训练好的模型位置，是绝对路径
–source是要进行测试的图片位置，是绝对路径

    parser.add_argument('--weights', nargs='+', type=str, default=ROOT / r'd:\yolov5-master\runs\train-seg\exp\weights\best.pt', help='model path(s)')parser.add_argument('--source', type=str, default=ROOT / r'D:\test\tudi', help='file/dir/URL/glob/screen/0(webcam)')

测试完成的结果保存在runs文件夹内的predict-seg文件夹内，打开可以查看。

YOLOv5分割训练，从数据集标注到训练一条龙解决

第一步：准备数据集

第二步：训练模型

第三步：测试模型

相关文章：

YOLOv5分割训练，从数据集标注到训练一条龙解决

再添千万级罚单，某银行年内罚款过亿！金融行业合规问题亟待解决

配置Nginx服务器用于Web应用代理和SSL{仅配置文件}

【广州华锐互动】VR溺水预防教育：在虚拟世界中学会自救！

Si(111)衬底上脉冲激光沉积AlN外延薄膜的界面反应控制及其机理

基于Cortex®-M4F的TM4C123GH6NMRT7R 32位MCU，LM74900QRGERQ1、LM74930QRGERQ1汽车类理想二极管

苹果企业签名失败常见的问题

Jtti：Android alertdialog嵌套出错怎么解决

解锁word密码，忘记密码怎么办？

同为科技（TOWE）桌面PDU插排：一款可以DIY定制的“超级插座”

使用Java Servlet生成动态二维码

【已解决】微信小程序腾讯地图的map清除markers，setData将marker置空后，安卓和ios还会显示上次的内容的问题所在以及解决办法

弄懂Rust编程中的Trait

关于登山扣亚马逊\SHEIN出口合规标准ASTM F1774 指南解析

浅析ChatGPT中涉及到的几种技术点

Web实战：基于Django与Bootstrap的在线计算器

曲率半径的推导

0时区格林威治时间转换手机当地时间-Android

git-3

【python爬虫】scrapy在pycharm 调试

猫抓：为什么这个浏览器扩展能彻底改变你获取网络资源的方式？

避开FreeRTOS串口接收的坑：从‘二重指针’理解队列传递数据的本质

掌握AI写专著技巧，借助工具轻松生成20万字专业专著！

5分钟彻底修复Windows软件运行错误：VisualCppRedist AIO终极解决方案

3大核心功能+5步实战：DLSS Swapper终极性能优化指南

2026智造进化论：从人工排程到AI智能排产，制造业生产模式正在如何变革？实在Agent技术解决方案

知识库架构最易踩的坑：Claude 链路位置放错，全流程白忙活！

别再乱调了！手把手教你用万用表正确设置DCDC升压模块的恒流恒压（以400W 15A模块为例）

我把设备指纹生成逻辑拆开了：它到底凭什么区分不同设备？

Youtu-Parsing算法核心：Attention机制如何实现图文对齐与理解