当前位置: 首页 > news >正文

darknet yolo标注、训练详细说明

文章目录

  • 1、标注数据
    • 1.1、标注
    • 1.2、生成训练列表文件train.txt
    • 1.3、转换数据标注格式
  • 2、训练数据整理
    • 2.1、修改train.txt路径
    • 2.2、修改yolov3.cfg
    • 2.3、obj.name和obj.data
    • 2.4、训练脚本文件trian.sh
    • 2.5、测试脚本文件test.sh
  • 3、训练

本文对应的脚本文件和程序下载链接 darkent yolo自定义数据标注训练全流程说明示例,也可发私信获取。

1、标注数据

使用labelImg.exe工具对数据进行标注,默认使用voc的数据集格式,之后使用脚本转换为yolo专用的数据格式,并且生成一些训练依赖的准备数据。
在这里插入图片描述

准备工作:

  • (1)执行脚本 0——清理train文件下的img、xml、txt文件文件 ,将上次训练的所有数据删除(需要的话进行备份)
  • (2)复制训练图片到 train/JPEGImages 目录下 (图片过大建议等比缩放到1080以下)

exe和train的目录结构
在这里插入图片描述在这里插入图片描述

1.1、标注

使用脚本 1——LabelImg.cmd 打开工具,
按钮 Open Dir 选择待标注的图片数据目录 这里为 to_path/train/JPEGImages
按钮 Change Save Dir,选择存放标注文件xml目录,to_path/train/Annotations
在这里插入图片描述

加载图片之后,点击 Edit label按钮 标注目标的类别标签
在这里插入图片描述
按键 a 、d 切换图片, 按键 w 开始绘制标准框, ctrl+s 保存当前标注图片数据。

详细参考互联网内容,搜索 yolov3标注自定义数据。标注完成后,目录下train/Annotations会得到每一张图片对应的的xml标注文件,
在这里插入图片描述在这里插入图片描述

1.2、生成训练列表文件train.txt

训练需要给出所有图片的绝对地址,这里注意,标注机器可能和后期训练不在一个机器,路径会变化,后期根据实际路径进行批量修改替换。

执行脚本 2——Label_generate_traintxt.cmd 即可,会在当前目录生成train.txt文件。如下
在这里插入图片描述
红框目录可能变化,可以通过修改脚本的参数,自动生成
在这里插入图片描述

1.3、转换数据标注格式

先修改脚本文件 exe/label_conver_voc_2_yolo.py 中的classes 列表为标注工具中的标签名,例如有4个标签 car,huoche,guache和keche,那么将之前行用#注释,修改如下图。
在这里插入图片描述

修改后保存之后,执行脚本 3——Label_conver_voc_2_yolo.cmd ,之后可以在目录 train\labels看到txt格式的标注文件
在这里插入图片描述
在这里插入图片描述
格式为 标签序号 x y w h :这里标签序号从0开始,值为python脚本中 classes 列表的下标;位置为相对图像宽高尺寸的百分比例。

这里实际是通过标注文件目录下train/Annotations的xml文件转换得到,一一对应(txt,xml,图片都要一一对应)。

可能出现的问题:

  • LabelImage.exe标注得到的xml文件中图像宽高尺寸为0,导致txt转换错误,训练时报错。脚本使用PIL库增加验证修复环节,保证转换正确无误。

    在这里插入图片描述
  • 提示标签不存在:因为标注时lable输入错误,和脚本中的classes列表元素不一致

2、训练数据整理

在训练机器上的训练工具目录darknet下,拷贝标注文件目录train和列表文件train.txt新建训练目录如data-vehicle-0926-772,这里的目录结构如下
在这里插入图片描述在这里插入图片描述

2.1、修改train.txt路径

修改图片列表文件路径的真实路径,前面 1.2、 生成训练列表文件train.txt 已经说明。注意要换行格式,要求unix、utf8格,否可能在训练出错、但会提示STB类似错误。

2.2、修改yolov3.cfg

从darknet目录复制一份原始yolov3.cfg文件到当前训练目录。修改地方有两快

  • (1) 修改网络结构参数

    找到cfg文件中的 所有[yolo]标签段(共3个),修改红框中的数据
    在这里插入图片描述
    classes修改为标注时的类别数量,例如4类,filters修改 (类别数+5)*3,这里就修改为(4+5)*3 = 27。(后期其他类别对应修改即可)
    注意,一共是修改3组数据。

  • (2) 修改训练参数

    这里参数比较专业,在大量数据训练时,需要不断调参设计。当前我们使用默认设计。训练时使用 batch=64, subdivision=16,如果机器GPU性能好显存足够,可以将subdivision降低为8、4、2等(3090可以修改为2)。
    在这里插入图片描述

2.3、obj.name和obj.data

照着修改即可
在这里插入图片描述

2.4、训练脚本文件trian.sh

脚本内容为

cd ..
./darknet detector train data-vehicle-0926-772/obj.data data-vehicle-0926-772/yolov3.cfg /yolov3.cfg darknet53.conv.74 -i 0 -clear

例如机器上已有的脚本文件为
在这里插入图片描述

2.5、测试脚本文件test.sh

(训练完成后进行)使用训练的指定模型文件对图片进行测试,并生成结果图片。
例如在服务器的darknet目录下执行

./darknet detector test car-0612-400/obj.data car-0612-400/yolov3-tiny.cfg car-0612-400/weights/yolov3-tiny_best.weights  -i 0 -thresh 0.25 ./car-0612-400/train/JPEGImages/11.jpg -ext_output

控制台会打印检测的结果,运行完成后,会生成一个 predictions.jpg 的文件,
在这里插入图片描述

3、训练

训练数据目录下,执行train.sh训练脚本即可,根据控制台训练数据输入检查是否存在错误,进行针对性调整。
正式训练时,后台执行,使用 命令 nohup train.sh & 即可, 生成nohup.out 的训练日志。

在这里插入图片描述
训练中间的输出,关注中间的 avg loss,直观上一般越低越好。
在这里插入图片描述
后面可以使用脚本drawLossPlot.py绘制loss(train)曲线
在这里插入图片描述

相关文章:

darknet yolo标注、训练详细说明

文章目录 1、标注数据1.1、标注1.2、生成训练列表文件train.txt1.3、转换数据标注格式 2、训练数据整理2.1、修改train.txt路径2.2、修改yolov3.cfg2.3、obj.name和obj.data2.4、训练脚本文件trian.sh2.5、测试脚本文件test.sh 3、训练 本文对应的脚本文件和程序下载链接 darke…...

chatgpt赋能python:Python如何产生随机整数?

Python如何产生随机整数? Python是一种高级编程语言。它允许程序员轻松地创建各种类型的应用程序,包括生成随机整数。本文将介绍如何在Python中使用内置的随机数函数来生成随机整数。 random模块 Python中的random模块提供了生成随机数的函数。这些函…...

大话Stable-Diffusion-Webui-客制化主题(四)

文章目录 目标效果开始重要说明单选框以及复选框图标样式更改gradio主题构建器上传主题方式代码上传主题方式目标 在DIY的主题中更改gradio单选框组件以及复选框组件的勾选后图标样式 效果 开始 笔者在使用gradio的主题构建器的过程中发现,gradio的复选框以及单选框组件勾选…...

Excel函数VLOOKUP常用方法

一、基础用法 1、精确匹配 公式:VLOOKUP(待匹配值,查找范围,范围列数,查找方式) 定义好要输出表的表头和第一列,第一列即为要查找和匹配的父内容,在第二列输入公式,被查找表中一定也要将待查…...

systemV的工作原理+原理代码

概念 我们知道进程间的通信有管道的方式进程通信管道制作_云的小站的博客-CSDN博客 但是我们的管道通信其实属于一种取巧的方式,利用了打开的文件可读写的特性上,两个进程对此分别进行读写操作就会产生所谓的通信现象,但是外面的管道依旧得…...

Kubeflow--TFJob实现机制学习

2023暑期学习 TF Job实际场景应用Vertex AI TF Job 链接 https://www.kubeflow.org/docs/components/training/tftraining/ https://developer.aliyun.com/article/601779 TFJob实际上遵循Kubernetes标准的API定义. TFJob 对象 apiVersion --> string --> api版本&…...

百度出品,Nature重磅 -- 优化的mRNA设计算法可改善mRNA的稳定性和免疫原性

摘要 尽管mRNA疫苗已用于COVID-19的预防,但仍然面临不稳定和易降解的风险,这是mRNA疫苗存储、配送、效价等面临的重要障碍。先前的研究已表明,增加二级结构可延长mRNA的半衰期,再加上选择优化的密码子,可改善蛋白表达。…...

CKA 01_docker部署Kubernetes 部署docker 使用kubeadm引导集群 安装Pod网络

文章目录 1. 虚拟机步骤2. Docker 部署 Kubernetes2.1 部署 docker2.1.1 环境要求2.1.2 安装 docker 引擎2.1.3 worker 节点对 master 节点免密2.1.4 设定 docker 开机自启2.1.5 打开桥接,查看桥接流量2.1.6 设定 systemd 方式管理 cgroup2.1.7 docker部署完成2.1.8…...

Redis的使用规范小建议

Redis 核心技术与实战 笔记 作者: 蒋德钧 毕竟,高性能和节省内存,是我们的两个目标,只有规范地使用Redis,才能真正实现这两个目标。如果说之前的内容教会了你怎么用,那么今天的内容,就是帮助你用…...

操作受限的线性表——栈

本文主要内容:本文主要讲解栈的基本概念、基本操作和栈的顺序、链式实现。 目录 栈一、栈的基本概念1、基本概念2、基本操作 二、栈的顺序存储结构1、顺序栈的实现2、顺序栈的基本运算1)初始化2)判栈空3)进栈4)出栈5&a…...

C++基类指针或引用指向或引用派生类对象(实现动态多态四种手段)父类指针访问子类成员变量(需要dynamic_cast)

文章目录 背景多态示例:父类指针指向子类对象父类指针指向子类对象,如何通过父类指针访问到子类特定的成员变量实现动态多态的四种手段:基类的指针或引用指向或引用一个派生类对象(new或不new) 背景 比如有父类Animal…...

WTM框架运行报错0308010C:digital envelope routines::unsupported

WTM框架运行报错0308010C:digital envelope routines::unsupported 错误描述报错原因解决方式 错误描述 我所使用WTM搭建的程序是选择的.net5.0Vue前后端分离的方式,项目结构选择的是“各层分离的多个项目”;本人并非初次使用WTM平台框架搭建项目&#…...

(二)CSharp-索引器

1、索引器定义 什么是索引器 索引器(indexer)是这样一种成员:它使对象能够用与数组相同的方式(即使用下标)进行索引 索引器的声明参见 C# 语言定义文档注意:没有静态索引器 索引器是一组 get 和 set 访问…...

配合AI刷leetcode 实现1170

题目如下: 1170. 比较字符串最小字母出现频次 难度中等 75 定义一个函数 f(s),统计 s 中(按字典序比较)最小字母的出现频次 ,其中 s 是一个非空字符串。 例如,若 s "dcce",那么…...

English Learning - L3 作业打卡 Lesson5 Day36 2023.6.9 周五

English Learning - L3 作业打卡 Lesson5 Day36 2023.6.9 周五 引言🍉句1: So next time you are on a train, look around and see what other people are reading, but dont jump to any conclusions.成分划分弱读连读爆破语调 🍉句2: You will probab…...

前端框架笔记

Vue.js的安装 安装Vue.js有两种方法&#xff1a; &#xff08;1&#xff09;类似于Bootstrap或jQuery&#xff0c;直接通过HTML文件中的标签引用。为了方便开发者使用&#xff0c;Vue.js提供了相关的CDN&#xff0c;通过如下代码可以引用最新版本的Vue.js&#xff1a; <sc…...

详细设计文档

1. 引言 1.1 目的 1.2 范围 1.3 定义、缩略语和缩写 1.4 参考文献 1.5 概述 2. 系统架构设计 2.1 总体架构 2.2 模块划分 2.3 数据流程设计 2.4 接口设计 3. 模块详细设计 3.1 登录模块详细设计 3.1.1 类设计 3.1.2 方法设计 3.1.3 数据库表设计 3.1.4 界面设计 3.2 文章管理模…...

Java011——Java数据类型转换(基本数据类型)

回顾&#xff1a;Java八大基本数据类型 大类 类型名称 关键字 占用内存 取值范围 --------------------------------------------------------------------------------------------|字节型 byte 1 字节 -128~127 整型 |短整型 short 2 字节 -32768~32…...

mybatis-plus用法(二)

(5条消息) mybatis-plus用法&#xff08;一&#xff09;_渣娃工程师的博客-CSDN博客 AR模式 ActiveRecord模式&#xff0c;通过操作实体对象&#xff0c;直接操作数据库表。与ORM有点类似。 示例如下 让实体类User继承自Model package com.example.mp.po; import com.bao…...

SQL笔记-存储过程+循环

存储过程循环使用方法 Oracle Oracle中存储过程的循环使用方法如下&#xff1a; DECLAREi NUMBER; BEGINi : 1;WHILE i < 10 LOOPDBMS_OUTPUT.PUT_LINE(i || i);i : i 1;END LOOP; END;其中&#xff0c;DECLARE用于声明变量&#xff0c;BEGIN和END用于标识存储过程的开始…...

初创团队如何借助Taotoken统一管理AI模型调用与成本

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 初创团队如何借助Taotoken统一管理AI模型调用与成本 对于资源有限的初创技术团队而言&#xff0c;在产品中集成人工智能功能已成为…...

2026论文降AI实战SOP:保留排版格式,8款工具与结构级优化指南

内容ai率检测数值太高&#xff0c;不得不熬夜改了一遍又一遍&#xff0c;润色到想吐&#xff0c;结果检测报告上数字还是不尽人意&#xff0c;截止日期越逼越近&#xff0c;真的是没办法了。 我花了整整三天&#xff0c;把2026全网热门的几十款降AI工具通通测了个遍&#xff0…...

大模型对话的端到端加密与隐私计算实战:基于CipherChat与TEE的架构解析

1. 项目概述&#xff1a;当大模型对话遇上“密码学”的硬核保护最近在折腾大语言模型&#xff08;LLM&#xff09;应用落地的朋友&#xff0c;估计都绕不开一个核心痛点&#xff1a;安全与隐私。无论是企业内部的知识库问答&#xff0c;还是面向用户的个性化AI助手&#xff0c;…...

计算机视觉工程师的周度技术雷达:从论文到产线的工程化筛选方法

1. 这不是一份“论文清单”&#xff0c;而是一份计算机视觉从业者的周度技术雷达 如果你每天刷arXiv、看CVPR会议摘要、追GitHub trending&#xff0c;却总在“读完就忘”和“知道很重要但不知从何下手”之间反复横跳——那你不是一个人。我做CV方向的工程落地和算法选型已经十…...

WarcraftHelper 2024:魔兽争霸3终极优化指南

WarcraftHelper 2024&#xff1a;魔兽争霸3终极优化指南 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 还在为《魔兽争霸3》在现代电脑上运行卡顿、画…...

5个简单步骤:用DXVK在Linux上流畅运行Windows游戏

5个简单步骤&#xff1a;用DXVK在Linux上流畅运行Windows游戏 【免费下载链接】dxvk Vulkan-based implementation of D3D8, 9, 10 and 11 for Linux / Wine 项目地址: https://gitcode.com/gh_mirrors/dx/dxvk 你是否曾经想在Linux系统上玩Windows游戏&#xff0c;却被…...

基于堆叠自编码器与LSTM的金融时间序列预测框架解析

1. 项目概述&#xff1a;一个基于多层神经网络的股票回报预测框架如果你对量化交易和机器学习结合感兴趣&#xff0c;并且已经厌倦了那些简单的线性回归或者单层LSTM模型&#xff0c;那么这个名为AIAlpha的项目可能会让你眼前一亮。它不是一个“即插即用”的盈利策略&#xff0…...

10分钟搞定:XUnity.AutoTranslator游戏翻译插件终极使用指南

10分钟搞定&#xff1a;XUnity.AutoTranslator游戏翻译插件终极使用指南 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 还在为外语游戏看不懂而烦恼吗&#xff1f;XUnity.AutoTranslator正是你需要的游戏…...

MCA Selector终极指南:Minecraft世界区块管理的核心技术解析与实战应用

MCA Selector终极指南&#xff1a;Minecraft世界区块管理的核心技术解析与实战应用 【免费下载链接】mcaselector A tool to select chunks from Minecraft worlds for deletion or export. 项目地址: https://gitcode.com/gh_mirrors/mc/mcaselector MCA Selector是一款…...

主动悬架乘坐舒适性控制策略优化【附模型】

✨ 长期致力于随机路面、主动悬架、乘坐舒适性、控制策略、仿真分析研究工作&#xff0c;擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅如需沟通交流&#xff0c;点击《获取方式》 &#xff08;1&#xff09;随机路面与1/4悬架动力学建模&…...