当前位置: 首页 > article >正文

保姆级教程:在Ubuntu 20.04上用YOLOv5 v6.2训练你自己的COCO数据集(附完整数据准备流程)

在Ubuntu 20.04上从零构建YOLOv5 v6.2自定义训练环境的完整指南当你想在本地工作站或云服务器上训练自己的目标检测模型时YOLOv5无疑是最受欢迎的选择之一。但许多教程都假设你已经熟悉了Linux环境配置、数据集处理等前置知识这让不少初学者在第一步就卡住了。本文将彻底解决这个问题——从Ubuntu系统的基础环境配置开始到最终成功启动训练每个步骤都会详细说明背后的原理和实际操作的细节。1. 系统环境准备与依赖安装在开始之前确保你的Ubuntu 20.04系统已经更新到最新状态。打开终端并执行sudo apt update sudo apt upgrade -y1.1 显卡驱动与CUDA安装YOLOv5训练需要NVIDIA显卡和CUDA支持。首先检查你的显卡型号和驱动版本nvidia-smi如果未安装驱动推荐使用官方PPA仓库安装sudo add-apt-repository ppa:graphics-drivers/ppa sudo apt install nvidia-driver-510安装完成后重启系统。接下来安装CUDA 11.3与PyTorch稳定版兼容wget https://developer.download.nvidia.com/compute/cuda/11.3.1/local_installers/cuda_11.3.1_465.19.01_linux.run sudo sh cuda_11.3.1_465.19.01_linux.run注意安装过程中不要勾选驱动安装选项因为我们已单独安装驱动1.2 Conda环境配置为避免依赖冲突我们使用Miniconda创建独立环境wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh bash Miniconda3-latest-Linux-x86_64.sh创建并激活Python 3.8环境conda create -n yolov5 python3.8 conda activate yolov52. COCO数据集的自定义路径管理大多数教程直接使用默认路径但在实际项目中我们往往需要将数据放在特定位置。下面展示如何完全自定义数据存储结构。2.1 数据集下载与重组首先创建项目目录结构~/yolov5_project/ ├── datasets/ │ └── coco/ │ ├── images/ │ │ ├── train2017/ │ │ └── val2017/ │ └── labels/ │ ├── train2017/ │ └── val2017/ ├── yolov5/ └── weights/下载COCO数据集到指定位置mkdir -p ~/yolov5_project/datasets/coco cd ~/yolov5_project/datasets/coco wget http://images.cocodataset.org/zips/train2017.zip wget http://images.cocodataset.org/zips/val2017.zip unzip train2017.zip -d images/ unzip val2017.zip -d images/2.2 标签文件处理YOLOv5需要特定格式的标签文件。使用以下脚本转换官方标注from pycocotools.coco import COCO import os def convert_coco_to_yolo(coco_json, output_dir): coco COCO(coco_json) os.makedirs(output_dir, exist_okTrue) for img_id in coco.imgs: ann_ids coco.getAnnIds(imgIdsimg_id) anns coco.loadAnns(ann_ids) img_info coco.loadImgs(img_id)[0] img_w, img_h img_info[width], img_info[height] with open(f{output_dir}/{img_id:012d}.txt, w) as f: for ann in anns: x, y, w, h ann[bbox] x_center (x w/2) / img_w y_center (y h/2) / img_h w_norm w / img_w h_norm h / img_h f.write(f{ann[category_id]} {x_center} {y_center} {w_norm} {h_norm}\n)3. YOLOv5项目配置与自定义克隆最新版YOLOv5仓库并安装依赖cd ~/yolov5_project git clone https://github.com/ultralytics/yolov5 cd yolov5 pip install -r requirements.txt3.1 自定义数据配置文件修改data/coco.yaml适配我们的路径结构# COCO 2017 dataset http://cocodataset.org # Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..] path: ~/yolov5_project/datasets/coco train: images/train2017 val: images/val2017 test: # Classes names: 0: person 1: bicycle # ...完整类别列表3.2 模型配置选择YOLOv5提供多种预定义模型尺寸模型参数量(M)推理时间(ms)mAP0.5YOLOv5n1.96.328.0YOLOv5s7.26.437.4YOLOv5m21.28.245.4YOLOv5l46.510.149.0YOLOv5x86.712.150.7对于初次训练建议从YOLOv5s开始python train.py --data coco.yaml --cfg yolov5s.yaml --weights --batch-size 32 --epochs 100 --img 6404. 训练优化与问题排查4.1 多GPU训练配置如果你有多个GPU可以通过以下方式加速训练python train.py --data coco.yaml --cfg yolov5l.yaml --weights --batch-size 64 --device 0,1 --epochs 300 --img 640提示batch-size需要根据GPU内存调整。RTX 3090(24GB)通常可以支持batch-size644.2 常见错误解决方案CUDA内存不足减小batch-size或使用更小的模型标签文件缺失检查路径是否正确确保每个图像都有对应的.txt标签文件训练指标不更新检查学习率设置尝试使用预训练权重4.3 训练监控与可视化YOLOv5会自动生成训练日志可以通过TensorBoard查看tensorboard --logdir runs/train关键监控指标包括损失函数变化box_loss, obj_loss, cls_loss验证集mAP学习率变化曲线5. 模型评估与导出训练完成后使用以下命令评估模型性能python val.py --data coco.yaml --weights runs/train/exp/weights/best.pt --img 640导出为ONNX格式以便部署python export.py --weights runs/train/exp/weights/best.pt --include onnx在实际项目中我发现合理设置超参数可以显著提升模型性能。例如调整学习率调度策略# yolov5s.yaml lr0: 0.01 # 初始学习率 lrf: 0.2 # 最终学习率 lr0 * lrf momentum: 0.937 weight_decay: 0.0005 warmup_epochs: 3.0 warmup_momentum: 0.8 warmup_bias_lr: 0.1

相关文章:

保姆级教程:在Ubuntu 20.04上用YOLOv5 v6.2训练你自己的COCO数据集(附完整数据准备流程)

在Ubuntu 20.04上从零构建YOLOv5 v6.2自定义训练环境的完整指南 当你想在本地工作站或云服务器上训练自己的目标检测模型时,YOLOv5无疑是最受欢迎的选择之一。但许多教程都假设你已经熟悉了Linux环境配置、数据集处理等前置知识,这让不少初学者在第一步…...

别再手动调参了!用Python+OpenCV玩转NCC立体匹配,手把手教你生成高质量视差图

PythonOpenCV实战:NCC立体匹配参数调优全指南 立体匹配是计算机视觉中获取深度信息的关键技术,而NCC(归一化互相关)作为经典的灰度匹配算法,在实际项目中既简单又实用。但很多开发者在使用时往往陷入手动调参的困境—…...

从NOI真题到算法思维:向量叉积在计算几何中的实战解析

1. 向量叉积:从数学公式到代码实现 第一次接触NOI真题中计算三角形面积的题目时,我被那个看似复杂的向量叉积公式吓了一跳。但当我真正理解它的原理后,才发现这简直是计算几何中的"瑞士军刀"。让我们从一个具体的例子开始&#xff…...

终极跨平台桌面待办工具:My-TODOs如何重塑你的任务管理体验

终极跨平台桌面待办工具:My-TODOs如何重塑你的任务管理体验 【免费下载链接】My-TODOs A cross-platform desktop To-Do list. 跨平台桌面待办小工具 项目地址: https://gitcode.com/gh_mirrors/my/My-TODOs 你是否厌倦了复杂的任务管理软件?是否…...

如何快速解决Visual C++运行库安装问题:终极一站式解决方案指南

如何快速解决Visual C运行库安装问题:终极一站式解决方案指南 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 你是否曾经遇到过应用程序无法启动&…...

ARM-MPU实战:从寄存器配置到内存安全防护

1. ARM-MPU基础概念与核心价值 第一次接触ARM-MPU时,我盯着开发板反复确认了三遍接线——明明程序逻辑完全正确,却总是莫名其妙进入HardFault中断。后来才发现是某个野指针改写了关键数据区,这种隐蔽的错误让我意识到内存保护的重要性。ARM-M…...

如何在JavaScript中快速生成专业的PowerPoint演示文稿

如何在JavaScript中快速生成专业的PowerPoint演示文稿 【免费下载链接】PptxGenJS Build PowerPoint presentations with JavaScript. Works with Node, React, web browsers, and more. 项目地址: https://gitcode.com/gh_mirrors/pp/PptxGenJS PptxGenJS是一个功能强大…...

深度实战:如何用League Akari将英雄联盟游戏效率提升300%的终极秘籍

深度实战:如何用League Akari将英雄联盟游戏效率提升300%的终极秘籍 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 你是否经历过在…...

别再轮询了!用STM32外部中断(EXTI)实现按键响应,效率提升不止一点点

STM32外部中断实战:从轮询到事件驱动的效率革命 刚接触STM32开发的工程师,往往会在按键检测这类基础功能上陷入"轮询陷阱"——用while循环不断检查GPIO状态,搭配delay_ms函数试图消除抖动。这种模式在51单片机时代或许可行&#x…...

SignalTap调试进阶:巧用约束与别名捕获FPGA优化后的关键信号

1. 为什么优化后的信号会"消失"? 很多FPGA工程师都遇到过这样的场景:明明在代码里明确定义了reg和wire信号,但在SignalTap里死活找不到它们的身影。这其实不是工具出了问题,而是Quartus的综合优化在"作怪"。…...

还在手动整理ai会议纪要浪费宝贵下班时间?2026年这4款真香AI工具3分钟搞定3小时会议

作为挖了快三年AI效率工具的爱好者,我上周刚被3小时项目复盘会的纪要搞到加班到九点,试了一圈新出的工具,直接给大家上结论:听脑AI是目前同类会议纪要工具里最值得用的,没有之一。 直达链接:https://iting…...

Python实战:三大曲线平滑技术对比与场景选型指南

1. 曲线平滑处理的必要性 当你处理传感器数据、金融时间序列或任何带有噪声的曲线时,原始数据往往像一条暴躁的蚯蚓——上下乱窜让人抓狂。我在处理工业传感器数据时就遇到过这种情况:一条本该平滑的温度曲线,因为电磁干扰变成了"心电图…...

告别手机外放‘破音’:深入拆解SmartPA技术如何拯救MTK平台的音频体验

告别手机外放‘破音’:深入拆解SmartPA技术如何拯救MTK平台的音频体验 你是否曾在用手机外放音乐时,遇到音量调大就出现刺耳破音的情况?或是发现低音部分总是软弱无力,完全没有沉浸感?这些问题在采用MTK平台的手机中尤…...

完整指南:3分钟解锁你的加密音乐文件

完整指南:3分钟解锁你的加密音乐文件 【免费下载链接】qmc-decoder Fastest & best convert qmc 2 mp3 | flac tools 项目地址: https://gitcode.com/gh_mirrors/qm/qmc-decoder 你是否曾经遇到过这样的情况:从音乐平台下载的歌曲只能在特定应…...

从编码器线数到电子齿轮比:一份给PLC编程员的伺服电机脉冲计算避坑指南

从编码器线数到电子齿轮比:PLC工程师的伺服电机脉冲计算实战手册 在工业自动化领域,伺服系统的精确定位控制一直是工程师面临的核心挑战。当机械臂需要以0.001mm的精度进行装配,或是数控机床要完成微米级的切削时,脉冲计算的准确…...

如何快速解锁中兴光猫:zteOnu工具的完整指南

如何快速解锁中兴光猫:zteOnu工具的完整指南 【免费下载链接】zteOnu A tool that can open ZTE onu device factory mode 项目地址: https://gitcode.com/gh_mirrors/zt/zteOnu 中兴光猫工厂模式解锁神器zteOnu是一款专为网络爱好者设计的开源工具&#xff…...

保姆级教程:在银河麒麟V10上为gcc编译的程序添加可执行权限(附kysec_set命令详解)

银河麒麟V10系统下gcc编译程序执行权限问题全解析 在银河麒麟V10操作系统中,许多开发者首次使用gcc编译程序后,会遇到一个看似简单却令人困惑的问题:明明已经为生成的可执行文件添加了传统Linux权限(如chmod x)&#…...

开源图表实时编辑器:从代码到可视化的无缝创作解决方案

开源图表实时编辑器:从代码到可视化的无缝创作解决方案 【免费下载链接】mermaid-live-editor Edit, preview and share mermaid charts/diagrams. New implementation of the live editor. 项目地址: https://gitcode.com/GitHub_Trending/me/mermaid-live-edito…...

如何用5分钟彻底解决Mac菜单栏混乱?Ice菜单栏管理工具终极指南

如何用5分钟彻底解决Mac菜单栏混乱?Ice菜单栏管理工具终极指南 【免费下载链接】Ice Powerful menu bar manager for macOS 项目地址: https://gitcode.com/GitHub_Trending/ice/Ice 你是否曾盯着Mac屏幕顶部那密密麻麻的图标海洋感到无力?Wi-Fi图…...

保姆级教程:SAP S/4HANA数据迁移,用LTMC从零导入会计科目(附模板避坑指南)

SAP S/4HANA会计科目迁移实战:LTMC工具全流程详解与避坑手册 当企业首次部署SAP S/4HANA时,会计科目主数据的迁移往往是财务模块实施的关键第一步。不同于传统ECC系统,S/4HANA的简化数据模型对会计科目结构提出了新要求,而Migrati…...

从IEEE 1588到EtherCAT DC:深入对比两种工业网络时间同步协议的核心差异与应用选型

工业网络时间同步技术深度解析:EtherCAT DC与IEEE 1588的实战选型指南 在智能制造和自动化控制领域,毫秒级的响应时间早已成为过去式。现代工业网络对时间同步精度的要求已经进入纳秒时代——这相当于光在真空中仅能传播30厘米的时间跨度。当多个伺服电…...

从Arduino到STM32:GRBL固件选型、下载与刷写全攻略(2024版)

从Arduino到STM32:2024年GRBL固件选型与刷写实战指南 在DIY激光雕刻机和CNC设备的构建过程中,控制器的选择与GRBL固件的配置往往是决定项目成败的关键环节。面对市场上琳琅满目的硬件平台——从经典的Arduino Uno到性能更强的STM32系列开发板&#xff0…...

HS2-HF_Patch终极指南:一站式汉化与功能增强解决方案

HS2-HF_Patch终极指南:一站式汉化与功能增强解决方案 【免费下载链接】HS2-HF_Patch Automatically translate, uncensor and update HoneySelect2! 项目地址: https://gitcode.com/gh_mirrors/hs/HS2-HF_Patch HS2-HF_Patch是《Honey Select 2》玩家的终极解…...

3分钟掌握B站缓存转换:开源m4s-converter工具全攻略

3分钟掌握B站缓存转换:开源m4s-converter工具全攻略 【免费下载链接】m4s-converter 一个跨平台小工具,将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter 还在为B站下架视频而烦恼吗&…...

Windows触控板手势定制终极指南:3个技巧实现高效三指拖拽优化

Windows触控板手势定制终极指南:3个技巧实现高效三指拖拽优化 【免费下载链接】ThreeFingersDragOnWindows Enables macOS-style three-finger dragging functionality on Windows Precision touchpads. 项目地址: https://gitcode.com/gh_mirrors/th/ThreeFinger…...

MLC LLM:大语言模型通用编译部署实战指南

1. 项目概述:当大语言模型遇见“通用编译” 最近几个月,我身边不少做AI应用和部署的朋友都在讨论一个词: MLC LLM 。这可不是一个新的大模型,而是一个旨在解决大语言模型(LLM)部署“最后一公里”问题的开…...

手把手教你用Matlab R2018a为TI C2000 DSP安装Embedded Coder支持包(含账户与版本避坑)

从零搭建Matlab与TI C2000 DSP的嵌入式开发环境:避坑指南与实战解析 当Matlab R2018a遇上TI C2000系列DSP处理器,工程师们便获得了一个从算法设计到硬件部署的完整解决方案。不同于传统的CCS开发模式,这种基于模型的设计(Model-Ba…...

Simulink代码生成实战指南:从模型配置到嵌入式部署

1. Simulink代码生成的核心价值 第一次接触Simulink代码生成功能时,我完全被它的自动化程度震惊了。想象一下,你花了几个月精心设计的控制算法模型,只需要点几下鼠标就能变成可以直接烧录到ECU的C代码,这简直就像魔术一样。不过在…...

归并排序:分治思想的经典应用

归并排序一、核心原理分治思想分:把数组不断从中间拆成左右两半,直到每个子数组只剩 1 个元素(天然有序);治:把两个有序子数组 合并 成一个大的有序数组;递归向上合并,最终整个数组有…...

HoRain云--PHP包含文件全解析

🎬 HoRain 云小助手:个人主页 ⛺️生活的理想,就是为了理想的生活! ⛳️ 推荐 前些天发现了一个超棒的服务器购买网站,性价比超高,大内存超划算!忍不住分享一下给大家。点击跳转到网站。 目录 ⛳️ 推荐 …...