当前位置: 首页 > article >正文

【无人售货柜・RK+YOLO】篇 3:手把手带飞!YOLO 商品识别环境搭建 + 训练全流程,一行行代码带敲

目录一、先给新手打个底训练需要什么硬件最低硬件要求二、第一步环境搭建新手避坑版照着做绝对不报错1. 安装 Python版本必须选对别装最新版2. 安装 PyTorchYOLO 训练的核心依赖1CPU 版本安装没有 NVIDIA 显卡的新手直接装这个2GPU 版本安装有 NVIDIA 显卡的新手装这个训练速度拉满3. 拉取 YOLOv5 官方源码1新手首选直接下载压缩包2有 Git 基础的朋友用 git clone4. 安装 YOLOv5 依赖库三、第二步修改数据集配置文件新手最容易改错的环节1. 复制模板配置文件2. 修改配置文件新手照着改就行四、第三步核心参数详解新手再也不瞎调参了核心参数大白话解释 售货柜场景最优值五、第四步启动训练一行命令搞定1. 启动训练命令2. 训练过程详解新手别慌六、第五步训练完成模型验证 效果可视化1. 模型验证看核心指标2. 效果可视化看实际识别效果最后说两句大家好我是黒漂技术佬。上一篇我们保姆级教大家做完了无人售货柜的商品数据集很多新手朋友已经把自己的数据集标完了就等着开训了。但是我太懂新手了到这一步大概率会遇到这些问题Python 环境怎么搭YOLO 源码怎么拉依赖装不上报错怎么办配置文件怎么改参数怎么调跟着网上的教程改结果一运行就报错根本跑不起来心态直接崩了。别慌今天这篇我一行行代码带你敲从环境搭建到模型训练、验证、可视化全流程无死角所有坑都给你提前踩平哪怕你是第一次接触 Python跟着走100% 能跑出自己的商品识别模型。一、先给新手打个底训练需要什么硬件很多新手问我佬我没有高端显卡能不能训 YOLO这里我先给你说清楚别到时候卡得动不了。最低硬件要求CPUi5 及以上AMD 同等性能内存16G 及以上低于 16G 很容易出现内存溢出报错显卡NVIDIA 显卡显存 4G 及以上首选有 GPU 训练速度能快 10 倍以上系统Windows10/11、Linux、MacOS 都可以教程以 Windows 为例其他系统通用【新手福音】如果你没有 NVIDIA 显卡用 CPU 也能训就是速度慢一点比如用 GPU 训 1 小时CPU 可能要训 10 小时但是完全能跑通新手练手完全够用。二、第一步环境搭建新手避坑版照着做绝对不报错很多新手第一步就栽在环境搭建上Python 版本装错了依赖装不上各种报错。今天我给你一套零报错的环境搭建流程严格按照步骤来绝对不会出问题。1. 安装 Python版本必须选对别装最新版【新手避坑红线】绝对不要装 Python3.11 及以上的版本YOLOv5 对高版本 Python 兼容性极差必踩坑我们选Python3.9这是目前兼容性最好、最稳的版本。安装步骤打开 Python 官网下载地址https://www.python.org/downloads/release/python-3913/往下滑找到 Windows 安装包64 位系统选Windows Installer (64-bit)32 位选 32 位的下载完成后打开安装包一定要勾选最下面的「Add Python 3.9 to PATH」这一步是关键不勾选后面必报错点击「Install Now」一键安装等待安装完成即可验证是否安装成功打开 cmd 命令行输入python -V如果输出Python 3.9.13就说明安装成功了。2. 安装 PyTorchYOLO 训练的核心依赖PyTorch 是 YOLO 的核心框架分 CPU 版本和 GPU 版本我分别给你讲安装方法。1CPU 版本安装没有 NVIDIA 显卡的新手直接装这个打开 cmd直接输入下面的命令回车运行一键安装bash运行pip install torch1.13.1 torchvision0.14.1 --index-url https://download.pytorch.org/whl/cpu2GPU 版本安装有 NVIDIA 显卡的新手装这个训练速度拉满先确认你的显卡装好了最新的显卡驱动然后打开 cmd输入nvidia-smi能输出显卡信息就说明驱动没问题。然后输入下面的命令一键安装 GPU 版本的 PyTorchbash运行pip install torch1.13.1 torchvision0.14.1 --index-url https://download.pytorch.org/whl/cu117验证是否安装成功打开 cmd输入python进入 Python 环境然后输入下面的代码python运行import torch print(torch.cuda.is_available())如果输出True就说明 GPU 版本安装成功了能正常用显卡训练了。3. 拉取 YOLOv5 官方源码我们上一篇已经定了用 YOLOv5s 版本这里直接拉取官方源码绝对不要用网上的魔改版本坑太多。两种方法新手选第一种就行1新手首选直接下载压缩包打开 YOLOv5 官方 GitHub 地址https://github.com/ultralytics/yolov5点击绿色的「Code」按钮然后点击「Download ZIP」下载源码压缩包下载完成后解压到你想放的文件夹路径不要有中文、空格比如D:\yolov5不然会报错2有 Git 基础的朋友用 git clone打开 cmd进入你想放源码的文件夹输入下面的命令bash运行git clone https://github.com/ultralytics/yolov5.git4. 安装 YOLOv5 依赖库源码解压完成后打开源码文件夹你会看到一个requirements.txt文件里面是 YOLOv5 需要的所有依赖库我们一键安装就行。步骤打开源码文件夹在地址栏输入cmd回车就能直接在这个文件夹打开 cmd 命令行非常方便在 cmd 里输入下面的命令回车运行一键安装所有依赖bash运行pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple这里加了清华源下载速度快不会出现超时报错新手一定要加上。等待安装完成没有报错你的 YOLO 训练环境就全部搭好了三、第二步修改数据集配置文件新手最容易改错的环节环境搭好了接下来就是把我们上一篇做好的数据集和 YOLOv5 关联起来核心就是修改数据集配置文件这一步很关键改错一个地方训练就会报错。1. 复制模板配置文件打开 YOLOv5 源码文件夹找到data文件夹里面有个coco128.yaml文件这是官方的模板配置文件我们复制一份改个名字比如shouhuogui.yaml专门用来放我们的售货柜数据集配置。2. 修改配置文件新手照着改就行用记事本或者 VSCode 打开我们刚复制的shouhuogui.yaml文件里面的内容全部删掉换成下面的内容我给你加了详细的注释你只需要改 3 个地方yaml# 售货柜商品数据集配置文件 # 1. 数据集根路径改成你自己的数据集文件夹的绝对路径 path: D:\dataset\shouhuogui # 这里改成你自己的数据集根路径 # 2. 训练集、验证集图片的相对路径不用改只要你的数据集结构和上一篇教的一样就行 train: images/train val: images/val # 3. 类别数量改成你自己的商品SKU数量比如你有10类商品就改成10 nc: 10 # 4. 类别名称改成你自己的商品类别名和标注的时候的类别顺序完全一致 names: [kele_1, xueli_2, kuangquanshui_3, shutiao_4, kele_lingdu_5, niunai_6, huaguocha_7, binggan_8, xiangchang_9, suliao_shui_10]【新手避坑红线】路径绝对不能有中文、空格不然会报错找不到图片类别数量nc必须和下面的names里的类别数量完全一致不然会报错类别名称的顺序必须和你标注的时候的顺序完全一致不然模型会把类别学错直接认错商品类别名称绝对不能用中文必须用英文 / 拼音不然会出现乱码报错改完之后保存文件数据集配置就完成了四、第三步核心参数详解新手再也不瞎调参了很多新手训练的时候只会无脑把 epoch 拉到 300batch_size 往满了怼结果训了三天三夜模型效果还贼差。今天我用大白话给你讲清楚 YOLO 训练的核心参数每个参数是什么意思售货柜场景该设多少新手直接抄作业就行。我们要改的是 YOLOv5 源码文件夹里的models文件夹下的yolov5s.yaml文件这是 YOLOv5s 的模型配置文件核心参数都在这里。核心参数大白话解释 售货柜场景最优值表格参数大白话解释新手最优值避坑提醒nc类别数量和数据集配置文件里的 nc 必须一致你的商品 SKU 数量必须和数据集配置文件完全一致不然必报错epochs训练轮数就是模型把整个数据集完整学多少遍100~200不是越大越好超过 200 很容易过拟合新手直接设 100 就行batch-size批次大小一次训练喂给模型多少张图显卡显存 4G 设 46G 设 88G 设 16CPU 设 2越大训练越快但是超了显存会报错报错了就往小调img-size训练图片的分辨率宽和高必须是 32 的倍数640售货柜场景 640 完全够用不用设太大不然训练速度巨慢lr0初始学习率模型学习的步长步长太大学不会步长太小学太慢0.01新手不要改默认值就好改了很容易出现训不收敛的问题weights预训练模型权重yolov5s.pt新手直接用官方预训练权重不用从 0 开始训速度快、效果好【新手必懂】预训练模型就是官方用 COCO 超大数据集提前训好的权重已经学会了识别物体的基础特征比如边缘、纹理、形状我们在这个基础上用自己的商品数据集微调就像一个已经学会认字的人你只需要教他认商品包装上的字就行比从 0 开始教快 10 倍效果还好。五、第四步启动训练一行命令搞定所有配置都改完了终于到了启动训练的环节非常简单只需要一行命令。1. 启动训练命令打开 YOLOv5 源码文件夹在地址栏输入cmd回车打开命令行输入下面的命令回车就启动训练了bash运行python train.py --img 640 --batch 8 --epochs 100 --data data/shouhuogui.yaml --weights yolov5s.pt --device 0我给你拆解一下这个命令的每个参数你对应自己的情况改--img 640训练分辨率和我们上面定的一致--batch 8批次大小根据你的显卡显存改显存不够就往小调--epochs 100训练轮数新手直接 100 就行--data data/shouhuogui.yaml我们的数据集配置文件路径如果你改了名字对应改过来--weights yolov5s.pt预训练权重官方会自动下载不用你手动下--device 0用第 0 号 GPU 训练如果你用 CPU 训练就改成--device cpu2. 训练过程详解新手别慌启动命令后会自动做这些事自动下载 yolov5s.pt 预训练权重不用你手动操作加载数据集检查数据集有没有问题有问题会直接报错提示开始训练每一轮都会输出训练损失、验证损失、mAP、召回率这些指标训练过程中会自动保存效果最好的权重保存在runs/train/exp/weights文件夹里有两个文件best.pt训练过程中效果最好的权重我们后续部署、优化就用这个last.pt最后一轮训练的权重用来中断续训【新手避坑】训练过程中不要关 cmd 窗口不要关机不然训练就中断了。如果不小心中断了想继续训只需要在命令里加上--resume runs/train/exp/weights/last.pt就能从上次中断的地方继续训不用从头开始。六、第五步训练完成模型验证 效果可视化训练完成后先别着急部署我们先验证一下模型的效果看看训出来的模型到底好不好用。1. 模型验证看核心指标训练完成后cmd 里会输出最终的 mAP、召回率这些核心指标我们重点看两个指标mAP0.5平均精度售货柜场景必须≥99%不然商用很容易认错商品Recall召回率必须≥99.5%不然会出现漏检用户拿了商品模型没认出来直接亏钱如果这两个指标都达标了说明你的模型训得非常好如果没达标下一篇我们会教你怎么优化。2. 效果可视化看实际识别效果我们用测试集的图片看看模型的实际识别效果只需要一行命令bash运行python detect.py --weights runs/train/exp/weights/best.pt --source dataset/images/test --img 640 --conf 0.5--weights我们训好的 best.pt 权重路径--source测试集图片的路径改成你自己的--conf 0.5置信度阈值只有置信度超过 50% 的识别结果才会显示运行完成后识别后的图片会保存在runs/detect/exp文件夹里打开就能看到模型已经把图片里的商品都框出来了标上了类别和置信度。到这里恭喜你你已经从零完成了 YOLO 商品识别模型的训练拥有了自己的第一个售货柜商品识别模型最后说两句很多新手总觉得 YOLO 训练很难其实只要你跟着步骤走把环境搭对配置文件改对命令输对就能轻松跑通。难的不是跑通训练是训出来的模型能在真实场景里好用。很多新手训完模型会遇到这些问题相似商品总是认错、小包装零食漏检、手遮挡就认不出来、暗光环境效果差放到真实售货柜里根本没法用。下一篇我们就针对无人售货柜场景的四大核心痛点给你一套可直接落地的 YOLO 模型优化技巧解决你 90% 的识别问题让你的模型从 demo 玩具变成真正能用的商用级模型。

相关文章:

【无人售货柜・RK+YOLO】篇 3:手把手带飞!YOLO 商品识别环境搭建 + 训练全流程,一行行代码带敲

目录 一、先给新手打个底:训练需要什么硬件? 最低硬件要求 二、第一步:环境搭建,新手避坑版,照着做绝对不报错 1. 安装 Python:版本必须选对,别装最新版 2. 安装 PyTorch:YOLO …...

扩散模型在轨迹预测中的5种实战应用:从Leapfrog到DiffTraj全解析

扩散模型在轨迹预测中的5种实战应用:从Leapfrog到DiffTraj全解析 在自动驾驶和机器人导航领域,轨迹预测一直是核心挑战之一。传统方法往往受限于确定性输出的局限,而扩散模型通过其独特的概率生成特性,为多模态轨迹预测开辟了新路…...

【无人售货柜・RK+YOLO】篇 2:90% 的新手都栽在这!无人售货柜商品识别数据集制作保姆级教程

目录 一、先搞懂核心:售货柜场景的数据集,到底要满足什么要求? 二、第一步:数据集采集,新手最容易踩坑的环节 1. 采集工具:必须和部署场景一致 2. 采集数量:到底要拍多少张图才够&#xff1…...

arxiv | 2025 | DuGI-MAE: Improving Infrared Mask Autoencoders via Dual-Domain Guidance

文章目录创新点贡献摘要及引言预备知识方法基于熵的掩码模块双域导向⾃适应频域调制(AFDM)频率引导注意力注入用于下游任务的DuGI-MAE实验红外目标检测红外语义分割红外小目标检测消融研究结论未来方向arxiv | 2025 | DuGI-MAE论文:https://a…...

YOLOv8部署提示‘找不到模型’?独立路径配置教程

YOLOv8部署提示‘找不到模型’?独立路径配置教程 1. 问题背景与解决方案 最近很多开发者在部署YOLOv8目标检测模型时遇到了一个常见问题:系统提示"找不到模型"。这个错误通常发生在模型路径配置不正确的情况下,特别是当使用独立部…...

开箱即用!LongCat-Image-Editn镜像快速部署与网页端测试完整教程

开箱即用!LongCat-Image-Editn镜像快速部署与网页端测试完整教程 1. 前言:一句话就能改图的AI神器 你有没有遇到过这样的烦恼?看到一张不错的图片,但总觉得哪里需要改一改——想把照片里的猫换成狗,想把背景换成海滩…...

告别AI自嗨!我的“落地”觉醒:做能帮人赚钱的事,才是真本事

上个月,一个做直播电商的朋友喝多了,拍着桌子冲我吼:“你们搞AI的天天说赋能赋能,我团队现在最烦的就是‘AI’这俩字!” 我愣住了。作为每天追大模型更新、研究各种技术参数的AI产品经理,我一直以为自己在做…...

AudioSeal精彩案例:国际赛事AI解说语音嵌入多语言版权信息水印

AudioSeal精彩案例:国际赛事AI解说语音嵌入多语言版权信息水印 1. 项目背景与价值 在当今数字内容爆炸式增长的时代,音频内容的版权保护变得尤为重要。国际体育赛事、新闻播报、音乐创作等领域都面临着AI生成音频的版权归属问题。AudioSeal作为Meta开源…...

用于光镊的Ince高斯光束

光镊是一种科学仪器,它利用高度聚焦的光束在亚微观水平上操纵物体,可以用来抓取单个细胞或分子,因此在生物学、医学和纳米化学中有许多应用。为了确保这些设置的正常功能,所用光束在整个聚焦过程中需要具有稳定的结构。虽然多种不…...

计算机常用接口及用途

计算机常用接口及用途1.VGA:Video Graphics array 视频图形阵列这是一个比较老式的显示连接器,也称为“模拟视频连接器”。这曾经在台式机和笔记本电脑上随处可见,但是 VGA 连接器已经无法适应先进的视频技术了。它在慢慢地被 DVI 和 HDMI 接…...

【大模型实践篇】Vanna:基于RAG的SQL生成框架从入门到精通的实战指南

1. Vanna框架初探:当自然语言遇见SQL 第一次听说Vanna这个工具时,我正在为一个零售客户分析销售数据。市场部的同事不断跑来问我:"能不能帮我查下上个月销量最好的商品?""哪些客户的复购率最高?"作…...

AI论文投稿避坑指南:这10本中科院4区SCI期刊审稿快、要求低

AI论文投稿实战指南:10本中科院4区SCI期刊深度测评与策略分析 第一次投稿就像在迷宫里摸索——你不知道哪条路能最快到达终点,更不知道哪条路上藏着审稿人的"地雷"。作为经历过7次投稿失败最终在3个月内成功发表两篇论文的"过来人"&…...

建筑设计师用飞扬就会 BIM 设计了

告别复杂建模、告别多软件切换、告别图模不一,飞扬集成设计系统让每一位习惯 CAD 的建筑设计师,零基础也能快速上手 BIM 正向设计,用熟悉的操作逻辑,做出专业级 BIM 成果。零门槛转型:CAD 老设计师也能直接上手不用重新…...

4步精通TradingView数据提取:构建专业金融分析数据集

4步精通TradingView数据提取:构建专业金融分析数据集 【免费下载链接】TradingView-data-scraper Extract price and indicator data from TradingView charts to create ML datasets 项目地址: https://gitcode.com/gh_mirrors/tr/TradingView-data-scraper …...

腾讯 QClaw 全量公测!打通五大 IM,还把 AI 做成了 “像素打工人”

前言:终于不用抢邀请码,腾讯 QClaw 把 AI 办公的门槛拉到最低今天腾讯 QClaw 正式开启全量公测,不用邀请码,官网下载 20 秒就能装完用,还一口气更新了打通五大 IM、像素工作室、可视化定时任务等功能,直接把…...

Flux.1-Dev深海幻境与数据库联动:基于MySQL的生成作品管理与检索系统

Flux.1-Dev深海幻境与数据库联动:基于MySQL的生成作品管理与检索系统 你有没有遇到过这样的烦恼?用Flux.1-Dev深海幻境模型一口气生成了几百张精美的图片,有风景、有人物、有各种奇幻场景,但几天后想找其中一张特定风格的图&…...

VibeVoice Pro行业方案:远程医疗问诊中医生语音转写+患者语音合成

VibeVoice Pro行业方案:远程医疗问诊中医生语音转写患者语音合成 1. 远程医疗的语音交互挑战 远程医疗正在改变传统的就医方式,但语音交互质量直接影响到诊疗效果。想象一下这样的场景:医生通过视频问诊,需要同时记录病历、查看…...

基础语法学习

Java基础语法概述Java是一种面向对象的编程语言,语法简洁且结构清晰。以下从变量、数据类型、运算符、控制结构、方法、数组等方面介绍Java基础语法。变量与数据类型Java是强类型语言,变量需先声明后使用。基本数据类型包括:整型:…...

SUNFLOWER MATCH LAB在ComfyUI中的工作流搭建与可视化推理

SUNFLOWER MATCH LAB在ComfyUI中的工作流搭建与可视化推理 如果你对植物识别或者创意图像处理感兴趣,可能听说过一些复杂的AI模型,但一想到要写代码、配环境就头疼。今天要聊的这个方法,能让你彻底告别这些烦恼。 SUNFLOWER MATCH LAB是一个…...

客服工单类型分不清?IPA自动分咨询/投诉/建议,重点问题早解决

客服工单分类方法基于内容关键词识别 通过自然语言处理(NLP)技术提取工单文本中的关键词(如“咨询”“投诉”“建议”),结合上下文语义判断类型。例如:投诉类工单常含“不满意”“赔偿”“投诉”等词汇&…...

考虑灵活性供需不确定性的储能优化配置附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室🍊个人信条:格物致知,完整Matlab代码及仿真咨询…...

OpenClaw+Qwen3-32B内容处理方案:自动生成公众号草稿并发布

OpenClawQwen3-32B内容处理方案:自动生成公众号草稿并发布 1. 为什么需要自动化内容发布 作为一个技术博主,我每周都要在公众号发布2-3篇原创文章。最让我头疼的不是写作本身,而是那些机械化的发布流程:调整Markdown格式、上传图…...

手动处理图片?Python批量压缩+加水印,宣传图1小时出100张

Python实现图片批量压缩与加水印安装必要的库:pip install Pillow批量压缩图片使用Pillow库调整图片质量实现压缩:from PIL import Image import osdef compress_images(input_folder, output_folder, quality85):if not os.path.exists(output_folder):…...

# Pyc怎么转Py?PyLingual 部署教程

Pyc怎么转Py?PyLingual 部署教程古有 uncompyle6 破码,今有 PyLingual 当家。PyLingual 是一款基于深度学习的 Python 字节码(.pyc)反编译工具, 定位是解决传统反编译工具(如 uncompyle6)处理「…...

【大模型LLM学习】天池Deep Research Agent开发赛

前言 运气不错,这次压线前10,不过和top还是有差距的数据包括问题和答案可以在比赛官网获取,包括初赛的100题和复赛100题。赛题为输入query输出answer,通过搭建Search Agent,分解问题、多跳搜索识别线索,找…...

Docker 容器中添加多个端口与宿主机映射

文章目录概要要点一、创建容器时映射多个端口二、运行中容器(容器内已修改部分配置)添加端口映射步骤 1:停止容器步骤 2:修改容器配置文件步骤 3:重启 Docker 服务和容器步骤 4:验证端口映射是否生效建议&a…...

RWA被闪电贷打爆,上百万美元被套利的真实案例

下面讲一个RWA赛道另一种典型漏洞:Oracle价格操纵 闪电贷套利。很多RWA项目都会用 预言机(Oracle) 把现实资产价格喂到链上,比如:🏠 房地产价格📊 基金净值 NAV💵 国债价格但如果这个价格被操控&#xff0…...

关于施乐7835开机提示扫描器故障应急解决方法

一、故障现象设备开机后,扫描头无动作扫描头未亮灯自检扫描头未按正常流程移动至初始位置二、故障原因驱动电机脱落(最常见原因)扫描小板与主板连接线松动扫描小板损坏三、维修步骤步骤1:检查扫描头驱动电机操作说明:打…...

客服服务质量难监控?IPA自动查话术/时长,问题及时纠

提升客服服务质量的监控方法引入智能流程自动化(IPA)工具 智能流程自动化可以实时监控客服对话内容,自动检查话术合规性。通过预设的关键词和话术模板,系统能快速识别偏离标准的情况,并生成提醒或报告。例如&#xff0…...

LangChain 快速入门:从基础到生产级 AI 智能体搭建

本快速入门教程将带你在几分钟内,从简单的环境配置开始,一步步搭建出一个功能完整的AI智能体。如果使用AI编码助手或集成开发环境(如Claude Code、Cursor),建议安装LangChain Docs MCP服务器,能让你的智能体…...