当前位置：首页 > article >正文

深度学习每周学习总结Y1（Yolov5 调用官方权重进行检测）

article 2026/4/11 23:13:06

🍨 本文为🔗365天深度学习训练营中的学习记录博客Y1中的内容

🍖 原作者：K同学啊 | 接辅导、项目定制

** 注意该训练营出现故意不退押金，恶意揣测偷懒用假的结果冒充真实打卡记录，在提出能够拿到视频录像证据后，仍然拉黑删除处理不沟通，并且学习资源也不对我开放。但是我有提前学习预习的习惯，学习资料有正常保存。目前据打卡结束还有两周，本篇为第12个月的第2篇学习，按照规则还差一周就能拿到押金退还，会照常打卡，打卡结束后如果仍旧没有拿到押金，将会继续通过一切法律手段维护作为消费者的合法权益。有相同经历者请与我联系。**

0.总结

YOLO（You Only Look Once）是一种非常流行的目标检测算法，用于从图像或视频中实时识别物体。与传统的目标检测方法不同，YOLO将目标检测任务转化为回归问题，在一个单独的神经网络中同时完成物体的定位和分类。因此，YOLO的主要特点是高效、实时，并且能够处理复杂的场景。

YOLO的工作流程如下：

图像分割：将输入图像分为多个网格。
边界框预测：每个网格预测一定数量的边界框，每个边界框包含物体的坐标、宽高以及该物体的类别概率。
目标分类与置信度：每个边界框会给出一个目标类别的概率，以及置信度分数，用来判断该框是否包含目标。

YOLO的版本更新迭代很快，最新的版本（如YOLOv5、YOLOv7等）对精度和速度进行了优化，并且提供了很多实际应用中可以直接使用的预训练模型。

对于初学者，以下是一些学习YOLO的步骤：

基础知识：学习一些基础的计算机视觉知识，如图像处理、卷积神经网络（CNN）等。
学习深度学习框架：YOLO是基于深度学习的，掌握一些深度学习框架（如TensorFlow、PyTorch）对于理解和使用YOLO非常重要。
阅读YOLO的论文：YOLO的创始人Joseph Redmon发布了YOLO的多篇论文，阅读这些论文可以帮助你更深入理解YOLO的工作原理。
动手实践：使用现有的YOLO模型进行实验，选择一些目标检测任务进行训练和优化。可以尝试使用开源的YOLO实现，如YOLOv5，它有详细的文档和示例，适合初学者。
调优和优化：在训练过程中尝试调节模型参数、使用不同的数据集以及进行模型评估和性能优化。

yolov5官方网站：https://github.com/ultralytics/yolov5

重要建议：

如果你正在使用YOLOv5或YOLOv7，Python 3.7到3.10的版本是最为推荐的。
在安装相关依赖时，可以创建一个虚拟环境，并确保Python版本与你的YOLO版本兼容，这样可以避免库冲突。

1. 配置环境

打开官网后下载代码

新建一个jupyter notebook 的虚拟环境用来专门运行yolo,关于建立虚拟环境请看我的这篇博客使用Anaconda Prompt 创建虚拟环境总结

建立好环境后，找到刚下载的代码文件中的requirments.txt文件运行 pip install -r requirments.txt 注意文件要和代码保持在一个文件夹里，或者直接指定具体路劲如下：
pip install -r D:\DataAnalysis\jupyter_notebook_warehouse\pytorch学习\yolov5-master\requirements.txt

在这里插入图片描述

等待环境配置好

在这里插入图片描述

2. 运行代码

运行代码，注意文件路径换成自己的：python D:\DataAnalysis\jupyter_notebook_warehouse\pytorch学习\yolov5-master\detect.py --source D:\DataAnalysis\jupyter_notebook_warehouse\pytorch学习\yolov5-master\data\images\bus.jpg --weights yolov5s.pt --img 640

注意我这里执行了 "cd /d D: ",路径涉及到跨不同的驱动器（C盘和D盘）可能会抛出错误
在这里插入图片描述

运行成功后会有上述结果，根据路径查看对应图片

在这里插入图片描述

3. 视频检测

方法一样，切换对应路径即可

python D:\DataAnalysis\jupyter_notebook_warehouse\pytorch学习\yolov5-master\detect.py --source D:\DataAnalysis\jupyter_notebook_warehouse\pytorch学习\data\crossfire2024-03-11.mp4

在这里插入图片描述

同样在图片上的文件夹里找到对应处理结果，有待改进的一点是检测似乎只用到了CPU？

在这里插入图片描述

可以看到对游戏视频录像里的人物识别并不那么准确，最好实际场景的视频做检测

在这里插入图片描述

深度学习每周学习总结Y1（Yolov5 调用官方权重进行检测）

目录

0.总结

1. 配置环境

2. 运行代码

3. 视频检测

相关文章：

深度学习每周学习总结Y1（Yolov5 调用官方权重进行检测）

计算机视觉基础｜从 OpenCV 到频域分析

74. 搜索二维矩阵（LeetCode 热题 100）

netcore libreoffice word转pdf中文乱码

qt-C++笔记之创建和初始化 `QGraphicsScene` 和 `QGraphicsView` 并关联视图和场景的方法

OpenGL 01--构建GLFW、创建第一个工程、配置GLAD

【时时三省】(C语言基础）求多项式1-1/2+1/3-1/4+...+1/99-1/100的值用C语言表示

kafka-集群缩容

Ubuntu22.04 - etcd的安装和使用

排查JVM的一些命令

Apache Doris 实现毫秒级查询响应

Java 与设计模式（15）：模板方法模式

Arduino 第十六章：pir红外人体传感器练习

C++中间件DDS介绍

自动化之ansible（二）

QSNCTF-WEB做题记录

Ruoyi-Vue 3.8.7集成积木报表JmReport和积木大屏JimuBI

OSPF（开放路径最短优先）

请谈谈 Vue 中的响应式原理，如何实现？

亲测可用，IDEA中使用满血版DeepSeek R1！支持深度思考！免费！免配置！

jvm中各个参数的理解

【队列】循环队列（Circular Queue）详解

Deepseek快速做PPT

DeepSeek掀起推理服务器新风暴，AI应用迎来变革转折点？

离线部署大模型：ollama+deepseek+open-webui

深入解析浏览器渲染全流程：从URL输入到页面渲染的底层原理与性能优化（附实战代码）

现代游戏UI架构深度解析——以UIController为核心的模块化界面管理系统

Vue 项目中逐步引入 TypeScript 的类型检查

Git企业开发

DeepSeek预测25考研分数线