当前位置：首页 > news >正文

YOLO v5与YOLO v8框图比较

news 2026/2/9 19:40:43

1. 介绍

YOLO (You Only Look Once) 是一个用于目标检测的卷积神经网络模型，以其高精度、高速度和易用性著称。YOLO v5 是目前最流行的 YOLO 版本之一，而 YOLO v8 是 YOLO 的最新版本。

2. 原理详解

YOLO 系列模型的基本原理是将目标检测任务转化为图像的回归预测问题，主要步骤包括：

图像预处理: 将输入图像缩放到指定尺寸并归一化。
特征提取: 使用主干网络 (Backbone) 提取图像特征。
特征融合: 将不同尺度的特征进行融合，以获取更丰富的特征信息。
预测框生成: 使用预测头 (Head) 生成目标检测结果，包括预测框坐标、置信度和类别信息。
非极大值抑制 (NMS): 剔除冗余的预测框，保留最终的检测结果。

3. 应用场景解释

YOLO 系列模型可用于各种目标检测任务，例如：

通用目标检测: 检测图像中的各种物体，如人、车、动物等。
实时目标检测: 在视频流中实时检测物体，用于监控、安防等场景。
特定目标检测: 针对特定物体进行检测，例如行人检测、车辆检测等。

4. 算法实现

YOLO 系列模型的代码开源在 GitHub 上，您可以参考官方仓库进行了解和学习。

1. 模型加载

import torch# 加载模型
model = torch.hub.load('ultralytics/yolov5', 'yolov5s')# 将模型设置为推理模式
model.eval()

2. 图像预处理

import cv2# 读取图像
image = cv2.imread('image.jpg')# 将图像转换为 RGB 格式
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)# 将图像转换为张量并归一化
image = torch.from_numpy(image).float() / 255.0
image = image.permute(2, 0, 1)
image = image.unsqueeze(0)

3. 模型推理

# 将图像输入模型
with torch.no_grad():outputs = model(image)

4. 处理检测结果

# 解析检测结果
results = outputs[0].cpu().numpy()# 筛选置信度大于阈值的检测结果
detections = []
for detection in results:if detection[4] > 0.5:detections.append(detection)# 绘制检测结果
for detection in detections:# 获取预测框坐标和类别x1, y1, x2, y2, confidence, class_id = detectionx1, y1, x2, y2 = int(x1), int(y1), int(x2), int(y2)# 绘制预测框cv2.rectangle(image, (x1, y1), (x2, y2), (0, 255, 0), 2)# 显示类别标签label = classes[int(class_id)]cv2.putText(image, label, (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 255), 2)# 显示最终结果
cv2.imshow('Result', image)
cv2.waitKey(0)

建议您参考官方 GitHub 仓库:

YOLO v5: GitHub - ultralytics/yolov5: YOLOv5 🚀 in PyTorch > ONNX > CoreML > TFLite

6. 部署测试搭建实现

YOLO 系列模型的部署和测试需要一些额外的配置和步骤。请参考官方文档和教程进行具体操作。

7. 文献材料链接

YOLO 论文: https://arxiv.org/pdf/1506.02640
YOLO v5 官方文档: Comprehensive Guide to Ultralytics YOLOv5 - Ultralytics YOLO Docs
YOLO v8 官方文档: [移除了无效网址]

8. 应用示例产品

YOLO 系列模型已被广泛应用于各种产品和服务中，例如：

智能监控: 实时检测视频中的物体，用于监控、安防等场景。
自动驾驶: 检测道路上的行人、车辆等障碍物，辅助自动驾驶系统进行决策。
医学影像分析: 检测医学影像中的病灶，辅助医生进行诊断。

9. 总结

YOLO 系列模型是目标检测领域的代表性模型，具有精度高、速度快、易用的特点。YOLO v8 是 YOLO 的最新版本，在性能和精度方面都有了显著提升。

10. 影响

YOLO 系列模型的出现推动了目标检测算法的快速发展，并使其在实际应用中得到了广泛普及。

11. 未来扩展

YOLO 系列模型的未来发展方向包括：

提高模型精度: 进一步提升模型对复杂场景和细小目标的检测能力。
提高模型速度: 优化模型架构和算法，以实现更快的推理速度。
扩展模型应用场景: 探索 YOLO 系列模型在更多领域的应用，例如医学影像分析、自动驾驶等。

YOLO v5 与 YOLO v8 框图比较

由于 YOLO v8 尚未发布官方框图，无法直接进行比较。建议您参考 YOLO v5 官方框图，并结合 YOLO v8 的改进内容进行理解。

YOLO v5与YOLO v8框图比较

1. 介绍 YOLO (You Only Look Once) 是一个用于目标检测的卷积神经网络模型，以其高精度、高速度和易用性著称。YOLO v5 是目前最流行的 YOLO 版本之一，而 YOLO v8 是 YOLO 的最新版本。 2. 原理详解 YOLO 系列模型的基本原理是将目标检测任务转化为图…...

编程日记 2024/6/12 6:59:12

Redis集群（5）

集群原理节点通信通信流程在分布式存储系统中，维护节点元数据（如节点负责的数据、节点的故障状态等）是关键任务。常见的元数据维护方式分为集中式和P2P方式。Redis集群采用P2P的Gossip协议，这种协议的工作原理是节点之间不断…...

编程日记 2024/6/12 6:58:11

STM32H5 DAC 配置

STM32 H5 DAC的详细初始化过程可以分为以下几个步骤，以下是根据参考文章和相关资料整理的具体步骤和参数设置： 1、使能相关时钟： 使能GPIOA（或其他对应DAC输出引脚的GPIO端口）的时钟。这通常是通过调用RCC_APB2Perip…...

编程日记 2024/6/12 6:57:10

第十九节：暴力递归到动态规划

一动画规划的概念优化出现重复解的递归一旦写出递归来，改动态规划就很快尝试策略和状态转移方程是一码事学会尝试是攻克动态规划最本质的能力如果你发现你有重复调用的过程，动态规划在算过一次之后把答案记下来，下回在越到重复调用过程…...

编程日记 2024/6/12 6:55:08

服务器部署spring项目jar包使用bat文件，省略每次输入java -jar了

echo off set pathC:\Program Files\Java\jre1.8.0_191\bin START "YiXiangZhengHe-8516" "%path%/java" -Xdebug -jar -Dspring.profiles.activeprod -Dserver.port8516 YiXiangZhengHe-0.0.1-SNAPSHOT.jar 将set path后面改成jre的bin文件夹 START 后…...

编程日记 2024/6/12 6:54:06

2024备忘知识点

1. adb shell dumpsys package f |grep fin 过滤查找指纹服务 １．　adsp write /sys/kernel/boot_adsp/boot 1 Please change replace dev_dbg into dev_err in kernel file adsp-loader.c. Then check whether "write /sys/kernel/boot_adsp/…...

编程日记 2024/6/12 6:53:05

JS基础与高级应用: 性能优化

在现代Web开发中，性能优化已成为前端工程师必须掌握的核心技能之一。本文从URL输入到页面加载完成的全过程出发，深入分析了HTTP协议的演进、域名解析、代码层面性能优化以及编译与渲染的最佳实践。通过节流、防抖、重复请求合并等具体技术手段&#xff0…...

编程日记 2024/6/12 6:49:00

Python | Leetcode Python题解之第145题二叉树的后序遍历

题目： 题解： class Solution:def postorderTraversal(self, root: TreeNode) -> List[int]:def addPath(node: TreeNode):count 0while node:count 1res.append(node.val)node node.righti, j len(res) - count, len(res) - 1while i < j:res…...

编程日记 2024/6/12 6:47:58

公司面试题总结（二）

7. 说说 JavaScript 中的数据类型？存储上的差别？ • 基本类型： o Number o String o Boolean o Undefined o null o symbol • 引用类型 o Object o Array o Function • 声明变量时不同的内存地址分配： o 简单类型的…...

编程日记 2024/6/12 6:46:41

人脸识别和 ArcFace：用于深度人脸识别的附加角边际损失

在本文中，您将发现一种 ArcFace 方法，该方法可获得用于人脸识别的高分辨特征。阅读本文后，你将了解: 人脸识别任务如何工作。如何计算人脸匹配。SoftMax 和 ArcFace 的直观区别。ArcFace 的几何解释。ArcFace 背后的数学原理本文假定您已经熟悉用于多类分类、检测和 SoftMax…...

编程日记 2024/6/12 6:42:03

双标引领：汽车软件安全的ASPICE与ISO21434之道

随着汽车行业的飞速发展，尤其是智能化、网联化趋势的加剧，汽车软件开发的复杂性和安全性需求日益提升。在这样的背景下，ASPICE标准和ISO21434安全标准应运而生，为汽车软件的开发和管理提供了坚实的支撑。 ASPICE（Auto…...

编程日记 2024/6/12 6:38:30

再度牵手，制造升级 | 毅达科技IMS OS+通用产品集+行业套件项目正式启动！

在数字化与智能制造的浪潮中，制造业企业纷纷加快转型步伐，力求通过技术创新实现生产效率与质量的双重提升。近日，广东毅达医疗科技股份有限公司（以下简称“毅达科技”）再次携手盘古信息，正式启动了IMS 数字…...

编程日记 2024/6/12 6:32:44

大疆智图_空三二维重建成果传输

一、软件环境 1.1 所需软件 1、大疆智图：点击下载； 2、 ArcGIS Pro 3.1.5：点击下载，建议使用IDM或Aria2等多线程下载器； 3、 IDM下载器：点击下载，或自行搜索； 4、 Fas…...

编程日记 2024/6/12 6:31:28

python实现无人机航拍图片像素坐标转世界坐标

背景已知相机参数（传感器宽度和高度、图像宽度和高度、焦距、相对航高、像主点坐标 ），在给定像素坐标的前提下，求世界坐标，大部分通过AI来实现，不知道哪个步骤有问题，望大家指正脚本 impor…...

编程日记 2024/6/12 6:30:16

C#面：什么是 Windows 服务，它的生命周期与标准的 EXE 程序有什么不同

C#中的Windows服务是一种在后台运行的长时间运行的应用程序，它可以在Windows操作系统启动时自动启动，并在系统运行期间持续运行。与标准的EXE程序相比，Windows服务具有以下不同之处： 生命周期：Windows服务的生命周期与…...

编程日记 2024/6/12 6:28:53

Java基础面试题自测

文章目录一、Java 中有哪 8 种基本数据类型？说说这 8 种基本数据类型对应的包装类型？二、包装类型的常量池技术了解么？三、为什么要有包装类型？四、什么是自动拆装箱？原理？四、遇到过自动拆箱引发的 NPE 问…...

编程日记 2024/6/12 6:27:29

【LeetCode 第 401 场周赛】K秒后第 N 个元素的值

文章目录 1. K秒后第 N 个元素的值🆗 1. K秒后第 N 个元素的值🆗 题目链接🔗 🐧解题思路： 前缀和小规律🍎 🍎 从上图观察可知，规律一目了然，arr[i] arr[i] 对上一…...

编程日记 2024/6/12 6:26:20

游戏心理学Day10

习得性动机。习得性动机也称社会性动机是指人与社会生活相联系的后天习得的动机，这类动机比原发性动机要多很多。成就动机。成就动机是指个人追求进步以及达到目标的内在动力。在游戏中设计师总会担心过多的失败，会令玩家感到挫败进而离开游戏对…...

编程日记 2024/6/12 6:25:10

MySQL表设计经验汇总篇

文章目录 1、命名规范2、选择合适的字段类型3、主键设计要合理4、选择合适的字段长度5、优先考虑逻辑删除，而不是物理删除6、每个表都需要添加通用字段7、一张表的字段不宜过多8、定义字段尽可能not null9、合理添加索引10、通过业务字段冗余来减少表关联11、避免使…...

编程日记 2024/6/12 6:23:58

Servlet基础（续集2）

HttpServletResponse web服务器接收到客户端的http的请求，针对这个请求，分别创建一个代表请求的HttpServletRequest对象，代表响应的一个HttpServletResponse 如果要获取客户端请求过来的参数：找HttpServletRequest如果要给客户端…...

编程日记 2024/6/12 6:22:47

观成科技：隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具，该工具基于TUN接口实现其功能，利用反向TCP/TLS连接建立一条隐蔽的通信信道，支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式，适应复杂网…...

编程新知 2026/2/8 4:37:24

conda相比python好处

Conda 作为 Python 的环境和包管理工具，相比原生 Python 生态（如 pip 虚拟环境）有许多独特优势，尤其在多项目管理、依赖处理和跨平台兼容性等方面表现更优。以下是 Conda 的核心好处： 一、一站式环境管理&#xff1a…...

编程新知 2025/11/29 6:54:19

docker详细操作--未完待续

docker介绍 docker官网: Docker：加速容器应用程序开发 harbor官网：Harbor - Harbor 中文使用docker加速器: Docker镜像极速下载服务 - 毫秒镜像是什么 Docker 是一种开源的容器化平台，用于将应用程序及其依赖项（如库、运行时环…...

编程新知 2026/2/5 4:33:24

golang循环变量捕获问题

在 Go 语言中，当在循环中启动协程（goroutine）时，如果在协程闭包中直接引用循环变量，可能会遇到一个常见的陷阱 - 循环变量捕获问题。让我详细解释一下： 问题背景看这个代码片段： fo…...

编程新知 2026/1/21 14:29:57

React Native在HarmonyOS 5.0阅读类应用开发中的实践

一、技术选型背景随着HarmonyOS 5.0对Web兼容层的增强，React Native作为跨平台框架可通过重新编译ArkTS组件实现85%以上的代码复用率。阅读类应用具有UI复杂度低、数据流清晰的特点。二、核心实现方案 1. 环境配置 （1）使用React Native…...

编程新知 2025/8/19 2:57:37

macOS多出来了：Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用

文章目录问题现象问题原因解决办法问题现象 macOS启动台（Launchpad）多出来了：Google云端硬盘、YouTube、表格、幻灯片、Gmail、Google文档等应用。问题原因很明显，都是Google家的办公全家桶。这些应用并不是通过独立安装的…...

编程新知 2025/12/4 19:00:05

JVM暂停（Stop-The-World，STW）的原因分类及对应排查方案

JVM暂停（Stop-The-World，STW）的完整原因分类及对应排查方案，结合JVM运行机制和常见故障场景整理而成：一、GC相关暂停 1. 安全点（Safepoint）阻塞现象：JVM暂停但无GC日志，日志显示No GCs detected。原因：JVM等待所有线程进入安全点（如…...

编程新知 2026/2/7 11:25:15

今日学习：Spring线程池|并发修改异常|链路丢失|登录续期|VIP过期策略|数值类缓存

文章目录优雅版线程池ThreadPoolTaskExecutor和ThreadPoolTaskExecutor的装饰器并发修改异常并发修改异常简介实现机制设计原因及意义使用线程池造成的链路丢失问题线程池导致的链路丢失问题发生原因常见解决方法更好的解决方法设计精妙之处登录续期登录续期常见实现方式特…...

编程新知 2026/1/27 16:41:02

鸿蒙DevEco Studio HarmonyOS 5跑酷小游戏实现指南

1. 项目概述本跑酷小游戏基于鸿蒙HarmonyOS 5开发，使用DevEco Studio作为开发工具，采用Java语言实现，包含角色控制、障碍物生成和分数计算系统。 2. 项目结构 /src/main/java/com/example/runner/├── MainAbilitySlice.java // 主界…...

编程新知 2025/12/19 22:56:05

嵌入式学习笔记DAY33（网络编程——TCP）

一、网络架构 C/S （client/server 客户端/服务器）：由客户端和服务器端两个部分组成。客户端通常是用户使用的应用程序，负责提供用户界面和交互逻辑 ，接收用户输入，向服务器发送请求，并展示服务…...

编程新知 2026/2/7 11:00:30