【论文解读】EdgeYOLO:一种边缘实时目标检测器(附论文地址)

论文地址:https://arxiv.org/pdf/2302.07483
这篇文章的标题是《EdgeYOLO: An Edge-Real-Time Object Detector》,由中国北京理工大学的Shihan Liu、Junlin Zha、Jian Sun、Zhuo Li和Gang Wang共同撰写。这篇论文提出了一个基于最新YOLO框架的高效、低复杂度且无锚点的目标检测器,能够在边缘计算平台上实时实现。以下是对论文内容的解读:
研究背景与动机
-
计算硬件性能提升:随着计算硬件性能的不断提升,基于深度神经网络的计算机视觉技术在过去十年中迅速发展,目标检测作为自主智能系统中的一个重要元素,对于实现自动化和智能化至关重要。
-
目标检测策略的演进:目标检测领域存在两种主流策略,即两阶段策略(如R-CNN系列)和一阶段策略(如YOLO框架)。两阶段策略虽然在精度上略胜一筹,但无法满足实时性要求,特别是在传统计算设备上。相比之下,一阶段策略在实时性和性能之间取得了平衡,因此受到了研究者更多的关注。
-
边缘计算的兴起:边缘计算允许在数据源附近进行数据处理,减少了数据传输延迟,对于需要快速响应的应用场景(如自动驾驶、无人机监控等)具有重要意义。然而,现有的先进模型在边缘计算设备上通常运行帧率(FPS)较低,无法满足实时性需求。
-
模型复杂度与实时性的平衡:为了在边缘设备上实现实时目标检测,需要设计出既保证精度又具有较低计算复杂度的模型。这要求研究者在模型设计时考虑到参数数量、结构复杂度以及推理速度。
-
小目标检测的挑战:小目标在图像中所占像素较少,导致用于表达目标的信息量减少,其检测精度通常显著低于大目标。为了提高小目标的检测效果,需要对现有方法进行改进和优化。
-
无锚点(Anchor-free)检测器的优势:与传统的基于锚点(Anchor-based)的检测器相比,无锚点检测器在后处理阶段可以节省更多时间,因为它们不需要处理每个网格单元的多个锚点,这有助于提高边缘设备上的目标检测速度。
EdgeYOLO
EdgeYOLO是一种具有良好精度并且能够在边缘设备上实时运行的目标检测器。
-
设计了一种Anchor-Free目标检测器,该检测器可以在MS COCO2017数据集中实时运行在边缘设备上,准确率为50.6%AP;
-
提出了一种更强大的数据增强方法,进一步确保了训练数据的数量和有效性;
-
模型中使用了可重参化的结构,以减少推理时间;
-
设计了一个损失函数,以提高小目标的精度。
主要改进
-
无锚点检测器: 提出了一个无需锚点(anchor-free)的目标检测器,可以减少设计复杂度和计算量。
-
数据增强方法: 开发了一个增强的数据增强方法,有效抑制训练过程中的过拟合。
-
混合随机损失函数: 设计了一种新的损失函数,提高小目标的检测精度。
-
解耦头: 提出了一种更轻量、高效的解耦头,以加速推理过程,同时保持精度。

关键组件
-
增强的Mosaic & Mixup: 通过结合Mosaic和Mixup数据增强技术,增加了图像的丰富性,并确保输出图像包含足够的有效信息。

-
Lite-Decoupled Head: 一种轻量级解耦头,通过重参数化技术提高推理速度,同时减少推理成本。

-
Staged Loss Function: 分阶段的损失函数设计,根据训练过程的不同阶段调整损失函数,以优化模型性能。
技术细节
-
数据增强: 通过随机数据增强不可避免地会导致一些标签无效,EdgeYOLO通过增加有效框的数量来解决这个问题。
-
模型缩减: 通过模型缩减技术减少计算成本,提高模型推理速度。
-
解耦回归: 与传统的统一回归检测头相比,解耦回归检测头可以提高性能并加速损失收敛。
-
小目标检测优化: 通过数据增强和损失函数的重新设计,提高小目标的检测效果。
实验与评估
-
数据集: 在MS COCO2017和VisDrone2019-DET数据集上进行测试,这些数据集包含丰富的标签信息,适合评估模型性能。
-
训练环境: 使用4个RTX 3090 GPU进行训练,采用ELAN-Darknet作为模型的主干网络。
-
推理测试: 在NVIDIA Jetson AGX Xavier边缘计算设备上进行推理测试,确保模型满足实时性要求。
-
性能: EdgeYOLO在MS COCO2017数据集上达到了50.6% AP50:95和69.8% AP50的精度,在VisDrone2019-DET数据集上达到了26.4% AP50:95和44.8% AP50的精度。
-
实时性: 在Nvidia Jetson AGX Xavier设备上,模型的帧率(FPS)≥30,满足实时要求。


结论与贡献
结论
-
高效率与实时性: EdgeYOLO证明了其能够在边缘设备上以高效率和实时性运行,同时保持了较高的目标检测精度。
-
小目标检测: 特别指出了EdgeYOLO在小目标检测方面的性能提升,这是通过其创新的数据增强和损失函数设计实现的。
-
无锚点结构: 由于采用了无锚点(anchor-free)结构,EdgeYOLO简化了设计复杂度和计算复杂度,使得在边缘设备上的部署更为友好。
-
框架扩展性: 论文提出该框架有潜力扩展到其他像素级识别任务,如实例分割等。
贡献
-
实时无锚点目标检测器: 设计了一个能够在边缘设备上实时运行的无锚点目标检测器,该检测器在MS COCO2017数据集上达到了50.6% AP50:95的精度。
-
增强的数据增强方法: 提出了一种更强大的数据增强方法,进一步确保了训练数据的量和有效性。
-
模型结构优化: 在模型中使用了可重参数化的结构,以减少推理时间。
-
混合随机损失函数: 设计了一种新的损失函数,改善了小目标的检测精度。
-
不同规模模型: 构建了几个不同大小的模型,以适应不同计算能力的边缘设备,并加速模型推理过程。
-
实验验证: 在MS COCO2017和VisDrone2019-DET数据集上进行了广泛的实验验证,证明了EdgeYOLO在不同场景下的有效性。
-
开源资源: 提供了源代码、超参数和模型权重,以便研究社区可以访问和进一步研究。
论文强调,尽管EdgeYOLO在目标检测方面取得了显著成果,但仍有改进空间,特别是在小目标检测的准确性方面。未来的工作将集中在进一步提高小目标的检测精度,并探索更有效的优化方法。
相关文章:
【论文解读】EdgeYOLO:一种边缘实时目标检测器(附论文地址)
论文地址:https://arxiv.org/pdf/2302.07483 这篇文章的标题是《EdgeYOLO: An Edge-Real-Time Object Detector》,由中国北京理工大学的Shihan Liu、Junlin Zha、Jian Sun、Zhuo Li和Gang Wang共同撰写。这篇论文提出了一个基于最新YOLO框架的高效、低复…...
xlwings,让excel飞起来!
excel已经成为必不可少的数据处理软件,几乎天天在用。python有很多支持操作excel的第三方库,xlwings是其中一个。 关于xlwings xlwings开源免费,能够非常方便的读写Excel文件中的数据,并且能够进行单元格格式的修改。 xlwings还…...
C语言学习,标准库 <stddef.h>
<stddef.h> C 标准库中头文件,它定义了一些常用的类型定义和宏。这些定义通常用于指针操作、数组处理和其他需要固定大小数据类型的场合。 size_t: 这是一个无符号整数类型,用于表示对象的大小(以字节为单位)。…...
PyQt5实战——操作台打印重定向,主界面以及stacklayout使用(四)
个人博客:苏三有春的博客 系类往期文章: PyQt5实战——多脚本集合包,前言与环境配置(一) PyQt5实战——多脚本集合包,UI以及工程布局(二) PyQt5实战——多脚本集合包,程序…...
React + Vite + TypeScript + React router项目搭建教程
一、创建项目 运行项目 二、目录结构 项目目录: ├─node_modules //第三方依赖 ├─public //静态资源(不参与打包) └─src├─assets //静态资源├─components //组件├─config //配置├─http //请求方法封装├─layout //页面…...
【ShuQiHere】️ 如何启用 SSH 服务
🛠️ 如何启用 SSH 服务 目录 基础概念 🌱检查是否已安装 SSH 服务 🔍在不同操作系统上安装 SSH 服务 💻 LinuxWindows 11macOS 启动和启用 SSH 服务 🚀配置防火墙以允许 SSH 连接 🔥配置 SSH 服务&#…...
【自动化测试】APP UI 自动化(安卓)-本地环境搭建
一、软件准备及版本介绍 软件版本JAVA-SDK1.8.0_181 python 3.10.10 Android SDK Tools 下最新版本即可,无特殊要求 PyCharm 2023.3.5(下最新版本即可,无特殊要求) 二、安装步骤及环境变量配置 2.1 Java安装及配置 1&am…...
java毕业设计之基于Bootstrap的常州地方旅游管理系统的设计与实现(springboot)
项目简介 基于Bootstrap的常州地方旅游管理系统的设计与实现有下功能: 基于Bootstrap的常州地方旅游管理系统的设计与实现的主要使用者分为用户功能模块和管理员功能模块两大部分,用户可查看景点信息、景点资讯等,注册登录后可进行景点订票…...
《机甲崛起》
第一章:觉醒 在遥远的未来,地球的面貌已被人类科技彻底改变。蓝天被高耸的摩天大楼和闪烁的飞行器撕裂,城市的光辉仿佛能照亮整个星球。然而,繁华背后隐藏着深重的危机:生态环境的恶化、资源的匮乏,已成为…...
Windows10:Linux Reader
Linux Reader Access files and folders on Ext, UFS, HFS, ReiserFS, or APFS file systems from Windows DiskInternals 发布的 Linux Reader 是一款能在 Windows 系统环境下读取 Linux 分区文件的免费软件,提供了资源管理器式的浏览模式。它使用只读模式挂载 L…...
一、k8s快速入门之学习Kubernetes组件基础
一、三个容器管理器平台 Apache MESOS 开源的分布式资源管理框架,被推特选为基础平台,2019年推特换位k8s,MESOS最新版可以在MESOS上管理k8sDOCKER SWARM docker总部发行的,实现docker的集群方案,和docker捆版一起&…...
PostgreSQL 到 PostgreSQL 数据迁移同步
简述 PostgreSQL 是一个历史悠久且广泛使用的数据库,不仅具备标准的关系型数据库能力,还具有相当不错的复杂 SQL 执行能力。用户常常会将 PostgreSQL 应用于在线事务型业务,以及部分数据分析工作,所以 PostgreSQL 到 PostgreSQL …...
RestTemplate 常用方法(提供了多种方法来发送 HTTP 请求)
RestTemplate 是 Spring 框架中用于同步客户端 HTTP 请求的一个类,它提供了多种方法来发送 HTTP 请求。以下是一些常用的 RestTemplate 方法及其代码案例: 1.postForObject() 该方法用于发送 POST 请求,并期望返回一个对象。以下是一个使用…...
常量和变量
常量 常量是指在程序中使用的一些具体的数、字符。在程序运行过程中,其值不能被更改。如123,145.88,m,TRUE等。常量,用于记录程序中不可更改的数据。 分类 1、整型常量,表示整数的常量。 表示形式: 1)十进制形…...
Go语言的使用
在安装Go和配置镜像时,可以根据操作系统和网络环境来选择适合的步骤。以下是详细的安装步骤和镜像配置: 1. 安装Go 1.1 通过官方下载 访问 Go的官方下载页面 下载适合操作系统的安装包(Windows、macOS 或 Linux)。安装包下载完…...
详解CRC校验原理以及FPGA实现
文章目录 一、什么是CRC校验?二、实现CRC校验原理以及步骤2.1 用多项式表示二元码数据2.2 选择一个生成多项式作为校验2.3 计算CRC校验码 三、CRC判断数据是否错误的原理以及步骤3.1 将收到的数据与生成多项式求余3.2 数据发生错误再进行CRC校验判断 四、FPGA实现CR…...
企业如何通过架构蓝图实现数字化转型
数字化转型的关键——架构蓝图的力量 在当今的商业世界,数字化转型已经不再是一个选择,而是企业生存与发展不可回避的战略行动。企业希望通过数字化提高效率、增强灵活性,并为客户提供更好的体验。然而,数字化转型不仅仅涉及技术…...
React第十三章(useTransition)
useTransition useTransition 是 React 18 中引入的一个 Hook,用于管理 UI 中的过渡状态,特别是在处理长时间运行的状态更新时。它允许你将某些更新标记为“过渡”状态,这样 React 可以优先处理更重要的更新,比如用户输入&#x…...
IDEA使用Maven Helper查看整个项目的jar冲突
在插件市场安装Maven Helper,安装好后,重启IDEA;双击打开可能存在jar冲突的pom文件;在右侧面板查看冲突,text是引入的依赖明细,点击Dependecy Analyzer选项卡即可查看冲突的jar。...
uniapp项目 存储数据到手机本地
打开manifest.json,在App权限配置中,添加读取和写入的权限 <uses-permission android:name"android.permission.READ_EXTERNAL_STORAGE"/> <uses-permission android:name"android.permission.WRITE_EXTERNAL_STORAGE"/&g…...
可靠性+灵活性:电力载波技术在楼宇自控中的核心价值
可靠性灵活性:电力载波技术在楼宇自控中的核心价值 在智能楼宇的自动化控制中,电力载波技术(PLC)凭借其独特的优势,正成为构建高效、稳定、灵活系统的核心解决方案。它利用现有电力线路传输数据,无需额外布…...
服务器硬防的应用场景都有哪些?
服务器硬防是指一种通过硬件设备层面的安全措施来防御服务器系统受到网络攻击的方式,避免服务器受到各种恶意攻击和网络威胁,那么,服务器硬防通常都会应用在哪些场景当中呢? 硬防服务器中一般会配备入侵检测系统和预防系统&#x…...
跨链模式:多链互操作架构与性能扩展方案
跨链模式:多链互操作架构与性能扩展方案 ——构建下一代区块链互联网的技术基石 一、跨链架构的核心范式演进 1. 分层协议栈:模块化解耦设计 现代跨链系统采用分层协议栈实现灵活扩展(H2Cross架构): 适配层…...
【Go】3、Go语言进阶与依赖管理
前言 本系列文章参考自稀土掘金上的 【字节内部课】公开课,做自我学习总结整理。 Go语言并发编程 Go语言原生支持并发编程,它的核心机制是 Goroutine 协程、Channel 通道,并基于CSP(Communicating Sequential Processes࿰…...
linux 下常用变更-8
1、删除普通用户 查询用户初始UID和GIDls -l /home/ ###家目录中查看UID cat /etc/group ###此文件查看GID删除用户1.编辑文件 /etc/passwd 找到对应的行,YW343:x:0:0::/home/YW343:/bin/bash 2.将标红的位置修改为用户对应初始UID和GID: YW3…...
C# SqlSugar:依赖注入与仓储模式实践
C# SqlSugar:依赖注入与仓储模式实践 在 C# 的应用开发中,数据库操作是必不可少的环节。为了让数据访问层更加简洁、高效且易于维护,许多开发者会选择成熟的 ORM(对象关系映射)框架,SqlSugar 就是其中备受…...
前端开发面试题总结-JavaScript篇(一)
文章目录 JavaScript高频问答一、作用域与闭包1.什么是闭包(Closure)?闭包有什么应用场景和潜在问题?2.解释 JavaScript 的作用域链(Scope Chain) 二、原型与继承3.原型链是什么?如何实现继承&a…...
什么?连接服务器也能可视化显示界面?:基于X11 Forwarding + CentOS + MobaXterm实战指南
文章目录 什么是X11?环境准备实战步骤1️⃣ 服务器端配置(CentOS)2️⃣ 客户端配置(MobaXterm)3️⃣ 验证X11 Forwarding4️⃣ 运行自定义GUI程序(Python示例)5️⃣ 成功效果
一、my.cnf配置详解 我们知道安装MySQL有两种方式来安装咱们的MySQL数据库,分别是二进制安装编译数据库或者使用三方yum来进行安装,第三方yum的安装相对于二进制压缩包的安装更快捷,但是文件存放起来数据比较冗余,用二进制能够更好管理咱们M…...
uniapp 字符包含的相关方法
在uniapp中,如果你想检查一个字符串是否包含另一个子字符串,你可以使用JavaScript中的includes()方法或者indexOf()方法。这两种方法都可以达到目的,但它们在处理方式和返回值上有所不同。 使用includes()方法 includes()方法用于判断一个字…...

