当前位置：首页 > news >正文

EfficientDet: Scalable and Efficient Object Detection

news 2026/2/9 17:23:44

CVPR2020 V7 Mon, 27 Jul 2020 引用量：243 机构：Google

贡献：1>提出了多尺度融合网络BiFPN 2>对backbone、feature network、box/class prediction network and resolution进行复合放缩，有着不同的性能表现，以适应不同资源和应用。

views：1> 首先讨论BiFPN，作者只描写了直觉上这样子，整体的结构就是在PANet上进行了修改，或者说图2的c、d其实可以看作是图2(b)的模型剪枝。此外，图2(d)又加入了快捷连接（感觉可类似ResNet），采用了Attention对每个级别的feature map进行加权融合。（这个好像没那么亮眼） 2> 对backbone、feature network、box/class prediction network and resolution进行复合放缩，在介绍这里时，作者反复引用了[39]，通过启发式算法（这个没介绍）将复合放缩融合到一起，提出了一系列模型，在2020初，霸榜各大榜单。

Ideas：能否借鉴多尺度融合方式进行模态数据的融合。

摘要：
研究了用于目标检测的神经网络体系结构设计选择，首先，提出了一种加权双向特征金字塔网络（bi-directional feature pyramid network）（BiFPN），该网络可快速进行多尺度特征融合，其次，提出了
一种复合缩放方法（compound scaling method），可同时对all backbone、feature network and box/class prediction均匀地缩放分辨率、深度、宽度。基于此和更好的backbone，我们提出了efficientdet。EfficientDet-D7在coco上实现55.1AP，77M，410B FLOPs，尺寸缩小了4-9倍，FLOPs减少了13-42倍。

1.Introduction
模型效率对于目标检测越来越重要，很多工作通过采用one-stage、anchor-free、compress model来实现，但会牺牲准确性。
提出问题（问题导向型文章）：是否有可能在广泛的资源约束中构建更高准确性和更高效率的可扩展检测体系结构？基于一阶段检测器，检测backbone，feature fusion，class/box network，提出两点挑战：
挑战1：有效的多尺度特征融合---FPN被广泛用于multi-scale feature fusion（neck部分），PANet和NAS-FPN为cross-scale feature fusion开发了更多的网络结构。不同的输入特征具有不同的分辨率，观测到它们通常不均等影响融合输出特征，故提出了BiFPN。BiFPN引入了可学习权重了解不同输入特征的重要性（起到了一种Attention机制作用），同时反复应用自上而下和自下而上的多尺度融合（作为一个基本层，反复应用，更好的融合多尺度）。
挑战2：模型缩放---先前的工作主要依赖于较大的backbone或较大的input image size，以实现更高的准确性。我们观察到按比例缩放feature network和box/class prediction netwrok对于同时考虑精度和效率至关重要。
EfficientNet+BiFPN+compound scaling = EfficientDet。在COCO和VOC上达到SOTA性能。

2.Related Work
One-Stage Detector: 根据它们是否具有interest proposal step
l Multi-Scale Feature Representations: 目标检测的主要困难是有效地表现和处理多尺度特征。FPN提出一种自上而下的途径来组合多尺度特征。PANet提出一种额外的自下而上的路径聚合网络，STDL提出一个尺度转换模块来利用跨尺度特征。M2det提出了一个U形模块来融合多尺度特征，G-FRNet提出用于跨特征控制信息流门单元。尽管NAS-FPN有很好的性能，但耗费大量时间，生成的要素网络是不规则的，难以解释。本文旨在更直观，更原则的方式优化多尺度特征融合。
Model Scaling：更大的backbone，或增加输入图像尺寸，最近，[39]通过共同扩大网络的宽度，深度和分辨率，证明了图像分类的卓越模型效率。

其中，resize通常表示upsampling or downsampling用于分辨率匹配，Conv表示卷积操作。
3.2 Cross-Scale Connections
自上而下的FPN受到单向信息流的限制。PANet添加了一个额外的自下而上的路径聚合网络，NAS-FPN使用neural architecture search搜索特定的网络拓扑结构，网络不规则，难以解释或修改（NAS感觉有点像大network进行神经元pruning ，没了解过）。
提出BiFPN，根据直觉：1>如果一个节点只有一个输入边且没有特征融合，那么它对融合不同特征的网络有很少的贡献，简化双向网络（这感觉有点牵强） 2>原始输入和输出节点处于同一级别，添加一条额外的边（类shortcut） 3>将每个双向路径视为一个feature network layer，重复多次以获得high-level feature fusion。
3.3 Weighted Feature Fusion
常见融合方法：调整为相同的分辨率，对其求和。
提出添加额外的权重对于每个输入，考虑三种加权融合方法：

EfficientDet: Scalable and Efficient Object Detection

CVPR2020 V7 Mon, 27 Jul 2020 引用量：243 机构：Google 贡献：1>提出了多尺度融合网络BiFPN 2>对backbone、feature network、box/class prediction network and resolution进行复合放缩，有着不同的…...

编程日记 2023/10/16 2:11:48

【数据结构】二叉树链式存储及遍历

二叉树链式存储及遍历文章目录二叉树链式存储及遍历前言实现过程代码实现源代码总结前言本文章中的内容参考于王道数据结构考研书，如果你对该部分的内容的记忆有所模糊，可以阅读我的文章再加深印象实现过程 1.定义二叉树结构体 2.初始化二叉树的根结…...

编程日记 2023/10/16 2:10:47

数字孪生技术：新零售的未来之路

随着科技的不断进步，新零售产业正经历着巨大的变革。数字孪生作为一种新兴技术正在加速这一变革的进程。它不仅为新零售企业带来了更高效的运营方式，还为消费者提供了更个性化、便捷的购物体验。那么，数字孪生技术究竟如何在新零售产业中发挥…...

编程日记 2023/10/16 2:09:46

NIO教程

一，概述原本的java是基于同步阻塞式的i/o通信（bio) 性能低下，所以出现了nio这种非阻塞式的二，Java 的I/O演进之路 2.1 i/o模型基本说明 i/o模型：就是用什么样的通道或者说通信模式和架构进行数据的传输和接收&am…...

编程日记 2023/10/16 2:07:45

【MySQL】表的内连和外连

文章目录一. 内连接二. 外连接1. 左外连接2. 右外连接一. 内连接利用where子句对两种表形成的笛卡尔积进行筛选，其实就是内连接的一种方式另一种方式是inner join select 字段 from 表1 inner join 表2 on 连接条件 and 其他条件现在有如下表 mysql> desc…...

编程日记 2023/10/16 2:06:43

文心一言：文心大模型 4.0 即将发布

本心、输入输出、结果文章目录文心一言：文心大模型 4.0 即将发布前言文心 4.0 的成本问题架构文心 4.0 是否可以对标 GPT-4文心4.0 会不会收费弘扬爱国精神文心一言：文心大模型 4.0 即将发布编辑：简简单单 Online zuozuo 地址：https://blog.csdn.net/qq_15071263 前言 …...

编程日记 2023/10/16 2:05:42

HTML笔记

注释标签： 标题标签：（作用范围依次递减） <h1></h1> <h2></h2> <h3></h3> <h4></h4> <h5></h5> <h6></h6> 段落标签：<p&g…...

编程日记 2023/10/16 2:04:41

design compiler中的drc规则详解

design compiler中的drc规则详解 DRC是什么？DRC分类各个DRC的含义写在最后 DRC是什么？ 本文讨论的DRC即是Design Rule Constraint,而不是Design Rule Check，后者是物理端或者后端的一个关键步骤。 DRC分类 DRC为DC中的一个约束大类&#x…...

编程日记 2023/10/16 2:03:40

CEC2013（MATLAB）：螳螂搜索算法（Mantis Search Algorithm，MSA）求解CEC2013

一、螳螂搜索算法螳螂搜索算法（Mantis Search Algorithm，MSA）由Mohamed Abdel-Basset等人于2023年提出，该算法模拟螳螂独特的狩猎和性同类相食行为。MSA由三个优化阶段组成，包括寻找猎物（探索&#xff09…...

编程日记 2023/10/16 2:02:38

【错误：No package snapd available.】在 CentOS 上启用 snap 并安装 snapd

参考：Install snapd on CentOS using the Snap Store | Snapcraft sudo yum install epel-releasesudo yum install snapd...

编程日记 2023/10/16 2:01:37

Shell命令笔记2

大家好，分享下最近工作中用得比较多的shell命令，希望对大家有帮助。获取数组长度： ${#array_name[*]}获取脚本相对路径 script_path$(dirname "$0")获取脚本的名字 script_name$(basename "$0")获取脚本的绝对路径 …...

编程日记 2023/10/16 2:00:36

怎么团队合作，协作开发

一、代码托管平台我是在大一下的一个竞赛中接触到的代码托管平台那个时候我也算是什么都不会的，不过不得不说这个确实比较重要，对我造成了一些冲击在我看来，代码托管平台的作用就是在一个中转站（仓库）上存储我们写…...

编程日记 2023/10/16 1:59:35

python 练习--更新

1.判断一个列表中的数值是否全部小于某个数方法一：利用if函数 （只要列表中有一个数字比大就可以终止比较） n int(input("请输入需要比较的数字:")) arr1 [1,3,4,5,8] index 0 for i in arr1:if i > n:index 1continue…...

编程日记 2023/10/16 1:57:32

【Java 进阶篇】JavaScript 事件详解

在本篇博客中，我们将深入探讨JavaScript事件，这是网页交互的核心。我们将从什么是事件开始，然后逐步介绍事件的类型、如何注册事件、事件处理程序、事件对象以及事件冒泡等相关内容。最终，我们将提供大量的示例代码来帮助您更好地…...

编程日记 2023/10/16 1:56:31

动态内存管理+柔性数组+经典笔试题

💓博客主页：江池俊的博客⏩收录专栏：C语言进阶之路👉专栏推荐：✅C语言初阶之路 ✅数据结构探索💻代码仓库：江池俊的代码仓库🎉欢迎大家点赞👍评论📝收藏⭐ 文…...

编程日记 2023/10/16 1:53:28

SQL和Python，哪个更容易自学？哪个更适合数据工作的编程新手？

如果你想从事数据工作，比如数据分析、数据开发、数据科学等，你可能会遇到这样的问题：SQL和Python哪个更容易自学？哪个更有用？哪个更有前途？其实这两种语言都是数据工作的重要技能，但它们的特点和…...

编程日记 2023/10/16 1:52:27

修改CDB的max_string_size，从STANDARD到EXTENDED

操作过程参考19c官方文档。具体过程如下。先修改参数并重启： -- 修改参数 -- 注意：即使在 MAX_STRING_SIZE 设置为 EXTENDED 之后，根仍继续使用 STANDARD 语义。 -- 在根中将 MAX_STRING_SIZE 设置为 EXTENDED 的原因是，CDB 中…...

编程日记 2023/10/16 1:51:26

Python 字典

目录 1 字典介绍2 字典的创建3 字典元素的访问4 字典元素添加、修改、删除5 序列解包6 表格数据使用字典和列表存储，并实现访问7 字典核心底层原理(重要)7.1 将一个键值对放进字典的底层过程7.2 扩容7.3 根据键查找“键值对”的底层过程7.4 用法总结： 声…...

编程日记 2023/10/16 1:49:23

【nginx】nginx部署升级htpp+websocket访问

关注todo-step1和todo-step2就行了： user root; …… http {### Basic Settings##sendfile on;tcp_nopush on;types_hash_max_size 2048;client_max_body_size 10240m;include /etc/nginx/mime.types;default_type application/octet-stream;# 配置websocket访问 *…...

编程日记 2023/10/16 1:48:21

C# 生成JWT的Token

using JWT.Algorithms; using JWT; using JWT.Serializers;private string GetToken(string timeStamp, string deptName, string doctorName, string idNo){string token string.Empty;string appID config.AppID;string secretKey config.AppSecret;//十分钟有效期long ex…...

编程日记 2023/10/16 1:46:20

EfficientDet: Scalable and Efficient Object Detection

相关文章：

EfficientDet: Scalable and Efficient Object Detection

【数据结构】二叉树链式存储及遍历

数字孪生技术：新零售的未来之路

NIO教程

【MySQL】表的内连和外连

文心一言：文心大模型 4.0 即将发布

HTML笔记

design compiler中的drc规则详解

CEC2013（MATLAB）：螳螂搜索算法（Mantis Search Algorithm，MSA）求解CEC2013

【错误：No package snapd available.】在 CentOS 上启用 snap 并安装 snapd

Shell命令笔记2

怎么团队合作，协作开发

python 练习--更新

【Java 进阶篇】JavaScript 事件详解

动态内存管理+柔性数组+经典笔试题

SQL和Python，哪个更容易自学？哪个更适合数据工作的编程新手？

修改CDB的max_string_size，从STANDARD到EXTENDED

Python 字典

【nginx】nginx部署升级htpp+websocket访问

C# 生成JWT的Token

Linux简单的操作

WEB3全栈开发——面试专业技能点P2智能合约开发（Solidity）

AI编程--插件对比分析：CodeRider、GitHub Copilot及其他

JDK 17 新特性

华为云Flexus+DeepSeek征文｜DeepSeek-V3/R1 商用服务开通全流程与本地部署搭建

【JavaWeb】Docker项目部署

动态 Web 开发技术入门篇

GO协程(Goroutine)问题总结

Bean 作用域有哪些？如何答出技术深度？

对象回调初步研究