当前位置: 首页 > article >正文

YOLO26最新创新改进系列:(粉丝反馈涨点模型TOP3)融合轻量级网络Ghostnet(幽灵卷积or幻影卷积),实测参数量降低!轻量化水文小神器!

YOLO26最新创新改进系列粉丝反馈涨点模型TOP3融合轻量级网络Ghostnet(幽灵卷积or幻影卷积)实测参数量降低轻量化水文小神器购买相关资料后畅享一对一答疑畅享超多免费持续更新且可大幅度提升文章档次的纯干货工具原文戳这里GhostNet: More Features from Cheap Operations摘要该论文提供了一个全新的Ghost模块旨在通过廉价操作生成更多的特征图。基于一组原始的特征图作者应用一系列线性变换以很小的代价生成许多能从原始特征发掘所需信息的“Ghost”特征图Ghost feature maps。该Ghost模块即插即用通过堆叠Ghost模块得出Ghost bottleneck进而搭建轻量级神经网络——GhostNet。幻影卷积步骤先进行1 x 1卷积聚合通道间的信息特征然后再使用分组卷积生成新的特征图。为了减少网络计算量作者将传统的卷积分成两步进行首先通过传统的卷积生成channel较小的特征图以较少的计算量然后在得到的特征图的基础上通过cheap operation(depthwise conv廉价操作)再进一步减少计算量生成新的特征图最后将两组特征图拼接到一起得到最终的output。卷积操作是卷积-批归一化BN-非线性激活全套组合而所谓的线性变换或者廉价操作cheap operation均指普通卷积不含批归一化和非线性激活。一 简介在效果较好的CNN模型中特征图存在冗余是非常重要的但是很少有人在模型结构设计上考虑特征图冗余问题从特征图冗余问题出发提出一个仅通过少量计算cheap operations就能生成大量特征图的结构——Ghost ModuleGhost Module通过一系列线性操作a series of linear transformations生成特征图其中经过线性操作生成的特征图称为ghost feature maps而被操作的特征图称为intrinsic feature mapsGhost Module的优点即插即用Ghost Module是一个即插即用模块可以无缝衔接现有的CNN中使用Ghost Module组成的Ghost bottlenecks设计出GhostNet在ILSVRC-2012上top-1超过Mobilenet-V3并且参数(params)更少。本文作者在观察ResNet50第一个残差块输出的特征图时发现有许多输出特征很相似图一中的红、绿、蓝框的特征图作者认为很相似基本只要进行简单的线性变换就能得到而不需要进行复杂的非线性变换得到作者该对其中的一个特征图可以通过廉价操作图中用扳手表示将另一特征图变换而获得可以认为其中一个特征图是另一个的“Ghost”。因为本文提出并非所有特征图都要用卷积操作来得到“Ghost”特征图可以用更廉价的操作来生成。二 方法Ghost Bottlenecks利用Ghost模块的优势作者介绍了专门为小型CNN设计的Ghost bottleneckG-bneck。如图所示Ghost bottleneck似乎类似于ResNet中的基本残差块Basic Residual Block其中集成了多个卷积层和shortcut。Ghost bottleneck主要由两个堆叠的Ghost模块组成第一个Ghost模块用作扩展层增加了通道数这里将输出通道数与输入通道数之比称为expansion ratio第二个Ghost模块减少通道数以与shortcut路径匹配,然后使用shortcut连接这两个Ghost模块的输入和输出。这里借鉴了MobileNetV2第二个Ghost模块之后不使用ReLU因为深度卷积后再加ReLU效果会变差可能是深度卷积输出太浅了, 应用 ReLU会带来信息丢失其他层在每层之后都应用了批量归一化BN和ReLU非线性激活。上述Ghost bottleneck适用于stride 1对于stride 2的情况shortcut路径由下采样层和stride 2的深度卷积Depthwise Convolution来实现。出于效率考虑Ghost模块中的初始卷积是逐点卷积Pointwise Convolution。基于Ghost bottleneck作者提出GhostNet如下所示1.作者遵循MobileNetV3的基本体系结构的优势然后使用Ghost bottleneck替换MobileNetV3中的bottleneck2.GhostNet主要由一堆Ghost bottleneck组成其中Ghost bottleneck以Ghost模块为构建基础第一层是具有16个卷积核的标准卷积层然后是一系列Ghost bottleneck通道逐渐增加。这些Ghost bottleneck根据其输入特征图的大小分为不同的阶段除了每个阶段的最后一个Ghost bottleneck是stride 2其他所有Ghost bottleneck都以stride 1进行应用3.最后利用全局平均池和卷积层将特征图转换为1280维特征向量以进行最终分类。SE模块也用在了某些Ghost bottleneck中的残留层4.与MobileNetV3相比这里用ReLU换掉了Hard-swish激活函数。尽管进一步的超参数调整或基于自动架构搜索的Ghost模块将进一步提高性能但下表所提供的架构提供了一个基本设计参考。三 结论1.Ghost模块消融实验当s2、d3的时候Ghost模块的性能优于更小或更大的Ghost模块。这是因为大小为1的内核无法在特征图上引入空间信息而较大的内核例如d5或d7会导致过拟合和更多计算。2.特征图可视化生成的特征足够灵活可以满足特定任务的需求。3.ImageNet分类数据集通常较大的FLOPs会在这些小型网络中带来更高的准确性这表明了它们的有效性。而GhostNet在各种计算复杂度级别上始终优于其他竞争对手主要是因为GhostNet在利用计算资源生成特征图方面效率更高。4.硬件推理速度作者的模型总体上胜过其他最新模型例如谷歌MobileNet系列ProxylessNASFBNet和MnasNet。5.COCO目标检测数据集GhostNet可以在单阶段的RetinaNet和两阶段的Faster R-CNN框架上达到和MobileNetV2和MobileNetV3类似的mAP。四 修改步骤4.1 修改YAML文件4.2 新建.py4.3 修改tasks.py五 验证是否成功即可执行命令python train.py改完收工关注B站Ai学术叫叫兽er从此走上科研快速路遥遥领先同行写在最后学术因方向、个人实验和写作能力以及具体创新内容的不同而无法做到一通百通关注我CSDN、B站及抖音Ai学术叫叫兽在所有B站资料中留下联系方式以便在科研之余为家人们答疑解惑本up主获得过国奖发表多篇SCI擅长目标检测领域拥有多项竞赛经历拥有软件著作权核心期刊等经历。因为经历过所以更懂小白的痛苦因为经历过所以更具有指向性的指导祝所有科研工作者都能够在自己的领域上更上一层楼以下为给大家庭小伙伴们免费更新过的绘图代码均配有详细教程超小白也可一键操作! 后续更多提升文章档次的资料的更新请大家庭的小伙伴关注我B站及抖音Ai学术叫叫兽

相关文章:

YOLO26最新创新改进系列:(粉丝反馈涨点模型TOP3)融合轻量级网络Ghostnet(幽灵卷积or幻影卷积),实测参数量降低!轻量化水文小神器!

YOLO26最新创新改进系列:(粉丝反馈涨点模型TOP3)融合轻量级网络Ghostnet(幽灵卷积or幻影卷积),实测参数量降低!轻量化水文小神器! 购买相关资料后畅享一对一答疑! 畅享超多免费持续更新且可大…...

终极塞尔达旷野之息存档修改器:5分钟掌握免费图形化编辑技巧

终极塞尔达旷野之息存档修改器:5分钟掌握免费图形化编辑技巧 【免费下载链接】BOTW-Save-Editor-GUI A Work in Progress Save Editor for BOTW 项目地址: https://gitcode.com/gh_mirrors/bo/BOTW-Save-Editor-GUI 你是否曾经在《塞尔达传说:旷野…...

FPGA新手避坑指南:编码器/译码器仿真波形老不对?检查这5个ModelSim设置细节

FPGA新手避坑指南:编码器/译码器仿真波形老不对?检查这5个ModelSim设置细节 刚接触FPGA开发的朋友们,是否经常遇到这样的场景:你按照教程一字不差地敲完了8-3编码器或3-8译码器的Verilog代码,满心期待地在ModelSim中运…...

Windows Subsystem for Android 完全指南:在 Windows 11 上畅享 Android 应用生态

Windows Subsystem for Android 完全指南:在 Windows 11 上畅享 Android 应用生态 【免费下载链接】WSA Developer-related issues and feature requests for Windows Subsystem for Android 项目地址: https://gitcode.com/gh_mirrors/ws/WSA 你是否曾经想过…...

从‘天书’到‘白话’:一个药学专业玩家如何逆向工程墨水屏LUT并调整局刷参数

从‘天书’到‘白话’:一个药学专业玩家如何逆向工程墨水屏LUT并调整局刷参数 墨水屏技术因其低功耗特性在电子价签、阅读器等场景广泛应用,但驱动芯片的底层参数配置常让非电子专业开发者望而生畏。当规格书中的术语如同密码,而开源代码中的…...

为什么你的Keil工程总是报GCC pragma错误?深入解析arm_math.h与编译器兼容性问题

为什么你的Keil工程总是报GCC pragma错误?深入解析arm_math.h与编译器兼容性问题 当你在Keil MDK环境下开发STM32项目时,是否曾在编译过程中遭遇过这样的警告信息? ..\CORE\arm_math.h(293): warning: #2803-D: unrecognized GCC pragma #pra…...

Vant动态表单封装实战:从零构建可配置的VForm组件

1. 为什么需要封装Vant动态表单组件 在移动端开发中,表单是最常见的交互场景之一。我做过一个统计,在典型的B端应用中,表单页面占比超过60%。但每次遇到需要收集用户信息的场景,都让我头疼不已 - 特别是当表单字段多达几十个&…...

好写作AI:科研绘图的“学术导航仪”,专治“做了研究却画不出来”

“老师,我研究做了半年,数据也有了,结果也挺有意思的,但要把这些东西画成论文里的图,我连从哪里开始都不知道。” 这样的私信,我每个月至少收到十几条。很多人以为科研绘图的核心问题是“不会画”&#xf…...

芯驰E3-gateway开发板Windows环境搭建保姆级教程(含IAR配置与常见坑点)

芯驰E3-gateway开发板Windows环境搭建全流程解析与实战避坑指南 拿到芯驰E3-gateway开发板的第一天,我对着官方文档折腾了整整8小时——环境变量报错、IAR工程无法生成、烧录后芯片不响应...这些坑几乎让项目还没开始就濒临放弃。如果你也正在经历这种痛苦&#xf…...

RS485通信冲突?手把手教你用C语言实现一个简单的“软件仲裁”驱动库

RS485通信冲突的软件仲裁解决方案:从原理到C语言实现 在工业自动化、智能楼宇等场景中,RS485总线因其抗干扰能力强、传输距离远等优势被广泛应用。但当多个设备同时尝试发送数据时,总线冲突问题便成为工程师们头疼的难题。与CAN总线不同&…...

Vant动态表单封装实战:从零构建可配置化VForm组件

1. 为什么需要封装Vant动态表单组件 在移动端开发中,表单是最常见的交互元素之一。我做过一个社区健康调查项目,需要收集居民的家庭信息、健康状况等数据,整个应用包含5个Tab页,每个Tab下都有7-8个表单字段。如果直接用Vant的Fiel…...

第一个FastAPI应用:从Hello World到完整接口

003、第一个FastAPI应用:从Hello World到完整接口 一、调试台前的困惑 昨天隔壁组的小王跑过来问:“FastAPI 文档里跑起来明明显示 http://127.0.0.1:8000,为什么我手机连同一个Wi-Fi就是访问不了?” 这个问题太典型了——很多工程师第一个坎不是语法,而是“服务到底跑在…...

Ubuntu 20.04开发踩坑记:系统自带OpenSSL为啥编译总报错?手把手教你用libssl-dev搞定

Ubuntu 20.04开发实战:解密OpenSSL开发环境配置的底层逻辑 刚接触Linux开发的程序员们,是否曾在Ubuntu上编写网络或加密相关代码时,遭遇过这样的场景:系统明明能正常使用openssl命令,但编译时却疯狂报错"找不到op…...

开发环境搭建:Python虚拟环境与依赖管理

002、开发环境搭建:Python虚拟环境与依赖管理 昨天调试同事的FastAPI项目时,又遇到了经典的依赖冲突问题——他的本地环境能跑,我的机器上死活起不来。uvicorn启动直接报ImportError,一查发现是pydantic版本不匹配。这种问题在团队协作中太常见了,根源往往在于环境隔离没…...

37 FastAPI框架概述与核心特性解析

FastAPI框架概述与核心特性解析 昨天调试一个老项目,同事用Flask写的传感器数据接口突然扛不住压力了。查看日志发现请求排队严重,JSON解析耗时占了大部分时间。我盯着那串用了五年的request.get_json()代码,突然意识到——是时候换个工具了。这就是我认真研究FastAPI的起点…...

保姆级教程:用Python脚本一键解析CCPD车牌数据集,生成YOLO格式标注

零基础实战:Python自动化解析CCPD车牌数据集并生成YOLO标注文件 当你第一次打开CCPD数据集文件夹时,那些看似随机的文件名是否让你感到困惑?比如这个典型的例子:01-86_91-298&341_449&414-458&394_308&410_304&am…...

机器学习学习路径:10种类型与资源匹配指南

1. 机器学习入门:如何找到适合自己的学习路径第一次接触机器学习时,我像大多数初学者一样陷入了选择困难。网上充斥着各种教程、书籍和课程推荐,但真正开始学习后才发现,很多资源要么过于理论化,要么与我的实际需求不匹…...

real-anime-z电商应用案例:动漫风商品详情页图+短视频封面批量生成

real-anime-z电商应用案例:动漫风商品详情页图短视频封面批量生成 1. 项目背景与价值 在电商运营中,商品详情页和短视频封面是吸引用户点击的关键视觉元素。传统方式需要设计师手动制作,耗时耗力且难以保持风格统一。real-anime-z模型提供了…...

Qianfan-OCR入门必看:Apache 2.0协议下商用部署与微调合规操作指南

Qianfan-OCR入门必看:Apache 2.0协议下商用部署与微调合规操作指南 1. 项目概述 Qianfan-OCR是百度千帆推出的开源端到端文档智能多模态模型,基于4B参数的Qwen3-4B语言模型构建。作为Apache 2.0协议下的开源项目,它提供了完整的商用授权和微…...

别再乱用OneHot编码了!用Pandas的get_dummies处理分类变量,这3个参数能帮你避开90%的坑

别再乱用OneHot编码了!用Pandas的get_dummies处理分类变量,这3个参数能帮你避开90%的坑 在数据科学项目中,分类变量的编码是特征工程中最容易被低估的环节之一。许多从业者习惯性地使用OneHotEncoder或简单调用pd.get_dummies(),却…...

别再手动算积分了!用MATLAB integral函数搞定这6种‘奇葩’积分(含分段、无穷限)

别再手动算积分了!用MATLAB integral函数搞定这6种‘奇葩’积分(含分段、无穷限) 在科研计算和工程仿真中,积分问题就像隐藏在数据背后的幽灵——当你在信号处理中分析频谱特性时,在物理建模中求解场分布时&#xff0c…...

告别Three.js卡顿:用Potree在Web端流畅渲染百万级点云(附Vue集成踩坑实录)

百万级点云Web渲染实战:从Three.js到Potree的性能跃迁与Vue 3深度集成 当激光雷达扫描的.las文件在Three.js中卡成幻灯片时,我们终于意识到传统方案的天花板。某次城市级BIM项目验收前夜,甲方临时要求增加20个扫描站点的实时对比功能&#xf…...

从AlexNet到VGG19:为什么说‘小卷积核+深度’是CNN进化的关键一步?

从AlexNet到VGG19:小卷积核如何重塑深度学习的视觉革命 2014年,当牛津大学视觉几何组(Visual Geometry Group)提交那篇名为《Very Deep Convolutional Networks for Large-Scale Image Recognition》的论文时,可能没想…...

点云数据预处理避坑指南:为什么你的模型训练效果差?可能忽略了这三点(尺度/旋转/排列)

点云数据预处理避坑指南:为什么你的模型训练效果差?可能忽略了这三点(尺度/旋转/排列) 当你在训练点云深度学习模型时,是否遇到过这样的困境:按照教程跑通了PointNet在ShapeNet上的基准测试,换成…...

配置:从零搭建Python、PyCharm、PyTorch与Anaconda的AI开发环境

1. Python安装与配置 作为AI开发的基础语言,Python的安装是第一步。我推荐直接从官网下载最新稳定版,目前主流是Python 3.8-3.11版本。安装时有个关键细节经常被忽略:一定要勾选"Add Python to PATH"选项。这个选项相当于给系统装了…...

考研数学二:3个月零基础速成295分,我的极限、积分与微分方程实战笔记(附避坑指南)

考研数学二:3个月零基础速成295分,我的极限、积分与微分方程实战笔记(附避坑指南) 当推免失败的通知突然降临,距离考研仅剩三个月时,我面对着几乎空白的数学二基础。作为计算机专业考生,数学二是…...

3步彻底告别激活烦恼:KMS_VL_ALL_AIO智能激活方案实战指南

3步彻底告别激活烦恼:KMS_VL_ALL_AIO智能激活方案实战指南 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 你是否还在为Windows和Office的激活问题而烦恼?每次重装系统都…...

STM32F407 RTC入侵检测实战:用按键模拟入侵事件(附消抖技巧)

STM32F407 RTC入侵检测实战:用按键模拟入侵事件(附消抖技巧) 在嵌入式系统开发中,实时时钟(RTC)模块的安全功能往往被忽视,而入侵检测恰恰是保护关键数据免遭篡改的最后一道防线。本文将带您深入…...

解锁Bootloader前必读:联想ZUI手机保修政策、数据备份与常见失败原因解析

联想ZUI手机Bootloader解锁全指南:风险规避与实战解决方案 Bootloader解锁是Android设备深度定制的必经之路,但对于联想ZUI用户而言,这更像是一场需要精密准备的"外科手术"。去年社区调研数据显示,23%的变砖案例源于解锁…...

Labelme标注踩过的坑:中文标签、复杂遮挡、数据集划分,一个脚本全搞定

Labelme高级标注实战:破解中文标签、复杂遮挡与数据集划分难题 在计算机视觉项目中,数据标注质量直接决定模型性能上限。作为最受欢迎的标注工具之一,Labelme凭借其灵活性和开源特性成为众多研究团队的首选。但当项目规模扩大、场景复杂度提升…...