当前位置: 首页 > article >正文

FogGate-YOLO:直击雾天检测痛点,基于通道选择的 YOLOv8 优化方案

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID计算机视觉研究院学习群扫码在主页获取加入方式https://pmc.ncbi.nlm.nih.gov/articles/PMC13030070/pdf/sensors-26-01811.pdf计算机视觉研究院专栏Column of Computer Vision Institute本文提出的FogGate-YOLO—— 一款基于 YOLOv8n 优化的雾天目标检测框架摒弃传统预处理思路创新性引入GroupGatedConv和C2fGated两个模块通过分层级的粗到精通道选择策略直接强化模型的特征表示能力在几乎不增加计算开销的前提下显著提升雾天环境下的目标检测鲁棒性。PART/1困境与思路在自动驾驶视觉检测中雾滴的大气散射会导致图像对比度下降、目标特征被遮蔽使得常规检测算法的漏检、误检率大幅上升有研究表明浓雾下 Faster R-CNN 的检测精度会从晴天的 91.55% 骤降至 57.75%。现有雾天检测方法多聚焦图像去雾预处理但这类方法存在明显短板依赖物理模型的雾密度估计难以适配不同雾浓度的复杂场景额外的预处理步骤还会增加计算成本不符合自动驾驶的实时性要求。而基于深度学习的单阶段检测器如 YOLO 系列因推理速度快成为实时检测的主流选择但在雾天场景中其特征提取能力易受雾噪干扰。为此研究团队从特征层优化出发将通道选择机制融入 YOLOv8n 的核心网络结构通过自适应筛选有效特征、抑制雾噪实现检测性能的提升且全程无需额外的图像预处理。PART/2核心架构FogGate-YOLO 核心架构双模块打造分层通道选择FogGate-YOLO 以轻量级的 YOLOv8n 为基础在其骨干网络Backbone和颈部网络Neck中嵌入自主设计的GroupGatedConv和C2fGated模块形成粗粒度通道筛选 细粒度特征校准的分层处理策略整体网络架构如图 1 所示。图 1FogGate-YOLO 网络架构图紫色标注骨干网络修改部分浅蓝色标注颈部网络修改部分1. GroupGatedConv骨干网络的粗粒度通道选择针对雾天场景中中层特征更具判别性的特点该模块被嵌入 YOLOv8n 骨干网络第四层在特征提取的同时完成粗粒度通道筛选既抑制雾噪又保留目标的核心结构特征。其核心原理是将输出通道分组通过门控机制为每个通道组学习自适应权重选择性保留与目标相关的通道特征、抑制雾诱导的背景噪声同时采用分组卷积的设计大幅降低计算开销模块架构如图 2 所示。图 2GroupGatedConv 模块架构图不同颜色代表不同通道组特征图圆圈为乘法操作箭头为特征流方向2. C2fGated多分支融合后的细粒度特征校准基于 YOLOv8 的 C2f 模块优化而来在特征拼接后嵌入ECA 高效通道注意力机制实现多分支融合后的细粒度通道重校准模块架构如图 3 所示。图 3C2fGated 模块架构图在 C2f 特征拼接后加入 ECA 注意力最后通过 1×1 卷积调整输出通道该模块被分别嵌入骨干网络第七层和颈部网络第十九层这两个位置的特征兼具空间细节和语义信息能通过 ECA 机制的局部跨通道交互自适应强调目标相关通道、弱化噪声通道尤其提升浓雾中小目标的检测能力且几乎不增加模型参数和计算量。3. ECA 注意力模块轻量级通道特征增强作为 C2fGated 的核心组件ECA 模块摒弃了传统通道注意力的降维操作通过 1D 卷积捕捉通道间的局部依赖关系自适应确定卷积核大小在保证特征增强效果的同时将计算开销降至最低模块架构如图 4 所示。图 4ECA 注意力模块架构图箭头为特征流方向圆圈为特征图乘法操作PART/3实验实验验证精度提升且保持轻量级特性为验证 FogGate-YOLO 的实际性能研究团队基于Roboflow 真实雾天数据集2975 张图像8:2 划分训练 / 验证集开展实验以 Recall召回率雾天检测核心指标、mAP50、mAP50-95 为评价标准同时兼顾模型的 GFLOPs计算量和参数量实验环境基于 PyTorch 框架采用 NVIDIA RTX 3090 GPU 训练。1. 对比实验优于主流轻量级 YOLO 模型将 FogGate-YOLO 与 YOLOv5n、YOLOv6n、YOLOv8n、YOLOv11n 等轻量级模型对比结果显示FogGate-YOLO 的 Recall 达到 39.8%较基线 YOLOv8n 提升 2.6%mAP50 达 41.3%优于多数同量级模型。关键是其 GFLOPs 仍为 8.8、参数量仅 3.152M与 YOLOv8n 基本一致远低于 YOLOv5s、YOLOv8s 等大尺寸模型实现了精度提升与轻量级特性的兼顾检测结果对比如图 5 所示。表 1不同检测方法的性能对比表包含 Recall、mAP50、mAP50-95、GFLOPs、Param 指标图 5YOLOv8n 与 FogGate-YOLO 在雾天数据集的检测结果对比图第一行为 YOLOv8n第二行为 FogGate-YOLO2. 消融实验双模块协同实现性能最优为验证两个核心模块的有效性团队开展消融实验结果表明单独加入 C2fGatedRecall 提升 0.6%、mAP50 提升 1.0%单独加入 GroupGatedConvRecall 提升 0.8%双模块协同加入时模型性能达到最优Recall 较基线提升 2.6%且计算开销无明显增加证明了粗粒度筛选 细粒度校准分层策略的互补性和有效性。表 2消融实验结果表包含 YOLOv8n、单模块、双模块组合的各项性能指标3. 训练过程可视化指标收敛稳定FogGate-YOLO 的训练过程指标可视化结果显示其边界框损失、分类损失、分布焦点损失均能快速收敛验证集的 Precision、Recall、mAP50 指标稳定提升无明显过拟合现象证明模型的训练稳定性和泛化能力训练指标变化如图 6 所示。图 6FogGate-YOLO 训练过程指标可视化图包含训练 / 验证集的损失曲线、Precision/Recall/mAP50 变化曲线PART/4结论与展望核心结论FogGate-YOLO 通过GroupGatedConv和C2fGated双模块的协同设计打造了一套适用于雾天环境的无预处理、轻量级、高鲁棒性的交通目标检测方案核心优势体现在摒弃传统图像去雾预处理直接从特征层优化无需估计雾密度适配不同雾浓度的真实场景分层级的通道选择策略实现粗粒度雾噪抑制和细粒度目标特征增强显著提升雾天检测的 Recall 和 mAP双模块设计几乎不增加计算开销和模型参数保持 YOLOv8n 的轻量级特性满足自动驾驶的实时性要求。未来优化方向尽管模型取得了良好的检测效果仍有进一步优化的空间扩充数据集规模增加不同雾浓度、不同场景的样本提升模型的泛化能力深入探索 GroupGatedConv 模块的分组数等超参数实现自适应分组最大化特征筛选效果结合数据增强、迁移学习等技术进一步提升模型在极端浓雾场景中的检测性能与当前先进的雾天检测模型开展对比实验验证算法的竞争力。PART/5研究意义FogGate-YOLO 为恶劣天气下的计算机视觉检测提供了新的研究思路将通道选择机制与 YOLO 系列检测器深度融合跳出了 “先去雾后检测” 的传统框架实现了特征层优化与实时检测的平衡。该方案不仅能应用于自动驾驶的雾天交通目标检测还能为监控摄像头、无人机巡检等视觉检测场景的恶劣天气适配提供技术参考具有重要的工程应用价值。有相关需求的你可以联系我们END转载请联系本公众号获得授权计算机视觉研究院学习群等你加入ABOUT计算机视觉研究院计算机视觉研究院主要涉及深度学习领域主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架提供论文一键下载并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程让大家真正体会摆脱理论的真实场景培养爱动手编程爱动脑思考的习惯往期推荐YOLO-TLA一种基于 YOLOv5 的高效轻量级小目标检测模型ViT-YOLO基于Transformer的用于目标检测的YOLO算法SSMA-YOLO一种轻量级的 YOLO 模型具备增强的特征提取与融合能力适用于无人机航拍的船舶图像检测LUD-YOLO一种用于无人机的新型轻量级目标检测网络Gold-YOLO基于聚合与分配机制的高效目标检测器Drone-YOLO一种有效的无人机图像目标检测「无人机AI」“空中城管”无人机AI光伏巡检自动化解决方案无人机视角下多类别船舶检测及数量统计机场项目解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题2PCNet昼夜无监督域自适应目标检测附原代码YOLO-S小目标检测的轻量级、精确的类YOLO网络大改Yolo框架 | 能源消耗极低的目标检测新框架附论文下载改进的检测算法用于高分辨率光学遥感图像目标检测

相关文章:

FogGate-YOLO:直击雾天检测痛点,基于通道选择的 YOLOv8 优化方案

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式https://pmc.ncbi.nlm.nih.gov/articles/PMC13030070/pdf/sensors-26-01811.pdf计算机视觉研究院专栏Column of Computer Vision Institut…...

Phi-4-mini-reasoning辅助Anaconda环境管理:依赖冲突的智能解决建议

Phi-4-mini-reasoning辅助Anaconda环境管理:依赖冲突的智能解决建议 1. 引言:Python开发者的依赖管理之痛 如果你经常使用Anaconda进行Python开发,一定遇到过这样的场景:当你满怀期待地运行conda install安装新包时,…...

深入解析Node.js事件循环机制

深入解析Node.js事件循环机制 Node.js以其非阻塞I/O和事件驱动特性成为高性能服务端开发的首选,而这一切的核心正是事件循环机制。理解这一机制不仅能帮助开发者优化代码性能,还能避免常见的异步陷阱。本文将带你深入Node.js事件循环的运作原理&#xf…...

openEuler(CentOS8)防火墙firewall与Selinux实战配置指南

1. 防火墙firewalld基础操作指南 刚接触openEuler或CentOS8系统的朋友,经常会遇到服务端口无法访问的问题。这十有八九是防火墙在"作怪"。别担心,今天我就带大家彻底搞定这个安全卫士。 firewalld是新一代动态防火墙管理工具,相比传…...

避坑!这些毕设太好抄了,3000+毕设案例推荐第1062期

621、基于Java的执法部门行政人员智慧管理系统的设计与实现(论文+代码+PPT)执法部门行政人员智慧管理系统主要功能包括:执法单位、执法人员、奖惩记录、培训记录。当前社会信息化水平提升行政执法单位需高效精准管理亟需数字化系统整合信息资…...

原神帧率解锁完全指南:如何安全突破60FPS限制

原神帧率解锁完全指南:如何安全突破60FPS限制 【免费下载链接】genshin-fps-unlock unlocks the 60 fps cap 项目地址: https://gitcode.com/gh_mirrors/ge/genshin-fps-unlock 对于《原神》PC玩家来说,60FPS的帧率限制常常让高性能硬件无法发挥全…...

站群系统的技术内核与商业逻辑:从开源到合正的选择

站群系统的技术内核与商业逻辑:从开源到合正的选择 2026年的春天,数字资产的管理方式正经历一场静默的变革。当单体网站的运营成为常态,一种更高效、更具规模效应的策略——站群管理,正从技术极客的圈子走向更广泛的商业应用。这…...

终极指南:5分钟快速解锁微信网页版,让浏览器中的微信重新可用

终极指南:5分钟快速解锁微信网页版,让浏览器中的微信重新可用 【免费下载链接】wechat-need-web 让微信网页版可用 / Allow the use of WeChat via webpage access 项目地址: https://gitcode.com/gh_mirrors/we/wechat-need-web 还在为微信网页版…...

京东抢购神器:JDspyder自动化脚本完整使用指南

京东抢购神器:JDspyder自动化脚本完整使用指南 【免费下载链接】JDspyder 京东预约&抢购脚本,可以自定义商品链接 项目地址: https://gitcode.com/gh_mirrors/jd/JDspyder 还在为抢不到心仪商品而烦恼吗?JDspyder是一款专业的京东…...

如何用biliTickerBuy实现B站会员购智能抢票?5个实战技巧帮你提升90%成功率

如何用biliTickerBuy实现B站会员购智能抢票?5个实战技巧帮你提升90%成功率 【免费下载链接】biliTickerBuy b站会员购购票辅助工具 项目地址: https://gitcode.com/GitHub_Trending/bi/biliTickerBuy 在B站会员购抢票大战中,你是否总是因为手速不…...

信捷PLC运动控制避坑指南:为什么绝对位置比较比静止判断更靠谱?

信捷PLC运动控制避坑指南:绝对位置比较为何优于静止判断 在工业自动化领域,运动控制的精度和可靠性直接影响着生产效率和产品质量。信捷XDH系列PLC凭借其出色的EtherCAT总线性能和灵活的C语言编程环境,已成为许多设备制造商的首选控制器。然而…...

简单免费:猫抓浏览器插件帮你轻松获取网页视频和音频资源的完整指南

简单免费:猫抓浏览器插件帮你轻松获取网页视频和音频资源的完整指南 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 你是否曾经遇到过这…...

Blender化学品插件终极指南:从零开始创建专业3D分子模型

Blender化学品插件终极指南:从零开始创建专业3D分子模型 【免费下载链接】blender-chemicals Draws chemicals in Blender using common input formats (smiles, molfiles, cif files, etc.) 项目地址: https://gitcode.com/gh_mirrors/bl/blender-chemicals …...

哔哩下载姬DownKyi完全指南:如何免费批量下载B站8K超高清视频

哔哩下载姬DownKyi完全指南:如何免费批量下载B站8K超高清视频 【免费下载链接】downkyi 哔哩下载姬downkyi,哔哩哔哩网站视频下载工具,支持批量下载,支持8K、HDR、杜比视界,提供工具箱(音视频提取、去水印等…...

《信息系统项目管理师教程(第4版)》——采购管理知识要点

以下是《信息系统项目管理师教程(第4版)》第16章“项目采购管理”的核心知识要点梳理,结合教程内容与高频考点整理:一、采购管理基础 1. 采购的定义与类型 定义:项目采购管理包括从项目团队外部获取或购买所需产品、服…...

Windows系统激活难题终极解决方案:KMS_VL_ALL_AIO智能脚本全解析

Windows系统激活难题终极解决方案:KMS_VL_ALL_AIO智能脚本全解析 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 你是否也曾面对Windows系统"未激活"的红色警告束手无策&a…...

万物识别镜像免费体验:无需自己训练模型,开箱即用的识别工具

万物识别镜像免费体验:无需自己训练模型,开箱即用的识别工具 1. 为什么选择万物识别镜像 想象一下,当你看到一张照片时,能立即说出里面的所有物体是什么吗?对于人类来说这可能是个挑战,但对于万物识别镜像…...

GPT-5架构泄露?Kubernetes 1.31发布与Rust重构浪潮下的云原生之变

🔥个人主页:北极的代码(欢迎来访) 🎬作者简介:java后端学习者 ❄️个人专栏:苍穹外卖日记,SSM框架深入,JavaWeb ✨命运的结局尽可永在,不屈的挑战却不可须臾或…...

多Agent技术爆发:28个月速成,企业应用超30%!揭秘AI协作新生态

多Agent协作系统,是指由多个具备独立感知、决策、执行能力的AI智能体,通过标准化通信协议实现专业化分工、自主任务分配与协同问题解决的分布式智能系统,是当前Agentic AI技术从单体工具向生态化自治系统演进的核心方向。 根据中国工业互联网…...

Zotero Citation插件终极指南:让Word文献引用更简单清晰的完整教程

Zotero Citation插件终极指南:让Word文献引用更简单清晰的完整教程 【免费下载链接】zotero-citation Make Zoteros citation in Word easier and clearer. 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-citation 如果你是一名经常需要在Word文档中插…...

LangChain入门指南:轻松掌握大模型应用开发,收藏必备技能!

LangChain是一个开源的大语言模型(LLM)应用开发框架,通过模块化抽象与标准化接口,简化复杂AI工作流的构建过程。本文介绍了LangChain的核心概念、架构、主要组件以及使用场景,并通过实例展示了如何使用LangChain进行大…...

软件实例化管理中的对象池技术

软件实例化管理中的对象池技术 在软件开发中,对象池技术是一种高效管理资源的方法,尤其适用于频繁创建和销毁对象的场景。通过预先创建并缓存对象,对象池技术能够显著减少系统开销,提升性能。无论是数据库连接、线程管理&#xf…...

烘干选对设备,品质更有保障

烘干选对设备,品质更有保障药材与农产品烘干,是决定成品品质、储存周期与加工收益的关键环节。不少加工户因设备适配不当、工艺把控不足,常遇到物料发霉、干燥不均、营养流失等问题,想要高效解决烘干难题,选对设备、把…...

如何轻松重置JetBrains IDE试用期?30天无限续杯指南

如何轻松重置JetBrains IDE试用期?30天无限续杯指南 【免费下载链接】ide-eval-resetter 项目地址: https://gitcode.com/gh_mirrors/id/ide-eval-resetter 你是否遇到过这样的困扰:正在专注编码时,IDE突然弹出试用期结束的提示&…...

Windows 11拖放功能一键恢复:告别任务栏拖拽烦恼的终极方案

Windows 11拖放功能一键恢复:告别任务栏拖拽烦恼的终极方案 【免费下载链接】Windows11DragAndDropToTaskbarFix "Windows 11 Drag & Drop to the Taskbar (Fix)" fixes the missing "Drag & Drop to the Taskbar" support in Windows …...

字符串盲区速记

1.char arr[] {h,h,h,h,h};是字符数组但不是字符串&#xff0c;末尾加\0或0才是字符串&#xff0c;注意是0不是0。2.sizeof和strlen#include <stdio.h> #include <string.h>char arr[] {h,h,h,h,h};char arr1[] {h,h,h,h,h,\0}; // <> char arr1[] &q…...

BEYOND REALITY Z-Image轻量化方案:解决传统模型模糊、细节缺失痛点

BEYOND REALITY Z-Image轻量化方案&#xff1a;解决传统模型模糊、细节缺失痛点 1. 技术突破与核心优势 BEYOND REALITY Z-Image代表了当前文生图技术的重要突破&#xff0c;其核心价值在于通过技术创新解决了传统模型的三大痛点&#xff1a; 模糊问题根治&#xff1a;采用Z…...

别再只做单步预测了!用Python+LSTM搞定未来3天客流预测(附完整代码)

从单步到多步&#xff1a;用LSTM实现高精度未来3天客流预测实战指南 每次看到景区门口排起的长龙或是电商仓库里堆积如山的包裹&#xff0c;你是否想过——如果能提前预知未来几天的客流或订单量&#xff0c;资源调配该有多从容&#xff1f;这正是多步时序预测的魅力所在。不同…...

踩坑实战分析前端实时数据刷新全方案详解|WebSocket / 定时轮询 / 惰性轮询 / Web Worker / SharedWorker / 后台静默同步

在中后台、行情系统、IM、监控看板、运营大盘这类项目里&#xff0c;“数据实时刷新”几乎是绕不过去的基础能力。 很多团队一上来就问&#xff1a;到底该选 WebSocket 还是轮询&#xff1f; 但真正的答案往往不是二选一&#xff0c;而是&#xff1a;分场景组合。这篇文章我会用…...

新手实战分享鸿蒙 HarmonyOS 6|混合开发(01)Web 组件内核——ArkWeb 加载机制与 Cookie 管理

在移动应用开发进入“多端协同”的今天&#xff0c;混合开发不再是“过渡方案”&#xff0c;而是越来越多团队的长期架构选择。对 HarmonyOS 6 来说&#xff0c;Web 与原生的协同能力正在成为应用快速迭代的关键抓手。而在这条链路里&#xff0c;ArkWeb 是无法绕开的核心组件。…...