当前位置: 首页 > article >正文

无人机航拍小目标检测太难?YOLO-MARS 一招搞定,精度暴涨 8.1%!

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID计算机视觉研究院学习群扫码在主页获取加入方式https://pmc.ncbi.nlm.nih.gov/articles/PMC12031147/pdf/sensors-25-02534.pdf计算机视觉研究院专栏Column of Computer Vision Institute无人机航拍目标检测一直被小目标太小、分布密集、互相遮挡三大难题卡脖子漏检、误检层出不穷。今天给大家带来一篇最新顶刊论文基于 YOLOv8n 改进的 YOLO‑MARS 模型专门解决航拍小目标检测痛点精度直接拉满PART/1痛点痛点直击无人机检测到底难在哪无人机拍出来的图天生就不好检测目标又小又密占像素极少特征很弱背景复杂遮挡严重容易丢目标传统 YOLOv8n 对小目标不友好深层网络容易丢失浅层细粒度特征市面上的模型要么精度不够要么参数量太大不适合无人机端侧部署。于是团队基于最轻量的 YOLOv8n做了四大硬核改进推出 YOLO‑MARS。PART/2创新四大创新点轻量 高精度双在线1. ERAC 模块小目标特征 “抓得更牢”把普通卷积换成增强残差注意力卷积扩大感受野不放过微小目标加入 SE 通道注意力重点强化小目标特征残差连接稳梯度训练不崩 效果mAP50 直接 1.8%参数几乎没涨。2. PD‑ASPP 模块多尺度识别更轻更快替换原 SPPF用并行深度可分离空洞金字塔多分支并行提取不同尺度特征深度卷积降参量减少计算冗余复杂背景也能精准区分小目标 效果mAP 再涨参数反而降了 4.3%。3. SGCS‑FPN浅层特征不丢失专门解决 “深层网络丢小目标” 问题新增浅层特征引导分支跨层建立语义关联把浅层细粒度信息传给深层小目标再也不会被 “吞掉” 效果mAP50 猛涨5.4%小目标检测质变。4. WIoUv3 损失框得更准把 CIoU 换成动态加权 WIoUv3动态自适应惩罚密集小目标定位更准非单调聚焦机制专注高质量锚框边界回归更稳定误检更少 效果最终精度再打磨整体拉到最高。【消融实验结果表】PART/3实验实验炸场比 YOLOv8n 强太多数据集VisDrone2019航拍小目标标准 benchmark60% 都是小目标平台RTX 3090训练 200 轮核心结果对比 YOLOv8nmAP5032.8% → 40.9%暴涨 8.1%mAP50:9519.1% → 23.4%提升 4.3%参数仅2.93M比 YOLOv8s 轻近 4 倍【对比实验结果表】吊打一众主流模型优于 SSD、Faster‑RCNN、QueryDet强于 YOLOv5s/YOLOv7‑tiny/YOLOv11n比参数量更大的 RFAG‑YOLO 精度更高、更轻量可视化效果杀疯了【四类场景对比图密集 / 夜间 / 遮挡 / 高空】【雾霾天气对比图】【HIT‑UAV 红外数据集对比图】密集人群不漏检、不误判夜间 / 雾霾依然稳准高遮挡 / 高空小目标精准框出PART/4总结与展望核心结论YOLO‑MARS 轻量 YOLOv8n 四大改进完美适配无人机航拍小目标检测小目标检出率大幅提升密集、遮挡、低光照、雾霾全场景稳健参数量小适合端侧实时部署未来方向模型剪枝、知识蒸馏进一步轻量化结合超分辨率提升极端小目标效果有相关需求的你可以联系我们END转载请联系本公众号获得授权计算机视觉研究院学习群等你加入ABOUT计算机视觉研究院计算机视觉研究院主要涉及深度学习领域主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架提供论文一键下载并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程让大家真正体会摆脱理论的真实场景培养爱动手编程爱动脑思考的习惯往期推荐YOLO-TLA一种基于 YOLOv5 的高效轻量级小目标检测模型ViT-YOLO基于Transformer的用于目标检测的YOLO算法SSMA-YOLO一种轻量级的 YOLO 模型具备增强的特征提取与融合能力适用于无人机航拍的船舶图像检测LUD-YOLO一种用于无人机的新型轻量级目标检测网络Gold-YOLO基于聚合与分配机制的高效目标检测器Drone-YOLO一种有效的无人机图像目标检测「无人机AI」“空中城管”无人机AI光伏巡检自动化解决方案无人机视角下多类别船舶检测及数量统计机场项目解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题2PCNet昼夜无监督域自适应目标检测附原代码YOLO-S小目标检测的轻量级、精确的类YOLO网络大改Yolo框架 | 能源消耗极低的目标检测新框架附论文下载改进的检测算法用于高分辨率光学遥感图像目标检测

相关文章:

无人机航拍小目标检测太难?YOLO-MARS 一招搞定,精度暴涨 8.1%!

点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID|计算机视觉研究院学习群|扫码在主页获取加入方式https://pmc.ncbi.nlm.nih.gov/articles/PMC12031147/pdf/sensors-25-02534.pdf计算机视觉研究院专栏Column of Computer Vision Institut…...

EVE-NG仿真模拟器从零部署与核心应用实战指南

1. EVE-NG仿真模拟器入门指南 第一次听说EVE-NG这个工具时,我正为如何搭建一个安全的网络实验环境发愁。作为网络工程师,我们经常需要测试各种网络配置,但在真实设备上操作风险太大,稍有不慎就可能造成网络中断。EVE-NG完美解决了…...

圣女司幼幽-造相Z-Turbo惊艳效果:清冷神性眉峰+淡金柔光背景生成实录

圣女司幼幽-造相Z-Turbo惊艳效果:清冷神性眉峰淡金柔光背景生成实录 1. 惊艳效果预览:当AI遇见东方神性美学 想象一下,一位身着墨绿长裙的圣女,手持冷冽长剑,眉宇间透着清冷神性,背景笼罩在淡金色柔光中—…...

文件被占用无法删除?5招轻松解决

删除文件/文件夹提示在另一程序打开?几个快速解决方法 是不是经常都遇到这种,想要删除一个文件或者文件夹的时候,系统突然弹出提示“文件正在被另一程序使用”,或者“已在某个程序中打开”,导致无法删除。看似很难其实…...

【DataWhale组队学习】DIY-LLM Task1分词器

原文链接 0. 引言:为什么要学分词器 分词器常被视为LLM的一部分,但它其实有独立的训练生命周期。 Tokenizer本质上是将原始文本转换为模型可处理的离散符号序列的组件,它可以决定模型看到世界的基本粒度:是字符、单词、子词&am…...

MATLAB图表导出专业指南:export_fig工具箱深度实战

MATLAB图表导出专业指南:export_fig工具箱深度实战 【免费下载链接】export_fig A MATLAB toolbox for exporting publication quality figures 项目地址: https://gitcode.com/gh_mirrors/ex/export_fig MATLAB export_fig是科研和工程可视化领域的专业图像…...

AI编程游戏化:Claude-Code-Game-Studios项目解析与实践

1. 项目概述与核心价值最近在GitHub上看到一个挺有意思的项目,叫“Donchitos/Claude-Code-Game-Studios”。光看名字,你可能会觉得这是个游戏开发工作室的代码库,或者是什么大型游戏引擎。但点进去仔细研究后,我发现它的核心玩法其…...

OpenPLC Editor:免费开源的工业自动化编程终极指南 [特殊字符]

OpenPLC Editor:免费开源的工业自动化编程终极指南 🚀 【免费下载链接】OpenPLC_Editor 项目地址: https://gitcode.com/gh_mirrors/ope/OpenPLC_Editor 你是否曾为高昂的PLC编程软件授权费用而烦恼?是否想寻找一款功能强大、完全免费…...

闲鱼自动化采集系统终极指南:从零搭建高效商品监控方案

闲鱼自动化采集系统终极指南:从零搭建高效商品监控方案 【免费下载链接】idlefish_xianyu_spider-crawler-sender 闲鱼自动抓取/筛选/发送系统,xianyu spider crawler blablabla 项目地址: https://gitcode.com/gh_mirrors/id/idlefish_xianyu_spider-…...

servlet笔记

1.servlet执行流程2.servlet生命周期稍微看一下吧,虽然也看不懂是什么...

【RAG】【vector_stores097】Timescale Vector Store 演示分析

1. 案例目标本案例演示如何使用Timescale Vector作为LlamaIndex的向量存储后端,实现高效的向量相似性搜索和时间过滤功能。主要目标包括:展示Timescale Vector与LlamaIndex的集成方法演示基础向量相似性搜索功能实现基于时间范围的向量过滤查询创建和管理…...

【RAG】【vector_stores096】TiDB向量存储示例分析

1. 案例目标本案例展示了如何使用TiDB Cloud的向量搜索功能与LlamaIndex集成,实现高效的文档检索和语义搜索。TiDB Serverless将内置的向量搜索集成到MySQL生态系统中,使用户无需额外的数据库或技术栈即可开发AI应用程序。2. 技术栈与核心依赖LlamaIndex…...

终极指南:如何用KKManager轻松管理Illusion游戏模组,告别混乱安装

终极指南:如何用KKManager轻松管理Illusion游戏模组,告别混乱安装 【免费下载链接】KKManager Mod, plugin and card manager for games by Illusion that use BepInEx 项目地址: https://gitcode.com/gh_mirrors/kk/KKManager KKManager是一款专…...

第27篇:PyTorch动态图 vs TensorFlow静态图——深度框架核心机制对比(原理解析)

文章目录现象引入:一次让我“怀疑人生”的调试经历提出问题:动与静,本质区别在哪?原理剖析:深入静态图与动态图的引擎舱静态计算图(以TensorFlow 1.x为典型)动态计算图(以PyTorch为典…...

Fairseq-Dense-13B-Janeway应用场景:为非母语者提供英文文学风格模仿训练的AI写作教练

Fairseq-Dense-13B-Janeway应用场景:为非母语者提供英文文学风格模仿训练的AI写作教练 1. 模型概述 Fairseq-Dense-13B-Janeway是一款专为创意写作设计的130亿参数大语言模型,由KoboldAI团队基于2210本科幻与奇幻题材的英文电子书训练而成。该模型特别…...

Diablo Edit2:暗黑破坏神2角色存档编辑器的完整使用指南

Diablo Edit2:暗黑破坏神2角色存档编辑器的完整使用指南 【免费下载链接】diablo_edit Diablo II Character editor. 项目地址: https://gitcode.com/gh_mirrors/di/diablo_edit 你是否曾经在暗黑破坏神2中花费数小时刷装备,却发现始终无法获得理…...

VRM4U与LiveLinkFace:打造实时面部动画的终极解决方案

VRM4U与LiveLinkFace:打造实时面部动画的终极解决方案 【免费下载链接】VRM4U Runtime VRM loader for UnrealEngine5 项目地址: https://gitcode.com/gh_mirrors/vr/VRM4U VRM4U是专为Unreal Engine设计的运行时VRM加载器,能够将VRM虚拟角色模型…...

UIEffect深度解析:为Unity UI注入专业级视觉效果的终极指南

UIEffect深度解析:为Unity UI注入专业级视觉效果的终极指南 【免费下载链接】UIEffect UIEffect is an open-source package that allows you to intuitively apply rich UI effects directly from the Inspector or via code. Combine various filters, such as gr…...

三步轻松搞定上海交通大学论文排版:SJTUThesis LaTeX模板终极指南

三步轻松搞定上海交通大学论文排版:SJTUThesis LaTeX模板终极指南 【免费下载链接】SJTUThesis 上海交通大学 LaTeX 论文模板 | Shanghai Jiao Tong University LaTeX Thesis Template 项目地址: https://gitcode.com/gh_mirrors/sj/SJTUThesis 还在为上海交…...

如何通过免费开源工具深度解析无人机飞行数据?终极指南

如何通过免费开源工具深度解析无人机飞行数据?终极指南 【免费下载链接】UAVLogViewer An online viewer for UAV log files 项目地址: https://gitcode.com/gh_mirrors/ua/UAVLogViewer 你是否曾经面对一堆复杂的无人机日志文件感到无从下手?当飞…...

Moonlight TV终极指南:如何在大屏设备上免费串流PC游戏

Moonlight TV终极指南:如何在大屏设备上免费串流PC游戏 【免费下载链接】moonlight-tv Lightweight NVIDIA GameStream Client, for LG webOS TV and embedded devices like Raspberry Pi 项目地址: https://gitcode.com/gh_mirrors/mo/moonlight-tv 想在大屏…...

Free Texture Packer深度解析:开源精灵表打包工具架构剖析与性能优化

Free Texture Packer深度解析:开源精灵表打包工具架构剖析与性能优化 【免费下载链接】free-tex-packer Free texture packer 项目地址: https://gitcode.com/gh_mirrors/fr/free-tex-packer Free Texture Packer是一款完全免费的开源纹理打包工具&#xff0…...

企业税务规划怎么做才合法合规?湖南税邦用“雁税通“系统让风险可预知

在税务监管日益严格的今天,越来越多企业意识到税务筹划的重要性。但一个核心问题始终困扰着企业主:如何在合法降低税负的同时,确保不触碰红线?湖南税邦会计事务有限公司作为衡阳市财税服务行业协会会长单位,通过自主研…...

AI编码效率翻倍的VSCode配置,92%开发者忽略的4个安全认证与上下文泄露风险点

更多请点击: https://intelliparadigm.com 第一章:AI编码效率翻倍的VSCode配置全景认知 现代AI编程助手已深度融入VSCode生态,但真正释放其效能的关键,在于精准协同的配置体系——而非零散插件堆砌。一个经过调优的AI就绪环境&am…...

MDCX Docker容器化部署深度解析:从源码到生产环境的完整实战手册

MDCX Docker容器化部署深度解析:从源码到生产环境的完整实战手册 【免费下载链接】mdcx-docker 在Docker容器中运行 MDCX,并通过Web界面或远程桌面进行控制。Run MDCX in a Docker container, accessible and controllable via a web interface or remo…...

c#笔记之同步异步

写在前面 1.同步异步和多线程的关系 为什么会有这个疑问:因为现在现在官方唯一推荐的异步就是Task + async/await但是Task又和多线程有使用; 异: 先确定一个答案:就是异步和多线程是两种东西,异步可以在单线程里异步也可以在多线程里异步;(就像一个人也可以煮饭的等…...

【收藏备用】2026年版 小白/程序员大模型转型全攻略(从入门到就业,零基础可冲)

2026年,大模型领域岗位需求较去年暴增280%,国产模型崛起、AI Agent落地、多模态普及,成为最具潜力的技术赛道✨。本文专为零基础小白、在职程序员打造,详细拆解进入大模型领域的完整转型路径,涵盖四大发展方向、基础能…...

从零开始学C++:30分钟掌握基础

从零开始学习C:基础知识C是一种高效、灵活的编程语言,广泛应用于系统开发、游戏引擎和科学计算等领域。作为初学者,你需要掌握核心概念来构建坚实基础。下面我将逐步讲解基础知识,并提供简单代码示例帮助你理解。整个过程从安装环…...

如何在Windows上快速部署Android应用:APK Installer完整操作指南

如何在Windows上快速部署Android应用:APK Installer完整操作指南 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你是否曾经想在Windows电脑上直接运行Andr…...

终极指南:AMD显卡用户如何轻松玩转kohya_ss AI模型训练

终极指南:AMD显卡用户如何轻松玩转kohya_ss AI模型训练 【免费下载链接】kohya_ss 项目地址: https://gitcode.com/GitHub_Trending/ko/kohya_ss 你是否拥有AMD显卡,却苦于找不到好用的AI模型训练工具?好消息来了!kohya_s…...