【CVPR红外小目标检测】红外小目标检测中的非对称上下文调制(ACM)
论文题目:
Asymmetric Contextual Modulation for Infrared Small Target Detection 红外小目标检测中的非对称上下文调制
红外小目标数据集
- 目标个数分布:约90%图片中只有一个目标,约10%图片有多个目标(在稀疏/显著的方法中,可能会因全局独特的假设而被忽略)
- 目标面积分布:约55%的目标面积占比在0.02%之内(即300300的图片中,目标像素为33)
- 目标亮度分布:仅有35%的目标亮度是全图最亮。考虑到65%的目标具有与背景非常相似甚至更暗的亮度。
数据集:链接:https://pan.baidu.com/s/1dwLWwtlQcETiKU_4deJvUA?pwd=zwzs
提取码:zwzs
文章目录
- 红外小目标数据集
- 1摘要
- 2介绍
- 问题:
- 贡献:
- 3 SIRST
- 4 不对称的上下文调制
- 4.1 Rethinking自上而下的注意力调节
- 4.2 自下而上逐点注意调制
- 4.3 非对称上下文调制模块
- 4.4 FPN和U-Net
- 5 实验
- 5.1 消融实验
1摘要
首先贡献了一个具有高质量注释的开放数据集。提出了一种非对称上下文调制模块,专门用于检测红外小目标。
2介绍
问题:
1、缺乏公共数据集:深度学习需要数据。
2、最小的内在信息:SPIE将红外小目标定义为256×256图像的总空间范围小于80像素(9×9)。纹理或形状特征的缺乏使得纯粹以目标为中心的表示不足以进行可靠的检测。特别是在深度网络中,小目标很容易被复杂的环境淹没。
3、分辨率和语义学之间的矛盾:红外小目标往往淹没在复杂背景中,信杂比较低。对于网络来说,检测这些虚警较低的暗目标既需要对整个红外图像的高级语义理解,也需要精细分辨率的预测图,这是深度网络的内在矛盾,因为它们通过逐渐减弱特征大小来学习更多的语义表示。
贡献:
提出了一种非对称上下文调制(ACM)机制,这是一种可以集成到多个主机网络中的插件模块。该方法补充了最先进自上而上的高级语义反馈路径,采用反向自下而上的上下文调制路径,将较小尺度的视觉细节编码到更深的层次,我们认为这是为红外小目标实现更好的性能的关键因素。
这种高级和低级特征之间的相互调制以非对称的方式实现的,其中 自上而下 的调制是由传统的全局通道注意调制(GCAM)将高级大规模语义信息传播到浅层,而 自下而上的调制是通过像素级通道注意调制(PCAM)实现的,以保持和突出高级特征中的红外小目标。
- 全局通道注意调制(GCAM):
全局通道注意力结构可以使神经网络在训练过程中建模特征图各个通道的重要性,自动判断哪些通道上的信息为有用信息,哪些通道上的信息为噪声信息。全局通道注意力结构以SENet的通道注意力结构为基础,添加了批归一化和ReLU激活用于调整权重分布,残差结构增强了模型对强噪声和高冗余数据的处理能力。全局通道注意力模块的输入为尺寸为H×W×C的特征图X,输出为维度是1×1×C的通道权重矩阵。 - 像素级通道注意调制(PCAM):
3 SIRST
离群值(outlier):样本中的一个或几个观测值,它们离其他观测值较远,暗示它们可能来自不同的总体。离群点是指与其他观测值有显著差异的数据点。由于目标太小,缺乏内在特征,它们都被归为一个类别,没有进一步区分其特定类别。每个目标都通过观察它的移动顺序来确定,以确保它是一个真正的目标,而不是像素级的脉冲噪声。
3.1 数据集统计
- 每幅图像的目标数分布如图所示,大约90%的图像只包含一个单一的目标。这一事实支持了许多模型驱动的方法,将检测任务转换为寻找最稀疏或最显著的目标。然而,应该注意的是,大约10%的图像仍然包含额外的目标,这些目标在这种独特的假设下会被忽略。
- 其中约55%的目标只占图像面积的0.02%。给定一个300×300的图像,目标仅仅是3×3像素。一般来说,检测较小的物体需要更多的上下文信息,而红外小目标由于低对比度和背景杂乱而将这一难度推到极端程度。
- 只有35%的目标是图像中最亮的。因此,在图像中选择最亮的像素不是一个好主意,导致检测率为0.35,误报率为65%。作为比较,本文提出的方法的检出率为0.84,误报率为0.0065%,要小10000倍。
4 不对称的上下文调制
4.1 Rethinking自上而下的注意力调节
给定具有C通道和大小为H×W的特征图的低水平特征X和高水平特征Y,自上而下的注意力调节可以公式化为
随着网络的深入,这两个假设不一定适用于红外小目标,因为在高层特征中,小目标很容易被背景淹没,并且它们的特征在全球平均池中也会被削弱。
4.2 自下而上逐点注意调制
逐点通道注意力调制模块,其中每个空间位置的通道特征上下文被单独聚合.
4.3 非对称上下文调制模块
同时利用自上而下的全局注意调制和自下而上的局部注意调制,以交换多尺度上下文,从而对语义信息和空间细节进行更丰富的编码。
4.4 FPN和U-Net
构建新的网络,即ACM-FPN和ACM-U-Net,用于红外小目标检测任务。
5 实验
选择FPN和U-Net作为主干部网络,其中ResNet-20是两者的骨干。ROC曲线IoU和所提出的nIoU被选择作为评估指标。SoftIoU作为损失函数,选择Nesterov加速梯度方法作为优化器。0.05的学习率。Bachsize=8,epoch=
300.
数据驱动的方法:
1)顶帽滤波器
2)局部对比度方法(LCM)
3)改进的LCM(ILCM)
4)局部显著性方法(LSM)
5)面核和随机游走器(FKRW)
6)基于多尺度斑块的对比度测量(MPCM)
7)红外斑块图像模型(IPI)
8)基于奇异值部分和的非负性IPI模型(NIPPS)
9)重加权红外斑块张量模型(RIPT)
10)张量核范数部分和(PSTNN)
11)非凸秩近似最小化(NRAM)
5.1 消融实验
1)下采样方案的影响
基于ACM的网络明显优于基于常规ACM的网,尤其是随着网络的深入。结果表明,针对红外小目标检测,有必要定制网络下采样方案。否则,过度的下采样将导致深层中小目标特征的丢失。
2)双向注意调制的影响
单向自上而下的调制模块即图中所示的TopDownLocal,以及双向调制模块,如图7所示的BiLocal。BiLocal总是比TopDownLocal表现得更好,这表明最好使用双向注意力调制,而不是仅使用自上而下的调制。
3)不对称注意调制的影响
通道注意力尺度为局部(BiLocal)或全局的调制方案(BiGlobal)相,ACM模块在自上而下的路径中利用全局通道注意力,并在自下而上的路径中明智地指向局部通道注意力。结果验证了所提出的非对称调制的假设,即自上而下的调制需要全局通道注意模块来处理整个图像的高级语义信息,而自下而上的调制需要逐点通道注意机制来处理低级细节。
相关文章:

【CVPR红外小目标检测】红外小目标检测中的非对称上下文调制(ACM)
论文题目: Asymmetric Contextual Modulation for Infrared Small Target Detection 红外小目标检测中的非对称上下文调制 红外小目标数据集 目标个数分布:约90%图片中只有一个目标,约10%图片有多个目标(在稀疏/显著的方法中&am…...

Axios概述
一、Json-server 获得零编码的完整伪造 REST API zero coding 在不到 30 秒的时间内 (认真)。 使用 <3 创建,适用于需要快速后端进行原型设计和模拟的前端开发人员,模拟后端发送过来json数据。 1.安装 npm install -g jso…...

用右雅克比对旋转矩阵进行求导
考虑一个向量 a \bold{a} a对其进行旋转, 旋转用旋转矩阵 R \bold{R} R表示, 用朴素的倒数定义进行求导而不是用扰动模型, 我得到了这个过程与结果 和高博的新书结果 − R J r a ∧ -\bold{R}\bold{J}_{r}\bold{a}^{\wedge} −RJra∧结果不一样, 雅克比矩阵位置不同, 是不是…...

高性能HMI 走向扁平化
个人计算机作为图形用户界面(GUI)在自动化中已经使用了30多年。在那段时间里,从技术、术语、功能到用于创建接口的标准和指南,发生了许多变化。 PC 技术的飞速发展,特别是图形显示,用户界面的技术发展导致了…...

虚幻引擎配置物体水面浮力的简便方法
虚幻引擎配置物体水面浮力的简便方法 目录 虚幻引擎配置物体水面浮力的简便方法前言前期工作配置水面浮力针对一个立方体的水面浮力配置针对船3D模型的水面浮力配置 小结 前言 在使用虚幻引擎配置导入的3D模型时,如何快速地将水面浮力配置正确,从而使得…...

WatchGuard 防火墙策略、配置和日志分析器
获取 Internet 活动见解并及时了解安全事件是一项具有挑战性的任务,因为安全设备会生成大量的安全和流量日志。Firewall Analyzer 针对 WatchGuard 防火墙设备的报告功能具有一系列功能,使您能够增强网络安全。WatchGuard 日志分析器软件,可让…...

Web自动化测试——XAPTH高级定位
XAPTH高级定位 一、xpath 基本概念二、xpath 使用场景三、xpath 相对定位的优点四、xpath 定位的调试方法五、xpath 基础语法(包含关系)六、xpath 顺序关系(索引)七、xpath 高级用法1、[last()]: 选取最后一个2、[属性名属性值 an…...
CentOS 7 安装 Nginx
前言 最近,在公司经常会进行项目的部署,但是服务器环境都是导师已经搭建好了的,我就是将项目文件放到特定目录。于是,周末在家就进行了 Nginx 的安装学习。之前,在 Windows 上使用过 Nginx,但是在 Linux 环…...

Databend 开源周报第 91 期
Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。 Whats On In Databend 探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。 新数据类型&…...

【Ubuntu18.04使用yolov5教程】
欢迎大家阅读2345VOR的博客【Ubuntu18.04使用yolov5教程】🥳🥳🥳2345VOR鹏鹏主页: 已获得CSDN《嵌入式领域优质创作者》称号👻👻👻,座右铭:脚踏实地,仰望星空…...
CocoaPods如何发布新版本的Pod Library
当我们修改了一个Pod Library中的代码时,如何让依赖该库的项目能更新到最新代码,步骤如下: 假设现在修改了SamplePod(Pod名称)的代码,希望将最新版本更新到1.0.1,目前版本是1.0.0 修改SamplePo…...

v4l2框架
v4l2框架 文章目录 v4l2框架框架1.硬件相关层uvc_probeuvc_register_chainsuvc_register_termsuvc_register_video 2.核心层__video_register_device 3.虚拟视频驱动vivid分析入口vivid_init注册vivid平台驱动vivid_probevivid_create_instance 框架 1.硬件相关层 driver/medi…...
vue项目中生成LICENSE文件
vue项目中生成LICENSE文件 简介 LICENSE 文件是一个文本文件,它包含了你的项目所使用的开源软件的许可证信息。 在开发过程中,我们经常会使用到各种各样的第三方开源软件,这些软件是有版权和许可证的,我们在使用时需要遵循它们的…...

NewBing最新更新使用体验(无需等待人人可用)
NewBing最新更新使用体验 微软Bing爆炸级更新!无需等待人人可用! 今天,微软突然官宣全面开放BingChat: 无需任何等待。只需注册一个账户,首页即可体验。 NewBing最新更新新特性官方文档 https://www.microsoft.com/en-…...

欧拉奔赴品牌2.0时代,女性汽车真实用户需求被定义?
每年的上海国际汽车工业展览会,不仅是各大汽车品牌的技术“秀场”,也是品牌的营销“修罗场”。今年上海车展出圈的营销事件特别多,热度甚至一再蔓延到汽车行业外,其中欧拉也贡献了不少流量。 据了解,在2023上海车展欧…...
机器视觉工程师,听我一句劝,别去外包,干了三年,废了....对女人没了兴趣
外包三年,干了就废,最后只会安装软件。 对于年轻人来说,需要工作,更需要生活。 对于年轻人来说,需要努力,更需要“面包”。 对于年轻人来说,需要规划,更需要发展。 对于外包,虽说废的不是很彻底,但那三年几乎是出差了三年、玩了三年、荒废了三年,那三年,技术…...
PBDB Data Service:Special parameters(特殊参数)
Special parameters(特殊参数) 描述参数1:下列参数在大部分请求中可用2:以下参数只与文本格式(.csv, .tsv, .txt)相关 描述 本文将介绍一组特殊参数,它们几乎可以在此数据服务的任何请求中使用…...

腾讯云轻量应用服务器使用限制说明(十大限制)
腾讯云轻量应用服务器和云服务器CVM相比具有一些限制,比如轻量服务器不支持更换内网IP地址,轻量服务器只能套餐整体升级且不支持降配,轻量不支持用户自定义配置私有网络VPC,还有如实例配额、云硬盘配额、备案限制和内网连通性等限…...

Python每日一练(20230507) 丑数I\II\III、超级丑数
目录 1. 丑数 Ugly Number I 2. 丑数 Ugly Number II 3. 丑数 Ugly Number III 4. 超级丑数 Super Ugly Number 🌟 每日一练刷题专栏 🌟 Golang每日一练 专栏 Python每日一练 专栏 C/C每日一练 专栏 Java每日一练 专栏 1. 丑数 Ugly Number I …...

K8S常见异常事件与解决方案
集群相关 Coredns容器或local-dns容器重启 集群中的coredns组件发生重启(重新创建),一般是由于coredns组件压力较大导致oom,请检查业务是否异常,是否存在应用容器无法解析域名的异常。 如果是local-dns重启,说明local-dns的性能…...
React hook之useRef
React useRef 详解 useRef 是 React 提供的一个 Hook,用于在函数组件中创建可变的引用对象。它在 React 开发中有多种重要用途,下面我将全面详细地介绍它的特性和用法。 基本概念 1. 创建 ref const refContainer useRef(initialValue);initialValu…...
基于服务器使用 apt 安装、配置 Nginx
🧾 一、查看可安装的 Nginx 版本 首先,你可以运行以下命令查看可用版本: apt-cache madison nginx-core输出示例: nginx-core | 1.18.0-6ubuntu14.6 | http://archive.ubuntu.com/ubuntu focal-updates/main amd64 Packages ng…...
unix/linux,sudo,其发展历程详细时间线、由来、历史背景
sudo 的诞生和演化,本身就是一部 Unix/Linux 系统管理哲学变迁的微缩史。来,让我们拨开时间的迷雾,一同探寻 sudo 那波澜壮阔(也颇为实用主义)的发展历程。 历史背景:su的时代与困境 ( 20 世纪 70 年代 - 80 年代初) 在 sudo 出现之前,Unix 系统管理员和需要特权操作的…...

《基于Apache Flink的流处理》笔记
思维导图 1-3 章 4-7章 8-11 章 参考资料 源码: https://github.com/streaming-with-flink 博客 https://flink.apache.org/bloghttps://www.ververica.com/blog 聚会及会议 https://flink-forward.orghttps://www.meetup.com/topics/apache-flink https://n…...

企业如何增强终端安全?
在数字化转型加速的今天,企业的业务运行越来越依赖于终端设备。从员工的笔记本电脑、智能手机,到工厂里的物联网设备、智能传感器,这些终端构成了企业与外部世界连接的 “神经末梢”。然而,随着远程办公的常态化和设备接入的爆炸式…...
代理篇12|深入理解 Vite中的Proxy接口代理配置
在前端开发中,常常会遇到 跨域请求接口 的情况。为了解决这个问题,Vite 和 Webpack 都提供了 proxy 代理功能,用于将本地开发请求转发到后端服务器。 什么是代理(proxy)? 代理是在开发过程中,前端项目通过开发服务器,将指定的请求“转发”到真实的后端服务器,从而绕…...
docker 部署发现spring.profiles.active 问题
报错: org.springframework.boot.context.config.InvalidConfigDataPropertyException: Property spring.profiles.active imported from location class path resource [application-test.yml] is invalid in a profile specific resource [origin: class path re…...
#Uniapp篇:chrome调试unapp适配
chrome调试设备----使用Android模拟机开发调试移动端页面 Chrome://inspect/#devices MuMu模拟器Edge浏览器:Android原生APP嵌入的H5页面元素定位 chrome://inspect/#devices uniapp单位适配 根路径下 postcss.config.js 需要装这些插件 “postcss”: “^8.5.…...

JVM 内存结构 详解
内存结构 运行时数据区: Java虚拟机在运行Java程序过程中管理的内存区域。 程序计数器: 线程私有,程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都依赖这个计数器完成。 每个线程都有一个程序计数…...

GO协程(Goroutine)问题总结
在使用Go语言来编写代码时,遇到的一些问题总结一下 [参考文档]:https://www.topgoer.com/%E5%B9%B6%E5%8F%91%E7%BC%96%E7%A8%8B/goroutine.html 1. main()函数默认的Goroutine 场景再现: 今天在看到这个教程的时候,在自己的电…...