当前位置: 首页 > news >正文

3、论文阅读:EnYOLO:一种基于图像增强的水下目标区域自适应实时检测框架

图像增强和目标检测的结合

  • 前言
  • 介绍
  • 相关工作
    • UIE 水下图像增强
    • UOD 水下目标检测
    • UDA 水下域自适应
  • 方法介绍
    • 训练过程
    • 推理过程
    • 网络概述
    • 多阶段训练策略
      • Burn-In Stage(预热阶段)
      • Mutual-Learning Stage(相互学习阶段)
      • Domain-Adaptation Stage(领域适应阶段)
    • 多阶段训练策略算法介绍
    • 损失设计
      • Burn-In Stage
      • Mutual-Learning Stage
      • Domain-Adaptation Stage
  • 实验
    • 实验的细节
      • 数据集
      • 训练设置
    • 水下图像增强实验
    • 水下目标检测实验
  • 结论
  • 代码

前言

UIE:水下图像增强
UOD:水下目标检测
AUVS:自主水下航行器
水下图像增强在水下目标检测任务方面应用不多,具体有一下原因:
(1)使用UIE作为预处理步骤,引入了很大的计算量
(2)在目标检测之前进行图像增强未必能够产生性能改进
(3)复杂的水下环境导致不同场景下的域偏移,严重影响UOD性能
为了解决这些挑战,我们引入了EnYOLO,这是一种集成的实时框架,设计用于同时进行UIE和UOD,并具有域适应能力。具体地说,UIE和UOD任务头共享相同的网络主干,并利用轻量级设计。
此外,我们提出一种新颖的领域适应性策略,以对齐来自不同水下环境的特征嵌入

介绍

复杂的水下环境导致水下图像的质量很差,因此,用UIE方法获取清晰的水下图像通常被认为是与视觉相关的水下任务的必要前提。为此,引入了EnYOLO:基于领域自适应的实时UIE和UOD集成框架。UIE和UOD任务负责人都利用相同的网络主干,并采用轻量级架构。此外,我们引入了一种多阶段的训练方法,以保持训练这两个任务的平衡,其总体目标是不断提高其性能。另外,我们还提出一种新的领域自适应方法来减轻水下各种环境的域差距

相关工作

UIE 水下图像增强

传统的方法通过在一定的先验假设下估计后向散射和透射,可以得到清晰的图像,它们的功效在复杂的现实世界场景中可能会下降。
相比之下,基于学习的方法直接获得从退化的水下图像到其清晰对应物的映射,在复杂情况下表现出更好的适应性。

UOD 水下目标检测

通常在水下目标检测之前先进行水下图像增强,但是会引入大量的计算,同时,增强图像中潜在伪影的存在也会导致某些环境中检测性能的下降、

UDA 水下域自适应

通过减轻不同领域之间的特征分布变化,领域自适应技术已经在各种各样的任务中进行了研究。在水下视觉任务的背景下,UIE主要讨论了领域自适应。目前的技术主要局限于UIE领域,对UOD领域适应性的探索有限。本研究中,我们提出了一种简单而有效的领域调适策略,以利用UIE所衍生的增强型特征嵌入。

方法介绍

我们提出的框架旨在同时有效地启用UIE和UOD。
我们使用成对的合成水下数据集Dps={(xs, ˆxs)i, i ∈ [1, ns]}来促进UIE任务的训练。ns表示数据集的大小。xs表示退化的合成水下图像,而 ˆxs是对应的清晰图像
对于UOD任务的训练,我们利用带标签的真实世界水下数据集Dlr ={(xr, br, cr)i, i ∈ [1, nr]};;其中nr表示真实世界数据集大小,xr表示真实世界水下图像,br表示边界框注释,cr是类标签。此外,Dlr中的真实水下图像即xr还构成了不成对的真实水下数据集Dur = {(xr)i,i ∈ [1,nr]},以增强UIE模块在真实世界场景中的性能。此外,UIE针对每个xr的增强结果ˆxr,连同他们对应的br和cr,用公式表示标记的增强现实世界数据集Dle = {( ˜xr, br, cr)i, i ∈ [1, nr]},也用于训练UOD任务。
在推理过程中,网络获取真实水下图像xr,并随后预测增强的图像ˆxr和检测结果(˜br, ˜cr)<

相关文章:

3、论文阅读:EnYOLO:一种基于图像增强的水下目标区域自适应实时检测框架

图像增强和目标检测的结合 前言介绍相关工作UIE 水下图像增强UOD 水下目标检测UDA 水下域自适应方法介绍训练过程推理过程网络概述多阶段训练策略Burn-In Stage(预热阶段)Mutual-Learning Stage(相互学习阶段)Domain-Adaptation Stage(领域适应阶段)多阶段训练策略算法介…...

MYSQL面试知识点手册

第一部分&#xff1a;MySQL 基础知识 1.1 MySQL 简介 MySQL 是世界上最流行的开源关系型数据库管理系统之一&#xff0c;它以性能卓越、稳定可靠和易用性而闻名。MySQL 主要应用在 Web 开发、大型互联网公司、企业级应用等场景&#xff0c;且广泛用于构建高并发、高可用的数据…...

排序算法的分析和应用

自己设计一个长度不小于10的乱序数组&#xff0c;用希尔排序&#xff0c;自己设定希尔排序参数 画出每一轮希尔排序的状态 自己设计一个长度不小于10的乱序数组&#xff0c;用堆排序&#xff0c;最终要生成升序数组&#xff0c;画出建堆后的状态 画出每一轮堆排序的状态 自…...

iptables限制网速

1、使用hashlimit来限速 #从eth0网卡进入INPUT链数据&#xff0c;使用模块hashlimit 限制网速为100kb/s或2mb/s,超过限制的数据包会被DROP。OUTPUT链同理&#xff0c;mode为srcip&#xff0c;有4个mode选项: srcip&#xff08;默认匹配每个源地址IP&#xff0c;配置指定源地址…...

ALSA ubuntu 编译

1、下载tar包:alsa-lib、alsa-utils GitHub - alsa-project/alsa-lib: The Advanced Linux Sound Architecture (ALSA) - library&#xff08;核心库&#xff09; GitHub - alsa-project/alsa-utils: The Advanced Linux Sound Architecture (ALSA) - utilities(工具库) 2、…...

【学习笔记】SSL/TLS证书安全机制之证书透明

1、概念 CT - Certificate Transparency&#xff0c;证书透明 2、Trying to Solve 如果意外的 CA 为我们的域名颁发证书&#xff0c;我们是不可见&#xff0c;这就是证书透明&#xff08;CT&#xff09;要解决的问题 3、How CT Works 任何CA机构颁发的所有证书的公共登记处&…...

网络编程问题解答

TCP/IP是哪种模型的协议 TCP/IP 是一组通信协议的集合&#xff0c;它基于 TCP/IP 模型。TCP/IP 模型通常被认为是一种实用的网络通信模型&#xff0c;与 OSI 模型相比&#xff0c;TCP/IP 模型更加简洁和侧重于实际应用&#xff0c;被广泛应用于互联网和大多数计算机网络中。 T…...

【开源免费】基于SpringBoot+Vue.JS服装商城系统(JAVA毕业设计)

本文项目编号 T 046 &#xff0c;文末自助获取源码 \color{red}{T046&#xff0c;文末自助获取源码} T046&#xff0c;文末自助获取源码 目录 一、系统介绍二、演示录屏三、启动教程四、功能截图五、文案资料5.1 选题背景5.2 国内外研究现状5.3 可行性分析 六、核心代码6.1 新…...

C语言字符串学习

在C语言中&#xff0c;字符串&#xff08;String&#xff09;是字符数组&#xff08;character array&#xff09;&#xff0c;并且它以空字符&#xff08;\0&#xff09;结束&#xff0c;表示字符串的结尾。我们可以通过一些常见的操作和概念来详细理解它。 1. 字符串的概念 …...

当你在Linux系统中使用MySQL命令行工具查询数据库时,如果中文显示为问号(?)或其他乱码,简单解决办法。(2)

文章目录 1、问题出现2、解决办法 1、问题出现 2、解决办法 mysql -u [username] -p --default-character-setutf8 [database_name]rootab66508d9441:/# mysql -uroot -p123456 --default-character-setutf8 tingshu_album mysql: [Warning] Using a password on the command …...

API网关之Fizz Gateway

Fizz Gateway 是一款轻量级、高性能的 API 网关&#xff0c;专门为服务间通信、流量控制、请求路由、鉴权与认证等需求而设计。它旨在为分布式系统和微服务架构提供高效的请求处理能力&#xff0c;帮助开发者构建和管理 API 服务。 核心特性 1. 请求路由 Fizz Gateway 通过强…...

pgvector docker版安装;稀疏向量使用;psycopg2 python连接使用

参看: https://cloud.tencent.com/developer/article/2359831 https://hub.docker.com/r/pgvector/pgvector/tags https://github.com/pgvector/pgvector 一、安装 拉取0.7版本 docker pull pgvector/pgvector:0.7.4-pg16运行: docker run --name pgvector -v $(pwd)/dat…...

C#命令行参数解析库System.CommandLine介绍

命令行参数 平常在日常的开发过程中&#xff0c;会经常用到命令行工具。如cmd下的各种命令。 以下为sc命令执行后的截图&#xff0c;可以看到&#xff0c;由于没有输入任何附带参数&#xff0c;所以程序并未执行任何操作&#xff0c;只是输出了描述和用法。 系统在创建一个新…...

CCF CSP题解:密码(key)(202409-1)

题目和思路 题目背景 西西艾弗网对用户密码有一套安全级别评定标准。 题目描述 在西西艾弗网上&#xff0c;用户的密码是一个由大写字母&#xff08;A‐Z&#xff09;、小写字母&#xff08;a‐z&#xff09;、数字&#xff08;0‐9&#xff09;和特殊字符&#xff08;*和 …...

RuntimeError: Maximum Recursion Depth Exceeded - 递归深度超限的完美解决方案

RuntimeError: Maximum Recursion Depth Exceeded - 递归深度超限的完美解决方案 &#x1f6e0;️ RuntimeError: Maximum Recursion Depth Exceeded - 递归深度超限的完美解决方案摘要 &#x1f4c3;引言 ✨1. 什么是递归&#xff1f;&#x1f50d;1.1 递归的基本概念 &#x…...

Linux1-ls,cd,pwd

1.Linux操作系统的根目录用/表示。 Windows操作系统的根目录有D:E: 2.Linux命令格式 命令 [选项] [参数] 例如&#xff1a;ls -l / ls表示显示文件夹内容 -l表示以列表的形式展示 /表示显示的是根目录文件夹的内容 其中&#xff0c;[]里面的内容可省略&#xff…...

【高级编程】XML DOM4J解析XML文件(含案例)

文章目录 DOM4JDOM4J 解析 XML读取修改添加删除 XML&#xff08;EXtensible Markup Language&#xff09;&#xff0c;可扩展标记语言。一种用于存储和传输数据的标记语言。XML 与操作系统、编程语言的开发平台无关。实现不同系统之间的数据交换。 作用&#xff1a;数据交互&a…...

查看VSFTPD配置的服务器路径和linux系统有哪些用户

要查看VSFTPD (Very Secure FTP Daemon)配置中定义的服务器路径,需要检查VSFTPD的配置文件。这通常可以在配置文件中找到并有不同的选项来设置路径。 这里有几个方法可以查看配置的服务器路径: 1. 检查主配置文件 VSFTPD的默认配置文件通常位于`/etc/vsftpd.conf`。可以使用…...

JavaEE: 创造无限连接——网络编程中的套接字

文章目录 Socket套接字TCP和UDP的区别有连接/无连接可靠传输/不可靠传输面向字节流/面向数据报全双工/半双工 UDP/TCP api的使用UDPDatagramSocketDatagramPacketInetSocketAddress练习 TCPServerSocketSocket练习 Socket套接字 Socket是计算机网络中的一种通信机制&#xff0…...

记K8s组件harbor和kuboard故障恢复

#记录一次工作实践# 故障现象&#xff1a; 本地私有仓库harbor和控制台kuboard均无法正常登陆。 解决过程&#xff1a; 1、harbor恢复过程 通过docker ps -a |grep harbor查看harbor相关的容器状态&#xff0c;发现均显示启动状态&#xff0c;但是仓库无法访问。 通过doc…...

如何在ComfyUI中智能合成视频序列:VHS_VideoCombine节点的专业应用方案

如何在ComfyUI中智能合成视频序列&#xff1a;VHS_VideoCombine节点的专业应用方案 【免费下载链接】ComfyUI-VideoHelperSuite Nodes related to video workflows 项目地址: https://gitcode.com/gh_mirrors/co/ComfyUI-VideoHelperSuite 面对AI生成的大量图像序列&…...

G-Helper终极指南:如何用轻量级工具优化华硕笔记本性能与电池健康

G-Helper终极指南&#xff1a;如何用轻量级工具优化华硕笔记本性能与电池健康 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF…...

NVIDIA Profile Inspector 终极指南:免费解锁显卡隐藏性能的完整教程

NVIDIA Profile Inspector 终极指南&#xff1a;免费解锁显卡隐藏性能的完整教程 【免费下载链接】nvidiaProfileInspector 项目地址: https://gitcode.com/gh_mirrors/nv/nvidiaProfileInspector 想要让游戏画面更流畅、画质更清晰吗&#xff1f;NVIDIA Profile Inspe…...

Pixel Couplet Gen入门必看:Streamlit Components封装像素春联React组件

Pixel Couplet Gen入门必看&#xff1a;Streamlit Components封装像素春联React组件 1. 项目介绍 Pixel Couplet Gen是一款基于ModelScope大模型驱动的创意春联生成器。与传统春联设计不同&#xff0c;它采用了独特的8-bit像素游戏风格&#xff0c;将中国传统春节元素与复古电…...

Springboot 实现多数据源(PostgreSQL 和 SQL Server)连接

为 HagiCode 添加 GitHub Pages 自动部署支持 本项目早期代号为 PCode&#xff0c;现已正式更名为 HagiCode。本文记录了如何为项目引入自动化静态站点部署能力&#xff0c;让内容发布像喝水一样简单。 背景/引言 在 HagiCode 的开发过程中&#xff0c;我们遇到了一个很现实的问…...

RePKG:突破动态壁纸资源壁垒的开源工具

RePKG&#xff1a;突破动态壁纸资源壁垒的开源工具 【免费下载链接】repkg Wallpaper engine PKG extractor/TEX to image converter 项目地址: https://gitcode.com/gh_mirrors/re/repkg 当你面对一个包含丰富素材的动态壁纸资源包&#xff08;PKG文件&#xff09;却无…...

STM32CubeIDE用DAP下载器?这份OpenOCD配置文件修改与复位难题解决指南请收好

STM32CubeIDE深度调优&#xff1a;DAP下载器OpenOCD配置与自动复位难题实战解析 当你在STM32CubeIDE中切换ST-LINK与DAP调试器时&#xff0c;是否注意到两者在用户体验上的显著差异&#xff1f;特别是当使用DAP调试器时&#xff0c;每次下载后都需要手动复位开发板才能运行程序…...

CasRel在智能问答系统中的落地实践:为QA引擎注入结构化事实支撑

CasRel在智能问答系统中的落地实践&#xff1a;为QA引擎注入结构化事实支撑 1. 引言&#xff1a;当问答系统遇到关系抽取 想象一下这样的场景&#xff1a;用户向智能问答系统提问"苹果公司的CEO是谁&#xff1f;"&#xff0c;系统需要快速准确地回答"蒂姆库克…...

中兴光猫配置解密工具:突破运营商限制,掌握家庭网络自主权

中兴光猫配置解密工具&#xff1a;突破运营商限制&#xff0c;掌握家庭网络自主权 【免费下载链接】ZET-Optical-Network-Terminal-Decoder 项目地址: https://gitcode.com/gh_mirrors/ze/ZET-Optical-Network-Terminal-Decoder 在家庭网络管理中&#xff0c;你是否曾因…...

YOLOv8人脸检测实战:如何将WIDER Face数据集玩出新花样?结合OpenCV分类提升准确率

YOLOv8人脸检测实战&#xff1a;WIDER Face数据集与OpenCV分类的融合优化 人脸检测技术早已从实验室走向实际应用&#xff0c;但误检问题始终困扰着开发者。上周团队在商场部署的人脸统计系统&#xff0c;竟将广告牌上的明星照片全部计入客流——这种尴尬促使我们重新思考单阶段…...