基于YOLOv5的水下海洋目标检测
摘要:水下海洋目标检测技术具有广泛的应用前景,可以用于海洋环境监测、海洋资源开发、海洋生物学研究等领域。本文提出了一种基于 YOLOv5 的水下海洋目标检测方法,使用数据增强方法进行了大量实验,并与其他方法进行了对比,实现了在检测各种不同的海洋环境和水下目标中都取得较高的准确率,具有较好的泛化能力。
关键词:水下海洋目标检测 YOLOv5 特征提取
一、背景介绍
水下海洋目标检测是指在水下海洋环境中,使用计算机视觉技术来识别和定位海洋目标的过程。由于水下海洋环境的特殊性,水下海洋目标检测具有一定的挑战。例如,水下环境中的光照不均匀、水流会干扰图像质量、目标的形态会受到水流的影响等。因此,需开发出一套能够适应水下海洋环境的目标检测方法。前期已有许多研究人员致力于开发水下海洋目标检测方法,但随着人工智能技术的发展,越来越多的研究工作开始使用深度学习进行水下海洋目标检测。因此,本文将使用YOLOv5算法进行水下海洋目标检测。
二、方法介绍
YOLOv5是一种基于深度学习的目标检测算法,具有较高的准确性和效率,能够有效识别小目标和复杂背景,并且具有较高的适应性。因此,项目选择使用YOLOv5来进行水下海洋目标检测。
YOLOv5的工作流程如下:
1.输入图像:首先,将图像输入到 YOLOv5 模型中。
2.提取特征:使用一组卷积神经网络(CNN)将图像的特征提取出来。
3.预测目标位置和类别:使用预测层对图像中的目标位置和类别进行预测。
4.进行边界框回归:使用边界框回归层精细调整预测的边界框,使其更准确地框住目标。
5.进行聚类:使用聚类层将多个重叠的边界框合并成一个边界框。
6.输出结果:最后,YOLOv5 模型将检测出的目标位置和类别输出到结果中。
使用 PyTorch 实现 YOLOv5 目标检测的示例代码如下:
import torch
import torchvision
model= torchvision.models.yolov5.YOLOv5(pretrained=True)
model.eval()
image = torch.randn(1, 3, 640, 640)
output = model(image)
print(output)
过程中使用 torchvision.models.yolov5.YOLOv5 函数加载了一个 YOLOv5 模型,然后使用 model(image) 函数对图像进行目标检测。最后,输出结果包含了检测到的目标的位置和类别信息。
在特征提取过程中,YOLOv5使用多层卷积神经网络(CNN)来提取图像特征。CNN能够有效识别复杂的图像特征,在特征提取过程中具有较高的准确性。在分类和定位过程中,YOLOv5使用一种称为多尺度卷积神经网络(MS-CNN)的方法。MS-CNN能够在不同尺度下对图像进行分类和定位,具有较高的适应性。
检测结果如图1所示:

图1
三、实验介绍
项目使用了一个名为“水下海洋目标数据集”的数据集,其中包含了大量的水下海洋目标图像。这些图像来自不同的水下海洋环境,包括浅海、深海、珊瑚礁等。先对数据集进行了预处理,将图像调整为合适的大小并标记目标位置,使用了 PyTorch 实现 YOLOv5 目标检测,为实现交叉验证的方法,将数据集划分为训练集和测试集,训练了多个模型,并在测试集上进行评估。项目使用准确率、召回率、精确率、F1 分数和平均精度作为模型评估标准。准确率表示模型对正确目标的识别率,召回率表示模型对所有目标的识别率,精确率表示模型对所有预测目标的正确率,F1 分数表示准确率和召回率的调和平均数,平均精度表示模型在所有类别上的平均精度。
为使实验数据更精确,还使用了计算机视觉领域常用的一些基准测试集进行评估,包括 PASCAL VOC 和 COCO。这些基准测试集包含了大量的图像,用于评估目标检测算法的性能。通过使用了与这些基准测试集相同的评估标准,以便与其他研究进行比较。
在实验中使用了两种不同的特征提取器:VGG16 和 ResNet50。使用了两种不同的分类器:SVM 和 KNN。通过不断调整模型的参数,以获得最优的结果。
图2显示了使用不同的特征提取器和分类器的结果:
图2
图3显示了使用 YOLOv5 的结果:

图3
可以看出,使用 YOLOv5 的准确率、召回率、精确率和 F1 分数均明显高于其他方法。
实验效果对比如图4:
图4
实验结果表明,使用 YOLOv5进行水下海洋目标检测是一种有效的方法。这种方法能够在各种不同的海洋环境和水下目标中取得较高的准确率,并具有较好的泛化能力。
四、总结
尽管生成的模型已经在水下海洋目标检测中取得了较好的结果,但仍有许多改进的空间。后期可以尝试使用更多的数据集,更先进的算法来改进模型的性能。水下海洋目标检测是一种重要的技术,具有广泛的实际意义。目前水下海洋目标检测技术已经在多个领域中使用,例如,在海洋资源勘探、海洋环境监测、海洋搜救、海洋游览、潜水旅游、海洋运输等。这项技术已经为人类的生产生活带来了更多的便利,相信未来会发挥更大的价值。
参考文献:
[1]方俊,邱春荣. 水下图像目标检测技术研究[J]. 科技资讯,2022,v.20;No.657(12):26-29.
[2]韩笑. 水下遮挡目标检测方法的研究与实现[J]. 电脑编程技巧与维护,2022,No.440(02):45-47.
[3]卢言. 基于单片机的智能水下目标检测识别系统设计[J]. 电子制作,2019,No.366(01):40-42.
[4]郑海生. 基于波束形成的水下自导目标检测优化算法[J]. 智能计算机与应用,2018,v.8(06):137-140.
[5]付丽云,王文爽. 基于背景差分和三帧差分的水下运动目标检测[J]. 电脑与信息技术,2018,v.26;No.152(02):37-40.
[6]董欣. 基于注意机制的水下目标检测方法[J]. 计算机与现代化,2013,No.213(05):87-89+94.
[7]王英哲,王英民,邱宏安,杨益新,马远良. TMC2310 DSP芯片在水下目标检测与参数估计中的应用[J]. 电子技术应用,2000,(08):63-
[8] Redmon, J., & Farhadi, A. (2018). YOLOv3: An Incremental Improvement. arXiv preprint arXiv:1804.02767.
[9] He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep Residual Learning for Image Recognition. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (pp. 770-778).
[10]蔡先治,王栋,鲁旭葆,苗泽宇. 基于改进的Yolov5的端到端车牌识别算法[J]. 计算机时代,2022,No.366(12):28-33.
[11]高伟,沈克宇,邵仕泉. 基于改进YOLOv5s的麦穗检测与计数[J]. 信息技术与信息化,2022,No.272(11):105-107+111.
相关文章:
基于YOLOv5的水下海洋目标检测
摘要:水下海洋目标检测技术具有广泛的应用前景,可以用于海洋环境监测、海洋资源开发、海洋生物学研究等领域。本文提出了一种基于 YOLOv5 的水下海洋目标检测方法,使用数据增强方法进行了大量实验,并与其他方法进行了对比…...
磁盘这列(Raid)
RAID介绍 RAID技术通过把多个硬盘设备组合成一个容量更大的、安全性更好的磁盘阵列。把数据切割成许多区段后分别放在不同的物理磁盘上,然后利用分散读写技术来提升磁盘阵列整体的性能,同时把多个重要数据的副本同步到不同的物理设备上,从而…...
Oracle之PL/SQL存储过程与函数练习题(七)
1.创建一个存储过程,以员工号为参数,输出该员工的工资2.创建一个存储过程,以员工号为参数,修改该员工的工资。若该员工属于10号部门,则工资增加150;若属于20号部门,则工资增加200;若…...
C++入门教程||C++ 基本的输入输出||C++ 数据结构
C 基本的输入输出 C 基本的输入输出 C 标准库提供了一组丰富的输入/输出功能,我们将在后续的章节进行介绍。本章将讨论 C 编程中最基本和最常见的 I/O 操作。 C 的 I/O 发生在流中,流是字节序列。如果字节流是从设备(如键盘、磁盘驱动器、…...
线性表——顺序表
文章目录一:线性表二:顺序表1:概念与结构1:静态顺序表2:动态顺序表2:动态顺序表的代码实现1:结构2:接口实现1:初始化2:释放内存3:检查容量4&#…...
第六章 Vite4+Vue3+Vtkjs 模型颜色切换、漫反射曲面颜色
一、介绍 💥 💥 Vtk里面工具非常的齐全,但是相关的文档又少之又少,只能花大量时间去阅读源码。漫反射曲面颜色是什么意思呢,Vtk可以使用漫反射曲面颜色来模拟光线在表面反射时的颜色。漫反射是一种光线与表面发生碰撞后,被散射到各个方向的现象,这种现象可以用来解释物…...
【QT学习七】QTreeWidget
目录 一、QTreeWidget 概述 二、QTreeWidget 的基本使用 2.1、创建 QTreeWidget 控件 2.2、设置 QTreeWidget 的大小和位置 2.3、设置 QTreeWidget 的列数和列标题 2.4、添加节点 2.5、读取节点 2.6、设置节点数据 2.7、自定义节点样式 三、注意事项 四、完整示例 一…...
【Linux】组管理和权限管理
目录1 Linux组的基本介绍2 文件/目录所有者2.1 查看文件的所有者2.2 修改文件所有者3 组的创建3.1 基本指令3.2 应用实例4 文件/目录 所在组4.1 查看文件/目录所在组4.2修改文件/目录所在的组5 其他组6 改变用户所在组6.1 改变用户所在的组6.2 应用实例7 权限介绍8 rwx权限详解…...
从零到一发布 NPM 包
如果你负责前端的基础能力建设,发布各种功能/插件包犹如家常便饭,所以熟悉对 npm 包的发布与管理是非常有必要的,故此有了本篇总结文章。本篇文章一方面总结,一方面向社区贡献开箱即用的 npm 开发、编译、发布、调试模板ÿ…...
uniapp国际化配置
1、创建资源文件 创建一个locale文件夹,新增index.js,en.json,zh-hans.json 2.配置locale文件夹中的index.js文件 import Vue from vue import VueI18n from vue-i18n// v8.x import en from ./en.json import zhHans from ./zh-Hans.json import zhHant from .…...
前端中 try-catch 捕获不到哪些异常和常见错误
在开发过程中,我们的目标是 0error,0warning。 但有很多因素并不是我们可控的,为了避免某块代码的错误,影响到其他模块或者整体代码的运行,我们经常会使用try-catch模块来主动捕获一些异常或者错误。 比如我们在获取…...
javaEE 初阶 — 如何构造一个 HTTP 请求
文章目录使用 form 表单标签构造1 构造 GET 请求2 构造 POST 请求使用 ajax 构造1 什么是异步2 代码中如何使用 ajax使用第三方工具构造1 postman 工具的安装2 postman 工具的使用使用 form 表单标签构造 1 构造 GET 请求 使用 form 表单构造 HTTP 请求,需要用到两…...
CentOS 7下安装PostgreSQL 15版本数据库(图文详细)
文章目录CentOS 7下安装PostgreSQL 15版本数据库(图文详细)1 简介1.1 概述1.2 官网2 PostgreSQL安装2.1 选定版本2.2 安装依赖2.3 执行安装2.4 初始化2.5 配置环境变量2.6 创建数据库2.6.1 进入命令行2.6.2 创建DB2.6.3 设置密码2.7 配置远程2.8 测试链接3 pgAdmin4工具安装3.1…...
代码随想录算法训练营第五十一天 | 309. 最佳买卖股票时机含冷冻期、714. 买卖股票的最佳时机含手续费
309. 最佳买卖股票时机含冷冻期 动规五部曲 1、确定dp数组以及下标的含义 dp[i][j],第i天状态为j,所剩的最多现金为dp[i][j]。 具体可以区分出如下四个状态: 状态一:持有股票状态(今天买入股票,或者是…...
中英文拼写检测纠正开源项目使用入门 word-checker 1.1.0
项目简介 word-checker 本项目用于单词拼写检查。支持英文单词拼写检测,和中文拼写检测。 特性说明 可以迅速判断当前单词是否拼写错误 可以返回最佳匹配结果 可以返回纠正匹配列表,支持指定返回列表的大小 错误提示支持 i18n 支持大小写、全角半角…...
面试如果还不会Netty,看这篇文章就够了
我们去面试的时候,经常被问到netty的题目。我整理了netty的32连问。小伙伴们,收藏起来慢慢看吧。 1. Netty是什么,它的主要特点是什么? Netty是一个高性能、异步事件驱动的网络编程框架,它基于NIO技术实现࿰…...
作为大学生,你还不会搭建chatGPT微应用吗?
目录 引言ChatGPT是什么?背景:ChatGPT敢为人先,打破全球僵局示例演示:基于ChatGPT微应用实现的条件及步骤(1)整体框架(2)搭建前的准备工作(3)实际搭建步骤&a…...
Three.js教程:第一个3D场景
推荐:将NSDT场景编辑器加入你3D工具链其他工具系列:NSDT简石数字孪生下面的代码完整展示了通过three.js引擎创建的一个三维场景,在场景中绘制并渲染了一个立方体的效果,为了大家更好的宏观了解three.js引擎, 尽量使用了…...
lua快速入门~在js基础上,知道Lua 和 Js 的不同即可
☺ lua 和 javaScript 差不多的,就是一些语法的细节不同,学过js,再注意一下下面的细节,就能上手了~ 快速入门,可以直接看一下菜鸟教程的lua:https://www.runoob.com/lua/lua-tutorial.html Lua 和 Js 的不同…...
Linux系统【Centos7】更换源详细教程
更换CentOS 7系统的源可以提高网络速度,加快软件升级和安装的速度。以下是详细的更换CentOS 7源实践。 步骤 1:备份原始 Yum.repo 在更换之前,首先要备份原始 Yum.repo 文件(一定要记得备份)。 bash sudo mv /etc/y…...
使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式
一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明:假设每台服务器已…...
基于uniapp+WebSocket实现聊天对话、消息监听、消息推送、聊天室等功能,多端兼容
基于 UniApp + WebSocket实现多端兼容的实时通讯系统,涵盖WebSocket连接建立、消息收发机制、多端兼容性配置、消息实时监听等功能,适配微信小程序、H5、Android、iOS等终端 目录 技术选型分析WebSocket协议优势UniApp跨平台特性WebSocket 基础实现连接管理消息收发连接…...
《Playwright:微软的自动化测试工具详解》
Playwright 简介:声明内容来自网络,将内容拼接整理出来的文档 Playwright 是微软开发的自动化测试工具,支持 Chrome、Firefox、Safari 等主流浏览器,提供多语言 API(Python、JavaScript、Java、.NET)。它的特点包括&a…...
抖音增长新引擎:品融电商,一站式全案代运营领跑者
抖音增长新引擎:品融电商,一站式全案代运营领跑者 在抖音这个日活超7亿的流量汪洋中,品牌如何破浪前行?自建团队成本高、效果难控;碎片化运营又难成合力——这正是许多企业面临的增长困局。品融电商以「抖音全案代运营…...
el-switch文字内置
el-switch文字内置 效果 vue <div style"color:#ffffff;font-size:14px;float:left;margin-bottom:5px;margin-right:5px;">自动加载</div> <el-switch v-model"value" active-color"#3E99FB" inactive-color"#DCDFE6"…...
【ROS】Nav2源码之nav2_behavior_tree-行为树节点列表
1、行为树节点分类 在 Nav2(Navigation2)的行为树框架中,行为树节点插件按照功能分为 Action(动作节点)、Condition(条件节点)、Control(控制节点) 和 Decorator(装饰节点) 四类。 1.1 动作节点 Action 执行具体的机器人操作或任务,直接与硬件、传感器或外部系统…...
cf2117E
原题链接:https://codeforces.com/contest/2117/problem/E 题目背景: 给定两个数组a,b,可以执行多次以下操作:选择 i (1 < i < n - 1),并设置 或,也可以在执行上述操作前执行一次删除任意 和 。求…...
DIY|Mac 搭建 ESP-IDF 开发环境及编译小智 AI
前一阵子在百度 AI 开发者大会上,看到基于小智 AI DIY 玩具的演示,感觉有点意思,想着自己也来试试。 如果只是想烧录现成的固件,乐鑫官方除了提供了 Windows 版本的 Flash 下载工具 之外,还提供了基于网页版的 ESP LA…...
多种风格导航菜单 HTML 实现(附源码)
下面我将为您展示 6 种不同风格的导航菜单实现,每种都包含完整 HTML、CSS 和 JavaScript 代码。 1. 简约水平导航栏 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport&qu…...
SpringTask-03.入门案例
一.入门案例 启动类: package com.sky;import lombok.extern.slf4j.Slf4j; import org.springframework.boot.SpringApplication; import org.springframework.boot.autoconfigure.SpringBootApplication; import org.springframework.cache.annotation.EnableCach…...
