当前位置: 首页 > news >正文

目标检测应用场景和发展趋势

参考:

目标检测的未来是什么? - 知乎 (zhihu.com)icon-default.png?t=N7T8https://www.zhihu.com/question/394900756/answer/32489649815大应用场景
1 行人检测:

  • 遮挡问题:行人之间的互动和遮挡是非常常见的,这给行人检测带来了挑战。
  • 非刚性目标:行人是非刚性目标,其运动非常灵活。在复杂交通环境下,行人的行为具有很大的随机性和任意性。
  • 多姿势变化问题:行人可能有多种行走姿态,而且可能会与背景混合,难以分离。
  • 检测场景的复杂性:例如光照度的变化、时变性和大量存在的类似行人部分轮廓的物体等因素的干扰。
  • 行人检测的准确性和实时性:如何准确地检测和跟踪行人是行人检测技术需要解决的关键问题。

2 人脸检测

  • 人脸姿态和饰物问题:由于非配合型监控,人脸会出现侧脸、低头、抬头等各种姿态,以及佩戴帽子、黑框眼镜、口罩等饰物现象。
  • 光照问题:由于环境光源的影响,可能出现侧光、顶光、背光和高光等现象。
  • 人脸相似性问题:不同个体之间特别是同一民族的区别不大,所有人脸的结构都相似,甚至人脸的结构外形都很相似。
  • 人脸易变性:人可以通过脸部的变化产生很多表情,而在不同观察角度,人脸的视觉图像也相差很大。
  • 人脸表情复杂:人脸具有多样的变化能力,人的脸上分布着五十多块面部肌肉,这些肌肉的运动导致不同面部表情的出现,会造成人脸特征的显著改变。
  • 人脸随年龄而改变:随着年龄的增长,皱纹的出现和面部肌肉的松弛使得人脸的结构和纹理都将发生改变。
  • 人脸有易变化的附加物:例如改变发型,蓄留胡须或者佩戴帽子和眼镜等饰物。
  • 人脸特征遮掩:人脸全部、部分遮掩将会造成错误识别。
  • 人脸图像畸变:由于光照、视角、摄取角度不同,可能会造成图像的灰度畸变、角度旋转等,降低了图像质量,增大了识别难度。

3 文本检测

  • 文本具有多样性:自然场景中的文本检测难点主要在于文本的多样性,包括文字颜色、大小、字体、形状、方向、语言、以及文本长度的影响。
  • 文本形状复杂多样:文本的形状也是一大难点,因为文本可以以各种不同的形式出现在图像或视频中,包括单个字符的位置或者整个文本行的位置。
  • 缺乏通用方法:当前所说的文本检测一般是自然场景文本检测,其难点在于缺乏一个通用的方法来解决所有问题。
  • 背景复杂:在图像或视频中,文本可能会出现在各种不同的背景中,这增加了检测的难度。
  • 光照条件不定:光照的变化也会对文本检测造成很大的影响。
  • 文本大小不一:文本的大小也是一大难点,因为文本的大小会因图像或视频的分辨率不同而变化。
  • 字符粘连和断字:在某些情况下,文本中的字符可能会相互粘连,或者字符可能会断开,这会增加检测的难度。
  • 字体和字库大小有限:不同的字体和字库大小也会影响文本检测的结果。
  • 文本倾斜:文本可能会以不同的角度倾斜出现在图像或视频中,这也会增加检测的难度。
  • 遮挡和背景扰动:文本可能会被其他物体遮挡,或者背景中存在扰动因素,这也会影响文本检测的结果。

4 交通信号检测

  • 复杂的背景环境:在实际的城市自动驾驶场景中采集的交通信号灯图像具有复杂的背景,如四面八方的信号灯以及其他各类发光源。 遮挡问题:例如前面行驶的大货车或是交通指示牌等,都可能导致交通信号灯被遮挡。
  • 多态性的问题:交通信号灯不仅有颜色、形状和位置的变化,一些交通灯还包括箭头来指示方向和标记,比如人或自行车。
  • 成像条件的影响:包括天气、低分辨率、模糊等因素的影响,这些因素都可能降低交通信号灯检测的准确性。
  • 特征提取和分类问题:对交通信号灯进行识别通常来说分为两个过程,第一步是对图像的候选区域进行特征提取,第二步就是根据特征对识别的特征进行分类。

5 遥感目标检测

  • 数据规模问题:由于遥感图像的数据规模相对较小,这可能会对模型的训练产生影响。
  • 目标尺寸问题:遥感图像中包含了大量小尺寸的目标,这些小目标在经过神经网络的多层处理后,细节信息可能会丢失过多,导致检测准确率下降。
  • 旋转目标的检测问题:这是遥感图像目标检测中的一个重要难题,因为一般的检测算法往往假设目标在图像中是固定方向和姿态的,而旋转目标的出现会大大增加检测的难度。
  • 大中小目标分布不均:遥感场景下进行旋转目标检测时,大、中、小目标的分布通常是不均匀的,这种分布的不均衡性也增加了检测的难度。
  • 计算资源限制:相比于自然图像数据集,航拍图像一般分辨率较高,受计算资源限制,一些在自然图像中有效的检测小目标的方法如FPN直接应用到航拍图像就无能为力了。
  • 遥感图像分辨率巨大:遥感图像分辨率巨大,因此如何快速准确地检测出遥感目标仍然是一个挑战性的问题。
  • 目标遮挡问题:超过50%的目标被云雾所遮挡,因此目标遮挡问题也是遥感图像目标检测所面临的一个挑战。
  • 域适应问题:由不同传感器所捕获的遥感图像仍然存在很大差异。



 7大发展趋势
1 轻量型目标检测

轻量型目标检测的难点主要集中在以下几个方面:

  • 小模型性能问题:由于模型容量和能力的限制,小模型往往难以达到较好的性能。虽然大型模型的性能较好,但速度较慢,不符合实时需求。
  •  精确度与模型压缩之间的差距:在模型压缩过程中,可能会出现精确度下降的问题。物体检测比分类要困难得多,例如标签的计算更加昂贵,类别不均衡,多任务同时需要分类和回归等。
  • 数据不平衡问题:在轻量级目标检测中,正负样本比例失衡是一个常见问题,这会导致模型过于关注多数类,而忽视少数类,从而影响检测的准确性。
  • 计算资源限制:轻量型目标检测需要在有限的计算资源上进行,如何在保证准确性的同时提高检测速度是一个重要的挑战。
  •  模型加速与优化:如何设计并优化轻量化网络结构以提高模型的速度和准确度是一个重要的研究方向。

2 与AutoML结合的目标检测
3 领域自适应的目标检测
4 弱监督目标检测
5 小目标检测

  • 可利用特征较少:小目标相比于大/中目标分辨率低,信息较少,难以提取到具有鉴别力的特征。
  • 定位精度要求高:小目标在图像中位置过小且极易受到环境干扰,网络预测时偏移一个像素则对小目标的影响是巨大的。
  • 现有数据集中小目标占比少:现有数据集较少关注小目标这一特别类型。同时,小目标不易标注,人力成本巨大,而且对误差更为敏感。
  • 样本不均衡:训练时通过设定阈值来判断锚框是否属于正样本,这样会导致不同尺寸目标的样本不均衡问题。因此,当人工设定的锚框与真实边框相差较大时,会导致模型忽略小目标的检测。
  • 小目标聚集:小目标更容易出现聚集的现象,这时网络模型的预测边框可能会因非极大值抑制过滤掉大量正确边框,导致漏掉小目标,或是边框距离过近,导致模型难以收敛。

6 视频检测

  • 图像模糊:在拍摄视频的过程中,由于物体或相机的移动,会造成视频中的某些帧的画面发生模糊,造成无法分辨目标的情况。
  • 目标遮挡:如果目标物体被其他物体遮挡,会使目标检测更加困难。在这种情况下,需要算法能够识别并分割出被遮挡的目标。
  • 区分相似目标:在图像中,可能存在与目标物体外形相似的非目标物体,如何区分它们是一个难题。
  • 保持视频中目标的时空一致性:由于视频比静态图像多了一个时间维度上的信息,所以大多数视频目标检测算法利用该信息来增强检测性能,最常见的思路就是使用其他帧的特征来增强关键帧的预测效果。
  • 夜间诊断效果不佳:由于夜间为黑白画面呈现,加上夜间灯光的影响,视频诊断系统很难对画面问题做出准确判断。
  • 上下文信息利用:由于视频相较于单张图片多了一个时间维度上的信息,因此如何有效地利用这些时间上下文信息来提高检测性能,是视频检测面临的一个重要问题。

  • 运动变化处理:视频中的目标检测需要在静态图像目标检测的基础上对目标因运动产生的各种变化进行处理。


7 信息融合目标检测

相关文章:

目标检测应用场景和发展趋势

参考: 目标检测的未来是什么? - 知乎 (zhihu.com)https://www.zhihu.com/question/394900756/answer/32489649815大应用场景 1 行人检测: 遮挡问题:行人之间的互动和遮挡是非常常见的,这给行人检测带来了挑战。非刚性…...

Confluence 自定义博文列表

1. 概述 Confluence 自有博文列表无法实现列表自定义功能,实现该需求可采用页面中引用博文宏标签控制的方式 2. 实现方式 功能入口: Confluence →指定空间→创建页面 功能说明: (1)页面引用博文宏 (…...

chrome历史版本下载

chrome历史版本下载 windows Google Chrome all versions on Windows linux版本 Google Chrome 64bit Linux版_chrome浏览器,chrome插件,谷歌浏览器下载,谈笑有鸿儒...

Messari发布Moonbeam简报,每日交易量稳步增长,首次公布利润数据

区块链数据公司Messari首次发布Moonbeam项目分析简报,从项目市值、链上数据表现、质押以及Moonbeam的技术优势XCM使用量等角度全面分析。这个再熊市初期上线的项目一直在默默开发,并在跨链互操作领域拥有了相当的实操成绩。我们翻译了Messari简报中的部分…...

数据库 锁、索引、在实际开发中怎么设置和优化

数据库锁和索引是数据库管理的两个重要方面,它们对于确保数据的一致性和提高查询性能具有重要作用。在实际开发中,正确地设置和优化锁和索引对于构建高效、稳定的系统至关重要。下面是一些关于如何在实际开发中设置和优化锁和索引的建议: 锁…...

超详细彻底卸载Anaconda详细教程

一、在开始处打开Anaconda Prompt 二、打开后,输入conda install tqdm -f命令并按回车键 conda install tqdm -f三、之后页面会出现一个WANNING,这个我们不用在意,然后会出现一个y/n提示框,在这里我们输入y或者Y y四、输入cond…...

Python--随机出拳(random)--if判断--综合案例练习:石头剪刀布

注:涉及相关链接: Python:if判断--综合案例练习:石头剪刀布-CSDN博客 Python语言非常的强大,强大之处就在于其拥有很多模块(module),这些模块中拥有很多别人已经开发好的代码&…...

微信小程序里配置less

介绍 在微信小程序里,样式文件的后缀名都是wxss,这导致一个问题,就是页面样式过多的时候,要写很多的类名来包裹,加大了工作量,还很有可能会写错样式。这时可以配置一个less,会大大提高代码编辑…...

MySq修改配置文件

要修改 MySQL 的配置文件,您可以按照以下步骤进行操作: 1、打开 MySQL 的配置文件 在大多数 Linux 系统上,默认的配置文件路径是 /etc/my.cnf 或 /etc/mysql/my.cnf。您可以使用文本编辑器(如 vim、nano)以管理员权限打开该文件。 sudo vim /etc/my.cnf 2、进行修改 …...

HTML 表格及练习

表格 概述 表格是一种二维结构,横行纵列。 由单元格组成。 表格是一种非常“强” 的结构: 每一行有相同的列数(单元格),每一列有相同的行数(单元格) 同一列的单元格,宽度&#…...

YOLOv5-训练自己的VOC格式数据集(VOC、自建数据集)

YOLOv5:训练自己的 VOC 格式数据集 1. 自定义数据集 1.1 环境安装 pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple注意: 安装 lxmlPillow 版本要低于 10.0.0,解释链接: module ‘PIL.Image’ has no attri…...

基于Java的考研信息查询系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序(小蔡coding) 代码参考数据库参考源码获取 前言 💗博主介绍:✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作者&am…...

Linux性能优化--性能追踪:受CPU限制的应用程序(GIMP)

10.0 概述 本章包含了一个例子:如何用Linux性能工具在受CPU限制的应用程序中寻找并修复性能问题。 阅读本章后,你将能够: 在受CPU限制的应用程序中明确所有的CPU被哪些源代码行使用。用1trace和oprofile弄清楚应用程序调用各种内部与外部函…...

BERT变体(1):ALBERT、RoBERTa、ELECTRA、SpanBERT

Author:龙箬 Computer Application Technology Change the World with Data and Artificial Intelligence ! CSDNweixin_43975035 *天下之大,虽离家万里,何处不可往!何事不可为! 1. ALBERT \qquad ALBERT的英文全称为A Lite versi…...

域控操作二:设置域用户使用简单密码

过程太多简单 直接写出路径更改即可 组策略—计算机配置----策略—Windows设置–安全设置----账户策略–密码策略 按自己想法改就行了 注意一点!!!!! 要么自己设置策略,要么从默认策略改!&am…...

python---三目运算符

在Python中三目运算符也叫三元运算符,其主要作用:就是用于 简化if...else...语句。 基本语法: 原 if 条件判断: # 语句段1 else: # 语句段2 新-----三目运算符/三元运算符 语句段1 if 条件判断 else 语句段2 案例 输入两个数…...

百度地图定位BMap.GeolocationControl的用法

BMap.GeolocationControl 是百度地图API中的一个类,用于添加地理定位控件到地图上,以便用户可以通过该控件获取自己的当前位置。以下是 BMap.GeolocationControl 的用法示例: 首先,确保已经加载了百度地图API,并且创建…...

Vue3响应式原理初探

vue3响应式原理初探 为什么要使用proxy取代defineProperty使用proxy如何完成依赖收集呢? 为什么要使用proxy取代defineProperty 原因1:defineproperty无法检测到原本不存在的属性。打个🌰 new Vue({data(){return {name:wxs,age:25}}})在vue…...

firewalld常用的基础配置

firewalld防火墙是centos7系统默认的防火墙管理工具,取代了之前的iptables防火墙,也是工作在网络层,属于包过滤防火墙。 支持IPv4、IPv6防火墙设置以及以太网桥支持服务或应用程序直接添加防火墙规则接口拥有两种配置模式:临时模…...

功率放大器如何驱动超声波换能器

驱动超声波换能器的功率放大器在超声波应用中起着至关重要的作用。它能够提供足够的功率和精确的信号控制,使换能器能够有效地将电能转换为超声波能量。下面安泰电子将介绍功率放大器如何驱动超声波换能器的原理和关键要点。 首先,让我们了解一下超声波换…...

零门槛NAS搭建:WinNAS如何让普通电脑秒变私有云?

一、核心优势:专为Windows用户设计的极简NAS WinNAS由深圳耘想存储科技开发,是一款收费低廉但功能全面的Windows NAS工具,主打“无学习成本部署” 。与其他NAS软件相比,其优势在于: 无需硬件改造:将任意W…...

CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型

CVPR 2025 | MIMO:支持视觉指代和像素对齐的医学视觉语言模型 论文信息 标题:MIMO: A medical vision language model with visual referring multimodal input and pixel grounding multimodal output作者:Yanyuan Chen, Dexuan Xu, Yu Hu…...

python/java环境配置

环境变量放一起 python: 1.首先下载Python Python下载地址:Download Python | Python.org downloads ---windows -- 64 2.安装Python 下面两个,然后自定义,全选 可以把前4个选上 3.环境配置 1)搜高级系统设置 2…...

微服务商城-商品微服务

数据表 CREATE TABLE product (id bigint(20) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT 商品id,cateid smallint(6) UNSIGNED NOT NULL DEFAULT 0 COMMENT 类别Id,name varchar(100) NOT NULL DEFAULT COMMENT 商品名称,subtitle varchar(200) NOT NULL DEFAULT COMMENT 商…...

解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错

出现的问题 安装 flash-attn 会一直卡在 build 那一步或者运行报错 解决办法 是因为你安装的 flash-attn 版本没有对应上,所以报错,到 https://github.com/Dao-AILab/flash-attention/releases 下载对应版本,cu、torch、cp 的版本一定要对…...

全面解析各类VPN技术:GRE、IPsec、L2TP、SSL与MPLS VPN对比

目录 引言 VPN技术概述 GRE VPN 3.1 GRE封装结构 3.2 GRE的应用场景 GRE over IPsec 4.1 GRE over IPsec封装结构 4.2 为什么使用GRE over IPsec? IPsec VPN 5.1 IPsec传输模式(Transport Mode) 5.2 IPsec隧道模式(Tunne…...

Hive 存储格式深度解析:从 TextFile 到 ORC,如何选对数据存储方案?

在大数据处理领域,Hive 作为 Hadoop 生态中重要的数据仓库工具,其存储格式的选择直接影响数据存储成本、查询效率和计算资源消耗。面对 TextFile、SequenceFile、Parquet、RCFile、ORC 等多种存储格式,很多开发者常常陷入选择困境。本文将从底…...

python报错No module named ‘tensorflow.keras‘

是由于不同版本的tensorflow下的keras所在的路径不同,结合所安装的tensorflow的目录结构修改from语句即可。 原语句: from tensorflow.keras.layers import Conv1D, MaxPooling1D, LSTM, Dense 修改后: from tensorflow.python.keras.lay…...

uniapp 集成腾讯云 IM 富媒体消息(地理位置/文件)

UniApp 集成腾讯云 IM 富媒体消息全攻略(地理位置/文件) 一、功能实现原理 腾讯云 IM 通过 消息扩展机制 支持富媒体类型,核心实现方式: 标准消息类型:直接使用 SDK 内置类型(文件、图片等)自…...

es6+和css3新增的特性有哪些

一:ECMAScript 新特性(ES6) ES6 (2015) - 革命性更新 1,记住的方法,从一个方法里面用到了哪些技术 1,let /const块级作用域声明2,**默认参数**:函数参数可以设置默认值。3&#x…...