当前位置: 首页 > news >正文

目标检测应用场景和发展趋势

参考:

目标检测的未来是什么? - 知乎 (zhihu.com)icon-default.png?t=N7T8https://www.zhihu.com/question/394900756/answer/32489649815大应用场景
1 行人检测:

  • 遮挡问题:行人之间的互动和遮挡是非常常见的,这给行人检测带来了挑战。
  • 非刚性目标:行人是非刚性目标,其运动非常灵活。在复杂交通环境下,行人的行为具有很大的随机性和任意性。
  • 多姿势变化问题:行人可能有多种行走姿态,而且可能会与背景混合,难以分离。
  • 检测场景的复杂性:例如光照度的变化、时变性和大量存在的类似行人部分轮廓的物体等因素的干扰。
  • 行人检测的准确性和实时性:如何准确地检测和跟踪行人是行人检测技术需要解决的关键问题。

2 人脸检测

  • 人脸姿态和饰物问题:由于非配合型监控,人脸会出现侧脸、低头、抬头等各种姿态,以及佩戴帽子、黑框眼镜、口罩等饰物现象。
  • 光照问题:由于环境光源的影响,可能出现侧光、顶光、背光和高光等现象。
  • 人脸相似性问题:不同个体之间特别是同一民族的区别不大,所有人脸的结构都相似,甚至人脸的结构外形都很相似。
  • 人脸易变性:人可以通过脸部的变化产生很多表情,而在不同观察角度,人脸的视觉图像也相差很大。
  • 人脸表情复杂:人脸具有多样的变化能力,人的脸上分布着五十多块面部肌肉,这些肌肉的运动导致不同面部表情的出现,会造成人脸特征的显著改变。
  • 人脸随年龄而改变:随着年龄的增长,皱纹的出现和面部肌肉的松弛使得人脸的结构和纹理都将发生改变。
  • 人脸有易变化的附加物:例如改变发型,蓄留胡须或者佩戴帽子和眼镜等饰物。
  • 人脸特征遮掩:人脸全部、部分遮掩将会造成错误识别。
  • 人脸图像畸变:由于光照、视角、摄取角度不同,可能会造成图像的灰度畸变、角度旋转等,降低了图像质量,增大了识别难度。

3 文本检测

  • 文本具有多样性:自然场景中的文本检测难点主要在于文本的多样性,包括文字颜色、大小、字体、形状、方向、语言、以及文本长度的影响。
  • 文本形状复杂多样:文本的形状也是一大难点,因为文本可以以各种不同的形式出现在图像或视频中,包括单个字符的位置或者整个文本行的位置。
  • 缺乏通用方法:当前所说的文本检测一般是自然场景文本检测,其难点在于缺乏一个通用的方法来解决所有问题。
  • 背景复杂:在图像或视频中,文本可能会出现在各种不同的背景中,这增加了检测的难度。
  • 光照条件不定:光照的变化也会对文本检测造成很大的影响。
  • 文本大小不一:文本的大小也是一大难点,因为文本的大小会因图像或视频的分辨率不同而变化。
  • 字符粘连和断字:在某些情况下,文本中的字符可能会相互粘连,或者字符可能会断开,这会增加检测的难度。
  • 字体和字库大小有限:不同的字体和字库大小也会影响文本检测的结果。
  • 文本倾斜:文本可能会以不同的角度倾斜出现在图像或视频中,这也会增加检测的难度。
  • 遮挡和背景扰动:文本可能会被其他物体遮挡,或者背景中存在扰动因素,这也会影响文本检测的结果。

4 交通信号检测

  • 复杂的背景环境:在实际的城市自动驾驶场景中采集的交通信号灯图像具有复杂的背景,如四面八方的信号灯以及其他各类发光源。 遮挡问题:例如前面行驶的大货车或是交通指示牌等,都可能导致交通信号灯被遮挡。
  • 多态性的问题:交通信号灯不仅有颜色、形状和位置的变化,一些交通灯还包括箭头来指示方向和标记,比如人或自行车。
  • 成像条件的影响:包括天气、低分辨率、模糊等因素的影响,这些因素都可能降低交通信号灯检测的准确性。
  • 特征提取和分类问题:对交通信号灯进行识别通常来说分为两个过程,第一步是对图像的候选区域进行特征提取,第二步就是根据特征对识别的特征进行分类。

5 遥感目标检测

  • 数据规模问题:由于遥感图像的数据规模相对较小,这可能会对模型的训练产生影响。
  • 目标尺寸问题:遥感图像中包含了大量小尺寸的目标,这些小目标在经过神经网络的多层处理后,细节信息可能会丢失过多,导致检测准确率下降。
  • 旋转目标的检测问题:这是遥感图像目标检测中的一个重要难题,因为一般的检测算法往往假设目标在图像中是固定方向和姿态的,而旋转目标的出现会大大增加检测的难度。
  • 大中小目标分布不均:遥感场景下进行旋转目标检测时,大、中、小目标的分布通常是不均匀的,这种分布的不均衡性也增加了检测的难度。
  • 计算资源限制:相比于自然图像数据集,航拍图像一般分辨率较高,受计算资源限制,一些在自然图像中有效的检测小目标的方法如FPN直接应用到航拍图像就无能为力了。
  • 遥感图像分辨率巨大:遥感图像分辨率巨大,因此如何快速准确地检测出遥感目标仍然是一个挑战性的问题。
  • 目标遮挡问题:超过50%的目标被云雾所遮挡,因此目标遮挡问题也是遥感图像目标检测所面临的一个挑战。
  • 域适应问题:由不同传感器所捕获的遥感图像仍然存在很大差异。



 7大发展趋势
1 轻量型目标检测

轻量型目标检测的难点主要集中在以下几个方面:

  • 小模型性能问题:由于模型容量和能力的限制,小模型往往难以达到较好的性能。虽然大型模型的性能较好,但速度较慢,不符合实时需求。
  •  精确度与模型压缩之间的差距:在模型压缩过程中,可能会出现精确度下降的问题。物体检测比分类要困难得多,例如标签的计算更加昂贵,类别不均衡,多任务同时需要分类和回归等。
  • 数据不平衡问题:在轻量级目标检测中,正负样本比例失衡是一个常见问题,这会导致模型过于关注多数类,而忽视少数类,从而影响检测的准确性。
  • 计算资源限制:轻量型目标检测需要在有限的计算资源上进行,如何在保证准确性的同时提高检测速度是一个重要的挑战。
  •  模型加速与优化:如何设计并优化轻量化网络结构以提高模型的速度和准确度是一个重要的研究方向。

2 与AutoML结合的目标检测
3 领域自适应的目标检测
4 弱监督目标检测
5 小目标检测

  • 可利用特征较少:小目标相比于大/中目标分辨率低,信息较少,难以提取到具有鉴别力的特征。
  • 定位精度要求高:小目标在图像中位置过小且极易受到环境干扰,网络预测时偏移一个像素则对小目标的影响是巨大的。
  • 现有数据集中小目标占比少:现有数据集较少关注小目标这一特别类型。同时,小目标不易标注,人力成本巨大,而且对误差更为敏感。
  • 样本不均衡:训练时通过设定阈值来判断锚框是否属于正样本,这样会导致不同尺寸目标的样本不均衡问题。因此,当人工设定的锚框与真实边框相差较大时,会导致模型忽略小目标的检测。
  • 小目标聚集:小目标更容易出现聚集的现象,这时网络模型的预测边框可能会因非极大值抑制过滤掉大量正确边框,导致漏掉小目标,或是边框距离过近,导致模型难以收敛。

6 视频检测

  • 图像模糊:在拍摄视频的过程中,由于物体或相机的移动,会造成视频中的某些帧的画面发生模糊,造成无法分辨目标的情况。
  • 目标遮挡:如果目标物体被其他物体遮挡,会使目标检测更加困难。在这种情况下,需要算法能够识别并分割出被遮挡的目标。
  • 区分相似目标:在图像中,可能存在与目标物体外形相似的非目标物体,如何区分它们是一个难题。
  • 保持视频中目标的时空一致性:由于视频比静态图像多了一个时间维度上的信息,所以大多数视频目标检测算法利用该信息来增强检测性能,最常见的思路就是使用其他帧的特征来增强关键帧的预测效果。
  • 夜间诊断效果不佳:由于夜间为黑白画面呈现,加上夜间灯光的影响,视频诊断系统很难对画面问题做出准确判断。
  • 上下文信息利用:由于视频相较于单张图片多了一个时间维度上的信息,因此如何有效地利用这些时间上下文信息来提高检测性能,是视频检测面临的一个重要问题。

  • 运动变化处理:视频中的目标检测需要在静态图像目标检测的基础上对目标因运动产生的各种变化进行处理。


7 信息融合目标检测

相关文章:

目标检测应用场景和发展趋势

参考: 目标检测的未来是什么? - 知乎 (zhihu.com)https://www.zhihu.com/question/394900756/answer/32489649815大应用场景 1 行人检测: 遮挡问题:行人之间的互动和遮挡是非常常见的,这给行人检测带来了挑战。非刚性…...

Confluence 自定义博文列表

1. 概述 Confluence 自有博文列表无法实现列表自定义功能,实现该需求可采用页面中引用博文宏标签控制的方式 2. 实现方式 功能入口: Confluence →指定空间→创建页面 功能说明: (1)页面引用博文宏 (…...

chrome历史版本下载

chrome历史版本下载 windows Google Chrome all versions on Windows linux版本 Google Chrome 64bit Linux版_chrome浏览器,chrome插件,谷歌浏览器下载,谈笑有鸿儒...

Messari发布Moonbeam简报,每日交易量稳步增长,首次公布利润数据

区块链数据公司Messari首次发布Moonbeam项目分析简报,从项目市值、链上数据表现、质押以及Moonbeam的技术优势XCM使用量等角度全面分析。这个再熊市初期上线的项目一直在默默开发,并在跨链互操作领域拥有了相当的实操成绩。我们翻译了Messari简报中的部分…...

数据库 锁、索引、在实际开发中怎么设置和优化

数据库锁和索引是数据库管理的两个重要方面,它们对于确保数据的一致性和提高查询性能具有重要作用。在实际开发中,正确地设置和优化锁和索引对于构建高效、稳定的系统至关重要。下面是一些关于如何在实际开发中设置和优化锁和索引的建议: 锁…...

超详细彻底卸载Anaconda详细教程

一、在开始处打开Anaconda Prompt 二、打开后,输入conda install tqdm -f命令并按回车键 conda install tqdm -f三、之后页面会出现一个WANNING,这个我们不用在意,然后会出现一个y/n提示框,在这里我们输入y或者Y y四、输入cond…...

Python--随机出拳(random)--if判断--综合案例练习:石头剪刀布

注:涉及相关链接: Python:if判断--综合案例练习:石头剪刀布-CSDN博客 Python语言非常的强大,强大之处就在于其拥有很多模块(module),这些模块中拥有很多别人已经开发好的代码&…...

微信小程序里配置less

介绍 在微信小程序里,样式文件的后缀名都是wxss,这导致一个问题,就是页面样式过多的时候,要写很多的类名来包裹,加大了工作量,还很有可能会写错样式。这时可以配置一个less,会大大提高代码编辑…...

MySq修改配置文件

要修改 MySQL 的配置文件,您可以按照以下步骤进行操作: 1、打开 MySQL 的配置文件 在大多数 Linux 系统上,默认的配置文件路径是 /etc/my.cnf 或 /etc/mysql/my.cnf。您可以使用文本编辑器(如 vim、nano)以管理员权限打开该文件。 sudo vim /etc/my.cnf 2、进行修改 …...

HTML 表格及练习

表格 概述 表格是一种二维结构,横行纵列。 由单元格组成。 表格是一种非常“强” 的结构: 每一行有相同的列数(单元格),每一列有相同的行数(单元格) 同一列的单元格,宽度&#…...

YOLOv5-训练自己的VOC格式数据集(VOC、自建数据集)

YOLOv5:训练自己的 VOC 格式数据集 1. 自定义数据集 1.1 环境安装 pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple注意: 安装 lxmlPillow 版本要低于 10.0.0,解释链接: module ‘PIL.Image’ has no attri…...

基于Java的考研信息查询系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序(小蔡coding) 代码参考数据库参考源码获取 前言 💗博主介绍:✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作者&am…...

Linux性能优化--性能追踪:受CPU限制的应用程序(GIMP)

10.0 概述 本章包含了一个例子:如何用Linux性能工具在受CPU限制的应用程序中寻找并修复性能问题。 阅读本章后,你将能够: 在受CPU限制的应用程序中明确所有的CPU被哪些源代码行使用。用1trace和oprofile弄清楚应用程序调用各种内部与外部函…...

BERT变体(1):ALBERT、RoBERTa、ELECTRA、SpanBERT

Author:龙箬 Computer Application Technology Change the World with Data and Artificial Intelligence ! CSDNweixin_43975035 *天下之大,虽离家万里,何处不可往!何事不可为! 1. ALBERT \qquad ALBERT的英文全称为A Lite versi…...

域控操作二:设置域用户使用简单密码

过程太多简单 直接写出路径更改即可 组策略—计算机配置----策略—Windows设置–安全设置----账户策略–密码策略 按自己想法改就行了 注意一点!!!!! 要么自己设置策略,要么从默认策略改!&am…...

python---三目运算符

在Python中三目运算符也叫三元运算符,其主要作用:就是用于 简化if...else...语句。 基本语法: 原 if 条件判断: # 语句段1 else: # 语句段2 新-----三目运算符/三元运算符 语句段1 if 条件判断 else 语句段2 案例 输入两个数…...

百度地图定位BMap.GeolocationControl的用法

BMap.GeolocationControl 是百度地图API中的一个类,用于添加地理定位控件到地图上,以便用户可以通过该控件获取自己的当前位置。以下是 BMap.GeolocationControl 的用法示例: 首先,确保已经加载了百度地图API,并且创建…...

Vue3响应式原理初探

vue3响应式原理初探 为什么要使用proxy取代defineProperty使用proxy如何完成依赖收集呢? 为什么要使用proxy取代defineProperty 原因1:defineproperty无法检测到原本不存在的属性。打个🌰 new Vue({data(){return {name:wxs,age:25}}})在vue…...

firewalld常用的基础配置

firewalld防火墙是centos7系统默认的防火墙管理工具,取代了之前的iptables防火墙,也是工作在网络层,属于包过滤防火墙。 支持IPv4、IPv6防火墙设置以及以太网桥支持服务或应用程序直接添加防火墙规则接口拥有两种配置模式:临时模…...

功率放大器如何驱动超声波换能器

驱动超声波换能器的功率放大器在超声波应用中起着至关重要的作用。它能够提供足够的功率和精确的信号控制,使换能器能够有效地将电能转换为超声波能量。下面安泰电子将介绍功率放大器如何驱动超声波换能器的原理和关键要点。 首先,让我们了解一下超声波换…...

PHP和Node.js哪个更爽?

先说结论,rust完胜。 php:laravel,swoole,webman,最开始在苏宁的时候写了几年php,当时觉得php真的是世界上最好的语言,因为当初活在舒适圈里,不愿意跳出来,就好比当初活在…...

23-Oracle 23 ai 区块链表(Blockchain Table)

小伙伴有没有在金融强合规的领域中遇见,必须要保持数据不可变,管理员都无法修改和留痕的要求。比如医疗的电子病历中,影像检查检验结果不可篡改行的,药品追溯过程中数据只可插入无法删除的特性需求;登录日志、修改日志…...

Linux相关概念和易错知识点(42)(TCP的连接管理、可靠性、面临复杂网络的处理)

目录 1.TCP的连接管理机制(1)三次握手①握手过程②对握手过程的理解 (2)四次挥手(3)握手和挥手的触发(4)状态切换①挥手过程中状态的切换②握手过程中状态的切换 2.TCP的可靠性&…...

linux 错误码总结

1,错误码的概念与作用 在Linux系统中,错误码是系统调用或库函数在执行失败时返回的特定数值,用于指示具体的错误类型。这些错误码通过全局变量errno来存储和传递,errno由操作系统维护,保存最近一次发生的错误信息。值得注意的是,errno的值在每次系统调用或函数调用失败时…...

ServerTrust 并非唯一

NSURLAuthenticationMethodServerTrust 只是 authenticationMethod 的冰山一角 要理解 NSURLAuthenticationMethodServerTrust, 首先要明白它只是 authenticationMethod 的选项之一, 并非唯一 1 先厘清概念 点说明authenticationMethodURLAuthenticationChallenge.protectionS…...

Springcloud:Eureka 高可用集群搭建实战(服务注册与发现的底层原理与避坑指南)

引言:为什么 Eureka 依然是存量系统的核心? 尽管 Nacos 等新注册中心崛起,但金融、电力等保守行业仍有大量系统运行在 Eureka 上。理解其高可用设计与自我保护机制,是保障分布式系统稳定的必修课。本文将手把手带你搭建生产级 Eur…...

UR 协作机器人「三剑客」:精密轻量担当(UR7e)、全能协作主力(UR12e)、重型任务专家(UR15)

UR协作机器人正以其卓越性能在现代制造业自动化中扮演重要角色。UR7e、UR12e和UR15通过创新技术和精准设计满足了不同行业的多样化需求。其中,UR15以其速度、精度及人工智能准备能力成为自动化领域的重要突破。UR7e和UR12e则在负载规格和市场定位上不断优化&#xf…...

【开发技术】.Net使用FFmpeg视频特定帧上绘制内容

目录 一、目的 二、解决方案 2.1 什么是FFmpeg 2.2 FFmpeg主要功能 2.3 使用Xabe.FFmpeg调用FFmpeg功能 2.4 使用 FFmpeg 的 drawbox 滤镜来绘制 ROI 三、总结 一、目的 当前市场上有很多目标检测智能识别的相关算法,当前调用一个医疗行业的AI识别算法后返回…...

高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数

高效线程安全的单例模式:Python 中的懒加载与自定义初始化参数 在软件开发中,单例模式(Singleton Pattern)是一种常见的设计模式,确保一个类仅有一个实例,并提供一个全局访问点。在多线程环境下,实现单例模式时需要注意线程安全问题,以防止多个线程同时创建实例,导致…...

Java求职者面试指南:Spring、Spring Boot、MyBatis框架与计算机基础问题解析

Java求职者面试指南:Spring、Spring Boot、MyBatis框架与计算机基础问题解析 一、第一轮提问(基础概念问题) 1. 请解释Spring框架的核心容器是什么?它在Spring中起到什么作用? Spring框架的核心容器是IoC容器&#…...