ISP-AF相关-聚焦区域选择-清晰度评价-1(待补充)
1、镜头相关
镜头类型
变焦类型:
定焦、手动变焦、自动变焦
光圈:
固定光圈、手动光圈、自动光圈
视场角:
鱼眼镜头、超广角镜头、广角镜头、标准镜头、长焦镜头、超长焦镜头(由大至小)
光圈:
超星光镜头、星光镜头、通用镜头
接口类型:
M12、$\Phi$14、C、CS、尼康F口、索尼A口、佳能E口等
外形功能:
球面镜头、非球面镜头、针孔镜头、鱼眼镜头
自动聚焦是指通过电机控制载物台或镜头的运动使物体的成像由模糊变得清晰的过程。
变焦
变焦通常指通过移动镜头内的透镜镜片位置来拉长或缩短焦距,也叫ZOOM。变焦目前可以分为光学变焦和数字变焦两种类型,光学变焦不会牺牲清晰度,数字变焦显著牺牲清晰度
光学变焦:
光学变焦是通过移动镜头内部镜片的相对位置来改变焦点的位置,改变镜头焦距的长短,并改变镜头的视角大小,从而实现影像的放大与缩小。如果被拍摄的物体位置保持不变,镜头的焦距与物体的放大倍率会呈现正比例的关系,如果要用一个词来形容光学变焦的话,那就是“望远镜”。(成像面水平方向移动)
数字变焦:
数字变焦是通过可拍照手机处理器,把图片内的每个像素面积增大,从而达到放大的目的,就像我们在ACDSEE等图像处理软件中,强行拉大图像的像素一样,只不过这个过程在手机中进行,把原来SENSOR上的一部分像素使用插值手段进行放大。与光学变焦不同的是,数码变焦是在SENSOR垂直方向上的变化,而给人以变焦效果的。由于整个过程焦距没有任何变化,所以图像质量是会随着放大比例的增加,逐渐下降。(成像面垂直方向缩放)
数字变焦也可以分为插值算法变焦和伪数字变焦两种:
插值算法变焦:对图像进行插值运算,将图像的尺寸扩大到所需的规格,这种算法就其效果而言,并不理想,尤其是当使用在手机上的时候,手机上的摄像头本身得到的数据就有较大的噪声,再插值的话,得到的图像几乎没法使用。
伪数字变焦:当摄像头不处在最大分辨率格式的情况下,比如130万像素的 sensor 使用 640x480的规格拍照时,仍旧设置 sersor 工作在 1280x960 的分辨率下,而后通过采集中央部分的图像来获取 640x480 的照片,使得在手机上看来所拍物体尺寸被放大了一倍。这种办法几乎不需要额外的算法支持,对图像质量也没有影响,缺点是只有小尺寸情况下可以采用。
对焦(调焦)
用凸透镜做照像机的镜头时,最清晰的像一般不会正好落在焦点上,或者说,最清晰的像到光心的距离(像距)一般不等于焦距,而是略大于焦距。具体的距离与被照的物体与镜头的距离(物距)有关,物距越大,像距越小,(但实际上总是大于焦距)。
对焦实际上是调整整个镜头的位置(而不是镜头内的镜片)的位置,来控制像距,从而使成像最清晰。被照的物体与相机(镜头)的距离不总是相同的,比如给人照像,有时,想照全身的,离得就远,照半身的,离得就近。要想照得到清晰的像,就必须随着物距的不同而改变感光面到镜头光心的距离。
由于人眼分辨能力的限制,一定范围内的模糊量不会对观察到的成像效果产生影响。对于清晰的成像,人眼视网膜对模糊感知的最大程度就是允许模糊量s,s的值在O.03.0.04mm之间。
对焦可以分为手动对焦,自动对焦,多点对焦:
手动对焦,它是通过手工转动对焦环来调节相机镜头从而使拍摄出来的照片清晰的一种对焦方式。
自动对焦,由照相机根据被摄体距离的远近,自动地调节镜头的对焦距离。
多点对焦,也叫区域对焦,当对焦中心不设置在图片中心的时候,可以使用多点对焦。常见的多点对焦为5点,7点和9点对焦。
2、聚焦区域选择
窗口过小容易丢失图像的重要细节;窗口过大会加重背景区域的干扰,同时也带来更大的计算量
聚焦窗口应该位于图像的主体目标区域,常用的窗口选择方法主要分为静态和动态两类。静态取窗方法有:中心区域取窗法、黄金分割十字区域取窗法和倒T型取窗法等;动态取窗方法有:高斯非均匀采样取窗法、一阶矩取窗法和人眼视觉显著机制取窗法等。前者通常是根据某个特征选定固定区域作为聚焦窗口,聚焦窗口大小由实际目标图像确定;后者是对图像的信息分布进行统计分析,给出一个最优的主体景物估计区域,然后取单个或多个窗口作为聚焦区域。
1、中心取窗法
中心取窗法认为人眼感兴趣目标总是位于图像的中心位置,故把中心部分作为聚焦区域。计算聚焦区域内的图像清晰度值,根据自动聚焦调节方法使聚焦区域内的物体达到最清晰即完成自动聚焦。这种聚焦区域选择方法适用于大多数情况,但若感兴趣目标偏离图像中心位置,摄像机将无法聚焦到感兴趣目标,聚焦质量会严重下降
【示意图待补充】
中心取窗方法的假设前提是主体目标位于图像中心,当图像中心是纯色背景时,会导致聚焦失败,窗口矩形框的长、宽分别为图像长、宽的1/4,中心区域的大小一般为图像的1/1 6,计算量减少了93.75%。
2、倒T型区域取窗
观察一幅图像时,人眼的注意力第一时间通常会放在图像的中下部分。在摄影构图时,人们也通常会将被摄物体放于整个场景的中下部分。因此可选择图像中下部的区域作为聚焦区域,如图 2.5 所示。该方法提高了感兴趣区域覆盖成功率,但同时会引入更多背景信息,导致图像清晰度值的计算量相应增加。
3、黄金多点取窗选择法
在实际场景中,往往包含多个不同的物体,物体的纹理以及距离摄像机的远近不尽相同。多点取窗法是将图像按照一定的规则划分为几个区域,选择与感兴趣目标较接近的区域作为图像的聚焦区域。聚焦区域选择灵活多变,使用场景更丰富。
光学成像系统中,只存在一个正确的焦平面,只有在焦平面位置才可以得到清晰的物体成像,并且在其他位置时目标点的成像会出现斑点。考虑到人眼的最小角度分辨率,当斑点直径小于一定值时,可以将其识别为清晰的图像点。
图像存在边缘,一幅图像聚焦与否与图像边缘信息的高频成分有关,当完全聚焦时,图像清晰,边缘信息的多,聚焦评价函数值最大;当图像离焦时,图像模糊,边缘信息较少,聚焦评价函数值小。
图像聚焦评价函数:
特性
1)无偏性:
清晰度评价函数曲线的峰值应该对应最清晰的聚焦的位置,不同离焦程度的评价值也对应着不同的离焦图像采集位置。
2)单峰性:
从远离准焦面到正焦面再到远离准焦面的过程中,聚焦评价函数曲线对应地先递增再递减,准确聚焦位置时取值最大,应该满足单峰性要求。
3)灵敏度:
评价函数曲线的陡峭程度反映了自动聚焦过程中的灵敏度,若曲线越平缓,则灵敏度越低。自动聚焦过程中希望有较高的灵敏度,曲线应该有一定的陡峭度。
4)抗噪性:
在噪声干扰下,曲线是否依旧能保持较好的形状特性。
5)实时性:
我们希望自动聚焦的过程是一个较为短暂的时间,为满足自动聚焦系统实时性的要求,设计的算法不能过于复杂,计算量不能太大。
评价函数
(1)SMD函数
SMD函数称为灰度差分和函数。它依据某一像素点的相邻的左像素点和上像素点与这一点的差值之和,来计算图像聚焦极值点
FSMD=∑i,j(∣f(i,j)−f(i,j−1)∣+∣f(i,j)−f(i−1,j)∣)F_{SMD}=\sum_{i,j}(\lvert f(i,j)-f(i,j-1) \rvert +\lvert f(i,j)-f(i-1,j) \rvert ) FSMD=i,j∑(∣f(i,j)−f(i,j−1)∣+∣f(i,j)−f(i−1,j)∣)
SMD函数算法简单、速度快、抗干扰能力较强,但精度不高。
(2)Brenner函数
计算相邻k个单位像素点间的灰度差,然后得到差的平方
FBrenner=∑i,j∣f(i+k,j)−f(i,j)∣2F_{Brenner}=\sum_{i,j}\lvert f(i+k,j)-f(i,j) \rvert ^2 FBrenner=i,j∑∣f(i+k,j)−f(i,j)∣2
Brenner函数复杂度低,计算过程简单,
(3)Tenengrad函数
FTenengrad=∑i,j(∣Gi2(i,j)+Gj2(i,j)∣)F_{Tenengrad}=\sum_{i,j}(\lvert G_{i}^{2}(i,j)+G_{j}^{2}(i,j) \rvert ) FTenengrad=i,j∑(∣Gi2(i,j)+Gj2(i,j)∣)
其中,Gi(i,j)G_{i}(i,j)Gi(i,j)和Gj(i,j)G_{j}(i,j)Gj(i,j)是i,j方向的一阶sobel算子差分
(4)EOG函数 平方梯度
FEOG=∑i,j(∣f(i,j)−f(i,j−1)∣2+∣f(i,j)−f(i−1,j)∣2)F_{EOG}=\sum_{i,j}(\lvert f(i,j)-f(i,j-1) \rvert ^2 +\lvert f(i,j)-f(i-1,j) \rvert ^2) FEOG=i,j∑(∣f(i,j)−f(i,j−1)∣2+∣f(i,j)−f(i−1,j)∣2)
(5)Robert算子梯度函数
FRobert=∑i,j(∣f(i,j)−f(i+1,j+1)∣+∣f(i+1,j)−f(i,j+1)∣)F_{Robert}=\sum_{i,j}(\lvert f(i,j)-f(i+1,j+1) \rvert +\lvert f(i+1,j)-f(i,j+1) \rvert ) FRobert=i,j∑(∣f(i,j)−f(i+1,j+1)∣+∣f(i+1,j)−f(i,j+1)∣)
Roberts梯度函数根据聚焦区域内所有交叉像素点间像素差值之和计算得出,以计算图像的聚焦清晰点,改进SMD函数,抗干扰性能比SMD函数的强
(6)sobel算子梯度函数
FSobel=∑i,j∣Gi(i,j)+Gj(i,j)∣F_{Sobel}=\sum_{i,j}\lvert G_{i}(i,j)+G_{j}(i,j) \rvert FSobel=i,j∑∣Gi(i,j)+Gj(i,j)∣
其中,Gi(i,j)G_{i}(i,j)Gi(i,j)和Gj(i,j)G_{j}(i,j)Gj(i,j)是i,j方向的一阶sobel算子差分
(7)Laplace算子函数
FLaplace=∑i,j∣f(i−1,j)−f(i+1,j)+f(i,j−1)−f(i,j+1)−4f(i,j)∣2F_{Laplace}=\sum_{i,j}\lvert f(i-1,j)-f(i+1,j) + f(i,j-1)-f(i,j+1) - 4f(i,j) \rvert ^2 FLaplace=i,j∑∣f(i−1,j)−f(i+1,j)+f(i,j−1)−f(i,j+1)−4f(i,j)∣2
参考文章:<基于梯度计算的自动聚焦图像清晰度评价函数仿真分析>
<自动聚焦 系统研究>
结合之前清晰度的计算,补充一些AF的内容
觉得本文对您有一点帮助,欢迎讨论、点赞、收藏,您的支持激励我多多创作。
我的个人博客主页,欢迎访问
我的CSDN主页,欢迎访问
我的GitHub主页,欢迎访问
我的知乎主页,欢迎访问
相关文章:
ISP-AF相关-聚焦区域选择-清晰度评价-1(待补充)
1、镜头相关 镜头类型 变焦类型: 定焦、手动变焦、自动变焦 光圈: 固定光圈、手动光圈、自动光圈 视场角: 鱼眼镜头、超广角镜头、广角镜头、标准镜头、长焦镜头、超长焦镜头(由大至小) 光圈: 超星…...
[element-ui] el-table行添加阴影悬浮效果
问题: 在el-table每一行获得焦点与鼠标经过时,显示一个整行的阴影悬浮效果 /*其中,table-row-checkd是我自定义的焦点行添加类名,大家可以自己起名*/ .el-table tbody tr:hover,.el-table tbody tr.table-row-checked{box-shadow: 0px 3px …...

分布式存储技术(上):HDFS 与 Ceph的架构原理、特性、优缺点解析
面对企业级数据量,单机容量太小,无法存储海量的数据,这时候就需要用到多台机器存储,并统一管理分布在集群上的文件,这样就形成了分布式文件系统。HDFS是Hadoop下的分布式文件系统技术,Ceph是能处理海量非结…...
【python设计模式】20、解释器模式
哲学思想: 解释器模式(Interpreter Pattern)是一种行为型设计模式,它提供了一种方式来解释和执行特定语言的语法或表达式。该模式中,解释器通过将表达式转换为可以执行的对象来实现对表达式的解释和执行。通常…...

【PostgreSQL】通过docker的方式运行部署PostgreSQL与go操作数据库
目录 1、docker的方式运行部署PostgreSQL 2、控制台命令 3、go操作增删改查 1、docker的方式运行部署PostgreSQL docker pull postgres docker run --name learn_postgres -e POSTGRES_PASSWORDdocker_user -e POSTGRES_USERdocker_user -p 5433:5432 -d postgres进入容器&am…...
Kotlin协程序列:
1: 使用方式一 ,callback和coroutine相互转化。 import kotlinx.coroutines.* import java.lang.Exception class MyCallback {fun doSomething(callback: (String?, Exception?) -> Unit) {// 模拟异步操作GlobalScope.launch {try {delay(1000) // 延迟 1 秒…...
java获取视频时长
1、先导包 <dependency><groupId>ws.schild</groupId><artifactId>jave-all-deps</artifactId><version>2.6.0</version> </dependency>2、获取时长 Testpublic void test01() {long time 0;try {String url "http://…...

EDAS投稿系统的遇到的问题及解决办法
问题1: gutter: Upload failed: The gutter between columns is 0.2 inches wide (on page 1), but should be at least 0.2 inches 解决: 在\begin{document}前添加\columnsep 0.201 in(0.2in也会报错,建议填大一点点)…...

t-learning 产品经理课程笔记
t-learning 腾讯公开课——产品经理课程 第一课 化身用户研究员,张小龙《产品精讲》 1-3:执行 4-7:中坚力量 7:核心leader 能解决问题的,就是好的产品经理 如何储备产品知识与素养 (1)了解并…...
校招,从准备开始准备(持续更新ing...)
诸神缄默不语-个人CSDN博文目录 作者现在有科研任务在身(今天还在标数据哦),所以不能实习。 所以就是纯纯拉个表。 最近更新时间:2023.4.9 最早更新时间:2023.4.6 文章目录1. 学习资料和知识点清单1.1 机器学习1.2 深…...

Android:使用LayerDrawable动态生成四宫格头像(包含双人、三人头像)
其实用自定义View也可以实现,我比较懒,就用LayerDrawable来创建一个新的Drawable资源实现。 举例4宫格,9宫格原理类似,每个图标的位置需要用边距慢慢调成预期的效果 效果如下: 双人头像: 三人头像&#x…...
Android Jetpack 从使用到源码深耕【数据库注解Room 从实践到原理 】(三)
前面两篇文章,我们一起学习了,Room引入的背景、Room的使用方式、Room的实现原理猜想验证、Room的源码原理探索总结。 本文,我们将其中牵扯到的课外知识点 or 过程中没有说到的知识点,进行一下单独的总结。 题外话:扩展知识点总结 1. 抽象工厂的设计模式应用 在源码探索…...

中国电子学会2023年03月份青少年软件编程Scratch图形化等级考试试卷三级真题(含答案)
2023-03 Scratch三级真题 分数:100 题数:38 测试时长:60min 一、单选题(共25题,共50分) 1.计算“248……128”,用变量n表示每项,根据变化规律,变量n的赋值用下列哪个最合适?&am…...
分布式事务培训
MQ发生成功 MQ响应失败 断网 DIY seary 不保证隔离性,扣账不成功,钱被花了。导致回滚不成功 超时处理。 超时处理机制 防悬挂, try 的 try catch 导致不报错。空提交 处理链,inputlog万一数据库出现问题。outlog 最终保证回滚。映…...

关键词采集工具可以帮助我们做那些方面的工作
针对搜索引擎的关键词采集工具可以帮助我们做那些方面的工作,至少从10个工作场景说明,并列举详细的使用场景 Msray-plus,是一款企业级综合性爬虫/采集软件。 支持亿级数据存储、导入、重复判断等。无需使用复杂的命令,提供本地W…...

2023年5月PMP难考吗?
PMP考试难不难,还是因人而异的,对小白而言,肯定是难的,对项目管理老人而言,难度肯定是没那么高。 难点主要是非常多而难理解的知识点,以及答题时的知识点提取。经过系统的学习,分解知识点&…...
定语从句的省略
1. 关系代词的省略(即that which之类的) 条件:首先限制定语从句(即没有逗号的) 先行词在从句中作宾语成分 两个条件缺一不可,先行词中作主语成分是不可以的。(这就是形容词短语作定语后置和定…...

简易小工具实现批量打开多个网页
最近有个需求,希望一次性可以打开多个网页,网址自由指定,这个需求的实现非常简单,使用基本的c代码调用system函数即可,都不需要MFC相关的东西。 但是我实测一些工具后发现一个问题,当打开超过大约3个网址的…...
swiper 点击事件
点击swiper 获取当前下标 两种模式 "swiper": "^5.4.5", "vue-awesome-swiper": "^3.1.3",swiperOption: {autoplay: { delay: 3000 },loop: true, //循环slidesPerView: auto,direction: "vertical",disableOnInteraction:…...

旅游心得Traveling Experience
前言 加油 原文 旅游心得常用会话 ❶ Share photos of the trip with friends. 与朋友分享旅游的照片。 ❷ We’ll go to the Great Wall, if you prefer. 你如果愿意的话,我们去长城。 ❸ Would you go to the church or the synagogue or the mosque? 你会去教堂,犹太…...

7.4.分块查找
一.分块查找的算法思想: 1.实例: 以上述图片的顺序表为例, 该顺序表的数据元素从整体来看是乱序的,但如果把这些数据元素分成一块一块的小区间, 第一个区间[0,1]索引上的数据元素都是小于等于10的, 第二…...
React Native 导航系统实战(React Navigation)
导航系统实战(React Navigation) React Navigation 是 React Native 应用中最常用的导航库之一,它提供了多种导航模式,如堆栈导航(Stack Navigator)、标签导航(Tab Navigator)和抽屉…...

【人工智能】神经网络的优化器optimizer(二):Adagrad自适应学习率优化器
一.自适应梯度算法Adagrad概述 Adagrad(Adaptive Gradient Algorithm)是一种自适应学习率的优化算法,由Duchi等人在2011年提出。其核心思想是针对不同参数自动调整学习率,适合处理稀疏数据和不同参数梯度差异较大的场景。Adagrad通…...

JavaScript 中的 ES|QL:利用 Apache Arrow 工具
作者:来自 Elastic Jeffrey Rengifo 学习如何将 ES|QL 与 JavaScript 的 Apache Arrow 客户端工具一起使用。 想获得 Elastic 认证吗?了解下一期 Elasticsearch Engineer 培训的时间吧! Elasticsearch 拥有众多新功能,助你为自己…...
在HarmonyOS ArkTS ArkUI-X 5.0及以上版本中,手势开发全攻略:
在 HarmonyOS 应用开发中,手势交互是连接用户与设备的核心纽带。ArkTS 框架提供了丰富的手势处理能力,既支持点击、长按、拖拽等基础单一手势的精细控制,也能通过多种绑定策略解决父子组件的手势竞争问题。本文将结合官方开发文档,…...
五年级数学知识边界总结思考-下册
目录 一、背景二、过程1.观察物体小学五年级下册“观察物体”知识点详解:由来、作用与意义**一、知识点核心内容****二、知识点的由来:从生活实践到数学抽象****三、知识的作用:解决实际问题的工具****四、学习的意义:培养核心素养…...
python如何将word的doc另存为docx
将 DOCX 文件另存为 DOCX 格式(Python 实现) 在 Python 中,你可以使用 python-docx 库来操作 Word 文档。不过需要注意的是,.doc 是旧的 Word 格式,而 .docx 是新的基于 XML 的格式。python-docx 只能处理 .docx 格式…...

第一篇:Agent2Agent (A2A) 协议——协作式人工智能的黎明
AI 领域的快速发展正在催生一个新时代,智能代理(agents)不再是孤立的个体,而是能够像一个数字团队一样协作。然而,当前 AI 生态系统的碎片化阻碍了这一愿景的实现,导致了“AI 巴别塔问题”——不同代理之间…...

select、poll、epoll 与 Reactor 模式
在高并发网络编程领域,高效处理大量连接和 I/O 事件是系统性能的关键。select、poll、epoll 作为 I/O 多路复用技术的代表,以及基于它们实现的 Reactor 模式,为开发者提供了强大的工具。本文将深入探讨这些技术的底层原理、优缺点。 一、I…...

浪潮交换机配置track检测实现高速公路收费网络主备切换NQA
浪潮交换机track配置 项目背景高速网络拓扑网络情况分析通信线路收费网络路由 收费汇聚交换机相应配置收费汇聚track配置 项目背景 在实施省内一条高速公路时遇到的需求,本次涉及的主要是收费汇聚交换机的配置,浪潮网络设备在高速项目很少,通…...