【AI最前线】DP双像素sensor相关的AI算法全集:深度估计、图像去模糊去雨去雾恢复、图像重建、自动对焦
Dual Pixel 简介
双像素是成像系统的感光元器件中单帧同时生成的图像:通过双像素可以实现:深度估计、图像去模糊去雨去雾恢复、图像重建
成像原理来源如上,也有遮罩等方式的pd生成,如图双像素视图可以看到光圈的不同一半,这提供了一个深度提示。然而,由于基本的模糊性,如果相机的焦距(或光圈大小或焦距)发生变化,不同的场景可能会产生相同的双像素图像。在(a)中,具有焦距g1的相机在距离Z1处成像聚焦的蓝色点和离焦的橙色点。通过光圈左半部分折射的光(深蓝色和橙色光线)到达每个双像素的右半部分,反之亦然。这导致了一个双像素图像,其中失焦橙色点被d像素(a,“DP数据”)位移,被b像素模糊(a,”图像”)。在(b)中,不同的焦距和场景深度集产生相同的双像素和RGB图像。然而,如文中所示,该场景通过逆深度上的仿射变换与(a)中的场景相关。消费者迅速采用。双像素相机似乎代表了更雄心勃勃的光场相机和传统相机之间的一种有前景的折衷方案——DP相机牺牲了可忽略的空间分辨率来采样光场中的两个角度,而真正的单眼相机只采样一个角度,Lytro Illum等光场相机以牺牲显著的空间分辨率为代价采样196个角度。因此,它们在消费类相机和内窥镜等空间受限的应用中得到了更广泛的采用[6]。
消费类硬件的最新发展可能为深度估计的新方法提供机会。最近,通过使用密集的双像素(DP)传感器(图2),可以使用一台相机同时捕获两张类似于具有微小基线的立体对的图像(图1)。虽然这项技术最初是为相机自动对焦而开发的,但双像素图像也可以用来从单个相机中恢复密集的深度图,从而消除了对额外硬件、校准或同步的任何需求。例如,Wadhwa等人[55]使用经典的立体技术(块匹配和边缘感知平滑)从DP数据中恢复深度。但如图1所示,传统立体技术可以生成的深度图的质量是有限的,因为DP图像中视差和焦点之间的相互作用可能会导致经典立体匹配技术失败。现有的基于单眼学习的技术在这方面也表现不佳

接下来就介绍双像素相关的sota论文和代码,长期更新教学
Table of contents
- DualPixel
- Dateset
Dual Pixel
| Year | Pub | Paper | App | Repo |
|---|---|---|---|---|
| 2018 | SIGGRAPH | Synthetic Depth-of-Field with a Single-Camera Mobile Phone | Depth / Segmenation / Synthetic DoF | |
| 2019 | CVPR | Reflection Removal Using a Dual-Pixel Sensor | Reflection Removal | Code |
| 2019 | ICCV | Learning Single Camera Depth Estimation using Dual-Pixels | Depth | Code & Dataset |
| 2020 | ICCP | Modeling Defocus-Disparity in Dual-Pixel Sensors | Depth | Code & Dataset |
| 2020 | CVPR | Learning to Autofocus | Autofocus | Dataset |
| 2020 | ECCV | Du2Net: Learning Depth Estimation from Dual-Cameras and Dual-Pixels | Disparity (w/Stereo) | |
| 2020 | ECCV | Defocus Deblurring Using Dual-Pixel Data | Deblur | Code & Dataset |
| 2021 | CVPR | Dual Pixel Exploration: Simultaneous Depth Estimation and Image Restoration | Depth / Deblur | Code & Dataset |
| 2021 | CVPRW | NTIRE 2021 Challenge for Defocus Deblurring Using Dual-pixel Images: Methods and Results | Deblur | |
| 2021 | CVPRW | ATTSF Attention! Stay Focus! | Deblur | Code |
| 2021 | ICCV | Defocus Map Estimation and Deblurring From a Single Dual-Pixel Image | Deblur / Defocus Map | Code & Dataset |
| 2021 | ICCV | Learning to Reduce Defocus Blur by Realistically Modeling Dual-Pixel Data | Deblur | Code & Dataset |
| 2021 | IEEE | World Largest Mobile Image Sensor with All Directional Phase Detection Auto Focus Function | Depth | |
| 2021 | ICTC | Disparity probability volume guided defocus deblurring using dual pixel data | Deblur | |
| 2021 | Journal of Electronic Imaging | Defocus deblurring: a designed deep model based on CNN | Deblur | |
| 2021 | IEEE | All-Directional Dual Pixel Auto Focus Technology in CMOS Image Sensors | Circuits | |
| 2022 | WACV | Improving Single-Image Defocus Deblurring: How Dual-Pixel Images Help Through Multi-Task Learning | Deblur | Code & Dataset |
| 2022 | ISSCC | A 1/1.57-inch 50Mpixel CMOS Image Sensor With 1.0μm All-Directional Dual Pixel by 0.5μm-Pitch Full-Depth Deep-Trench Isolation Technology | Circuits | |
| 2022 | ECCV | Facial Depth and Normal Estimation using Single Dual-Pixel Camera | Depth / Surface Normal / Anti-spoofing / Relighting | Code & Dataset |
| 2023 | CVPR | K3DN: Disparity-Aware Kernel Estimation for Dual-Pixel Defocus Deblurring | Deblur | |
| 2023 | CVPR | Spatio-Focal Bidirectional Disparity Estimation From a Dual-Pixel Image | Depth / Disparity | Code |
| 2023 | ICCP | Learning to Synthesize Photorealistic Dual-pixel Images from RGBD frames | Simulator | Code & Dataset |
| 2023 | ICCV | Exploring Positional Characteristics of Dual-Pixel Data for Camera Autofocus | Autofocus |
这其中
| 2019 | ICCV | Learning Single Camera Depth Estimation using Dual-Pixels | Depth |
网络的代码被复现在:DualPixelFace/src at main · MinJunKang/DualPixelFace · GitHub ;GitHub - vyi/PdCapture: [google-research/dual-pixels](Forked from https://github.com/google-research/google-research/tree/master/dual_pixels)
GitHub - RugvedKatole/Learning-Single-Camera-Depth-Estimation-using-Dual-Pixels: This Repo is an implementation of paper titled "Learning Single Camera Depth Estimation using Dual-Pixels"
Dataset
| Year | Pub | Paper | Detail |
|---|---|---|---|
| 2019 | ICCV | Learning Single Camera Depth Estimation using Dual-Pixels | Train:2506, Test:684, Res:1512x2016(DP), 16bit png, DP Raw / Depth |
| 2020 | ICCP | Modeling Defocus-Disparity in Dual-Pixel Sensors | Num:100, Res:5180x2940, RGB 8bit jpg / 16bit tif Depth, DP LR / Depth |
| 2020 | ECCV | Defocus Deblurring Using Dual-Pixel Data | Num:500, Res:1680x1120, 16bit, Used for NTIRE 2021 Challenge (CVPRW) |
| 2021 | CVPR | Dual Pixel Exploration: Simultaneous Depth Estimation and Image Restoration | DP Simulator from NYUD Dataset |
| 2021 | ICCV | Learning to Reduce Defocus Blur by Realistically Modeling Dual-Pixel Data | DP Simulator form SYNTHIA-SF dataset |
| 2023 | ICCP | Learning to Synthesize Photorealistic Dual-pixel Images from RGBD frames | Num:5130, Res:1680x1120, RGB(DP LRC) 8bit png / Depth 16bit png |
小结
欢迎AI深度估计、AI重建、AI恢复图像:图像去雾去雨去模糊降噪方向的同学一起交流,cv君正在打造最大最前沿的AI社区,让你在浓厚的学习氛围中进步,让你在飞速发展的时代中砥砺前行;免费进群交流请私信cv君(免费)
相关文章:
【AI最前线】DP双像素sensor相关的AI算法全集:深度估计、图像去模糊去雨去雾恢复、图像重建、自动对焦
Dual Pixel 简介 双像素是成像系统的感光元器件中单帧同时生成的图像:通过双像素可以实现:深度估计、图像去模糊去雨去雾恢复、图像重建 成像原理来源如上,也有遮罩等方式的pd生成,如图双像素视图可以看到光圈的不同一半&#x…...
CTF之密码学(Polybius密码)
棋盘密码,也称为Polybius密码或方格密码,是一种基于替换的加密方法。以下是对棋盘密码的详细解析: 一、加密原理 棋盘密码使用一个5x5的方格棋盘,其中填充了26个英文字母(通常i和j被视为同一个字母并放在同一个格子中…...
【C++篇】从售票窗口到算法核心:C++队列模拟全解析
文章目录 须知 💬 欢迎讨论:如果你在学习过程中有任何问题或想法,欢迎在评论区留言,我们一起交流学习。你的支持是我继续创作的动力! 👍 点赞、收藏与分享:觉得这篇文章对你有帮助吗࿱…...
clipboard
clipboard 现代复制到剪贴板。无闪光。只有 3kb 的 gzip 压缩。 安装 npm install clipboard --save第三方cdn提供商 <script src"https://cdn.jsdelivr.net/npm/clipboard2.0.11/dist/clipboard.min.js"></script>使用 data-clipboard-target"…...
【Mac】VMware Fusion Pro 安装 CentOS 7
1、下载镜像 CentOS 官网阿里云镜像网易镜像搜狐镜像 Mac M1芯片无法直接使用上述地址下载的最新镜像(7.9、9),会一直卡在安装界面(在 install 界面按 enter 回车无效),想要使用需要经过一系列操作&#…...
游戏引擎学习第22天
移除 DllMain() 并成功重新编译 以下是对内容的详细复述与总结: 问题和解决方案: 在编译过程中遇到了一些问题,特别是如何告知编译器不要退出程序,而是继续处理。问题的根源在于编译过程中传递给链接器的参数设置不正确。原本尝试…...
洛谷 B2038:奇偶 ASCII 值判断
【题目来源】https://www.luogu.com.cn/problem/B2038http://shnoip.openjudge.cn/level1/39/【题目描述】 任意输入一个字符,判断其 ASCII 是否是奇数,若是,输出 YES,否则,输出 NO。 例如,字符 A 的 ASCII…...
APIRouter
当然可以!理解 FastAPI 中直接在 FastAPI 实例上定义路由与使用 APIRouter 作为路由器的区别,对于编写结构良好、可维护性高的应用程序至关重要。下面,我将详细解释这两种方法的区别、各自的优缺点以及何时使用它们。 1. 直接在 FastAPI 实例…...
算法模板2:位运算+离散化+区间合并
文章目录 1.6 位运算**位运算的常见应用**1.7 离散化**经典离散化题目例子****1. 区间合并和覆盖长度问题****2. 区间查询与修改****3. 动态求第 K 小值****4. 区间最大重叠次数****5. 动态逆序对计数****6. 二维区间问题****7. 模拟车流/时间段事件****8. 区间众数统计** **具…...
钉钉授权登录
一.找开钉钉开发平台【钉钉开放平台 (dingtalk.com)】 二。点击菜单【应用开发】->左边【钉钉应用】->【创建应用】 三。创建应用-》保存成功后,点击自己【新建的应用】,进入详细页面 四。进入应用详细页面。左边【分享设置】 注意:进…...
【视频】二维码识别:libzbar-dev、zbar-tools(zbarimg )
1、简介 ZBar可以使用多个方式识别各种条形码和二维码。 支持的格式有:EAN-13/UPC-A、UPC-E、EAN-8、Code 128、Code 93、Code 39、Codabar、Interleaved 2 of 5、QR Code和SQ Code 支持的来源有:视频流、图像文件等 libzbar-dev:二维码识别开发库 zbar-tools(zbarimg …...
C语言中的结构体,指针,联合体的使用
目录 1. 概述2. 定义和初始化3. 成员的使用4. 结构体数组5. 结构体套结构体6. 结构体赋值7. 结构体和指针8. 结构体作为函数参数9. 共用体(联合体)10. typedef就是取别名总结 1. 概述 数组:连续的相同数据类型的集合 结构体:不同…...
基于卡尔曼滤波器的 PID 控制
基于卡尔曼滤波器的PID控制算法结合了经典控制理论和现代信号处理技术。卡尔曼滤波器(Kalman Filter, KF)可以对噪声数据进行平滑处理,从而改善PID控制器的性能,特别是在处理具有噪声和不确定性的系统时。以下是详细的设计过程&am…...
CVE-2022-26201
打开是这么个页面 左上角找到Admin访问 里面有个Add Users,访问一下,能创建用户,有个能上传图片的地方 普通的一句话木马无法访问flag,需要创建一个权限马 <?php system($_GET[1]);phpinfo();?> 因为只能上传jpg形式的文…...
海信Java后端开发面试题及参考答案
TCP 的优点是什么? TCP(Transmission Control Protocol,传输控制协议)是一种面向连接的、可靠的、基于字节流的传输层通信协议,它具有众多优点。 首先,TCP 提供可靠的传输服务。它通过序列号、确认应答、重传机制等确保数据的准确无误传输。例如,在发送数据时,发送方会…...
传智杯 3-初赛:终端
题目描述: 有一天您厌烦了电脑上又丑又没用的终端,打算自己实现一个 Terminal。具体来说,它需要支持如下命令: 1. touch filename:如果名为 filename 的文件不存在,就创建一个这样的文件,如果已经存在同名…...
大数据新视界 -- Hive 数据分区:精细化管理的艺术与实践(上)(7/ 30)
💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的…...
【中间件】Redis
一、什么是Redis Redis是一个开源(BSD许可),内存存储的数据结构服务器,可用作数据库,高速缓存和消息队列代理。它支持字符串、哈希表、列表、集合、有序集合,位图,hyperloglogs等数据类型。内置…...
RTSP播放器EasyPlayer.js播放器分辨率高的视频在设置container的宽高较小时,会出现锯齿状的画面效果
流媒体播放器的核心技术及发展趋势展现了其在未来数字生活中的无限潜力。随着技术的不断进步和市场的持续发展,流媒体播放器将在内容创新、用户体验优化以及跨平台互通等方面取得新的突破。对于从业者而言,把握这些趋势并积极应对挑战将是实现成功的关键…...
Java爬虫:获取商品详情的实践之旅
在当今这个信息爆炸的时代,数据的价值日益凸显。对于电商行业来说,商品详情的获取尤为重要,它不仅关系到产品的销售,还直接影响到用户体验。传统的人工获取方式耗时耗力,而自动化的爬虫技术则提供了一种高效解决方案。…...
日语AI面试高效通关秘籍:专业解读与青柚面试智能助攻
在如今就业市场竞争日益激烈的背景下,越来越多的求职者将目光投向了日本及中日双语岗位。但是,一场日语面试往往让许多人感到步履维艰。你是否也曾因为面试官抛出的“刁钻问题”而心生畏惧?面对生疏的日语交流环境,即便提前恶补了…...
内存分配函数malloc kmalloc vmalloc
内存分配函数malloc kmalloc vmalloc malloc实现步骤: 1)请求大小调整:首先,malloc 需要调整用户请求的大小,以适应内部数据结构(例如,可能需要存储额外的元数据)。通常,这包括对齐调整,确保分配的内存地址满足特定硬件要求(如对齐到8字节或16字节边界)。 2)空闲…...
调用支付宝接口响应40004 SYSTEM_ERROR问题排查
在对接支付宝API的时候,遇到了一些问题,记录一下排查过程。 Body:{"datadigital_fincloud_generalsaas_face_certify_initialize_response":{"msg":"Business Failed","code":"40004","sub_msg…...
day52 ResNet18 CBAM
在深度学习的旅程中,我们不断探索如何提升模型的性能。今天,我将分享我在 ResNet18 模型中插入 CBAM(Convolutional Block Attention Module)模块,并采用分阶段微调策略的实践过程。通过这个过程,我不仅提升…...
使用分级同态加密防御梯度泄漏
抽象 联邦学习 (FL) 支持跨分布式客户端进行协作模型训练,而无需共享原始数据,这使其成为在互联和自动驾驶汽车 (CAV) 等领域保护隐私的机器学习的一种很有前途的方法。然而,最近的研究表明&…...
从深圳崛起的“机器之眼”:赴港乐动机器人的万亿赛道赶考路
进入2025年以来,尽管围绕人形机器人、具身智能等机器人赛道的质疑声不断,但全球市场热度依然高涨,入局者持续增加。 以国内市场为例,天眼查专业版数据显示,截至5月底,我国现存在业、存续状态的机器人相关企…...
《通信之道——从微积分到 5G》读书总结
第1章 绪 论 1.1 这是一本什么样的书 通信技术,说到底就是数学。 那些最基础、最本质的部分。 1.2 什么是通信 通信 发送方 接收方 承载信息的信号 解调出其中承载的信息 信息在发送方那里被加工成信号(调制) 把信息从信号中抽取出来&am…...
DIY|Mac 搭建 ESP-IDF 开发环境及编译小智 AI
前一阵子在百度 AI 开发者大会上,看到基于小智 AI DIY 玩具的演示,感觉有点意思,想着自己也来试试。 如果只是想烧录现成的固件,乐鑫官方除了提供了 Windows 版本的 Flash 下载工具 之外,还提供了基于网页版的 ESP LA…...
SpringTask-03.入门案例
一.入门案例 启动类: package com.sky;import lombok.extern.slf4j.Slf4j; import org.springframework.boot.SpringApplication; import org.springframework.boot.autoconfigure.SpringBootApplication; import org.springframework.cache.annotation.EnableCach…...
MySQL用户和授权
开放MySQL白名单 可以通过iptables-save命令确认对应客户端ip是否可以访问MySQL服务: test: # iptables-save | grep 3306 -A mp_srv_whitelist -s 172.16.14.102/32 -p tcp -m tcp --dport 3306 -j ACCEPT -A mp_srv_whitelist -s 172.16.4.16/32 -p tcp -m tcp -…...
