当前位置: 首页 > article >正文

【CVPR26-杜克大学】超越真值约束:利用图像质量先验实现真实场景图像修复

Beyond Ground-Truth: Leveraging Image Quality Priors for Real-World Image Restoration代码https://github.com/fengyang1399-pixel/IQPIR单位杜克大学、清华大学、洛桑联邦理工学院一、问题背景现在的真实场景图像修复模糊人脸、暗光、水下、背光图修复几乎都依赖标准答案图Ground-Truth监督训练。但这个模式有两个致命问题标准答案图本身质量参差不齐AI只能学到平均画质修不出顶级高清效果只挑高质量图训练会丢失数据多样性容易修出伪影、失真直接用画质分数优化容易出现“分数高、看着假”的过度优化问题传统码本模型虽然稳定但完全依赖不完美的标准答案没法主动追求人眼最舒服的高清质感。二、方法创新作者提出了一套叫IQPIR的全新框架核心是用“画质先验”代替死磕标准答案三大创新点画质条件Transformer把无参考画质评价NR-IQA的分数当作条件输入让AI直接朝着“满分画质”去修即插即用不改动原有模型结构。双码本结构普通码本学图像通用轮廓、结构高清码本专学发丝、纹理等顶级细节 两者融合兼顾结构准确与质感高清。离散空间画质优化用码本的离散表示限制输出空间解决连续空间里“分数高、图像假”的过度优化让分数高真的好看。三、实验结果IQPIR在四大真实场景任务中全面登顶SOTA盲人脸修复在LFW、WebPhoto、WIDER数据集上各项画质指标全部第一用户打分最高暗光图像增强PSNR、SSIM领先FID、BIQE更低视觉更干净自然水下图像增强清晰度、色彩还原优于现有模型UIQE、UIQM指标最优背光图像修复细节保留完整颜色失真最小同时把IQPIR集成到其他主流修复模型WaveFace、Interlcm、Reti-Diff等都能带来2%~7%的稳定提升。四、优势与局限核心优势不依赖完美标准答案主动追求最高感知画质即插即用可无缝增强现有图像修复模型双码本离散优化兼顾结构准确与真实质感泛用性强人脸、暗光、水下、背光全场景适用局限画质先验来自现有NR-IQA模型会继承其评价偏差对超极端退化、极低质图像的修复稳定性仍有提升空间五、一句话总结IQPIR抛弃对不完美标准答案的依赖用画质先验双码本让AI直接学会“审美修图”在真实场景图像修复中实现更清晰、更自然、更贴合人眼观感的效果还能轻松赋能现有模型。

相关文章:

【CVPR26-杜克大学】超越真值约束:利用图像质量先验实现真实场景图像修复

Beyond Ground-Truth: Leveraging Image Quality Priors for Real-World Image Restoration代码:https://github.com/fengyang1399-pixel/IQPIR单位:杜克大学、清华大学、洛桑联邦理工学院一、问题背景现在的真实场景图像修复(模糊人脸、暗光…...

ElegantBook LaTeX模板技术解析:中文书籍排版系统架构与实战应用

ElegantBook LaTeX模板技术解析:中文书籍排版系统架构与实战应用 【免费下载链接】ElegantBook Elegant LaTeX Template for Books 项目地址: https://gitcode.com/gh_mirrors/el/ElegantBook ElegantBook作为LaTeX中文书籍排版的专业解决方案,通…...

OpenClaw+千问3.5-27B开发提效:日志分析+异常自动上报

OpenClaw千问3.5-27B开发提效:日志分析异常自动上报 1. 为什么需要自动化日志分析 作为一个长期与代码打交道的开发者,我每天至少有30%的时间花在查看日志、定位问题上。特别是在调试分布式系统时,不同服务的日志分散在各个文件&#xff0c…...

复分析与复变函数的区别

1、本质相同,称呼习惯不同 ‌复分析与复变函数本质上指代同一数学分支,无实质区别‌,通常可互换使用 。二者主要差异体现在‌课程定位‌与‌研究侧重‌上:‌‌ 2、‌名称沿革‌:复变函数论是传统称呼,复分析…...

Testsigma企业级自动化测试平台架构设计与高可用部署指南

Testsigma企业级自动化测试平台架构设计与高可用部署指南 【免费下载链接】testsigma Testsigma is an agentic test automation platform powered by AI-coworkers that work alongside QA teams to simplify testing, accelerate releases and improve quality across web, m…...

恒模约束波形设计(Constant Modulus Waveform Design)第2章 MIMO雷达波形设计基础

目录 2.1 MIMO雷达系统模型 2.1.1 发射-接收信号模型与阵列几何配置 2.1.2 信号依赖干扰建模 2.1.3 扩展目标与点目标检测模型 2.2 波形设计目标函数 2.2.1 波束赋形设计准则 2.2.2 输出SINR最大化框架 2.2.3 CRLB最小化方法 2.3 硬件约束与工程实现 2.3.1 高功率放大…...

3分钟搞定30+文库下载:这款开源神器如何帮你突破平台限制?

3分钟搞定30文库下载:这款开源神器如何帮你突破平台限制? 【免费下载链接】kill-doc 看到经常有小伙伴们需要下载一些免费文档,但是相关网站浏览体验不好各种广告,各种登录验证,需要很多步骤才能下载文档,该…...

openclaw部署oauth模式codex无法正常登录

windows: openclaw onboard --auth-choice openai-codex 执行后,codex浏览器可以登录,但是终端中返回403 这里报错可以看到是region不符合,可以看下vpn中是否开启了tun模式,开启后可以测试一下地区 curl.exe https:/…...

适合嵌入式新手实战的五个项目!

嵌入式开发需结合硬件操作与软件逻辑,初学阶段通过实战项目积累经验至关重要。本文精选5个难度递进的小项目,覆盖基础外设控制到简单智能系统搭建,帮助快速掌握核心技能。一、基础控制类1. LED流水灯核心目标:掌握GPIO输出控制与延…...

Camunda 业务规则任务 (Business Rule Task) 与 DMN 深度解析

Camunda 业务规则任务 (Business Rule Task) 与 DMN 深度解析一、 核心概念定义 1. Business Rule Task(业务规则任务) 角色定位:BPMN 流程中的“决策代理人”。它不执行具体的业务动作(如发送邮件),而是负…...

Leather Dress Collection赋能服装创业:低成本生成高质感皮革服饰概念图

Leather Dress Collection赋能服装创业:低成本生成高质感皮革服饰概念图 你是不是也有过这样的困扰?脑子里有一个绝佳的皮革服装设计灵感,却苦于找不到合适的画师,或者高昂的设计费让你望而却步。对于服装创业者、独立设计师&…...

终极指南:如何用Obsidian PDF++插件将PDF阅读效率提升300%

终极指南:如何用Obsidian PDF插件将PDF阅读效率提升300% 【免费下载链接】obsidian-pdf-plus PDF: the most Obsidian-native PDF annotation & viewing tool ever. Comes with optional Vim keybindings. 项目地址: https://gitcode.com/gh_mirrors/ob/obsid…...

一个简单到尴尬却有效的SFT实验

卷友们好,我是rumor。上周Apple有篇论文做了一个简单到有点尴尬的实验:从模型自己采样一批代码答案,不过滤对错,不执行验证,直接拿去SFT。结果Qwen3-30B在LiveCodeBench v6上,pass1从42.4%涨到55.3%&#x…...

基恩士VL扫描仪:高效检测场景的适配之选

一、引言企业选购3D扫描仪时,“哪个品牌性价比高”是核心决策难题。性价比并非单纯看价格高低,而是精度、效率、操作成本与长期服务的综合平衡,这也是企业筛选3D扫描仪品牌的核心评判维度。当前制造业检测流程优化需求迫切,接触式…...

3个核心突破:科研工作者的文献获取难题终极解决方案

3个核心突破:科研工作者的文献获取难题终极解决方案 【免费下载链接】zotero-scipdf Download PDF from Sci-Hub automatically For Zotero7 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-scipdf 作为科研工作者,你是否经常遇到这些困扰&…...

Uber成为亚马逊AI芯片最新拥趸,云服务竞争白热化

周二,亚马逊宣布Uber扩大其AWS云服务合约,将更多打车功能迁移到亚马逊芯片上运行。Uber将特别扩大对AWS Graviton芯片(低功耗ARM架构服务器CPU)的使用,并开始试用Trainium3——AWS对标英伟达的AI芯片。这项合作与其说是…...

ChatGLM3-6B-128K实战案例:Ollama中构建政府政策文件智能解读与条款匹配

ChatGLM3-6B-128K实战案例:Ollama中构建政府政策文件智能解读与条款匹配 1. 项目背景与需求场景 在日常工作中,我们经常需要处理大量的政策文件、法规条文和规范性文档。这些文件往往篇幅冗长、条款复杂,人工阅读和理解需要耗费大量时间和精…...

使用Anaconda配置清华镜像源加速PyTorch安装

1. 为什么需要配置清华镜像源? 如果你在国内使用Anaconda安装PyTorch,可能会遇到下载速度慢、安装失败的问题。这主要是因为PyTorch的默认下载源位于国外服务器,网络传输距离远,再加上某些网络限制,导致下载速度很不理…...

3种高效方法:快速部署BetterNCM插件管理器

3种高效方法:快速部署BetterNCM插件管理器 【免费下载链接】BetterNCM-Installer 一键安装 Better 系软件 项目地址: https://gitcode.com/gh_mirrors/be/BetterNCM-Installer BetterNCM-Installer是一款专为网易云音乐客户端设计的插件管理器,提…...

Qwen2.5-7B新手部署:如何用最简单的方法运行阿里大模型

Qwen2.5-7B新手部署:如何用最简单的方法运行阿里大模型 1. 引言 Qwen2.5-7B是阿里云最新开源的大语言模型,相比前代版本在知识量、编程能力和数学能力等方面都有显著提升。对于想要体验这款强大AI模型的新手来说,部署过程可能会显得有些复杂…...

颠覆式效率革命:Krita智能选区插件重新定义图像分割工作流

颠覆式效率革命:Krita智能选区插件重新定义图像分割工作流 【免费下载链接】krita-vision-tools Krita plugin which adds selection tools to mask objects with a single click, or by drawing a bounding box. 项目地址: https://gitcode.com/gh_mirrors/kr/kr…...

Skill vs App:一场入口范式的争夺

田晏林 发自 凹非寺量子位 | 公众号 QbitAI中关村科学城国际创新服务集聚区的会议室,座无虚席。原定2点开始的沙龙活动,不少观众提前一个小时就到场。他们大多是从业多年的产品经理、创业者,也有大学生和刚入行的年轻人。OpenClaw带来的连锁反…...

暗黑破坏神2终极单机增强插件:PlugY完全指南,三步搞定无限仓库与技能重置

暗黑破坏神2终极单机增强插件:PlugY完全指南,三步搞定无限仓库与技能重置 【免费下载链接】PlugY PlugY, The Survival Kit - Plug-in for Diablo II Lord of Destruction 项目地址: https://gitcode.com/gh_mirrors/pl/PlugY 你是否曾经在暗黑破…...

Java的运行时数据区

Java虚拟机在执行Java程序时会把它所管辖的内存划分为若干个区域,这些区域各有用途,生命周期也各自不同。1、程序计数器。是每条线程都有的一小块私有区域。在程序执行时,一个CPU内核内只能有一条线程执行,不会有多条线程并行执行…...

如何用OpenCore Legacy Patcher让旧Mac焕发新生?3个核心技巧揭秘

如何用OpenCore Legacy Patcher让旧Mac焕发新生?3个核心技巧揭秘 【免费下载链接】OpenCore-Legacy-Patcher Experience macOS just like before 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 你的旧Mac还在跑着过时的macOS版…...

镭神智能C32激光雷达实战:从开箱到点云可视化全流程解析

1. 开箱与硬件连接 第一次拿到镭神智能C32激光雷达时,包装箱里会有这些关键部件:雷达主机、电源适配器、网线、HDMI线(可选)和说明书。我建议先找个宽敞的工作台,把所有配件摊开检查一遍,避免遗漏。 连接步…...

技术揭秘:SMUDebugTool如何实现AMD Ryzen处理器的深度硬件调试

技术揭秘:SMUDebugTool如何实现AMD Ryzen处理器的深度硬件调试 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: ht…...

OpenClaw多模型对比:千问3.5-9B与其他开源模型性能实测

OpenClaw多模型对比:千问3.5-9B与其他开源模型性能实测 1. 为什么需要多模型对比 去年冬天,当我第一次在本地部署OpenClaw时,最让我头疼的问题不是安装配置,而是选择哪个大模型作为后端。官方文档列出了十几种兼容模型&#xff…...

如何让经典魔兽争霸在现代系统重生?WarcraftHelper兼容性解决方案全解析

如何让经典魔兽争霸在现代系统重生?WarcraftHelper兼容性解决方案全解析 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 当你在Windows 11…...

网易云音乐永久直链解析API完整指南:高效获取稳定音乐链接

网易云音乐永久直链解析API完整指南:高效获取稳定音乐链接 【免费下载链接】netease-cloud-music-api 网易云音乐直链解析 API 项目地址: https://gitcode.com/gh_mirrors/ne/netease-cloud-music-api 还在为网易云音乐分享链接频繁失效而烦恼吗?…...