当前位置: 首页 > article >正文

TPAMI 2025 | 港城大团队新作:强化学习引导 ODE 轨迹,提升图像复原性能

点击上方“小白学视觉”选择加星标或“置顶” 重磅干货第一时间送达在计算机视觉领域图像恢复一直是核心研究方向之一——从模糊的监控画面中还原清晰细节、让水下拍摄的照片重现真实色彩、给低光照的夜景图像提亮增晰这些看似神奇的操作背后都离不开图像恢复技术的支撑。近期一篇发表于TPAMI 2025的研究论文为基于微分方程的图像恢复方法带来了颠覆性突破提出全新的轨迹优化范式打造出统一的感知图像恢复模型FLUX-IR在超分辨率、去噪、去模糊等7类任务上均达到领先水平。论文信息题目 Learning Efficient and Effective Trajectories for Differential Equation-Based Image Restoration基于微分方程的图像恢复学习高效且有效的轨迹作者Zhiyu Zhu, Jinhui Hou, Hui Liu, Huanqiang Zeng, Junhui Hou一、痛点扩散模型的“两难”——效果与效率不可兼得扩散模型凭借强大的生成能力成为近年图像恢复领域的研究热点。这类方法通过构建微分方程轨迹在低质量图像和高质量图像的分布之间搭建桥梁反向采样实现图像恢复。但实际应用中两个核心问题始终制约着它的落地 一是重建效果易受误差累积影响扩散模型推理时依赖逐步去噪分数估计的微小误差会不断累积导致最终恢复结果失真 二是推理效率低下为保证效果传统扩散模型需要大量采样步骤计算成本高、耗时久难以满足实时应用需求。既要提升恢复质量又要加速推理过程成为扩散模型在图像恢复领域亟待解决的核心矛盾。二、核心突破轨迹优化新范式兼顾效果与效率针对上述痛点研究团队提出了一套全新的轨迹优化框架整体思路可通过下图清晰理解图1该框架主要包含两大核心阶段基于强化学习的轨迹增强以及成本感知的轨迹蒸馏。前者聚焦提升重建质量后者专攻推理效率优化二者结合实现了“鱼与熊掌兼得”。1. 基于强化学习的ODE轨迹增强找对“恢复路径”扩散模型的反向生成轨迹常因概率特性出现不稳定、混乱的问题就像走迷宫时选错了方向越走越偏离目标。研究团队发现确定性的常微分方程ODE轨迹虽然稳定但缺乏多样性无法找到最优路径而随机微分方程SDE能生成多样轨迹却噪声强度固定灵活性不足。为此团队创新性引入调制随机微分方程M-SDE通过动态调整噪声强度生成多样化的候选恢复轨迹再借助强化学习将ODE轨迹与其中最有效的M-SDE轨迹对齐——相当于在迷宫中先试遍多条可能的路径再把最优路线固定下来引导模型沿着最精准的方向完成图像恢复。图2这一过程解决了传统扩散模型分数估计误差累积的问题让模型学习到更优的恢复路径从根源上提升重建质量。2. 成本感知的轨迹蒸馏走快“恢复路径”找到最优路径后如何减少走完全程的步数研究团队提出成本感知的轨迹蒸馏策略通过分析蒸馏过程的成本特性针对性减轻模型学习负担1初始状态插值告别“从噪声起步”传统扩散模型推理时需要从纯高斯噪声开始生成初始阶段的估计误差极大。而图像恢复任务中低质量输入图像虽然退化但仍包含场景的结构、语义信息比随机噪声更有价值。团队利用低质量图像进行初始状态插值将其作为生成过程的起点而非从纯噪声开始。这一步相当于给模型一个“初始参考”大幅降低初始阶段的估计误差让模型从更接近目标的起点出发完成恢复。2低质量图像负向引导校准“前进方向”低质量图像和高质量图像的分布存在显著差异团队将低质量图像作为采样引导通过调整分数函数放大扩散过程中的正向恢复成分进一步修正生成方向。这就像在前进时不断用“错误样本”校准方向让模型少走弯路在更少的步数内达到理想效果。图3上图清晰展示了蒸馏成本的特性蒸馏成本与步数负相关、初始步骤对成本贡献最大、高低质量图像分布差异显著这也印证了上述策略的合理性。三、统一模型FLUX-IR7大任务全面领先基于上述轨迹优化框架研究团队对120亿参数的基础扩散模型FLUX-DEV进行微调打造出统一的图像恢复模型FLUX-IR。该模型可处理超分辨率、去噪、去模糊、低光增强、水下增强、去雨、去雪7类图像恢复任务无需为不同任务单独设计模型泛化能力拉满。1. 任务特定实验性能碾压现有SOTA1水下图像增强在UIEB数据集上FLUX-IR相比HCLR-net、SemiUIR等SOTA方法PSNR提升1.3dB即使是单步模型也优于传统多步方法。在无参考指标评估中FLUX-IR的MUSIQ、CLIPIQA分数最高NIQE分数最低恢复出的图像色彩更自然、细节更清晰水下物体的轮廓和纹理还原度远超对比方法。图42低光图像增强在LOL-v1数据集上FLUX-IR实现0.7dB的PSNR提升LOL-v2数据集上提升超1.1dB。更关键的是其单步推理仅需0.06秒效率远超LLFormer、LLFlow-L-SKFF等方法。视觉效果上即使是极低光照区域的细节如文字、叶片纹理也能精准重建。图53图像去雨在Raindrop、Outdoor-Rain等数据集上FLUX-IR分别实现2.1dB、0.9dB的PSNR提升双步和单步模型均优于专门的去雨扩散模型。对于雨滴严重遮挡的区域如汽车屋顶、户外架子能精准还原物体结构甚至能校正纹理颜色清晰重建模糊的文字和数字。图62. 统一任务验证感知质量与效率双优除了上述任务FLUX-IR在超分辨率、去噪、去模糊、去雪任务中同样表现出色。在感知质量评估中MUSIQ、CLIPIQA等指标全面领先且推理步数大幅减少兼顾了视觉效果和计算效率。这意味着无论是专业的工业场景还是日常的图像修复需求FLUX-IR都能提供高质量、高效率的解决方案。四、总结重新定义微分方程基图像恢复这篇TPAMI 2025论文的核心价值在于提出了一套全新的轨迹优化范式从“找对路径”和“走快路径”两个维度解决了扩散模型在图像恢复领域的核心痛点。其打造的FLUX-IR模型不仅在7类任务上刷新SOTA更实现了“统一模型适配多任务”的突破为图像恢复技术的实用化、规模化落地奠定了基础。未来随着该框架与更高效的网络结构、更丰富的数据集结合基于微分方程的图像恢复方法有望在更多实际场景中发挥作用——从安防监控、医疗影像到手机拍照、影视后期让高质量的图像恢复触手可及。下载1OpenCV-Contrib扩展模块中文版教程在「小白学视觉」公众号后台回复扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。下载2Python视觉实战项目52讲在「小白学视觉」公众号后台回复Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目助力快速学校计算机视觉。下载3人工智能0基础学习攻略手册在「小白学视觉」公众号后台回复攻略手册即可获取《从 0 入门人工智能学习攻略手册》文档包含视频课件、习题、电子书、代码、数据等人工智能学习相关资源可以下载离线学习。交流群欢迎加入公众号读者群一起和同行交流目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群以后会逐渐细分请扫描下面微信号加群备注”昵称学校/公司研究方向“例如”张三 上海交大 视觉SLAM“。请按照格式备注否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告否则会请出群谢谢理解~

相关文章:

TPAMI 2025 | 港城大团队新作:强化学习引导 ODE 轨迹,提升图像复原性能

点击上方“小白学视觉”,选择加"星标"或“置顶” 重磅干货,第一时间送达在计算机视觉领域,图像恢复一直是核心研究方向之一——从模糊的监控画面中还原清晰细节、让水下拍摄的照片重现真实色彩、给低光照的夜景图像提亮增晰&#x…...

PyTorch 2.8镜像功能体验:支持多卡计算,大幅缩短模型训练时间

PyTorch 2.8镜像功能体验:支持多卡计算,大幅缩短模型训练时间 1. PyTorch 2.8镜像概述 PyTorch 2.8镜像是一个开箱即用的深度学习环境,预装了PyTorch 2.8和CUDA工具包。这个镜像最大的亮点是支持多GPU并行计算,能够显著加速模型…...

Qwen3.5-9B商业落地实践:电商客服图文理解+多轮需求确认系统

Qwen3.5-9B商业落地实践:电商客服图文理解多轮需求确认系统 1. 项目概述与核心价值 Qwen3.5-9B是一款拥有90亿参数的开源大语言模型,在电商客服场景中展现出强大的商业应用价值。该系统通过多模态理解和长上下文支持能力,能够同时处理文字和…...

利用 Worker Threads 优化 Vite 构建性能的实战

背景在我们的前端工程化实践中,随着项目规模的扩大,构建效率问题逐渐凸显。特别是在生产环境构建流程中,为了保护源码逻辑,我们通常会引入 JavaScript 混淆工具(如 javascript-obfuscator)。这一步虽然必要…...

逆向实战:WASM加密在荔枝网x-itouchtv-ca参数中的定位与Hook技巧

1. WASM加密技术解析 WebAssembly(简称WASM)是一种新兴的二进制指令格式,它的出现让前端加密技术迈上了新台阶。与传统JavaScript加密相比,WASM具有明显的性能优势。在我的实际测试中,相同加密算法在WASM环境下的执行速…...

直接上代码吧,咱们先用Python+OpenCV搞个帧间差法的Demo。看这段核心代码

基于帧间差法进行视频目标检测处理 【是仅源码的价格】 【可写完整课程设计文档报告】 需要或需要请随时联系,博主常在线能秒回 1.[1]视频目标检测: 视频目标检测是指从视频流中自动识别和提取出运动目标的过程 视频目标检测算法通常基于以下原理和方法&…...

Windows 10下SQLMap安装配置全攻略(附Python环境搭建)

Windows 10下SQLMap实战指南:从Python环境搭建到高级配置 在渗透测试和安全研究领域,SQLMap无疑是数据库安全检测的瑞士军刀。这款开源工具能够自动检测和利用SQL注入漏洞,支持几乎所有主流数据库系统。但对于Windows用户,特别是刚…...

SMBIOS字符串逆向解析技巧:从二进制数据到硬件信息全解密(含Type1实例分析)

SMBIOS字符串逆向解析技巧:从二进制数据到硬件信息全解密(含Type1实例分析) 在数字取证和硬件分析领域,SMBIOS数据结构就像一台计算机的"身份证档案库",存储着从主板序列号到电池规格等数百项硬件细节。但当…...

基于YOLOV8的车辆检测系统:快速上手与实用功能

基于YOLOV8的车辆检测系统 基于深度学习的车辆检测系统有数据集 模型已经训练好 直接用即可 报告 30r 就是售价 包搭配环境 远程运行跑通程序 本项目已经训练好模型,配置好环境可直接使用,运行效果见图像(可找我要演示视频) 项…...

Graphormer在药物发现中的价值:缩短先导化合物筛选周期50%以上

Graphormer在药物发现中的价值:缩短先导化合物筛选周期50%以上 1. 引言:药物研发的新利器 在药物研发领域,科学家们每年需要筛选数百万种化合物来寻找潜在的药物候选分子。传统方法不仅耗时耗力,而且成本高昂。Graphormer的出现…...

毫米波行波管核心:折叠波导慢波结构原理、优势、对比与设计实战

在毫米波行波管(TWT)领域,折叠波导慢波结构(FW-SWS) 是无可争议的 “王者”—— 它凭借全金属结构、高功率容量、宽频带和成熟的加工工艺,在 Ka 波段及以上的功率器件中占据绝对主导地位,是卫星…...

RX9 vs RX7:哪个更适合你的AU音频修复工作流?实测对比与安装教程

RX9 vs RX7:专业音频修复工具深度评测与实战指南 在数字音频处理领域,iZotope RX系列一直是音频修复的金标准。当最新版RX9与经典版RX7同时出现在插件列表中,专业音频工程师们常常面临选择困境——是升级到功能更强大的新版本,还是…...

基于企业发展过程的改进型元启发式算法IED:一种高效智能优化策略的探索与应用

改进企业发展优化算法IED,(Enterprise Development, ED)是一种新型的元启发式算法(智能优化算法),灵感来源于企业的发展过程。 该算法清晰易懂,与我们日常使用的优化算法相近,发表的期刊等级很高&#xff0…...

普通程序员有必要深入学习JVM底层原理吗?

对于JVM,我想大部分小伙伴都是要面试了才会去学,其余时间基本不会去看。但值得一说的是,当你工作多年之后,你遇到的项目会越来越复杂,遇到的问题也会越来越复杂:各种古怪的内存溢出,死锁&#x…...

【优化求解】基于matlab粒子群算法面向弹性提升的多种应急资源参与配电网抢修恢复【含Matlab源码 15275期】

💥💥💥💥💥💥💞💞💞💞💞💞💞💞欢迎来到海神之光博客之家💞💞💞&#x1f49…...

Optisystem仿真案例5-三种调制格式的FSO空间自由光通信系统 内容:搭建了OOK、P...

Optisystem仿真案例5-三种调制格式的FSO空间自由光通信系统 内容:搭建了OOK、PPM、BPSK基本结构的三种调制格式的FSO空间自由光通信系统 形式:程序+附带解析 最近在搞FSO通信仿真,试了三种不同的调制格式——OOK、PPM、BPSK&…...

别再只用BCE了!用PyTorch实现ASL损失函数,搞定多标签分类中的样本不均衡

多标签分类新范式:PyTorch实战ASL损失函数解决样本不均衡难题 在图像标注、医学诊断或文本情感分析等多标签分类任务中,我们常常遇到一个棘手问题——某些标签的出现频率可能比其他标签高出几个数量级。想象一下,当你构建一个商品标签系统时&…...

5个高效模块精通抖音视频批量下载工具:从技术原理到实战应用

5个高效模块精通抖音视频批量下载工具:从技术原理到实战应用 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback…...

霞鹜文楷屏幕阅读版:2025年最佳屏幕阅读字体解决方案

霞鹜文楷屏幕阅读版:2025年最佳屏幕阅读字体解决方案 【免费下载链接】LxgwWenKai-Screen LXGW WenKai for Screen Reading. 项目地址: https://gitcode.com/gh_mirrors/lx/LxgwWenKai-Screen 还在为长时间盯着屏幕阅读而感到眼睛疲劳吗?&#x1…...

Attu可视化工具:向量数据库性能监控与运维效率提升实践

Attu可视化工具:向量数据库性能监控与运维效率提升实践 【免费下载链接】attu The Best GUI for Milvus 项目地址: https://gitcode.com/gh_mirrors/at/attu Attu作为Milvus向量数据库的图形化管理界面,通过系统监控工具、性能分析仪表盘和可视化…...

3步掌控Windows驱动管理:从冗余清理到系统性能提升全指南

3步掌控Windows驱动管理:从冗余清理到系统性能提升全指南 【免费下载链接】DriverStoreExplorer Driver Store Explorer 项目地址: https://gitcode.com/gh_mirrors/dr/DriverStoreExplorer Windows系统随着使用时间增长,驱动存储区会积累大量冗余…...

Halcon拼图算子tile_images_offset实战:从图像裁切到精准拼接

1. 认识tile_images_offset算子 第一次接触Halcon的tile_images_offset算子时,我正面临一个棘手的工业检测项目。客户需要将多个摄像头拍摄的电路板局部图像拼接成完整视图,传统手动拼接方式效率低下且误差大。这个算子就像及时雨,完美解决了…...

P3C代码规范检查:风险驱动架构下的动态治理策略

P3C代码规范检查:风险驱动架构下的动态治理策略 【免费下载链接】p3c Alibaba Java Coding Guidelines pmd implements and IDE plugin 项目地址: https://gitcode.com/gh_mirrors/p3/p3c 在数字化转型浪潮中,企业级Java应用面临代码质量与开发效…...

Qwen3.5-9B-AWQ-4bit操作系统概念学习与实验指导

Qwen3.5-9B-AWQ-4bit操作系统概念学习与实验指导 1. 当AI成为你的操作系统课助教 想象一下,凌晨两点你正在赶操作系统课程的作业,突然卡在进程调度算法上。这时候如果有个随时在线的助教,能清晰解释概念、提供实验思路,甚至给出…...

终极指南:让macOS Finder视频预览功能焕发新生的QLVideo插件

终极指南:让macOS Finder视频预览功能焕发新生的QLVideo插件 【免费下载链接】QuickLookVideo This package allows macOS Finder to display thumbnails, static QuickLook previews, cover art and metadata for most types of video files. 项目地址: https://…...

G-Helper解决华硕笔记本风扇异常问题完全指南

G-Helper解决华硕笔记本风扇异常问题完全指南 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Strix, Scar, and other model…...

Quartus元器件仿真波形生成实战指南

1. Quartus元器件仿真波形生成入门指南 第一次接触Quartus的仿真功能时,我也被那一堆专业术语搞得晕头转向。但后来发现,只要掌握了基本流程,生成仿真波形其实就像用画图软件一样简单。这里我会用最直白的语言,带你一步步完成整个…...

javaweb驾校考试车辆预约系统

目录同行可拿货,招校园代理 ,本人源头供货商功能模块划分预约功能设计考试管理模块系统辅助功能技术实现参考项目技术支持源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作同行可拿货,招校园代理 ,本人源头供货商 功能模块划分 用户管理模块…...

javaweb铁路火车接发车课程作业培训考试系统证书

目录同行可拿货,招校园代理 ,本人源头供货商铁路火车接发车课程作业培训考试系统证书的功能分析系统概述功能模块分析技术实现要点行业合规性扩展功能建议项目技术支持源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作同行可拿货,招校园代理 …...

javaweb计算机教学活动教室预约系统聊天机器人

目录同行可拿货,招校园代理 ,本人源头供货商功能模块划分智能聊天机器人功能系统集成设计技术实现要点项目技术支持源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作同行可拿货,招校园代理 ,本人源头供货商 功能模块划分 用户管理模块 实现…...