图像处理篇---图像处理中常见参数
文章目录
- 前言
- 一、分贝(dB)的原理
- 1.公式
- 二、峰值信噪比(PSNR, Peak Signal-to-Noise Ratio)
- 1.用途
- 2.公式
- 3.示例
- 三、信噪比(SNR, Signal-to-Noise Ratio)
- 1.用途
- 2.公式
- 3.示例
- 四、动态范围(Dynamic Range)
- 1.用途
- 2.公式
- 五、分贝的意义
- 1.直观性
- 2.人眼适应性
- 3.标准化比较
- 六、结构相似性指数(SSIM, Structural Similarity Index)
- 1.原理
- 2.公式
- 3.示例代码
- 七、多尺度结构相似性指数(MS-SSIM)
- 1.原理
- 2.示例代码
- 八、平均绝对误差(MAE, Mean Absolute Error)
- 1.原理
- 2.公式
- 3.示例代码
- 九、视觉信息保真度(VIF, Visual Information Fidelity)
- 1.原理
- 2.示例代码
- 十、学习感知图像块相似度(LPIPS)
- 1.原理
- 2.示例代码
- 总结
前言
在图像处理中,参数的衡量常涉及对数单位(如分贝,dB),主要用于量化信号的强度、噪声水平或图像质量的相对变化。以下是常见参数的原理、计算方法和示例:
一、分贝(dB)的原理
分贝(Decibel)是一种对数单位,用于表示两个量(如信号与噪声)的比值。其核心优势是将大范围的数值压缩到更易处理的尺度,并符合人类感官对强度的非线性感知特性。
1.公式

其中 𝑃1和 𝑃2是两个功率值。若涉及幅度值(如电压、像素强度),公式需平方:

二、峰值信噪比(PSNR, Peak Signal-to-Noise Ratio)
1.用途
用途:衡量图像压缩或重建后的质量(对比原始图像)。
2.公式

3.示例

三、信噪比(SNR, Signal-to-Noise Ratio)
1.用途
用途:量化信号中有效信息与噪声的比例。
2.公式

3.示例

四、动态范围(Dynamic Range)
1.用途
用途:描述图像中最亮与最暗区域的比值。
2.公式

五、分贝的意义
1.直观性
直观性:分贝将大范围数值压缩为小范围
(如 1:1000 → 30dB)。
2.人眼适应性
人眼适应性:符合人类对亮度变化的非线性感知(韦伯-费希纳定律)。
3.标准化比较
标准化比较:便于跨不同设备或场景的图像质量评估。
六、结构相似性指数(SSIM, Structural Similarity Index)
1.原理
SSIM通过比较亮度(Luminance)、对比度(Contrast)和结构(Structure)三个因素来评估两幅图像的相似性,范围在**[-1, 1]**之间,1表示完全相同。
2.公式

3.示例代码
from skimage.metrics import structural_similarity as ssim
import cv2读取图像(需保证尺寸相同)
img1 = cv2.imread('original.png', cv2.IMREAD_GRAYSCALE)
img2 = cv2.imread('processed.png', cv2.IMREAD_GRAYSCALE)#计算SSIM
ssim_score = ssim(img1, img2, data_range=255) # 8位图像范围为0-255
print(f"SSIM: {ssim_score:.4f}")
七、多尺度结构相似性指数(MS-SSIM)
1.原理
MS-SSIM在多个尺度(分辨率)下计算SSIM,综合各尺度的结果,更符合人类视觉系统对多分辨率特征的感知。
2.示例代码
import tensorflow as tf # 需要安装tensorflow或使用其他库#使用TensorFlow的MS-SSIM实现
def compute_ms_ssim(img1, img2):img1 = tf.convert_to_tensor(img1, dtype=tf.float32)img2 = tf.convert_to_tensor(img2, dtype=tf.float32)return tf.image.ssim_multiscale(img1, img2, max_val=255)#示例(假设img1和img2为numpy数组,形状[H, W, C])
ms_ssim_score = compute_ms_ssim(img1, img2)
print(f"MS-SSIM: {ms_ssim_score.numpy():.4f}")
八、平均绝对误差(MAE, Mean Absolute Error)
1.原理
计算两图像像素差的绝对值的均值,单位与像素强度相同。
2.公式

3.示例代码
def compute_mae(img1, img2):return np.mean(np.abs(img1 - img2))mae = compute_mae(img1, img2)
print(f"MAE: {mae:.2f}")
九、视觉信息保真度(VIF, Visual Information Fidelity)
1.原理
通过自然场景统计模型和人类视觉系统的失真感知来评估图像质量,值越大表示质量越好(通常范围在0到1之间)。
2.示例代码
#需要安装piq库:pip install piq
from piq import vif_p#输入为PyTorch张量,形状[B, C, H, W](B为批次大小)
img1_tensor = torch.tensor(img1).unsqueeze(0).permute(0, 3, 1, 2) # 示例转换
img2_tensor = torch.tensor(img2).unsqueeze(0).permute(0, 3, 1, 2)
vif_score = vif_p(img1_tensor, img2_tensor)
print(f"VIF: {vif_score.item():.4f}")
十、学习感知图像块相似度(LPIPS)
1.原理
基于深度学习模型(如VGG)提取特征,计算特征空间的距离,值越小表示越相似。
2.示例代码
#需要安装lpips库:pip install lpips
import lpipsloss_fn = lpips.LPIPS(net='vgg') # 使用VGG网络
img1_tensor = lpips.im2tensor(lpips.load_image('original.png'))
img2_tensor = lpips.im2tensor(lpips.load_image('processed.png'))
lpips_score = loss_fn(img1_tensor, img2_tensor)
print(f"LPIPS: {lpips_score.item():.4f}")
总结
以上就是今天要讲的内容,本文仅仅简单介绍了分贝、峰值信噪比、信噪比、动态范围等的公式、原理以及使用。
相关文章:
图像处理篇---图像处理中常见参数
文章目录 前言一、分贝(dB)的原理1.公式 二、峰值信噪比(PSNR, Peak Signal-to-Noise Ratio)1.用途2.公式3.示例 三、信噪比(SNR, Signal-to-Noise Ratio)1.用途2.公式3.示例 四、动态范围(Dyna…...
AI Agent实战:打造京东广告主的超级助手 | 京东零售技术实践
前言 自2022年末ChatGPT的问世,大语言模型(LLM)技术引发全球关注。在大模型技术落地的最佳实践中,智能体(Agent)架构显现出巨大潜力,成为业界的普遍共识,各大公司也纷纷启动Agent技…...
50周学习go语言:第1周 环境搭建
以下是为零基础学习者准备的详细第1周教程,包含环境搭建、工具配置和首个Go程序的完整操作指南: 一、Go语言环境安装(Windows/macOS/Linux通用) 1. 下载安装包 官网地址:https://go.dev/dl//根据系统选择对应版本&am…...
4. MySQL 逻辑架构说明
4. MySQL 逻辑架构说明 文章目录 4. MySQL 逻辑架构说明1. 逻辑架构剖析1.1 服务器处理客户端请求1.2 Connectors(连接器)1.3 第1层:连接层1.4 第2层:服务层1.5 第3层:引擎层1.6 存储层 2. SQL执行流程2.1 MySQL 中的 SQL 执行流程 2.2 MySQL…...
《AI与NLP:开启元宇宙社交互动新纪元》
在科技飞速发展的当下,元宇宙正从概念逐步走向现实,成为人们关注的焦点。而在元宇宙诸多令人瞩目的特性中,社交互动体验是其核心魅力之一。人工智能(AI)与自然语言处理(NLP)技术的迅猛发展&…...
面对STM32的庞大体系,如何避免迷失在细节中?
我第一次接触STM32时,我以为抱着开发板就是拥抱未来,实际上一开机就喜提四大耳光,看到卖家演示的MP3播放、TFT彩屏、网口通信好炫酷,忍不住买回来掌握这些神技,到最后发现最实用的还是开发板的关机键和复位键。 看视频…...
ragflow-RAPTOR到底是什么?请通俗的解释!
RAPTOR有两种不同的含义,具体取决于上下文: RAPTOR作为一种信息检索技术 RAPTOR是一种基于树状结构的信息检索系统,全称为“Recursive Abstractive Processing for Tree-Organized Retrieval”(递归抽象处理树组织检索)…...
Linux系统移植之Uboot启动流程
Linux系统移植之Uboot启动流程 一,Uboot启动流程1.Uboot的两阶段1.1.第一阶段1.11.硬件初始化1.12.复制 U-Boot 到 RAM1.13.跳转到第二阶段 1.2.第二阶段1.21.C 语言环境初始化1.22. 硬件设备初始化1.23. 加载环境变量1.24. 显示启动信息1.25. 等待用户输入…...
【Open X-Embodiment】简单数据下载与预处理
文章目录 1. RLDS Dataset2. 处理成numpy格式3. 存储桶 1. RLDS Dataset 从 Octo 里面找到数据下载的代码 rlds_dataset_mod github 按照官网代码配置环境后,修改 prepare_open_x.sh,相当于只用 gsutil 下载数据: DOWNLOAD_DIR/mnt/data…...
【第四节】C++设计模式(创建型模式)-Builder(建造者)模式
目录 引言 一、Builder 模式概述 二、Builder 模式举例 三、Builder 模式的结构 四、Builder 模式的实现 五、Builder 模式的优缺点 六、总结 引言 Builder 模式是一种创建型设计模式,旨在将复杂对象的构建过程与其表示分离。通过一步步构建对象,…...
排查JVM的一些命令
查看JVM相关信息的方法 环境: Win10, jdk17 查看端口的Pid netstat -ano | findstr <端口号>列出当前运行的JVM进程 ## 用于输出JVM中运行的进程状态信息。通过jps,可以快速获取Java进程的PID(进程标识符), …...
uni-app(位置1)
文章目录 一、获取当前的地理位置、速度 uni.getLocation(OBJECT)二、打开地图选择位置 uni.chooseLocation(OBJECT)三、使用应用内置地图查看位置。uni.openLocation(OBJECT) 一、获取当前的地理位置、速度 uni.getLocation(OBJECT) App平台 manifest中配置好自己的地图厂商k…...
某手sig3-ios算法 Chomper黑盒调用
Chomper-iOS界的Unidbg 最近在学习中发现一个Chomper框架,Chomper 是一个模拟执行iOS可执行文件的框架,类似于安卓端大名鼎鼎的Unidbg。 这篇文章使用Chomper模拟执行某手的sig3算法,初步熟悉该框架。这里只熟悉模拟执行步骤以及一些常见的…...
登录-05.JWT令牌-介绍
一.JWT令牌 JWT令牌是一种简洁的、自包含的格式,用于在通讯双方之间以json数据格式安全的传输数据。说白了,JWT令牌就是将json格式的数据进行封装,从而实现安全传输。 所谓简洁,就是指JWT令牌就是一个简单的字符串。 所谓自包含…...
Mac下Python版本管理,适用于pyenv不起作用的情况
前言 声明:之前也在网上看到过可以使用pyenv来管理python版本,但由于作者的python安装路径实在是繁杂不堪,因此安装完成pyenv体验下来没有任何用处,但偶然发现vscode似乎可以看到各个python版本,因此写下这篇博客记录…...
Ubuntu 服务器Llama Factory 搭建DeepSeek-R1微调训练环境
1.首先了解一下什么是LLM微调 LLM 微调指的是在已经预训练好的大型语言模型基础上,使用特定的任务数据或领域数据,通过进一步的训练来调整模型的参数,使其在特定任务或领域上能够表现得更好。简单来说,就是对一个已经具备了丰富语…...
【redis】redis内存管理,过期策略与淘汰策略
一:Redis 的过期删除策略及处理流程如下: 1. 过期删除策略 Redis 通过以下两种策略删除过期键: 1.1 惰性删除 触发时机:当客户端访问某个键时,Redis 会检查该键是否过期。执行流程: 客户端请求访问键。…...
RabbitMQ学习—day6—死信队列与延迟队列
目录 死信队列 1. 死信的概念 2. 死信的来源 实战演练 1. 消息TTL过期 2. 队列达到最大长度 3. 消息被拒绝 延迟队列 概念 使用场景 TTL的两种设置 死信队列 1. 死信的概念 1.1 先从概念解释上搞清楚这个定义,死信,顾名思义就是无法被消费的…...
seacmsv9联合注入数据以及绕过 ORDERBY
seacmsv9联合注入数据 php源码 <?php session_start(); require_once("../../include/common.php"); $id (isset($gid) && is_numeric($gid)) ? $gid : 0; $page (isset($page) && is_numeric($page)) ? $page : 1; $type (isset($type) …...
day58 第十一章:图论part08
拓扑排序精讲 关键: 先找到入度为0的节点,把这些节点加入队列/结果,然后依次循环再找。 #include <iostream> #include <vector> #include <queue> #include <unordered_map> using namespace std; int main() {int …...
JVM垃圾回收机制全解析
Java虚拟机(JVM)中的垃圾收集器(Garbage Collector,简称GC)是用于自动管理内存的机制。它负责识别和清除不再被程序使用的对象,从而释放内存空间,避免内存泄漏和内存溢出等问题。垃圾收集器在Ja…...
最新SpringBoot+SpringCloud+Nacos微服务框架分享
文章目录 前言一、服务规划二、架构核心1.cloud的pom2.gateway的异常handler3.gateway的filter4、admin的pom5、admin的登录核心 三、code-helper分享总结 前言 最近有个活蛮赶的,根据Excel列的需求预估的工时直接打骨折,不要问我为什么,主要…...
基于数字孪生的水厂可视化平台建设:架构与实践
分享大纲: 1、数字孪生水厂可视化平台建设背景 2、数字孪生水厂可视化平台建设架构 3、数字孪生水厂可视化平台建设成效 近几年,数字孪生水厂的建设开展的如火如荼。作为提升水厂管理效率、优化资源的调度手段,基于数字孪生的水厂可视化平台的…...
反射获取方法和属性
Java反射获取方法 在Java中,反射(Reflection)是一种强大的机制,允许程序在运行时访问和操作类的内部属性和方法。通过反射,可以动态地创建对象、调用方法、改变属性值,这在很多Java框架中如Spring和Hiberna…...
Linux-07 ubuntu 的 chrome 启动不了
文章目录 问题原因解决步骤一、卸载旧版chrome二、重新安装chorme三、启动不了,报错如下四、启动不了,解决如下 总结 问题原因 在应用中可以看到chrome,但是打不开(说明:原来的ubuntu系统出问题了,这个是备用的硬盘&a…...
C++.OpenGL (10/64)基础光照(Basic Lighting)
基础光照(Basic Lighting) 冯氏光照模型(Phong Lighting Model) #mermaid-svg-GLdskXwWINxNGHso {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-GLdskXwWINxNGHso .error-icon{fill:#552222;}#mermaid-svg-GLd…...
Rapidio门铃消息FIFO溢出机制
关于RapidIO门铃消息FIFO的溢出机制及其与中断抖动的关系,以下是深入解析: 门铃FIFO溢出的本质 在RapidIO系统中,门铃消息FIFO是硬件控制器内部的缓冲区,用于临时存储接收到的门铃消息(Doorbell Message)。…...
Pinocchio 库详解及其在足式机器人上的应用
Pinocchio 库详解及其在足式机器人上的应用 Pinocchio (Pinocchio is not only a nose) 是一个开源的 C 库,专门用于快速计算机器人模型的正向运动学、逆向运动学、雅可比矩阵、动力学和动力学导数。它主要关注效率和准确性,并提供了一个通用的框架&…...
嵌入式学习笔记DAY33(网络编程——TCP)
一、网络架构 C/S (client/server 客户端/服务器):由客户端和服务器端两个部分组成。客户端通常是用户使用的应用程序,负责提供用户界面和交互逻辑 ,接收用户输入,向服务器发送请求,并展示服务…...
基于Springboot+Vue的办公管理系统
角色: 管理员、员工 技术: 后端: SpringBoot, Vue2, MySQL, Mybatis-Plus 前端: Vue2, Element-UI, Axios, Echarts, Vue-Router 核心功能: 该办公管理系统是一个综合性的企业内部管理平台,旨在提升企业运营效率和员工管理水…...
