当前位置: 首页 > news >正文

OpenCV书签 #差值哈希算法的原理与相似图片搜索实验

1. 介绍

差值哈希算法(Difference Hash Algorithm,简称dHash) 是哈希算法的一种,主要可以用来做以图搜索/相似图片的搜索工作。

 

2. 原理

差值哈希算法通过计算相邻像素的差异来生成哈希,即通过缩小图像的每个像素与平均灰度值的比较,生成一组哈希值。最后,利用两组图像的哈希值的汉明距离来评估图像的相似度。

 

3. 魔法

概括地讲,差值哈希算法一共可细分五步:

  1. 缩小图像: 调整输入图像的大小为 (hash_size + 1) 宽度和 hash_size 高度,通常为 9x8 像素,总共72个像素。
  2. 图像灰度化: 将彩色图像转换为灰度图像,以便进行灰度差值计算。
  3. 计算差异值: 差值算法工作在相邻像素之间,如果左边的像素比右边的更亮,则记录为1,否则为0,这样每行9个像素通过左右像素的两两比较,会产生8个不同的差异值,一共8行,则会产生64个差异值。
  4. 生成哈希值: 由于64位的二进制值(差异值)太长,所以按每4个字符为1组,由2进制转成16进制。这样就转为一个长度为16的字符串。这个字符串也就是这个图像可识别的哈希值,也叫图像指纹,即这个图像所包含的特征。
  5. 哈希值比较: 通过比较两个图像的哈希值的汉明距离(Hamming Distance),就可以评估图像的相似度,距离越小表示图像越相似。

 

4. 实验

4.1 魔法

第一步:缩小图像

调整输入图像的大小为 (hash_size + 1) 宽度和 hash_size 高度,通常为 9x8 像素,总共72个像素,以便进行后续的差值计算。

1)读取原图

# 测试图片路径
img_path = 'img_test/apple-01.jpg'# 通过OpenCV加载图像
img = cv2.imread(img_path)
plt.imshow(img, cmap='gray')
plt.show()# 通道重排,从BGR转换为RGB
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
plt.imshow(img_rgb, cmap='gray')
plt.show()

dhash-0001

2)缩小原图

# 缩小图像:使用OpenCV的resize函数将图像缩放为9x8像素,采用Cubic插值方法进行图像重采样
img_resize = cv2.resize(img_rgb, (9, 8), cv2.INTER_CUBIC)# 打印 img.shape 可以获取图像的形状信息,即 (行数, 列数, 通道数)
# 通道数:灰度图像通道数为 1,彩色图像通道数为 3
print(img_resize.shape)
plt.imshow(img_resize, cmap='gray')
plt.show()

输出打印:

(8, 9, 3)

dhash-0002
将图像 img 调整大小为 (9, 8) 的尺寸,并使用 cv2.INTER_CUBIC 插值方法进行图像的缩放。在这里,原始图像 img 将被调整为 9 像素宽和 8 像素高。
打印 img.shape 可以获取图像的形状信息,即(行数, 列数, 通道数)。通道数取决于原始图像的通道数(如灰度图像通道数为 1,彩色图像通道数为 3)。

第二步:图像灰度化

将彩色图像转换为灰度图像,以便进行灰度差值计算。

# 图像灰度化:将彩色图像转换为灰度图像。
img_gray = cv2.cvtColor(img_resize, cv2.COLOR_BGR2GRAY)# 打印出了灰度图像的行数和列数,因为灰度图像只有一个通道,所以不会显示通道数
print(img_gray.shape)
plt.imshow(img_gray, cmap='gray')
plt.show()

输出打印:

(8, 9)

dhash-0003
使用 OpenCV 的 cvtColor 函数将彩色图像 img 转换为灰度图像。cv2.COLOR_BGR2GRAY 是颜色空间转换标志,它指示将图像从 BGR(彩色)颜色空间转换为灰度颜色空间。

打印 img_gray.shape 包含图像的维度信息,通常是(行数, 列数)或(行数, 列数, 通道数)。这里只有灰度图像的行数和列数,因为灰度图像只有一个通道,所以不会显示通道数。

第三步:计算差异值

差值算法工作在相邻像素之间,如果左边的像素比右边的更亮,则记录为1,否则为0,这样每行9个像素通过左右像素的两两比较,会产生8个不同的差异值,一共8行,则会产生64个差异值。

# 计算差异值:获得图像二进制字符串
img_hash_str = ''
# img_hash_arr = []
# 遍历图像的像素,比较相邻像素之间的灰度值,根据强弱增减差异情况生成一个二进制哈希值
# 外层循环,遍历图像的行(垂直方向),范围是从0到7
for i in range(8):# 内层循环,遍历图像的列(水平方向),范围也是从0到7for j in range(8):# 比较当前像素 img[i, j] 与下一个像素 img[i, j + 1] 的灰度值if img_gray[i, j] > img_gray[i, j + 1]:# 如果当前像素的灰度值大于下一个像素的灰度值(灰度值增加),将1添加到名为 hash 的列表中# img_hash_arr.append(1)img_hash_str += '1'else:# 否则灰度值弱减,将0添加到名为 hash 的列表中# img_hash_arr.append(0)img_hash_str += '0'
print(f"图像的二进制哈希值={img_hash_str}")

输出打印:

图像的二进制哈希值=0000000000110000001100000010000001110000001000000011000001110000

这段代码的目的是遍历图像的每一行和每一列,逐个比较相邻像素之间的灰度值,根据比较结果生成一个二进制哈希值。如果像素之间的灰度值增加,就将1添加到哈希值中,如果减少或保持不变,就将0添加。这个生成的哈希值可用于图像相似性比较,用于检测图像中的局部特征。

第四步:生成哈希值

由于64位二进制值太长,所以按每4个字符为1组,由2进制转成16进制。这样就转为一个长度为16的字符串。这个字符串也就是这个图像可识别的哈希值,也叫图像指纹,即这个图像所包含的特征。

# 生成哈希值:生成图像可识别哈希值
img_hash = ''
for i in range(0, 64, 4):img_hash += ''.join('%x' % int(img_hash_str[i: i + 4], 2))
print(f"图像可识别的哈希值={img_hash}")

输出打印:

图像可识别的哈希值=0030302070203070

同样的,将目标素材图像进行上述计算,亦可得到一个图像可识别的哈希值。

第五步:哈希值比较

通过两个等长字符串在相同位置上不同字符的数量,计算两个等长字符串之间的汉明距离(Hamming Distance),就可以评估图像的相似度,距离越小表示图像越相似。

# 汉明距离:通过两个等长字符串在相同位置上不同字符的数量,计算两个等长字符串之间的汉明距离
def hamming_distance(s1, s2):# 检查这两个字符串的长度是否相同。如果长度不同,它会引发 ValueError 异常,因为汉明距离只适用于等长的字符串if len(s1) != len(s2):raise ValueError("Input strings must have the same length")distance = 0for i in range(len(s1)):# 遍历两个字符串的每个字符,比较它们在相同位置上的值。如果发现不同的字符,将 distance 的值增加 1if s1[i] != s2[i]:distance += 1return distance

汉明距离: 两个等长字符串在相同位置上不同字符的数量。即一组二进制数据变成另一组数据所需要的步骤数。汉明距离越小,则相似度越高。汉明距离为0,即两张图片完全一样。

dhash-0004

 

4.2 测试

实验场景

通过 opencv,使用差值哈希算法查找目标图像素材库中所有相似图像,并列出相似值。

实验素材

这里,我准备了10张图片,其中9张是苹果,但形态不一;1张梨子。
dhash-0005

实验代码

"""
以图搜图:差值哈希算法(Difference Hash Algorithm,简称dHash)的原理与实现
测试环境:win10 | python 3.9.13 | OpenCV 4.4.0 | numpy 1.21.1
实验场景:通过 opencv,使用差值哈希算法查找目标图像素材库中所有相似图像
实验时间:2023-10-31
实验名称:dhash_v5_all.py
"""import os
import cv2
import timedef get_dHash(img_path):# 读取图像:通过OpenCV的imread加载RGB图像img_rgb = cv2.cvtColor(cv2.imread(img_path), cv2.COLOR_BGR2RGB)# 缩小图像:使用OpenCV的resize函数将图像缩放为9x8像素,采用Cubic插值方法进行图像重采样img_resize = cv2.resize(img_rgb, (9, 8), cv2.INTER_CUBIC)# 图像灰度化:将彩色图像转换为灰度图像img_gray = cv2.cvtColor(img_resize, cv2.COLOR_BGR2GRAY)# 计算差异值:获得图像二进制字符串img_hash_str = ''# 遍历图像的像素,比较相邻像素之间的灰度值,根据强弱增减差异情况生成一个二进制哈希值# 外层循环,遍历图像的行(垂直方向),范围是从0到7for i in range(8):# 内层循环,遍历图像的列(水平方向),范围也是从0到7for j in range(8):# 比较当前像素 img[i, j] 与下一个像素 img[i, j + 1] 的灰度值if img_gray[i, j] > img_gray[i, j + 1]:# 如果当前像素的灰度值大于下一个像素的灰度值(灰度值增加),将1添加到名为 hash 的列表中img_hash_str += '1'else:# 否则灰度值弱减,将0添加到名为 hash 的列表中img_hash_str += '0'# print(f"图像的二进制哈希值={img_hash_str}")# 生成哈希值:生成图像可识别哈希值img_hash = ''.join(map(lambda x:'%x' % int(img_hash_str[x : x + 4], 2), range(0, 64, 4)))return img_hash# 汉明距离:通过两个等长字符串在相同位置上不同字符的数量,计算两个等长字符串之间的汉明距离
def hamming_distance(str1, str2):# 检查这两个字符串的长度是否相同。如果长度不同,它会引发 ValueError 异常,因为汉明距离只适用于等长的字符串if len(str1) != len(str2):raise ValueError("Input strings must have the same length")distance = 0for i in range(len(str1)):# 遍历两个字符串的每个字符,比较它们在相同位置上的值。如果发现不同的字符,将 distance 的值增加 1if str1[i] != str2[i]:distance += 1return distance# ------------------------------------------------- 测试 -------------------------------------------------
if __name__ == "__main__":time_start = time.time()# 指定测试图像库目录img_dir = 'img_test'# 指定测试图像文件扩展名img_suffix = ['.jpg', '.jpeg', '.png', '.bmp', '.gif']# 获取当前执行脚本所在目录script_dir = os.path.dirname(__file__)# 获取目标测试图像的全路径img_org_path = os.path.join(script_dir, img_dir, 'apple-01.jpg')# 获取目标图像可识别哈希值(图像指纹)org_img_hash = get_dHash(img_org_path)print(f"目标图像:{os.path.relpath(img_org_path)},图像HASH:{org_img_hash}")# 获取测试图像库中所有文件all_files = os.listdir(os.path.join(script_dir, img_dir))# 筛选出指定后缀的图像文件img_files = [file for file in all_files if any(file.endswith(suffix) for suffix in img_suffix)]img_hash_all = []# 遍历测试图像库中的每张图像for img_file in img_files:# 获取相似图像文件路径img_path = os.path.join(script_dir, img_dir, img_file)# 获取相似图像可识别哈希值(图像指纹)img_hash = get_dHash(img_path)# 获取相似图像与目标图像的汉明距离distance = hamming_distance(org_img_hash, img_hash)# 存储相似图像的相对路径、哈希值、汉明距离img_hash_all.append((os.path.relpath(img_path), img_hash, distance))for img in img_hash_all:print(f"图像名称:{os.path.basename(img[0])},图像HASH:{img[1]},与目标图像的近似值(汉明距离):{img[2]}")time_end = time.time()print(f"耗时:{time_end - time_start}")

输出打印:

目标图像:..\..\P1_Hash\03_dHash\img_test\apple-01.jpg,图像HASH:0030302070203070
图像名称:apple-01.jpg,图像HASH:0030302070203070,与目标图像的近似值(汉明距离):0
图像名称:apple-02.jpg,图像HASH:2048502430301000,与目标图像的近似值(汉明距离):9
图像名称:apple-03.jpg,图像HASH:0030705070506020,与目标图像的近似值(汉明距离):5
图像名称:apple-04.jpg,图像HASH:3030303038301000,与目标图像的近似值(汉明距离):7
图像名称:apple-05.jpg,图像HASH:0818206840602830,与目标图像的近似值(汉明距离):11
图像名称:apple-06.jpg,图像HASH:00004cccd0c8eeec,与目标图像的近似值(汉明距离):12
图像名称:apple-07.jpg,图像HASH:5af53928b158dc1e,与目标图像的近似值(汉明距离):14
图像名称:apple-08.jpg,图像HASH:87868a060c081e2c,与目标图像的近似值(汉明距离):16
图像名称:apple-09.jpg,图像HASH:0040285060602070,与目标图像的近似值(汉明距离):7
图像名称:pear-001.jpg,图像HASH:0204367274f07060,与目标图像的近似值(汉明距离):10
耗时:0.09773826599121094

 

5. 总结

经过实验和测试,差值哈希算法(dHash)是一种非常简单的算法,易于实现和理解,且计算速度快,适用于大规模图像数据相似性处理。

特点: 传统,属于一种外观相似哈希算法。
优点: 简单、相对准确、计算效率高;在同等测试样本下,相比pHash,dHash的速度要更快;适用于快速图像相似性搜索。
缺点: 对于图像的旋转和缩放敏感,不适用于检测嵌入式水印或复杂的变换,即使是微小的旋转或缩放也会导致哈希值大幅度改变,因为它主要用于检测左右局部像素级别的变化。

 

6. 系列书签

OpenCV书签 #均值哈希算法的原理与相似图片搜索实验
OpenCV书签 #感知哈希算法的原理与相似图片搜索实验
OpenCV书签 #差值哈希算法的原理与相似图片搜索实验

相关文章:

OpenCV书签 #差值哈希算法的原理与相似图片搜索实验

1. 介绍 差值哈希算法(Difference Hash Algorithm,简称dHash) 是哈希算法的一种,主要可以用来做以图搜索/相似图片的搜索工作。 2. 原理 差值哈希算法通过计算相邻像素的差异来生成哈希,即通过缩小图像的每个像素与平…...

Unity中URP下获取主灯信息

文章目录 前言一、计算BulinnPhone的函数有两个重载1、 目前最新使用的是该方法(这是我们之后主要分析的函数)2、 被淘汰的老方法,需要传入一堆数据 二、GetMainLight1、Light结构体2、GetMainLight具有4个方法重载3、1号重载干了什么&#x…...

尝试着在Stable Diffusion里边使用SadTalker进行数字人制作

首先需要标明的是,我这里是图片说话类型,而且是看了知识星球AI破局俱乐部大航海数字人手册进行操作的。写下这篇文章是防止我以后遗忘。 我使用的基础软件是Stable Diffusion,SadTalker是作为插件放进来的,需要注意的是这对自己的…...

链路聚合原理与配置

链路聚合原理 随着网络规模不断扩大,用户对骨干链路的带宽和可靠性提出了越来越高的要求。在传统技术中,常用更换高速率的接口板或更换支持高速率接口板的设备的方式来增加带宽,但这种方案需要付出高额的费用,而且不够灵活。采用…...

第8章 通信网络安全

文章目录 8.1 信息系统安全概述8.1.1 信息系统的构成和分类8.1.2 信息系统安全1、信息系统中的安全概念2、信息系统安全问题的发展演变3、信息系统的安全结构 8.1.3 信息系统的安全保护等级1.TCSEC(可信计算机系统评估准则)2. 我国信息安全标准 8.1.4 通…...

L1-092 进化论(Java)

在“一年一度喜剧大赛”上有一部作品《进化论》,讲的是动物园两只猩猩进化的故事。猩猩吕严说自己已经进化了 9 年了,因为“三年又三年”。猩猩土豆指出“三年又三年是六年呐”…… 本题给定两个数字,以及用这两个数字计算的结果,…...

SpringBoot 源码解析5:ConfigurationClassPostProcessor整体流程和@ComponentScan源码分析

SpringBoot 源码解析5:ConfigurationClassPostProcessor整体流程和ComponentScan源码分析 1. 知道以下几点,读ConfigurationClassPostProcessor源码会更轻松2. 源码解析 ConfigurationClassPostProcessor#postProcessBeanDefinitionRegistry2.1 Configur…...

一.初识Linux 1-3操作系统概述Linux初识虚拟机介绍

目录 一.初识Linux 1.操作系统概述 计算机组成 硬件: 软件: 操作系统: 操作系统工作流程 操作系统作用 常见的操作系统 PC端: 移动端:(掌上操作系统) 一.初识Linux 2.Linux初识 linu…...

Eureka整合seata分布式事务

文章目录 一、分布式事务存在的问题二、分布式事务理论三、认识SeataSeata分布式事务解决方案1、XA模式2、AT模式3、SAGA模式4.SAGA模式优缺点:5.四种模式对比 四、微服务整合Seata AT案例Seata配置微服务整合2.1、父工程项目创建引入依赖 2.2、Eureka集群搭建2.3、…...

华为云磁盘性能指标(参考)

MD[华为云磁盘性能指标(参考)] 云硬盘(Elastic Volume Service, EVS) 根据性能,磁盘可分为极速型SSD V2、极速型SSD、通用型SSD V2、超高IO、通用型SSD、高IO、普通IO。 性能指标(参考),测速说明:操作系统-windows …...

利用OpenGL图形库实现人物动画移动效果

使用OpenGL库实现人物动画移动效果需要涉及到更复杂的图形编程和事件处理。以下是一个简单的例子,使用OpenGL和GLUT库实现人物的基本动画移动效果。 确保你已经安装了OpenGL和GLUT。你可以使用包管理器或者从官方网站下载并安装。 一、如果你已经安装过了OpenGL和…...

History命令解释,及一个相关的bash脚本(如何编写脚本程序从记录文件中提取history命令)

目 录 一、history命令介绍 1、history命令是什么? 2、history的主要功能 二、history命令的用法 1、语法 2、选项说明 3、命令实例 三、history和历史记录文件bash_history 四、history命令的相关配置 1,命令带时间展示-HISTTI…...

apisix 单机部署 linux

安装etcd: cd /home/app rz tar -zxvf etcd-v3.5.4-linux-amd64.tar.gz cd etcd-v3.5.4-linux-amd64 vim start.sh内容: #!/bin/sh nohup etcd --name infra0 --initial-advertise-peer-urls http://127.0.0.1:2380 \--listen-peer-urls http://127.0.…...

Redis 面试题 | 06.精选Redis高频面试题

🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 🍚 蓝桥云课签约作者、上架课程《Vue.js 和 E…...

2008年苏州大学837复试机试C/C++

2008年苏州大学复试机试 题目 编写程序充成以下功能: 一、从键盘上输入随机变量x的 10个取样点。X0,X1—X9 的值; 1、计算样本平均值 2、判定x是否为等差数列 3、用以下公式计算z的值(t0.63) 注。请对程序中必要地方进行注释 补充:个人觉得这个题目回忆…...

MySQL笔记-information_schema库中COLUMNS表的一些笔记

mysql建表中可以添加comment,也就是注释,这些注释会写到information_schema库的COLUMNS表中,可以使用如下SQL语句进行查询: SELECT COLUMN_NAME, COLUMN_COMMENT FROM information_schema.COLUMNS WHERE TABLE_SCHEMA your_data…...

归并排序模板

模板在文末,以下步骤方便理解记忆。 先贴一张快速排序模板步骤,用于对比记忆 归并排序步骤: (0)如果数组左边界L ≥ 数组右边界,则不需要排序,直接return。 (1)直接取…...

【NVIDIA】Jetson Orin Nano系列:安装 Qt6、firefox、jtop、flameshot

1、使用命令安装 sudo apt install qtcreator sudo apt install qt6-* sudo apt install libqt6* sudo apt install qml-qt6 sudo apt install qmlscene-qt6 sudo apt install assistant-qt6 sudo apt install designer-qt62、启动 qtcreator 3、常用工具安装 sudo apt in…...

Fastapi+Jsonp实现前后端跨域请求

文章目录 一、实现方法1.后端部分【Fastapi】2.前端部分【JS】二、测试一、实现方法 1.后端部分【Fastapi】 # coding:utf-8import json from fastapi import FastAPI, Response from fastapi.middleware.cors import CORSMiddlewareapp = FastAPI(...

MacOS受欢迎的数据库开发工具 Navicat Premium 15 中文版

Navicat Premium 15 Mac是一款数据库管理工具,提供了一个全面的解决方案,用于连接、管理和维护各种数据库系统。以下是Navicat Premium 15 Mac的一些主要功能和特点: 软件下载:Navicat Premium 15 中文版下载 多平台支持&#xff…...

变量 varablie 声明- Rust 变量 let mut 声明与 C/C++ 变量声明对比分析

一、变量声明设计:let 与 mut 的哲学解析 Rust 采用 let 声明变量并通过 mut 显式标记可变性,这种设计体现了语言的核心哲学。以下是深度解析: 1.1 设计理念剖析 安全优先原则:默认不可变强制开发者明确声明意图 let x 5; …...

微信小程序之bind和catch

这两个呢,都是绑定事件用的,具体使用有些小区别。 官方文档: 事件冒泡处理不同 bind:绑定的事件会向上冒泡,即触发当前组件的事件后,还会继续触发父组件的相同事件。例如,有一个子视图绑定了b…...

Vue3 + Element Plus + TypeScript中el-transfer穿梭框组件使用详解及示例

使用详解 Element Plus 的 el-transfer 组件是一个强大的穿梭框组件,常用于在两个集合之间进行数据转移,如权限分配、数据选择等场景。下面我将详细介绍其用法并提供一个完整示例。 核心特性与用法 基本属性 v-model:绑定右侧列表的值&…...

c++ 面试题(1)-----深度优先搜索(DFS)实现

操作系统:ubuntu22.04 IDE:Visual Studio Code 编程语言:C11 题目描述 地上有一个 m 行 n 列的方格,从坐标 [0,0] 起始。一个机器人可以从某一格移动到上下左右四个格子,但不能进入行坐标和列坐标的数位之和大于 k 的格子。 例…...

全志A40i android7.1 调试信息打印串口由uart0改为uart3

一,概述 1. 目的 将调试信息打印串口由uart0改为uart3。 2. 版本信息 Uboot版本:2014.07; Kernel版本:Linux-3.10; 二,Uboot 1. sys_config.fex改动 使能uart3(TX:PH00 RX:PH01),并让boo…...

是否存在路径(FIFOBB算法)

题目描述 一个具有 n 个顶点e条边的无向图,该图顶点的编号依次为0到n-1且不存在顶点与自身相连的边。请使用FIFOBB算法编写程序,确定是否存在从顶点 source到顶点 destination的路径。 输入 第一行两个整数,分别表示n 和 e 的值(1…...

使用Matplotlib创建炫酷的3D散点图:数据可视化的新维度

文章目录 基础实现代码代码解析进阶技巧1. 自定义点的大小和颜色2. 添加图例和样式美化3. 真实数据应用示例实用技巧与注意事项完整示例(带样式)应用场景在数据科学和可视化领域,三维图形能为我们提供更丰富的数据洞察。本文将手把手教你如何使用Python的Matplotlib库创建引…...

排序算法总结(C++)

目录 一、稳定性二、排序算法选择、冒泡、插入排序归并排序随机快速排序堆排序基数排序计数排序 三、总结 一、稳定性 排序算法的稳定性是指:同样大小的样本 **(同样大小的数据)**在排序之后不会改变原始的相对次序。 稳定性对基础类型对象…...

AirSim/Cosys-AirSim 游戏开发(四)外部固定位置监控相机

这个博客介绍了如何通过 settings.json 文件添加一个无人机外的 固定位置监控相机,因为在使用过程中发现 Airsim 对外部监控相机的描述模糊,而 Cosys-Airsim 在官方文档中没有提供外部监控相机设置,最后在源码示例中找到了,所以感…...

elementUI点击浏览table所选行数据查看文档

项目场景&#xff1a; table按照要求特定的数据变成按钮可以点击 解决方案&#xff1a; <el-table-columnprop"mlname"label"名称"align"center"width"180"><template slot-scope"scope"><el-buttonv-if&qu…...