当前位置: 首页 > news >正文

Python使用余弦相似度比较两个图片

为了使用余弦相似度来找到与样例图片相似的图片,我们需要先进行一些预处理,然后计算每两张图片之间的余弦相似度。以下是一个简单的实现:

  1. 读取样例图片和目标文件夹中的所有图片。
  2. 对每张图片进行预处理,例如灰度化、降噪等。
  3. 计算每张图片与样例图片的余弦相似度。
  4. 找到与样例图片最相似的图片并复制到指定目录。

首先,确保你已经安装了必要的库:

pip install opencv-python numpy Pillow scikit-image

以下是Python代码:

import cv2  
import numpy as np  
from skimage import io, img_as_ubyte  
from sklearn.metrics.pairwise import cosine_similarity  
from PIL import Image  
import os  
import shutil  # 图片路径和目标路径  
sample_image_path = "测试图片\\356-1703817660893.jpg"  
image_folder = "未分类图片文件夹"  
output_folder = "输出图片文件夹"  # 读取样例图片  
sample_image = cv2.imread(sample_image_path, cv2.IMREAD_GRAYSCALE)  
sample_image = img_as_ubyte(sample_image)  # 确保图片在0-255范围内  
sample_image = io.imread(sample_image)  # 使用skimage读取,确保是数组格式  # 读取目标文件夹中的所有图片并预处理  
images = []  
for filename in os.listdir(image_folder):  img = cv2.imread(os.path.join(image_folder, filename), cv2.IMREAD_GRAYSCALE)  img = img_as_ubyte(img)  # 确保图片在0-255范围内  img = io.imread(img)  # 使用skimage读取,确保是数组格式  images.append(img)  # 计算余弦相似度并找到最相似的图片  
similarities = []  
for image in images:  similarity = cosine_similarity(sample_image.reshape(-1, 1), image.reshape(-1, 1))[0][0]  similarities.append((similarity, image))  
similarities.sort(key=lambda x: x[0], reverse=True)  # 按相似度排序  
most_similar_image = similarities[0][1]  # 最相似的图片  # 复制最相似的图片到指定目录  
output_filename = os.path.join(output_folder, "most_similar_" + os.path.basename(sample_image_path))  
shutil.copyfile(os.path.join(image_folder, os.path.basename(sample_image_path)), output_filename)  # 复制原样例图片到指定目录  
shutil.copyfile(os.path.join(image_folder, os.path.basename(most_similar_image)), output_filename)  # 复制最相似的图片到指定目录

注意:这个代码假设所有的图片都已经以灰度格式存储,并且大小相同。如果实际情况不是这样,你可能需要进行一些额外的预处理步骤,例如调整大小或转换为灰度。此外,对于大型图片集,计算余弦相似度可能会比较慢,因此你可能需要使用更高效的相似度计算方法或优化代码。

相关文章:

Python使用余弦相似度比较两个图片

为了使用余弦相似度来找到与样例图片相似的图片,我们需要先进行一些预处理,然后计算每两张图片之间的余弦相似度。以下是一个简单的实现: 读取样例图片和目标文件夹中的所有图片。对每张图片进行预处理,例如灰度化、降噪等。计算…...

树莓派4B-Python使用PyCharm的SSH协议在电脑上远程编辑程序

目录 前言一、pycharm的选择二、添加SSH的解释器使用总结 前言 树莓派的性能始终有限,不好安装与使用高级一点的程序编辑器,如果只用thonny的话,本人用得不习惯,还不如PyCharm,所以想着能不能用电脑中的pycharm来编写…...

Servlet的自动加载、ServletConfig对象、ServletContext对象

一、 Servlet的自动加载 默认情况下,第一次访问servlet的时候,创建servlet对象。如果servlet构造函数里面的代码或者init方法里面的代码比较多,就会导致用户第一次访问servlet的时候比较慢。这个时候,我们可以改变servlet对象的创…...

Vue - Class和Style绑定详解

1. 模板部分 <template><div><!-- Class 绑定示例 --><div :class"{ active: isActive, text-danger: hasError }">Hello, Vue!</div><!-- Class 绑定数组示例 --><div :class"[activeClass, errorClass]">Cla…...

适用于 Windows 的 7 个顶级视频转换器 – 流畅的视频转换体验!

对于任何想要增强视频转换体验的人来说&#xff0c;视频转换器都是必不可少的工具。无论您是需要转换视频文件格式以实现兼容性&#xff0c;还是只是想优化视频以获得更好的质量&#xff0c;可靠的视频转换器都可以使该过程无缝且高效。在这篇博文中&#xff0c;我们将探讨适用…...

Vue3全局属性app.config.globalProperties

文章目录 一、概念二、实践2.1、定义2.2、使用 三、最后 一、概念 一个用于注册能够被应用内所有组件实例访问到的全局属性的对象。点击【前往】访问官网 二、实践 2.1、定义 在main.ts文件中设置app.config.globalPropertie import {createApp} from vue import ElementPl…...

单片机开发--keil5

一.keil5 Keil uVision5是一个集成开发环境&#xff08;IDE&#xff09;&#xff0c;用于对嵌入式系统中的微控制器进行编程。它是一个软件套件&#xff0c;包括源代码编辑器、项目经理、调试器以及微控制器开发、调试和编程所需的其他工具。Keil uVision5 IDE主要用于对基于A…...

<JavaEE> TCP 的通信机制(三) -- 滑动窗口

目录 TCP的通信机制的核心特性 四、滑动窗口 1&#xff09;什么是滑动窗口&#xff1f; 2&#xff09;滑动窗口的作用是什么&#xff1f; 3&#xff09;批量传输出现丢包如何处理&#xff1f; 1> 接收端ACK丢包 2> 发送端数据包丢包 4&#xff09;适用性 TCP的通…...

听GPT 讲Rust源代码--library/portable-simd

File: rust/library/portable-simd/crates/core_simd/examples/spectral_norm.rs spectral_norm.rs是一个示例程序&#xff0c;它展示了如何使用Portable SIMD库中的SIMD&#xff08;Single Instruction Multiple Data&#xff09;功能来实现频谱规范化算法。该示例程序是Rust源…...

CMake入门教程【基础篇】CMake+Minggw构建项目

文章目录 Minggw是什么Minggw下载CMake下载安装第1步&#xff1a;下载CMake第2步&#xff1a;安装CMake 如何构建和编译项目&#xff1a;使用CMake和MinGW总结 Minggw是什么 MinGW&#xff08;Minimalist GNU for Windows&#xff09;是一个免费的软件开发环境&#xff0c;旨在…...

2024年原创深度学习算法项目分享

原创深度学习算法项目分享&#xff0c;包括以下领域&#xff1a; 图像视频、文本分析、知识图谱、推荐系统、问答系统、强化学习、机器学习、多模态、系统界面、爬虫、增量学习等领域… 有需要的话&#xff0c;评论区私聊...

Linux自定义shell编写

Linux自定义shell编写 一.最终版本展示1.动图展示2.代码展示 二.具体步骤1.打印提示符2.解析命令行3.分析是否是内建命令1.shell对于内建名令的处理2.cd命令3.cd函数的实现4.echo命令的实现5.export命令的实现6.内建命令函数的实现 4.创建子进程通过程序替换执行命令5.循环往复…...

堆的应用:堆排序和TOP-K问题

上次才讲完堆的相关问题&#xff1a;二叉树顺序结构与堆的概念及性质&#xff08;c语言实现堆 那今天就接着来进行堆的主要两方面的应用&#xff1a;堆排序和TOP-K问题 文章目录 1.堆排序1.1概念、思路及代码1.2改良代码&#xff08;最初建立大堆用AdjustDow&#xff09; 2. TO…...

element表格排序功能

官方展示 个人项目 可以分别对每一项数据进行筛选 注&#xff1a;筛选的数据不能是字符串类型必须是数字类型&#xff0c;否则筛选会乱排序 html <el-table :data"tableData" border height"600" style"width: 100%"><el-table-co…...

HNU-Java程序设计基础训练-2023

1.DNA序列&#xff08;Java&#xff09; 【问题描述】 一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例&#xff08;定义为GC-Ratio&#xff09;是序列中G和C两个字母的总的出现次数除以总的字母数目&#xff08;也就是序列长度&#xff09;。在基因工程中&#xf…...

数据库和数据库编程

数据库、数据表、表数据操作以及数据库编程相关的知识点 1. 数据库的概念&#xff1a; 数据库是用于存储和组织数据的系统。数据库管理系统(DBMS)是管理数据库的软件&#xff0c;提供对数据的访问、查询和维护。关系型数据库是一种通过表格结构来组织和管理数据的数据库。 2…...

爬虫基础一(持续更新)

爬虫概念&#xff1a; 通过编写程序&#xff0c;模拟浏览器上网&#xff0c;然后让其去互联网上抓取数据的过程 分类&#xff1a; 1&#xff0c;通用爬虫&#xff1a;抓取一整张页面数据 2&#xff0c;聚焦爬虫&#xff1a;抓取页面中的局部内容 3&#xff0c;增量式爬虫&…...

右键菜单“以notepad++打开”,在windows文件管理器中

notepad 添加到文件管理器的右键菜单中 找到安装包&#xff0c;重新安装一般即可。 这里有最新版&#xff1a;地址 密码:f0f1 方法 在安装的时候勾选 “Context Menu Entry” 即可 Notepad的右击打开文件功能 默认已勾选 其作用是添加右键快捷键。即&#xff0c;对于任何…...

JSON.parseObject强制将自动转化的Intage型设置为Long型

通过Redis或Caffeine存储入json型String&#xff0c;通过JSON.parseObject自动类型转化之后&#xff0c;数值会优先转为Intage&#xff0c;如果存入的字符值大于Intage最大值&#xff0c;会自动转为Long型&#xff1b; 需求是&#xff1a;实要取出时数值类型值为Long&#xff1…...

Redis的集群模式:主从 哨兵 分片集群

基于Redis集群解决单机Redis存在的问题&#xff0c;在之前学Redis一直都是单节点部署 单机或单节点Redis存在的四大问题&#xff1a; 数据丢失问题&#xff1a;Redis是内存存储&#xff0c;服务重启可能会丢失数据 > 利用Redis数据持久化的功能将数据写入磁盘并发能力问题…...

远程办公团队如何高效协作:项目管理的10条黄金法则

远程办公团队如何高效协作&#xff1f;本文结合10年项目管理实践&#xff0c;总结出目标对齐、书面共识、责任分工、沟通节奏、进度透明、风险预警、反馈复盘和团队信任等10条黄金法则&#xff0c;帮助管理者提升远程协作效率与项目交付质量。 远程办公已经成为许多团队的常态协…...

3步搞定电子课本下载,效率提升80%:教师与家长的教育资源获取神器

3步搞定电子课本下载&#xff0c;效率提升80%&#xff1a;教师与家长的教育资源获取神器 【免费下载链接】tchMaterial-parser 国家中小学智慧教育平台 电子课本下载工具 项目地址: https://gitcode.com/GitHub_Trending/tc/tchMaterial-parser 在数字化教学日益普及的今…...

Python实现中国象棋AI对战【完整代码+算法解析】

1. 中国象棋AI对战系统设计思路 中国象棋AI对战系统的核心在于将传统规则转化为计算机可执行的逻辑&#xff0c;同时赋予AI"思考"能力。我最初尝试开发这个项目时&#xff0c;发现最大的挑战不是代码实现&#xff0c;而是如何让AI理解象棋的策略本质。经过多次迭代&a…...

嵌入式开发必知:如何通过.text、.data和.bss段优化内存使用(附实例分析)

嵌入式开发实战&#xff1a;从.text到.bss的内存优化策略与案例分析 在资源受限的嵌入式系统中&#xff0c;内存优化从来不是可选项&#xff0c;而是生存法则。当你的MCU只有几十KB RAM&#xff0c;而产品功能需求却在不断膨胀时&#xff0c;对内存分区的深入理解就成为了区分普…...

BetterGI 0.38.1版本安装失败终极解决方案:从诊断到修复的完整指南

BetterGI 0.38.1版本安装失败终极解决方案&#xff1a;从诊断到修复的完整指南 【免费下载链接】better-genshin-impact &#x1f368;BetterGI 更好的原神 - 自动拾取 | 自动剧情 | 全自动钓鱼(AI) | 全自动七圣召唤 | 自动伐木 | 自动派遣 | 一键强化 - UI Automation Testi…...

verl分布式训练实战:从单机多卡到多机多卡的完整配置指南

1. 分布式训练基础概念与verl框架简介 第一次接触分布式训练的朋友可能会被"单机多卡"、"多机多卡"这些术语吓到。其实理解起来很简单&#xff0c;就像搬家时找帮手一样&#xff1a;单机多卡相当于在一套房子里叫来几个家人一起打包&#xff0c;多机多卡则…...

从‘两遍法’到‘并查集’:图像连通域算法演进与性能避坑指南

从‘两遍法’到‘并查集’&#xff1a;图像连通域算法演进与性能避坑指南 在工业质检、自动驾驶或医学影像分析中&#xff0c;处理一张2000万像素的图像时&#xff0c;传统连通域算法可能让系统卡顿数秒——这恰恰是算法选型失误的典型代价。本文将带您穿透三种主流算法的技术…...

高效批量OCR处理实战指南:提升图片文字提取效率的完整方案

高效批量OCR处理实战指南&#xff1a;提升图片文字提取效率的完整方案 【免费下载链接】Umi-OCR Umi-OCR: 这是一个免费、开源、可批量处理的离线OCR软件&#xff0c;适用于Windows系统&#xff0c;支持截图OCR、批量OCR、二维码识别等功能。 项目地址: https://gitcode.com/…...

5分钟部署Qwen3-Reranker-0.6B:解决模型下载失败、权限问题等部署难题

5分钟部署Qwen3-Reranker-0.6B&#xff1a;解决模型下载失败、权限问题等部署难题 1. 引言 Qwen3-Reranker-0.6B作为一款轻量级但功能强大的文本重排序模型&#xff0c;在实际部署过程中常常会遇到各种"拦路虎"。本文将带你快速解决这些部署难题&#xff0c;让你在…...

零成本上线个人博客:我的阿贝云免费云服务器实战记录

作为一名学生党/程序员&#xff0c;你是否也想拥有一台属于自己的云服务器&#xff0c;用来搭建博客、跑 Demo、练习 Linux&#xff1f;但又被各大云厂商的“首月0元”、“学生认证”等套路劝退&#xff1f;前段时间&#xff0c;我无意间发现了 阿贝云 的 永久免费云服务器 和 …...