当前位置：首页 > news >正文

图像识别快速实现

news 2026/2/10 1:59:55

文本的跑通了，接下来玩玩图片场景

1. 引入模型

再另起类test_qdrant_img.py，转化图片用到的模型和文本不太一样，我们这里使用ResNet-50模型

import unittest
from qdrant_client.http.models import Distance, VectorParams
from qdrant_client import QdrantClient
import torch
import torchvision.transforms as transforms
from PIL import Imageclass TestQDrantImg(unittest.TestCase):def setUp(self):self.collection_name = "img_collection"self.client = QdrantClient("localhost", port=6333)# 加载ResNet-50模型self.model = torch.hub.load('pytorch/vision:v0.10.0', 'resnet50', pretrained=True)self.model.eval()# 图像预处理self.preprocess = transforms.Compose([# 图像调整为256*256transforms.Resize(256), # 中心裁剪为224*224transforms.CenterCrop(224), # 转换为张量，像素值从范围[0,255]缩放到范围[0,1]，RGB（红绿蓝）转换为通道顺序（即 RGB 顺序）transforms.ToTensor(), # 应用归一化，减去均值（mean）并除以标准差（std）transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])])

2. 添加图片向量

我们先创建一个新集合

def test_create_collection(self):self.client.create_collection(collection_name=self.collection_name,vectors_config=VectorParams(size=1000, distance=Distance.EUCLID),)

往集合里分别添加1个猫的图片和1个狗的图片

    def test_img_vector(self):# 加载并预处理图像id = 1image_path = './img/cat1.png'# id = 2# image_path = './img/dog1.png'image = Image.open(image_path)image_tensor = self.preprocess(image)# 在第0维度上添加一个维度，将图像张量转换为形状为 (1, C, H, W) 的张量，其中 C 是通道数，H 是高度，W 是宽度image_tensor = torch.unsqueeze(image_tensor, 0)with torch.no_grad():# 去除维度为1的维度，将特征向量的形状从 (1, D) 转换为 (D,)feature_vector = self.model(image_tensor).squeeze().tolist()operation_info = self.client.upsert(collection_name=self.collection_name,points=[{'id': id, 'vector': feature_vector, 'payload': {"image_path": image_path}}])print(operation_info)

3. 匹配图片向量

然后用其他猫狗的图片来做搜索匹配

    def test_search(self):# 加载并预处理图像image_path = './img/cat2.png'# image_path = './img/dog2.png'# image_path = './img/cat3.png'image = Image.open(image_path)image_tensor = self.preprocess(image)image_tensor = torch.unsqueeze(image_tensor, 0)with torch.no_grad():feature_vector = self.model(image_tensor).squeeze().tolist()search_result = self.client.search(collection_name=self.collection_name, query_vector=feature_vector, limit=3, with_vectors=True, with_payload=True)print(search_result)

结果：

[ScoredPoint(id = 1, version = 0, score = 68.21013, payload = {

'image_path': './img/cat1.png'

}, vector = [...]),

ScoredPoint(id = 2, version = 1, score = 85.10757, payload = {

'image_path': './img/dog1.png'

}, vector = [...])]

当使用猫2猫3作为查询条件时，跟猫1记录的score(向量距离)较小；

同理，使用狗2作为查询条件时，跟狗1记录的score(向量距离)较小

图像识别快速实现

文本的跑通了，接下来玩玩图片场景 1. 引入模型再另起类test_qdrant_img.py，转化图片用到的模型和文本不太一样，我们这里使用ResNet-50模型 import unittest from qdrant_client.http.models import Distance, VectorParams from qdrant_cl…...

编程日记 2024/1/6 11:46:03

一文详解动态 Schema

在数据库中，Schema 常有，而动态 Schema 不常有。例如，SQL 数据库有预定义的 Schema，但这些 Schema 通常都不能修改，用户只有在创建时才能定义 Schema。Schema 的作用是告诉数据库使用者所希望的表结构，确保…...

编程日记 2024/1/6 11:44:02

Web网页开发-总结笔记2

28.为什么会出现浮动？浮动会带来哪些问题？ 1)为什么会出现浮动： 为了页面排版时块元素同行显示 2)浮动带来的问题： 父元素高度崩塌29.清除浮动的方法 (额外标签法、父级overflow、after伪元素、双伪元素） &#xff08…...

编程日记 2024/1/6 11:43:01

C#的StringBuilder方法

一、StringBuilder方法 StringBuilder方法Append()向此实例追加指定对象的字符串表示形式。AppendFormat()向此实例追加通过处理复合格式字符串（包含零个或更多格式项）而返回的字符串。每个格式项都由相应的对象自变量的字符串表示形式替换。AppendJoi…...

编程日记 2024/1/6 11:42:00

美格智能5G RedCap模组SRM813Q通过广东联通5G创新实验室测试认证

近日，美格智能5G RedCap轻量化模组SRM813Q正式通过广东联通5G创新实验室端到端的测试验收，获颁测评证书。美格智能已连续通过业内两家权威实验室的测试认证，充分验证SRM813Q系列模组已经具备了成熟的商用能力，将为智慧工业、安防监…...

编程日记 2024/1/6 11:37:57

MVCC 并发控制原理-源码解析（非常详细）

基础概念并发事务带来的问题 1）脏读：一个事务读取到另一个事务更新但还未提交的数据，如果另一个事务出现回滚或者进一步更新，则会出现问题。 2）不可重复读：在一个事务中两次次读取同一个数据时&#xff0c…...

编程日记 2024/1/6 11:36:56

通过国家网络风险管理方法提供安全的网络环境

印度尼西亚通过讨论网络安全法草案启动了其战略举措。不过，政府和议会尚未就该法案的多项内容达成一致。另一方面，制定战略性、全面的网络安全方法的紧迫性从未像今天这样重要。其政府官方网站遭受了多起网络攻击，引发了人们对国家网络安全…...

编程日记 2024/1/6 11:34:54

自我扩展‘ type 中date属性自我控制编辑区域的 ::-webkit-datetime-edit { padding: 1px; background: url(…/selection.gif); }控制年月日这个区域的 ::-webkit-datetime-edit-fields-wrapper { background-color: #eee; }这是控制年月日之间的斜线或短横线的 ::-webki…...

编程日记 2024/1/6 11:33:53

将PPT4页并排成1页

将PPT4页并排成1页打印解决方法: 方法一在打印时选择： 打开 PPT，点击文件选项点击打印点击整页幻灯片点击4张水平放置的幻灯平页面就会显示4张PPT显示在一张纸上方法二另存为PDF： 打开电脑上的目标PPT文件，点击文件点击…...

编程日记 2024/1/6 11:32:52

iPhone 恢复出厂设置后如何恢复数据

如果您在 iPhone 上执行了恢复出厂设置，您会发现所有旧数据都被清除了。这对于清理混乱和提高设备性能非常有用，但如果您忘记保存重要文件，那就是坏消息了。恢复出厂设置后可以恢复数据吗？是的！幸运的是，…...

编程日记 2024/1/6 11:31:51

欧洲最好的AI大模型：Mistral 7B!（开源、全面超越Llama 2）

你可能已经听说过Meta（原Facebook）的Llama 2，这是一款拥有13亿参数的语言模型，能够生成文本、代码、图像等多种内容。但是你知道吗，有一家法国的创业公司Mistral AI，推出了一款只有7.3亿参数的语言模型&am…...

编程日记 2024/1/6 11:30:50

Python | 诞生、解析器的分类版本及安装

1. python的诞生 Python是一门由Guido van Rossum（龟叔）于1991年创造的高级编程语言。下图是TIOBE指数（TIOBE Index）的官方网站的截图，TIOBE指数是衡量编程语言流行度的指标之一，截止到目前python排名第…...

编程日记 2024/1/6 11:28:47

vim学习记录

目录历史记录前言相关资料配置windows互换ESC和Caps Lock按键基本操作替换字符串历史记录 2024年1月2日, 搭建好框架,开始学习; 前言 vim使用很久了,但是都是一些基本用法,主要是用于配置Linux,进行一些简单的编写文档和程序.没有进行过大型程序开发,没有达到熟练使用的程…...

编程日记 2024/1/6 11:27:46

bat脚本：将ini文件两行值转json格式

原文件 .ini：目标转换第2行和第三行成下方json [info] listKeykey1^key2^key3 listNameA大^B最小^c最好 ccc1^2^3^ ddd0^1^9目标格式生成同名json文件，并删除原ini文件 [ { "value":"key1", "text":"A大" …...

编程日记 2024/1/6 11:23:43

scratch绘制小正方形 2023年12月中国电子学会图形化编程少儿编程 scratch编程等级考试四级真题和答案解析

目录 scratch绘制小正方形一、题目要求 1、准备工作 2、功能实现二、案例分析...

编程日记 2024/1/6 11:21:41

【产品应用】一体化伺服电机在管道检测机器人中的应用

一体化伺服电机在管道检测机器人的应用正日益受到关注。管道检测机器人是一种能够在管道内部进行检测和维护的智能化设备，它可以检测管道的内部结构、泄漏、腐蚀等问题，以确保管道的安全和稳定运行。而一体化伺服电机作为机器人的动力源，对于…...

编程日记 2024/1/6 11:20:40

Django在urls.py利用函数path()配置路由时传递参数给调用的视图函数的方法

01-单个参数的传递问：在urls.py利用函数path()配置路由时能不能传递一些参数给调用的视图函数？因为我有很多路由调用的其实是同一个视图函数，所以希望能传递一些额外的参数。比如路由的PATH信息如果能传递就好了。答：在Django中…...

编程日记 2024/1/6 11:18:39

Ubuntu20 编译 Android 12源码

1.安装基础库推荐使用 Ubuntu 20.04 及以上版本编译，会少不少麻烦，以下是我的虚拟机配置执行命令安装依赖库 // 第一步执行 update sudo apt-get update//安装相关依赖sudo apt-get install -y libx11-dev:i386 libreadline6-dev:i386 libgl1-mesa-de…...

编程日记 2024/1/6 11:16:36

RFID传感器|识读器CNS-RFID-01/1S在AGV小车|搬运机器人领域的安装与配置方法

AGV 在运行时候需要根据预设地标点来执行指令，在需要 AGV 在路径线上位置执行某个指令时候，则需要在这个点设置命令地标点，AGV 通过读取不同地标点编号信息，来执行规定的指令。读取地标点设备为寻址传感器，目前&#…...

编程日记 2024/1/6 11:14:35

用友U8 Cloud smartweb2.RPC.d XML外部实体注入漏洞

产品介绍用友U8cloud是用友推出的新一代云ERP，主要聚焦成长型、创新型、集团型企业，提供企业级云ERP整体解决方案。它包含ERP的各项应用，包括iUAP、财务会计、iUFO cloud、供应链与质量管理、人力资源、生产制造、管理会计、资产管理&#…...

编程日记 2024/1/6 11:13:34

第19节 Node.js Express 框架

Express 是一个为Node.js设计的web开发框架，它基于nodejs平台。 Express 简介 Express是一个简洁而灵活的node.js Web应用框架, 提供了一系列强大特性帮助你创建各种Web应用，和丰富的HTTP工具。使用Express可以快速地搭建一个完整功能的网站。 Expre…...

编程新知 2026/2/8 6:37:43

Zustand 状态管理库：极简而强大的解决方案

Zustand 是一个轻量级、快速和可扩展的状态管理库，特别适合 React 应用。它以简洁的 API 和高效的性能解决了 Redux 等状态管理方案中的繁琐问题。核心优势对比基本使用指南 1. 创建 Store // store.js import create from zustandconst useStore create((set)…...

编程新知 2026/2/8 10:56:57

大数据零基础学习day1之环境准备和大数据初步理解

学习大数据会使用到多台Linux服务器。一、环境准备 1、VMware 基于VMware构建Linux虚拟机是大数据从业者或者IT从业者的必备技能之一也是成本低廉的方案所以VMware虚拟机方案是必须要学习的。 （1）设置网关打开VMware虚拟机，点击编辑…...

编程新知 2026/1/25 14:43:07

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院挂号小程序

一、开发准备环境搭建： 安装DevEco Studio 3.0或更高版本配置HarmonyOS SDK申请开发者账号项目创建： File > New > Create Project > Application (选择"Empty Ability") 二、核心功能实现 1. 医院科室展示 /…...

编程新知 2025/9/5 12:16:40

【算法训练营Day07】字符串part1

文章目录反转字符串反转字符串II替换数字反转字符串题目链接：344. 反转字符串双指针法，两个指针的元素直接调转即可 class Solution {public void reverseString(char[] s) {int head 0;int end s.length - 1;while(head < end) {char temp …...

编程新知 2025/8/27 14:38:58

QT： `long long` 类型转换为 `QString` 2025.6.5

在 Qt 中，将 long long 类型转换为 QString 可以通过以下两种常用方法实现： 方法 1：使用 QString::number() 直接调用 QString 的静态方法 number()，将数值转换为字符串： long long value 1234567890123456789LL; …...

编程新知 2026/2/1 6:30:04

【SpringBoot自动化部署】

SpringBoot自动化部署方法使用Jenkins进行持续集成与部署 Jenkins是最常用的自动化部署工具之一，能够实现代码拉取、构建、测试和部署的全流程自动化。配置Jenkins任务时，需要添加Git仓库地址和凭证，设置构建触发器（如GitHub…...

编程新知 2025/11/18 2:17:20

uniapp 实现腾讯云IM群文件上传下载功能

UniApp 集成腾讯云IM实现群文件上传下载功能全攻略一、功能背景与技术选型在团队协作场景中，群文件共享是核心需求之一。本文将介绍如何基于腾讯云IMCOS，在uniapp中实现： 群内文件上传/下载文件元数据管理下载进度追踪跨平台文件预览二…...

编程新知 2025/9/14 20:44:53

k8s从入门到放弃之HPA控制器

k8s从入门到放弃之HPA控制器 Kubernetes中的Horizontal Pod Autoscaler (HPA)控制器是一种用于自动扩展部署、副本集或复制控制器中Pod数量的机制。它可以根据观察到的CPU利用率（或其他自定义指标）来调整这些对象的规模，从而帮助应用程序在负…...

编程新知 2025/10/30 1:59:28

Axure 下拉框联动

实现选省、选完省之后选对应省份下的市区...

编程新知 2026/1/20 13:43:41

图像识别快速实现

1. 引入模型

2. 添加图片向量

3. 匹配图片向量

相关文章：

图像识别快速实现

一文详解动态 Schema

Web网页开发-总结笔记2

C#的StringBuilder方法

美格智能5G RedCap模组SRM813Q通过广东联通5G创新实验室测试认证

MVCC 并发控制原理-源码解析（非常详细）

通过国家网络风险管理方法提供安全的网络环境

input中typedate的属性都有那些

将PPT4页并排成1页

iPhone 恢复出厂设置后如何恢复数据

欧洲最好的AI大模型：Mistral 7B!（开源、全面超越Llama 2）

Python | 诞生、解析器的分类版本及安装

vim学习记录

bat脚本：将ini文件两行值转json格式

scratch绘制小正方形 2023年12月中国电子学会图形化编程少儿编程 scratch编程等级考试四级真题和答案解析

【产品应用】一体化伺服电机在管道检测机器人中的应用

Django在urls.py利用函数path()配置路由时传递参数给调用的视图函数的方法

Ubuntu20 编译 Android 12源码

RFID传感器|识读器CNS-RFID-01/1S在AGV小车|搬运机器人领域的安装与配置方法

用友U8 Cloud smartweb2.RPC.d XML外部实体注入漏洞

第19节 Node.js Express 框架

Zustand 状态管理库：极简而强大的解决方案

大数据零基础学习day1之环境准备和大数据初步理解

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院挂号小程序

【算法训练营Day07】字符串part1

QT： `long long` 类型转换为 `QString` 2025.6.5

【SpringBoot自动化部署】

uniapp 实现腾讯云IM群文件上传下载功能

k8s从入门到放弃之HPA控制器

Axure 下拉框联动