当前位置：首页 > news >正文

pychon/PIL/opencv/json学习过程中遇到的问题

news 2026/2/8 19:58:42

1. 使用PIL.Image读取图片

注意：pytorch中对图像预处理是transforms的输入必须是PIL格式的文件，使用cv2读取的图片就按照第二条的代码处理（3通道合并、归一化处理）

from PIL import Image
img = Image.open("test1.jpg")读取图像
img.show()展示图片
print(img.size)查看图像是255*255大小的数据，每个像素点是0-1的值。而cv2读出每个像素点为0-255.

如果进行FasterRCNN推理：

	net=torchvision.models.detection.fasterrcnn_resnet50_fpn(pretrained=True)transform = transforms.Compose([transforms.Resize(256),transforms.CenterCrop(224),transforms.ToTensor(),transforms.Normalize(mean=[0.485,0.456,0.406],std=[0.229,0.224,0.225])])img = Image.open("test1.jpg")img_t = transform(img)#裁剪及转换为张量batch_t = torch.unsqueeze(img_t,0)net.eval()out2=net(batch_t)

2.使用opencv读取图片

src_img=cv2.imread("test1.jpg")#读取图片
cv2.imshow("result",src_img)#显示图片
print(src_img.shape)#可查看大小为(255，255，3)此时cv2读取的图像格式为BGR,且每个像素点的值为0-255，需要使用	cv2.cvtColor(img,cv2.COLOR_BGR2RGB)转换为RGB格式

import cv2
import torch 
import torchvision
import numpy as np
from PIL import Image
import PIL
from matplotlib import pyplot as plt
from torchvision import transformsnet=torchvision.models.detection.fasterrcnn_resnet50_fpn(pretrained=True)
net.eval()
src_img=cv2.imread("test1.jpg")
img = cv2.cvtColor(src_img,cv2.COLOR_BGR2RGB)
img_tensor = torch.from_numpy(img/255.).permute(2,0,1).float()
input=[]
input.append(img_tensor)
out2=net(input)
boxes=out2[0]['boxes']
labels=out2[0]['labels']
scores=out2[0]['scores']
boxes=boxes.detach().numpy()
boxes=np.array(boxes,np.uint8)
for idx in range(boxes.shape[0]):if scores[idx] >= 0.95:x1,y1,x2,y2=boxes[idx][0],boxes[idx][1],boxes[idx][2],boxes[idx][3]cv2.rectangle(src_img,(x1,y1),(x2,y2),(0,255,0),thickness=2)cv2.imshow("result",src_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

3.PIL和cv2图片相互转换：

img_pil=Image.fromarray(cv2.cvtColor(img_cv,cv2.COLOR_BGR2RGB))
img_cv=cv2.cvtColor(np.asarray(img_pil),cv2.COLOR_RGB2BGR)

Image读取的图片使用cv2显示：

img = Image.open("test1.jpg")
print(img.size)#(255,255)
cv2img=np.array(img.convert('RGB'))#转换为RGB格式
print(cv2img.shape)#(255,255,3)
cv2img=cv2.cvtColor(cv2img, cv2.COLOR_RGB2BGR)#cv2需要BGR格式图片
cv2.imshow("result",cv2img)#可正常展示

4.使用json保存读取文件,coco数据集为91类别，voc为21个类别

从txt文件加载字符串保存为json格式：
在这里插入图片描述
coco_classes.json:

代码：

import json
coco_class_path="./coco_classes.txt"#txt文件每行为一个数据如： 1 person前面为字典关键字key,person为字典value
jsondata={}#json文件是字典结构,用于存放数据
with open(coco_class_path,'r') as coco:for line in coco.readlines():#遍历txt文件每行字符串line=line.strip().split()#strip()去除两边控空字符，split()以空格分割字符串if len(line)>2:print(line[0],line[1],line[2])jsondata[line[0]] = line[1]+' '+line[2]#有些value为两个单词else:jsondata[line[0]] = line[1]with open('coco_classes.json','w') as coco:#写入json文件json.dump(jsondata,coco)with open('coco_classes.json','r') as coco:#从json文件读出readjson=json.load(coco)print(readjson)

pychon/PIL/opencv/json学习过程中遇到的问题

1. 使用PIL.Image读取图片注意：pytorch中对图像预处理是transforms的输入必须是PIL格式的文件，使用cv2读取的图片就按照第二条的代码处理（3通道合并、归一化处理） from PIL import Image img Image.open("test1.jpg"…...

编程日记 2023/11/13 21:59:30

YOLO目标检测——番茄数据集下载分享【含对应voc、coco和yolo三种格式标签】

实际项目应用：番茄检测数据集说明：番茄目标检测数据集，真实场景的高质量图片数据，数据场景丰富标签说明：使用lableimg标注软件标注，标注框质量高，含voc(xml)、coco(json)和yolo(txt)三种格式标签…...

编程日记 2023/11/13 21:58:29

（JAVA）线程

线程的创建方式一：Thread public class dome {public static void main(String[] args) {MyThread myThread new MyThread();myThread.start();for(int i1;i<5;i){System.out.println("主线程"i);}} }public class MyThread extends Thread{Overri…...

编程日记 2023/11/13 21:57:29

【深度学习环境】windows安装 NVIDIA Docker

摘要不要安装 Docker Desktop！我们将在 Ubuntu 中自行安装 Docker。请安装 Windows 10 Insider Build 或 Windows 11 （Beta也行）。（稳定发行版无法在 WSL 2 中使用 GPU） 请安装 WSL 2 w/Ubuntu 20.04 或同等版本。…...

编程日记 2023/11/13 21:56:27

【微信小程序】自定义组件（三）

自定义组件插槽1、什么是插槽2、单个插槽3、定义多个插槽父子组件之间的通信1、父子组件之间的通信的3种方式2、事件绑定3、behaviors 插槽 1、什么是插槽在自定义组件的wxml结构中，可以提供一个<solot> 节点（插槽），用…...

编程日记 2023/11/13 21:55:26

Python语言：经典案例分析讲解2

例题1：文件的操作例题2：调用函数求偶数之和例题3：调用函数并使用递归的方法求斐波那契数前N项之和题1: 以只写的模式打开文件test.txt，写入"Python"，关闭文件。代码如下： f open("E:/…...

编程日记 2023/11/13 21:54:25

dbeaver连接别人的数据库没有表

1.概念非缺省的数据库： 通常是指在一个数据库管理系统（DBMS）中，除了系统默认创建的数据库之外的其他用户创建或自定义的数据库。许多数据库系统在安装后会创建一个默认数据库，例如MySQL中的mysql数据库，…...

编程日记 2023/11/13 21:53:24

EXIT(1）

EXTI介绍 EXTI是片上外设 NVIC是cpu内的外设回忆起之前的GPIO和AFIO 我们是如何检测按键按下的我们是一直用while循环读取IDR寄存器的对应位置的值一直检测判断按键是否被按下那么是否有第二种方式检测按键是否被按下了呢？ 通过EXTI 当EXTI检测到按键的电平发生…...

编程日记 2023/11/13 21:52:23

Qt信号量用于对共享资源进行同步

定义信号量与缓冲区： const int BufferSize 8; int buffer1[BufferSize]; int buffer2[BufferSize]; int curBuf1; //当前正在写入的Bufferint bufNo0; //采集的缓冲区序号quint8 counter0;//数据生成器QSemaphore emptyBufs(2);//信号量：空的缓冲区…...

编程日记 2023/11/13 21:51:22

在报错中学python something

这里写目录标题动手学深度学习pandas完整代码数据处理TypeError: can only concatenate str (not "int") to str（fillna填补缺失值） 创建文件夹学习这个数据分组get_dummies实现one hot encode 动手学深度学习pandas完整代码 import osimpor…...

编程日记 2023/11/13 21:50:21

如何调用 DBMS_DISKGROUP 对 ASM 文件进行随机读取

目录一、概述二、实现思路与注意点三、Java Demo 1、直接调用 2、读写异步一、概述对于 Oracle Rac 环境下，数据文件大多默认存放在 ASM 共享存储上，当我们需要读取 ASM 上存储的数据文件时可以使用 Oracle 提供的一些方法，比如 ASMCMD CP。但是，对于一些备份场景…...

编程日记 2023/11/13 21:49:19

UART学习

uart.c #include "stm32mp1xx_gpio.h" #include "stm32mp1xx_uart.h" // UART4_TX : PG11 AF6 // UART4_RX : PB2 AF8 void __uart_init() {// GPIOB2 设置为复用功能GPIOB->MODER & (~(0x3 << 4));GPIOB->MODER | (0x2 << 4);G…...

编程日记 2023/11/13 21:48:18

洗地机哪个牌子最好用？洗地机品牌排行榜

近年来，洗地机相当热门，洗地机结合了扫地拖地吸地为一体的多功能清洁工具，让我们告别了传统方式打扫卫生，让我们清洁不再费劲，可是市面上的洗地机五花八门，怎么挑选到一个洗地机也是一个问题，下…...

编程日记 2023/11/13 21:47:17

国际阿里云：Windows实例中数据恢复教程！！！

在处理磁盘相关问题时，您可能会碰到操作系统中数据盘分区丢失的情况。本文介绍了Windows系统下常见的数据盘分区丢失的问题以及对应的处理方法，同时提供了使用云盘的常见误区以及最佳实践，避免可能的数据丢失风险。前提条件已注册阿里云账…...

编程日记 2023/11/13 21:46:17

浅谈二叉树

✏️✏️✏️今天给大家分享一下二叉树的基本概念以及性质、二叉树的自定义实现，二叉树的遍历等。清风的CSDN博客 😛😛😛希望我的文章能对你有所帮助，有不足的地方还请各位看官多多指教，大家一起学习交流&…...

编程日记 2023/11/13 21:45:15

（二）用QWebSocket 实现服务端和客户端（详细代码直接使用）

目录前言一、服务器的代码： 1、服务器的思路 2、具体服务器的代码示例二、客户端的代码： 1、客户端的思路（和服务器类似） 2、具体客户端的代码示例前言要是想了解QWebSocket的详细知识，还得移步到上一篇文…...

编程日记 2023/11/13 21:44:14

关于我在配置zookeeper出现，启动成功，进程存在，但是查看状态却没有出现Mode:xxxxx的问题和我的解决方案

在我输入:zkServer.sh status 之后出现报错码. 报错码： ZooKeeper JMX enabled by default Using config: /opt/software/zookeeper/bin/../conf/zoo.cfgClient port found: 2181. Client address: localhost. Error contacting service. It is probably not runni…...

编程日记 2023/11/13 21:43:13

react及相关面试问题汇总

目录 1、什么是React？它的特点是什么？ 2、解释一下虚拟DOM(Virtual DOM)的概念以及它的工作原理。 3、什么是组件(Component)？如何定义一个React组件？ 4、什么是JSX？它与HTML的区别是什么？如何在React中…...

编程日记 2023/11/13 21:42:12

QT4到QT5移植出现的一些问题

转自：QT4到QT5移植出现的一些问题_西门子3gl qt5 许可证-CSDN博客在上述作者基础上修改： 一、问题1：头文件的问题 1、QtGui/QApplication: No such file or directory 1.1错因原因是Qt5源文件位置的改动 1.2解决 pro文件里&#xff0…...

编程日记 2023/11/13 21:41:11

【可解释AI】Alibi explain: 解释机器学习模型的算法

Alibi explain: 解释机器学习模型的算法可解释人工智能简介Alibi特点算法Library设计展望参考资料今天介绍Alibi Explain，一个开源Python库，用于解释机器学习模型的预测(https://github.com/SeldonIO/alibi)。该库具有最先进的分类和回归模型可解释性算…...

编程日记 2023/11/13 21:40:10

7.4.分块查找

一.分块查找的算法思想： 1.实例： 以上述图片的顺序表为例， 该顺序表的数据元素从整体来看是乱序的，但如果把这些数据元素分成一块一块的小区间， 第一个区间[0,1]索引上的数据元素都是小于等于10的， 第二…...

编程新知 2026/1/27 18:11:42

基于大模型的 UI 自动化系统

基于大模型的 UI 自动化系统下面是一个完整的 Python 系统，利用大模型实现智能 UI 自动化，结合计算机视觉和自然语言处理技术，实现"看屏操作"的能力。系统架构设计 #mermaid-svg-2gn2GRvh5WCP2ktF {font-family:"trebuchet ms",verdana,arial,sans-…...

编程新知 2025/10/22 11:16:20

论文解读：交大港大上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架（二）

HoST框架核心实现方法详解 - 论文深度解读（第二部分）《Learning Humanoid Standing-up Control across Diverse Postures》系列文章：论文深度解读 + 算法与代码分析（二）作者机构：上海AI Lab, 上海交通大学, 香港大学, 浙江大学, 香港中文大学论文主题：人形机器人…...

编程新知 2026/1/20 19:54:35

页面渲染流程与性能优化

页面渲染流程与性能优化详解（完整版） 一、现代浏览器渲染流程（详细说明） 1. 构建DOM树浏览器接收到HTML文档后，会逐步解析并构建DOM（Document Object Model）树。具体过程如下： (…...

编程新知 2026/1/31 11:58:35

Pinocchio 库详解及其在足式机器人上的应用

Pinocchio 库详解及其在足式机器人上的应用 Pinocchio (Pinocchio is not only a nose) 是一个开源的 C 库，专门用于快速计算机器人模型的正向运动学、逆向运动学、雅可比矩阵、动力学和动力学导数。它主要关注效率和准确性，并提供了一个通用的框架&…...

编程新知 2025/11/28 5:32:31

python报错No module named ‘tensorflow.keras‘

是由于不同版本的tensorflow下的keras所在的路径不同，结合所安装的tensorflow的目录结构修改from语句即可。原语句： from tensorflow.keras.layers import Conv1D, MaxPooling1D, LSTM, Dense 修改后： from tensorflow.python.keras.lay…...

编程新知 2025/9/24 7:39:50

Spring是如何解决Bean的循环依赖：三级缓存机制

1、什么是 Bean 的循环依赖在 Spring框架中，Bean 的循环依赖是指多个 Bean 之间‌互相持有对方引用‌，形成闭环依赖关系的现象。多个 Bean 的依赖关系构成环形链路，例如：双向依赖：Bean A 依赖 Bean B，同时 Bean B 也依赖 Bean A（A↔B）。链条循环： Bean A → Bean…...

编程新知 2025/7/25 1:21:53

IP如何挑？2025年海外专线IP如何购买？

你花了时间和预算买了IP，结果IP质量不佳，项目效率低下不说，还可能带来莫名的网络问题，是不是太闹心了？尤其是在面对海外专线IP时，到底怎么才能买到适合自己的呢？所以，挑IP绝对是个技…...

编程新知 2026/1/28 3:04:35

AirSim/Cosys-AirSim 游戏开发（四）外部固定位置监控相机

这个博客介绍了如何通过 settings.json 文件添加一个无人机外的固定位置监控相机，因为在使用过程中发现 Airsim 对外部监控相机的描述模糊，而 Cosys-Airsim 在官方文档中没有提供外部监控相机设置，最后在源码示例中找到了，所以感…...

编程新知 2026/2/5 18:58:39

vulnyx Blogger writeup

信息收集 arp-scan nmap 获取userFlag 上web看看一个默认的页面，gobuster扫一下目录可以看到扫出的目录中得到了一个有价值的目录/wordpress，说明目标所使用的cms是wordpress，访问http://192.168.43.213/wordpress/然后查看源码能看到这…...

编程新知 2026/1/29 5:24:50

1. 使用PIL.Image读取图片

2.使用opencv读取图片

3.PIL和cv2图片相互转换：

4.使用json保存读取文件,coco数据集为91类别，voc为21个类别

相关文章：