当前位置：首页 > news >正文

图像的读取与保存

news 2026/2/9 17:20:36

图像是由一个个像素点组成，像素点就是颜色点，而颜色最简单的方式就是用RGB或RGBA表示

图像保存

图像将像素信息按照一定格式，一定顺序（即编码）存在硬盘上的二进制文件中

保存图像需要以下必要信息：

1. 文件名和路径

2. 文件格式

3. 压缩参数(jpeg图像的压缩质量等)

图像读取

将而二进制文件还原为像素排布

图像编码

目的：压缩（有损压缩，无损压缩）减小数据大小

有损压缩: 解压缩后的数据与压缩前的数据不一致.在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息,而且丢失的信息不可恢复。

无损压缩: 压缩前和解压缩后的数据完全一致。优化数据的排列等。

补充：【端到端指的是直接输入原始数据，让模型自己去学习特征，最后输出结果

非端到端呢，简单来说，就是我们的输入数据首先经过人工处理，在喂给模型去训练】

常见编码：PNG 无损压缩，BMG 无损压缩，JPEG 有损压缩

PNG

PNG图像格式文件（或者称为数据流）由一个8字节的PNG文件署名（PNG file signature）域和按照特定结构组织的3个以上的数据块（chunk）组成。

PNG定义了两种类型的数据块，一种是称为关键数据块（critical chunk），这是必需的数据块，另一种叫做辅助数据块（ancillary chunks），这是可选的数据块。

Critical Chunk（关键数据块），有四种类型：

IHDR，header chunk，包含有图像基本信息，作为第一个出现的数据块并且只出现一次。

PLTE，palette chunk，调色板数据块，必须存放在图像数据块之前。

IDAT，image data chunk，存储实际的图像数据。PNG数据包允许包含多个连续的图像数据块。

IEND，image trailer chunk，图像结束数据，表示PNG数据流结束。

其中ihdr的结构为：4字节为chunk length，4字节为chunk type

剩下13字节的ihdr为：

宽(无符号整，4字节)

高(无符号整，4字节)

bit deep位深(无符号char，1字节)

颜色类型(无符号char，1字节)

压缩方法/滤波方法/隔行扫描法(都是unsigned char 1字节)

https://www.jb51.net/article/199586.htm

# 首先读取二进制文件
f = open("E:/DeepLearning/计算机视觉/cv101-master/dataset/lena.png", 'rb')
print(f)
# <_io.BufferedReader name='E:/DeepLearning/计算机视觉/cv101-master/dataset/lena.png'># head
file_sign = f.read(4)
print("head：", file_sign)
#换行符文件结束符
sign1 = f.read(4)
print("换行符和文件结束符：", sign1)
#head： b'\x89PNG'
#换行符和文件结束符： b'\r\n\x1a\n'length = struct.unpack('I', f.read(4))
print(length)
type = f.read(4)
print(type)
#(218103808,)
#b'IHDR'width = struct.unpack('I', f.read(4))
print("宽度:", width)
height = struct.unpack('I', f.read(4))
print("高度:", height)
# 感觉有点问题
#宽度: (131072,)
#高度: (131072,)
bit = struct.unpack('B',f.read(1))
print("位深:", bit)
color = struct.unpack('B',f.read(1)) 
print("颜色:", color)
#位深: (8,)
#颜色: (2,)a = struct.unpack('B',f.read(1))
b = struct.unpack('B',f.read(1))
c = struct.unpack('B',f.read(1))
print("a,b,c: ",a,b,c)
# a,b,c:  (0,) (0,) (0,)

BMP

-- 文件头：文件类型、文件大小、位图数据的起始位置

-- 位图信息头：图像尺寸、位深图、压缩方式

-- 调色板：存储位深小于8的像素点信息

-- 位图数据：存储图像中每个像素点的颜色信息

位深的概念：

BMP格式中，每个像素点的颜色信息可以使用不同的位深度表示，如1位（单色）、4位（16色）、8位（256色）、16位、24位（真彩色）和32位等。其中，1位表示每个像素点只有黑和白两种颜色；4位表示每个像素点可以有16种颜色；8位（0~255）表示每个像素点可以有256种颜色；16位、24位和32位则表示每个像素点的颜色可以用不同的颜色通道（如红、绿、蓝）进行表示

基本规则如下：

- 文件头（14b）：

- 表示符：BM（2b）

- 文件大小（4b）

- 保留量（4b）

- 偏移量（4b）

- 位图头（40b）

- 字节头大小 4b

- 宽 4b

- 高 4b

- 颜色通道数 2b

- 位深 2b

- 位图数据

- 从左到右，从上到下

- 所占空间为宽乘以高乘以位数除以8

- 补齐4字节

读取一张BMP图片全过程

# 以bmp为例
# 首先读取二进制文件
f = open("E:/DeepLearning/计算机视觉/cv101-master/dataset/lena.bmp", 'rb')
print(f)
#<_io.BufferedReader name='E:/DeepLearning/计算机视觉/cv101-master/dataset/lena.bmp'># 先读取头文件
# 2字节标识符
file_sign = f.read(2)
print("标识符：", file_sign)
#标识符： b'BM'# 4字节文件大小
file_size_byte = f.read(4)
# 需要解码
import struct
file_size = struct.unpack("i", file_size_byte)
print("文件大小:", file_size)
#文件大小: (786486,)# 4字节保留
f.read(4)
# 4字节数据偏移量
offset = struct.unpack("i", f.read(4))[0]
print("偏移量:", offset)
#偏移量: 54# 位图头读取
# 字节头解码
bm_header_size = struct.unpack('i', f.read(4))
print("字节头大小:", bm_header_size)
width = struct.unpack('i', f.read(4))
print("宽度:", width)
height = struct.unpack('i', f.read(4))
print("高度:", height)
channels = struct.unpack('<H', f.read(2))
print("通道:", channels)
color_bit = struct.unpack('<H', f.read(2))  # 2字节解码，低位字节在前
print("位深:", color_bit)
#字节头大小: (40,)
#宽度: (512,)
#高度: (512,)
#通道: (1,)
#位深: (24,)# 读取像素
f.seek(offset)
data = f.read()
# print(data[0], data[1], data[2])
print("总像素值数量为:", len(data))
print("像素点个数为:", len(data) // (color_bit[0] // 8))
print("长(512)*宽(512)= ", 512 * 512)
#总像素值数量为: 786432
#像素点个数为: 262144
#长(512)*宽(512)=  262144# 解码数据
# 一个像素占用的字节：24位深，一个像素三个数字表示rgb通道数值，用三个字节表示；8位深用1个字节表示(灰度图像)；1位深用1个比特来存储（二值图像）
# 因此，计算方式为：int(位深/8）
pixel_bit = int(color_bit[0] / 8)
print("一个像素占用%d字节" % pixel_bit)
row_bit = pixel_bit * width[0]
print("一行占用%d字节" % row_bit)
#一个像素占用3字节
#一行占用1536字节# 建立一个空矩阵用于存储像素
import numpy as np
img = np.zeros((height[0], width[0], 3), dtype=np.uint8)
# 依次填充像素值
for i in range(height[0]):for j in range(width[0]):index = i * height[0] * 3 + j * 3img[i, j, 2] = data[index]img[i, j, 1] = data[index + 1]img[i, j, 0] = data[index + 2]
# 展示结果
import matplotlib.pyplot as plt
plt.imshow(img, origin='lower')
plt.show()

JPEG

-- joint photographic experts group

-- 有损压缩格式

-- DCT和量化实现

-- 具体步骤：

1. 预处理：rgb->YCbCr

2. DCT变换：

- 图像划分成8*8的patch

- 每个patch做DCT变换

3. 量化：

- 量化频域信号

- 舍弃高频信号

4. 编码：

- 熵编码技术对DCT信号编码

- 保留主分量，舍去噪声分量

- 常见的两种实现方式：

* baseline jpeg：常规方式，编码顺序为从左至右从上至下

* progressive jpeg：内容从模糊到清晰，将图像分为多个扫描，每个扫描中先编码大致轮廓，然后在后续扫描中添加细节

图像读取和保存的第三方库

PIL

安装：pip install pillow

读写使用

from PIL import Image
# 读取图像
img = Image.open('E:/DeepLearning/计算机视觉/cv101-master/dataset/lena.bmp')
plt.imshow(img)
plt.show()# 查看图像大小
print('image shape:', img.size)
# 查看图像格式
print('format:', img.format)
# 查看图像通道数
print('mode:', img.mode)# 获取像素值
# 通常是将其转换为其他格式来使用像素值，例如
import numpy as np
img_array = np.asarray(img)
print(img_array[:3, :3, 0])

输出：

image shape: (512, 512)

format: BMP

mode: RGB

[[226 226 223]

[226 226 223]

[226 226 223]]

保存

# PIL提供了保存图像的方法，即
img.save('../../dataset/pil_lena.bmp')

opencv

安装：pip install python-opencv

读取使用：默认读取bgr需转化为rgb

import cv2
img = cv2.imread('E:/dataset/lena.bmp')#路径中不能有中文！！！plt.imshow(img)
plt.show()#读取默认bgr

img = cv2.imread('E:/notebook/lena.bmp')
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)plt.imshow(img)
plt.show()

# 在读取图像时，imread还有个隐藏参数，可以直接将彩色图像转化为灰度图像
img = cv2.imread('E:/notebook/lena.bmp', 0)
img = cv2.cvtColor(img, cv2.COLOR_GRAY2RGB)plt.imshow(img)
plt.show()

图片保存

opencv提供函数保存图像，其格式为：

cv2.imwrite(filename, image, [params])

其中，参数分别是：文件名，图像数据，可选参数：文件格式

img = cv2.imread('E:/notebook/lena.bmp')
cv2.imwrite('E:/notebook/lena.png', img)
cv2.imwrite('E:/notebook/lena_90.jpg', img, [cv2.IMWRITE_JPEG_QUALITY, 90])#压缩质量90kb
cv2.imwrite('E:/notebook/lena_10.jpg', img, [cv2.IMWRITE_JPEG_QUALITY, 10])#压缩质量10kb

质量10kb(第一张)和90kb对比

两者区别

cv2直接读取到图像的内容，pil读取图像的区块

cv2支持的图像格式更多，保存图像时能够控制图像质量，需要空间转换

pil适合简单的图像查看应用场景，opencv适合处理计算机视觉任务。

assignment

PNG2JPG

#方法一：使用PIL库
from PIL import Image
img = Image.open('test.jpg')
img.save('testpil.png')
#方法二：使用opencv库
from cv2 import imread, imwrite
image = imread("test.jpg", 1)
imwrite("testcv.png", image)

不使用第三方库怎么做？

def png2jpg(filename, quality_value, save_folder):# 不依赖opencv或者pil库，从二进制文件直接解析png文件，并保存成jpeg格式。# 其中，jpeg格式的压缩参数由输入指定。# # 输入： #     filename: str, png图像路径#     quality_value: 压缩质量参数#     save_folder: 保存的目标路径# # 图像保存文件名：# # 返回值:#    返回0

图像的读取与保存

图像是由一个个像素点组成，像素点就是颜色点，而颜色最简单的方式就是用RGB或RGBA表示图像保存图像将像素信息按照一定格式，一定顺序（即编码） 存在硬盘上的二进制文件中保存图像需要以下必要信息：1. 文件…...

编程日记 2023/4/25 18:46:38

【蓝桥杯集训·每日一题】AcWing 4074. 铁路与公路

文章目录一、题目1、原题链接2、题目描述二、解题报告1、思路分析2、时间复杂度3、代码详解三、知识风暴Floyd 算法Spfa 算法一、题目 1、原题链接 4074. 铁路与公路 2、题目描述某国家有 n 个城市（编号 1∼n）和 m 条双向铁路。每条铁路连接两个不同的…...

编程日记 2023/4/25 18:46:36

网络：TCP与UDP相关知识（详细）

目录：1、UDP 和 TCP 的特点与区别2、UDP 、TCP 首部格式3、TCP 的三次握手和四次挥手4、TCP 的三次握手（为什么三次？）5、TCP 的四次挥手（为什么四次？）6、TCP 长连接和短连接的区别7、TCP粘包、拆…...

编程日记 2023/4/25 18:46:33

不好！有敌情，遭到XSS攻击【网络安全篇】

XSS：当一个目标的站点，被我们用户去访问，在渲染HTMl的过程中，出现了没有预期到的脚本指令，然后就会执行攻击者用各种方法注入并执行的恶意脚本，这个时候就会产生XSS。涉及方： 用户&#xff0…...

编程日记 2023/4/24 23:47:54

Mysql中Explain详解及索引的最佳实践1.Explan工具的介绍1.1 Explan 分析示例1.2 Explain中的列1.2.1 id1.2.2 select_type1.2.3 table1.2.4 partitions1.2.5 type1.2.6 possible_keys1.2.7 key1.2.8 key_len1.2.9 ref1.2.10 rows1.2.11 filtered1.2.12 Extra1.Explan工具的介绍…...

编程日记 2023/4/24 20:28:31

JavaScript 内的 this 指向

在 javascript 语言中, 有一个奇奇怪怪的 “关键字” 叫做 this为什么说它是奇奇怪怪呢, 是因为你写出 100 个 this, 可能有 100 个解释, 完全不挨边，但是, 在你的学习过程中, 搞清楚了 this 这个玩意, 那么会对你的开发生涯有很大帮助的，接下来咱们就…...

编程日记 2023/4/25 18:46:31

Java多种方法实现等待所有子线程完成再继续执行

简介在现实世界中，我们常常需要等待其它任务完成，才能继续执行下一步。Java实现等待子线程完成再继续执行的方式很多。我们来一一查看一下。 Thread的join方法该方法是Thread提供的方法，调用join()时，会阻塞主线程&#xff0…...

编程日记 2023/4/25 18:46:28

制造企业数字化工厂建设步骤的建议

随着工业4.0、中国制造2025的深度推进，越来越多的制造企业开始迈入智能制造的领域，那数字工厂要从何入手呢？ 数字工厂规划的核心，也正是信息域和物理域这两个维度，那就从这两个维度来进行分析，看如何进行数…...

编程日记 2023/4/25 18:46:26

网上鲜花交易平台，可运行

文章目录项目介绍一、项目功能介绍1、用户模块主要功能包括：2、商家模块主要功能包括：3、管理员模块主要功能包括：二、部分页面展示1、用户模块部分功能页面展示2、商家模块部分功能页面展示3、管理员模块部分功能页面展示三、部分源码四、底…...

编程日记 2023/4/25 18:46:23

【实战】用 Custom Hook + TS泛型实现 useArray

文章目录一、题目二、答案（非标准）三、关键知识点1.Custom Hook关键点案例useMountuseDebounce2.TS 泛型关键点一、题目完善自定义 Hook —— useArray ，使其能够完成 tryUseArray 组件中测试的功能： 入参：数组返回…...

编程日记 2023/4/25 18:46:20

【LeetCode】剑指 Offer（18）

目录题目：剑指 Offer 35. 复杂链表的复制 - 力扣（Leetcode） 题目的接口： 解题思路： 代码： 过啦！！！ 写在最后： 题目：剑指 Offer 35. 复杂链…...

编程日记 2023/4/25 18:46:18

Kubernetes节点运行时从Docker切换到Containerd

由于k8s将于1.24版本弃用dockershim，所以最近在升级前把本地的k8s切换到了Containerd运行时，目前我的k8s版本是1.22.5，一个master，二个Node的配置，以下做为一个操作记录日志整理，其它可以参考官网文档。在…...

编程日记 2023/4/25 18:46:15

【编程基础之Python】12、Python中的语句

【编程基础之Python】12、Python中的语句Python中的语句赋值语句条件语句循环语句for循环while循环continue语句break语句continue与break的区别函数语句pass语句异常处理语句结论Python中的语句 Python是一种高级编程语言，具有简单易学的语法，适用于各…...

编程日记 2023/4/25 18:46:13

android h5餐饮管理系统myeclipse开发mysql数据库编程服务端java计算机程序设计

一、源码特点 android h5餐饮管理系统是一套完善的WEBandroid设计系统，对理解JSP java，安卓app编程开发语言有帮助（系统采用web服务端APP端综合模式进行设计开发），系统具有完整的源代码和数据库，系统主要…...

编程日记 2023/4/25 18:46:10

容易混淆的嵌入式(Embedded)术语

因为做嵌入式开发工作虽然跳不出电子行业，但还是能接触到跨度较大的不同行当，身处不同的圈子。诸如医疗，银行，车载，工业；亦或者手机，PC，专用芯片；甚至可能横跨系统开发、…...

编程日记 2023/4/25 18:46:08

Nodejs 中 JSON 和 YAML 互相转换

JSON 转换成 YAML 1. 安装 js-yaml 库: npm install js-yaml2. 在程序中引入依赖库 const yaml require(js-yaml);3. 创建一个 js 对象, 代表 json 数据 const jsonData {name: John,age: 30,city: New York };4. 使用 yaml.dump() 把 js 对象转换成 YAML, 返回 YAML 字符…...

编程日记 2023/4/25 18:46:05

C++入门教程｜｜C++ 修饰符类型｜｜C++ 存储类

C 修饰符类型 C 允许在 char、int 和 double 数据类型前放置修饰符。修饰符用于改变基本类型的含义，所以它更能满足各种情境的需求。下面列出了数据类型修饰符： signedunsignedlongshort 修饰符 signed、unsigned、long 和 short 可应用于整型&#…...

编程日记 2023/4/25 18:46:02

Android开发面试：Java知识答案精解

目录 Java 集合集合概述 HashMap ConcurrentHashMap 泛型反射注解 IO流异常、深浅拷贝与Java8新特性 Java异常深浅拷贝 Java8新特性并发线程线程池锁 volatile JVM 内存区域内存模型类加载机制垃圾回收机制如何判断对象已死 Java 集合 …...

编程日记 2023/4/26 6:21:33

Windows上一款特别好用的画图软件

安装废话不多说，打开windows的应用商店，搜索draw.io，点击获取即可。画图 draw.io的布局左边是各种图形组件，中间是画布，右边是属性设置，文件扩展名是.drawio。点击左边列表中的图形可以将它添加到画…...

编程日记 2023/4/26 2:45:14

html--学习

javascrapt交互，网页控制JavaScript：改变 HTML 图像本例会动态地改变 HTML <image> 的来源（src）：点亮灯泡<script>function changeImage() {elementdocument.getElementById(myimage) #内存变量&#xff0…...

编程日记 2023/4/26 2:45:12

Day131 | 灵神 | 回溯算法 | 子集型子集

Day131 | 灵神 | 回溯算法 | 子集型子集 78.子集 78. 子集 - 力扣（LeetCode） 思路： 笔者写过很多次这道题了，不想写题解了，大家看灵神讲解吧回溯算法套路①子集型回溯【基础算法精讲 14】_哔哩哔哩_bilibili 完…...

编程新知 2026/1/23 12:37:51

python/java环境配置

环境变量放一起 python： 1.首先下载Python Python下载地址：Download Python | Python.org downloads ---windows -- 64 2.安装Python 下面两个，然后自定义，全选可以把前4个选上 3.环境配置 1）搜高级系统设置 2…...

编程新知 2026/2/9 15:41:39

Vue2 第一节_Vue2上手_插值表达式{{}}_访问数据和修改数据_Vue开发者工具

文章目录 1.Vue2上手-如何创建一个Vue实例,进行初始化渲染2. 插值表达式{{}}3. 访问数据和修改数据4. vue响应式5. Vue开发者工具--方便调试 1.Vue2上手-如何创建一个Vue实例,进行初始化渲染准备容器引包创建Vue实例 new Vue()指定配置项 ->渲染数据准备一个容器,例如: …...

编程新知 2026/2/7 10:59:19

postgresql|数据库|只读用户的创建和删除（备忘）

CREATE USER read_only WITH PASSWORD 密码 -- 连接到xxx数据库 \c xxx -- 授予对xxx数据库的只读权限 GRANT CONNECT ON DATABASE xxx TO read_only; GRANT USAGE ON SCHEMA public TO read_only; GRANT SELECT ON ALL TABLES IN SCHEMA public TO read_only; GRANT EXECUTE O…...

编程新知 2025/9/18 19:34:22

汇编常见指令

汇编常见指令一、数据传送指令指令功能示例说明MOV数据传送MOV EAX, 10将立即数 10 送入 EAXMOV [EBX], EAX将 EAX 值存入 EBX 指向的内存LEA加载有效地址LEA EAX, [EBX4]将 EBX4 的地址存入 EAX（不访问内存）XCHG交换数据XCHG EAX, EBX交换 EAX 和 EB…...

编程新知 2026/1/23 2:04:44

Redis数据倾斜问题解决

Redis 数据倾斜问题解析与解决方案什么是 Redis 数据倾斜 Redis 数据倾斜指的是在 Redis 集群中，部分节点存储的数据量或访问量远高于其他节点，导致这些节点负载过高，影响整体性能。数据倾斜的主要表现部分节点内存使用率远高于其他节…...

编程新知 2026/1/27 19:28:11

基于TurtleBot3在Gazebo地图实现机器人远程控制

1. TurtleBot3环境配置 # 下载TurtleBot3核心包 mkdir -p ~/catkin_ws/src cd ~/catkin_ws/src git clone -b noetic-devel https://github.com/ROBOTIS-GIT/turtlebot3.git git clone -b noetic https://github.com/ROBOTIS-GIT/turtlebot3_msgs.git git clone -b noetic-dev…...

编程新知 2026/2/6 11:54:58