当前位置：首页 > news >正文

[python-opencv] PNG 裁切物体

news 2026/2/10 17:53:09

拿到一组图PNG的图，边缘有点太宽了，需要裁切一下，为了这个需求，简单复习一下基本语法。

1. 读取PNG的4个通道

image = cv.imread(image_path, cv.IMREAD_UNCHANGED)

附参数说明：

IMREAD_UNCHANGED = -1	返回的数据带有alpha通道（R,G,B,A 四个通道），否则没有alpha通道
IMREAD_GRAYSCALE = 0	将图像转换为单通道灰度图像
IMREAD_COLOR = 1	将图像转换成3通道BGR彩色图像
IMREAD_ANYDEPTH = 2	在输入具有相应深度时返回16位/32位图像，否则将其转换为8位
IMREAD_ANYCOLOR = 4	图像可能以任何颜色格式读取
IMREAD_LOAD_GDAL = 8	使用gdal驱动程序加载图像
IMREAD_REDUCED_GRAYSCALE_2 = 16	将图像转换为单通道灰度图像且图像大小减少1/2
IMREAD_REDUCED_COLOR_2 = 17	将图像转换为3通道BGR彩色图像且图像大小减少1/2
IMREAD_REDUCED_GRAYSCALE_4 = 32	将图像转换为单通道灰度图像且图像大小减少1/4
IMREAD_REDUCED_COLOR_4 = 33	将图像转换为3通道BGR彩色图像且图像大小减少1/4
IMREAD_REDUCED_GRAYSCALE_8 = 64	将图像转换为单通道灰度图像且图像大小减少1/8
IMREAD_REDUCED_COLOR_8 = 65	将图像转换为3通道BGR彩色图像且图像大小减少1/8
IMREAD_IGNORE_ORIENTATION = 128	不会根据EXIF的方向标志旋转图像

2. 遍历文件夹获取每个图像文件：

def traverse_folder(folder_path):for root, dirs, files in os.walk(folder_path):for file in files:# 文件的绝对路径file_path = os.path.join(root, file)print(file_path)

3. 找到PNG中物体的ROI：

def findROI(img_path):image = cv.imread(img_path)gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)# 获取图像的宽高通道height, width, channels = image.shape# 进行边缘检测edges = cv.Canny(gray, 50, 255)xmin = width - 1ymin = height - 1xmax = 0ymax = 0for i in range(width):for j in range(height):if edges[j, i] != 0:if xmin > i:xmin = iif xmax < i:xmax = iif ymin > j:ymin = jif ymax < j:ymax = jprint("width : ", xmax - xmin)print("height : ", ymax - ymin)return xmin,xmax,ymin,ymax

4. 遍历文件夹将jpg转PNG


def traverse_folder_convertJPGtoPNG(folder_path, output_path):for root, dirs, files in os.walk(folder_path):for file in files:# 文件的绝对路径file_path = os.path.join(root, file)print(file_path)# 获取没有后缀的文件名filename_without_extension = os.path.splitext(file)[0]print(filename_without_extension)#print(output_path + '/' + filename_without_extension + '.png')jpg_to_png(file_path, output_path + '/' + filename_without_extension + '.png')def jpg_to_png(jpg_path, png_path):img = Image.open(jpg_path)  # 打开jpg文件img.save(png_path, 'PNG')  # 保存为png文件

5. 按照指定ROI图像获取图像区域并保存


def cropbysize_and_save_image(image_path, output_path, outputWidth,outputHeight):image = cv.imread(image_path, cv.IMREAD_UNCHANGED)height, width, channels = image.shapeprint("图像宽度:", width)print("图像高度:", height)print("图像频道:", channels)ymin=math.floor(height*0.5-outputHeight*0.5)ymax=math.ceil(height*0.5+outputHeight*0.5)xmin=math.floor(width*0.5-outputWidth*0.5)xmax=math.ceil(width*0.5+outputWidth*0.5)cropped_image = image[ymin:ymax, xmin:xmax]# 保存为png文件cv.imwrite(output_path, cropped_image, [int(cv.IMWRITE_PNG_STRATEGY_DEFAULT), 9])

6. 按照问题所在ROI获取图像区域

def crop_and_save_image(image_path, output_path):image = cv.imread(image_path, cv.IMREAD_UNCHANGED)gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)height, width, channels = image.shapeedges = cv.Canny(gray, 50, 255)print(edges)xmin = width - 1ymin = height - 1xmax = 0ymax = 0for i in range(width):for j in range(height):if edges[j,i] != 0:if xmin > i:xmin = iif xmax < i:xmax = iif ymin > j:ymin = jif ymax < j:ymax = jcropped_image = image[ymin-2:ymax+2, xmin-2:xmax+2]cv.imwrite(output_path,cropped_image, [int(cv.IMWRITE_PNG_STRATEGY_DEFAULT), 9])

Imwrite参数说明

IMWRITE_JPEG_QUALITY	对于JPEG，它可以是从0到100的质量（越高越好）。默认值是95。
IMWRITE_JPEG_PROGRESSIVE	启用JPEG功能，0或1，默认为False。
IMWRITE_JPEG_OPTIMIZE	启用JPEG功能，0或1，默认为False。
IMWRITE_JPEG_RST_INTERVAL	JPEG重新启动间隔，0 - 65535，默认为0 - 不重新启动。
IMWRITE_JPEG_LUMA_QUALITY	单独的亮度质量等级，0 - 100，默认为0 - 不使用。
IMWRITE_JPEG_CHROMA_QUALITY	独立的色度质量等级，0 - 100，默认为0 - 不使用。
IMWRITE_PNG_COMPRESSION	对于PNG，它可以是从0到9的压缩级别。较高的值意味着较小的尺寸和较长的压缩时间。默认值是3。
IMWRITE_PNG_STRATEGY	cv :: ImwritePNGFlags之一，默认为IMWRITE_PNG_STRATEGY_DEFAULT。
IMWRITE_PNG_BILEVEL	二进制级PNG，0或1，默认为0。
IMWRITE_PXM_BINARY	对于PPM，PGM或PBM，它可以是二进制格式标志，0或1.默认值为1。
IMWRITE_WEBP_QUALITY	对于WEBP，它可以是从1到100的质量（越高越好）。默认情况下（没有任何参数），质量超过100的情况下使用无损压缩。
IMWRITE_PAM_TUPLETYPE	对于PAM，将TUPLETYPE字段设置为为格式定义的相应字符串值。
IMWRITE_TIFF_RESUNIT	对于TIFF，用于指定要设置的DPI分辨率单位; 请参阅libtiff文档以获取有效值。
IMWRITE_TIFF_XDPI	对于TIFF，用于指定X方向DPI。
IMWRITE_TIFF_YDPI	对于TIFF，用于指定Y方向DPI。
IMWRITE_TIFF_COMPRESSION	对于TIFF，用于指定图像压缩方案。请参阅libtiff以获取与压缩格式对应的整数常量。注意，对于深度为CV_32F的图像，仅使用libtiff的SGILOG压缩方案。对于其他支持的深度，可以通过此标志指定压缩方案; LZW压缩是默认值。
IMWRITE_JPEG2000_COMPRESSION_X1000	对于JPEG2000，用于指定目标压缩率（乘以1000）。该值可以是0到1000.默认值是1000

[python-opencv] PNG 裁切物体

拿到一组图PNG的图，边缘有点太宽了，需要裁切一下，为了这个需求，简单复习一下基本语法。 1. 读取PNG的4个通道 image cv.imread(image_path, cv.IMREAD_UNCHANGED) 附参数说明： IMREAD_UNCHANGED -1 返…...

编程日记 2024/2/11 1:24:01

机器学习——有监督学习和无监督学习

有监督学习简单来说，就是人教会计算机学会做一件事。给算法一个数据集，其中数据集中包含了正确答案，根据这个数据集，可以对额外的数据希望得到一个正确判断（详见下面的例子） 回归问题例如现在有一个…...

编程日记 2024/2/11 1:19:57

MySQL单主模式部署组复制集群

前言本篇文章介绍MySQL8.0.27版本的组复制详细搭建过程，教你如何快速搭建一个三节点的单主模式组复制集群。实际上，MySQL组复制是MySQL的一个插件 group_replication.so，组中的每个成员都需要配置并安装该插件，配置和安装过程…...

编程日记 2024/2/11 1:18:56

【大厂AI课学习笔记】【1.5 AI技术领域】（10）对话系统

对话系统，Dialogue System，也称为会话代理。是一种模拟人类与人交谈的计算机系统，旨在可以与人类形成连贯通顺的对话，通信方式主要有语音/文本/图片，当然也可以手势/触觉等其他方式一般我们将对话系统，分…...

编程日记 2024/2/11 1:12:49

【ARM 嵌入式编译系列 2.7 -- GCC 编译优化参数详细介绍】

请阅读【嵌入式开发学习必备专栏】文章目录 GCC 编译优化概述常用优化等级-O1 打开的优化选项-O2 打开的优化选项-O3 打开的优化选项-Os 打开的优化选项优化技术使用优化选项的注意事项GCC 编译优化概述 GCC（GNU Compiler Collection）包含了用于C、C++、Objective-C、Fort…...

编程日记 2024/2/11 1:02:38

《剑指 Offer》专项突破版 - 面试题 38、39 和 40 : 通过三道面试题详解单调栈（C++ 实现）

目录面试题 38 : 每日温度面试题 39 : 直方图最大矩形面积方法一、暴力求解方法二、递归求解方法三、单调栈法面试题 40 : 矩阵中的最大矩形面试题 38 : 每日温度题目： 输入一个数组，它的每个数字是某天的温度。请计算每天需要等几天才会…...

编程日记 2024/2/11 1:00:37

动态规划C语言

#include <stdio.h> #include <stdlib.h> //0-1背包问题是一种经典的组合优化问题， //问题描述为：有一个给定容量的背包和一组具有不同价值和重量的物品，如何选择物品放入背包中，以使得背包中物品的总价值最大化&…...

编程日记 2024/2/11 0:56:32

基于微信小程序的校园二手交易平台

博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇…...

编程日记 2024/2/11 0:51:26

K8S系列文章之 [使用 Alpine 搭建 k3s]

官方文档：K3s - 轻量级 Kubernetes | K3s 官方描述，可运行在 systemd 或者 openrc 环境上，那就往精简方向走，使用 alpine 做系统。与 RHEL、Debian 的区别，主要在防火墙侧；其他基础配置需求类似&#xff0…...

编程日记 2024/2/11 0:50:25

计算机视觉 | OpenCV 实现手势虚拟控制亮度和音量

Hi，大家好，我是半亩花海。在当今科技飞速发展的时代，我们身边充斥着各种智能设备，然而，如何更便捷地与这些设备进行交互却是一个不断被探索的课题。本文将主要介绍一个基于 OpenCV 的手势识别项目，通过手势…...

编程日记 2024/2/11 0:49:24

python28-Python的运算符之三目运算符

Python可通过if语句来实现三目运算符的功能，因此可以近似地把这种if语句当成三目运算符。作为三目运算符的f语句的语法格式如下 True_statements if expression else False_statements 三目运算符的规则是:先对逻辑表达式expression求值，如果逻辑表达式…...

编程日记 2024/2/11 0:47:21

高德 API 10009

问题笔者使用高德地图所提供的API接口，访问接口报错 {"info":"USERKEY_PLAT_NOMATCH","infocode":"10009","status":"0","sec_code_debug":"d41d8cd98f00b204e9800998ecf8427e"…...

编程日记 2024/2/11 0:43:16

Go 语言中如何大小端字节序？int 转 byte 是如何进行的？

嗨，大家好！我是波罗学。本文是系列文章 Go 技巧第十五篇，系列文章查看：Go 语言技巧。我们先看这样一个问题：“Go 语言中，将 byte 转换为 int 时是否涉及字节序（endianness）&#x…...

编程日记 2024/2/11 0:42:15

论文阅读——MP-Former

MP-Former: Mask-Piloted Transformer for Image Segmentation https://arxiv.org/abs/2303.07336 mask2former问题是：相邻层得到的掩码不连续，差别很大 denoising training非常有效地稳定训练时期之间的二分匹配。去噪训练的关键思想是将带噪声的GT坐标…...

编程日记 2024/2/11 0:40:13

JPEG图像的压缩标准（1）

分3个博客详细介绍JPEG图像的压缩标准，包含压缩和解压缩流程，熵编码过程和文件存储格式。一、JPEG压缩标准概述 JPEG压缩标准由国际标准化组织 (International Organization for Standardization, ISO) 制订，用于静态图像压缩。JPEG标准包…...

编程日记 2024/2/11 0:39:12

数解 transformer 之 self attention transformer 公式整理

句子长度为n；比如2048，或1024，即，一句话最多可以是1024个单词。 1, 位置编码可知，E是由n个列向量组成的矩阵，每个列向量表示该列号的位置编码向量。 2, 输入向量加入本句话第一个单词的词嵌入向量是, 第…...

编程日记 2024/2/11 0:37:10

ubuntu22.04@laptop OpenCV Get Started

ubuntu22.04laptop OpenCV Get Started 1. 源由2. 步骤3. 预期&展望4. 参考资料 1. 源由 OpenCV在学校的时候接触过，不过当时专注在物理、研究方面，没有好好的学习下。这次借后续视频分析刚性需求，对OpenCV做个入门的学习和研读&#…...

编程日记 2024/2/11 0:34:06

【Java】苍穹外卖 Day01

苍穹外卖-day01 课程内容软件开发整体介绍苍穹外卖项目介绍开发环境搭建导入接口文档Swagger 项目整体效果展示： 管理端-外卖商家使用用户端-点餐用户使用当我们完成该项目的学习，可以培养以下能力： 1. 软件开发整体介绍作为一名软件开…...

编程日记 2024/2/11 0:20:53

Ivanti Pulse Connect Secure VPN SSRF(CVE-2023-46805)漏洞

免责声明：文章来源互联网收集整理，请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失，均由使用者本人负责，所产生的一切不良后果与文章作者无关。该…...

编程日记 2024/2/11 0:19:52

GPT-4：比ChatGPT3.5好得多，但它有多好你知道么？

GPT-4简介 GPT-4是一款由OpenAI开发的人工智能语言模型，它是ChatGPT3.5的升级版。GPT-4拥有更强大的学习能力、更高的生成质量和更广泛的知识覆盖范围，被誉为人工智能技术的重要突破。 GPT-4与ChatGPT3.5的对比 1. 学习能力 GPT-4采用了更多的神经网…...

编程日记 2024/2/11 0:18:51

龙虎榜——20250610

上证指数放量收阴线，个股多数下跌，盘中受消息影响大幅波动。深证指数放量收阴线形成顶分型，指数短线有调整的需求，大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技代表标的：御银股份、雄帝科技驱动…...

编程新知 2026/2/8 15:03:06

网络六边形受到攻击

大家读完觉得有帮助记得关注和点赞！！！ 抽象现代智能交通系统 （ITS） 的一个关键要求是能够以安全、可靠和匿名的方式从互联车辆和移动设备收集地理参考数据。Nexagon 协议建立在 IETF 定位器/ID 分离协议 （…...

编程新知 2026/2/8 5:22:04

前端倒计时误差!

提示：记录工作中遇到的需求及解决办法文章目录前言一、误差从何而来？二、五大解决方案1. 动态校准法（基础版）2. Web Worker 计时3. 服务器时间同步4. Performance API 高精度计时5. 页面可见性API优化三、生产环境最佳实践四、终极解决方案架构前言前几天听说公司某个项…...

编程新知 2025/9/8 23:14:43

1.创建ts文件路径：src/utils/timer.ts 完整代码： import { onUnmounted } from vuetype TimerCallback (...args: any[]) > voidexport function useGlobalTimer() {const timers: Map<number, NodeJS.Timeout> new Map()// 创建定时器con…...

编程新知 2025/8/9 0:31:20

【HTML-16】深入理解HTML中的块元素与行内元素

HTML元素根据其显示特性可以分为两大类：块元素(Block-level Elements)和行内元素(Inline Elements)。理解这两者的区别对于构建良好的网页布局至关重要。本文将全面解析这两种元素的特性、区别以及实际应用场景。 1. 块元素(Block-level Elements) 1.1 基本特性 …...

编程新知 2025/11/11 6:28:42

Redis数据倾斜问题解决

Redis 数据倾斜问题解析与解决方案什么是 Redis 数据倾斜 Redis 数据倾斜指的是在 Redis 集群中，部分节点存储的数据量或访问量远高于其他节点，导致这些节点负载过高，影响整体性能。数据倾斜的主要表现部分节点内存使用率远高于其他节…...

编程新知 2026/1/27 19:28:11

AI书签管理工具开发全记录（十九）：嵌入资源处理

1.前言 📝 在上一篇文章中，我们完成了书签的导入导出功能。本篇文章我们研究如何处理嵌入资源，方便后续将资源打包到一个可执行文件中。 2.embed介绍 🎯 Go 1.16 引入了革命性的 embed 包，彻底改变了静态资源管理的…...

编程新知 2026/1/30 16:24:23

C# 求圆面积的程序（Program to find area of a circle）

给定半径r，求圆的面积。圆的面积应精确到小数点后5位。例子： 输入：r 5 输出：78.53982 解释：由于面积 PI * r * r 3.14159265358979323846 * 5 * 5 78.53982，因为我们只保留小数点后 5 位数字。输…...

编程新知 2026/2/8 9:34:11

【生成模型】视频生成论文调研

工作清单上游应用方向：控制、速度、时长、高动态、多主体驱动类型工作基础模型WAN / WAN-VACE / HunyuanVideo控制条件轨迹控制ATI~镜头控制ReCamMaster~多主体驱动Phantom~音频驱动Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation速…...

编程新知 2025/9/9 8:40:47

安宝特方案丨船舶智造的“AR+AI+作业标准化管理解决方案”（装配）

船舶制造装配管理现状：装配工作依赖人工经验，装配工人凭借长期实践积累的操作技巧完成零部件组装。企业通常制定了装配作业指导书，但在实际执行中，工人对指导书的理解和遵循程度参差不齐。船舶装配过程中的挑战与需求挑战 (1…...

编程新知 2026/2/6 2:16:18

[python-opencv] PNG 裁切物体

Imwrite参数说明

相关文章：

[python-opencv] PNG 裁切物体

机器学习——有监督学习和无监督学习

MySQL单主模式部署组复制集群

【大厂AI课学习笔记】【1.5 AI技术领域】（10）对话系统

【ARM 嵌入式编译系列 2.7 -- GCC 编译优化参数详细介绍】

《剑指 Offer》专项突破版 - 面试题 38、39 和 40 : 通过三道面试题详解单调栈（C++ 实现）

动态规划C语言

基于微信小程序的校园二手交易平台

K8S系列文章之 [使用 Alpine 搭建 k3s]

计算机视觉 | OpenCV 实现手势虚拟控制亮度和音量

python28-Python的运算符之三目运算符

高德 API 10009

Go 语言中如何大小端字节序？int 转 byte 是如何进行的？

论文阅读——MP-Former

JPEG图像的压缩标准（1）

数解 transformer 之 self attention transformer 公式整理

ubuntu22.04@laptop OpenCV Get Started

【Java】苍穹外卖 Day01

Ivanti Pulse Connect Secure VPN SSRF(CVE-2023-46805)漏洞

GPT-4：比ChatGPT3.5好得多，但它有多好你知道么？

龙虎榜——20250610

网络六边形受到攻击

前端倒计时误差!

vue3 定时器-定义全局方法 vue+ts

【HTML-16】深入理解HTML中的块元素与行内元素

Redis数据倾斜问题解决

AI书签管理工具开发全记录（十九）：嵌入资源处理

C# 求圆面积的程序（Program to find area of a circle）

【生成模型】视频生成论文调研

安宝特方案丨船舶智造的“AR+AI+作业标准化管理解决方案”（装配）