当前位置: 首页 > news >正文

[python-opencv] PNG 裁切物体

拿到一组图PNG的图,边缘有点太宽了,需要裁切一下,为了这个需求,简单复习一下基本语法。

1.  读取PNG的4个通道

image = cv.imread(image_path, cv.IMREAD_UNCHANGED)

参数说明

IMREAD_UNCHANGED            = -1 

返回的数据带有alpha通道(R,G,B,A 四个通道),否则没有alpha通道

IMREAD_GRAYSCALE            = 0  

将图像转换为单通道灰度图像

IMREAD_COLOR                = 1  

将图像转换成3通道BGR彩色图像

IMREAD_ANYDEPTH             = 2  

在输入具有相应深度时返回16位/32位图像,否则将其转换为8位

IMREAD_ANYCOLOR             = 4  

图像可能以任何颜色格式读取

IMREAD_LOAD_GDAL            = 8 

 使用gdal驱动程序加载图像

IMREAD_REDUCED_GRAYSCALE_2  = 16

 将图像转换为单通道灰度图像且图像大小减少1/2

IMREAD_REDUCED_COLOR_2      = 17 

将图像转换为3通道BGR彩色图像且图像大小减少1/2

IMREAD_REDUCED_GRAYSCALE_4  = 32

 将图像转换为单通道灰度图像且图像大小减少1/4

IMREAD_REDUCED_COLOR_4      = 33 

将图像转换为3通道BGR彩色图像且图像大小减少1/4

IMREAD_REDUCED_GRAYSCALE_8  = 64

 将图像转换为单通道灰度图像且图像大小减少1/8

IMREAD_REDUCED_COLOR_8      = 65 

将图像转换为3通道BGR彩色图像且图像大小减少1/8

IMREAD_IGNORE_ORIENTATION   = 128

不会根据EXIF的方向标志旋转图像

2. 遍历文件夹获取每个图像文件:

def traverse_folder(folder_path):for root, dirs, files in os.walk(folder_path):for file in files:# 文件的绝对路径file_path = os.path.join(root, file)print(file_path)

3. 找到PNG中物体的ROI:

def findROI(img_path):image = cv.imread(img_path)gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)# 获取图像的宽高通道height, width, channels = image.shape# 进行边缘检测edges = cv.Canny(gray, 50, 255)xmin = width - 1ymin = height - 1xmax = 0ymax = 0for i in range(width):for j in range(height):if edges[j, i] != 0:if xmin > i:xmin = iif xmax < i:xmax = iif ymin > j:ymin = jif ymax < j:ymax = jprint("width : ", xmax - xmin)print("height : ", ymax - ymin)return xmin,xmax,ymin,ymax

4. 遍历文件夹将jpg转PNG


def traverse_folder_convertJPGtoPNG(folder_path, output_path):for root, dirs, files in os.walk(folder_path):for file in files:# 文件的绝对路径file_path = os.path.join(root, file)print(file_path)# 获取没有后缀的文件名filename_without_extension = os.path.splitext(file)[0]print(filename_without_extension)#print(output_path + '/' + filename_without_extension + '.png')jpg_to_png(file_path, output_path + '/' + filename_without_extension + '.png')def jpg_to_png(jpg_path, png_path):img = Image.open(jpg_path)  # 打开jpg文件img.save(png_path, 'PNG')  # 保存为png文件

5. 按照指定ROI图像获取图像区域并保存


def cropbysize_and_save_image(image_path, output_path, outputWidth,outputHeight):image = cv.imread(image_path, cv.IMREAD_UNCHANGED)height, width, channels = image.shapeprint("图像宽度:", width)print("图像高度:", height)print("图像频道:", channels)ymin=math.floor(height*0.5-outputHeight*0.5)ymax=math.ceil(height*0.5+outputHeight*0.5)xmin=math.floor(width*0.5-outputWidth*0.5)xmax=math.ceil(width*0.5+outputWidth*0.5)cropped_image = image[ymin:ymax, xmin:xmax]# 保存为png文件cv.imwrite(output_path, cropped_image, [int(cv.IMWRITE_PNG_STRATEGY_DEFAULT), 9])  

6. 按照问题所在ROI获取图像区域

def crop_and_save_image(image_path, output_path):image = cv.imread(image_path, cv.IMREAD_UNCHANGED)gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)height, width, channels = image.shapeedges = cv.Canny(gray, 50, 255)print(edges)xmin = width - 1ymin = height - 1xmax = 0ymax = 0for i in range(width):for j in range(height):if edges[j,i] != 0:if xmin > i:xmin = iif xmax < i:xmax = iif ymin > j:ymin = jif ymax < j:ymax = jcropped_image = image[ymin-2:ymax+2, xmin-2:xmax+2]cv.imwrite(output_path,cropped_image, [int(cv.IMWRITE_PNG_STRATEGY_DEFAULT), 9]) 

Imwrite参数说明

IMWRITE_JPEG_QUALITY

对于JPEG,它可以是从0到100的质量(越高越好)。默认值是95。

IMWRITE_JPEG_PROGRESSIVE

启用JPEG功能,0或1,默认为False。

IMWRITE_JPEG_OPTIMIZE

启用JPEG功能,0或1,默认为False。

IMWRITE_JPEG_RST_INTERVAL

JPEG重新启动间隔,0 - 65535,默认为0 - 不重新启动。

IMWRITE_JPEG_LUMA_QUALITY

单独的亮度质量等级,0 - 100,默认为0 - 不使用。

IMWRITE_JPEG_CHROMA_QUALITY

独立的色度质量等级,0 - 100,默认为0 - 不使用。

IMWRITE_PNG_COMPRESSION

对于PNG,它可以是从0到9的压缩级别。较高的值意味着较小的尺寸和较长的压缩时间。默认值是3。

IMWRITE_PNG_STRATEGY

cv :: ImwritePNGFlags之一,默认为IMWRITE_PNG_STRATEGY_DEFAULT。

IMWRITE_PNG_BILEVEL

二进制级PNG,0或1,默认为0。

IMWRITE_PXM_BINARY

对于PPM,PGM或PBM,它可以是二进制格式标志,0或1.默认值为1。

IMWRITE_WEBP_QUALITY

对于WEBP,它可以是从1到100的质量(越高越好)。默认情况下(没有任何参数),质量超过100的情况下使用无损压缩。

IMWRITE_PAM_TUPLETYPE

对于PAM,将TUPLETYPE字段设置为为格式定义的相应字符串值。

IMWRITE_TIFF_RESUNIT

 对于TIFF,用于指定要设置的DPI分辨率单位; 请参阅libtiff文档以获取有效值。

IMWRITE_TIFF_XDPI

对于TIFF,用于指定X方向DPI。

IMWRITE_TIFF_YDPI

对于TIFF,用于指定Y方向DPI。

IMWRITE_TIFF_COMPRESSION

 对于TIFF,用于指定图像压缩方案。请参阅libtiff以获取与压缩格式对应的整数常量。注意,对于深度为CV_32F的图像,仅使用libtiff的SGILOG压缩方案。对于其他支持的深度,可以通过此标志指定压缩方案; LZW压缩是默认值。

IMWRITE_JPEG2000_COMPRESSION_X1000

对于JPEG2000,用于指定目标压缩率(乘以1000)。该值可以是0到1000.默认值是1000

相关文章:

[python-opencv] PNG 裁切物体

拿到一组图PNG的图&#xff0c;边缘有点太宽了&#xff0c;需要裁切一下&#xff0c;为了这个需求&#xff0c;简单复习一下基本语法。 1. 读取PNG的4个通道 image cv.imread(image_path, cv.IMREAD_UNCHANGED) 附参数说明&#xff1a; IMREAD_UNCHANGED -1 返…...

机器学习——有监督学习和无监督学习

有监督学习 简单来说&#xff0c;就是人教会计算机学会做一件事。 给算法一个数据集&#xff0c;其中数据集中包含了正确答案&#xff0c;根据这个数据集&#xff0c;可以对额外的数据希望得到一个正确判断&#xff08;详见下面的例子&#xff09; 回归问题 例如现在有一个…...

MySQL单主模式部署组复制集群

前言 本篇文章介绍MySQL8.0.27版本的组复制详细搭建过程&#xff0c;教你如何快速搭建一个三节点的单主模式组复制集群。 实际上&#xff0c;MySQL组复制是MySQL的一个插件 group_replication.so&#xff0c;组中的每个成员都需要配置并安装该插件&#xff0c;配置和安装过程…...

【大厂AI课学习笔记】【1.5 AI技术领域】(10)对话系统

对话系统&#xff0c;Dialogue System&#xff0c;也称为会话代理。是一种模拟人类与人交谈的计算机系统&#xff0c;旨在可以与人类形成连贯通顺的对话&#xff0c;通信方式主要有语音/文本/图片&#xff0c;当然也可以手势/触觉等其他方式 一般我们将对话系统&#xff0c;分…...

【ARM 嵌入式 编译系列 2.7 -- GCC 编译优化参数详细介绍】

请阅读【嵌入式开发学习必备专栏 】 文章目录 GCC 编译优化概述常用优化等级-O1 打开的优化选项-O2 打开的优化选项-O3 打开的优化选项-Os 打开的优化选项优化技术使用优化选项的注意事项GCC 编译优化概述 GCC(GNU Compiler Collection)包含了用于C、C++、Objective-C、Fort…...

《剑指 Offer》专项突破版 - 面试题 38、39 和 40 : 通过三道面试题详解单调栈(C++ 实现)

目录 面试题 38 : 每日温度 面试题 39 : 直方图最大矩形面积 方法一、暴力求解 方法二、递归求解 方法三、单调栈法 面试题 40 : 矩阵中的最大矩形 面试题 38 : 每日温度 题目&#xff1a; 输入一个数组&#xff0c;它的每个数字是某天的温度。请计算每天需要等几天才会…...

动态规划C语言

#include <stdio.h> #include <stdlib.h> //0-1背包问题是一种经典的组合优化问题&#xff0c; //问题描述为&#xff1a;有一个给定容量的背包和一组具有不同价值和重量的物品&#xff0c;如何选择物品放入背包中&#xff0c;以使得背包中物品的总价值最大化&…...

基于微信小程序的校园二手交易平台

博主介绍&#xff1a;✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专栏推荐订阅&#x1f447;…...

K8S系列文章之 [使用 Alpine 搭建 k3s]

官方文档&#xff1a;K3s - 轻量级 Kubernetes | K3s 官方描述&#xff0c;可运行在 systemd 或者 openrc 环境上&#xff0c;那就往精简方向走&#xff0c;使用 alpine 做系统。与 RHEL、Debian 的区别&#xff0c;主要在防火墙侧&#xff1b;其他基础配置需求类似&#xff0…...

计算机视觉 | OpenCV 实现手势虚拟控制亮度和音量

Hi&#xff0c;大家好&#xff0c;我是半亩花海。在当今科技飞速发展的时代&#xff0c;我们身边充斥着各种智能设备&#xff0c;然而&#xff0c;如何更便捷地与这些设备进行交互却是一个不断被探索的课题。本文将主要介绍一个基于 OpenCV 的手势识别项目&#xff0c;通过手势…...

python28-Python的运算符之三目运算符

Python可通过if语句来实现三目运算符的功能&#xff0c;因此可以近似地把这种if语句当成三目运算符。作为三目运算符的f语句的语法格式如下 True_statements if expression else False_statements 三目运算符的规则是:先对逻辑表达式expression求值&#xff0c;如果逻辑表达式…...

高德 API 10009

问题 笔者使用高德地图所提供的API接口&#xff0c;访问接口报错 {"info":"USERKEY_PLAT_NOMATCH","infocode":"10009","status":"0","sec_code_debug":"d41d8cd98f00b204e9800998ecf8427e"…...

Go 语言中如何大小端字节序?int 转 byte 是如何进行的?

嗨&#xff0c;大家好&#xff01;我是波罗学。 本文是系列文章 Go 技巧第十五篇&#xff0c;系列文章查看&#xff1a;Go 语言技巧。 我们先看这样一个问题&#xff1a;“Go 语言中&#xff0c;将 byte 转换为 int 时是否涉及字节序&#xff08;endianness&#xff09;&#x…...

论文阅读——MP-Former

MP-Former: Mask-Piloted Transformer for Image Segmentation https://arxiv.org/abs/2303.07336 mask2former问题是&#xff1a;相邻层得到的掩码不连续&#xff0c;差别很大 denoising training非常有效地稳定训练时期之间的二分匹配。去噪训练的关键思想是将带噪声的GT坐标…...

JPEG图像的压缩标准(1)

分3个博客详细介绍JPEG图像的压缩标准&#xff0c;包含压缩和解压缩流程&#xff0c;熵编码过程和文件存储格式。 一、JPEG压缩标准概述 JPEG压缩标准由国际标准化组织 (International Organization for Standardization, ISO) 制订&#xff0c;用于静态图像压缩。JPEG标准包…...

数解 transformer 之 self attention transformer 公式整理

句子长度为n&#xff1b;比如2048&#xff0c;或1024&#xff0c;即&#xff0c;一句话最多可以是1024个单词。 1, 位置编码 可知&#xff0c;E是由n个列向量组成的矩阵&#xff0c;每个列向量表示该列号的位置编码向量。 2, 输入向量 加入本句话第一个单词的词嵌入向量是, 第…...

ubuntu22.04@laptop OpenCV Get Started

ubuntu22.04laptop OpenCV Get Started 1. 源由2. 步骤3. 预期&展望4. 参考资料 1. 源由 OpenCV在学校的时候接触过&#xff0c;不过当时专注在物理、研究方面&#xff0c;没有好好的学习下。 这次借后续视频分析刚性需求&#xff0c;对OpenCV做个入门的学习和研读&#…...

【Java】苍穹外卖 Day01

苍穹外卖-day01 课程内容 软件开发整体介绍苍穹外卖项目介绍开发环境搭建导入接口文档Swagger 项目整体效果展示&#xff1a; 管理端-外卖商家使用用户端-点餐用户使用当我们完成该项目的学习&#xff0c;可以培养以下能力&#xff1a; 1. 软件开发整体介绍 作为一名软件开…...

Ivanti Pulse Connect Secure VPN SSRF(CVE-2023-46805)漏洞

免责声明&#xff1a;文章来源互联网收集整理&#xff0c;请勿利用文章内的相关技术从事非法测试&#xff0c;由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失&#xff0c;均由使用者本人负责&#xff0c;所产生的一切不良后果与文章作者无关。该…...

GPT-4:比ChatGPT3.5好得多,但它有多好你知道么?

GPT-4简介 GPT-4是一款由OpenAI开发的人工智能语言模型&#xff0c;它是ChatGPT3.5的升级版。GPT-4拥有更强大的学习能力、更高的生成质量和更广泛的知识覆盖范围&#xff0c;被誉为人工智能技术的重要突破。 GPT-4与ChatGPT3.5的对比 1. 学习能力 GPT-4采用了更多的神经网…...

设计饮用水水质饮用习惯监测程序,统计每日饮水量,提醒科学补水养成健康习惯。

饮用水水质与饮水习惯监测程序——基于日志与规则的健康行为实验系统一、实际应用场景描述在现代城市生活中&#xff0c;很多人存在以下问题&#xff1a;- 不清楚自己每天喝了多少水- 饮水时间集中在晚上或运动后- 长期饮水不足或过量- 对水质来源缺乏基本记录意识本项目的目标…...

中文BERT-wwm模型实战指南:3个关键步骤实现95%+准确率的AI模型部署

中文BERT-wwm模型实战指南&#xff1a;3个关键步骤实现95%准确率的AI模型部署 【免费下载链接】Chinese-BERT-wwm Pre-Training with Whole Word Masking for Chinese BERT&#xff08;中文BERT-wwm系列模型&#xff09; 项目地址: https://gitcode.com/gh_mirrors/ch/Chines…...

ViGEmBus虚拟游戏控制器驱动:从零开始掌握Windows手柄模拟技术

ViGEmBus虚拟游戏控制器驱动&#xff1a;从零开始掌握Windows手柄模拟技术 【免费下载链接】ViGEmBus Windows kernel-mode driver emulating well-known USB game controllers. 项目地址: https://gitcode.com/gh_mirrors/vi/ViGEmBus 想在Windows电脑上使用任意手柄玩…...

碳感知Transformer与硬件协同优化框架解析

1. CATransformers&#xff1a;碳感知Transformer与硬件协同优化框架解析在AI技术快速发展的今天&#xff0c;Transformer模型已成为自然语言处理、计算机视觉和多模态任务的核心架构。然而&#xff0c;这些模型的广泛部署带来了显著的碳排放问题——不仅包括训练和推理过程中的…...

G-Helper:华硕笔记本轻量化控制工具完整指南

G-Helper&#xff1a;华硕笔记本轻量化控制工具完整指南 【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Zenbook, Expertbook,…...

Vue 项目中 vis-network 点击节点不生效的问题排查:外层 transform 缩放导致坐标偏移

最近在 Vue3 项目中把一个原生 HTML 版知识图谱迁移成 Vue 组件。原始 HTML 使用 vis-network 实现节点关系图&#xff0c;点击节点可以正常展开下一级。但迁移到 Vue 项目后&#xff0c;图谱可以正常渲染&#xff0c;节点、连线、布局都没有问题&#xff0c;唯独点击节点时无法…...

AI微型赛车:从车道线检测到PID控制,手把手实现端侧自动驾驶

1. 项目概述&#xff1a;当AI遇见指尖上的速度与激情最近在创客圈和AI应用领域&#xff0c;一个结合了硬件、软件与智能算法的项目正悄然兴起&#xff0c;那就是“AI驱动的自动微型赛车”。这听起来像是科幻电影里的场景&#xff0c;但如今&#xff0c;借助开源硬件和成熟的机器…...

RAMba架构:RNN与稀疏注意力融合优化长文本处理

1. RAMba架构&#xff1a;RNN与稀疏注意力的创新融合在自然语言处理领域&#xff0c;处理长文本序列一直是个棘手的问题。传统Transformer架构虽然性能强大&#xff0c;但其注意力机制的计算复杂度与序列长度呈平方关系增长&#xff0c;这严重限制了模型处理长文本的能力。RAMb…...

多模态大模型 | GroundingDINO 架构解析与开放集检测实战

1. GroundingDINO的核心设计思想 GroundingDINO作为多模态大模型领域的创新成果&#xff0c;其最突出的特点是实现了视觉与语言模态的紧密融合&#xff08;Tight Fusion&#xff09;。这种设计理念贯穿于模型的三个关键组件&#xff1a;特征增强器&#xff08;Feature Enhancer…...

Person Blocker实战教程:10个创意用例教你玩转图片遮挡

Person Blocker实战教程&#xff1a;10个创意用例教你玩转图片遮挡 【免费下载链接】person-blocker Automatically "block" people in images (like Black Mirror) using a pretrained neural network. 项目地址: https://gitcode.com/gh_mirrors/pe/person-block…...