当前位置：首页 > news >正文

Python Opencv: 基于颜色提取的印章分割

news 2025/7/10 10:35:41

利用Python实现了一个图像处理功能，即批量提取图像中的印章区域；使用了颜色聚类的方法来提取颜色。

本代码也发布到了github，欢迎大家试用（如果帮助，请star一下）：

GitHub - AICVHub/seal_seg_opencv: pyhon opencv seal segpyhon opencv seal seg. Contribute to AICVHub/seal_seg_opencv development by creating an account on GitHub.https://github.com/AICVHub/seal_seg_opencv.git

1. 方法

2. 代码

3. 运行结果

1. 方法

K-means 聚类 (kmeans_color_quantization 函数): 通过将图像从BGR颜色空间转换到HSV颜色空间，并使用K-means聚类算法来找到图像中的主要颜色。K-means算法是一种无监督学习算法，用于将数据点划分为K个簇，使得每个数据点与其所属簇的中心距离之和最小。
颜色阈值 (extract_seal_with_kmeans 函数): 根据聚类得到的颜色中心，创建HSV颜色空间中的上下界限，以确定与印章颜色相似的像素范围。通过调整hue_threshold参数，可以控制颜色相似度的敏感度。
掩码生成: 使用cv2.inRange函数根据颜色阈值生成掩码，这些掩码用于识别图像中可能包含印章的区域。
掩码膨胀 (cv2.dilate 函数): 对生成的掩码进行膨胀操作，以填补印章区域中的小空洞或连接断裂的部分。
图像合成: 使用掩码提取印章区域，并将其与原图结合在一个透明的背景上。这里使用了PIL库（Python Imaging Library）来处理图像的透明度和合成。
批量处理 (batch_extract_seals_with_dominant_color 函数): 遍历指定文件夹中的所有图像，对每个图像执行印章提取和合成操作，并将结果保存到另一个文件夹。

2. 代码

import cv2
import numpy as np
import os
from sklearn.cluster import KMeans
from PIL import Imagedef kmeans_color_quantization(hsv_image, k=2):"""使用 K-means 聚类找到图像中的主要颜色。"""# 重新调整图像大小以加速聚类过程resized_image = cv2.resize(hsv_image, (0, 0), fx=0.5, fy=0.5)# 将图像数据转换为二维数组，每行是一个像素的 HSV 值reshaped_image = resized_image.reshape(-1, 3)# 应用 K-means 聚类kmeans = KMeans(n_clusters=k)kmeans.fit(reshaped_image)# 返回聚类中心return kmeans.cluster_centers_def extract_seal_with_kmeans(image_path, output_path, k=4, hue_threshold=15):image = cv2.imread(image_path)if image is None:print(f"Image not found at {image_path}")returnhsv_image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)dominant_colors = kmeans_color_quantization(hsv_image, k=k)masks = []for color in dominant_colors:lower_color = np.array([color[0] - hue_threshold, 100, 100])upper_color = np.array([color[0] + hue_threshold, 255, 255])mask = cv2.inRange(hsv_image, lower_color, upper_color)masks.append(mask)combined_mask = cv2.bitwise_or(masks[0], masks[1]) if len(masks) > 1 else masks[0]# 膨胀掩码kernel = np.ones((3, 3), np.uint8)final_mask = cv2.dilate(combined_mask, kernel, iterations=1)# 提取印章区域seal = cv2.bitwise_and(image, image, mask=final_mask)# 将OpenCV图像转换为PIL图像original_image = Image.open(image_path).convert('RGBA')seal_pil = Image.fromarray(cv2.cvtColor(seal, cv2.COLOR_BGR2RGBA)).convert('RGBA')# 计算新图像的宽度，原图宽度加上印章区域宽度original_width, original_height = original_image.sizeseal_width, seal_height = seal_pil.sizenew_width = original_width + seal_widthnew_height = max(original_height, seal_height)# 创建一个全透明的图像，用于左右拼接transparent_background = Image.new('RGBA', (new_width, new_height), (0, 0, 0, 0))# 将原图粘贴到透明背景上transparent_background.paste(original_image, (0, 0))# 将印章区域粘贴到透明背景的右侧transparent_background.paste(seal_pil, (original_width, 0), seal_pil)# 保存结果transparent_background.save(output_path)print(f"Original image and extracted seal combined with transparent background saved to {output_path}")def batch_extract_seals_with_dominant_color(input_dir, output_dir):"""批量处理文件夹中的所有图像，使用主要颜色进行印章提取。参数:- input_dir: 包含输入图像的文件夹路径。- output_dir: 输出图像的保存文件夹路径。"""if not os.path.exists(output_dir):os.makedirs(output_dir)for filename in os.listdir(input_dir):image_path = os.path.join(input_dir, filename)output_path = os.path.join(output_dir, os.path.splitext(filename)[0]+'.png')extract_seal_with_kmeans(image_path, output_path)# 使用示例
if __name__ == "__main__":import argparseparser = argparse.ArgumentParser(description="Batch extract seals with dominant color from images.")parser.add_argument("--input_dir", default='/data/projects/Matting/modnet_demo/seals',help="Path to the folder containing input images.")parser.add_argument("--output_dir", default='/data/projects/Matting/modnet_demo/output_seals_01',help="Path to the folder for saving output images.")args = parser.parse_args()batch_extract_seals_with_dominant_color(args.input_dir, args.output_dir)

关于其中一些方法的说明：

KMeans：

KMeans 是一个在机器学习库 scikit-learn 中实现的 K-means 聚类算法的类。K-means 聚类是一种无监督学习算法，它的目标是将数据点划分为 K 个簇，使得每个数据点与其所属簇的中心（即聚类中心）之间的距离之和最小。这种算法在许多领域都有应用，包括图像处理、市场细分、天文数据分析等。

以下是 KMeans 类的一些关键点：

初始化 (__init__ 方法): 当你创建一个 KMeans 实例时，你需要指定 n_clusters 参数，它代表你想要划分的簇的数量。在这个例子中，k 就是这个参数的值。

拟合数据 (fit 方法): 调用 fit 方法时，你需要传递一个数据集，通常是二维数组的形式，其中每行代表一个数据点，每列代表一个特征。KMeans 会根据这些数据点初始化簇中心，并迭代地调整簇中心的位置，直到满足停止条件（如达到一定的迭代次数或簇中心的变化小于某个阈值）。

聚类中心 (cluster_centers_ 属性): 聚类完成后，KMeans 实例的 cluster_centers_ 属性会包含 K 个聚类中心的坐标。每个聚类中心是一个向量，其维度与输入数据的特征维度相同。

标签分配 (labels_ 属性): 除了聚类中心，KMeans 还会为每个输入数据点分配一个标签，表示它属于哪个簇。这个标签分配是通过计算数据点与各个聚类中心之间的距离来决定的，数据点会被分配到最近的聚类中心所代表的簇。

优化: K-means 算法在初始化簇中心时可能会陷入局部最优，因此可能需要多次运行以获得更好的结果。KMeans 类提供了 init 参数来指定初始化方法，例如 init='k-means++'，这是一种更智能的初始化方法，可以提高找到全局最优解的概率。

灵活性: KMeans 类还提供了其他参数来调整算法的行为，比如 max_iter（最大迭代次数）、tol（收敛阈值）等。

cv2.inRange：

在OpenCV中，cv2.inRange 函数用于创建一个掩码（mask），该掩码将图像中与指定颜色范围匹配的像素设置为白色（即像素值为255），而将不匹配的像素设置为黑色（即像素值为0）。这个函数在图像处理中非常有用，特别是在需要根据颜色来分割图像时。

3. 运行结果

Python Opencv: 基于颜色提取的印章分割

利用Python实现了一个图像处理功能，即批量提取图像中的印章区域；使用了颜色聚类的方法来提取颜色。本代码也发布到了github，欢迎大家试用（如果帮助，请star一下）： GitHub - AICVHub/seal_seg_o…...

编程日记 2024/9/9 17:21:41

Codeforces Round 970 (Div. 3)(ABCDEF)

Codeforces Round 970 (Div. 3) A:Sakurakos Exams 签到题意:给定1,2的数量,判断是否能用加减符号使得这些1,2计算出0 void solve() {cin>>n>>m;if(n%2)cout<<"NO\n";else{if(m%20||n)cout<<"YES\n";else cout<<"…...

编程日记 2024/9/9 17:18:38

springboot基于ssm+Jsp的人才招聘网站系统的设计与实现 jw2cs

目录前言详细视频演示后端技术栈具体实现截图开发核心技术：开发工具核心代码部分展示系统设计操作可行性可行性论证试验方案源码获取前言 👇🏻 博主介绍：👇🏻 全网粉丝50W,博客专家、CSDN特邀作者、CSDN…...

编程日记 2024/9/9 17:16:36

高质量共建“一带一路”！苏州金龙助力非洲交通驶向共同繁荣之旅

9月6日，中非合作论坛在北京落下帷幕。此次论坛，“高质量共建‘一带一路’”成为重要议题。截止至目前，苏州金龙海格客车已向阿尔及利亚、埃塞俄比亚、南非等所有参与共建“一带一路”的非洲国家累计出口客车14000台。从产品销售，到…...

编程日记 2024/9/9 17:15:35

嵌入式初学-C语言-数据结构--四

栈 1. 基本概念栈是一种逻辑结构，是特殊的线性表。特殊在： 只能在固定的一端操作只要满足上述条件，那么这种特殊的线性表就会呈现一种“后进先出”的逻辑，这种逻辑就被称为栈。栈在生活中到处可见，比如堆叠的盘子…...

编程日记 2024/9/9 17:10:31

【HarmonyOS 4】应用性能优化

1. ArkTs 高性能编程 1.1 ArkTs 高性能编程规则 1.1.1 限制一些 TypeScript 的特性，比如需要不支持属性的动态变更、变量或参数需要明确的类型声明和返回值声明等。1.1.2 禁用 ts-ignore、ts-expect-error 等屏蔽编译校验的命令。1.1.3 开启 TypeScript 的严格模式…...

编程日记 2024/9/9 17:09:30

MySQL——表操作

目录一、创建表二、查看表 2.1 查看表中某成员的数据 2.2 查看整个表中的表成员 2.3 查看创建表时的句柄三、修改表 alter 3.1 重命名 rename 3.2 新增一列 add 3.3 更改列属性 modify 3.4 更改列名称 change 3.5 删除某列上一篇博客介绍了库的操作，…...

编程日记 2024/9/9 17:08:29

阅读笔记--Guiding Attention in End-to-End Driving Models（二）

端到端驾驶的注意力学习（Attention Learning for End-to-End Driving）关键内容学习 3.1 问题设置（Problem Setup） 模仿学习（Imitation Learning, IL）：介绍了模仿学习的概念，即通过…...

编程日记 2024/9/9 17:07:29

Linux: network: TCP: errno: EWOULDBLOCK

https://mzhan017.blog.csdn.net/article/details/108010013 这个errno的意思: 如果是send接口函数返回的错误，代表tcp socket的sending buffer满了，让应用程序等上一段时间重试send。所以，这个产生的原因就不固定了：可能是当前系统太忙，导致系统发包慢，buffer累积；可…...

编程日记 2024/9/9 17:05:27

闲话“设计模式”

Q1、请详细介绍软件架构设计模式（智能化），应用程序设计模式（自动化），编程语言设计模式（人性化）（后面括号中是我希望其具有的特点） 的概念，有…...

编程日记 2024/9/9 17:03:24

Sentence-BERT实现文本匹配【CoSENT损失】

引言还是基于Sentence-BERT架构，或者说Bi-Encoder架构，但是本文使用的是苏神提出的CoSENT损失函数1。点击来都是缘分，之前过时的方法可以不细看，别的文章可以不收藏，现在是最流行的方法，这篇文章建议收藏…...

编程日记 2024/9/9 17:02:23

业余考什么证书比较实用？

在业余时间里，获得一些有用的证书不仅能提升你的专业素养，还能增强你在职场上的竞争力。特别是职业技能证书和行业认证证书，这两者受到了广大职场人士的高度关注。一、业余时间考取的实用证书行业认证证书主要针对特定行业或职业&#…...

编程日记 2024/9/9 17:01:22

16款facebook辅助工具，总有一款适合你！

Hey小伙伴们~👋 是不是想利用FB大展拳脚，却苦于不知道如何开始？别急，今天就给你们安利16个超实用的FB营销工具，涵盖了内容创建和发布的应用程序，以及数据追踪分析、商品销售等多个方面让你轻松get海外获客新…...

编程日记 2024/9/9 17:00:21

给网站发外链的好处，你了解多少？

在当今这个信息爆炸的互联网时代，网站优化和推广成为了每一个网站主不可忽视的重要环节。其中，给网站发外链，即在其他网站上设置指向自己网站的链接，是一种高效且被广泛采用的策略。那么，给网站发外链究竟能带来哪些好…...

编程日记 2024/9/9 16:58:19

安卓链接正常显示，ios#符被转义%23导致链接访问404

原因分析： url中含有特殊字符中文未编码都有可能导致URL转换失败，所以需要对url编码处理如下： guard let allowUrl webUrl.addingPercentEncoding(withAllowedCharacters: .urlQueryAllowed) else {return} 后面发现当url中有#号时&a…...

编程日记 2024/9/9 16:57:18

excel分列

Excel中有这么几列，希望将每一列内容再分出3列： 可以通过以下步骤在 Excel 表格中将 B 到 F 列的内容拆分为每列的 3 列，分别为 pred_label、pred_score 和 pred_class： 确定数据结构：假设 B 列到 F 列中的内容都是按类…...

编程日记 2024/9/9 16:56:17

STM32 HAL DMA 中断碰到的问题

流程串口收数据—>dma搬运到变量—>空闲中断----->接收完成配置 dma中断全部去掉串口中断开启 freertos中断全部去掉时钟配置代码开启中断 // DMA 空闲检查 void receives_uaru_7(void) {RXU7 0;//清除中断标志HAL_UARTEx_ReceiveToIdle_DMA(&hua…...

编程日记 2024/9/9 16:55:16

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现，因为rasa本身是带有remindschedule模块的。不过经过一番折腾后，忽然发现，chatbot上实现的定时，语音助手不一定会有响应。因为，我目前语音助手的代码设置了长时间无应答会结束…...

编程日记 2024/9/9 16:54:15

AIoTedge边缘计算+边缘物联网平台

在数字化转型的浪潮中，AIoTedge边缘计算平台以其边云协同的架构和强大的分布式AIoT处理能力，正成为推动智能技术发展的关键力量。AIoTedge通过在数据源附近处理信息，实现低延迟、快速响应，增强了应用的实时性。同时，它…...

编程日记 2024/9/9 16:50:11

Java使用拷贝asset文件，解密，并用DexclassLoader加载执行

//asset中加密的apk文件重命名为index.html,拷贝到私有目录 //解密 //加载,执行apk中的方法 public static void handleByJava(Context context){File copyedFile new File(context.getFilesDir().getAbsolutePath() "/" "main.html");FileUtil.copyAss…...

编程日记 2024/9/9 16:49:10

idea大量爆红问题解决

问题描述在学习和工作中，idea是程序员不可缺少的一个工具，但是突然在有些时候就会出现大量爆红的问题，发现无法跳转，无论是关机重启或者是替换root都无法解决就是如上所展示的问题，但是程序依然可以启动。问题解决…...

编程新知 2025/7/8 12:02:51

调用支付宝接口响应40004 SYSTEM_ERROR问题排查

在对接支付宝API的时候，遇到了一些问题，记录一下排查过程。 Body:{"datadigital_fincloud_generalsaas_face_certify_initialize_response":{"msg":"Business Failed","code":"40004","sub_msg…...

编程新知 2025/7/9 2:08:29

应用升级/灾备测试时使用guarantee 闪回点迅速回退

1.场景应用要升级,当升级失败时,数据库回退到升级前. 要测试系统,测试完成后,数据库要回退到测试前。相对于RMAN恢复需要很长时间， 数据库闪回只需要几分钟。 2.技术实现数据库设置 2个db_recovery参数创建guarantee闪回点，不需要开启数据库闪回。…...

编程新知 2025/6/17 3:47:36

转转集团旗下首家二手多品类循环仓店“超级转转”开业

6月9日，国内领先的循环经济企业转转集团旗下首家二手多品类循环仓店“超级转转”正式开业。转转集团创始人兼CEO黄炜、转转循环时尚发起人朱珠、转转集团COO兼红布林CEO胡伟琨、王府井集团副总裁祝捷等出席了开业剪彩仪式。据「TMT星球」了解，“超级…...

编程新知 2025/7/9 21:51:57

linux arm系统烧录

1、打开瑞芯微程序 2、按住linux arm 的 recover按键插入电源 3、当瑞芯微检测到有设备 4、松开recover按键 5、选择升级固件 6、点击固件选择本地刷机的linux arm 镜像 7、点击升级 （忘了有没有这步了估计有） 刷机程序和镜像就不提供了。要刷的时…...

编程新知 2025/7/8 20:07:30

cf2117E

原题链接：https://codeforces.com/contest/2117/problem/E 题目背景： 给定两个数组a,b，可以执行多次以下操作：选择 i (1 < i < n - 1)，并设置或，也可以在执行上述操作前执行一次删除任意和。求…...

编程新知 2025/7/5 22:52:54

[10-3]软件I2C读写MPU6050 江协科技学习笔记（16个知识点）

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16...

编程新知 2025/7/6 15:15:08

Spring Boot面试题精选汇总

🤟致敬读者 🟩感谢阅读🟦笑口常开🟪生日快乐⬛早点睡觉 📘博主相关 🟧博主信息🟨博客首页🟫专栏推荐🟥活动信息文章目录 Spring Boot面试题精选汇总⚙️ **一、核心概…...

编程新知 2025/7/6 8:41:46

unix/linux，sudo，其发展历程详细时间线、由来、历史背景

sudo 的诞生和演化，本身就是一部 Unix/Linux 系统管理哲学变迁的微缩史。来，让我们拨开时间的迷雾，一同探寻 sudo 那波澜壮阔（也颇为实用主义）的发展历程。历史背景：su的时代与困境 ( 20 世纪 70 年代 - 80 年代初) 在 sudo 出现之前，Unix 系统管理员和需要特权操作的…...

编程新知 2025/7/9 17:51:06

大模型多显卡多服务器并行计算方法与实践指南

一、分布式训练概述大规模语言模型的训练通常需要分布式计算技术，以解决单机资源不足的问题。分布式训练主要分为两种模式：数据并行：将数据分片到不同设备，每个设备拥有完整的模型副本模型并行：将模型分割到不同设备，每个设备处理部分模型计算现代大模型训练通常结合…...

编程新知 2025/6/24 6:21:26

1. 方法

2. 代码

3. 运行结果

相关文章：