当前位置：首页 > news >正文

Python工具箱系列（五十七）

news 2026/2/9 7:05:31

图像分割与人脸识别

众所周知图像是由若干有意义的像素组成的，图像分割作为计算机视觉的基础，对具有现有目标和较精确边界的图像进行分割，实现在图像像素级别上的分类任务。图像分割可分为语义分割和实例分割两类，区别如下：

语义分割：将图像中每个像素赋予一个类别标签，用不同的颜色来表示。例如能够区分人脸与头发、能够区分人与动物等
实例分割：无需对每个像素进行标记，只需要找到感兴趣物体的边缘轮廓。

图像分割通常应用如下所示：

专业检测：应用于专业场景的图像分析，比如在卫星图像中识别建筑、道路、森林，或在医学图像中定位病灶、测量面积等；
智能交通：识别道路信息，包括车道标记、交通标志等。

我们使用pixellib库来进行图像分割。

import timefrom pixellib.instance import instance_segmentation
from pixellib.semantic import semantic_segmentationdef semantic_seg(inputfile, outputfile):"""对图像进行语义分割(semantic segmentation)Args:inputfile (string): 输入文件outputfile (string): 输出文件"""segment_image = semantic_segmentation()segment_image.load_pascalvoc_model(r"D:\test\deeplabv3_xception_tf_dim_ordering_tf_kernels.h5")start = time.time()segment_image.segmentAsPascalvoc(inputfile, output_image_name=outputfile,overlay = True)end = time.time()print(f"Inference Time: {end-start:.2f}seconds")def instance_seg(inputfile, outputfile):"""对图像进行实体分割Args:inputfile (string): 输入文件outputfile (string): 输出文件"""segment_image = instance_segmentation()segment_image.load_model(r"D:\test\mask_rcnn_coco.h5")start = time.time()segment_image.segmentImage(inputfile, output_image_name=outputfile,show_bboxes = True)end = time.time()print(f"Inference Time: {end-start:.2f}seconds")def test_semantic():targetimage = r'd:\test\horseandman.png'outimage = r'd:\test\semantic.png'semantic_seg(targetimage,outimage)def test_instance():targetimage = r'd:\test\food.jpg'outputfile = r'd:\test\box.png'instance_seg(targetimage,outputfile)test_semantic()
test_instance()

代码中，test_semantic函数进行语义分割的演示。其中horseandman.png如下图所示，是人、马、狗组合在一起的风景图，人类是可以理解的。

经过人工智能训练后的代码，进行语义分割后，形成的图像如下所示。

上图表明计算机也能够理解。因为输出结果中不同物体的颜色表明了模型识别出的类型。颜色示意如下图所示。

其中棕色代表人、鲜红代表马、紫色代表狗，形成了非常准确的判断。此外，函数test_instance使用模型能够对目标进行识别，并且使用矩形进行标注。下图是有名的互联网大佬聚餐图。

使用上述代码进行实体分割后的效果如下图所示。

效果还差强人意，勉强可用。在上面的代码中，我们加载了在load_pascalvoc_model上训练的用于分割对象的xception模型以及Mask RCNN模型。由于以上模型较大，建议下载后本地化保存与部署。

在实际应用中，还存在着人脸识别的需求。以下代码借助第三方库face_recognition轻松实现了人脸识别的基本能力。

import face_recognition
import cv2targetimage = r'd:\test\food.jpg'# 加载待识别图片
image = face_recognition.load_image_file(targetimage)face_location = face_recognition.face_locations(image,number_of_times_to_upsample=5, model='hog')for location in face_location:top, right, bottom, left = locationprint("已检测到人脸部位，像素区域为:top:{}, right:{}. bottom:{}, left:{}".format(top, right, bottom, left))start = (left, top)end = (right, bottom)cv2.rectangle(image, start, end, (0, 0, 255), thickness=2)cv2.imshow("window", image)
cv2.waitKey(0)

依然使用前面的大佬聚餐图，通过上述代码可以很轻松地完成人脸识别，效果如下所示。

在face_locations函数中，可以选择'hog'与'cnn'两种模型。hog模型更快，cnn更精确。此外，number_of_times_to_upsample缺省为1，如果识别时效果不好，增加这个值。最后，将第三方库的安装过程列举如下。

pip install tensorflow==2.2.0
pip install pixellib
pip install face_recognition

tensorflow推荐安装2.2.0版本，否则上述代码可能跑不下来。

Python工具箱系列（五十七）

图像分割与人脸识别众所周知图像是由若干有意义的像素组成的，图像分割作为计算机视觉的基础，对具有现有目标和较精确边界的图像进行分割，实现在图像像素级别上的分类任务。图像分割可分为语义分割和实例分割两类，区别如下&#x…...

编程日记 2024/11/2 7:53:18

数据智能驱动金融策略优化：民锋智能分析技术的应用

在现代金融市场中，数据分析与智能化技术的结合为投资策略带来了全新机遇。民锋以智能分析技术为核心，帮助投资者在复杂的市场环境中做出高效决策。本文将深入探讨民锋智能分析技术如何驱动策略优化，为投资者带来更加智能化的支持。 #### 一、…...

编程日记 2024/11/2 7:50:15

1009：带余除法

【题目描述】给定被除数和除数，求整数商及余数。此题中请使用默认的整除和取余运算，无需对结果进行任何特殊处理。【输入】一行，包含两个整数，依次为被除数和除数（除数非零），中间用一个空格隔…...

编程日记 2024/11/2 7:49:14

Jmeter实际应用

环境准备 JDK1.8Jmeter 5.6.3 下载地址Jmeter 插件下载地址放到lib/ext下常用命令 # 启动 sh jmeter# 集群模式下启动节点，不启动用不了集群 sh jmeter-server#生成ssl需要的证书, 这里会要求输入个密码，是要在jmeter中用的 keytool -import -ali…...

编程日记 2024/11/2 7:48:13

C++基础（11.AVL树的实现）

目录 AVL的概念： AVL树的实现： AVL树的结构： AVL树的插⼊： 平衡因⼦更新： 旋转： AVL树的其他功能: AVL树平衡检测: 测试代码*2: 源代码： KV结构： 源代码： AVL…...

编程日记 2024/11/2 7:46:11

c# 抽象方法虚函数使用场景

在C#中，抽象方法（abstract method）和虚函数（virtual method）都是用于实现多态性（polymorphism）的重要特性，但它们在使用上有一些关键的区别和各自的用途。抽象方法（Abs…...

编程日记 2024/11/2 7:45:10

大数据安全方案验证

一、背景文档用于记录配置 Kerberos 和 Ranger 后，对 HDFS、Hive 认证和鉴权的功能测试。二、Kerberos 验证 2.1、验证功能 1，HDFS 认证 2.1.1、访问 HDFS Kerberos 验证前，访问 HDFS 失败。 Kerberos 验证后，访问 HDFS 成…...

编程日记 2024/11/2 7:42:08

电脑软件：推荐一款免费且实用的电脑开关机小工具

目录一、软件简介二、软件功能三、软件特点四、使用说明五、软件下载今天给大家推荐一款免费且实用的电脑开关机小工具KShutdown，有需要的朋友可以下载试一下！ 一、软件简介 KShutdown是一款精巧且实用的定时自动关机小工具，对于…...

编程日记 2024/11/2 7:41:03

php反序列化靶场随笔分析

项目地址：github.com/mcc0624/php_ser_Class 推荐使用docker部署：https://hub.docker.com/r/mcc0624/ser/tags 前面讲了以下php基础，我们直接从class6开始实验 class6 访问页面，传一个序列化的字符串，php代码将其反…...

编程日记 2024/11/2 7:39:00

动态规划 - 编辑距离

115. 不同的子序列困难给你两个字符串 s 和 t ，统计并返回在 s 的子序列中 t 出现的个数，结果需要对 10^9 7 取模。算法思想：利用动态规划，分s[i - 1] 与 t[j - 1]相等，s[i - 1] 与 t[j - 1] 不相等两种情况具…...

编程日记 2024/11/2 7:36:58

力扣——113. 路径总和

113. 路径总和 II 给你二叉树的根节点 root 和一个整数目标和 targetSum ，找出所有从根节点到叶子节点路径总和等于给定目标和的路径。叶子节点是指没有子节点的节点。示例 1： 输入：root [5,4,8,11,null,13,4,7,2,null,null,5,1], t…...

编程日记 2024/11/2 7:35:53

C02S04-Ubuntu基本使用

一、Ubuntu初始配置 1. 使用root用户 Ubuntu系统默认只能使用普通用户，要想使用root用户，需要先设置root用户密码。进入终端，配置root用户密码。按照提示输入密码。 sudo passwd root配置完成后，执行下面的密码，切换…...

编程日记 2024/11/2 7:34:52

C语言 | Leetcode C语言题解之第525题连续数组

题目： 题解： struct HashTable {int key, val;UT_hash_handle hh; };int findMaxLength(int* nums, int numsSize) {int maxLength 0;struct HashTable* hashTable NULL;struct HashTable* tmp malloc(sizeof(struct HashTable));tmp->key 0, tm…...

编程日记 2024/11/2 7:33:51

Qml-Transition的使用

Qml-Transition的使用 Transition的概述 Transition：定义了当状态发生改变时应用的动画属性animations : list：(Transition)过渡的动画属性enabled : bool：状态发生变化时，是否使能此过渡（Transition）动画…...

编程日记 2024/11/2 7:32:50

Notepad++检索包含多个关键字的行

Notepad检索包含多个关键字的行在Notepad中，你可以使用正则表达式来检索包含多个关键字的行。以下是具体步骤： 打开Notepad，打开要搜索的文件。点击菜单栏上的“搜索”选项，然后选择“查找”。在弹出的查找对话框中&#xf…...

编程日记 2024/11/2 7:30:48

C语言:水仙花树,要求三位以上的N位整数每位的N次方等于数本身,全部输出出来

#include <stdio.h> int main() { int n; scanf("%d",&n);//这里是说明多少n位整数 int first1; int i1; while(i<n){//此while循环可以得到n位数的最小位,例如3位的100. first*10; i; } ifirst; whil…...

编程日记 2024/11/2 7:28:46

金融贷款口子超市V2源码 Thinkphp开发的贷款和超市平台源码（亲测源码含安装视频教程）

金融贷款口子超市V2源码 Thinkphp开发的贷款和超市平台源码源码下载：https://download.csdn.net/download/m0_66047725/89938268 更多资源下载：关注我。...

编程日记 2024/11/2 7:23:41

redis的三种客户端

在 Redis 中，常用的 Java 客户端有三种：Jedis、Lettuce 和 Redisson。它们各有特点，适用于不同的场景。以下是它们的详细介绍，以及如何在 Spring Boot 中集成 Redis。一、Redis 三种常用客户端详解 1.1 Jedis Jedis 是 Redis 官…...

编程日记 2024/11/2 7:22:40

边缘计算【智能+安全检测】系列教程--agx orin解决RTC时间问题

因为是离线运行，首要问题是时间不准确，就在主板上加装了纽扣电池，但是会有一系列问题，比如无法将RTC时间回写到系统时间，或者无法将系统时间写到RTC中等等一些列问题。为解决这些问题，一劳永逸的方式&#…...

编程日记 2024/11/2 7:20:37

数据库动态扩容：Java实现与技术策略

引言数据库动态扩容是应对数据量增长和业务需求变化的关键技术。它允许数据库系统在不停机的情况下，通过增加或减少资源来适应业务负载的变化。本文将详细介绍数据库动态扩容的工作原理、技术策略，并提供Java代码示例。 1. 数据库动态扩容的工作原理 …...

编程日记 2024/11/2 7:18:35

遍历 Map 类型集合的方法汇总

1 方法一先用方法 keySet() 获取集合中的所有键。再通过 gey(key) 方法用对应键获取值 import java.util.HashMap; import java.util.Set;public class Test {public static void main(String[] args) {HashMap hashMap new HashMap();hashMap.put("语文",99);has…...

编程新知 2026/1/24 15:08:45

基于服务器使用 apt 安装、配置 Nginx

🧾 一、查看可安装的 Nginx 版本首先，你可以运行以下命令查看可用版本： apt-cache madison nginx-core输出示例： nginx-core | 1.18.0-6ubuntu14.6 | http://archive.ubuntu.com/ubuntu focal-updates/main amd64 Packages ng…...

编程新知 2026/1/9 12:53:59

Objective-C常用命名规范总结

【OC】常用命名规范总结文章目录【OC】常用命名规范总结1.类名（Class Name)2.协议名（Protocol Name)3.方法名（Method Name)4.属性名（Property Name）5.局部变量/实例变量（Local / Instance Variables&…...

编程新知 2025/12/14 22:33:06

【快手拥抱开源】通过快手团队开源的 KwaiCoder-AutoThink-preview 解锁大语言模型的潜力

引言： 在人工智能快速发展的浪潮中，快手Kwaipilot团队推出的 KwaiCoder-AutoThink-preview 具有里程碑意义——这是首个公开的AutoThink大语言模型（LLM）。该模型代表着该领域的重大突破，通过独特方式融合思考与非思考…...

编程新知 2026/2/6 19:29:20

工程地质软件市场：发展现状、趋势与策略建议

一、引言在工程建设领域，准确把握地质条件是确保项目顺利推进和安全运营的关键。工程地质软件作为处理、分析、模拟和展示工程地质数据的重要工具，正发挥着日益重要的作用。它凭借强大的数据处理能力、三维建模功能、空间分析工具和可视化展示手段&…...

编程新知 2025/10/6 6:10:29

[10-3]软件I2C读写MPU6050 江协科技学习笔记（16个知识点）

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16...

编程新知 2026/1/28 8:34:48

让AI看见世界：MCP协议与服务器的工作原理

让AI看见世界：MCP协议与服务器的工作原理 MCP（Model Context Protocol）是一种创新的通信协议，旨在让大型语言模型能够安全、高效地与外部资源进行交互。在AI技术快速发展的今天，MCP正成为连接AI与现实世界的重要桥梁。…...

编程新知 2026/1/31 11:13:53

select、poll、epoll 与 Reactor 模式

在高并发网络编程领域，高效处理大量连接和 I/O 事件是系统性能的关键。select、poll、epoll 作为 I/O 多路复用技术的代表，以及基于它们实现的 Reactor 模式，为开发者提供了强大的工具。本文将深入探讨这些技术的底层原理、优缺点。一、I…...

编程新知 2026/2/9 6:43:47

Element Plus 表单(el-form)中关于正整数输入的校验规则

目录 1 单个正整数输入1.1 模板1.2 校验规则 2 两个正整数输入（联动）2.1 模板2.2 校验规则2.3 CSS 1 单个正整数输入 1.1 模板 <el-formref"formRef":model"formData":rules"formRules"label-width"150px"…...

编程新知 2025/11/10 19:08:45

2023赣州旅游投资集团

单选题 1.“不登高山，不知天之高也；不临深溪，不知地之厚也。”这句话说明_____。 A、人的意识具有创造性 B、人的认识是独立于实践之外的 C、实践在认识过程中具有决定作用 D、人的一切知识都是从直接经验中获得的参考答案: C 本题解…...

编程新知 2025/11/8 16:42:13

相关文章：