当前位置：首页 > news >正文

使用python-opencv检测图片中的人像

news 2026/2/10 13:46:31

最简单的方法进行图片中的人像检测

使用python-opencv配合yolov3模型进行图片中的人像检测

1、安装python-opencv、numpy

pip install opencv-python
pip install numpy

2、下载yolo模型文件和配置文件：

下载地址：

https://download.csdn.net/download/mldxs/88396654yhttps://download.csdn.net/download/mldxs/88396654

yolo官网：

YOLO: Real-Time Object DetectionYou only look once (YOLO) is a state-of-the-art, real-time object detection system.https://pjreddie.com/darknet/yolo/3、搬砖：代码比较简单并且带注释，不过多介绍

import cv2
import numpy as np# 读取输入图像
image = cv2.imread('input.jpeg')# 加载YOLOv3模型和类别标签
net = cv2.dnn.readNet('yolov3.weights', 'yolov3.cfg')
classes = []
with open('coco.data', 'r') as f:classes = f.read().strip().split('\n')# 获取YOLO模型的输出层名称
layer_names = net.getLayerNames()
output_layers = []
unconnected_layers = net.getUnconnectedOutLayers()# 根据输出层索引获取输出层名称
for i in unconnected_layers:output_layers.append(layer_names[i - 1])# 为每个类别生成随机颜色
colors = np.random.uniform(0, 255, size=(len(classes), 3))# 获取图像的尺寸
height, width, channels = image.shape# 创建YOLO模型的输入blob
blob = cv2.dnn.blobFromImage(image, 0.00392, (416, 416), (0, 0, 0), True, crop=False)# 将blob设置为模型的输入
net.setInput(blob)
outs = net.forward(output_layers)class_ids = []
confidences = []
boxes = []# 处理YOLO模型的输出
for out in outs:for detection in out:scores = detection[5:]class_id = np.argmax(scores)confidence = scores[class_id]# 如果置信度大于0.5并且类别是"person"（0对应COCO数据集中的"person"类）if confidence > 0.5 and class_id == 0:center_x = int(detection[0] * width)center_y = int(detection[1] * height)w = int(detection[2] * width)h = int(detection[3] * height)x = int(center_x - w / 2)y = int(center_y - h / 2)boxes.append([x, y, w, h])confidences.append(float(confidence))class_ids.append(class_id)# 使用非极大值抑制获取最终的检测结果
indexes = cv2.dnn.NMSBoxes(boxes, confidences, 0.5, 0.4)
margin = 30  # 定义边框扩展的边距大小# 绘制边框和类别标签
for i in range(len(boxes)):if i in indexes:x, y, w, h = boxes[i]label = str(classes[class_ids[i]])color = colors[i]# 扩展边框的坐标x_new = max(0, x - margin)y_new = max(0, y - margin)w_new = min(image.shape[1], w + 2 * margin)h_new = min(image.shape[0], h + 2 * margin)# 绘制扩展后的边框cv2.rectangle(image, (x_new, y_new), (x_new + w_new, y_new + h_new), color, 2)cv2.putText(image, label, (x_new, y_new - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, color, 2)# 显示带有边框的图像
cv2.imshow('Detected Bodies', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

最终效果：

yolo有很多检测类别，上述代码只对人像进行检测，就是检测类别里的第一项（person）

使用python-opencv检测图片中的人像

最简单的方法进行图片中的人像检测使用python-opencv配合yolov3模型进行图片中的人像检测 1、安装python-opencv、numpy pip install opencv-python pip install numpy 2、下载yolo模型文件和配置文件： 下载地址： https://download.csdn.net/down…...

编程日记 2023/10/5 22:57:52

项目进展（三）-电机驱动起来了，发现了很多关键点，也遇到了一些低级错误，

一、前言昨天电机没有驱动起来，头发掉一堆，不过今天，终于终于终于把电机驱动起来了！！！！，特别开心，哈哈哈哈，后续继续努力完善！！&…...

编程日记 2023/10/5 22:53:47

目标检测算法改进系列之Backbone替换为RepViT

RepViT简介轻量级模型研究一直是计算机视觉任务中的一个焦点，其目标是在降低计算成本的同时达到优秀的性能。轻量级模型与资源受限的移动设备尤其相关，使得视觉模型的边缘部署成为可能。在过去十年中，研究人员主要关注轻量级卷积神经网络&a…...

编程日记 2023/10/5 22:49:43

学习 Kubernetes的难点和安排

Kubernetes 技术栈的特点可以用四个字来概括，那就是“新、广、杂、深”： 1.“新”是指 Kubernetes 用到的基本上都是比较前沿、陌生的技术，而且版本升级很快，经常变来变去。 2.“广”是指 Kubernetes 涉及的应用领域很多、覆盖面非…...

编程日记 2023/10/5 22:47:42

【MATLAB源码-第42期】基于matlab的人民币面额识别系统（GUI）。

操作环境： MATLAB 2022a 1、算法描述基于 MATLAB 的人民币面额识别系统设计可以分为以下步骤： 1. 数据收集与预处理数据收集： 收集不同面额的人民币照片，如 1 元、5 元、10 元、20 元、50 元和 100 元。确保在不同环境、不…...

编程日记 2023/10/5 22:46:41

【软件测试】软件测试的基础概念

一、一个优秀的测试人员需要具备的素质技能方面： 优秀的测试用例设计能力：测试用例设计能力是指，无论对于什么类型的测试，都能够设计出高效的发现缺陷，保证产品质量的优秀测试用例。这就需要我们掌握设计测试用例的方…...

编程日记 2023/10/5 22:45:39

Docker-mysql，redis安装

安装MySQL 下载MySQL镜像终端运行命令 docker pull mysql:8.0.29镜像下载完成后，需要配置持久化数据到本地这是mysql的配置文件和存储数据用的目录切换到终端，输入命令，第一次启动MySQL容器 docker run --restartalways --name mysq…...

编程日记 2023/10/5 22:44:38

五种I/O模型

目录 1、阻塞IO模型2、非阻塞IO模型3、IO多路复用模型4、信号驱动IO模型5、异步IO模型总结 blockingIO - 阻塞IOnonblockingIO - 非阻塞IOIOmultiplexing - IO多路复用signaldrivenIO - 信号驱动IOasynchronousIO - 异步IO 5种模型的前4种模型为同步IO，只有异步IO模…...

编程日记 2023/10/5 22:43:37

用nativescript开发ios程序常用命令？

NativeScript是一个用于跨平台移动应用程序开发的开源框架，允许您使用JavaScript或TypeScript构建原生iOS和Android应用程序。以下是一些常用的NativeScript命令，用于开发iOS应用程序： 1、创建新NativeScript项目： tns create m…...

编程日记 2023/10/5 22:41:34

6.Tensors For Beginners-What are Convector

Covectors （协向量） What‘s a covector Covectors are “basically” Row Vectors 在一定程度上，可认为协向量基本上就像行向量。但不能简单地认为这就是列向量进行转置！ 行向量和列向量是根本不同类型的对象。 …...

编程日记 2023/10/5 22:39:32

Linux多线程网络通信

思路：主线程（只有一个）建立连接，就创建子线程。子线程开始通信。共享资源：全局数据区，堆区，内核区描述符。线程同步不同步需要取决于线程对共享资源区的数据的操作，如果是只读就不…...

编程日记 2023/10/5 22:37:30

矩阵的c++实现（2）

上一次我们了解了矩阵的运算和如何使用矩阵解决斐波那契数列，这一次我们多看看例题，了解什么情况下用矩阵比较合适。先看例题 1.洛谷P1939 【模板】矩阵加速（数列） 模板题应该很简单。补：1<n<10^9 10^9肯定…...

编程日记 2023/10/5 22:36:29

RPC 框架之Thrift入门（一）

📋 个人简介 💖 作者简介：大家好，我是阿牛，全栈领域优质创作者。😜📝 个人主页：馆主阿牛🔥🎉 支持我：点赞👍收藏⭐️留言&#x1f4d…...

编程日记 2023/10/5 22:33:27

【C++】运算符重载 ⑥ ( 一元运算符重载 | 后置运算符重载 | 前置运算符重载与后置运算符重载的区别 | 后置运算符重载添加 int 占位参数 )

文章目录一、后置运算符重载1、前置运算符重载与后置运算符重载的区别2、后置运算符重载添加 int 占位参数上 2 2 2 篇博客【C】运算符重载 ④ ( 一元运算符重载 | 使用全局函数实现前置自增运算符重载 | 使用全局函数实现前置 - - 自减运算符重载 )【C】运算符…...

编程日记 2023/10/5 22:32:26

538. 把二叉搜索树转换为累加树

题目描述给出二叉搜索树的根节点，该树的节点值各不相同，请你将其转换为累加树（Greater Sum Tree），使每个节点 node 的新值等于原树中大于或等于 node.val 的值之和。提醒一下，二叉搜索树满足下列约束…...

编程日记 2023/10/5 22:30:24

java8日期时间工具类

【README】 1）本文总结了java8中日期时间常用工具方法；包括： 日期时间对象格式化为字符串；日期时间字符串解析为日期时间对象；日期时间对象转换； 转换过程中，需要注意的是： Instan…...

编程日记 2023/10/5 22:29:21

算法-动态规划/trie树-单词拆分

算法-动态规划/trie树-单词拆分 1 题目概述 1.1 题目出处 https://leetcode.cn/problems/word-break/description/?envTypestudy-plan-v2&envIdtop-interview-150 1.2 题目描述 2 动态规划 2.1 解题思路 dp[i]表示[0, i)字符串可否构建那么dp[i]可构建的条件是&…...

编程日记 2023/10/5 22:28:20

React框架核心原理

一、整体架构三大核心库与对应的组件 history -> react-router -> react-router-dom react-router 可视为react-router-dom 的核心，里面封装了<Router>，<Route>，<Switch>等核心组件,实现了从路由的改变到组件的更新…...

编程日记 2023/10/5 22:27:19

python-pytorch 利用pytorch对堆叠自编码器进行训练和验证

利用pytorch对堆叠自编码器进行训练和验证一、数据生成二、定义自编码器模型三、训练函数四、训练堆叠自编码器五、将已训练的自编码器级联六、微调整个堆叠自编码器一、数据生成随机生成一些数据来模拟训练和验证数据集： import torch# 随机生成数据 n_sample…...

编程日记 2023/10/5 22:21:12

制作 3 档可调灯程序编写

PWM 0~255 可以将数据映射到0 75 150 225 尽可能均匀电压间隔...

编程日记 2023/10/5 22:20:11

Chapter03-Authentication vulnerabilities

文章目录 1. 身份验证简介1.1 What is authentication1.2 difference between authentication and authorization1.3 身份验证机制失效的原因1.4 身份验证机制失效的影响 2. 基于登录功能的漏洞2.1 密码爆破2.2 用户名枚举2.3 有缺陷的暴力破解防护2.3.1 如果用户登录尝试失败次…...

编程新知 2026/2/10 3:29:01

React Native 开发环境搭建（全平台详解）

React Native 开发环境搭建（全平台详解） 在开始使用 React Native 开发移动应用之前，正确设置开发环境是至关重要的一步。本文将为你提供一份全面的指南，涵盖 macOS 和 Windows 平台的配置步骤，如何在 Android 和 iOS…...

编程新知 2025/10/7 2:47:54

（二）TensorRT-LLM | 模型导出（v0.20.0rc3）

0. 概述上一节对安装和使用有个基本介绍。根据这个 issue 的描述，后续 TensorRT-LLM 团队可能更专注于更新和维护 pytorch backend。但 tensorrt backend 作为先前一直开发的工作，其中包含了大量可以学习的地方。本文主要看看它导出模型的部分&#x…...

编程新知 2026/1/24 6:44:11

学习STC51单片机31（芯片为STC89C52RCRC）OLED显示屏1

每日一言生活的美好，总是藏在那些你咬牙坚持的日子里。硬件：OLED 以后要用到OLED的时候找到这个文件 OLED的设备地址 SSD1306"SSD" 是品牌缩写，"1306" 是产品编号。驱动 OLED 屏幕的 IIC 总线数据传输格式示意图 …...

编程新知 2026/1/30 4:16:26

ElasticSearch搜索引擎之倒排索引及其底层算法

文章目录一、搜索引擎1、什么是搜索引擎？2、搜索引擎的分类3、常用的搜索引擎4、搜索引擎的特点二、倒排索引1、简介2、为什么倒排索引不用B+树1.创建时间长，文件大。2.其次，树深，IO次数可怕。3.索引可能会失效。4.精准度差。三. 倒排索引四、算法1、Term Index的算法2、 …...

编程新知 2026/1/30 17:10:19

使用Matplotlib创建炫酷的3D散点图：数据可视化的新维度

文章目录基础实现代码代码解析进阶技巧1. 自定义点的大小和颜色2. 添加图例和样式美化3. 真实数据应用示例实用技巧与注意事项完整示例（带样式）应用场景在数据科学和可视化领域，三维图形能为我们提供更丰富的数据洞察。本文将手把手教你如何使用Python的Matplotlib库创建引…...

编程新知 2026/1/28 8:25:28

HarmonyOS运动开发：如何用mpchart绘制运动配速图表

##鸿蒙核心技术##运动开发##Sensor Service Kit（传感器服务）# 前言在运动类应用中，运动数据的可视化是提升用户体验的重要环节。通过直观的图表展示运动过程中的关键数据，如配速、距离、卡路里消耗等，用户可以更清晰…...

编程新知 2026/2/2 7:49:59

基于Java+MySQL实现（GUI）客户管理系统

客户资料管理系统的设计与实现第一章需求分析 1.1 需求总体介绍本项目为了方便维护客户信息为了方便维护客户信息，对客户进行统一管理，可以把所有客户信息录入系统，进行维护和统计功能。可通过文件的方式保存相关录入数据，对…...

编程新知 2026/1/25 10:12:06

掌握 HTTP 请求：理解 cURL GET 语法

cURL 是一个强大的命令行工具，用于发送 HTTP 请求和与 Web 服务器交互。在 Web 开发和测试中，cURL 经常用于发送 GET 请求来获取服务器资源。本文将详细介绍 cURL GET 请求的语法和使用方法。一、cURL 基本概念 cURL 是 "Client URL" 的缩写…...

编程新知 2025/7/9 20:52:19

【Linux】自动化构建-Make/Makefile

前言上文我们讲到了Linux中的编译器gcc/g 【Linux】编译器gcc/g及其库的详细介绍-CSDN博客本来我们将一个对于编译来说很重要的工具：make/makfile 1.背景在一个工程中源文件不计其数，其按类型、功能、模块分别放在若干个目录中，mak…...

编程新知 2026/2/4 16:04:21

相关文章：