当前位置：首页 > news >正文

Python+OpenCV系列：AI看图识人、识车、识万物

news 2026/2/11 3:49:53

在人工智能风靡全球的今天，用 Python 和 OpenCV 结合机器学习实现物体识别，不仅是酷炫技能，更是掌握未来的敲门砖。本篇博文手把手教你如何通过摄像头或图片输入，识别人、动物、车辆及其他物品，让你的程序瞬间具备 AI 能力。

一、什么是物体识别？

物体识别是计算机视觉中的关键任务，通过算法从图像或视频中检测并分类特定目标。例如：识别人脸、识别汽车品牌、甚至是分类宠物品种。

借助 OpenCV 和 Python，我们可以轻松构建从简单到复杂的物体识别系统，包括基于传统机器学习的模型和深度学习的预训练模型（如 MobileNet、YOLO、ResNet）。

二、实现物体识别的工作流程

数据获取：
- 从摄像头实时捕捉视频帧。
- 从文件读取图像（支持 PNG、JPG 等格式）。
数据预处理：
- 灰度转换、尺寸缩放、归一化等。
模型加载：
- 使用预训练的 Haar 级联分类器（传统机器学习）。
- 或加载深度学习模型（如 DNN 模块支持的 MobileNet-SSD）。
目标检测与分类：
- 检测目标区域（Bounding Box）。
- 分类目标（如猫/狗/车辆）。

三、实现代码：检测人脸和车辆

（1）人脸检测（Haar 级联分类器）

import cv2# 加载 Haar 级联分类器
face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')# 从摄像头捕捉视频
cap = cv2.VideoCapture(0)while True:ret, frame = cap.read()gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5)for (x, y, w, h) in faces:cv2.rectangle(frame, (x, y), (x+w, y+h), (255, 0, 0), 2)cv2.imshow('Face Detection', frame)if cv2.waitKey(1) & 0xFF == ord('q'):breakcap.release()
cv2.destroyAllWindows()

在这里插入图片描述

（2）车辆识别（深度学习 MobileNet-SSD）

import cv2# 加载 MobileNet-SSD 模型
prototxt_path = 'MobileNetSSD_deploy.prototxt'
model_path = 'MobileNetSSD_deploy.caffemodel'
net = cv2.dnn.readNetFromCaffe(prototxt_path, model_path)# 类别标签
CLASSES = ["background", "aeroplane", "bicycle", "bird", "boat", "bottle", "bus", "car", "cat", "chair", "cow", "diningtable", "dog", "horse", "motorbike", "person", "pottedplant", "sheep", "sofa", "train", "tvmonitor"]cap = cv2.VideoCapture(0)while True:ret, frame = cap.read()h, w = frame.shape[:2]blob = cv2.dnn.blobFromImage(frame, 0.007843, (300, 300), 127.5)net.setInput(blob)detections = net.forward()for i in range(detections.shape[2]):confidence = detections[0, 0, i, 2]if confidence > 0.5:idx = int(detections[0, 0, i, 1])box = detections[0, 0, i, 3:7] * [w, h, w, h](startX, startY, endX, endY) = box.astype("int")label = f"{CLASSES[idx]}: {confidence:.2f}"cv2.rectangle(frame, (startX, startY), (endX, endY), (0, 255, 0), 2)cv2.putText(frame, label, (startX, startY - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)cv2.imshow('Object Detection', frame)if cv2.waitKey(1) & 0xFF == ord('q'):breakcap.release()
cv2.destroyAllWindows()

四、扩展功能

多对象识别：通过循环逐帧检测，实现实时多目标跟踪。
自定义分类：用 TensorFlow 或 PyTorch 训练自定义数据集，替换预训练模型。
GPU 加速：用 CUDA 提高实时检测性能（支持 NVIDIA 显卡）。

五、总结

借助 Python 和 OpenCV，你可以轻松实现从简单到复杂的物体识别。无论是用传统方法还是现代深度学习模型，OpenCV 都提供了丰富的工具。赶紧尝试，在 AI 的道路上迈出第一步！

Python+OpenCV系列：AI看图识人、识车、识万物

在人工智能风靡全球的今天，用 Python 和 OpenCV 结合机器学习实现物体识别，不仅是酷炫技能，更是掌握未来的敲门砖。本篇博文手把手教你如何通过摄像头或图片输入，识别人、动物、车辆及其他物品，让你的程序瞬间具备 AI …...

编程日记 2024/12/20 21:52:43

springboot449教学资源共享平台(论文+源码)_kaic

摘要如今社会上各行各业，都喜欢用自己行业的专属软件工作，互联网发展到这个时候，人们已经发现离不开了互联网。新技术的产生，往往能解决一些老技术的弊端问题。因为传统教学资源共享平台信息管理难度大，容错率低&am…...

编程日记 2024/12/20 21:50:39

类OCSP靶场-Kioptrix系列-Kioptrix Level 4

一、前情提要二、实战打靶 1. 信息收集 1.1. 主机发现 1.2. 端口扫描 1.3.目录遍历 1.4. 敏感信息 2.漏洞发现 2.1.登录框万能密码 2.2.系统用户密码-ssh链接 2.3.mysql-udf提权一、前情提要 kali黑客-利用searchsploit搜索exp一键化攻击-CSDN博客一篇文章带你理…...

编程日记 2024/12/20 21:46:35

贪心算法在背包问题上的运用（Python）

背包问题有n个物品，它们有各自的体积和价值，现有给定容量的背包，如何让背包里装入的物品具有最大的价值总和？这就是典型的背包问题(又称为0-1背包问题)，也是具体的、没有经过任何延伸的背包问题模型。背包问题的传统求解方法较为复杂，现定义有一个可以载重为8kg的背…...

编程日记 2024/12/20 21:38:29

POD 存储、PV、PVC

目录容器如何持久化存储？ PV和PVC 为什么不能直接在 Pod 或容器中存储数据？ 什么是 PV和 PVC？ 可以使用本地磁盘空间创建PV吗？ 如何让客户端通过ftp上传到远端服务器的POD里面？ 另一个POD想访问ftp的POD里面的…...

编程日记 2024/12/20 21:34:24

C中strlen和sizeof的区别

1、代码如下： #include<stdio.h>int main() {char a[10] { h,e,l,l,0};printf("%d\n",strlen(a));printf("%d\n", sizeof(a));return 0; } 2、运行结果如下：...

编程日记 2024/12/20 21:32:22

WSL2内部的Ubuntu怎么设置网络内桥接模式，弄了好久老是不成功，怎么办？

环境： Win10专业版 WSL2 Ubuntu22.04 问题描述： WSL2内部的Ubuntu怎么设置网络内桥接模式解决方案：方法一 1.控制面板开启，Hyper-V 管理器 2.重启电脑 3…创建外部虚拟交换机打开 Hyper-V 管理器,在右侧操作面板中点击“虚拟交换机管理器”。选择“创建虚…...

编程日记 2024/12/20 21:31:20

Linux环境下搭建ELk项目 -单机版练习

前言 ELK 项目是一个由三个开源工具组成的日志处理和分析解决方案，ELK 是 Elasticsearch、Logstash 和 Kibana 的首字母缩写。这个项目的目标是帮助用户采集、存储、搜索和可视化大量的日志和事件数据，尤其是在分布式系统中。下面是每个组件的概述&…...

编程日记 2024/12/20 21:29:19

ubuntu20.04安装mysql5.7

安装之前要确保之前没安装过或者安装后卸载干净了，不然后面的配置文件可能会报错。 1. 下载安装包打开链接 downloads.mysql.com/archives/co… 选择相应版本进行下载，这里mysql版本选择 5.7.35，系统选择Ubuntu Linux，选择64位…...

编程日记 2024/12/20 21:28:18

MacPorts 安装 Tengine

创建 Portfile 以下是我参考 nginx 调整后的 Portfile，如需安装指定版本，除了修改版本号之外还需要修改 checksums 里的 sha256 sha256 值需下载 Tengine 源码文件（tar.gz）进行计算模块的调整在最后的 configure.args-append …...

编程日记 2024/12/20 21:21:12

Git安装及基础学习

Git学习 Git安装概述： Git是一个开源的分布式版本控制系统，可以有效、高速的处理从很小到非常大的项目版本管理，是目前使用范围最广的版本管理工具。下载安装： 下载地址：https://git-scm.com/ 下载后傻瓜式一键安…...

编程日记 2024/12/20 21:20:08

【celery】任务有时候不执行

celery任务有时执行，有时不执行，这种情况是任务被冒领；有时执行说明这个方法可以使用，有时不执行通常是被使用同一个消息队列的进程冒领了； 解决 Redis：指定一个分块就行了...

编程日记 2024/12/20 21:19:07

【恶意软件检测论文】通过提取 API 语义来实现的一个新颖的安卓恶意软件检测方法

目录摘要1. 引言2. 相关工作2.1. 基于重新训练的恶意软件检测2.2. 基于应用关系图的恶意软件检测2.3. 基于异常样本识别的恶意软件检测2.4. 基于API聚类的恶意软件检测 3. AMDASE概述4. 基于语义距离的API聚类4.1. API特征提取4.2. API句子生成4.3. API句子编码4.4.聚类中心生…...

编程日记 2024/12/20 21:14:02

什么，不用 Tomcat 也能运行 Java web？

在 Java web 开发领域，传统的 Tomcat 服务器一直占据着重要地位。但如今，Blade 框架的出现为我们提供了一种全新的开发体验，它无需依赖 Tomcat 便可运行 Java web 应用。一、Blade 框架简介是一款轻量级且高性能的 Java web 框架。其设计理…...

编程日记 2024/12/20 21:11:59

华为HarmonyOS实现跨多个子系统融合的场景化服务 -- 1 构建快速验证手机号Button

场景介绍快速验证手机号Button功能用于帮助开发者向用户发起手机号申请，应用在满足《常见类型移动互联网应用程序必要个人信息范围规定》（对第三方网站的内容，华为公司不承担任何责任）中使用手机号的必要业务场景，经…...

编程日记 2024/12/20 21:08:57

王佩丰24节Excel学习笔记——第十一讲：Vlookup函数

【以 Excel2010 系列学习，用 Office LTSC 专业增强版 2021 实践】【本章小技巧】掌握vlookup使用方法，选区的第一列一定是查询参数条件一。使用通配符查询。vlookup 限 255 位长度。掌握日常使用场景。使用vlookup模糊匹配查询个税一、使用Vlookup函…...

编程日记 2024/12/20 21:03:48

【QT实战の心情笔记】

文章目录界面布局主要界面分为三部分：1. 笔记列表区域2. 笔记内容编辑区域3. 操作按钮区域 Qt Designer 界面设计步骤完整界面布局图各控件设置和属性Qt Designer 文件 (.ui) 数据库表结构SQL 表结构： 逻辑代码1. 项目结构2. Note 类 (Note.h 和 Note.c…...

编程日记 2024/12/20 21:01:46

图像生成工具WebUI

介绍 Stable Diffusion WebUI（AUTOMATIC1111，简称A1111）是一个为高级用户设计的图形用户界面（GUI），它提供了丰富的功能和灵活性，以满足复杂和高级的图像生成需求。如今各种人工智能满天飞&…...

编程日记 2024/12/20 21:00:45

排查常见的 MySQL性能问题

1. 查询速度慢：MySQL 数据库中最常见的性能问题之一是查询执行速度慢。缓慢的查询会增加等待时间和阻碍应用程序响应能力，从而显著影响用户体验。这些缓慢的查询可能由各种因素引起，例如缺少适当的索引、设计不佳的数据库架构、查询逻辑本身效…...

编程日记 2024/12/20 20:54:38

滑雪场管理系统

【毕业设计】基于SpringBoot Vue的滑雪场管理系统摘要随着信息化时代的快速发展，滑雪场作为冬季旅游的热门目的地，其管理效率和服务质量直接影响着游客的体验。为此，设计一个高效、安全、易用的滑雪场管理系统成为当务之急。本文详细阐述…...

编程日记 2024/12/20 20:45:28

docker详细操作--未完待续

docker介绍 docker官网: Docker：加速容器应用程序开发 harbor官网：Harbor - Harbor 中文使用docker加速器: Docker镜像极速下载服务 - 毫秒镜像是什么 Docker 是一种开源的容器化平台，用于将应用程序及其依赖项（如库、运行时环…...

编程新知 2026/2/5 4:33:24

基于距离变化能量开销动态调整的WSN低功耗拓扑控制开销算法matlab仿真

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.算法仿真参数 5.算法理论概述 6.参考文献 7.完整程序 1.程序功能描述通过动态调整节点通信的能量开销，平衡网络负载，延长WSN生命周期。具体通过建立基于距离的能量消耗模型&am…...

编程新知 2026/2/10 16:20:04

PHP和Node.js哪个更爽?

先说结论，rust完胜。 php：laravel，swoole，webman，最开始在苏宁的时候写了几年php，当时觉得php真的是世界上最好的语言，因为当初活在舒适圈里，不愿意跳出来，就好比当初活在…...

编程新知 2025/9/14 7:59:52

汽车生产虚拟实训中的技能提升与生产优化

在制造业蓬勃发展的大背景下，虚拟教学实训宛如一颗璀璨的新星，正发挥着不可或缺且日益凸显的关键作用，源源不断地为企业的稳健前行与创新发展注入磅礴强大的动力。就以汽车制造企业这一极具代表性的行业主体为例，汽车生产线上各类…...

编程新知 2026/1/27 7:46:36

从零开始打造 OpenSTLinux 6.6 Yocto 系统（基于STM32CubeMX）（九）

设备树移植和uboot设备树修改的内容同步到kernel将设备树stm32mp157d-stm32mp157daa1-mx.dts复制到内核源码目录下源码修改及编译修改arch/arm/boot/dts/st/Makefile，新增设备树编译 stm32mp157f-ev1-m4-examples.dtb \stm32mp157d-stm32mp157daa1-mx.dtb修改…...

编程新知 2026/2/5 12:11:18

VTK如何让部分单位不可见

最近遇到一个需求，需要让一个vtkDataSet中的部分单元不可见，查阅了一些资料大概有以下几种方式 1.通过颜色映射表来进行，是最正规的做法 vtkNew<vtkLookupTable> lut; //值为0不显示，主要是最后一个参数，透明度…...

编程新知 2025/12/12 4:55:21

微信小程序云开发平台MySQL的连接方式

注：微信小程序云开发平台指的是腾讯云开发先给结论：微信小程序云开发平台的MySQL，无法通过获取数据库连接信息的方式进行连接，连接只能通过云开发的SDK连接，具体要参考官方文档： 为什么？ 因为…...

编程新知 2026/2/1 5:24:17

Map相关知识

数据结构二叉树二叉树，顾名思义，每个节点最多有两个“叉”，也就是两个子节点，分别是左子节点和右子节点。不过，二叉树并不要求每个节点都有两个子节点，有的节点只有左子节点，有的节点只有…...

编程新知 2026/2/4 16:21:14

C#学习第29天：表达式树（Expression Trees）

目录什么是表达式树？ 核心概念 1.表达式树的构建 2. 表达式树与Lambda表达式 3.解析和访问表达式树 4.动态条件查询表达式树的优势 1.动态构建查询 2.LINQ 提供程序支持： 3.性能优化 4.元数据处理 5.代码转换和重写适用场景代码复杂性…...

编程新知 2025/10/20 9:03:01

C++实现分布式网络通信框架RPC(2)——rpc发布端

有了上篇文章的项目的基本知识的了解，现在我们就开始构建项目。目录一、构建工程目录二、本地服务发布成RPC服务 2.1理解RPC发布 2.2实现三、Mprpc框架的基础类设计 3.1框架的初始化类 MprpcApplication 代码实现 3.2读取配置文件类 MprpcConfig 代码实现…...

编程新知 2026/2/5 18:18:58