当前位置: 首页 > news >正文

使用OpenCV和卡尔曼滤波器进行实时活体检测

引言

在现代计算机视觉应用中,实时检测和跟踪物体是一项重要的任务。本文将详细介绍如何使用OpenCV库和卡尔曼滤波器来实现一个实时的活体检测系统。该系统能够通过摄像头捕捉视频流,并使用YOLOv3模型来检测目标对象(例如人),同时利用卡尔曼滤波器来预测目标的运动轨迹。本文将逐步介绍代码的实现过程,并解释每个部分的功能。

1. 环境准备

在开始编写代码之前,确保已经安装了以下依赖库:

  • OpenCV
  • NumPy
  • FilterPy

可以使用pip命令来安装这些库:

pip install opencv-python numpy filterpy

2. 代码结构

2.1 导入必要的库

import cv2
import numpy as np
from filterpy.kalman import KalmanFilter
from filterpy.common import Q_discrete_white_noise

2.2 初始化卡尔曼滤波器

卡尔曼滤波器是一种用于估计线性动态系统的状态的算法。在这里,我们使用它来预测目标的位置和速度。

def init_kalman_filter():kf = KalmanFilter(dim_x=4, dim_z=2)kf.x = np.zeros((4, 1))  # 初始状态 [x, y, vx, vy]kf.F = np.array([[1, 0, 1, 0],[0, 1, 0, 1],[0, 0, 1, 0],[0, 0, 0, 1]], dtype=float)  # 状态转移矩阵kf.H = np.array([[1, 0, 0, 0],[0, 1, 0, 0]])  # 观测矩阵kf.P *= 1000  # 初始协方差kf.R = np.eye(2) * 5  # 测量噪声kf.Q = Q_discrete_white_noise(dim=4, dt=1, var=0.1)  # 过程噪声return kf

2.3 更新卡尔曼滤波器

每次获取新的观测值时,我们需要更新卡尔曼滤波器的状态。

def update_kalman_filter(kf, measurement):kf.predict()kf.update(measurement)return kf.x[0, 0], kf.x[1, 0], kf.x[2, 0], kf.x[3, 0]

2.4 实时检测函数

detect_live 函数是整个系统的核心,它负责从摄像头读取视频流,检测目标,并使用卡尔曼滤波器进行预测。

def detect_live(camera_index=0,motion_threshold=10,  # 移动的阈值min_confidence=0.5,  # 最小置信度debug=False,  # 是否显示调试窗口consecutive_motion_frames=5,  # 连续检测到移动的帧数target_class="person"  # 目标类别
):# 加载 YOLOv3 配置和权重文件net = cv2.dnn.readNet("yolov3.weights", "yolov3.cfg")# 加载类别名称with open("coco.names", "r") as f:classes = [line.strip() for line in f.readlines()]# 获取输出层名称layer_names = net.getLayerNames()try:output_layers = [layer_names[i[0] - 1] for i in net.getUnconnectedOutLayers()]except IndexError:output_layers = [layer_names[i - 1] for i in net.getUnconnectedOutLayers()]# 打开摄像头cap = cv2.VideoCapture(camera_index)if not cap.isOpened():print("无法打开摄像头。")returnprev_frame = Noneprev_centers = []  # 用于存储前几帧的目标中心点consecutive_motion_count = 0  # 连续检测到移动的帧数计数器is_target_detected = False  # 标志变量,用于记录当前帧中是否检测到目标类别kf = init_kalman_filter()  # 初始化卡尔曼滤波器try:while True:# 读取摄像头帧ret, frame = cap.read()if not ret:print("无法读取摄像头帧。")breakheight, width, _ = frame.shape# 对图像进行预处理blob = cv2.dnn.blobFromImage(frame, 0.00392, (416, 416), (0, 0, 0), True, crop=False)net.setInput(blob)outs = net.forward(output_layers)class_ids = []confidences = []boxes = []for out in outs:for detection in out:scores = detection[5:]class_id = np.argmax(scores)confidence = scores[class_id]if confidence > min_confidence:center_x = int(detection[0] * width)center_y = int(detection[1] * height)w = int(detection[2] * width)h = int(detection[3] * height)x = int(center_x - w / 2)y = int(center_y - h / 2)boxes.append([x, y, w, h])confidences.append(float(confidence))class_ids.append(class_id)if classes[class_id] == target_class:is_target_detected = True  # 检测到目标类别indexes = cv2.dnn.NMSBoxes(boxes, confidences, min_confidence, 0.4)# 将 indexes 转换为 NumPy 数组indexes = np.array(indexes)current_centers = []for i in indexes.flatten():x, y, w, h = boxes[i]label = str(classes[class_ids[i]])confidence = confidences[i]# 计算中心点center = ((x + x + w) // 2, (y + y + h) // 2)current_centers.append(center)if len(prev_centers) > 0 and label == target_class:# 如果有前一帧的数据,计算速度和方向prev_center = prev_centers[-1]distance = np.sqrt((center[0] - prev_center[0]) ** 2 + (center[1] - prev_center[1]) ** 2)speed = distance  # 单位是像素/帧direction = (center[0] - prev_center[0], center[1] - prev_center[1])# 更新卡尔曼滤波器x, y, vx, vy = update_kalman_filter(kf, np.array([center[0], center[1]]))# 简单的行为预测if speed > motion_threshold:consecutive_motion_count += 1else:consecutive_motion_count = 0# 如果连续检测到足够的移动,认为是活体if consecutive_motion_count >= consecutive_motion_frames:yield {"is_live": True, "speed": speed, "direction": direction, "predicted_position": (x, y),"predicted_velocity": (vx, vy)}consecutive_motion_count = 0  # 重置计数器else:consecutive_motion_count = 0# 在调试模式下绘制框if debug:color = (0, 255, 0) if label == target_class else (0, 0, 255)  # 绿色表示目标类别,红色表示其他类别# 确保坐标是整数类型x, y, w, h = int(x), int(y), int(w), int(h)cv2.rectangle(frame, (x, y), (x + w, y + h), color, 2)cv2.putText(frame, f"{label}: {confidence:.2f}", (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, color,2)if label == target_class:cv2.circle(frame, center, 5, (0, 0, 255), -1)cv2.circle(frame, (int(x), int(y)), 5, (0, 255, 0), -1)  # 预测位置# 更新前一帧的中心点列表prev_centers = current_centers# 如果没有检测到目标类别,输出不是活体if not is_target_detected:yield {"is_live": False}# 重置标志变量is_target_detected = False# 显示当前帧(仅在调试模式下)if debug:cv2.imshow('Live Detection', frame)# 按 'q' 键退出循环if cv2.waitKey(1) & 0xFF == ord('q'):breakfinally:# 释放摄像头并关闭所有窗口cap.release()cv2.destroyAllWindows()

2.5 主程序

主程序调用 detect_live 函数,并打印出检测结果。

if __name__ == "__main__":for result in detect_live(debug=True):if result["is_live"]:print(f"Is live: True, Speed: {result['speed']:.2f} pixels/frame, Direction: {result['direction']}, Predicted Position: {result['predicted_position']}, Predicted Velocity: {result['predicted_velocity']}")else:print("Is live: False")

3. 代码详解

3.1 初始化卡尔曼滤波器

卡尔曼滤波器初始化时定义了状态向量、状态转移矩阵、观测矩阵、初始协方差矩阵、测量噪声和过程噪声。这些参数决定了卡尔曼滤波器的性能。

3.2 更新卡尔曼滤波器

每次获取新的观测值时,卡尔曼滤波器会先进行预测,然后根据新的观测值更新状态。这样可以得到更准确的目标位置和速度估计。

3.3 实时检测

detect_live 函数首先加载YOLOv3模型,然后打开摄像头并开始读取视频流。对于每一帧,它都会进行以下操作:

  1. 对图像进行预处理。
  2. 使用YOLOv3模型进行目标检测。
  3. 使用非极大值抑制(NMS)去除重复的检测框。
  4. 计算目标的中心点。
  5. 如果检测到目标,计算目标的速度和方向。
  6. 更新卡尔曼滤波器以预测目标的未来位置。
  7. 在调试模式下绘制检测框和预测位置。
  8. 如果连续多帧检测到目标移动,认为是活体。
  9. 显示当前帧(仅在调试模式下)。

4. 结论

本文详细介绍了如何使用OpenCV和卡尔曼滤波器实现一个实时的活体检测系统。通过结合YOLOv3模型的强大检测能力和卡尔曼滤波器的预测能力,我们可以构建一个高效且准确的实时检测系统。这个系统可以应用于各种场景,如安全监控、自动驾驶等。

相关文章:

使用OpenCV和卡尔曼滤波器进行实时活体检测

引言 在现代计算机视觉应用中,实时检测和跟踪物体是一项重要的任务。本文将详细介绍如何使用OpenCV库和卡尔曼滤波器来实现一个实时的活体检测系统。该系统能够通过摄像头捕捉视频流,并使用YOLOv3模型来检测目标对象(例如人)&…...

【25春招前端八股文】——JS数据类型检测方式

检测数据类型 # typeof 总结:数组、对象、null都会被判断为object,其他判断都正确的类型。 可以检测基本数据类型null会检测为Object,因为null也是一个空的引用对象复杂数据类型只能检测function和Object 情况说明: 数组&#x…...

Kafka的学习路径规划

目录标题 1. 记(记忆力)Kafka核心概念Kafka关键配置 2. 懂(理解力)Kafka工作原理Kafka核心功能Kafka架构设计 3. 网(知识网络)技术栈整合用例和场景 4. 拓(全面拓展)学习材料多样化内…...

linux模拟试题

Linux 基础阶段考试笔试模拟试卷 审核人:王旺旺 一.填空题(每题 1 分,共 30 分) 1.验证 httpd 服务是否启动的命令是_______ 答:systemctl status httpd 或 netstat -anptl 或 ss -anpt 2.将目录 xxhf 下所有文件的所属组改为 user1 的命令是_______ 答:chown -R ,user1 …...

Qt-界面优化QSS

QSS介绍 先说下CSS: 在⽹⻚前端开发领域中, CSS 是⼀个⾄关重要的部分. 描述了⼀个⽹⻚的 "样式". 从⽽起到对⽹⻚美化的作⽤。 Qt 仿照 CSS 的模式, 引⼊了 QSS, 来对 Qt 中的控件做出样式上的设定 。 CSS的功能很强大,QSS要逊色一些&#…...

QT实战-qt各种菜单样式实现

本文主要介绍了qt普通菜单样式、带选中样式、带子菜单样式、超过一屏幕菜单样式、自定义带有滚动条的菜单样式, 先上图如下: 1.普通菜单样式 代码: m_pmenu new QMenu(this);m_pmenu->setObjectName("quoteListMenu"); qss文…...

深度学习基础03_BP算法(下)过拟合和欠拟合

目录 一、BP算法(下) 0、反向传播代码回顾 写法一: 写法二(更常用): 1、BP中的梯度下降 1.数学描述 2.传统下降方式 3.优化梯度下降方式 指数加权平均 Momentum AdaGrad RMSProp Adam(常用) 总结 二、过拟合和欠拟合 1、概念 1.过拟合 …...

web vue 滑动选择 n宫格选中 九宫格选中

页面动态布局经常性要交给客户来操作,他们按时他们的习惯在同一个屏幕内显示若干个子视图,尤其是在医学影像领域对于影像的同屏显示目视对比显的更为重要。 来看看如下的用户体验: 设计为最多支持5行6列页面展示后,右侧的布局则动…...

Spring Boot整合EasyExcel

Spring Boot整合EasyExcel主要涉及到以下几个步骤: 1.添加EasyExcel依赖到Spring Boot项目的pom.xml文件中。 2.创建数据模型类,用于映射Excel文件中的数据。 3.编写读取和写入Excel的服务。 以下是一个简单的例子: 1.添加EasyExcel依赖 …...

微软表示不会使用你的 Word、Excel 数据进行 AI 训练

​微软否认使用 Microsoft 365 应用程序(包括 Word、Excel 和 PowerPoint)收集数据来训练公司人工智能 (AI) 模型的说法。 此前,Tumblr 的一篇博文声称,雷德蒙德使用“互联体验”功能抓取客户的 Word 和 Excel 数据,用…...

JavaScript(一)

1.JavaScript 基本使用 2.JavaScript简单事件 3.JavaScript修改样式 4.JavaScript数据类型 JavaScript和Java有什么关系 知识点一 JavaScript基本使用 JS写在哪 还有一种写在中间的&#xff0c;也就是<head>里面 JS一些注意事项 JS修改元素内容 #JS获取对象<…...

Day 32 动态规划part01

今天正式开始动态规划! 理论基础 无论大家之前对动态规划学到什么程度,一定要先看 我讲的 动态规划理论基础。 如果没做过动态规划的题目,看我讲的理论基础,会有感觉 是不是简单题想复杂了? 其实并没有,我讲的理论基础内容,在动规章节所有题目都有运用,所以很重要!…...

winform跨线程更新界面

前言&#xff1a; 大家好&#xff0c;我是上位机马工&#xff0c;硕士毕业4年年入40万&#xff0c;目前在一家自动化公司担任软件经理&#xff0c;从事C#上位机软件开发8年以上&#xff01;我们在开发C#程序的时候&#xff0c;有时候需要在非Ui主线程更新界面&#xff0c;为了…...

【合作原创】使用Termux搭建可以使用的生产力环境(二)

前言 上期文章没看的可以先从上期文章开始看起 【合作原创】使用Termux搭建可以使用的生产力环境&#xff08;一&#xff09;-CSDN博客 目前我们已经完成了FinalShell ssh连接手机Termux的功能了&#xff0c;这期我们继续朝我们的目标前进。今天早上有读者进群以为生成环境指…...

微积分复习笔记 Calculus Volume 2 - 3.3 Trigonometric Substitution

3.3 Trigonometric Substitution - Calculus Volume 2 | OpenStax...

vue2+svg+elementui实现花瓣图自定义el-select回显色卡图片

项目需要实现花瓣图&#xff0c;但是改图表在echarts&#xff0c;highCharts等案例中均未出现&#xff0c;有类似的韦恩图&#xff0c;但是和需求有所差距&#xff1b; 为实现该效果&#xff0c;静态图表上采取svg来手动绘制花瓣&#xff1a; 确定中心点&#xff0c;以该点为中…...

记录一次网关异常

记一次网关异常 网关时不时就会出现下面的异常。关键是不知道什么时候就会报错&#xff0c;并且有时候就算什么都不操作&#xff0c;也会导致这个异常。 ERROR org.springframework.scheduling.support.TaskUtils$LoggingErrorHandler - Unexpected error occurred in schedul…...

计算机网络——不同版本的 HTTP 协议

介绍 HTTP&#xff0c;即超文本传输协议&#xff08;HyperText Transfer Protocol&#xff09;&#xff0c;是应用层的一个简单的请求-响应协议&#xff0c;它指定了客户端可能发送给服务器什么样的消息以及得到什么样的响应。本文将介绍 HTTP 协议各个版本。 HTTP/1.0 HTTP/1…...

使用 LLaMA-Factory 微调

git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory pip install -e . pip install tf-keras[dataset_info.json](dataset_info.json) 包含了所有可用的数据集。如果您希望使用自定义数据集&#xff0c;请**务必**在 dataset_info.json 文件中添加*数据…...

vue2 虚拟DOM 和 真实DOM (概念、作用、Diff 算法)

虚拟 DOM 和 真实DOM&#xff08;概念、作用、Diff 算法&#xff09; 1.1 概念 真实 DOM&#xff08;Document Object Model&#xff09;&#xff1a;是浏览器中用于表示文档结构的树形结构。 <h2>你好</h2>虚拟DOM&#xff1a;用 JavaScript 对象来模拟真实 DOM…...

React Native在HarmonyOS 5.0阅读类应用开发中的实践

一、技术选型背景 随着HarmonyOS 5.0对Web兼容层的增强&#xff0c;React Native作为跨平台框架可通过重新编译ArkTS组件实现85%以上的代码复用率。阅读类应用具有UI复杂度低、数据流清晰的特点。 二、核心实现方案 1. 环境配置 &#xff08;1&#xff09;使用React Native…...

unix/linux,sudo,其发展历程详细时间线、由来、历史背景

sudo 的诞生和演化,本身就是一部 Unix/Linux 系统管理哲学变迁的微缩史。来,让我们拨开时间的迷雾,一同探寻 sudo 那波澜壮阔(也颇为实用主义)的发展历程。 历史背景:su的时代与困境 ( 20 世纪 70 年代 - 80 年代初) 在 sudo 出现之前,Unix 系统管理员和需要特权操作的…...

C++.OpenGL (10/64)基础光照(Basic Lighting)

基础光照(Basic Lighting) 冯氏光照模型(Phong Lighting Model) #mermaid-svg-GLdskXwWINxNGHso {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-GLdskXwWINxNGHso .error-icon{fill:#552222;}#mermaid-svg-GLd…...

多模态大语言模型arxiv论文略读(108)

CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文标题&#xff1a;CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文作者&#xff1a;Sayna Ebrahimi, Sercan O. Arik, Tejas Nama, Tomas Pfister ➡️ 研究机构: Google Cloud AI Re…...

使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台

🎯 使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台 📌 项目背景 随着大语言模型(LLM)的广泛应用,开发者常面临多个挑战: 各大模型(OpenAI、Claude、Gemini、Ollama)接口风格不统一;缺乏一个统一平台进行模型调用与测试;本地模型 Ollama 的集成与前…...

华为OD机考-机房布局

import java.util.*;public class DemoTest5 {public static void main(String[] args) {Scanner in new Scanner(System.in);// 注意 hasNext 和 hasNextLine 的区别while (in.hasNextLine()) { // 注意 while 处理多个 caseSystem.out.println(solve(in.nextLine()));}}priv…...

给网站添加live2d看板娘

给网站添加live2d看板娘 参考文献&#xff1a; stevenjoezhang/live2d-widget: 把萌萌哒的看板娘抱回家 (ノ≧∇≦)ノ | Live2D widget for web platformEikanya/Live2d-model: Live2d model collectionzenghongtu/live2d-model-assets 前言 网站环境如下&#xff0c;文章也主…...

小木的算法日记-多叉树的递归/层序遍历

&#x1f332; 从二叉树到森林&#xff1a;一文彻底搞懂多叉树遍历的艺术 &#x1f680; 引言 你好&#xff0c;未来的算法大神&#xff01; 在数据结构的世界里&#xff0c;“树”无疑是最核心、最迷人的概念之一。我们中的大多数人都是从 二叉树 开始入门的&#xff0c;它…...

Modbus RTU与Modbus TCP详解指南

目录 1. Modbus协议基础 1.1 什么是Modbus? 1.2 Modbus协议历史 1.3 Modbus协议族 1.4 Modbus通信模型 🎭 主从架构 🔄 请求响应模式 2. Modbus RTU详解 2.1 RTU是什么? 2.2 RTU物理层 🔌 连接方式 ⚡ 通信参数 2.3 RTU数据帧格式 📦 帧结构详解 🔍…...

【UE5 C++】通过文件对话框获取选择文件的路径

目录 效果 步骤 源码 效果 步骤 1. 在“xxx.Build.cs”中添加需要使用的模块 &#xff0c;这里主要使用“DesktopPlatform”模块 2. 添加后闭UE编辑器&#xff0c;右键点击 .uproject 文件&#xff0c;选择 "Generate Visual Studio project files"&#xff0c;重…...