当前位置：首页 > news >正文

基于 RealSense D435相机实现手部姿态检测

news 2026/2/9 10:43:45

基于 RealSense D435i相机进行手部姿态检测，其中采用 Mediapipe 进行手部检测，以下是详细步骤：

Mediapipe 是一个由 Google开发的开源框架，专门用于构建多媒体处理管道，特别是计算机视觉和机器学习任务。它提供了一系列预训练的模型和工具，可以用于实时处理图像和视频流。
主要功能：

手部检测：可以检测并跟踪手部的位置和姿态。
面部检测：识别面部特征点，用于表情识别和面部跟踪。
姿态估计：检测人体的关键点，用于运动分析和健身应用。
物体检测：实现物体检测和识别，适用于各种场景。
语音识别：支持音频处理和语音识别功能。

主要特点：

高效性：能够在移动设备和边缘设备上运行，具备良好的性能。
跨平台：支持多种操作系统和设备，包括 Android、iOS 和桌面环境。
易于使用：提供简单的 API，方便开发者快速集成和使用。

使用场景：

Mediapipe 被广泛应用于增强现实、游戏开发、健康监测、安防监控等领域。
可以访问 Mediapipe的官方文档了解详细内容和使用示例。

一、手部姿态检测

步骤 1: 安装所需库

首先，请确保您已经安装了 Python 和 pip。然后，通过以下命令安装所需库：

pip install pyrealsense2 opencv-python mediapipe numpy

步骤 2: 设置 RealSense D435i

确保您的 RealSense D435 相机已正确连接，并安装了 RealSense SDK。
可以从 Intel 的 RealSense SDK 页面获取更多信息。

步骤 3: 演示代码

以下是一个整合了 RealSense D435i 和 Mediapipe 手部检测的 Python 脚本示例。具体的实现细节可能需要根据需求进行调整。

import cv2
import numpy as np
import pyrealsense2 as rs
import mediapipe as mp# 初始化 Mediapipe 手部模块
mp_hands = mp.solutions.hands
hands = mp_hands.Hands(static_image_mode=False, max_num_hands=2, min_detection_confidence=0.7)
mp_drawing = mp.solutions.drawing_utils# 配置 RealSense 流
pipeline = rs.pipeline()
config = rs.config()
config.enable_stream(rs.stream.depth, 640, 480, rs.format.z16, 30)
config.enable_stream(rs.stream.color, 640, 480, rs.format.bgr8, 30)# 启动流
pipeline.start(config)try:while True:# 等待获取新的帧frames = pipeline.wait_for_frames()color_frame = frames.get_color_frame()if not color_frame:continue# 将图像转换为 NumPy 数组image = np.asanyarray(color_frame.get_data())# 转换颜色空间image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)image_rgb.flags.writeable = False# 使用 Mediapipe 检测手部results = hands.process(image_rgb)# 绘制手部标记image_rgb.flags.writeable = Trueif results.multi_hand_landmarks:for hand_landmarks in results.multi_hand_landmarks:mp_drawing.draw_landmarks(image_rgb, hand_landmarks, mp_hands.HAND_CONNECTIONS)# 在这里可以调用 Dex-Retargeting 算法，处理 hand_landmarks# dex_retargeting_function(hand_landmarks)# 显示结果cv2.imshow('Hand Tracking', image_rgb)if cv2.waitKey(1) & 0xFF == ord('q'):breakfinally:# 停止流pipeline.stop()cv2.destroyAllWindows()

步骤 4: 运行代码

将上述代码保存为 hand_tracking.py，然后在终端中运行：

python hand_tracking.py

在这里插入图片描述

二、记录/打印手指关节姿态

1、修改上述步骤 3的演示代码

# 定义手指的关键点索引范围
finger_indices = {"thumb": range(0, 5),"index": range(5, 9),"middle": range(9, 13),"ring": range(13, 17),"pinky": range(17, 21)
}try:while True:# 等待新帧frames = pipeline.wait_for_frames()color_frame = frames.get_color_frame()depth_frame = frames.get_depth_frame()if not color_frame or not depth_frame:continue# 转换为 numpy 数组img = cv2.cvtColor(np.asanyarray(color_frame.get_data()), cv2.COLOR_RGB2BGR)# 处理手部检测results = hands.process(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))if results.multi_hand_landmarks:for hand_landmarks in results.multi_hand_landmarks:# 绘制手部关键点mp_drawing.draw_landmarks(img, hand_landmarks, mp_hands.HAND_CONNECTIONS)# 提取并打印每个手指的关键点空间姿态for finger, indices in finger_indices.items():keypoints = [(hand_landmarks.landmark[i].x, hand_landmarks.landmark[i].y, hand_landmarks.landmark[i].z) for i in indices]print(f"{finger} keypoints: {keypoints}")# 将手指关节姿态信息写入文件with open('hand_landmarks.txt', 'a') as f:f.write(f"{finger}: {keypoints}\n")

2、结果显示和分析

thumb: [(0.9687821865081787, 0.6210590600967407, 3.910763268777373e-07), (0.9071911573410034, 0.6109362840652466, -0.03194861114025116), (0.8624528646469116, 0.554160475730896, -0.04743020609021187), (0.8405251502990723, 0.49807286262512207, -0.06013686582446098), (0.8232850432395935, 0.4591226577758789, -0.0727970078587532)]
index: [(0.9149847626686096, 0.4301099479198456, -0.02639639377593994), (0.9145824909210205, 0.3440428376197815, -0.04998774453997612), (0.9162378907203674, 0.2871255874633789, -0.07186762243509293), (0.9200422763824463, 0.23657603561878204, -0.08782264590263367)]
middle: [(0.9503715634346008, 0.4127236604690552, -0.02441730722784996), (0.9643440246582031, 0.31598132848739624, -0.042417172342538834), (0.9733370542526245, 0.2534366846084595, -0.05844615772366524), (0.9829654097557068, 0.19702278077602386, -0.07070045918226242)]
ring: [(0.9794745445251465, 0.41305306553840637, -0.026965150609612465), (0.9923086762428284, 0.3207796812057495, -0.04289492592215538), (1.0009437799453735, 0.2619915306568146, -0.05437065660953522), (1.0100406408309937, 0.21127769351005554, -0.06270640343427658)]
pinky: [(1.0050956010818481, 0.42907220125198364, -0.033185433596372604), (1.018389105796814, 0.3570478856563568, -0.046027250587940216), (1.024712324142456, 0.31118300557136536, -0.0520443469285965), (1.030387043952942, 0.2696005702018738, -0.05643028765916824)]

上述代码打印的信息表示了拇指各个关节在三维空间中的位置坐标。具体来说，每个元组代表一个关节的 (x)、(y) 和 (z)坐标，解释如下：

拇指的关节列表：

thumb：表示这是拇指的关键点信息。
里面的每个元组均表示拇指某个关节的空间坐标。

坐标含义：

每个元组包含三个值：
(x): 表示该关节在图像宽度方向上的相对位置，值范围为 0 到 1。
(y): 表示该关节在图像高度方向上的相对位置，值范围为 0 到 1。
(z): 表示关节相对于手掌的深度值（通常是负值表示离相机更远，正值则表示更近）。

对于拇指的五个关节，上述打印的坐标信息分别是：

第一个关节（根部）: ((0.9688, 0.6211, 0))
第二个关节: ((0.9072, 0.6109, -0.0319))
第三个关节: ((0.8625, 0.5542, -0.0474))
第四个关节: ((0.8405, 0.4981, -0.0601))
第五个关节（指尖）: ((0.8233, 0.4591, -0.0728))
这些数据可以用于分析拇指的姿态和运动，帮助实现手势识别或其他与手部交互相关的应用。

三、注意事项

确保 RealSense D435i 相机已连接并正常工作。
若有其他依赖项或运行环境问题，请根据错误提示进行调试。
调整 min_detection_confidence 和 min_tracking_confidence 以提高检测效果。

通过这些步骤，可以实现手部姿态检测，并将每个手指的关节空间姿态信息保存到文件中。

基于 RealSense D435相机实现手部姿态检测

基于 RealSense D435i相机进行手部姿态检测，其中采用 Mediapipe 进行手部检测，以下是详细步骤： Mediapipe 是一个由 Google开发的开源框架，专门用于构建多媒体处理管道，特别是计算机视觉和机器学习任务。它提供了一系列…...

编程日记 2024/9/29 18:43:30

linux 下mailx 的使用。发送短信

1. 安装 mailx yum install -y mailx 2.请求数字证书 163 邮箱 mkdir -p /root/.certs/ ####创建目录，用来存放证书 echo -n | openssl s_client -connect smtp.163.com:465 | sed -ne /-BEGIN CERTIFICATE-/,/-END CERTIFICATE-/p >…...

编程日记 2024/9/29 18:41:26

把网易云音乐的网页源码复制出来，粘贴在hbuilder中，运行于浏览器，为什么没有任何内容显示？

在将网易云音乐的网页源码复制并粘贴到HBuilder中后，如果运行于浏览器时没有任何内容显示，这可能是由于以下几个原因造成的： 1. 外部资源加载问题 ‌资源路径错误‌：网易云音乐的网页源码中可能包含大量的外部资源链接，如CSS、JavaScript文件、图片等。当这些资源链接的路…...

编程日记 2024/9/29 18:40:25

excel怎么转换json

如何将 Excel 转换为 JSON 方法一：使用内置函数在 Excel 中选择要转换的数据范围。转到“数据”选项卡 > “获取外部数据”组 > “自其他来源” > “JSON”。在“从文件”对话框中，选择要保存 JSON 文件的位置，然后单击“导入”…...

编程日记 2024/9/29 18:38:23

二、认识大模型

认识大模型什么是大模型？发展趋势AGI是不是泡沫大模型对比【时效】大模型特点大模型技术原理向量化除了向量化，大模型还具有特征提取特点总结结语什么是大模型？ 大模型是大规模语言模型（Large Language Model）的简…...

编程日记 2024/9/29 18:37:22

2024年【电工（高级）】考试题及电工（高级）考试内容

题库来源：安全生产模拟考试一点通公众号小程序电工（高级）考试题根据新电工（高级）考试大纲要求，安全生产模拟考试一点通将电工（高级）模拟考试试题进行汇编，组成一套电工…...

编程日记 2024/9/29 18:36:20

Unity中分辨率适配

在Unity中，分辨率适配问题是一个常见的挑战，尤其是在开发跨平台游戏时。为了确保你的游戏在不同设备上都能良好显示，以下是一些解决方案和最佳实践： 1. 使用Canvas Scaler 在UI的Canvas组件中，设置 UI Scale Mode …...

编程日记 2024/9/29 18:34:17

图像处理基础知识点简记

简单记录一下图像处理的基础知识点一、取样 1、释义图像的取样就是图像在空间上的离散化处理，即使空间上连续变化的图像离散化, 决定了图像的空间分辨率。 2、过程简单描述一下图象取样的基本过程，首先用一个网格把待处理的图像覆盖，然后把每一小格上模拟图像的各个…...

编程日记 2024/9/29 18:33:15

微信小程序-使用vant组件库

文章目录微信小程序-使用vant组件库概述构建npm构建步骤使用vant注册使用添加事件使用插槽样式覆盖解除样式隔离使用外部样式类使用CSS变量微信小程序-使用vant组件库概述 Vant Weapp 是有赞前端团队开源的小程序 UI 组件库，基于微信小程序的自定义组件开发&a…...

编程日记 2024/9/29 18:32:14

Java【注解】

概述 ①Java的注解又称标注，它是程序的元数据，也是程序代码的标记，主要添加到程序代码上，作说明和解释。元数据是用来描述数据的一种数据。 ②Java中的注解可用于类、构造方法、成员变量、方法、参数等的声明中，注解…...

编程日记 2024/9/29 18:29:11

基于安卓开发大型体育场管理系统的设计与实现（源码+定制+讲解)

博主介绍： ✌我是阿龙，一名专注于Java技术领域的程序员，全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师，我在计算机毕业设计开发方面积累了丰富的经验。同时，我也是掘金、华为云、阿里云、InfoQ等平台…...

编程日记 2024/9/29 18:28:09

【Go】-Websocket的使用

目录为什么需要websocket 使用场景在线教育视频弹幕 Web端即时通信方式什么是web端即时通讯技术？ 轮询长轮询长连接 SSE websocket 通信方式总结 Websocket介绍协议升级连接确认数据帧 socket和websocket 常见状态码 gorilla/websocket实…...

编程日记 2024/9/29 18:27:07

怎么查看员工电脑安装了什么软件

1、使用专业监控软件：安装如金刚钻信息网站行为审计系统、WorkWin等专业的电脑监控软件。这些软件能够实时监控员工的电脑操作，包括安装的软件、运行的程序等。通过软件的管理端，您可以轻松查看员工电脑上安装的所有软件，并可以设…...

编程日记 2024/9/29 18:26:05

面积开运算bwareaopen

一个非常有用的二值图像形态学后处理算法，建立在连通分量分析的基础之上。 bwareaopen 从二值图像中删除小对象语法 BW2 bwareaopen(BW,P) BW2 bwareaopen(BW,P,conn) 说明 BW2 bwareaopen(BW,P) 从二值图像 BW 中删除少于 P 个像素的所有连通分量&#x…...

编程日记 2024/9/29 18:25:04

TortoiseGit 下载和安装

下载 1，下载路径 Download – TortoiseGit – Windows Shell Interface to Git 2，选择windows64的， 3，下载完成后安装 1，双击运行，点击next 2，点击next 3，点击next 4&#xff0…...

编程日记 2024/9/29 18:24:03

0x09 瑞友应用虚拟化系统 GetBSAppUrl SQL注入漏洞 - 复现

参考：瑞友应用虚拟化系统 GetBSAppUrl SQL注入漏洞 | PeiQi文库 (wgpsec.org) 漏洞描述瑞友应用虚拟化系统中的 GetBSAppUrl 方法存在 SQL注入漏洞。由于请求参数未经过滤，攻击者可以利用此漏洞执行恶意SQL查询，从而获取数据库中的敏感信息。漏洞影响受影响版本：瑞友…...

编程日记 2024/9/29 18:22:00

C++(Qt)软件调试---内存调试器Dr.Memory（21）

C(Qt)软件调试—内存调试器Dr. Memory（21） 文章目录 C(Qt)软件调试---内存调试器Dr. Memory（21）[toc]1、概述🐜2、安装Dr.Memory🪲3、命令行使用Dr.Memory🦗4、Qt Creator集成使用Dr.Memory&…...

编程日记 2024/9/29 18:17:54

Python3自带HTTP服务：轻松开启与后台管理

Python3自带有http服务，可以在服务器，也可以在本地启动，并运行一些常用的网页程序。比如：我们可以把streamlit框架编写的网页放到服务器上，开启http服务，就可以通过网页来调用这个pythont程序了&#xff0c…...

编程日记 2024/9/29 18:16:53

传统行业选择企业大文件传输系统需要注意哪些？

数字化转型的洪流中，传统行业正经历着前所未有的挑战与机遇。随着数据量的激增，企业大文件传输系统的选型成为了一个至关重要的议题。今天小编将深入探讨传统行业在这一过程中的考量因素，并以镭速企业大文件传输系统为例，展示其如…...

编程日记 2024/9/29 18:15:52

如何配置路由器支持UDP

一、UDP协议简介 UDP是一种传输层协议，与TCP（传输控制协议）不同，它不需要建立连接，因此传输速度较快。由于UDP不需要确认数据包的接收状态，它适用于不需要严格数据完整性但需要低延迟的场景。常见的UDP应…...

编程日记 2024/9/29 18:14:51

大话软工笔记—需求分析概述

需求分析，就是要对需求调研收集到的资料信息逐个地进行拆分、研究，从大量的不确定“需求”中确定出哪些需求最终要转换为确定的“功能需求”。需求分析的作用非常重要，后续设计的依据主要来自于需求分析的成果，包括: 项目的目的…...

编程新知 2026/1/28 10:58:50

dedecms 织梦自定义表单留言增加ajax验证码功能

增加ajax功能模块，用户不点击提交按钮，只要输入框失去焦点，就会提前提示验证码是否正确。一，模板上增加验证码 <input name"vdcode"id"vdcode" placeholder"请输入验证码" type"text&quo…...

编程新知 2026/2/5 17:51:52

linux arm系统烧录

1、打开瑞芯微程序 2、按住linux arm 的 recover按键插入电源 3、当瑞芯微检测到有设备 4、松开recover按键 5、选择升级固件 6、点击固件选择本地刷机的linux arm 镜像 7、点击升级 （忘了有没有这步了估计有） 刷机程序和镜像就不提供了。要刷的时…...

编程新知 2026/2/6 20:07:35

LabVIEW双光子成像系统技术

双光子成像技术的核心特性双光子成像通过双低能量光子协同激发机制，展现出显著的技术优势： 深层组织穿透能力：适用于活体组织深度成像高分辨率观测性能：满足微观结构的精细研究需求低光毒性特点：减少对样本的损伤…...

编程新知 2026/1/31 13:04:44

LOOI机器人的技术实现解析：从手势识别到边缘检测

LOOI机器人作为一款创新的AI硬件产品，通过将智能手机转变为具有情感交互能力的桌面机器人，展示了前沿AI技术与传统硬件设计的完美结合。作为AI与玩具领域的专家，我将全面解析LOOI的技术实现架构，特别是其手势识别、物体识别和环境…...

编程新知 2025/6/10 21:22:04

Python网页自动化Selenium中文文档

1. 安装 1.1. 安装 Selenium Python bindings 提供了一个简单的API，让你使用Selenium WebDriver来编写功能/校验测试。通过Selenium Python的API，你可以非常直观的使用Selenium WebDriver的所有功能。 Selenium Python bindings 使用非常简洁方便的A…...

编程新知 2026/1/23 18:15:21

【大模型】RankRAG：基于大模型的上下文排序与检索增强生成的统一框架

文章目录 A 论文出处B 背景B.1 背景介绍B.2 问题提出B.3 创新点 C 模型结构C.1 指令微调阶段C.2 排名与生成的总和指令微调阶段C.3 RankRAG推理：检索-重排-生成 D 实验设计E 个人总结 A 论文出处论文题目：RankRAG：Unifying Context Ranking…...

编程新知 2026/2/5 1:38:59

Yii2 项目自动上报Bug 原理 yii2在程序报错时, 会执行指定action, 通过重写ErrorAction, 实现Bug自动提交至GitLab的issue 步骤配置SiteController中的actions方法 public function actions(){return [error > [class > app\helpers\web\ErrorAction,],];}重写Error…...

编程新知 2025/12/17 3:27:17