当前位置: 首页 > article >正文

Python+MediaPipe 实现实时手部关键点检测(新手避坑完整版)

PythonMediaPipe 实现实时手部关键点检测新手避坑完整版在计算机视觉领域手部关键点检测是一个非常基础且实用的需求无论是手势识别、人机交互还是手势控制都离不开它的支持。而 MediaPipe 作为 Google 开源的跨平台计算机视觉框架凭借其轻量、高效、易上手的特点成为了新手实现手部检测的首选工具。最近自己动手实操了 PythonMediaPipe 实时手部关键点检测过程中踩了不少环境兼容的坑比如 numpy 版本冲突、mediapipe 模块报错也优化了代码逻辑最终实现了稳定的实时检测效果——不仅能识别双手21个关键点还能显示每个关键点的编号和坐标。今天就把完整的实现过程、避坑指南分享给大家新手跟着做也能一次成功一、环境准备避坑核心很多新手会卡在环境搭建上尤其是 numpy、OpenCV、MediaPipe 三者的版本兼容问题这里直接给出经过实测、100% 稳定的版本组合避免大家走弯路。1. 基础环境Python 版本3.11亲测兼容3.9-3.11 均可依赖库numpy、opencv-python、mediapipe版本固定如下2. 一键安装命令复制直接运行打开 PyCharm 底部 Terminal 或 CMD 命令行依次执行以下命令先卸载可能冲突的旧版本再安装兼容版本# 卸载冲突库若之前安装过 pip uninstall -y numpy opencv-python opencv-contrib-python mediapipe # 安装稳定版本核心兼容组合 pip install numpy1.23.5 -i https://pypi.tuna.tsinghua.edu.cn/simple pip install opencv-python4.8.1.78 -i https://pypi.tuna.tsinghua.edu.cn/simple pip install mediapipe0.10.9 -i https://pypi.tuna.tsinghua.edu.cn/simple说明使用清华镜像源可以大幅提升下载速度避免超时版本固定是为了解决 “ABI 版本不兼容”“module has no attribute solutions” 等常见错误。二、核心原理简单科普不用深入理解复杂的算法新手只需记住这2个核心模块的作用就能看懂代码mediapipe.solutions.hands手部检测的核心模块可初始化手部识别模型设置检测参数如识别手的最大数量、检测置信度等。mediapipe.solutions.drawing_utils绘图工具模块用于将识别到的手部关键点和关节连线绘制到 OpenCV 捕获的画面中让检测结果可视化。补充MediaPipe 手部检测模型会自动识别手部21个关键点每个关键点对应手指的不同位置如指尖、关节我们可以通过这些关键点的坐标进一步实现手势判断后续会补充。三、完整代码可直接复制运行代码已优化修复了“关键点编号飘移”“画面颜色异常”等问题添加了详细注释新手也能轻松看懂每一步的作用import cv2 import mediapipe as mp # 1. 初始化绘图工具和手部检测模型 mp_drawing mp.solutions.drawing_utils # 绘制关键点和连线 mp_hands mp.solutions.hands # 手部检测核心模块 # 2. 配置手部检测参数关键参数说明 hands mp_hands.Hands( static_image_modeFalse, # 动态检测适用于视频/摄像头False更稳定 max_num_hands2, # 最多识别2只手 min_detection_confidence0.75, # 最小检测置信度越高越精准响应稍慢 min_tracking_confidence0.75 # 最小追踪置信度越高追踪越稳定 ) # 3. 打开电脑摄像头0表示默认摄像头 cap cv2.VideoCapture(0) # 4. 循环捕获画面实时检测手部 while True: # 读取摄像头画面 ret, frame cap.read() # 若读取失败如摄像头未打开直接退出循环 if not ret: break # 获取画面的宽和高用于将关键点坐标转换为像素坐标 h, w frame.shape[:2] # 镜像翻转画面更符合人眼观察习惯可选不想翻转可注释 frame cv2.flip(frame, 1) # 转换颜色空间OpenCV 默认是 BGRMediaPipe 需要 RGB frame_rgb cv2.cvtColor(frame, cv2.COLOR_BGR2RGB) # 执行手部检测不修改原始画面避免颜色异常 results hands.process(frame_rgb) # 5. 若检测到手部绘制关键点和编号 if results.multi_hand_landmarks: # 遍历每一只检测到的手 for hand_landmarks in results.multi_hand_landmarks: # 遍历每一个关键点绘制编号0-21 for idx, lm in enumerate(hand_landmarks.landmark): # 将关键点的归一化坐标0-1转换为像素坐标适配画面尺寸 x_pixel int(lm.x * w) y_pixel int(lm.y * h) # 在画面上绘制关键点编号绿色字体粗细2 cv2.putText( frame, str(idx), (x_pixel, y_pixel), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2 ) # 绘制手部关键点之间的连线默认样式可自定义 mp_drawing.draw_landmarks( frame, hand_landmarks, mp_hands.HAND_CONNECTIONS ) # 6. 显示检测画面 cv2.imshow(MediaPipe 实时手部关键点检测, frame) # 按 ESC 键退出ESC 的 ASCII 码是27 if cv2.waitKey(1) 27: break # 7. 释放资源关闭摄像头、关闭窗口 cap.release() cv2.destroyAllWindows()四、常见问题及解决方案新手必看结合我自己踩的坑整理了3个最常见的错误给出直接解决方案遇到问题直接对应查找即可1. 错误AttributeError: module mediapipe has no attribute solutions原因mediapipe 版本太低旧版本没有 solutions 模块。解决方案执行命令升级到指定版本pip install mediapipe0.10.9 -i https://pypi.tuna.tsinghua.edu.cn/simple2. 错误RuntimeError: module compiled against ABI version 0x1000009 but this version of numpy is 0x2000000原因numpy 版本过高或过低与 OpenCV 不兼容最常见的坑。解决方案卸载当前 numpy安装指定兼容版本pip install numpy1.23.5 -i https://pypi.tuna.tsinghua.edu.cn/simple3. 错误ImportError: numpy.core.multiarray failed to import原因numpy 安装不完整或与 OpenCV 依赖冲突。解决方案先卸载 numpy 和 opencv-python再重新安装参考前面的一键安装命令。五、运行效果及扩展方向1. 运行效果打开电脑摄像头画面会实时显示你的手部。每只手会被识别出21个关键点每个关键点有对应的数字编号0-21。关键点之间会有连线清晰显示手指的关节结构。按 ESC 键可退出检测。2. 扩展方向新手可尝试学会基础的手部检测后可以尝试这些进阶功能提升实用性根据关键点坐标判断手指伸直/弯曲状态实现“剪刀、石头、布”手势识别。计算关键点之间的距离实现手势控制如控制电脑音量、滑动页面。将检测结果保存为视频用于后续分析或演示。六、总结PythonMediaPipe 实现实时手部关键点检测核心难点在于环境版本兼容只要按照本文给出的版本组合安装依赖就能避开大部分坑。代码逻辑并不复杂主要分为“初始化模型→捕获画面→检测手部→绘制结果”四个步骤新手跟着注释一步步看就能轻松理解。如果运行过程中还有其他报错或者想尝试进阶功能欢迎在评论区留言交流 动手实操起来你会发现计算机视觉其实没有那么难

相关文章:

Python+MediaPipe 实现实时手部关键点检测(新手避坑完整版)

PythonMediaPipe 实现实时手部关键点检测(新手避坑完整版)在计算机视觉领域,手部关键点检测是一个非常基础且实用的需求,无论是手势识别、人机交互,还是手势控制,都离不开它的支持。而 MediaPipe 作为 Goog…...

Entity Framework Core 10向量搜索集成崩溃全复盘(含Microsoft.Data.Sqlite v8.0.10+OpenAI Embedding适配陷阱)

第一章:Entity Framework Core 10向量搜索集成崩溃全复盘(含Microsoft.Data.Sqlite v8.0.10OpenAI Embedding适配陷阱)崩溃现象与根本诱因 在 Entity Framework Core 10 中启用 SQLite 向量搜索时,应用在调用 SaveChangesAsync() …...

【Dify农业知识库开发实战指南】:20年专家亲授3大核心代码模块与5个避坑要点

第一章:Dify农业知识库开发实战导论Dify 是一款开源的低代码大模型应用开发平台,专为快速构建具备对话能力、知识检索与工作流编排能力的智能应用而设计。在农业数字化转型加速的背景下,将分散的农技文档、病虫害图谱、土壤参数标准、作物生长…...

人工智能知识体系(2026版)

人工智能知识体系 (AI Knowledge Architecture) 标记说明 • ● 高确定性:成熟稳定,可直接应用,风险可控 • ◐ 中确定性:技术可用但快速演进,需持续跟进 • ○ 低确定性:前沿探索,存在路径分歧,谨慎评估 关系类型: • 依赖关系(A → B):A是B的基础,需先掌握A • 并…...

别再乱改Serial参数了!深入解读ArduPilot地面站里Serial1到Serial7每个串口的预设功能

深入解析ArduPilot串口配置:从Serial1到Serial7的功能定位与避坑指南 当你第一次打开ArduPilot地面站的"全部参数表",看到Serial1到Serial7那一排神秘的参数时,是否感到困惑?特别是当某个串口显示为-1时,你是…...

让 AI 真正“听懂业务”并“按规矩办事”

一句话回顾:为什么 Agent 需要本体?本体为 AI Agent 提供了一幅“业务地图”。有了这幅地图的导航,Agent 才能在复杂的业务环境中看清方向,减少幻觉和错误。01 误区:本体不是另一个数据库或图谱很多人第一次接触“本体…...

深入K210人脸识别核心:手把手教你解读与优化196维特征值比对算法

深入K210人脸识别核心:手把手教你解读与优化196维特征值比对算法 在嵌入式AI领域,K210凭借其低功耗、高性能的特性成为人脸识别应用的理想选择。但真正让项目从"能运行"到"好用",关键在于对196维特征值算法的深度掌控——…...

从‘换脸’到‘换物’:手把手用Attention-GAN实现图片局部精准转换(避坑指南)

从‘换脸’到‘换物’:手把手用Attention-GAN实现图片局部精准转换(避坑指南) 在数字图像处理领域,生成对抗网络(GAN)技术已经从早期的整体风格迁移发展到如今的局部精准编辑。想象这样一个场景&#xff1a…...

SketchUp动态组件实战:用onClick函数制作一个能自动开关的门(附完整公式)

SketchUp动态组件实战:用onClick函数制作自动开关门 在建筑可视化与室内设计领域,交互式组件能显著提升方案展示的专业度与趣味性。想象一下,当客户点击你模型中的门扇时,它能像真实物体一样旋转开合——这种动态演示效果远比静态…...

Go的time.Ticker与time.Timer:精准的定时任务

Go的time.Ticker与time.Timer:精准的定时任务 在现代软件开发中,定时任务是常见的需求,无论是定时数据同步、周期性任务执行,还是超时控制,都需要精准的时间管理。Go语言的标准库提供了time.Ticker和time.Timer两种强…...

开发小店简易收支台账自动生成代码,给社区团购小微店铺,做每日营收支出,智能分类汇总对账。

一个非常接地气、适合社区小店老板娘/店主使用的完整方案:基于 Python 的「社区团购小微店铺简易收支台账自动生成系统」定位:每日记账 → 自动分类 → 汇总对账 → 台账输出一、实际应用场景描述典型场景:社区团购自提点 / 小微便利店&#…...

ModTheSpire终极指南:5分钟学会安装杀戮尖塔游戏模组

ModTheSpire终极指南:5分钟学会安装杀戮尖塔游戏模组 【免费下载链接】ModTheSpire External mod loader for Slay The Spire 项目地址: https://gitcode.com/gh_mirrors/mo/ModTheSpire 你是否厌倦了杀戮尖塔的原有玩法?想要体验全新角色、卡牌和…...

Kotlin的@OptIn与@RequiresOptIn:实验性API的使用

Kotlin作为一门现代化的编程语言,不断引入新特性以提升开发体验。某些功能在稳定之前需要经过充分测试,这时实验性API(Experimental API)便成为开发者提前体验新特性的窗口。为了管理这类API的使用风险,Kotlin提供了Re…...

RT-Thread设备驱动避坑指南:eMMC块设备注册成功却挂载失败?这5个配置细节要检查

RT-Thread设备驱动避坑指南:eMMC块设备注册成功却挂载失败的深度排查 当你看到list_device命令中eMMC块设备已经成功注册,却在执行dfs_mount时遭遇失败,这种"看得见却用不了"的情况往往比完全无法识别更令人抓狂。本文将带你深入五…...

GPT、BERT、LLaMA 这些模型类别怎么区分

最核心的一句:- BERT:偏“读懂”- GPT:偏“写出来”- LLaMA:本质上也是 GPT 这一路,只是是一个重要的开源/开放权重模型家族先看本质区别| 类别 | 结构 | 训练方式 | 擅长 ||---|---|---|---|| BERT | Encoder-only | …...

企业知识库问答系统的详细架构图

离线链路:把企业知识加工进知识库- 在线链路:用户提问后,检索、推理、生成答案总架构图──离线建库链路───────────────────────────────────数据源Confluence / SharePoint / 钉盘 / 飞书文档 / Git / …...

ViGEmBus虚拟游戏控制器驱动:终极安装与完整使用指南

ViGEmBus虚拟游戏控制器驱动:终极安装与完整使用指南 【免费下载链接】ViGEmBus Windows kernel-mode driver emulating well-known USB game controllers. 项目地址: https://gitcode.com/gh_mirrors/vi/ViGEmBus 你是否曾经遇到过这样的烦恼?想…...

3分钟解决Minecraft语言障碍:MASA全家桶汉化包终极指南

3分钟解决Minecraft语言障碍:MASA全家桶汉化包终极指南 【免费下载链接】masa-mods-chinese 一个masa mods的汉化资源包 项目地址: https://gitcode.com/gh_mirrors/ma/masa-mods-chinese 还在为MASA模组复杂的英文界面而烦恼吗?每次打开Minecraf…...

别再死记硬背了!用Wireshark抓包,5分钟搞懂PPP链路IP地址协商(IPCP)全过程

用Wireshark透视PPP链路:IP地址协商全流程实战解析 第一次接触PPP链路的IP地址协商时,那些Config-Request、Config-Ack报文交互总让人云里雾里。直到我用Wireshark亲手抓取IPCP报文,才真正理解了为什么PPP链路两端的设备可以不在同一网段却依…...

Linux系统崩溃别慌!手把手教你用Timeshift在Deepin/UOS上快速恢复桌面(含命令行救急指南)

Linux系统崩溃急救手册:Timeshift在Deepin/UOS上的全场景恢复指南 那天下午,我正在赶一份重要文档,Deepin系统突然弹出一个更新提示。像往常一样点击"立即更新"后,屏幕却陷入了黑屏循环重启的噩梦。作为深度系统三年老用…...

别再乱用@DateTimeFormat了!Spring Boot中处理前端日期传参的3种正确姿势(附Postman测试脚本)

别再乱用DateTimeFormat了!Spring Boot中处理前端日期传参的3种正确姿势(附Postman测试脚本) 最近在团队Code Review时,发现不少同事在处理日期参数时都存在一个共性误区——把DateTimeFormat和JsonFormat混为一谈。这直接导致接口…...

保姆级教程:在Ubuntu 20.04上搞定RoboSense 16线雷达驱动与点云格式转换(附编译避坑指南)

跨平台LiDAR数据融合实战:Ubuntu 20.04/22.04下的RoboSense-Velodyne点云转换全解析 当我们在多传感器融合项目中尝试整合不同品牌的激光雷达时,数据格式的差异往往会成为第一个"拦路虎"。最近在部署RoboSense 16线雷达时,我发现许…...

从零到一:用VuePress/Hexo搭建技术博客时,你必须搞懂的SEO配置(附完整代码)

从零到一:用VuePress/Hexo搭建技术博客时,你必须搞懂的SEO配置(附完整代码) 技术博客不仅是开发者记录学习历程的载体,更是个人品牌的重要展示窗口。但很多开发者发现,即使内容优质,博客流量依然…...

Azure AI 模型费用精细统计实战 — Cost Management API 按资源组/模型/Token 类型拆分

通过 Azure Cost Management API 精细统计 AI 模型(GPT/Embedding/Speech/Vision)的费用,按资源组、模型、Token 类型(Input/Output/Cached)拆分,支持第三方平台集成。 一、背景 Azure AI 费用在 Cost Management 中归类为 Foundry Models(不是 “Azure AI Services”)…...

酒店信息数据集,数据量1.1万条,包含多个字段,可以用于酒店评分/价格/销量预测大数据分析毕设

酒店信息数据集,数据量1.1万条,包含多个字段,可以用于酒店评分/价格/销量预测大数据分析毕设,具体字段如下:酒店ID 酒店名称 图片URL 推荐理由 星级代码 星级描述 评分 评分描述 评论标签 评论数量 历史消费人数 原价 …...

Qwen1.5-0.5B-Chat成本控制:低配服务器部署实战案例

Qwen1.5-0.5B-Chat成本控制:低配服务器部署实战案例 1. 项目背景与价值 在AI应用快速发展的今天,很多开发者和中小企业都面临一个现实问题:如何以最低成本获得可用的智能对话服务?大模型虽然效果惊艳,但对硬件要求高…...

别再死磕卡尔曼滤波了!用Python从零实现一个RBPF粒子滤波建图(附避坑指南)

从零实现RBPF粒子滤波建图:Python实战与避坑指南 在机器人定位与建图(SLAM)领域,粒子滤波方法因其对非线性系统的天然适应能力而备受青睐。但大多数教程停留在理论推导,真正动手实现时总会遇到各种"魔鬼细节"。本文将用Python带你完…...

手把手教你用奥比中光Gemini 335L和YOLOv8实现3D目标定位(附完整代码)

从2D到3D:基于Gemini 335L与YOLOv8的智能空间感知实战指南 当计算机视觉遇上深度感知,会碰撞出怎样的火花?想象一下,你的设备不仅能识别物体是什么,还能精确知道它离你有多远——这正是3D目标定位技术的魅力所在。本文…...

告别全局update!手把手教你写一个安全的UVM寄存器批量更新函数

告别全局update!手把手教你写一个安全的UVM寄存器批量更新函数 在SoC验证环境中,寄存器配置是最基础却最频繁的操作之一。每次看到验证工程师手动逐个调用set()和update()时,我总会想起自己刚入行时那段"复制粘贴到怀疑人生"的日子…...

告别临时目录!Petalinux 2020.1 如何直接引用本地Uboot和Kernel源码进行开发

告别临时目录!Petalinux 2020.1 直接引用本地Uboot和Kernel源码的工程实践 在嵌入式Linux开发领域,Xilinx的Petalinux工具链因其与Zynq系列SoC的深度整合而广受欢迎。然而,许多工程师在实际开发中都会遇到一个共同的痛点:默认的&q…...