当前位置: 首页 > article >正文

YOLO26-Pose端到端部署:告别NMS!人体与工业部件关键点检测实战

做关键点检测的同学肯定都被NMS后处理折腾过尤其是边缘部署的时候NMS不仅耗时占比能到30%不同框架的NMS实现还不一样很容易出现精度对齐问题改半天都对不齐训练时的效果。上个月做消费电子厂的连接器引脚平整度检测项目我用了YOLO26-Pose第一次体会到什么叫部署爽完全不需要NMS后处理只需要做个阈值过滤10行代码就能写完推理逻辑在RK3588上跑到68FPS比之前用的YOLOv8-Pose快了32%引脚关键点的检测精度还高了2.1%。今天就把YOLO26-Pose的实战部署流程分享给大家不管是人体关键点还是工业部件关键点检测部署效率至少提升一倍。一、YOLO26-Pose的核心优势真·端到端无NMS之前的YOLO-Pose系列虽然也是端到端训练但推理的时候还是需要用NMS去重检测框本质上还是Anchor-based的思路而YOLO26-Pose做了两个核心改进彻底干掉了NMSOne-to-One标签分配每个GT目标只分配一个正样本不会出现多个预测框对应同一个目标的情况自然不需要NMS去重检测框关键点联合预测每个输出头同时预测检测框坐标、置信度和关键点坐标后处理只需要过滤置信度低于阈值的结果就行这个改进对部署太友好了后处理逻辑从几十行变成10行以内不需要适配不同框架的NMS插件边缘端部署的时候速度提升特别明显而且不会出现NMS导致的精度损失。二、实战场景1人体关键点检测先拿大家最熟悉的COCO人体关键点检测举例从训练到部署全流程。2.1 训练YOLO26的官方库已经内置了Pose的配置直接用就行训练命令和普通YOLO一样# 训练人体关键点模型yolo trainmodelyolov26n-pose.yamldatacoco-pose.yamlepochs100batch32imgsz640我训练的YOLO26n-Pose在COCO val上的mAP是68.2%比YOLOv8n-Pose高1.5%推理速度还快了20%。2.2 模型导出重点来了导出的时候不需要任何NMS插件直接导出纯ONNX模型就行yoloexportmodelyolov26n-pose.ptformatonnxsimplifyTrueopset11导出的ONNX模型输出只有一个Tensor形状是(1, 20160, 17*35)其中20160是预测框的数量前5个值是x1,y1,x2,y2,conf后面是17个关键点的x,y,conf2.3 推理代码实现推理代码特别简单10行就能搞定后处理importcv2importnumpyasnpimportonnxruntimeasrtclassYOLO26Pose:def__init__(self,model_path,conf_thres0.5):self.sessionrt.InferenceSession(model_path,providers[CPUExecutionProvider])self.conf_thresconf_thres self.input_size(640,640)self.num_kpts17# COCO人体关键点数量defpreprocess(self,img_path):imgcv2.imread(img_path)self.org_h,self.org_wimg.shape[:2]# 等比例缩放填充scalemin(self.input_size[0]/self.org_h,self.input_size[1]/self.org_w)new_h,new_wint(self.org_h*scale),int(self.org_w*scale)img_resizedcv2.resize(img,(new_w,new_h))pad_h,pad_w(self.input_size[0]-new_h)//2,(self.input_size[1]-new_w)//2img_paddedcv2.copyMakeBorder(img_resized,pad_h,self.input_size[0]-new_h-pad_h,pad_w,self.input_size[1]-new_w-pad_w,cv2.BORDER_CONSTANT,value(114,114,114))# 归一化img_inputimg_padded.transpose(2,0,1)[np.newaxis,:,:,:].astype(np.float32)/255.0returnimg_input,scale,pad_h,pad_wdefpredict(self,img_path):img_input,scale,pad_h,pad_wself.preprocess(img_path)outputsself.session.run(None,{self.session.get_inputs()[0].name:img_input})[0][0]# 后处理只过滤置信度不需要NMSresultsoutputs[outputs[:,4]self.conf_thres]keypoints_results[]forresinresults:# 还原检测框坐标x1int((res[0]-pad_w)/scale)y1int((res[1]-pad_h)/scale)x2int((res[2]-pad_w)/scale)y2int((res[3]-pad_h)/scale)confres[4]# 还原关键点坐标kpts[]foriinrange(self.num_kpts):kxint((res[5i*3]-pad_w)/scale)kyint((res[5i*31]-pad_h)/scale)kconfres[5i*32]kpts.append((kx,ky,kconf))keypoints_results.append({box:[x1,y1,x2,y2],conf:conf,keypoints:kpts})returnkeypoints_results看到没完全没有NMS的代码直接过滤置信度就行后处理耗时不到1ms比YOLOv8-Pose的后处理快了5倍以上。三、实战场景2工业部件关键点检测我做的连接器引脚平整度检测项目需要检测连接器上12个引脚的坐标计算引脚之间的高度差要求精度误差小于1像素速度大于50FPS。3.1 数据集标注用LabelMe标注每个引脚的关键点标注格式和COCO-Pose一样每个目标12个关键点总共收集了1200张训练集300张测试集。3.2 模型配置修改复制yolov26n-pose.yaml修改关键点数量nc:1# 只有连接器一个类别kpt_shape:[12,3]# 12个关键点每个点x,y,conf三个值scales:n:[0.33,0.25,1024]3.3 训练与结果训练命令和人体关键点一样yolo trainmodelyolov26n-pose-connector.yamldataconnector-pose.yamlepochs80batch32最终测试集的关键点精度是98.7%坐标误差小于0.8像素完全满足要求。3.4 部署到RK3588导出ONNX之后转成RKNN模型部署到RK3588上实测速度是68FPS比之前用YOLOv8-Pose的51FPS快了32%后处理耗时从1.2ms降到了0.2ms边缘端的优势特别明显。四、性能对比我做了几个主流Pose模型的对比测试硬件是RK3588输入分辨率640×640模型精度mAP推理速度FPS后处理耗时是否需要NMSYOLOv8n-Pose66.7%511.2ms是YOLOv11n-Pose67.4%561.1ms是YOLO26n-Pose68.2%680.2ms否YOLO26s-Pose73.5%420.2ms否可以看到YOLO26-Pose在精度更高的情况下速度快了20%-30%后处理耗时几乎可以忽略部署起来特别省心。五、落地避坑指南关键点标注要严格对齐工业场景的关键点检测对标注要求特别高同一个部件的关键点顺序不能乱不然模型学不到正确的特征我最开始就是有几百张图标注顺序反了精度一直上不去改了标注之后精度直接涨了8%不要对关键点坐标做归一化训练的时候关键点坐标直接用像素值就行不要归一化到0-1不然边缘的关键点精度会掉很多导出模型的时候不要加NMS插件很多人习惯导出的时候加NMSYOLO26-Pose完全不需要加了反而会出错因为本来就没有重复框小目标关键点选高分辨率特征层如果检测的是小部件的关键点可以把输出头改到P2层分辨率更高关键点精度更高当然速度会稍微慢一点我做引脚检测的时候就是用的P2层输出精度涨了3%速度降到52FPS也满足要求部署的时候注意坐标还原缩放和填充的参数要和预处理完全一致不然关键点坐标会偏移我之前就是填充的像素算错了导致所有关键点都偏移了2像素找了半天才找到原因YOLO26-Pose是我最近用过的最省心的关键点检测模型尤其是部署的时候不用折腾NMS不用对齐后处理逻辑半天就能完成从训练到上线的全流程强烈建议做关键点检测的同学试试。

相关文章:

YOLO26-Pose端到端部署:告别NMS!人体与工业部件关键点检测实战

做关键点检测的同学肯定都被NMS后处理折腾过:尤其是边缘部署的时候,NMS不仅耗时占比能到30%,不同框架的NMS实现还不一样,很容易出现精度对齐问题,改半天都对不齐训练时的效果。 上个月做消费电子厂的连接器引脚平整度检…...

Gazebo仿真环境下的SLAM建图实战:从模型导入到地图保存全流程

Gazebo仿真环境下的SLAM建图实战:从模型导入到地图保存全流程 在机器人开发领域,仿真环境的重要性不言而喻。Gazebo作为一款功能强大的3D机器人仿真平台,为开发者提供了测试SLAM算法的理想沙盒。本文将带你从零开始,在Gazebo中搭建…...

拉普拉斯反变换避坑指南:当ROC区域遇到部分分式展开时的5个易错点

拉普拉斯反变换避坑指南:当ROC区域遇到部分分式展开时的5个易错点 在信号与系统领域,拉普拉斯反变换是连接复频域与时域的关键桥梁。许多工程师和学生在处理部分分式展开与收敛域(ROC)的交叉问题时,常因细微疏忽导致结…...

Qwen3-4B-Thinking模型软件测试应用:自动化测试用例与缺陷报告生成

Qwen3-4B-Thinking模型软件测试应用:自动化测试用例与缺陷报告生成 1. 引言:当测试工程师遇上AI助手 想象一下这个场景:产品经理刚刚发来一份长达50页的新功能需求文档,要求在下周完成测试覆盖。你看着密密麻麻的文字&#xff0…...

Git误删急救指南:30秒挽救代码

Git误操作急救手册大纲常见误操作场景分类文件误删或未暂存就撤销修改 提交信息错误或漏提交文件 分支误删或错误合并 远程仓库操作失误&#xff08;如强制推送覆盖历史&#xff09;撤销本地修改的紧急措施恢复工作区未暂存的修改&#xff1a;git checkout -- <file> 撤销…...

【路径规划】在二维和三维空间中实现RRT_算法,根据障碍物位置和尺寸实现的避障功能附matlab代码

✅作者简介&#xff1a;热爱科研的Matlab仿真开发者&#xff0c;擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。&#x1f34e; 往期回顾关注个人主页&#xff1a;Matlab科研工作室&#x1f447; 关注我领取海量matlab电子书和…...

MATLAB/Simulink 两相交错并联Buck电路仿真:电压闭环控制之旅

MATLAB/Simulink&#xff0c;两相交错并联Buck&#xff08;降压斩波&#xff09;电路仿真模型&#xff0c;电压闭环控制&#xff0c;仿真电路以及部分波形如图所示&#xff0c;可定制模型。 2022b版本&#xff0c;可转其他版本最近在研究电源管理相关的项目&#xff0c;和大家分…...

在Java中如何理解方法访问修饰符的作用

方法访问修饰符决定了类中方法的可见性和可访问范围&#xff0c;是Java封装特性的重要体现。合理使用访问修饰符不仅能保护数据安全&#xff0c;还能提升代码的可维护性和设计清晰度。理解它们的作用&#xff0c;关键在于掌握每种修饰符的具体访问权限以及在实际开发中的最佳实…...

3.22 OJ

一、题目&#xff1a;8皇后改作者: turbo时间限制: 1s章节: 深度优先搜索问题描述规则同8皇后问题&#xff0c;但是棋盘上每格都有一个数字&#xff0c;要求八皇后所在格子数字之和最大。输入说明一个8*8的棋盘。数据规模和约定棋盘上的数字范围0~99输出说明所能得到的最大数字…...

无人船、AUV与无人车编队路径跟踪的奇妙探索

无人船&#xff0c;AUV&#xff0c;无人车 编队路径跟踪 领航跟随los制导反步控制 路径可调&#xff0c;模型可调 MATLAB程序在自动化载具的领域中&#xff0c;无人船、AUV&#xff08;自主水下航行器&#xff09;以及无人车的编队路径跟踪是一个极富挑战与魅力的研究方向。今天…...

三菱PLC恒定张力收卷机控制程序解析

三菱plc恒定张力收卷机控制程序 结构化编程&#xff0c;逻辑清晰 包含三菱触摸屏程序&#xff0c;电路接线图&#xff0c;bom&#xff0c;程序有注释&#xff0c;值得学习和借鉴。 最近在做一个三菱PLC恒定张力收卷机的项目&#xff0c;感觉收获挺多的。整个项目从程序设计到硬…...

用PHP搞定TikTok搜索数据抓取:手把手教你绕过x-bogus签名验证(附完整Node.js联动代码)

PHP与Node.js协同破解TikTok搜索数据抓取难题&#xff1a;x-bogus签名实战指南 当后端开发者需要处理前端加密算法时&#xff0c;技术栈的边界往往变得模糊。本文将带你深入探索如何用PHP作为主力语言&#xff0c;巧妙整合Node.js的JavaScript执行能力&#xff0c;构建一个稳定…...

从‘玩具‘到‘武器库‘:如何将本地Pikachu靶场升级为团队共享的实战训练平台?

从个人实验到团队赋能&#xff1a;构建企业级网络安全训练平台的实战指南 在网络安全领域&#xff0c;靶场训练早已从个人技能打磨的工具&#xff0c;演变为团队能力建设的核心基础设施。许多安全从业者都曾搭建过Pikachu这类经典漏洞靶场&#xff0c;但将其局限在本地环境使用…...

基于Matlab的单侧电源三段式距离保护控制系统

基于matlab的单侧电源三段式距离保护控制系统。 有详细的原理说明&#xff0c;和仿真程序介绍&#xff0c;同时附有详细的仿真结果分析。 可直接用做课程设计报告。一、引言 在电力系统中&#xff0c;保护装置对于保障系统的安全稳定运行至关重要。单侧电源三段式距离保护作为一…...

手把手教你用示波器抓CAN波形:从隐性/显性电平到TJA1050收发器实战分析

手把手教你用示波器抓CAN波形&#xff1a;从隐性/显性电平到TJA1050收发器实战分析 在嵌入式系统和汽车电子领域&#xff0c;CAN总线调试是每个硬件工程师必须掌握的技能。记得我第一次调试CAN节点时&#xff0c;面对复杂的波形完全无从下手——直到一位资深工程师教会我用示波…...

StructBERT与Vue.js前端框架结合:构建实时文本比对演示平台

StructBERT与Vue.js前端框架结合&#xff1a;构建实时文本比对演示平台 最近在做一个文本分析相关的项目&#xff0c;需要快速对比几段文本的相似度。一开始用命令行工具&#xff0c;虽然结果准确&#xff0c;但每次都要手动输入、复制粘贴&#xff0c;效率实在太低。后来想&a…...

CT图像预处理避坑指南:为什么你的窗宽窗位调整总是不理想?

CT图像预处理避坑指南&#xff1a;为什么你的窗宽窗位调整总是不理想&#xff1f; 在医学影像分析领域&#xff0c;CT图像的窗宽窗位调整看似基础却暗藏玄机。许多研究者花费大量时间调试深度学习模型&#xff0c;却忽略了这一关键预处理步骤对最终效果的深远影响。本文将揭示那…...

施耐德食品饮料行业面向智能制造的精益数字化工厂MES解决方案:方案定位与架构、MES核心功能模块、数据采集与集成

本方案基于施耐德生产体系&#xff0c;为食品饮料行业构建精益数字化工厂。MES核心功能涵盖计划排产、批次追溯、物料拉动、质量管理、设备运维与安灯系统&#xff0c;通过数据采集与ERP、自动仓库等深度集成&#xff0c;实现生产全流程闭环管理、问题即时升级与可视化监控&…...

零成本实现专业级网页截图:5款精选Screenshot API全攻略

零成本实现专业级网页截图&#xff1a;5款精选Screenshot API全攻略 【免费下载链接】free-for-dev free-for-dev - 一个列出了对开发者和开源作者提供免费服务的软件和资源的集合&#xff0c;帮助开发者节省成本。 项目地址: https://gitcode.com/GitHub_Trending/fr/free-f…...

Nunchaku-flux-1-dev应用:为微信小程序开发提供AI配图生成接口

Nunchaku-flux-1-dev应用&#xff1a;为微信小程序开发提供AI配图生成接口 每次为微信小程序设计新页面或发布新内容&#xff0c;最头疼的是什么&#xff1f;对我而言&#xff0c;曾经是找配图。要么是版权问题&#xff0c;要么是风格不搭&#xff0c;要么是成本太高。直到我开…...

HQC来了:为什么我们需要一个“备用轮胎”——后量子时代的密码多样性与架构敏捷性设计

文章目录 前言 HQC来了:为什么我们需要一个“备用轮胎”——后量子时代的密码多样性与架构敏捷性设计 文章导读 引言:当ML-KEM已是主路,NIST为何再修一条辅路? 一、HQC核心解析:从通信纠错码到后量子密码基石 1.1 纠错码:通信领域的抗噪底层技术 1.2 HQC的数学本质:准循…...

Jimeng AI Studio模型蒸馏实战:小模型大性能

Jimeng AI Studio模型蒸馏实战&#xff1a;小模型大性能 在实际项目中&#xff0c;我们常常遇到这样的困境&#xff1a;一个效果出色的AI模型&#xff0c;部署到边缘设备或小型服务器上时&#xff0c;要么显存爆满&#xff0c;要么推理慢得让人无法忍受。你可能已经试过降低分…...

web安全主要包括哪些方面的安全

web安全主要包括哪些方面的安全 web安全主要包括哪些方面的安全&#xff1a;web安全主要分为保护服务器及其数据的安全、保护服务器和用户之间传递的信息的安全、保护web应用客户端及其环境安全这三个方面。 web安全介绍 Web应用安全问题本质上源于软件质量问题。但Web应用相较…...

Java实现数据结构栈

1、定义接口 /*** 栈接口* param <T> 元素类型*/ public interface Stack<T> {/*** 入栈* param element 要入栈的元素* return 是否入栈成功*/boolean push(T element);/*** 出栈* return 出栈的元素*/T pop();/*** 查看栈顶元素* return 栈顶元素*/T peek();/**…...

STM32驱动GP2Y1014AU粉尘传感器实战指南

1. 认识GP2Y1014AU粉尘传感器 GP2Y1014AU是夏普公司推出的一款光学粉尘传感器&#xff0c;专门用于检测空气中PM2.5等细小颗粒物的浓度。它的工作原理是通过红外LED照射空气中的颗粒物&#xff0c;然后检测散射光的强度来判断粉尘浓度。这种检测方式在空气净化器、环境监测设备…...

AI Agent长期记忆工程实战(非常详细),踩坑与取舍从入门到精通,收藏这一篇就够了!

长期记忆不是「把历史对话存起来」。在生产环境里&#xff0c;它更像一套数据管道和检索系统&#xff0c;目标很具体&#xff1a; 让 Agent 在跨天、跨周的任务里保持一致性&#xff08;用户偏好、项目背景、关键决策不丢&#xff09;。让上下文成本可控&#xff08;Token、TT…...

为什么ViT要用卷积做Patch Embedding?对比传统Transformer的文本嵌入差异

ViT中卷积式Patch Embedding的设计哲学与技术实现 当Transformer架构从自然语言处理领域跨越到计算机视觉领域时&#xff0c;最关键的创新之一就是如何将二维图像数据适配到原本为序列数据设计的Transformer结构中。Vision Transformer&#xff08;ViT&#xff09;通过Patch Em…...

智能体时代来了,经济学的底层逻辑要被彻底改写了

各位学弟学妹&#xff0c;最近和行业里的朋友聊起 AI 发展&#xff0c;发现一个很有意思的趋势&#xff1a;生成式 AI 已经从单纯的工具&#xff0c;进化成了能自主行动的「智能体」&#xff0c;而这波变革&#xff0c;不只是改变我们的工作方式&#xff0c;更是要掀翻经济学的…...

基于EIT时序数据的STReSRNN模型:融合ResNet-34、BiLSTM与自注意力机制

基于EIT时序数据的STReSRNN模型:融合ResNet-34、BiLSTM与自注意力机制 摘要 电阻抗成像(Electrical Impedance Tomography, EIT)作为一种无创、无辐射的功能成像技术,能够实时监测人体胸部的阻抗变化,在肺功能评估、呼吸监测等领域具有重要应用价值。然而,EIT图像重建是…...

让老显卡焕发新生:在Win10+GTX 1080Ti上成功运行Mamba-SSM的完整配置记录

让老显卡焕发新生&#xff1a;在Win10GTX 1080Ti上成功运行Mamba-SSM的完整配置记录 当我在二手市场以不到原价三分之一的价格淘到一张GTX 1080Ti时&#xff0c;朋友笑称这是"电子垃圾回收"。但作为一名热衷于尝试最新AI技术的开发者&#xff0c;我始终相信硬件性能的…...