深度学习在人体动作识别领域的应用:开源工具、数据集资源及趋动云GPU算力不可或缺
人体动作识别检测是一种通过使用计算机视觉和深度学习技术,对人体姿态和动作进行实时监测和分析的技术。该技术旨在从图像或视频中提取有关人体姿态、动作和行为的信息,以便更深入地识别和理解人的活动。
人体动作识别检测的基本步骤包括:
-
数据采集:收集包含人体动作的图像或视频数据,这可以通过摄像头、深度传感器或其他传感器来完成。
-
预处理:对采集到的数据进行预处理,包括图像去噪、颜色调整等,以确保输入数据质量。
-
特征提取:提取图像或视频中的关键特征,例如人体关节点的位置、姿势等信息。
-
模型训练:使用深度学习模型,如卷积神经网络(CNN)或循环神经网络(RNN),对提取的特征进行训练,使模型能够识别和学习不同的人体动作。
-
实时检测:部署训练好的模型,对实时图像或视频进行检测,识别人体的姿态和动作。
上述步骤通常需要大规模 GPU 计算的支持。
为了更好地支持研究人员和开发者深入研究动作识别、检测、分类技术,本文将介绍一系列相关的开源工具箱、项目以及数据集资源。这些资源的综合使用将为动作相关技术的发展提供全面而有力的支持。
工具箱
MMSkeleton
MMSkeleton 是由香港中文大学多媒体实验室(MMLab)发布的一个基于骨架动作识别的视频分析开源工具箱,拥有领先的在视频中进行人体骨骼识别的能力,支持框架预训练模型,并提供多数据集。
开源地址:https://github.com/open-mmlab/mmskeleton

MMAction2
MMAction2 同样是由 MMLab 发布的一款基于 PyTorch 的视频理解开源工具箱,是 MMAction 的升级版,目前支持四大主流视频理解任务,分别是 Action Recognition、Skeleton based Action Recognition、Spatio-Temporal Action Detection 和 Temporal Action Localization。MMAction2 支持了 28 类视频理解模型 和 22 类视频理解数据集。
开源地址:https://github.com/open-mmlab/mmaction2

PYSKL
PYSKL 是在开源项目 MMAction2 的基础上进行构建的,使用 PYTorch 对骨架数据进行动作识别的工具箱。该工具箱支持多种骨架动作识别算法,包括基于 GCN 和 CNN 方法。
开源地址:https://github.com/kennymckormick/pyskl

数据集
EPIC-KITCHENS-100
EPIC-KITCHENS-100 是一个大规模的有关于厨房内第一视角活动的数据集,也是 Epic-kitchens-55 数据集的扩充版,视频总时长从 55 小时增加到了 100 小时,共包含超过 9 万个动作片段,97 个动词类别和 300 个名词类别。
论文链接:https://arxiv.org/abs/2006.13256
下载地址:https://epic-kitchens.github.io/2023

COIN
COIN 是由清华和美图共同开源的一个大规模视频分析数据集,包含 11827 条教程类视频,涉及日常生活中 12 个领域里的 180 个任务的视频内容。可以用于复杂场景下视频动作时序定位(temporal localization)、视频行为分析与理解问题的研究。
-
论文链接:https://arxiv.org/abs/1903.02874
-
下载地址:https://coin-dataset.github.io/

HOLLYWOOD2
HOLLYWOOD2 是一个人类行为动作视频数据集,内含 3669 个剪辑视频,视频总长度约为 20.1 小时,其中包括 12 类不同的人类行为动作,10 个场景,这些视频剪辑内容均来自 69 部好莱坞电影。
动作如:接电话、开车、吃饭、拥抱、接吻等。
场景如:户外、车内、厨房、办公室、商场、酒店等。
下载地址:https://www.di.ens.fr/~laptev/actions/hollywood2/

UCF Sports
UCF Sports 是一个主要关于运动的数据集,收集自 BBC 和 ESPN 的电视新闻,包含 150 段视频剪辑,视频分辨率为 720x480。
运动种类为:Diving、Golf Swing、Kicking、Lifting 、Riding Horse、Running、SkateBoarding、Swing-Bench、Swing-Side、Walking。
下载地址:https://www.crcv.ucf.edu/data/UCF_Sports_Action.php

UCF101
UCF101 数据集收集自 YouTube,是 UCF50 数据集的扩充版,从 50 个动作类别增加到 101 个类别,共 13320 个视频,这些视频都是由用户真实上传的,包含相机运动、各种照明条件、部分遮挡、低质帧等特点。
另外,该数据集主要包括 5 大类动作:人与物体交互,单纯的肢体动作,人与人交互,乐器演奏,体育运动。
下载地址:https://www.crcv.ucf.edu/data/UCF101.php

趋动云作为领先的算力服务提供商,不仅致力于提供灵活而成本可控的算力,同时还具备可扩展的存储解决方案。除此之外,趋动云还为用户提供了丰富多样的数据集资源,包括大规模的动作识别数据集如Kinetics-400和UCF101等。

对于像Kinetics-400这样超过 100GB 的数据集,本地下载和训练需耗费大量时间,而在趋动云上,用户只需一键即可使用,极大地提升了用户的使用体验。
总体而言,GPU 算力在 AI 技术的发展中起到了至关重要的作用。它不仅推动了技术的创新,也为AI技术在各个领域的广泛应用奠定了基础。随着 GPU 算力的不断提升,我们可以期待看到更加强大、智能的动作识别技术,为我们的生活带来更丰富、便捷的体验。
相关文章:
深度学习在人体动作识别领域的应用:开源工具、数据集资源及趋动云GPU算力不可或缺
人体动作识别检测是一种通过使用计算机视觉和深度学习技术,对人体姿态和动作进行实时监测和分析的技术。该技术旨在从图像或视频中提取有关人体姿态、动作和行为的信息,以便更深入地识别和理解人的活动。 人体动作识别检测的基本步骤包括: 数…...
科技提升安全,基于YOLOv6开发构建商超扶梯场景下行人安全行为姿态检测识别系统
在商超等人流量较为密集的场景下经常会报道出现一些行人在扶梯上摔倒、受伤等问题,随着AI技术的快速发展与不断普及,越来越多的商超、地铁等场景开始加装专用的安全检测预警系统,核心工作原理即使AI模型与摄像头图像视频流的实时计算…...
二叉树的最大深度
问题描述: 给定一个二叉树 root ,返回其最大深度。 二叉树的 最大深度 是指从根节点到最远叶子节点的最长路径上的节点数。 示例 1: 输入:root [3,9,20,null,null,15,7] 输出:3示例 2: 输入࿱…...
nginx配置正向代理支持https
操作系统版本: Alibaba Cloud Linux 3.2104 LTS 64位 nginx版本: nginx-1.25.3 1. 下载软件 切换目录 cd /server wget http://nginx.org/download/nginx-1.25.3.tar.gz 1.1解压 tar -zxvf nginx-1.25.3.tar.gz 1.2切换到源码所在目录…...
奥比中光 Femto Bolt相机ROS配置
机械臂手眼标定详解 作者: Herman Ye Auromix 测试环境: Ubuntu20.04/22.04 、ROS1 Noetic/ROS2 Humble、X86 PC/Jetson Orin、Kinect DK/Femto Bolt 更新日期: 2023/12/12 注1: Auromix 是一个机器人爱好者开源组织。 注2&#…...
scala表达式
1.8 表达式(重点) # 语句(statement):一段可执行的代码# 表达式(expression):一段可以被求值的代码,在Scala中一切都是表达式 - 表达式一般是一个语句块,可包含一条或者多条语句,多条语句使用“…...
uniapp,点击选中并改变颜色,第二次点击取消选中状态
一、效果图 二、代码实现 字符串的indexOf和数组的indexOf用法一致! arr.indexOf(item) 该方法返回某个元素在数组中的位置。若没检索到,则返回 -1。 关键代码:(通过:class绑定) :class"selectList.indexOf(sub.type) ! -1 ? right_ite…...
mmyolo的bbox_loss和检测bbox都是空
最近用mmyolo训练自己的数据集的时候发现训练的时候loss_bbox0,测试和eval的时候结果也全是空的,排除了数据集读取的问题,最后发现是config中自定义了自己的类别但是没有传给dataset。。。 简而言之,在自定义了数据集里的metainf…...
Linux——基本指令(二)
个人主页:日刷百题 系列专栏:〖C语言小游戏〗〖Linux〗〖数据结构〗 〖C语言〗 🌎欢迎各位→点赞👍收藏⭐️留言📝 写在前面: 紧接上一章,我们在理解接下来的命令之前,…...
渲染农场对工业产品渲染带来的意义与优势?
随着科技的进步,利用精细渲染图来呈现和推广工业设计的创新已成为行业标准。这些图像在产品研发、设计评审和营销阶段起着关键作用,同时对产品最终的成功也产生深远影响。然而,由于产品设计日渐复杂,制作渲染图的任务变得极具挑战…...
产品入门第二讲:Axure产品元件库的使用
📚📚 🏅我是默,一个在CSDN分享笔记的博主。📚📚 🌟在这里,我要推荐给大家我的专栏《Axure》。🎯🎯 🚀无论你是编程小白,还是…...
(第7天)Linux 静默安装单机 Oracle 19C 数据库
Linux 静默安装安装单机 Oracle 19C 数据库(第7天) 很多朋友经常会问,如果生产环境不允许安装 Linux 图形化界面怎么办?是不是有其他的方式来安装部署 Oracle 数据库呢?答案是肯定的! 我们可以通过命令行的方式来静默安装,不调用图形化界面,当然也就没有那么简单了!…...
智能优化算法应用:基于入侵杂草算法3D无线传感器网络(WSN)覆盖优化 - 附代码
智能优化算法应用:基于入侵杂草算法3D无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于入侵杂草算法3D无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.入侵杂草算法4.实验参数设定5.算法结果6.…...
数据挖掘目标(Kaggle Titanic 生存测试)
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns1.数据导入 In [2]: train_data pd.read_csv(r../老师文件/train.csv) test_data pd.read_csv(r../老师文件/test.csv) labels pd.read_csv(r../老师文件/label.csv)[Su…...
【Vue】router.push用法实现路由跳转
目录 router.push用法 在Login.vue中 在Register.vue中 上一篇:登录与注册界面的制作 https://blog.csdn.net/m0_67930426/article/details/134895214?spm1001.2014.3001.5502 制作了登录与注册界面,并介绍了相关表单元素即属性的用法 在登录页面…...
设计原则 | 接口隔离原则
一、接口隔离原则 1、原理 客户端不应该依赖它不需要的接口,即一个类对另一个类的依赖应该建立在最小的接口上。如果强迫客户端依赖于那些它们不使用的接口,那么客户端就面临着这个未使用的接口的改变所带来的变更,这无意间导致了客户程序之…...
maui 调用文心一言开发的聊天APP 3
主要是对代码进行了优化 上一个版本写死了帐号跟密码 ,这一个帐本有户可以直接设置对相关的key以及secret如果设置错时,在聊天中也会返回提示。注册帐号时同时也设置了key及secrete升级到了net.8.0导出APK,上一个版本是导出abb.解决了变型问…...
鸿蒙开发 - ohpm安装第三方库
前端开发难免使用第三方库,鸿蒙亦是如此,在使用 DevEco Studio 开发工具时,如何引入第三方库呢?操作步骤如下,假设你使用的是MacOS,假设你已经创建了了一个项目: 一、配置 HTTP Proxy 在打开了…...
[C++] new和delete
使用new时调用构造函数使用delete时调用析构函数 构造函数 使用new动态分配内存时,如果分配的是基本类型的内存,则不会调用构造函数。如果分配的是自定义类型的内存,则会调用构造函数进行对象的初始化。 例如: int* pInt new…...
OpenVINS学习2——VIRAL数据集eee01.bag运行
前言 周末休息了两天,接着做上周五那个VIRAL数据集没有运行成功的工作。现在的最新OpenVINS需要重新写配置文件,不像之前那样都写在launch里,因此需要根据数据集情况配置好estimator_config.yaml还有两个标定参数文件。 VIRAL数据集 VIRAL…...
【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现(服务端执行命令请求的过程 - 初始化服务器)
服务端执行命令请求的过程 【专栏简介】【技术大纲】【专栏目标】【目标人群】1. Redis爱好者与社区成员2. 后端开发和系统架构师3. 计算机专业的本科生及研究生 初始化服务器1. 初始化服务器状态结构初始化RedisServer变量 2. 加载相关系统配置和用户配置参数定制化配置参数案…...
如何为服务器生成TLS证书
TLS(Transport Layer Security)证书是确保网络通信安全的重要手段,它通过加密技术保护传输的数据不被窃听和篡改。在服务器上配置TLS证书,可以使用户通过HTTPS协议安全地访问您的网站。本文将详细介绍如何在服务器上生成一个TLS证…...
浅谈不同二分算法的查找情况
二分算法原理比较简单,但是实际的算法模板却有很多,这一切都源于二分查找问题中的复杂情况和二分算法的边界处理,以下是博主对一些二分算法查找的情况分析。 需要说明的是,以下二分算法都是基于有序序列为升序有序的情况…...
【电力电子】基于STM32F103C8T6单片机双极性SPWM逆变(硬件篇)
本项目是基于 STM32F103C8T6 微控制器的 SPWM(正弦脉宽调制)电源模块,能够生成可调频率和幅值的正弦波交流电源输出。该项目适用于逆变器、UPS电源、变频器等应用场景。 供电电源 输入电压采集 上图为本设计的电源电路,图中 D1 为二极管, 其目的是防止正负极电源反接, …...
代码规范和架构【立芯理论一】(2025.06.08)
1、代码规范的目标 代码简洁精炼、美观,可持续性好高效率高复用,可移植性好高内聚,低耦合没有冗余规范性,代码有规可循,可以看出自己当时的思考过程特殊排版,特殊语法,特殊指令,必须…...
【Post-process】【VBA】ETABS VBA FrameObj.GetNameList and write to EXCEL
ETABS API实战:导出框架元素数据到Excel 在结构工程师的日常工作中,经常需要从ETABS模型中提取框架元素信息进行后续分析。手动复制粘贴不仅耗时,还容易出错。今天我们来用简单的VBA代码实现自动化导出。 🎯 我们要实现什么? 一键点击,就能将ETABS中所有框架元素的基…...
一些实用的chrome扩展0x01
简介 浏览器扩展程序有助于自动化任务、查找隐藏的漏洞、隐藏自身痕迹。以下列出了一些必备扩展程序,无论是测试应用程序、搜寻漏洞还是收集情报,它们都能提升工作流程。 FoxyProxy 代理管理工具,此扩展简化了使用代理(如 Burp…...
数据结构:泰勒展开式:霍纳法则(Horner‘s Rule)
目录 🔍 若用递归计算每一项,会发生什么? Horners Rule(霍纳法则) 第一步:我们从最原始的泰勒公式出发 第二步:从形式上重新观察展开式 🌟 第三步:引出霍纳法则&…...
表单设计器拖拽对象时添加属性
背景:因为项目需要。自写设计器。遇到的坑在此记录 使用的拖拽组件时vuedraggable。下面放上局部示例截图。 坑1。draggable标签在拖拽时可以获取到被拖拽的对象属性定义 要使用 :clone, 而不是clone。我想应该是因为draggable标签比较特。另外在使用**:clone时要将…...
Qt的学习(二)
1. 创建Hello Word 两种方式,实现helloworld: 1.通过图形化的方式,在界面上创建出一个控件,显示helloworld 2.通过纯代码的方式,通过编写代码,在界面上创建控件, 显示hello world; …...
