当前位置: 首页 > news >正文

基于可解释性特征矩阵与稀疏采样全局特征组合的人体行为识别

论文还未发表,不细说,欢迎讨论。

Title: A New Solution to Skeleton-Based Human Action Recognition via the combination usage of explainable feature extraction and sparse sampling global features.

Abstract: With the development of deep learning technology, the vision-based applications of human action recognition (HAR) have received great progress. Many methods followed the idea of data-driven and tried their best to include more and more motion features in consideration for higher accuracy purposes. However, the thought of “the more features adopted, the higher accuracy will be”will inevitably result in the ever-increasing requirement of computing power and decreasing efficiency. In this paper, in order to effectively recognize human actions with only a few of the most sensitive motion features, the explainable features, the combining usage of local and global features, and a multi-scale shallow network are proposed. First, the explainable features let a deep neural network be finetuned in the input stage, and an action represented by these features are easier to find priori theory of physics and kinematics for data augmentation purpose. Second, although criticism of the global features never stops, it is universally acknowledged that the context information included in the global feature is essential to HAR. The proposed SMHI—motion history image generated in a sparse sampling way, can not only reduce the time-cost, but also effectively reflect the motion tendency. It is suggested to be a useful complementary of local features. Third, full experiments were conducted to find out the best feature combination for HAR. The results have proved that feature selection is more important than computing all features. The proposed method is evaluated on three datasets. The experiment results proved the effectiveness and efficiency of our proposed method. Moreover, the only usage of human skeleton motion data provides privacy assurances to users.

现在大多数方法有两个问题:1. 将尽可能多的特征纳入到输入端,虽然可以增强准确率,但增加了计算负担,而且模型越来越臃肿;2. 全局特征一直处于被抛弃的境地,而其包含的上下文信息却有非常重要。针对这两点,我尝试用物理学和运动学中的先验知识提取人体行为动作特征,使其具备可解释性,然后对其优化和数据增强。并进一步找到其最有效的组合。同时,通过稀疏采样的方式构建MHI,即:只提取其运动趋势特征。使之作为local feature的有效补充。实验结果良好,特别是在效率方面有质的提升。本文的主要创新点在于跳出了主流“数据驱动”特征越多越好的传统思路,通过实验证明:特征选择远比计算所有特征更为重要。

相关文章:

基于可解释性特征矩阵与稀疏采样全局特征组合的人体行为识别

论文还未发表,不细说,欢迎讨论。 Title: A New Solution to Skeleton-Based Human Action Recognition via the combination usage of explainable feature extraction and sparse sampling global features. Abstract: With the development of deep …...

OpenCV4(C++)—— 仿射变换、透射变换和极坐标变换

文章目录 一、仿射变换1. getRotationMatrix2D()2. warpAffine() 二、透射变换三、极坐标变换 一、仿射变换 在OpenCV中没有专门用于图像旋转的函数,而是通过图像的仿射变换实现图像的旋转。实现图像的旋转首先需要确定旋转角度和旋转中心,之后确定旋转…...

http.header.Set()与Add()区别;

在Go语言中进行HTTP请求时,http.Header对象表示HTTP请求或响应的头部信息。http.Header是一个map[string][]string类型的结构,用于存储键值对,其中键表示HTTP头字段的名称,值是一个字符串切片,可以存储多个相同名称的头…...

vue-7-vuex

一、Vuex 概述 目标:明确Vuex是什么,应用场景以及优势 1.是什么 Vuex 是一个 Vue 的 状态管理工具,状态就是数据。 大白话:Vuex 是一个插件,可以帮我们管理 Vue 通用的数据 (多组件共享的数据)。例如:购…...

SSO单点登录和OAuth2.0区别

一、概述 SSO是Single Sign On的缩写,OAuth是Open Authority的缩写,这两者都是使用令牌的方式来代替用户密码访问应用。流程上来说他们非常相似,但概念上又十分不同。SSO大家应该比较熟悉,它将登录认证和业务系统分离&#xff0c…...

【轻松玩转MacOS】基本操作篇

引言 本文是系列的开篇,我将为大家介绍MacOS的基本操作。对于初次接触MacOS的用户来说,掌握这些基本操作是必不可少的。无论是启动和关机,还是使用键盘和鼠标,或者是快捷键的使用,这些基本操作都是你开始使用MacOS的第…...

华为ICT——第三章图像处理基本任务

目录 1:数字图像处理的层次:(处理-分析-理解)顺序不能错: 2:图像处理(图像处理过程): 3:图像分析(特征提取): 4&#x…...

(C++)引用的用法总结

引用&#xff08;reference&#xff09;是C极为重要的一部分&#xff0c;本文对其用法进行简单总结。 1. 引用的基本用法 引用的关键字为&&#xff0c;表示取地址的意思&#xff0c;引用变量定义如下&#xff1a; int m 1; int &n m; //定义 cout<<"n:…...

Charles:移动端抓包 / windows客户端 iOS手机 / 手机访问PC本地项目做调试

一、背景描述 1.1、本文需求&#xff1a;移动端进行抓包调试 1.2、理解Charles可以做什么 Charles是一款跨平台的网络代理软件&#xff0c;可以用于捕获和分析网络流量&#xff0c;对HTTP、HTTPS、HTTP/2等协议进行调试和监控。使用Charles可以帮助开发人员进行Web开发、调试…...

【AI】深度学习——人工智能、深度学习与神经网络

文章目录 0.1 如何开发一个AI系统0.2 表示学习(特征处理)0.2.1 传统特征学习特征选择过滤式包裹式 L 1 L_1 L1​ 正则化 特征抽取监督的特征学习无监督的特征学习 特征工程作用 0.2.2 语义鸿沟0.2.3 表示方式关联 0.2.4 表示学习对比 0.3 深度学习0.3.1 表示学习与深度学习0.3.…...

RK3288:BT656 RN6752调试

这篇文章主要想介绍一下再RK3288平台上面调试BT656 video in的注意事项。以RN6752转接芯片&#xff0c;android10平台为例进行介绍。 目录 1. RK3288 VIDEO INPUT 并口 2. 驱动调试 2.1 RN6752 驱动实现 ①rn6752_g_mbus_config总线相关配置 ②rn6752_querystd配置制式 …...

LLMs 蒸馏, 量化精度, 剪枝 模型优化以用于部署 Model optimizations for deployment

现在&#xff0c;您已经了解了如何调整和对齐大型语言模型以适应您的任务&#xff0c;让我们讨论一下将模型集成到应用程序中需要考虑的事项。 在这个阶段有许多重要的问题需要问。第一组问题与您的LLM在部署中的功能有关。您需要模型生成完成的速度有多快&#xff1f;您有多…...

Milvus踩坑笔记

本文用于记录在学习 Milvus文档时所遇到的一些Bug或报错及解决方法 参考文章&#xff1a; 官方demo&#xff1a;在Dynamic Schema的集合中插入数据 报错1&#xff1a;auto id enabled, id shouldnt in entities[0] 问题描述 此报错出现在Milvus官方在介绍 Dynamic Schema …...

什么是轴电流?轴电流对轴承有什么危害?

根据同步发电机结构及工作原理&#xff0c;由于定子铁芯组合缝、定子硅钢片接缝&#xff0c;定子与转子空气间隙不均匀&#xff0c;轴中心与磁场中心不一致等&#xff0c;机组的主轴不可避免地要在一个不完全对称的磁场中旋转。这样&#xff0c;在轴两端就会产生一个交流电压。…...

react create-react-app v5配置 px2rem (不暴露 eject方式)

环境信息&#xff1a; create-react-app v5 “react”: “^18.2.0” “postcss-plugin-px2rem”: “^0.8.1” 配置步骤&#xff1a; 不暴露 eject 配置自己的webpack&#xff1a; 1.下载react-app-rewired 和 customize-cra-5 npm install react-app-rewired customize-cra…...

.net中用标志位解决socket粘包问题

以下为wpf中, 用标志位"q" 解决粘包问题 using MyFrameWorkWpf.Entities; using System.Collections.ObjectModel; using System.Net; using System.Net.Sockets; using System.Text; using System.Threading; using System.Threading.Tasks; using System.Windows.…...

【Ubuntu】Systemctl 管理 MinIO 服务器的启动和停止

要使用 systemctl 来管理 MinIO 服务器的启动和停止&#xff0c;您需要创建一个 systemd 服务单元文件&#xff0c;以便 systemd 能够启动和停止 MinIO 服务器。下面是一般的步骤&#xff1a; 创建 systemd 服务单元文件&#xff1a; 打开终端并使用文本编辑器创建一个新的 sys…...

《golang设计模式》第二部分·结构型模式-07-代理模式(Proxy)

文章目录 1. 概述1.1 角色1.2 模式类图 2. 代码示例2.1 设计2.2 代码2.3 示例类图 1. 概述 代理&#xff08;Proxy&#xff09;是用于控制客户端访问目标对象的占位对象。 需求&#xff1a;在调用接口实现真是主题之前需要一些提前处理。 解决&#xff1a;写一个代理&#xff…...

Jmeter常用线程组设置策略

一、前言 在JMeter压力测试中&#xff0c;我们时常见到的几个场景有&#xff1a;单场景基准测试、单场景并发测试、单场景容量测试、混合场景容量测试、混合场景并发测试以及混合场景稳定性测试 在本篇文章中&#xff0c;我们会用到一些插件&#xff0c;在这边先给大家列出&…...

【Spring】Spring MVC 程序开发

Spring MVC 程序开发 一. 什么是 Spring MVC1. MVC2. Spring、Spring Boot 与 Spring MVC 二. 创建 Spring MVC 项目1. 创建项目2. 用户和程序的映射3. 获取用户请求参数①. 获取单个参数②. 获取多个参数③. 传递对象④. 后端参数重命名&#xff08;后端参数映射&#xff09;R…...

告别硬编码延时!用Vector CAPL定时器实现汽车总线报文精准周期发送

告别硬编码延时&#xff01;用Vector CAPL定时器实现汽车总线报文精准周期发送 在汽车电子测试领域&#xff0c;CAN、LIN等总线报文的周期发送是验证ECU功能的基础需求。传统脚本常依赖delay()或硬编码等待&#xff0c;不仅难以维护&#xff0c;更会因系统调度导致时序漂移。本…...

跨越Android存储权限适配的深水区:从Android 11到13的实战避坑指南

1. 当存储权限遇上Android版本分裂&#xff1a;真实踩坑现场 去年接手一个图片下载功能时&#xff0c;我遭遇了职业生涯最诡异的兼容性问题。在荣耀Android 10、红米Android 11和小米Android 13上运行完美的代码&#xff0c;到了三星Galaxy S23 Ultra&#xff08;Android 13&am…...

别再死记硬背了!用PyTorch手把手拆解ECAPA-TDNN中的Res2Net与SENet模块

用PyTorch实战解析ECAPA-TDNN中的Res2Net与SENet模块 当我们在说话人识别任务中追求更高的准确率时&#xff0c;ECAPA-TDNN无疑是一个绕不开的标杆模型。这个模型之所以能在VoxSRC等权威比赛中屡创佳绩&#xff0c;关键在于其精心设计的Res2Net和SENet模块的协同工作。本文将带…...

终极Windows APK安装器:3分钟学会在电脑上安装Android应用

终极Windows APK安装器&#xff1a;3分钟学会在电脑上安装Android应用 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你是否想在Windows电脑上直接运行Android应用&am…...

长期使用Taotoken聚合服务对开发效率的实际提升感受

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 长期使用Taotoken聚合服务对开发效率的实际提升感受 作为一名在多个项目中集成大模型能力的开发者&#xff0c;我过去需要为不同的…...

一款强大的PHP视频播放器:轻松嵌入,高效播放

一款强大的PHP视频播放器&#xff1a;轻松嵌入&#xff0c;高效播放 【下载地址】PHP视频播放器源码 本仓库提供了一个PHP视频播放器的源码&#xff0c;支持播放m3u8和mp4格式的资源。该播放器可以直接嵌入到网站中&#xff0c;方便用户在线观看视频内容 项目地址: https://g…...

量子计算中SIMD编译优化与离子阱架构实践

1. 量子计算中的SIMD编译优化概述量子计算正逐步从理论走向实践&#xff0c;而离子阱架构因其长相干时间和高保真度操作成为当前最有前景的物理实现方案之一。在传统量子编译器中&#xff0c;指令调度往往采用串行执行模式&#xff0c;导致离子传输和量子门操作存在大量等待时间…...

What Are You Talking About(HDU- P1075)

伊格纳修斯真是走了狗屎运&#xff0c;昨天居然遇到了火星人&#xff01;可惜他完全听不懂火星人的语言。临走时&#xff0c;火星人给了他一本火星历史书和一本词典。现在伊格纳修斯想把这本历史书翻译成英语&#xff0c;你能帮帮他吗&#xff1f;输入本题只有一组测试数据&…...

35岁程序员亲历:AI时代如何避免踩坑?收藏这份避坑指南,小白也能看懂大模型!

作者作为一名有十多年经验的程序员&#xff0c;分享了自己在AI快速发展背景下&#xff0c;利用GPT Pro和Deep Research进行产品调研的经历。文章指出&#xff0c;仅依靠AI工具并不足以成功&#xff0c;更重要的是要找到真实的市场痛点和需求。作者通过实际案例分析了纯工具类、…...

不只是CT重建:手把手教你用RTK+ITK+VS2022搭建可扩展的医学影像处理开发环境

构建医学影像算法开发平台&#xff1a;RTKITKVS2022全流程实战指南 医学影像处理领域正迎来前所未有的技术革新&#xff0c;从传统的CT重建到三维可视化、病灶自动检测等高级应用&#xff0c;开发者需要一套稳定且可扩展的开发环境。本文将带您从零开始&#xff0c;在Windows平…...