【小笔记】时序数据分类算法最新小结
2024.1.15
最近基于时序数据训练分类算法,对其进行了一番了解,主要围绕以下几点:
- 时序数据算法有哪些细分类?
- 时序数据分类算法经典模型?
- 当下时序分类算法模型强baseline?
- 有没有现成的工具?

1.时序数据算法有哪些细分类?
时序数据(Time Series)简称TS
其包括两类算法:
- 时间序列预测(Time Series Forecast,TSF)
根据过去的时间序列预测未来一段时间的序列。eg:股价预测 - 时间序列分类(Time Series Classify,TSC)
根据一段时间序列预测其类别。eg:根据心电图预测是否有某类疾病;根据手环的传感器信号预测佩戴者当前的运动类型。
本文讨论TSC。
多说一点:时间序列根据其特征维度数量的不同,可以分为一元时间序列(TS只和一个特征相关)和多元时间序列(TS和多个特征相关)。
2.时序数据分类算法经典模型
通过我一通调研,直观总结出一下几类经典模型,具体模型细节不展开。
- KNN+DTW
这是比较早的一个解决方案,很长一段时间,DTW都是作为一个强baseline用来比较深度学习算法的性能 - CNN类
一维卷积神经网络在TSC中表现非常好,其中,2018年的TCN已经可以完全取代CNN,而后,出现了各种TCN变体。
最新的SOTA算法也基本上有卷积神经网络。 - RNN类
RNN类(如LSTM,GRU)通常不适合TSC。 - Transformer类
这是新的研究趋势,而且效果不错
这里没有介绍具体的模型,因为很多都已经过时了,不需要过多了解,直接推荐下面的强baseline,花时间了解它们即可。
3.当下时序分类算法模型强baseline
经过我一番调研,最终荣获此殊荣的有以下几位:
InceptionTime
- InceptionTime: Finding AlexNet for Time Series Classification Data Min. Know. Disc. 2020
HIVE-COTE家族
- HIVE-COTE:Time Series Classification with HIVE-COTE: The Hierarchical Vote Collective of Transformation-based Ensembles
- HIVE-COTE 2.0: a new meta ensemble for time series classification.
Rocket家族
- ROCKET: exceptionally fast and accurate time series classification using random convolutional kernels
- MiniRocket: A Very Fast (Almost) Deterministic Transform for Time Series Classification Angus
- MultiRocket: Effective summary statistics for convolutional outputs in time series classification
SOTA大PK
结论:
上面各个模型之间的性能比较,均来自这篇综述:
Bake off redux: a review and experimental evaluation of recent time series classification algorithms
简而言之:
从性能上看,HIVE-COTE 2.0是当下最强的模型,其次是Hydra-MultiRocket,两者都是藐视众生一版的存在。后者虽然性能比比前者的差一点点,但是它训练非常快哦,甩前者好几条街(见下图,MultiRocket项目提供),所以其实更推荐后者,而且更重要的一点:HIVE-COTE 2.0并没有开源,是的,想用也用不到。🤣

4.有没有现成的工具?
Rocket家族都是有开源的,可以直接用。
除此外,我还发现了一个宝藏😲,非常之哇塞——tsai:
https://github.com/timeseriesAI/tsai

里面包含了很多模型,可用于TSF和TSC

这是这个库的介绍文档:
https://timeseriesai.github.io/tsai/

里面主推三类算法:InceptionTime、Rocket、TST
想必掌握了这三个,TS就游刃有余了
参考资料
1.知乎:时间序列分类-Rocket到MiniRocket再到MultiRocket
2.知乎:时间序列数据如何分类并进行特征提取?
3Bake off redux: a review and experimental evaluation of recent time series classification algorithms【非常值得一看】
相关文章:
【小笔记】时序数据分类算法最新小结
2024.1.15 最近基于时序数据训练分类算法,对其进行了一番了解,主要围绕以下几点: 时序数据算法有哪些细分类?时序数据分类算法经典模型?当下时序分类算法模型强baseline?有没有现成的工具? 1…...
使用Python+pygame实现贪吃蛇小游戏
使用Pythonpygame贪吃蛇小游戏 使用第三方库pygame,关于Python中pygame游戏模块的安装使用可见 https://blog.csdn.net/cnds123/article/details/119514520 给出两种实现。 第一种 运行效果如下: 游戏源码如下: import pygame import sy…...
SpringBoot 全局异常统一处理:BindException(绑定异常)
概述 在Spring Boot应用中,数据绑定是一个至关重要的环节,它负责将HTTP请求中的参数映射到控制器方法的入参对象上。在这个过程中如果遇到任何问题,如参数缺失、类型不匹配或验证失败等,Spring MVC将会抛出一个org.springframewo…...
ucloud轻量云(wordpress)配置ssl
ucloud 轻量云(wordpress)配置ssl 1、上传ssl证书到/usr/local/software/apache/conf,这里的文件名和内容与ucloud控制台下载下来的文件名和内容保持一致 2、修改httpd.conf文件 vim /usr/local/software/apache/conf/httpd.conf 找到下面两行,去掉注…...
电脑/设备网络共享给其他设备上网
文章目录 一、概述二、设置网络共享2.1 电脑可以上网,通过网络共享让其他设备也可以上网2.2 手机如何使用USB数据线共享网络给电脑 一、概述 现在有如下几种情况: 设备本身不能上网,需要通过电脑上网 笔记本WIFI连热点上网,然后…...
vue之虚拟滚动
一、解决的问题 对于大量数据的懒加载,我们可以使用虚拟滚动的技术。虚拟滚动的原理是只渲染可视区域内的数据,当用户滚动时,动态计算并渲染新的可视数据,从而实现大数据量的流畅滚动。 在Vue中,我们可以使用第三方库…...
Redis学习指南(11)-Redis的有序集合数据类型介绍
文章目录 特点和用途常用命令插入操作查询操作删除操作 示例总结 Redis的有序集合数据类型是一种高效的数据结构,能够存储多个成员和对应的分值,并能够根据分值进行快速的查找、插入和删除操作。本文将详细介绍Redis的有序集合数据类型,包括其…...
Spring的纯注解配置
1.环境搭建 1.1.创建工程 1.2.待改造的问题 我们发现,之所以我们现在离不开xml配置文件,是因为我们有一处很关键的配置,如果他要也能用注解配置,那么我们就可以脱离xml文件了: 1.2.1.jdbc配置 <context:propert…...
numpy 筛选多段数据
目录 掩码方式 利用切片 掩码方式 range_to_remove list(range(77-1, 111-1)) list(range(122-1, 135-1))keep_mask np.ones(image0_cut.shape[0], dtypebool)keep_mask[range_to_remove] Falseprocessed_data image0_cut[keep_mask] 利用切片 import numpy as np# 假设…...
【Kotlin】协程的字节码原理
前言 协程是Koltin语言最重要的特性之一,也是最难理解的特性。网上关于kotlin协程的描述也是五花八门,有人说它是轻量级线程,有人说它是无阻塞式挂起,有人说它是一个异步框架等等,众说纷芸。甚至还有人出了书籍专门介…...
区间预测 | Matlab实现LSSVM-ABKDE的最小二乘支持向量机结合自适应带宽核密度估计多变量回归区间预测
区间预测 | Matlab实现LSSVM-ABKDE的最小二乘支持向量机结合自适应带宽核密度估计多变量回归区间预测 目录 区间预测 | Matlab实现LSSVM-ABKDE的最小二乘支持向量机结合自适应带宽核密度估计多变量回归区间预测效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.Matlab实现…...
基于深度学习的实例分割的Web应用
基于深度学习的实例分割的Web应用 1. 项目简介1.1 模型部署1.2 Web应用 2. Web前端开发3. Web后端开发4. 总结 1. 项目简介 这是一个基于深度学习的实例分割Web应用的项目介绍。该项目使用PaddlePaddle框架,并以PaddleSeg训练的图像分割模型为例。 1.1 模型部署 …...
20240115如何在线识别俄语字幕?
20240115如何在线识别俄语字幕? 2024/1/15 21:25 百度搜索:俄罗斯语 音频 在线识别 字幕 Bilibili:俄语AI字幕识别 音视频转文字 字幕小工具V1.2 BING:音视频转文字 字幕小工具V1.2 https://www.bilibili.com/video/BV1d34y1F7…...
Flink 处理函数(1)—— 基本处理函数
在 Flink 的多层 API中,处理函数是最底层的API,是所有转换算子的一个概括性的表达,可以自定义处理逻辑 在处理函数中,我们直面的就是数据流中最基本的元素:数据事件(event)、状态(st…...
Linux系统下编译MPlayer
一、编译MPlayer 在 http://www.mplayerhq.hu/design7/dload.html 下载MPlayer源码 执行命令: tar -xf MPlayer-1.5.tar.xz cd MPlayer-1.5 ./configure --prefix$(pwd)/install --yasm make make install 然后在install/bin目录下即会生成mplayer的可执行文件 二…...
事务的ACID属性是什么?为什么它们很重要?
引言 在现代的数据库和事务处理系统中,事务处理是一项非常重要的技术。在数据库中,事务是指一组被视为单个逻辑操作单元的SQL语句序列,它们要么全部成功执行,要么全部不执行。事务可以确保数据库在执行时保持一致性和可靠性。ACI…...
计算机毕业设计 基于Java的手机销售网站的设计与实现 Java实战项目 附源码+文档+视频讲解
博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌ 🍅文末获取源码联系🍅 👇🏻 精…...
Redis相关命令详解及其原理
Redis概念 Redis,英文全称是remote dictionary service,也就是远程字典服务。这是kv存储数据库。Redis,包括所有的数据库,都是请求-回应模式,通俗来说就是数据库不会主动地要给前台推送数据,只有前台发送了…...
go语言中的GoMock
GoMock是一个Go框架。它与内置的测试包整合得很好,并在单元测试时提供了灵活性。正如我们所知,对具有外部资源(数据库、网络和文件)或依赖关系的代码进行单元测试总是很麻烦。 安装 为了使用GoMock,我们需要安装gomo…...
DIFFWAVE: A VERSATILE DIFFUSION MODEL FOR AUDIO SYNTHESIS (Paper reading)
DIFFWAVE: A VERSATILE DIFFUSION MODEL FOR AUDIO SYNTHESIS Zhifeng Kong, Computer Science and Engineering, UCSD, ICLR2021, Code, Paper 1. 前言 在这项工作中,我们提出了DiffWave,这是一种用于条件和无条件波形生成的多功能扩散概率模型。该模…...
▲基于DQPSK调制解调+LDPC编译码+扩频解扩通信链路matlab误码率仿真
目录 1.本系统整体构架 2.各个模块基本原理 2.1 DQPSK原理简介 2.2 DQPSK解调原理 2.3 LDPC编译码 2.4 扩频技术原理 3.仿真结果 4.完整程序下载 1.本系统整体构架 整个程序,我们采用如下的流程图实现: 2.各个模块基本原理 2.1 DQPSK原理简介 …...
CMMI 能力成熟度模型集成介绍
CMMI(Capability Maturity Model Integration)即能力成熟度模型集成,是由美国卡内基梅隆大学软件工程研究所(SEI)研发、现由ISACA旗下CMMI 研究院维护的国际权威过程改进与评估框架,核心是通过标准化最佳实…...
基于MATLAB平台PCA的人脸识别:开启识别新征程
基于MATLAB平台PCA的人脸识别,程序已调通,可将自己的数据替换进行识别。 得到识别准确率结果。最近在研究人脸识别技术,基于MATLAB平台利用PCA(主成分分析)实现了一个人脸识别程序,现在跟大家分享分享。 PC…...
COMSOL电磁超声仿真技术:基于5.6版本模型,精确检测L形铝板裂纹的电磁超声测量方法
COMSOL电磁超声仿真: Crack detection in L-shaped aluminum plate via electromagnetic ultrasonic measurements 版本为5.6,低于5.6的版本打不开此模型电磁超声检测(EMAT)在工业无损检测领域一直是个热门方向,最近在COMSOL 5.6上…...
嵌入式软件开发中的柔性数组机制
在嵌入式系统开发中,内存资源始终是最核心的约束之一。无论是微控制器还是低功耗控制终端,程序设计都必须在有限的存储空间中实现功能、效率与可靠性的平衡。因此,开发者不仅需要关注算法逻辑,还必须重视数据结构对内存的占用方式。 在这种背景下,柔性数组成为嵌入式软件…...
2026届最火的降重复率工具实际效果
Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 维普平台针对AIGC技术的引入,制定了严谨的检测规范,在当前学术场景里…...
驱动模块的加载与卸载机制
昨天调板子又遇到个怪事:insmod加载驱动一切正常,但rmmod死活卸载不掉,内核日志里只留下一行“Device or resource busy”。查了半小时才发现,原来是有个用户态进程没关,一直占着驱动文件。这种问题在嵌入式开发里太常…...
Java调用C/C++库从未如此简单:3步实现JNI替代方案,性能提升40%的FFM实测报告
第一章:Java调用C/C库从未如此简单:3步实现JNI替代方案,性能提升40%的FFM实测报告Java开发者长期受限于JNI繁琐的头文件生成、本地方法注册、内存生命周期管理等痛点。如今,Java 21正式将Foreign Function & Memory API&#…...
tao-8k性能优化小技巧:如何提升向量化与检索速度
tao-8k性能优化小技巧:如何提升向量化与检索速度 1. 理解tao-8k的性能瓶颈 1.1 模型架构特点 tao-8k作为支持8192长度上下文的嵌入模型,其核心优势在于长文本处理能力。然而,这种能力也带来了独特的性能挑战: 计算复杂度&…...
在Ubuntu 24.04上从源码编译PETSc:一个给计算科学新手的保姆级避坑指南
在Ubuntu 24.04上从源码编译PETSc:一个给计算科学新手的保姆级避坑指南 第一次在Ubuntu上编译科学计算库的经历,往往像闯进了一个满是隐藏陷阱的迷宫。作为过来人,我完全理解当看到满屏红色错误提示时的无助感——那些神秘的configure参数、突…...











