当前位置: 首页 > article >正文

结合模体发现(Motif Discovery)与残差分析的时间序列研究方法

这篇关于多变量时间序列残差分析的学术论文。论文基本信息项目内容标题Cutting through the noise: Explaining residuals in multivariate time series with motif analysis穿透噪音用模体分析解释多变量时间序列中的残差作者Miguel G. Silva, Sara C. Madeira, Rui Henriques葡萄牙里斯本大学发表期刊Pattern Recognition模式识别领域顶级期刊发表时间2025年接收2026年正式发表代码https://doi.org/10.1016/j.patcog.2025.111900核心研究问题传统观点认为时间序列中的残差residuals就是噪音——不可预测的随机扰动。但这篇论文提出了一个颠覆性假设“大量看似随机的残差变化实际上可能隐藏着有意义的、可解释的非周期性模式而非纯粹的噪音。”论文试图回答复杂系统行为的可解释性极限究竟在哪里核心方法论1. 整体框架图1原始多变量时间序列 ↓ [步骤1] 时间序列分解如MSTL ↓ 提取趋势(T) 季节性(S) 残差(R) ↓ 计算残差强度 F_Residuals var(R)/var(X) ↓ 如果残差强度显著 → [步骤2] 在残差上执行模体发现 ↓ [步骤3] 统计显著性检验 排序过滤 ↓ [步骤4] 动态参数调整 ↓ 输出统计显著的模体 无法解释的噪音2. 关键技术矩阵轮廓Matrix Profile, MP这是论文的技术基石一种计算高效的全对相似性搜索方法定义对于长度为nnn的时间序列MP是一个向量记录每个长度为sss的子序列与其最近邻的距离优势O(n2)O(n^2)O(n2)时间复杂度精确算法或准线性复杂度近似算法适合流式数据3. 多维度模体发现将MP扩展到多变量场景mmm个维度无约束搜索自动确定模体跨越的维度数q≤mq \leq mq≤m约束搜索指定必须包含/排除的变量子集距离阈值在至少qqq个维度上满足最大距离dmaxd_{max}dmax​4. 统计显著性检验这是区分真模式和假阳性的关键一阶马尔可夫假设pM∏Yj∈JpMj∏Yj∈JP(Yjxjt)∏t1tsP(Yjxji∣Yjxji−1)p_M \prod_{Y_j \in J} p_{M_j} \prod_{Y_j \in J} P(Y_jx_j^t) \prod_{t1}^{ts} P(Y_jx_j^i | Y_jx_j^{i-1})pM​Yj​∈J∏​pMj​​Yj​∈J∏​P(Yj​xjt​)t1∏ts​P(Yj​xji​∣Yj​xji−1​)二项式检验计算模体在Nn−s1Nn-s1Nn−s1次独立试验中出现rrr次的概率多重检验校正使用 Benjamini-Hochberg 方法控制错误发现率5. 可操作性评分Actionability Score论文提出了一个统一评分SUnifiedS_{Unified}SUnified​来排序模体SUnifiedw1(1−median(top-k distances)dmax)w2(rrmax)w3⋅CES_{Unified} w_1\left(1 - \frac{\text{median}(\text{top-}k\text{ distances})}{d_{max}}\right) w_2\left(\frac{r}{r_{max}}\right) w_3 \cdot C_ESUnified​w1​(1−dmax​median(top-kdistances)​)w2​(rmax​r​)w3​⋅CE​其中第一项匹配质量距离越小越好第二项出现频率rrr为匹配次数第三项模式复杂度CEC_ECE​避免过于简单的平凡模体三大案例研究数据集场景关键发现人体活动识别6轴加速度计22名受试者12种活动发现47.3%的残差方差可由模体解释模体对应站立→行走等活动转换家庭能耗法国Sceaux家庭4年分钟级用电数据97.3%的残差方差被解释模体对应空调等高耗能设备使用模式里斯本人口密度Vodafone手机信号3743个空间网格小时级发现足球赛事等非周期性事件驱动的残差模式单个模体解释高达50%残差里斯本案例亮点图4-7这是最具应用价值的部分本菲卡球场附近区域发现与足球赛事高度相关的12小时残差模体模式前5小时平稳→第7小时急剧下降至谷底→逐渐回升43次匹配解释43.1%残差方差** Sporting球场附近**发现下午16-18时的人群聚集模式28次匹配解释42.75%残差方差非归一化搜索直接发现特定事件如周末足球赛导致的绝对人口变化论文的五大贡献概念创新提出将残差分解为可解释结构与真正噪音的方法论方法扩展将模体发现任务扩展到噪音解释性领域包含偏差消除、超参数鲁棒化统计准则建立评估模式显著性、定义时间尺度、预处理数据的统计框架开源工具提供Web应用实现GitHub:cml_synthetic_demo知识获取在多个领域验证发现解释高达50%不规则成分的模式关键数学定义符号含义X⟨x1,...,xn⟩X \langle \mathbf{x}_1, ..., \mathbf{x}_n \rangleX⟨x1​,...,xn​⟩多变量时间序列xi∈Rm\mathbf{x}_i \in \mathbb{R}^mxi​∈RmXi,s,JX_{i,s,J}Xi,s,J​从位置iii开始、长度sss、跨越变量子集JJJ的子序列Di[di,1,...,di,n−s1]D_i [d_{i,1}, ..., d_{i,n-s1}]Di​[di,1​,...,di,n−s1​]距离轮廓子序列iii与所有子序列的距离P[min⁡(D1),...,min⁡(Dn−s1)]P [\min(D_1), ..., \min(D_{n-s1})]P[min(D1​),...,min(Dn−s1​)]矩阵轮廓最近邻距离FResidualsvar(R)var(X)F_{Residuals} \frac{var(R)}{var(X)}FResiduals​var(X)var(R)​残差强度指标CE(M)∑i1s−1(qi′−qi1′)2s−1C_E(M) \frac{\sqrt{\sum_{i1}^{s-1}(q_i - q_{i1})^2}}{\sqrt{s-1}}CE​(M)s−1​∑i1s−1​(qi′​−qi1′​)2​​模体复杂度min-max归一化后的差分局限性与未来方向局限性依赖残差中确实存在可解释结构若无结构则效果受限精确MP算法O(n2)O(n^2)O(n2)复杂度大规模数据需近似算法未来方向用发现的非周期模式指导时间序列分解优化趋势/季节性提取扩展到时空异构数据结构融入情境上下文如天气、新闻事件增强解释探索模体的时间规则结构用于预测任务自动生成可视化-文本混合解释核心启示这篇论文的最大价值在于改变了我们对噪音的认知在复杂系统城市、人体、电网中所谓的噪音往往不是随机的而是由未建模的事件驱动的可解释模式。通过将时间序列分解与模体发现结合配合严格的统计显著性检验我们可以从残差中提取出具有可操作性的知识——这对于城市规划、能源管理、健康监测等领域具有直接的应用价值。

相关文章:

结合模体发现(Motif Discovery)与残差分析的时间序列研究方法

这篇关于多变量时间序列残差分析的学术论文。 论文基本信息项目内容标题Cutting through the noise: Explaining residuals in multivariate time series with motif analysis(穿透噪音:用模体分析解释多变量时间序列中的残差)作者Miguel G. …...

学习网安-二刷之SSRF

SSRF(服务器端请求伪造)概述SSRF是一种攻击者通过服务器发起恶意请求的安全漏洞,通常用于访问内部系统或绕过防火墙限制。攻击者利用目标服务器作为代理,请求内网资源或第三方服务。SSRF常见利用场景访问内部服务:扫描…...

Mac用户别折腾了!实测三种方法给U盘装Win10,最后还得靠Windows

Mac用户制作Windows启动盘的终极避坑指南 作为一个长期使用Mac却不得不偶尔与Windows打交道的用户,我最近经历了一场制作Windows 10启动U盘的噩梦。原本以为在Mac上完成这个任务会很简单,结果却接连尝试了三种方法都以失败告终。这篇文章将详细记录我的…...

NVIDIA IGX平台:企业级AI边缘计算解决方案解析

1. NVIDIA IGX平台的企业级AI边缘计算解决方案在医疗影像实时分析、工业质检流水线和天文观测数据处理这些场景中,传统云计算架构面临的根本矛盾在于:数据产生端与计算端的物理距离导致的网络延迟,与业务对毫秒级响应的硬性要求之间不可调和的…...

避坑指南:STM32软件I2C读取MPU6050数据老是不对?可能是这5个细节没做好

STM32软件I2C读取MPU6050数据异常排查实战手册 深夜调试嵌入式系统时,最令人抓狂的莫过于硬件连接看似正常,但传感器数据死活读不出来。上周我就遇到了这样的困境:用STM32的软件模拟I2C读取MPU6050时,OLED屏幕上要么显示一堆乱码&…...

告别手动!用ABAP BADI给采购订单行项目自动填税码(附Z001/Z002订单类型代码)

告别手动!用ABAP BADI给采购订单行项目自动填税码(附Z001/Z002订单类型代码) 在SAP采购订单处理中,税码的频繁手工输入一直是业务部门的痛点。想象一下,每天处理数百个采购订单,每个订单包含数十个行项目&a…...

从数据到故事:用ArcGIS布局编辑打造专业级人口结构专题图

1. 从数据到故事的思维转变 很多人第一次接触ArcGIS制作专题地图时,往往只关注技术操作本身。我曾经也是这样,花了大量时间研究工具按钮的位置,却忽略了最重要的部分——如何让数据讲好一个故事。直到有一次,我把精心制作的"…...

电力仿真避坑指南:110kV短距离输电,用集中参数模型真的够准吗?——基于Simulink的误差实测

110kV短距离输电仿真:集中参数模型的精度边界与工程决策 在电力系统设计与运行分析中,输电线路模型的精确选择常常让工程师陷入两难——是追求计算效率采用简化模型,还是为确保精度接受复杂计算?这个看似基础的问题,实…...

深入EtherCAT从站中断与同步:搞懂Sync0、Sync1和PDI中断如何影响你的控制周期

深入解析EtherCAT从站中断机制与同步优化策略 在工业自动化领域,EtherCAT因其卓越的实时性能而成为运动控制系统的首选协议。但对于开发者而言,真正理解从站设备的中断处理机制和同步原理,往往是实现微秒级精确控制的关键所在。本文将聚焦Syn…...

别再乱试了!手把手教你用串口助手调试Benewake TF系列雷达(附常见无数据排查表)

从零到一:Benewake TF系列雷达串口调试实战指南 第一次拿到Benewake TF系列雷达时,那种既兴奋又忐忑的心情至今记忆犹新。作为一名嵌入式开发者,我深知这类高精度传感器能为项目带来的价值,但也清楚调试过程中可能遇到的种种"…...

当流媒体成为数字围城:N_m3u8DL-RE如何打破现代视频下载的壁垒

当流媒体成为数字围城:N_m3u8DL-RE如何打破现代视频下载的壁垒 【免费下载链接】N_m3u8DL-RE Cross-Platform, modern and powerful stream downloader for MPD/M3U8/ISM. English/简体中文/繁體中文. 项目地址: https://gitcode.com/GitHub_Trending/nm3/N_m3u8…...

城通网盘解析器:3分钟掌握高速下载的终极秘籍

城通网盘解析器:3分钟掌握高速下载的终极秘籍 【免费下载链接】ctfileGet 获取城通网盘一次性直连地址 项目地址: https://gitcode.com/gh_mirrors/ct/ctfileGet 还在为城通网盘下载速度慢、广告多而烦恼吗?城通网盘解析器正是解决这些问题的利器…...

告别抓瞎!手把手教你用ISO-27145标准解析汽车故障码(附J2012DA表格下载)

告别抓瞎!手把手教你用ISO-27145标准解析汽车故障码(附J2012DA表格下载) 在汽车电子诊断领域,ISO-27145标准就像一本厚重的密码手册,而故障码则是车辆与工程师对话的暗号。每次连接诊断接口,ECU返回的那串十…...

别再手动打包了!用Jenkins Pipeline + Ansible实现Java项目自动化部署(附完整脚本)

从零构建企业级Java自动化部署流水线:Jenkins Pipeline与Ansible深度整合实战 每次代码提交后手动执行mvn package、scp上传、ssh重启服务的日子该结束了。我曾见过团队中最资深的工程师将宝贵时间浪费在重复的部署操作上——直到某次深夜紧急修复时,疲劳…...

如何快速安装APA第7版格式:面向Word用户的完整指南

如何快速安装APA第7版格式:面向Word用户的完整指南 【免费下载链接】APA-7th-Edition Microsoft Word XSD for generating APA 7th edition references 项目地址: https://gitcode.com/gh_mirrors/ap/APA-7th-Edition 还在为学术论文的参考文献格式问题而烦恼…...

免费解锁《鸣潮》120帧:鸣潮工具箱WaveTools完整使用指南

免费解锁《鸣潮》120帧:鸣潮工具箱WaveTools完整使用指南 【免费下载链接】WaveTools 🧰鸣潮工具箱 项目地址: https://gitcode.com/gh_mirrors/wa/WaveTools 想让《鸣潮》在电脑上运行得更加流畅丝滑吗?鸣潮工具箱WaveTools是专为《鸣…...

Whisper模型选哪个?从Tiny到Large,实测Python语音识别精度与速度的终极权衡

Whisper模型选哪个?从Tiny到Large,实测Python语音识别精度与速度的终极权衡 当面对一段10分钟的中文会议录音时,如何在有限的硬件资源下获得最佳转录效果?这个问题困扰着许多尝试使用Whisper进行语音识别的开发者。OpenAI开源的Wh…...

四足机器人无传感器地形稳定性检测技术解析

1. 四足机器人坍塌地形运动规划技术解析在灾难救援和行星探测等高风险场景中,四足机器人常面临地表突然坍塌的致命威胁。传统解决方案通常依赖两类技术路线:一类是通过立体视觉或激光雷达构建地形高程图,但这种方法只能识别表面几何特征&…...

5分钟搞定游戏画质升级:DLSS Swapper免费工具完全指南

5分钟搞定游戏画质升级:DLSS Swapper免费工具完全指南 【免费下载链接】dlss-swapper 项目地址: https://gitcode.com/GitHub_Trending/dl/dlss-swapper 还在为游戏画面模糊、帧率不稳而烦恼吗?你是否知道,许多游戏内置的DLSS版本可能…...

别再到处找安装包了!华为eNSP模拟器最新版(附VirtualBox、WinPcap)保姆级安装配置指南

华为eNSP模拟器全栈安装指南:从零避坑到高效组网 在数字化转型浪潮中,网络技术人才的实战能力成为核心竞争力。华为eNSP作为业界公认的企业级网络仿真平台,能完美复现真实设备操作环境,却让不少学习者在安装阶段就遭遇"出师未…...

FFmpeg罢工了?手把手教你修复那些没有.ts后缀的M3U8视频分片

FFmpeg罢工了?手把手教你修复那些没有.ts后缀的M3U8视频分片 你是否遇到过这样的情况:费尽心思用FFmpeg下载了一个M3U8视频,却在最后拼接环节遭遇"Invalid data"报错?更让人抓狂的是,明明下载的分片文件看起…...

别再乱选TVS管了!手把手教你从USB接口保护案例看懂VRWM、VCL、IPP怎么选

别再乱选TVS管了!手把手教你从USB接口保护案例看懂VRWM、VCL、IPP怎么选 当你的USB设备突然失灵,排除了软件问题后,很可能是接口电路遭遇了瞬态电压冲击。作为硬件工程师,我们每天都在与这些看不见的"电路杀手"搏斗。TV…...

如何解决Linux下CH341SER驱动问题:CH340/CH341 USB转串口完全指南

如何解决Linux下CH341SER驱动问题:CH340/CH341 USB转串口完全指南 【免费下载链接】CH341SER CH341SER driver with fixed bug 项目地址: https://gitcode.com/gh_mirrors/ch/CH341SER 在Linux系统中连接CH340/CH341系列USB转串口设备时,驱动问题…...

从‘紧耦合’到‘松耦合’:一个真实微服务拆分踩坑记与架构演进思考

从紧耦合到松耦合:一个电商平台的微服务架构演进实录 当我们的电商平台日订单量首次突破10万单时,系统开始频繁出现性能瓶颈。每次大促前的深夜,技术团队都要面对那个熟悉的噩梦:一个模块的小改动,需要全站回归测试&am…...

为什么Dify 1.3.0要用uv替换Poetry?聊聊Python依赖管理工具的选择与实战

为什么Dify 1.3.0要用uv替换Poetry?聊聊Python依赖管理工具的选择与实战 Python生态中的依赖管理工具一直是开发者们热议的话题。从早期的pip到后来的Pipenv、Poetry,再到如今备受关注的uv,每一次工具的迭代都反映了开发者对效率、稳定性和易…...

避坑指南:Halcon Variation_Model三种模式(standard/robust/direct)到底怎么选?

Halcon Variation_Model模式选型实战:从原理到避坑指南 在工业视觉检测领域,Variation_Model(差异模板)算子是处理轻微变形目标的利器,尤其在印刷品检测、包装缺陷识别等场景表现突出。但当开发者真正将其投入项目时&a…...

5个高效方法:专业级QMC音频解密完全指南

5个高效方法:专业级QMC音频解密完全指南 【免费下载链接】qmc-decoder Fastest & best convert qmc 2 mp3 | flac tools 项目地址: https://gitcode.com/gh_mirrors/qm/qmc-decoder 你是否曾经在QQ音乐下载了心爱的歌曲,却发现只能在特定软件…...

别再只跑Demo了!手把手教你用HPatches数据集实战评测你的局部描述子算法

别再只跑Demo了!手把手教你用HPatches数据集实战评测你的局部描述子算法 当你花费数周时间开发出一个新的局部描述子算法,兴奋地在Demo图像上看到不错的匹配效果时,是否曾思考过:这个算法在真实场景下的表现究竟如何?…...

用生活化的例子讲透USB PD状态机:从‘饿了吃饭’到电源协商的完整流程

用生活化的例子讲透USB PD状态机:从‘饿了吃饭’到电源协商的完整流程 想象一下,你走进一家餐厅,服务员递上菜单后开始一场微妙的互动——这与USB PD协议中电源和设备间的"对话"惊人相似。当你的手机连接充电器时,两者就…...

0-RTT详解和总结

0-RTT(Zero Round Trip Time,零往返时间)是一种优化网络连接的技术,允许客户端在未完成完整握手的情况下直接向服务器发送应用数据,从而消除握手阶段带来的往返延迟。该技术最早由 TLS 1.3 引入,后被 QUIC 协议继承并增强。以下从原理、实现、优缺点、安全性等维度进行系…...