当前位置: 首页 > article >正文

时间序列分类|MedSpaformer:多粒度token稀疏化的可迁移Transformer模型

MedSpaformer: a Transferable Transformer with Multi-granularity Token Sparsification for Medical Time Series Classification注意: 该论文在v1版本2025年3月19日中名为 “Sparseformer”在后续版本v2/v3中更名为 “MedSpaformer”作者: Jiexia Ye, Weiqi Zhang, Ziyue Li, Jia Li, Fugee Tsung机构:香港科技大学广州香港科技大学德国科隆大学发表时间: 2025年3月19日v12025年5月29日更新v22025年8月17日更新v3论文链接: https://arxiv.org/abs/2503.15578源码The code is provided in the supplementary material研究背景与动机医疗时间序列Medical Time Series, MedTS分类对于临床诊断至关重要但面临四大核心挑战挑战 描述多尺度模式 病理特征跨越毫秒如癫痫尖波到分钟如慢波振荡复杂跨通道关系 多传感器数据如12导联ECG编码空间分布的生物标志物信息冗余 不同尺度和通道中的冗余段引入噪声和计算低效标签稀缺 临床标注数据集有限尤其是罕见疾病现有Transformer模型主要专注于预测任务未能充分利用MedTS的独特特性单时间戳方法难以捕捉粗粒度模式全时间戳方法可能忽略细粒度局部细节多粒度方法如PatchTST、Crossformer局限于单通道输入Medformer虽有多粒度跨通道能力但缺乏有效抑制冗余信号的机制核心贡献MedSpaformer模型整体架构┌─────────────────────────────────────────────────────────┐ │ MedSpaformer │ ├─────────────────────────────────────────────────────────┤ │ 时间序列编码器 │ 自适应标签编码器 │ │ (Time Series Encoder) │ (Adaptive Label Encoder) │ ├─────────────────────────┼───────────────────────────────┤ │ ┌─────────────────┐ │ 标签文本描述 → ClinicalBERT │ │ │ 多粒度分割 │ │ ↓ │ │ │ Multi-granularity│ │ 可学习投影器 → D维统一空间 │ │ │ Segmentation │ │ │ │ └────────┬────────┘ │ │ │ ↓ │ │ │ ┌─────────────────┐ │ │ │ │ 粒度内层次稀疏 │ │ │ │ │ Intra-granularity│ │ │ │ │ Encoding (TSDA)│ │ │ │ └────────┬────────┘ │ │ │ ↓ │ │ │ ┌─────────────────┐ │ │ │ │ 粒度间编码 │ │ │ │ │ Inter-granularity│ │ │ │ │ Encoding (TSDA)│ │ │ │ └────────┬────────┘ │ │ │ ↓ │ │ │ ┌─────────────────┐ │ │ │ │ 跨通道编码 │ │ │ │ │ Cross-channel │ │ │ │ │ Encoding (TSDA)│ │ │ │ └────────┬────────┘ │ │ │ ↓ │ │ │ 时间序列嵌入 HX │ 标签嵌入 Hy │ │ (D维) │ (D维) │ └─────────────────────────┴───────────────────────────────┘ ↓ 对比学习优化最大化相似度核心创新模块Token-Sparse Dual Attention (TSDA) 块设计灵感模拟医生的两阶段诊断过程——先整体症状情境化再聚焦生物标志物分析结构组成输入序列 H ∈ R^(L×D) ↓ ┌─────────────────────────────────────┐ │ Stage 1: Self-Attention │ │ 自注意力层 │ │ H_self Attn_self(H, H, H) │ │ 建模全局时间依赖捕获所有token的 │ │ 成对交互解决局部模式歧义 │ └─────────────┬───────────────────────┘ ↓ ┌─────────────────────────────────────┐ │ Stage 2: Token-Sparse Attention │ │ 稀疏token注意力层 │ │ │ │ 可学习查询 Q_aug f(Q, E_prior) │ │ (融合领域先验知识) │ │ │ │ H_sparse Attn_sparse(Q_aug, H_self, H_self) │ │ Softmax(Q_aug(H_self·W_K)^T/√d) · H_self·W_V │ │ │ │ 输出: K ≪ L 个token实现计算减少 │ │ 同时保留关键特征消除无关信息 │ └─────────────────────────────────────┘关键特性输入长度无关可训练参数仅依赖于预定义的查询数K和维度D而非输入长度L动态特征精炼通过领域引导的可学习查询聚焦于最具信息量的token多粒度层次稀疏编码粒度内编码Intra-Granularity使用多个TSDA块K3token数配置为[128, 64, 32]渐进式噪声抑制保留层次化判别模式H_k TSDA_k(H_{k-1}; Θ_k, O_k) 其中 O_k O_{k-1}实现渐进式token压缩粒度间编码Inter-Granularity将各粒度的表示拼接后通过TSDA块建模跨粒度关系自注意力建立全局上下文稀疏注意力压缩信息多粒度配置使用粒度集合 S {25, 50, 100, 150} 捕获多尺度时间模式跨通道编码Cross-Channel Encoding通道级表示 {h_c}_{c1}^C → 拼接为 H_C ∈ R^(C×D_c) ↓ Self-Attention: 计算所有通道的密集成对相关性 ↓ Token-Sparse Attention: 将C个通道压缩为O_cross个任务特定交互原型 ↓ MLP投影 → 最终时间序列嵌入 H_X ∈ R^D关键优势可训练参数仅依赖于输出token数O_cross和维度D而非通道数C支持跨异构数据集部署如6通道ICU监护仪 vs 12通道可穿戴设备自适应标签编码器Adaptive Label Encoder解决问题传统one-hot编码难以适应异构标签空间或泛化到未见类别设计标签文本描述 T_y → ClinicalBERT冻结语言模型 ↓ 可学习投影器W1, W2, b→ ReLU激活 ↓ D维统一空间中的自适应标签嵌入 H_y损失函数L(Θ) -Σ log[exp(sim(H_X, H_y)) / Σ_j exp(sim(H_X, H_j))]实验结果数据集7个医疗数据集数据集 领域 样本数 类别数 通道数 序列长度APAVA 阿尔茨海默病 5,967 2 16 256 (EEG)ADFTD 阿尔茨海默病 69,752 3 19 256 (EEG)PTB 心脏病 64,356 2 15 300 (ECG)PTB-XL (4类) 心脏病 17,110 4 12 1000 (ECG)PTB-XL (5类) 心脏病 17,110 5 12 1000 (ECG)TUSZ (2类) 癫痫 22,040 2 19 6000 (EEG)TUSZ (4类) 癫痫 2,891 4 19 6000 (EEG)监督学习性能F1分数模型 APAVA ADFTD TUSZ(2) TUSZ(4) PTB-XL(4) PTB-XL(5) PTB 平均DLinear 0.486 0.292 0.648 0.735 0.234 0.243 0.593 0.461TimesNet 0.706 0.465 0.767 0.854 0.479 0.513 0.776 0.652Medformer 0.706 0.461 0.823 0.841 0.584 0.514 0.811 0.677MedSpaformer 0.813 0.472 0.854 0.893 0.578 0.542 0.850 0.715关键发现MedSpaformer在7个数据集上均达到最佳性能平均F1分数比次优的Medformer高出约4%通过聚焦有用的多粒度token并渐进式丢弃冗余信息提取更高层次的通道交互少样本学习Few-shot Learning在{5, 10, 20, 30, 40, 50}-shot设置下评估MedSpaformer在所有shot设置下均表现最佳仅5个样本训练时性能已超过多数基线模型零样本学习Zero-shot Learning实验类型 设置 结果领域内迁移 同领域数据集间迁移 4个最佳性能跨领域迁移 不同领域间迁移 3个最佳性能对比 DLinear (50-shot) MedSpaformer零样本性能更优对比 DLinear (监督学习) MedSpaformer在APAVA、PTB-XL上零样本性能更优里程碑据作者称这是首个支持跨任务零样本学习的时间序列分类Transformer框架消融研究配置 APAVA ADFTD TUSZ(2) TUSZ(4) PTB-XL(4) PTB-XL(5) PTBw/o 多粒度 0.785 0.452 0.803 0.853 0.557 0.514 0.813w/o 通道注意力 0.782 0.460 0.816 0.868 0.562 0.535 0.835w/o 标签编码器 0.801 0.467 0.845 0.881 0.579 0.540 0.846MedSpaformer 0.813 0.472 0.854 0.893 0.578 0.542 0.850贡献度排序多粒度机制最重要移除后性能下降约7%稀疏注意力移除后性能下降约6%通道注意力移除后性能下降约5%对EEG数据集更显著标签编码器提供约2%的性能提升效率分析在APAVA数据集上的对比模型 参数量 每轮训练时间 F1分数Autoformer 4.5M 最快 0.718Medformer 2.1M 较快 0.706MedSpaformer 8.4M 中等 0.813TimesNet 12.3M 较慢 0.706结论MedSpaformer在效率与效果之间取得平衡以合理的参数量和训练时间实现显著更高的性能。关键创新总结创新点 技术实现 解决的问题Token稀疏双注意力 TSDA块自注意力稀疏注意力 信息冗余、计算效率多粒度层次编码 粒度内粒度间TSDA块堆叠 多尺度时间模式捕获跨通道编码 通道级TSDA处理 复杂跨通道依赖建模自适应标签编码 ClinicalBERT 可学习投影 跨数据集标签空间对齐输入输出异构性支持 稀疏编码机制 变长序列、变通道数处理结论与意义MedSpaformer通过以下设计实现了医疗时间序列分类的突破临床启发式设计模拟医生的两阶段诊断过程渐进式信息精炼从多粒度到跨通道的层次化特征提取跨数据集可迁移性支持监督、少样本、零样本学习首个零样本Transformer实现跨任务零样本迁移该研究为医疗AI中的标签稀缺问题提供了有效解决方案具有广泛的临床应用潜力。

相关文章:

时间序列分类|MedSpaformer:多粒度token稀疏化的可迁移Transformer模型

MedSpaformer: a Transferable Transformer with Multi-granularity Token Sparsification for Medical Time Series Classification 注意: 该论文在v1版本(2025年3月19日)中名为 “Sparseformer”,在后续版本(v2/v3)中…...

打破画布边界:为什么 AI 实时绘画正成为线下品牌营销与亲子互动的“新标配”?

AI 实时绘画已从“画完等待出图”的照片冲洗模式进化为“边画边变”的魔法镜子模式,显著提升亲子参与感与品牌记忆度。搜狐AILab“绘光织影”将延迟压缩至约 200ms、帧率达 20fps,并通过即画即印闭环,实现亲子参与时长与二次互动率双提升。 -…...

5分钟搞定百度网盘限速:免费开源的网盘直链下载助手终极指南

5分钟搞定百度网盘限速:免费开源的网盘直链下载助手终极指南 【免费下载链接】baiduyun 油猴脚本 - 一个免费开源的网盘下载助手 项目地址: https://gitcode.com/gh_mirrors/ba/baiduyun 还在为百度网盘几十KB的下载速度而烦恼吗?想要免费享受满速…...

从零开始:3步掌握N_m3u8DL-CLI-SimpleG视频下载工具

从零开始:3步掌握N_m3u8DL-CLI-SimpleG视频下载工具 【免费下载链接】N_m3u8DL-CLI-SimpleG N_m3u8DL-CLIs simple GUI 项目地址: https://gitcode.com/gh_mirrors/nm3/N_m3u8DL-CLI-SimpleG 还在为在线视频无法下载而烦恼吗?今天我要为你介绍一个…...

CefFlashBrowser终极指南:在2025年完美运行Flash内容与游戏存档

CefFlashBrowser终极指南:在2025年完美运行Flash内容与游戏存档 【免费下载链接】CefFlashBrowser Flash浏览器 / Flash Browser 项目地址: https://gitcode.com/gh_mirrors/ce/CefFlashBrowser 随着Adobe正式停止对Flash的支持,无数经典的网页游…...

uni-app打包完整流程

📦 app打包完整流程 > 操作系统要求:macOS(Transporter 仅支持 Mac) 一、打包前准备 1. 设置环境变量 在 App.vue 文件中,设置 isProd 变量用于区分测试环境和正式环境: // App.vue let isProd = true // 正式环境设为 true,测试环境设为 false> 💡 提示:…...

微软正在测试类OpenClaw智能体功能,拟让Copilot实现自主运行

微软希望其AI助手能够成为一个全天候运行、代替用户自主完成任务的智能体,据The Information报道,微软正在探索将类似OpenClaw的功能集成到Copilot AI助手中的可能性。此次测试据报是微软推动Microsoft 365 Copilot"全天候自主运行"并为用户代…...

诺和诺德与OpenAI达成研发合作,加速新药研发进程

诺和诺德成为最新一家与AI巨头OpenAI建立战略联盟的大型制药企业,旨在面对日趋激烈的市场竞争,大力提升药物研发速度与效率。这家丹麦制药集团目前正与礼来公司在肥胖症和糖尿病市场展开激烈的份额争夺战。诺和诺德计划将OpenAI的技术全面融入公司运营&a…...

怎么轻松配置拯救者工具箱:联想笔记本性能优化完整指南

怎么轻松配置拯救者工具箱:联想笔记本性能优化完整指南 【免费下载链接】LenovoLegionToolkit Lightweight Lenovo Vantage and Hotkeys replacement for Lenovo Legion laptops. 项目地址: https://gitcode.com/gh_mirrors/le/LenovoLegionToolkit Lenovo L…...

3分钟搞定!免费解锁AMD/Intel处理器性能的终极指南

3分钟搞定!免费解锁AMD/Intel处理器性能的终极指南 【免费下载链接】Universal-x86-Tuning-Utility Unlock the full potential of your Intel/AMD based device. 项目地址: https://gitcode.com/gh_mirrors/un/Universal-x86-Tuning-Utility 还在为电脑性能…...

告别裸机SPI轮询:在ZYNQ上为W25Q80 Flash打造高效驱动层(附C语言源码)

告别裸机SPI轮询:在ZYNQ上为W25Q80 Flash打造高效驱动层(附C语言源码) 在嵌入式系统开发中,SPI Flash存储设备如W25Q80系列因其高性价比和易用性被广泛采用。然而,许多开发者在使用ZYNQ这类高性能SoC时,仍…...

Axios 爆高危 RCE 漏洞 CVE-2026-40175:原理、PoC 利用与全网修复方案

2026年4月9日,全球最流行的JavaScript HTTP客户端Axios发布紧急安全更新,修复了编号为CVE-2026-40175的高危漏洞。该漏洞CVSS评分高达9.9/10,影响所有0.x和1.x版本,周下载量超过1亿次的庞大用户群体瞬间暴露在风险之中。与此前的供…...

Speech Seaco Paraformer优化指南:如何提升中文语音识别准确率

Speech Seaco Paraformer优化指南:如何提升中文语音识别准确率 1. 引言:为什么需要优化语音识别准确率 语音识别技术在日常工作和生活中的应用越来越广泛,从会议记录到客服对话,从语音输入到内容创作,准确率直接决定…...

Face Analysis WebUI快速部署:Docker Compose一键拉起+模型自动下载

Face Analysis WebUI快速部署:Docker Compose一键拉起模型自动下载 1. 引言:智能人脸分析,触手可及 你是否曾经想过,在自己的电脑上搭建一个专业级的人脸分析系统?不需要复杂的配置,不需要手动下载模型&a…...

低成本GPU算力方案:PyTorch 2.8镜像助力中小企业实现AIGC私有化部署

低成本GPU算力方案:PyTorch 2.8镜像助力中小企业实现AIGC私有化部署 1. 为什么中小企业需要私有化AIGC部署 在人工智能生成内容(AIGC)领域,中小企业常常面临两大难题:高昂的云服务成本和数据隐私风险。传统方案要么需…...

HunyuanVideo-Foley多场景落地:虚拟主播直播实时AI音效增强方案

HunyuanVideo-Foley多场景落地:虚拟主播直播实时AI音效增强方案 1. 引言:直播音效的AI革命 在虚拟主播直播领域,音效质量直接影响观众体验。传统Foley音效制作面临三大痛点: 成本高昂:专业音效师按小时计费效率低下…...

如何快速搭建Sunshine游戏串流服务器:从零开始的完整配置指南

如何快速搭建Sunshine游戏串流服务器:从零开始的完整配置指南 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine 还在为无法在客厅电视上流畅玩PC游戏而烦恼吗&#xff1f…...

Fish Speech 1.5效果展示:高难度专有名词(化学式/医学术语)发音准确率

Fish Speech 1.5效果展示:高难度专有名词(化学式/医学术语)发音准确率 1. 专业术语发音的挑战与突破 语音合成技术发展到今天,日常对话的合成已经相当成熟,但专业领域的术语发音一直是技术难点。化学式、医学术语、专…...

【maaath】Flutter 三方库 dio 的鸿蒙化适配指南:网络请求与数据列表实践

Flutter 三方库 dio 的鸿蒙化适配指南:网络请求与数据列表实践 欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.csdn.net一、引言 我在移动应用开发中意识到,网络请求是最基础也是最核心的功能之一。随着开源鸿蒙生态的蓬勃发…...

“先读后生成“统一范式:记忆驱动的AI交互模式

"先读后生成"统一范式:记忆驱动的AI交互模式 ——基于RAG与提问工程化融合的通用交互框架 摘要 当前大语言模型产业应用中,系统侧检索增强生成(RAG,M6赛道) 与用户侧提问工程化(M2赛道) 长期处于割裂状态:RAG聚焦系统侧知识的标准化沉淀,却无法适配用户的个…...

Stable Yogi Leather-Dress-Collection 多模型对比评测:与同类开源模型的优势分析

Stable Yogi Leather-Dress-Collection 多模型对比评测:与同类开源模型的优势分析 最近在尝试用AI做皮革服饰设计,发现了一个挺有意思的模型——Stable Yogi Leather-Dress-Collection。听名字就知道,它是专门针对皮革服装设计这个细分领域的…...

从零配置到向量相加:在VS2022中构建你的第一个CUDA程序

1. 环境准备:搭建CUDA开发环境 第一次接触CUDA编程时,最让人头疼的就是环境配置。记得我刚开始学习CUDA时,光是安装驱动和配置VS2022就折腾了一整天。现在回想起来,其实只要按照正确的步骤操作,整个过程可以非常顺利。…...

APIPOST 8.x 脚本实战:循环调用接口实现OA流程自动化测试

1. 为什么需要OA流程自动化测试 最近在排查一个OA系统的诡异问题时,我遇到了一个典型场景:某个审批流程偶尔会出现卡顿,但手动测试又很难复现。这时候就需要用自动化测试工具来模拟真实用户操作,通过高频次的流程触发来验证问题。…...

谷歌为 Pixel 10 调制解调器嵌入 Rust 组件,破解内存安全难题

【导语:现代智能手机操作系统虽有众多安全机制,但调制解调器的安全问题仍不容忽视。谷歌 Project Zero 团队的研究促使谷歌重新评估调制解调器安全,决定将基于 Rust 的组件嵌入 Pixel 10 调制解调器。】调制解调器成攻击重灾区现代智能手机操…...

PP-DocLayoutV3快速体验:上传图片即得分析结果,支持合同/论文/书籍

PP-DocLayoutV3快速体验:上传图片即得分析结果,支持合同/论文/书籍 1. 文档版面分析的实用价值 在日常工作中,我们经常需要处理各种文档:合同需要提取关键条款、论文需要分析结构、书籍需要数字化存档。传统的人工处理方式效率低…...

IndexTTS 2.0快速上手:上传音频+文字,5分钟生成专属配音

IndexTTS 2.0快速上手:上传音频文字,5分钟生成专属配音 还在为视频找不到合适的配音而烦恼吗?自己录,声音不好听;找专业配音,价格不便宜。现在,有了B站开源的IndexTTS 2.0,这个问题…...

TPFanCtrl2:ThinkPad风扇控制终极指南,打造静音高效散热系统

TPFanCtrl2:ThinkPad风扇控制终极指南,打造静音高效散热系统 【免费下载链接】TPFanCtrl2 ThinkPad Fan Control 2 (Dual Fan) for Windows 10 and 11 项目地址: https://gitcode.com/gh_mirrors/tp/TPFanCtrl2 ThinkPad笔记本以其卓越的可靠性和…...

手把手教你部署NaViL-9B:双卡配置与快速测试全记录

手把手教你部署NaViL-9B:双卡配置与快速测试全记录 1. 环境准备与快速部署 1.1 硬件要求 显卡配置:至少2张24GB显存的NVIDIA显卡(如RTX 3090或A10G)系统内存:建议64GB以上存储空间:至少50GB可用空间&…...

中小企业本地部署即时通讯:预算有限怎么把功能配齐

对于员工规模在50人到300人之间的中小企业来说,本地部署即时通讯时,核心不是一味追求功能越多越好,而是要先解决三个现实问题:数据能不能放在自己服务器上,日常沟通和文件传输够不够稳定,以及整体部署成本能…...

3分钟搞定城通网盘限速:免费直连解析工具完整指南

3分钟搞定城通网盘限速:免费直连解析工具完整指南 【免费下载链接】ctfileGet 获取城通网盘一次性直连地址 项目地址: https://gitcode.com/gh_mirrors/ct/ctfileGet 你是否曾经因为城通网盘的限速下载而烦恼?面对几十KB/s的下载速度,…...