AAAI 2025论文分享│STD-PLM:基于预训练语言模型的时空数据预测与补全方法
本文详细介绍了一篇发表于人工智能顶级会议AAAI 2025的论文《STD-PLM: Understanding Both Spatial and Temporal Properties of Spatial-Temporal Data with PLM》。该论文提出了一种基于预训练语言模型(Pre-trained Language Model,PLM)的时空预测与补全统一框架STD-PLM。通过显式设计的时空标记器和时空嵌入,STD-PLM 能够有效理解时空数据的空间和时间特性。此外,还引入沙漏注意力模块(Sandglass Attention.SGA),通过构建区域级空间标记显著降低计算成本。大量实验表明,STD-PLM表现出具有竞争力的性能。论文的工作表明,构建基于PLM的统一预训练时空模型具有广阔前景。
本推文由韩煦撰写,审核为邓镝。
原文链接:https://arxiv.org/html/2407.09096v4
代码链接:https://github.com/Hyheng/STD-PLM
一、研究背景
时空数据的时空特性理解对智能交通、城市规划等动态系统至关重要,其中时空预测与补全是核心任务。精准的预测可优化交通管理与出行规划,补全则能支撑时空模式分析及下游任务。然而,现有方法存在以下核心挑战:
- 时空相关性建模不足:传统PLM缺乏对时间序列动态性、空间拓扑结构(如节点连通性)及高阶时空交互的显式建模;
- 任务适配性差:现有PLM-based方法多聚焦预测任务,补全能力不足,且难以同时支持多任务;
- 计算效率瓶颈:PLM的高维嵌入与大量tokens导致处理时空数据时训练和推理成本激增;
该论文的主要贡献如下。
- 提出STD-PLM统一框架。设计基于预训练语言模型的时空预测与补全统一框架,实现对时空数据的空间和时间特性的联合建模,同时支持时空预测、补全、零样本及少样本学习任务。
- 设计拓扑感知节点嵌入,利用图拉普拉斯矩阵的特征向量捕捉空间拓扑结构,使PLM能感知节点间的静态关系与动态状态。
- 开发空间和时间标记器,从时空双维度将数据转换为PLM可处理的标记序列,显式建模时间相关性、空间连通性及高阶时空交互。
- 设计沙漏注意力模块(SGA),通过区域级标记聚合减少计算量,结合约束损失函数强制模型学习符合原始图结构的特征,在保证性能的同时显著提升计算效率。
二、方法
1、方法概述
图 1 STD-PLM 模型架构
图1展示了STD-PLM模型架构,图中将模型分为了四部分:模块A为节点和时间信息提供时空嵌入。时空标记器B从不同角度构建时间标记和空间标记。模块C基于B-2输出的节点级空间标记构建区域级空间标记。模块D将隐藏表示投影到目标输出。对于预训练语言模型,采用了部分冻结策略,并结合低秩适应技术对多头注意力、位置嵌入和层归一化层进行微调。
2、时空嵌入
拓扑感知节点嵌入:利用图拉普拉斯矩阵的特征向量捕捉空间节点的拓扑结构,通过选取前 K大特征值对应的特征向量,生成包含节点连通性信息的嵌入表示,其作用为捕捉节点在空间网络中的拓扑属性(如枢纽节点与边缘节点的差异),支持归纳式学习(即模型可泛化到未见过的图结构,如不同城市的交通网络)。
周期感知时间嵌入:结合 “小时级” 和 “星期级” 周期性粒度,构建时间嵌入字典,通过查表与拼接操作生成包含时间上下文的向量,捕捉数据的周期性波动模式。
3、时空标记器
空间标记器为每个节点生成包含 “静态属性”(节点嵌入与时间嵌入)、“动态状态”(历史数据特征)和 “缺失掩码” 的标记,支持 PLM 建模节点间的复杂空间依赖;
内在状态:拼接时间与节点嵌入,通过 MLP 提取静态时空特征(如节点在特定时段的拓扑角色)。
动态状态:直接对原始数据应用多层感知机( Multilayer Perceptron,MLP),捕捉实时动态特征(如节点的流量、速度)。
掩码标记:将二进制掩码转换为标记,显式提示缺失位置(补全任务关键)。
融合操作:通过逐元素相加与层归一化,生成包含 “动态 + 静态 + 缺失” 信息的复合标记。
时间标记器通过全局聚合节点信息,生成 “整体状态” 与 “变化趋势” 标记,帮助 PLM 捕捉时空数据的宏观演化规律,避免仅依赖局部节点信息。
整体状态:融合全局平均状态与最后时刻的时间嵌入,体现当前系统整体状态。
整体趋势:融合全局趋势与时间嵌入,表征 “系统随时间的变化方向”
4、沙漏注意力模块
编码器:通过可学习查询矩阵将节点级空间标记压缩为更少的区域级标记,减少计算量的同时捕捉非成对、高阶时空相关性;
解码器:将区域级表示还原为节点级,结合约束损失函数(强制区域划分符合原始图结构),确保压缩过程中拓扑信息不丢失;
效率优化:通过稀疏注意力机制与区域级聚合,显著降低 PLM 处理大规模节点时的时间与内存开销。
三、实验
1.实验设置
数据集:在交通领域的四个真实数据集(PEMS03/04/07/08)上,STD-PLM通过多维度实验验证了其在时空预测、补全及少样本场景下的领先性能。
基线对比:选取LSTM、ASTGCN等 7 种传统深度学习模型,以及OFA、STGLLM等 3 种 PLM-based 模型作为基线;
训练策略:采用6:2:2的数据集划分,滑动窗口构建样本,使用AdaW优化器及LoRA技术微调 PLM 参数,平衡效率与性能。
2、与最先进方法的比较
基线模型有两种,包括六种传统深度学习模型和三种基于预训练语言模型的模型。
表 1 预测性能
表1展示了 STD-PLM 与六种传统深度学习模型(如LSTM、ASTGCN等)及三种PLM-based模型(如OFA、STGLLM等)在四个交通数据集上的预测性能对比,指标包括MAE(平均绝对误差)、RMSE(均方根误差)和MAPE(平均绝对百分比误差)。STD-PLM在所有数据集上实现最优或次优性能。
表 2 在PEMS08数据集上的补全性能
表2展示了STD-PLM与BRITS、E2GAN等4种基线模型在PEMS08数据集高缺失率(70%)场景下的补全性能,结果显示:在随机缺失(RM)和时空连续缺失(CM)两种模式中,STD-PLM均以显著优势领先——RM 场景下 MAE为14.36,CM 场景下MAE为22.69。其核心优势源于掩码标记显式定位缺失位置、时空嵌入融合拓扑与周期先验及PLM 生成能力支持长程推理,使模型在高缺失率下仍能结合全局趋势(如早晚高峰规律)与局部拓扑关联(生成合理补全值,突破了传统方法依赖局部观测或数据拟合的局限,为传感器故障、数据采集不全等实际场景提供了高效可靠的解决方案。
3、消融研究
消融研究通过移除STD-PLM的关键组件,验证各模块对性能的贡献。假设表3对比了以下变体:
- 完整模型(STD-PLM):包含时空嵌入、时空标记器、沙漏注意力模块(SGA)及PLM微调策略;
- w/o 时空嵌入:移除拓扑感知节点嵌入与时间周期嵌入,仅用原始数据特征;
- w/o 时空标记器:直接将原始数据输入PLM,不进行时空维度解耦;
- w/o SGA 模块:保留节点级标记,不进行区域压缩;
- w/o 掩码标记:在补全任务中移除缺失模式编码。
表 3 消融分析
消融研究证实了STD-PLM的每个组件均不可替代:时空嵌入注入领域先验,时空标记器激活PLM时空理解,SGA模块优化计算效率,掩码标记增强补全针对性。这一结果不仅验证了模型设计的合理性,也为后续时空PLM的组件优化提供了方向。
四、总结
本文介绍了STD-PLM模型,旨在通过预训练语言模型解决时空数据的预测与补全问题。模型通过时空嵌入模块生成拓扑感知的节点嵌入与周期感知的时间嵌入,融合空间结构与时间规律;利用时空标记器解耦时空维度,构建包含动态状态、静态先验及缺失掩码的节点级标记与全局时间趋势标记;通过沙漏注意力模块压缩节点级标记为区域级以降低预训练语言模型的计算复杂度,同时通过约束损失保留拓扑信息;采用部分冻结预训练语言模型结合低秩自适应微调策略平衡预训练知识与任务适配性。实验表明,STD-PLM在交通数据集PEMS03/04/07/08的预测与补全任务中性能显著优于传统深度学习模型及其他PLM-based模型,尤其在70% 高缺失率场景下补全误差降低超40%,消融研究验证了各组件的必要性。该模型通过时空特性显式建模、预训练语言模型的推理能力与效率优化的结合,为时空智能任务提供了高效且泛化性强的解决方案,适用于智能交通、城市计算等数据稀缺或大规模场景。
相关文章:

AAAI 2025论文分享│STD-PLM:基于预训练语言模型的时空数据预测与补全方法
本文详细介绍了一篇发表于人工智能顶级会议AAAI 2025的论文《STD-PLM: Understanding Both Spatial and Temporal Properties of Spatial-Temporal Data with PLM》。该论文提出了一种基于预训练语言模型(Pre-trained Language Model,PLM)的…...

Ethernet/IP转DeviceNet网关:驱动大型矿山自动化升级的核心纽带
在大型矿山自动化系统中,如何高效整合新老设备、打通数据孤岛、实现统一控制,是提升效率与安全的关键挑战。JH-EIP-DVN疆鸿智能EtherNet/IP转DeviceNet网关,正是解决这一难题的核心桥梁,为矿山各环节注入强劲连接力: …...
Android 11以上App主动连接WIFI的完整方案
早期Android版本App内连接指定的WIFI还是比较简单的,但是随着Android版本的提升,限制也越来越多。以下是一套完整的Android 11以上的WIFI应用内主动连接方案。 第一步:添加到建议连接: val wifiManager getSystemService(WIFI_…...

[蓝桥杯]模型染色
模型染色 题目描述 在电影《超能陆战队》中,小宏可以使用他的微型机器人组合成各种各样的形状。 现在他用他的微型机器人拼成了一个大玩具给小朋友们玩。为了更加美观,他决定给玩具染色。 小宏的玩具由 nn 个球型的端点和 mm 段连接这些端点之间的边…...
力扣上C语言编程题
一. 简介 本文简单记录一下力扣上 C语言编程题。作为自己做题笔记。 二. 力扣上 C 语言编程题 1. 从数组中找到两个元素之和,等于一个 target目标值 具体题目说明:给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为…...

卡西欧模拟器:Windows端功能强大的计算器
引言 大家还记得初中高中时期用的计算器吗?今天给大家分享的就是一款windows端的卡西欧计算器。 软件介绍 大家好,我是逍遥小欢。 CASIO fx-9860G是一款功能强大的图形计算器,适用于数学、科学和工程计算。以下是其主要功能和特点的详细介…...
鸿蒙OSUniApp结合机器学习打造智能图像分类应用:HarmonyOS实践指南#三方框架 #Uniapp
UniApp结合机器学习打造智能图像分类应用:HarmonyOS实践指南 引言 在移动应用开发领域,图像分类是一个既经典又充满挑战的任务。随着机器学习技术的发展,我们现在可以在移动端实现高效的图像分类功能。本文将详细介绍如何使用UniApp结合Ten…...

机器学习基础(三) 逻辑回归
目录 逻辑回归的概念核心思想 Sigmoid 函数 逻辑回归的原理和底层优化手段伯努利分布最大似然估计 Maximum Likelihood Estimation (MLE)伯努利分布的似然函数交叉熵损失函数(Cross-Entropy Loss),也称为 对数损失&…...
系统调试——ADB 工具
ADB 工具 1.1 概述 ADB(Android Debug Bridge) 是 Android SDK 里的一个工具, 用这个工具可以操作管理Android 模拟器或真实的 Android 设备。 主要功能有: 运行设备的 shell(命令行)管理模拟器或设备的端…...

Qwen-3 微调实战:用 Python 和 Unsloth 打造专属 AI 模型
虽然大家都忙着在 DeepSeek 上构建应用,但那些聪明的开发者们却悄悄发现了 Qwen-3 的微调功能,这可是一个隐藏的宝藏,能把通用型 AI 变成你的专属数字专家。 通过这篇文章,你将学到如何针对特定用途微调最新的 Qwen-3 模型。无论…...

微软Build 2025:Copilot Studio升级,解锁多智能体协作未来
微软Build 2025大会圆满落幕,作为年度科技盛会,它一直是开发与AI技术突破性创新的重要展示平台。对于工程师、创作者和领域专家来说,这是了解微软生态未来动向的关键时刻。今年,Microsoft Copilot Studio推出了一系列新功能&#…...

设计模式——系统数据建模设计
摘要 本文主要介绍了UML在软件系统分析和设计中的应用,详细阐述了六大类关系(泛化、实现、依赖、关联、聚合、组合)及其在UML类图中的表示方法,并通过具体例子说明了这些关系在实际编程中的应用。同时,文章还概述了UM…...

解决docker运行zentao 报错:ln: failed to create symbolic link ‘/opt/zbox/tmp/mysq
1 背景描述 禅道使用docker部署运行过一段,服务正常。 后因服务器断电重启,禅道服务也随docker一起启动,但是服务却无法访问。如下如: 2 查看日志,定位原因 查看禅道日志: # docker logs zentao容器di…...
Spring Boot MVC自动配置与Web应用开发详解
Spring Boot MVC自动配置机制 Spring Boot通过自动配置功能为MVC应用提供了开箱即用的默认配置,开发者无需手动配置即可获得完整的Web支持。以下是核心功能的实现原理: 静态资源支持 默认情况下,Spring Boot会自动从以下classpath目录提供…...

OA工程自动化办公系统 – 免费Java源码
概述 功能完备的OA工程自动化办公系统Java源码,采用主流技术栈开发,无论是学习SpringBoot框架还是开发企业级应用,都是不可多得的优质资源。 主要内容 技术架构 后端技术栈: 核心框架:SpringBoot 2.xORM框…...

Apache IoTDB V2.0.3 发布|新增元数据导入导出脚本适配表模型功能
Release Announcement Version 2.0.3 Apache IoTDB V2.0.3 已经发布! V2.0.3 作为树表双模型正式版本,主要新增元数据导入导出脚本适配表模型、Spark 生态集成(表模型)、AINode 返回结果新增时间戳,表模型新增部分聚…...

某校体育场馆结构自动化监测
1. 项目简介 某小学学校成立于2020年,是一所公办小学,以高起点定位为该区优质教育新增长极,依托当地学院及教师进修学院附属小学资源,注重学生综合素质培养,近年来,该小学聚焦“五育” 领域,不…...
MySQL 9.0 相较于 MySQL 8.0 引入了多项重要改进和新特性
MySQL 9.0 相较于 MySQL 8.0 引入了多项重要改进和新特性,以下是两者的主要区别及其详细说明: 1. 认证机制 MySQL 8.0 支持 mysql_native_password 和 caching_sha2_password 认证插件。默认使用 caching_sha2_password,但未完全移除 mysql_native_password。MySQL 9.0 完全…...

Android 3D球形水平圆形旋转,旋转动态更换图片
看效果图 1、事件监听类 OnItemClickListener:3D旋转视图项点击监听器接口 public interface OnItemClickListener {/*** 当旋转视图中的项被点击时调用** param view 被点击的视图对象* param position 被点击项在旋转视图中的位置索引(从0开始&a…...

数据结构与算法学习笔记(Acwing 提高课)----动态规划·树形DP
数据结构与算法学习笔记----动态规划树形DP author: 明月清了个风 first publish time: 2025.6.4 ps⭐️树形动态规划(树形DP)是处理树结构问题的一种动态规划方法,特征也很明显,会有一个树形结构,其实是DFS的优化。…...
FTP 和 SFTP 介绍及 C/C++ 实现分析
1. FTP 协议概述 FTP(File Transfer Protocol)是一种用于在网络上进行文件传输的标准协议,诞生于 1971 年,是互联网上最早的应用层协议之一。它基于客户端 - 服务器模型,使用 TCP 作为传输层协议,默认通过 …...

leetcode hot100刷题日记——36.最长连续序列
解答: 实际上在哈希表中存储不重复的数字。 然后遍历哈希表,找间隔,更新最大间隔。 class Solution { public:int longestConsecutive(vector<int>& nums) {unordered_set<int>hash;for(int num:nums){hash.insert(num);}in…...

CentOS7关闭防火墙、Linux开启关闭防火墙
文章目录 一、firewalld开启、关闭防火墙1、查看防火墙状态 一、firewalld开启、关闭防火墙 以下命令在linux系统CentOS7中操作开启关闭防火墙 # 查询防火墙状态 systemctl status firewalld.service # 开启防火墙 systemctl start firewalld.service # 开机自启动防火墙 syste…...

PyTorch——搭建小实战和Sequential的使用(7)
import torch from torch import nn from torch.nn import Conv2d, MaxPool2d, Flatten, Linearclass TY(nn.Module):def __init__(self):"""初始化TY卷积神经网络模型模型结构:3层卷积池化,2层全连接设计目标:处理32x32像素的…...
基于大模型的腔隙性脑梗塞风险预测及治疗方案研究
目录 一、引言 1.1 研究背景与意义 1.2 研究目的与方法 1.3 国内外研究现状 二、腔隙性脑梗塞概述 2.1 定义与分类 2.2 发病机制与病理生理过程 2.3 临床表现与诊断方法 三、大模型技术原理与应用现状 3.1 基本概念与技术架构 3.2 在医疗领域的应用案例与优势 3.3 …...

Python 开发效率秘籍:PyCharm、VS Code 与 Anaconda 配置与实战全解
目录 一、IDE(集成开发环境)是什么?二、Python IDE有哪些,哪款适合初学者?三、Visual Studio Code下载和安装教程3.1 VS Code下载和安装3.2 VS Code运行Python程序 四、PyCharm下载和安装教程4.1 PyCharm下载4.2 PyCharm安装4.3 运行PyCharm4.4 创建工程…...
[C]C语言日志系统宏技巧解析
代码解释:日志标签字符串化宏 这段代码定义了一个名为 _LOG_TAG 的宏,用于将 LOG_TAG_CONST 转换为字符串形式。这在日志系统中很常见,用于为不同模块添加标识前缀。 宏结构分析 #define _LOG_TAG STR(LOG_TAG_CON…...
自动驾驶系统研发系列—激光雷达感知延迟:自动驾驶安全的隐形隐患?
🌟🌟 欢迎来到我的技术小筑,一个专为技术探索者打造的交流空间。在这里,我们不仅分享代码的智慧,还探讨技术的深度与广度。无论您是资深开发者还是技术新手,这里都有一片属于您的天空。让我们在知识的海洋中一起航行,共同成长,探索技术的无限可能。 🚀 探索专栏:学…...
内网应用如何实现外网访问?无公网IP本地端口网址服务提供互联网连接
一、应用程序外网访问遇到的问题 在现实的工作场景中,在公司内网的服务器上有很多的应用系统,这些系统只能局限于在公司内部使用,而在外网却无法使用。 二、外网访问内网应用常见的解决方案 如何在外网使用这些系统呢?下面简单…...

大话软工笔记—组合要素1之要素
1. 要素来源 对象是要素的来源,要素是从对象分解而来的。可将对象分为优化类和非优化类,如下图所示。 对象分类图 2. 要素的概念 2.1 要素的定义 要素,是构成事物必不可少的因素,要素的集合体构成了对象。 2.2 要素的内容 要…...