当前位置：首页 > news >正文

Pyraformer复现心得

news 2025/7/7 8:09:19

Pyraformer复现心得

引用

Liu, Shizhan, et al. “Pyraformer: Low-complexity pyramidal attention for long-range time series modeling and forecasting.” International conference on learning representations. 2021.

代码部分

def long_forecast(self, x_enc, x_mark_enc, x_dec, x_mark_dec, mask=None):enc_out = self.encoder(x_enc, x_mark_enc)[:, -1, :]#B,dmodel*3dec_out = self.projection(enc_out).view(enc_out.size(0), self.pred_len, -1)#B,pre,Nreturn dec_out

预测部分就这么长

x_dec, x_mark_dec, mask=None都没用到

enc_out = self.encoder(x_enc, x_mark_enc)[:, -1, :]
#B,dmodel*3

直接进入encoder

def forward(self, x_enc, x_mark_enc):seq_enc = self.enc_embedding(x_enc, x_mark_enc)

重构了encoder和decoder，跟transformer的很不一样

x = self.value_embedding(x) + self.temporal_embedding(x_mark) + self.position_embedding(x)
return self.dropout(x)

embedding方法跟former一样

mask = self.mask.repeat(len(seq_enc), 1, 1).to(x_enc.device)

用pyra的方式获取pam掩码

def get_mask(input_size, window_size, inner_size):"""Get the attention mask of PAM-Naive"""# Get the size of all layersall_size = []all_size.append(input_size)for i in range(len(window_size)):layer_size = math.floor(all_size[i] / window_size[i])all_size.append(layer_size)seq_length = sum(all_size)mask = torch.zeros(seq_length, seq_length)# get intra-scale maskinner_window = inner_size // 2for layer_idx in range(len(all_size)):start = sum(all_size[:layer_idx])for i in range(start, start + all_size[layer_idx]):left_side = max(i - inner_window, start)right_side = min(i + inner_window + 1, start + all_size[layer_idx])mask[i, left_side:right_side] = 1# get inter-scale maskfor layer_idx in range(1, len(all_size)):start = sum(all_size[:layer_idx])for i in range(start, start + all_size[layer_idx]):left_side = (start - all_size[layer_idx - 1]) + \(i - start) * window_size[layer_idx - 1]if i == (start + all_size[layer_idx] - 1):right_side = startelse:right_side = (start - all_size[layer_idx - 1]) + (i - start + 1) * window_size[layer_idx - 1]mask[i, left_side:right_side] = 1mask[left_side:right_side, i] = 1mask = (1 - mask).bool()return mask, all_size

接着进入卷积层

seq_enc = self.conv_layers(seq_enc)

先构建CSCM卷积

class Bottleneck_Construct(nn.Module):"""Bottleneck convolution CSCM"""

temp_input = self.down(enc_input).permute(0, 2, 1)
all_inputs = []

self.down = Linear(d_model, d_inner)

下采样

for i in range(len(self.conv_layers)):temp_input = self.conv_layers[i](temp_input)all_inputs.append(temp_input)

堆叠很多次卷积，这个跟former是一样的

class ConvLayer(nn.Module):def __init__(self, c_in, window_size):super(ConvLayer, self).__init__()self.downConv = nn.Conv1d(in_channels=c_in,out_channels=c_in,kernel_size=window_size,stride=window_size)self.norm = nn.BatchNorm1d(c_in)self.activation = nn.ELU()def forward(self, x):x = self.downConv(x)x = self.norm(x)x = self.activation(x)return x

将N次卷积的结果拼接起来

all_inputs = torch.cat(all_inputs, dim=2).transpose(1, 2)#
all_inputs = self.up(all_inputs)
all_inputs = torch.cat([enc_input, all_inputs], dim=1)

self.up = Linear(d_inner, d_model)

all_inputs = self.norm(all_inputs)
return all_inputs

self.norm = nn.LayerNorm(d_model)

之后在跟原始输入拼接起来

卷积layer完了之后是encoderlayer

def forward(self, enc_input, slf_attn_mask=None):attn_mask = RegularMask(slf_attn_mask)

enc_output, _ = self.slf_attn(enc_input, enc_input, enc_input, attn_mask=attn_mask)

进到encoder里面，到了熟悉的former框架

def forward(self, queries, keys, values, attn_mask, tau=None, delta=None):#后面俩参数应该是作者指定的B, L, _ = queries.shape#B,seq,dmodel_, S, _ = keys.shapeH = self.n_heads
#其实L和S是一个数queries = self.query_projection(queries).view(B, L, H, -1)#B, L, H, dmodel/hkeys = self.key_projection(keys).view(B, S, H, -1)#一样的计算方法values = self.value_projection(values).view(B, S, H, -1)#H 表示头的数量-1 表示自动计算该维度

encoder的注意力用的fullattention。并且用到了掩码

回到pyra的encoder

self.pos_ffn = PositionwiseFeedForward(d_model, d_inner, dropout=dropout, normalize_before=normalize_before)

def forward(self, x):residual = xif self.normalize_before:x = self.layer_norm(x)x = F.gelu(self.w_1(x))x = self.dropout(x)x = self.w_2(x)x = self.dropout(x)x = x + residualif not self.normalize_before:x = self.layer_norm(x)return x

indexes = self.indexes.repeat(seq_enc.size(0), 1, 1, seq_enc.size(2)).to(seq_enc.device)
#B,seq,3,dmodel
indexes = indexes.view(seq_enc.size(0), -1, seq_enc.size(2))
#B,seq+pred,dmodel
all_enc = torch.gather(seq_enc, 1, indexes)
##B,seq+pred,dmodel
seq_enc = all_enc.view(seq_enc.size(0), self.all_size[0], -1)
#B,seq,dmodel*3
return seq_enc

总结

x_dec, x_mark_dec, mask=None都没用到

直接进入encoder

重构了encoder和decoder，跟transformer的很不一样

embedding方法跟former一样

encoder的注意力用的fullattention，并且用到了掩码

Pyraformer复现心得

Pyraformer复现心得引用 Liu, Shizhan, et al. “Pyraformer: Low-complexity pyramidal attention for long-range time series modeling and forecasting.” International conference on learning representations. 2021. 代码部分 def long_forecast(self, x_enc, x_m…...

编程日记 2024/11/7 17:38:00

成绩排序c++

说明给出了班里某门课程的成绩单，请你按成绩从高到低对成绩单排序输出，如果有相同分数则名字字典序小的在前。输入格式第一行为nn(0<n<200<n<20)，表示班里的学生数目; 接下来的nn行，每行为每个学生的名字和他的…...

编程日记 2024/11/7 17:36:59

人脸检测之MTCNN算法网络结构

MTCNN（Multi-task Cascaded Convolutional Networks）是一种用于人脸检测和关键点检测的深度学习模型，特别适合在复杂背景下识别出多尺度的人脸。它通过多任务学习来实现人脸检测和人脸关键点定位（如眼睛、鼻子、嘴巴的位置&#x…...

编程日记 2024/11/7 17:35:57

蓝桥杯顺子日期（填空题）

题目：小明特别喜欢顺子。顺子指的就是连续的三个数字：123、456 等。顺子日期指的就是在日期的 yyyymmdd 表示法中，存在任意连续的三位数是一个顺子的日期。例如 20220123 就是一个顺子日期，因为它出现了一个顺子：123&a…...

编程日记 2024/11/7 17:33:54

Java云HIS医院管理系统源码病案管理、医保业务、门诊、住院、电子病历编辑

云HIS系统优势 （1）客户/用户角度无需安装，登录即用多终端同步，轻松应对工作环境转换系统使用简单、易上手，信息展示主次分明、重点突出极致降低用户操作负担：关联功能集中、减少跳转，键盘快…...

编程日记 2024/11/7 17:31:50

【C++的vector、list、stack、queue用法简单介绍】

【知识预告】 vector的介绍及使用list的介绍及使用list与vector的对比stack的介绍和使用queue的介绍和使用priority_queue的介绍和使用 1 vector的介绍及使用 1.1 vector的介绍 vector是表示可变大小数组的序列容器和数组类似，vector也采用连续存储空间来存储元…...

编程日记 2024/11/7 17:29:47

git中使用tag（标签）的方法及重要性

在Git中打标签（tag）通常用于标记发布版本或其他重要提交。 Git中打标签的步骤： 列出当前所有的标签 git tag创建一个指向特定提交的标签 git tag <tagname> <commit-hash>创建一个带注释的标签，通常用于发布版本 git…...

编程日记 2024/11/7 17:28:46

【专题】2024年文旅微短剧专题研究报告汇总PDF洞察（附原数据表）

原文链接： https://tecdat.cn/?p38187 当今时代，各类文化与消费领域呈现出蓬勃发展且不断变革的态势。微短剧作为新兴内容形式，凭借网络发展与用户需求，从低成本都市题材为主逐步走向多元化，其内容供给类型正历经深…...

编程日记 2024/11/7 17:25:42

celery加速爬虫使用flower 可视化地查看celery的实时监控情况

重点: celery ==5.4.0 python 3.11 flower ==2.0.1 请对齐celery与flower的版本信息，如果过低会导致报错报错1: (venv) PS D:\apploadpath\pythonPath\Lib\site-packages> celery -A tasks flower Traceback (most recent call last):File …...

编程日记 2024/11/7 17:24:41

Angular进阶之十：toPromise废弃原因及解决方案

背景 Rxjs从V7开始废弃了toPromise, V8中会删除它。原因 1：toPromise()只返回一个值 toPromise()将 Observable 序列转换为符合 ES2015 标准的 Promise 。它使用 Observable 序列的最后一个值。例： import { Observable } from "rxjs"; ………...

编程日记 2024/11/7 17:22:39

python实现RSA算法

目录一、算法简介二、算法描述2.1 密钥产生2.2 加密过程2.3 解密过程2.4 证明解密正确性三、相关算法3.1 欧几里得算法3.2 扩展欧几里得算法3.3 模重复平方算法3.4 Miller-Rabin 素性检测算法四、算法实现五、演示效果一、算法简介 RSA算法是一种非对称加密算法&#xff0c…...

编程日记 2024/11/7 17:21:37

可灵开源视频生成数据集学习笔记

目录介绍可灵团队提出了四个模块的改进： video caption 新指标 vtss 动态质量静态质量视频自然性介绍在视频数据处理中，建立准确且细致的条件是关键，可灵团队认为，解决这一问题需要关注三个主要方面： 文本…...

编程日记 2024/11/7 17:19:35

告别软文营销瓶颈！5招助你突破限制，实现宣传效果最大化

在当今信息爆炸的时代，软文营销作为品牌推广的重要手段之一，面临着日益激烈的竞争和受众日益提高的辨别力。传统的软文营销方式往往难以穿透消费者的心理防线，实现有效的信息传递和品牌塑造。为了突破这一瓶颈，实现宣传效果的最大…...

编程日记 2024/11/7 17:18:34

秋冬进补防肥胖：辨证施补，健康过冬不增脂

中医理论中的秋冬“封藏” 在中医理论中，认为秋冬季节是人体“封藏”的时期，而“封藏”指的是秋冬季节人体应当减少消耗，蓄积能源，此时进补可以使营养物质易于吸收并蓄积于体内，从而增强体质和抵抗力，为来…...

编程日记 2024/11/7 17:17:32

uniapp radio单选

<uni-data-checkbox v-model"selectedValue" :localdata"quTypeList" change"radioChange"/> //产品类型列表 const quTypeList [{ text: 漆面膜, value: 100, }, { text: 改色…...

编程日记 2024/11/7 17:16:31

通熟易懂地讲解GCC和Makefile

1. 嵌入式开发工具链：GCC GCC（GNU Compiler Collection）是一个强大且常用的编译器套件，支持多种编程语言，比如 C 和 C。在嵌入式开发中，GCC 可以帮助我们把人类可读的 C/C 代码编译成机器可以理解的二进制…...

编程日记 2024/11/7 17:14:29

Java Agent使用

文章目录基本使用premain使用场景 agentmain 关于tools.jar https://docs.oracle.com/en/java/javase/20/docs/specs/jvmti.html com.sun的API，如果使用其他厂商的JVM，可能没有这个API了，比如Eclipse的J9 https://www.ibm.com/docs/en/sdk…...

编程日记 2024/11/7 17:13:28

selenium 点击元素报错element not interactable

描述说明： 我这里是获取一个span标签后并点击，用的元素自带的element.click()，报错示例代码如下： driver.find_element(By.XPATH,//span[id"my_span"]).click() # 或者 elementdriver.find_element(By.XPATH,//span[i…...

编程日记 2024/11/7 17:12:26

【大数据技术基础 | 实验七】HBase实验：部署HBase

文章目录一、实验目的二、实验要求三、实验原理四、实验环境五、实验内容和步骤（一）验证Hadoop和ZooKeeper已启动（二）修改HBase配置文件（三）启动并验证HBase 六、实验结果七、实验心得一、实验目的掌握…...

编程日记 2024/11/7 17:10:23

Android进程保活，lmkd杀进程相关

lmk原理 Android进程回收之LowMemoryKiller原理 lmkd 更新进程oomAdj; 设备端进程被杀可能原因...

编程日记 2024/11/7 17:09:21

地震勘探——干扰波识别、井中地震时距曲线特点

目录干扰波识别反射波地震勘探的干扰波井中地震时距曲线特点干扰波识别有效波：可以用来解决所提出的地质任务的波；干扰波：所有妨碍辨认、追踪有效波的其他波。地震勘探中，有效波和干扰波是相对的。例如，在反射波…...

编程新知 2025/7/1 10:09:55

Java 语言特性(面试系列1)

一、面向对象编程 1. 封装（Encapsulation） 定义：将数据（属性）和操作数据的方法绑定在一起，通过访问控制符（private、protected、public）隐藏内部实现细节。示例： public …...

编程新知 2025/6/17 14:49:12

中南大学无人机智能体的全面评估！BEDI：用于评估无人机上具身智能体的综合性基准测试

作者：Mingning Guo, Mengwei Wu, Jiarun He, Shaoxian Li, Haifeng Li, Chao Tao单位：中南大学地球科学与信息物理学院论文标题：BEDI: A Comprehensive Benchmark for Evaluating Embodied Agents on UAVs论文链接：https://arxiv.…...

编程新知 2025/7/6 5:56:03

Mybatis逆向工程，动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件

今天呢，博主的学习进度也是步入了Java Mybatis 框架，目前正在逐步杨帆旗航。那么接下来就给大家出一期有关 Mybatis 逆向工程的教学，希望能对大家有所帮助，也特别欢迎大家指点不足之处，小生很乐意接受正确的建议&…...

编程新知 2025/7/5 20:17:23

Springcloud：Eureka 高可用集群搭建实战（服务注册与发现的底层原理与避坑指南）

引言：为什么 Eureka 依然是存量系统的核心？ 尽管 Nacos 等新注册中心崛起，但金融、电力等保守行业仍有大量系统运行在 Eureka 上。理解其高可用设计与自我保护机制，是保障分布式系统稳定的必修课。本文将手把手带你搭建生产级 Eur…...

编程新知 2025/7/6 0:21:40

零基础设计模式——行为型模式 - 责任链模式

第四部分：行为型模式 - 责任链模式 (Chain of Responsibility Pattern) 欢迎来到行为型模式的学习！行为型模式关注对象之间的职责分配、算法封装和对象间的交互。我们将学习的第一个行为型模式是责任链模式。核心思想：使多个对象都有机会处…...

编程新知 2025/7/6 2:21:50

Spring AI与Spring Modulith核心技术解析

Spring AI核心架构解析 Spring AI（https://spring.io/projects/spring-ai）作为Spring生态中的AI集成框架，其核心设计理念是通过模块化架构降低AI应用的开发复杂度。与Python生态中的LangChain/LlamaIndex等工具类似，但特别为多语…...

编程新知 2025/6/17 4:17:05