当前位置：首页 > news >正文

时间卷积网络（TCN）原理+代码详解

news 2025/7/9 8:50:52

在理解 TCN 的原理之前，我们可以先对传统的循环神经网络（RNN）进行简要回顾。RNN 是处理序列数据的常用方法，其核心思想是通过将前一个时间步的隐藏状态传递到下一个时间步，实现对序列依赖关系的建模。然而，RNN 在处理长序列时存在以下几个缺点：

无法并行计算：RNN 的计算依赖于时间步的顺序，导致无法高效利用 GPU 并行计算。
梯度消失/爆炸：在长时间依赖中，梯度在反向传播时会逐渐消失或变得不稳定。
短期记忆限制：由于计算依赖于序列的逐步传递，RNN 难以捕获远距离的时间依赖。

TCN 正是在这样的背景下提出的。它通过因果卷积和扩张卷积，突破了 RNN 的这些瓶颈，特别适用于长时间序列数据。接下来，我们将详细解析 TCN 的原理。

一、TCN原理

1.1 因果卷积（Causal Convolution）

在卷积操作中，卷积核在输入上滑动时会同时处理前后时间步的数据，导致当前时间步的输出可能依赖于未来的输入。然而，对于时间序列任务，我们通常希望模型只依赖于过去的输入，不“窥探”未来，这样的结构称为“因果性”。

TCN 使用因果卷积来确保这一点。因果卷积是指每个时间步的输出仅依赖于它之前的时间步，而不依赖于未来。简单来说，当前时间步的输出只会考虑卷积核覆盖的前几个时间步的输入。

TCN 通过适当的填充（padding）来实现这一点，使得每一层的卷积不会跨越未来时间步。因果卷积的示意图如下：

在这里插入图片描述

1.2 扩张卷积（Dilated Convolution）

为了捕捉长时间依赖关系，TCN 通过 扩张卷积（Dilated Convolution 来扩展卷积核的感受野。扩张卷积通过在卷积核的元素之间插入“间隔”，从而在保持卷积核大小不变的情况下，扩大卷积的感受野。

例如，假设卷积核大小为 3，当扩张率 dilation=2 时，卷积核的元素之间插入 1 个间隔，感受野可以从 3 扩展到 5。通过这种扩张卷积，TCN 在每一层可以通过指数扩展的方式增大感受野，使得模型能够捕捉到远距离的依赖关系。例如，TCN 中第 $i$ 层的感受野大小为 $2^{i}$ ，这样层数越深，感受野就越大。如下图所示：

在这里插入图片描述

二、代码实现

2.1 Chomp1d 模块

TCN 使用填充操作来保证卷积后的时间步不丢失，但填充会导致额外的时间步，因此需要 Chomp1d 来修剪掉多余部分，保证输入输出的时间维度一致。

class Chomp1d(nn.Module):def __init__(self, chomp_size):super(Chomp1d, self).__init__()self.chomp_size = chomp_sizedef forward(self, x):return x[:, :, :-self.chomp_size].contiguous()

Chomp1d 的作用是对卷积结果的最后几个时间步进行修剪，这确保了卷积核在时间序列两端不会额外输出冗余的步长。

2.2 TemporalBlock 模块

TemporalBlock 是 TCN 的基本构建单元，包含两层扩张卷积，每层后接激活函数和 Chomp1d 操作。

class TemporalBlock(nn.Module):def __init__(self, n_inputs, n_outputs, kernel_size, stride, dilation, padding, dropout):super(TemporalBlock, self).__init__()# 第一层卷积self.ll_conv1 = nn.Conv1d(n_inputs, n_outputs, kernel_size, stride=stride, padding=padding, dilation=dilation)self.chomp1 = Chomp1d(padding)self.relu1 = nn.LeakyReLU()# 第二层卷积self.ll_conv2 = nn.Conv1d(n_outputs, n_outputs, kernel_size, stride=stride, padding=padding, dilation=dilation)self.chomp2 = Chomp1d(padding)self.relu2 = nn.LeakyReLU()# Dropout 作为正则化，防止过拟合self.dropout = nn.Dropout(dropout)def forward(self, x):# 第一个卷积、修剪、激活和 Dropoutout = self.ll_conv1(x)out = self.chomp1(out)out = self.relu1(out)out = self.dropout(out)# 第二个卷积、修剪、激活和 Dropoutout = self.ll_conv2(out)out = self.chomp2(out)out = self.relu2(out)out = self.dropout(out)return out

ll_conv1 和 ll_conv2 是两层扩张卷积层，dilation 参数决定了每层的感受野大小。
Chomp1d 保证卷积结果不会产生额外的时间步。
LeakyReLU 是非线性激活函数，为模型引入非线性。
Dropout 用于防止过拟合，通过随机丢弃一部分神经元。

2.3 TemporalConvNet 模块

TemporalConvNet 是由多个 TemporalBlock 级联组成的模型，每一层的卷积感受野逐层递增。

class TemporalConvNet(nn.Module):def __init__(self, num_inputs, num_channels, kernel_size=2, dropout=0.0):super(TemporalConvNet, self).__init__()layers = []self.num_levels = len(num_channels)for i in range(self.num_levels):dilation_size = 2 ** i  # 每层的扩张率递增in_channels = num_inputs if i == 0 else num_channels[i - 1]out_channels = num_channels[i]layers.append(TemporalBlock(in_channels, out_channels, kernel_size, stride=1, dilation=dilation_size,padding=(kernel_size - 1) * dilation_size, dropout=dropout))self.network = nn.Sequential(*layers)def forward(self, x):return self.network(x)

TemporalConvNet 通过循环构建多层 TemporalBlock，每层的扩张率 dilation 是前一层的两倍，使得感受野指数级增长。
使用 nn.Sequential 将所有层级联在一起，模型最终输出序列数据经过所有层的处理结果。

2.4 完整代码示例

在这个例子中，输入数据有 8 个样本，每个样本有 3 个特征，序列长度为 10。经过 TCN 网络的三层处理，输出的特征维度从 3 增加到 64，但时间维度（10）保持不变。

import torch.nn as nn
import torch.nn.functional as F
import torchclass Chomp1d(nn.Module):def __init__(self, chomp_size):super(Chomp1d, self).__init__()self.chomp_size = chomp_sizedef forward(self, x):return x[:, :, : -self.chomp_size].contiguous()class TemporalBlock(nn.Module):def __init__(self, n_inputs, n_outputs, kernel_size, stride, dilation, padding, dropout):super(TemporalBlock, self).__init__()self.n_inputs = n_inputsself.n_outputs = n_outputsself.kernel_size = kernel_sizeself.stride = strideself.dilation = dilationself.padding = paddingself.dropout = dropoutself.ll_conv1 = nn.Conv1d(n_inputs,n_outputs,kernel_size,stride=stride,padding=padding,dilation=dilation,)self.chomp1 = Chomp1d(padding)self.ll_conv2 = nn.Conv1d(n_outputs,n_outputs,kernel_size,stride=stride,padding=padding,dilation=dilation,)self.chomp2 = Chomp1d(padding)self.sigmoid = nn.Sigmoid()def net(self, x, block_num, params=None):layer_name = "ll_tc.ll_temporal_block" + str(block_num)if params is None:x = self.ll_conv1(x)else:x = F.conv1d(x,weight=params[layer_name + ".ll_conv1.weight"],bias=params[layer_name + ".ll_conv1.bias"],stride=self.stride,padding=self.padding,dilation=self.dilation,)x = self.chomp1(x)x = F.leaky_relu(x)return xdef init_weights(self):self.ll_conv1.weight.data.normal_(0, 0.01)self.ll_conv2.weight.data.normal_(0, 0.01)def forward(self, x, block_num, params=None):out = self.net(x, block_num, params)return outclass TemporalConvNet(nn.Module):def __init__(self, num_inputs, num_channels, kernel_size=2, dropout=0.0):super(TemporalConvNet, self).__init__()layers = []self.num_levels = len(num_channels)for i in range(self.num_levels):dilation_size = 2 ** iin_channels = num_inputs if i == 0 else num_channels[i - 1]out_channels = num_channels[i]setattr(self,"ll_temporal_block{}".format(i),TemporalBlock(in_channels,out_channels,kernel_size,stride=1,dilation=dilation_size,padding=(kernel_size - 1) * dilation_size,dropout=dropout,),)def forward(self, x, params=None):for i in range(self.num_levels):temporal_block = getattr(self, "ll_temporal_block{}".format(i))x = temporal_block(x, i, params=params)return x# 定义一个 TCN 模型，输入通道数为 3，输出通道分别为 16, 32, 64，核大小为 2
tcn = TemporalConvNet(num_inputs=3, num_channels=[16, 32, 64], kernel_size=2, dropout=0.2)# 假设输入的张量形状为 (batch_size, num_inputs, sequence_length)
x = torch.randn(8, 3, 10)  # 8 个样本，3 个输入特征，序列长度为 10# 通过 TCN 进行前向传播
output = tcn(x)print(output.shape)  # 输出的形状为 (batch_size, 64, sequence_length)，即 (8, 64, 10)

参考文献

[1] https://github.com/locuslab/TCN

[2] 如何理解扩张卷积(dilated convolution)

[3] 【机器学习】详解扩张/膨胀/空洞卷积 (Dilated / Atrous Convolution)

时间卷积网络（TCN）原理+代码详解

目录一、TCN原理1.1 因果卷积（Causal Convolution）1.2 扩张卷积（Dilated Convolution） 二、代码实现2.1 Chomp1d 模块2.2 TemporalBlock 模块2.3 TemporalConvNet 模块2.4 完整代码示例参考文献在理解 TCN 的原理之前&#xff…...

编程日记 2024/10/8 13:45:07

零散的知识

1.物化在SQL中，物化（Materialization）是指将查询结果保存为物理数据结构以供后续使用的过程。这与普通的视图或查询不同，物化视图会存储查询的结果，而不是每次查询时都动态地重新计算数据。 ①物化视图物化视图是一…...

编程日记 2024/10/8 13:43:04

Python读取pdf中的文字与表格

一、PyPDF2包安装在Python中安装PyPDF2库，您可以使用pip包管理器。打开您的命令行工具（例如CMD、Terminal或Anaconda Prompt），然后输入以下命令： pip install PyPDF2 如果您使用的是Python 3，并且系统中…...

编程日记 2024/10/8 13:42:02

【MySQL 08】复合查询

目录 1.准备工作 2.多表查询笛卡尔积多表查询案例 3. 自连接 4.子查询 1.单行子查询 2.多行子查询 3.多列子查询 4.在from子句中使用子查询 5.合并查询 1.union 2.union all 1.准备工作如下三个表，将作为示例，理解复合查询 EMP员工表…...

编程日记 2024/10/8 13:41:00

求1000以内的完数

题目：一个数如果恰好等于他的因子之和（包括1，但不包括这个数），这个数就是完数。编写算法找出1000之内的所有完数，并按下面格式输出其因子：28 its factors are 1,2,4,7,14 代码如下：…...

编程日记 2024/10/8 13:39:58

sqli-labs less-16 post提交dnslog注入

post提交DNSlog注入第十六关和和十五关大差不大，可以使用布尔注入，时间盲注等，只不过闭合方式不一样，但是用布尔和时间盲太过于消耗时间，本次测试我将使用dnslog注入。使用在线平台http://www.dnslog.cn/ 闭合方式…...

编程日记 2024/10/8 13:38:56

nginx报错|xquic|xqc_engine_create: fail|

编程日记 2024/10/8 13:37:51

Java虚拟机(JVM)

目录内存区域划分堆（Heap）方法区（Method Area）程序计数器（Program Counter Register）虚拟机栈（VM Stack）本地方法栈（Native Method Stack） 类加载的过程类加…...

编程日记 2024/10/8 13:36:49

MQ 架构设计原理与消息中间件详解（三）

RabbitMQ实战解决方案 RabbitMQ死信队列死信队列产生的背景 RabbitMQ死信队列俗称，备胎队列；消息中间件因为某种原因拒收该消息后，可以转移到死信队列中存放，死信队列也可以有交换机和路由key等。产生死信队列的原因消息投…...

编程日记 2024/10/8 13:35:48

大数据新视界 --大数据大厂之 Alluxio 数据缓存系统在大数据中的应用与配置

💖💖💖亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的…...

编程日记 2024/10/8 13:34:46

PHP基本语法总结

目录输出语句注释数据类型（变量） 局部和全局作用域类型比较（松散比较与严格比较） 常量运算符并置运算符不等于逻辑运算符条件语句数组关联数组数组排序一般数组关联数组循环函数变量函数魔…...

编程日记 2024/10/8 13:33:43

尚硅谷rabbitmq 2024第30-33节死信队列答疑

Virtual host: Type: Name: Durabiity: Arguments: Default for virtual host w ququt.normal.video Durable x-dead-letter-exchange x-dead-1etter-routing-xey x-mAx-1ength X-m在88点0也-6E1 exchange.dead.letter.vide zouting.key.dead.ietter.v 10 String String Number…...

编程日记 2024/10/8 13:32:27

解锁空间距离计算的多种方式-含前端、空间数据库、后端

目录前言一、空间数据库求解 1、PostGIS实现二、GIS前端组件求解 1、Leaflet.js距离测算 2、Turf.js前端计算三、后台距离计算生成 1、欧式距离 2、Haversice球面距离 3、GeoTools距离计算 4、Gdal距离生成 5、geodesy距离计算四、成果与生成对比 1、Java不…...

编程日记 2024/10/8 13:29:23

Windows 开发工具使用技巧 QT使用安装和使用技巧 QT快捷键

一、QT配置 1. 安装 Qt 开发框架 1、下载 1、进入下载地址下载地址1 (官方, 需注册账号)： https://www.qt.io/download下载地址2（推荐）： http://download.qt.io/http://download.qt.io/archive/qt/ （或更直接的…...

编程日记 2024/10/8 13:28:22

【实战教程】SpringBoot全面指南：快速上手到项目实战(SpringBoot)

文章目录【实战教程】SpringBoot全面指南：快速上手到项目实战(SpringBoot)1. SpringBoot介绍1.1 SpringBoot简介1.2系统要求1.3 SpringBoot和SpringMVC区别1.4 SpringBoot和SpringCloud区别 2.快速入门3. Web开发3.1 静态资源访问3.2 渲染Web页面3.3 YML与Properti…...

编程日记 2024/10/8 13:24:16

LeetCode讲解篇之1043. 分隔数组以得到最大和

文章目录题目描述题解思路题解代码题目链接题目描述题解思路对于这题我们这么考虑，我们选择以数字的第i个元素做为分隔子数组的右边界，我们需要计算当前分隔子数组的长度为多少时能让数组[0, i]进行分隔数组的和最大我们用数组f表示[0, i)区间内的…...

编程日记 2024/10/8 13:23:14

Python知识点：结合Python工具，如何使用TfidfVectorizer进行文本特征提取

开篇，先说一个好消息，截止到2025年1月1日前，翻到文末找到我，赠送定制版的开题报告和任务书，先到先得！过期不候！ 如何使用Python的TfidfVectorizer进行文本特征提取在自然语言处理（…...

编程日记 2024/10/8 13:20:08

Diffusion models（扩散模型）是怎么工作的

前言给一个提示词, Midjourney, Stable Diffusion 和 DALL-E 可以生成很好看的图片，那么它们是怎么工作的呢？它们都用了 Diffusion models（扩散模型） 这项技术。 Diffusion models 正在成为生命科学等领域的一项尖端技术&…...

编程日记 2024/10/8 13:17:02

查找回收站里隐藏的文件

在Windows里，每个磁盘分区都有一个隐藏的回收站Recycle， 回收站里保存着用户删除的文件、图片、视频等数据，比如，C盘的回收站为C:\RECYCLE.BIN\，D盘的的回收站为D:\RECYCLE.BIN\，E盘的的回收站为E:\RECYCLE…...

编程日记 2024/10/8 13:15:00

[运维]2.elasticsearch-svc连接问题

Serverless 与容器决战在即？有了弹性伸缩就不一样了 - 阿里云云原生 - 博客园当我部署好elasticsearch的服务后，由于个人习惯，一般服务会在name里带上svc，所以我elasticsearch服务的名字是elasticsearch-svc： [root…...

编程日记 2024/10/8 13:13:58

龙虎榜——20250610

上证指数放量收阴线，个股多数下跌，盘中受消息影响大幅波动。深证指数放量收阴线形成顶分型，指数短线有调整的需求，大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技代表标的：御银股份、雄帝科技驱动…...

编程新知 2025/7/8 21:18:02

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …...

编程新知 2025/7/8 4:42:32

网络六边形受到攻击

大家读完觉得有帮助记得关注和点赞！！！ 抽象现代智能交通系统 （ITS） 的一个关键要求是能够以安全、可靠和匿名的方式从互联车辆和移动设备收集地理参考数据。Nexagon 协议建立在 IETF 定位器/ID 分离协议 （…...

编程新知 2025/7/8 12:04:49

Appium+python自动化（十六）- ADB命令

简介 Android 调试桥(adb)是多种用途的工具，该工具可以帮助你你管理设备或模拟器的状态。 adb ( Android Debug Bridge)是一个通用命令行工具，其允许您与模拟器实例或连接的 Android 设备进行通信。它可为各种设备操作提供便利，如安装和调试…...

编程新知 2025/7/2 5:30:43

阿里云ACP云计算备考笔记 (5)——弹性伸缩

目录第一章概述第二章弹性伸缩简介 1、弹性伸缩 2、垂直伸缩 3、优势 4、应用场景 ① 无规律的业务量波动 ② 有规律的业务量波动 ③ 无明显业务量波动 ④ 混合型业务 ⑤ 消息通知 ⑥ 生命周期挂钩 ⑦ 自定义方式 ⑧ 滚的升级 5、使用限制第三章主要定义 …...

编程新知 2025/7/4 12:47:34

智慧工地云平台源码，基于微服务架构+Java+Spring Cloud +UniApp +MySql

智慧工地管理云平台系统，智慧工地全套源码，java版智慧工地源码，支持PC端、大屏端、移动端。智慧工地聚焦建筑行业的市场需求，提供“平台网络终端”的整体解决方案，提供劳务管理、视频管理、智能监测、绿色施工、安全管…...

编程新知 2025/7/6 8:41:25

Debian系统简介

目录 Debian系统介绍 Debian版本介绍 Debian软件源介绍软件包管理工具dpkg dpkg核心指令详解安装软件包卸载软件包查询软件包状态验证软件包完整性手动处理依赖关系 dpkg vs apt Debian系统介绍 Debian 和 Ubuntu 都是基于 Debian内核的 Linux 发行版&#xff…...

编程新知 2025/7/8 19:49:47

【SpringBoot】100、SpringBoot中使用自定义注解+AOP实现参数自动解密

在实际项目中，用户注册、登录、修改密码等操作，都涉及到参数传输安全问题。所以我们需要在前端对账户、密码等敏感信息加密传输，在后端接收到数据后能自动解密。 1、引入依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId...

编程新知 2025/6/17 4:52:56