当前位置: 首页 > news >正文

【数据挖掘】时间序列的傅里叶变换:用numpy解释的快速卷积

一、说明

本篇告诉大家一个高级数学模型,即傅里叶模型的使用; 当今,傅里叶变换及其所有变体构成了我们现代世界的基础,为压缩、通信、图像处理等技术提供了动力。我们从根源上理解,从根本上应用,这是值得付出的代价。

二、FFT的历史根源

        傅里叶变换算法被认为是所有数学中最伟大的发现之一。法国数学家让-巴蒂斯特·约瑟夫·傅立叶在1822年的《Théorie analytique de la chaleur》一书中为调和分析奠定了基础。

        法国数学家让·巴蒂斯特·约瑟夫·傅立叶(1768-1830 年)的雕刻肖像,19 世纪初。[来源:维基百科,图片来自公共领域]

        这个奇妙的框架还为分析时间序列提供了很好的工具......这就是我们在这里的原因!

        这篇文章是傅里叶变换系列文章的一部分。今天我们将讨论卷积以及傅里叶变换如何提供最快的方法。

        

三、离散傅里叶变换 (DFT) 的定义

        让我们从基本定义开始。N 个元素的离散时间序列 x 的离散傅里叶变换为:

        离散傅里叶变换 (DFT) 定义。存在其他定义,您只需要选择一个并坚持下去(由作者制作)

        其中 k 表示 x 频谱的第 k 个频率。请注意,一些作者在该定义中添加了 1/N 的比例因子,但对这篇文章来说并不重要——总而言之,这只是一个定义问题并坚持下去。

        然后是傅里叶逆变换(给定前向傅里叶变换的定义):

        逆离散傅里叶变换,基于上述前向定义(由作者制作)。

        话虽如此,傅里叶变换最重要的定理之一是一个空间中的卷积等价于另一个空间中的乘法。换句话说,乘积的傅里叶变换是相应傅里叶谱的卷积,卷积的傅里叶变换是相应傅里叶谱的乘积。

        时域中的乘法对应于傅里叶域中的循环卷积(由作者制作)。

        和

        时域中的循环卷积对应于傅里叶域中的乘法(由作者制作)。

        其中点表示标准乘积(乘法),圆圈星表示圆形卷积

        两个重要注意事项:

  • 周期信号:傅里叶分析框架认为我们处理的信号是周期性的。换句话说,它们从负无穷大重复到无穷大。然而,使用有限的内存计算机处理此类信号并不总是实用的,因此我们只“玩”一个周期,我们将在后面看到。
  • 循环卷积:卷积定理指出乘法等价于循环卷积,这与我们更习惯的线性卷积略有不同。正如我们将看到的,它并没有那么不同,也没有那么复杂。

四、循环卷积与线性卷积

        如果您熟悉线性卷积(通常简称为“卷积”),那么您不会被循环卷积混淆。基本上,循环卷积只是卷积周期信号的方法。正如您可以猜到的,线性卷积仅对有限长度的信号有意义,这些信号的范围不是从负无穷大到无穷大。在我们的例子中,在傅里叶分析的上下文中,我们的信号是周期性的,因此不满足这个条件。我们不能谈论(线性)卷积。

        然而,我们仍然可以直观地对周期信号进行线性卷积式操作:只需将周期信号卷积在一个周期长度上即可。这就是循环卷积的作用:它在一个周期跨度上卷积 2 个相同长度的周期信号。

为了进一步说服自己差异,请比较离散线性卷积和离散循环卷积的两个公式:

线性卷积方程:大多数时候在信号处理中,使用此公式,通过填充零(由作者制作)。

循环卷积 :这是处理周期信号时使用的卷积,如傅里叶分析(由作者制作)。

注意差异:

边界:线性卷积使用从负无穷大到正无穷大的样本 — 如前所述,在这种情况下,x 和 y 具有有限的能量,总和是有意义的。对于循环卷积,我们只需要在一个时间段内发生了什么,所以总和只跨越一个周期

- 循环索引 :在循环卷积中,我们使用长度为 N 的模运算“包装”y 的索引。这只是一种确保 y 被认为是周期为 N 的周期的方法:当我们想知道位置 k 处 y 的值时,我们只在位置 k%N 处使用 y 的值 — 因为 y 是 N 周期性的,我们得到正确的值。同样,这只是处理周期性无限长度样本序列的一种数学方法。

五、在 numpy 中的实现

        Numpy为有限长度信号提供了很好的工具:这是一个好消息,因为正如我们刚刚看到的,我们的无限长度周期信号可以用一个周期来表示。

        让我们创建一个简单的类来表示这些信号。我们添加了一个快速绘制数组的方法,以及“基本”数组前后的额外周期,以记住我们正在处理周期序列。

import numpy as np
import matplotlib.pyplot as pltclass PeriodicArray:"""A class to represent a periodic signal, using a singleperiod of the sequence."""def __init__(self, base):"""base is the base sequence representing a full period."""self.base = base@propertydef N(self): """Lenght of the base array, which is also the period of our infinite-periodic sequence"""return len(self.base)def __getitem__(self, n):"""We can get the value at any index, from -infinityto +infinity using the fact that the sequence is N-periodic, so we use the modulo operator.Examples-------->>> x = PeriodicArray([1, 2, 3])>>> x[0]1>>> x[4]2>>> x[5]3"""return self.base[n%self.N]def plot(self, ax=None):"""Quickly plot the sequence, with a period before and afterthe base array."""if ax is None:fig, ax = plt.subplots()line = ax.plot(self.base, '-o')ax.plot(np.arange(-self.N, 0), self.base, '--o', color=line[0].get_color(), alpha=0.5)ax.plot(np.arange(self.N, self.N*2), self.base, '--o', color=line[0].get_color(), alpha=0.5)return ax

        让我们看两个例子:首先是采样的窦序列,然后是线性序列。两者都被认为是 N 周期性的(在这种情况下为 N=10)。

periodic_sampled_sinus = PeriodicArray(np.sin(2*np.pi*1*np.linspace(0, np.pi/10, 10)))
periodic_sampled_sinus.plot()periodic_slope = PeriodicArray(np.linspace(-5, 5, num=10)*0.5)
periodic_slope.plot()

PeriodicArray 的 2 个示例:“基”周期以深蓝色从 0 到 N 绘制,而其他 2 个周期在前后添加,以表示我们正在处理周期序列的事实(由作者制作)。

六、循环卷积,慢速方式

        现在让我们实现上面看到的循环卷积方程。使用索引和模运算符,非常简单:

        上述2个周期序列之间的循环卷积(由作者制作)。

        太好了,我们现在可以看到两个信号之间的循环卷积是什么样子的。将所有内容放在一个数字中:

        左:第一个周期数组。中间:第二周期数组。右:2个周期数组的循环卷积,这也是一个周期数组(由作者制作)。

        现在这个解决方案运行得很好,但它有一个主要缺陷:它很慢。如您所见,我们必须经历 2 个嵌套循环来计算结果:一个用于结果数组中的每个位置,一个用于计算该位置的结果:我们说算法是 O(N²),随着 N 的增加,操作次数将随着 N 的平方而增加。

        对于示例中的小型数组,这不是问题,但随着数组的增长,它将成为主要问题。

        此外,在python中,对数值数据的循环在大多数情况下被认为是一种不好的做法。一定有更好的方法...

七、循环卷积,傅里叶方式

        这就是傅里叶变换和卷积定理发挥作用的地方。由于离散傅里叶变换的实现方式,使用快速傅里叶变换(FFT)以非常快速和优化的方式实现,操作非常(我们说FFT是O(N log N),这比O(N²)要好得多)。

        使用卷积定理,我们可以利用 2 个序列的 DFT 的乘积,当使用逆 DFT 转换回时域时,我们得到输入时间序列的卷积。换句话说,我们有:

        使用直接和逆傅里叶变换的x和y之间的循环卷积(由作者制作)。

        其中DFT表示离散傅里叶变换,IDFT表示逆运算。

        然后我们可以非常轻松地实现这个算法来计算 x 和 y 的卷积:

def circconv_fast(x, y):"""Fast circular convolution using DFT.Return the full array of the circulard convolution between x and y."""X = np.fft.fft(x)Y = np.fft.fft(y)return np.real(np.fft.ifft(np.multiply(X, Y)))# let's compute the circular convolution for our 2 signals
circ_fast = circconv_fast(periodic_sampled_sinus.base, periodic_slope.base)
circ_fast = PeriodicArray(circ_fast)

八、数值和时间比较

        最后,让我们验证这两种方法是否产生相同的结果,并比较 python 使用这两种技术计算循环卷积所需的时间:

# compare both ways : "slow" way, and DFT-way
fig, ax = plt.subplots()
ax.plot(circ.base, '-o', label="slow-way")
ax.plot(circ_fast.base, '-o', label="DFT-way")
ax.legend()
ax.set_title('Comparison of 2 ways to compute convolution : \nslow-algebraic way VS using DFT and the convolution theorem')

        比较两种计算两个周期序列之间循环卷积的方法:“慢速方式”是使用蓝色循环和加法的简单代数,它与橙色的“傅里叶方式”叠加。两种方法给出的结果完全相同(精确到数值精度)(由作者制作)。

        这是完美的搭配!两者在数值方面是严格等效的。

        现在进行时间比较:

N = 1000
long_x = np.sin(2*np.pi*1*np.linspace(0, np.pi/10, N))
long_y = np.cos(2*np.pi*1*np.linspace(0, np.pi/10, N))print(circconv(long_x, long_y))
print(circconv_fast(long_x, long_y))
# first make sure that both method yield the same result
assert np.allclose(circconv(long_x, long_y), circconv_fast(long_x, long_y))%timeit circconv(long_x, long_y)
%timeit circconv_fast(long_x, long_y)# for N = 10   :  90.2 µs ± 10.2 µs for the slow way VS 14.1 µs ± 161 ns  for the DFT-way
# for N = 1000 : 579   ms ± 9.14 ms for the slow way VS 69.4 µs ± 2.35 µs for the DFT-wayfrom physipy import units
ms = units['ms']
mus = units['mus']
print("Gain in speed for 10 samples length: ", 90*mus/(14*mus))
print("Gain in speed for 1000 samples length: ", 579*ms/(69*mus))

结果是:

  • 对于 N=10 个样本,DFT 快 6 倍
  • 对于 N=1000 个样本,DFT 的速度快约 10000 倍

这是巨大的!现在考虑一下,当您分析包含成千上万个样本的时间序列时,它可以为您带来什么!

Fourier Transform for Time Series: Fast Convolution Explained with numpy | by Yoann Mocquin | Jul, 2023 | Towards Data Science

相关文章:

【数据挖掘】时间序列的傅里叶变换:用numpy解释的快速卷积

一、说明 本篇告诉大家一个高级数学模型,即傅里叶模型的使用; 当今,傅里叶变换及其所有变体构成了我们现代世界的基础,为压缩、通信、图像处理等技术提供了动力。我们从根源上理解,从根本上应用,这是值得付…...

Chatgpt Web API 创建对话,免费,不计token数量,模仿网页提交对话

Chatgpt API 是收费的,按token使用量计费 Chatgpt Web API 免费的,只要有账号就可以使用。 curl https://chat.openai.com/backend-api/conversation \-H authority: chat.openai.com \-H accept: text/event-stream \-H accept-language: zh-CN,zh;q…...

嵌入式软件—RK3568开发环境搭建

一、RK3568 1.1 开发板特点 BSP比较大,对于电脑内存和存储空间要求高 1.2 BSP BSP(Board Support Package,板级支持包),类似于PC系统中BIOS和驱动程序的集合,BSP包含的范围更广,除了外设驱动…...

使用 OpenCV 和 GrabCut 算法进行交互式背景去除

一、说明 我想,任何人都可以尝试从图像中删除背景。当然,有大量可用的软件或工具能够做到这一点,但其中一些可能很昂贵。但是,我知道有人使用窗口绘画3D魔术选择或PowerPoint背景去除来删除背景。 如果您是计算机视觉领域的初学者…...

在Windows server 2012上使用virtualBox运行CentOS7虚拟机,被强制休眠(二)

问题场景 本月7月10日处理了一个虚拟机被强制暂停的问题,详见:在Windows server 2012上使用virtualBox运行CentOS7虚拟机,被强制暂停当时是由于C盘存储空间不足,导致虚拟机被强制暂停,将虚拟机迁移后,问题…...

sql学习笔记

sql语句优先级 FROM → WHERE → GROUP BY → SELECT → HAVING → ORDER BY sql case用法 例题: 按照销售单价( sale_price )对练习 3.6 中的 product(商品)表中的商品进行如下分类。 低档商品:销售单价在1000日元以下&#x…...

Ubuntu 20.04.4 LTS安装Terminator终端(Linux系统推荐)

Terminator终端可以在一个窗口中创建多个终端,并且可以水平、垂直分割,运行ROS时很方便。 sudo apt install terminator这样安装完成后,使用快捷键Ctrl Alt T打开的就是新安装的terminator终端,可以使用以下方法仍然打开ubuntu默…...

22. 括号生成

题目描述 数字 n 代表生成括号的对数,请你设计一个函数,用于能够生成所有可能的并且 有效的 括号组合。 示例 1: 输入:n 3 输出:["((()))","(()())","(())()","()(())",&…...

WPF实战学习笔记05-首页界面

首页界面 新建文件 添加文件[类型:用户控件] ./Common/Models/TaskBars.cs ./Common/Models/ToDoDto.cs ./Common/Models/MemoDto.cs 新建类 TaskBars.cs using System; using System.Collections.Generic; using System.Linq; using Sy…...

一文带你迅速入门SprIngMVC,看这一篇就足够了!

0. 什么是SpringMVC 要知道什么是SpringMVC,我们首先得知道什么 MVC,MVC是软件工程中的一种架构模式,分为 Model、View、Control。它把软件系统分为模型、视图和控制器三个基本部分。 Model:模型,应用程序负责数据逻…...

js路由跳转时放弃正在pending的请求

在单页面应用中通常会对请求进行catch处理,如果用户打开a页面后页面发出了一个请求去获取aaa,但是由于某种原因请求一直在pending。此时用户又进入了b页面,在浏览时a页面的请求失败了,然后页面弹出提示:“数据aaa请求失…...

LeetCode(sql)-0723

聚合函数 620 select * from cinema where mod(id,2)1 and description <> boring order by rating desc1251 select p.product_id, Round(sum(price*units)/sum(units),2)as average_price from UnitsSold u left join Prices p using(product_id) where purchase_d…...

【C++】开源:grpc远程过程调用(RPC)配置与使用

&#x1f60f;★,:.☆(&#xffe3;▽&#xffe3;)/$:.★ &#x1f60f; 这篇文章主要介绍grpc远程过程调用&#xff08;RPC&#xff09;配置与使用。 无专精则不能成&#xff0c;无涉猎则不能通。。——梁启超 欢迎来到我的博客&#xff0c;一起学习&#xff0c;共同进步。 喜…...

rabbitmq模块启动报java.net.SocketException: socket closed的解决方法

问题 最近在接手一个项目时&#xff0c;使用的是spring-cloud微服务构架&#xff0c;mq消息消费模块是单独一个模块&#xff0c;但启动这个模块一直报如下错误&#xff1a; java.net.SocketException: socket closed 这个错误是这个模块注册不到nacos报的错&#xff0c;刚开…...

uni-app 中定时器的使用

学习目标&#xff1a; 学习目标如下所示&#xff1a; uniapp中通过使用uni-app提供的定时器API来实现定时器功能。 学习内容&#xff1a; 内容如下所示&#xff1a; **uni-app的定时器API分为两种&#xff1a; 1.第一种方式&#xff1a; setTimeout函数&#xff0c;用于设置一…...

基于物联网、视频监控与AI视觉技术的智慧电厂项目智能化改造方案

一、项目背景 现阶段&#xff0c;电力行业很多企业都在部署摄像头对电力巡检现场状况进行远程监控&#xff0c;但是存在人工查看费时、疲劳、出现问题无法第一时间发现等管理弊端&#xff0c;而且安全事件主要依靠人工经验判断分析、管控&#xff0c;效率十分低下。 为解决上述…...

内网穿透远程查看内网监控摄像头

内网穿透远程查看内网监控摄像头 在现代社会中&#xff0c;大家总是奔波于家和公司之间。大部分时间用于工作中&#xff0c;也就很难及时知晓家中的动态情况&#xff0c;对于家中有老人、小孩或宠物的&#xff08;甚至对居住环境安全不放心的&#xff09;&#xff0c;这已然是…...

【Flume 01】Flume简介、部署、组件

1 Flume简介 Flume是一个高可用、高可靠、分布式的海量日志采集、聚合和传输的系统 主要特性&#xff1a; 它有一个简单、灵活的基于流的数据流结构&#xff08;使用Event封装&#xff09;具有负载均衡机制和故障转移机制一个简单可扩展的数据模型(Source、Channel、Sink) Sou…...

三款即时通讯工具推荐:J2L3x、Telegram、WhatsApp 你选哪个?

1、J2L3x J2L3x 是一款受欢迎的即时通讯工具&#xff0c;广泛应用于企业团队之间的沟通和协作。它提供了多种通讯方式&#xff0c;包括群组聊天、私人消息和文件共享等&#xff0c;还可以方便地与其他应用程序和服务集成。即使你不在工作场所&#xff0c;你也可以在任何地方使…...

C++ 单例模式(介绍+实现)

文章目录 一. 设计模式二. 单例模式三. 饿汉模式四. 懒汉模式结束语 一. 设计模式 单例模式是一种设计模式 设计模式(Design Pattern)是一套被反复使用&#xff0c;多数人知晓的&#xff0c;经过分类的&#xff0c;代码设计经验的总结。 为什么要有设计模式 就像人类历史发展会…...

内存分配函数malloc kmalloc vmalloc

内存分配函数malloc kmalloc vmalloc malloc实现步骤: 1)请求大小调整:首先,malloc 需要调整用户请求的大小,以适应内部数据结构(例如,可能需要存储额外的元数据)。通常,这包括对齐调整,确保分配的内存地址满足特定硬件要求(如对齐到8字节或16字节边界)。 2)空闲…...

C++_核心编程_多态案例二-制作饮品

#include <iostream> #include <string> using namespace std;/*制作饮品的大致流程为&#xff1a;煮水 - 冲泡 - 倒入杯中 - 加入辅料 利用多态技术实现本案例&#xff0c;提供抽象制作饮品基类&#xff0c;提供子类制作咖啡和茶叶*//*基类*/ class AbstractDr…...

JavaScript 中的 ES|QL:利用 Apache Arrow 工具

作者&#xff1a;来自 Elastic Jeffrey Rengifo 学习如何将 ES|QL 与 JavaScript 的 Apache Arrow 客户端工具一起使用。 想获得 Elastic 认证吗&#xff1f;了解下一期 Elasticsearch Engineer 培训的时间吧&#xff01; Elasticsearch 拥有众多新功能&#xff0c;助你为自己…...

理解 MCP 工作流:使用 Ollama 和 LangChain 构建本地 MCP 客户端

&#x1f31f; 什么是 MCP&#xff1f; 模型控制协议 (MCP) 是一种创新的协议&#xff0c;旨在无缝连接 AI 模型与应用程序。 MCP 是一个开源协议&#xff0c;它标准化了我们的 LLM 应用程序连接所需工具和数据源并与之协作的方式。 可以把它想象成你的 AI 模型 和想要使用它…...

Axios请求超时重发机制

Axios 超时重新请求实现方案 在 Axios 中实现超时重新请求可以通过以下几种方式&#xff1a; 1. 使用拦截器实现自动重试 import axios from axios;// 创建axios实例 const instance axios.create();// 设置超时时间 instance.defaults.timeout 5000;// 最大重试次数 cons…...

全面解析各类VPN技术:GRE、IPsec、L2TP、SSL与MPLS VPN对比

目录 引言 VPN技术概述 GRE VPN 3.1 GRE封装结构 3.2 GRE的应用场景 GRE over IPsec 4.1 GRE over IPsec封装结构 4.2 为什么使用GRE over IPsec&#xff1f; IPsec VPN 5.1 IPsec传输模式&#xff08;Transport Mode&#xff09; 5.2 IPsec隧道模式&#xff08;Tunne…...

蓝桥杯 冶炼金属

原题目链接 &#x1f527; 冶炼金属转换率推测题解 &#x1f4dc; 原题描述 小蓝有一个神奇的炉子用于将普通金属 O O O 冶炼成为一种特殊金属 X X X。这个炉子有一个属性叫转换率 V V V&#xff0c;是一个正整数&#xff0c;表示每 V V V 个普通金属 O O O 可以冶炼出 …...

处理vxe-table 表尾数据是单独一个接口,表格tableData数据更新后,需要点击两下,表尾才是正确的

修改bug思路&#xff1a; 分别把 tabledata 和 表尾相关数据 console.log() 发现 更新数据先后顺序不对 settimeout延迟查询表格接口 ——测试可行 升级↑&#xff1a;async await 等接口返回后再开始下一个接口查询 ________________________________________________________…...

Vite中定义@软链接

在webpack中可以直接通过符号表示src路径&#xff0c;但是vite中默认不可以。 如何实现&#xff1a; vite中提供了resolve.alias&#xff1a;通过别名在指向一个具体的路径 在vite.config.js中 import { join } from pathexport default defineConfig({plugins: [vue()],//…...

Vue 模板语句的数据来源

&#x1f9e9; Vue 模板语句的数据来源&#xff1a;全方位解析 Vue 模板&#xff08;<template> 部分&#xff09;中的表达式、指令绑定&#xff08;如 v-bind, v-on&#xff09;和插值&#xff08;{{ }}&#xff09;都在一个特定的作用域内求值。这个作用域由当前 组件…...