顶会新宠!KAN-LSTM完美融合新方案
2024深度学习发论文&模型涨点之——KAN+LSTM
KAN-LSTM混合预测模型是一种结合了自注意力机制(KAN, Key-attention network)和长短时记忆网络(LSTM)的深度学习模型,主要用于序列数据的预测任务,如时间序列分析、自然语言处理等。
KAN-LSTM混合模型的优势在于,KAN提供了全局视角,而LSTM则专注于捕捉局部序列中的有用信息,两者的结合能够提升模型对序列数据的理解和预测能力。通过将KAN的输出作为LSTM的输入,模型能够更有效地整合全局上下文信息和局部细节,从而提高预测的准确性和可靠性。
因为KAN是新提出的模型,这个方向现在也不是很卷,是个很好的发文方向。
我整理了一些KAN+LSTM【论文+代码】合集,需要的同学公人人人号【AI创新工场】自取。
论文精选
论文1:
Core Temperature Estimation of Lithium-Ion Batteries Using Long Short-Term Memory (LSTM) Network and Kolmogorov-Arnold Network (KAN)
利用长短期记忆(LSTM)网络和Kolmogorov-Arnold网络(KAN)估算锂离子电池的核心温度
方法
-
LSTM网络:提出了使用基本操作参数(如电压、电流和环境温度)来估算锂离子电池的表面和核心温度的LSTM网络架构。
-
KAN网络:介绍了一种基于数据驱动的深度学习方法KAN,用于估算锂离子电池的核心和表面温度,而不依赖于表面温度作为神经网络的反馈。
创新点
-
KAN网络的引入:通过KAN网络,能够在不需要物理表面温度传感器的情况下,准确预测电池的内部和表面温度,降低了电池管理系统(BMS)的成本和线路复杂性。
-
性能提升:实验验证显示KAN在估算核心温度时误差为0.5°C,计算成本为2.9ms至3.2ms,相较于传统方法在计算效率和准确性上都有显著提升。
-
适应性和准确性:KAN模型不仅能够适应操作条件的变化,保持电池整个生命周期内的准确性,而且计算成本保持在可接受的范围内,适合于车载BMS和基于云的数字孪生BMS使用。
论文2:
Deep state space recurrent neural networks for time series forecasting
深度状态空间递归神经网络用于时间序列预测
方法
-
状态空间模型与RNN结合:提出了将计量经济学状态空间模型的原理与递归神经网络(RNN)的动态能力相结合的新型神经网络框架。
-
LSTM、GRU和TKAN:提出了使用长短期记忆(LSTM)、门控残差单元(GRU)和时间Kolmogorov-Arnold网络(TKAN)的状态空间模型。
创新点
-
TKAN网络的提出:TKAN网络在Kolmogorov-Arnold网络(KAN)和LSTM的启发下展现出有希望的结果,特别是在时间序列预测方面。
-
状态切换模型:通过引入隐藏的状态切换机制,模型能够根据某些可观察的协变量随时间变化的转换概率,增强了对市场不同状态(如牛市或熊市)的适应性和预测能力。
-
性能提升:TKAN在模拟实验中展现出比LSTM和GRU更优越的性能,特别是在处理复杂非线性关系时,尽管计算复杂度和时间较高,但其预测能力和灵活性的提高是显著的
论文3:
Model Comparisons: XNet Outperforms KAN
模型比较:XNet优于KAN
方法
-
XNet算法:探索了一种新型算法XNet,该算法采用复值柯西积分公式,提供了超越传统多层感知器(MLPs)和Kolmogorov-Arnold网络(KANs)的优越网络架构。
-
柯西激活函数:XNet利用柯西核作为基函数,与KAN使用的B样条基函数形成对比。
创新点
-
函数逼近能力提升:XNet在处理Heaviside步函数和复杂高维场景时展现出比KAN更优越的性能,尤其在局部数据段的逼近上,XNet的均方误差(MSE)比KAN小1000倍。
-
物理信息神经网络(PINN)中的优越性:在Poisson方程的基准测试中,XNet在物理信息神经网络(PINN)框架内的效率和准确性显著超过MLP和KAN。
-
时间序列预测的创新:通过在LSTM架构中用XNet替换传统的前馈神经网络(FNN),引入了XLSTM模型,在时间序列预测实验中,XLSTM在准确性和可靠性方面一致超越了传统的LSTM模型。
论文4:
TKAN: Temporal Kolmogorov-Arnold Networks
TKAN:时序Kolmogorov-Arnold网络
方法
-
时序Kolmogorov-Arnold网络(TKAN):提出了一种新的神经网络架构,结合了Kolmogorov-Arnold网络(KAN)和长短期记忆网络(LSTM)。
-
循环Kolmogorov-Arnold网络(RKAN)层:在TKAN中嵌入了记忆管理,以保持短期记忆。
-
门控机制:通过门控机制管理信息流,决定哪些信息应该被保留或遗忘。
-
B-Spline曲线:使用B-Spline曲线作为1D函数的参数化表示,以学习KAN层中的激活函数。
创新点
-
结合KAN和LSTM:TKAN结合了KAN和LSTM的优点,提升了多步时间序列预测的准确性和效率,特别是在处理复杂序列模式方面。
-
RKAN层:通过在每个层中嵌入记忆管理,RKAN层能够存储与时间上下文相关的信息,并在处理过程中被网络访问,使网络能够显式学习和利用过去的信息。
-
性能提升:在多步预测任务中,TKAN相比于传统的LSTM和GRU模型表现出更好的性能,例如在15步预测中,TKAN的R-squared值比GRU高出至少25%,显示出在长期预测中的优势。
-
模型稳定性:TKAN在多次实验中显示出更好的稳定性,与GRU和LSTM相比,TKAN的性能变化较小,表明其在不同实验间的权重校准更为稳定。
相关文章:

顶会新宠!KAN-LSTM完美融合新方案
2024深度学习发论文&模型涨点之——KANLSTM KAN-LSTM混合预测模型是一种结合了自注意力机制(KAN, Key-attention network)和长短时记忆网络(LSTM)的深度学习模型,主要用于序列数据的预测任务,如时间序…...
JS中对象的浅拷贝,深拷贝和引用
JS中对象的浅拷贝,深拷贝和引用 浅拷贝和深拷贝的区别主要在于它们如何处理引用类型的数据(如数组和对象),而引用简而言之就是换了个变量名。 浅拷贝 引用:浅拷贝只复制对象的第一层属性,对于嵌套的对象或…...
思普企业运营平台 idsCheck Sql注入漏洞复现
0x01 产品描述: 思普企业运营平台是由贵阳思普信息技术有限公司自主研发的国内首款投融建管营云服务平台——...

FSWIND脉动风-风载时程生成器软件下载、安装及注册
1、软件下载 点击文末超链接下载 2、软件安装 以下操作,若被电脑杀毒软件提示风险,请加入白名单,软件无任何病毒和后台,请放心使用! 1)双击Fswind_setup.exe,启动安装程序 2)、点…...
spring通过RequestContextHolder获取HttpServletRequest对象
1.获取HttpServletRequest对象方法: public static HttpServletRequest getRequest() {ServletRequestAttributes attributes ((ServletRequestAttributes) RequestContextHolder.getRequestAttributes());assert attributes ! null;return attributes.getRequest(…...

STM32编码器接口及编码器测速模板代码
编码器是什么? 编码器是一种将角位移或者角速度转换成一连串电数字脉冲的旋转式传感 器,我们可以通过编码器测量到底位移或者速度信息。编码器从输出数据类型上 分,可以分为增量式编码器和绝对式编码器。 从编码器检测原理上来分࿰…...

qt QNetworkAccessManager详解
1、概述 QNetworkAccessManager是QtNetwork模块中的一个核心类,它允许应用程序发送网络请求并接收响应。该类是网络通信的基石,提供了一种方便的方式来处理常见的网络协议,如HTTP、HTTPS等。QNetworkAccessManager对象持有其发送的请求的通用…...
部署 Vue 前端项目到 Linux
看看怎么把一个 Vue 3 项目部署到 Linux 服务器上。准备好你的咖啡,让我们愉快地度过这段部署时光! 前期准备 确保你已经在本地构建了 Vue 3 项目,并生成了 dist 文件夹。 npm run build构建完成后,你将看到一个新鲜出炉的 dis…...

数据分析:探索数据背后的秘密与挑战
在当今这个数据驱动的时代,数据分析已成为各行各业不可或缺的一部分。从市场营销到金融风控,从医疗健康到智能制造,数据分析为企业决策提供了强有力的支持。然而,尽管其重要性日益凸显,数据分析的过程并非一帆风顺&…...

文本域设置高度 加上文字限制并show出来:
文本域设置高度 :rows"4" 加上文字限制并show出来: maxlength"30" show-word-limit 效果: <el-form-item label"产品备注" prop"remark"><el-input v-model"form.remark" type"textarea"…...
深入浅出:Gin框架-简介与API开发入门
深入浅出:Gin框架-简介与API开发入门 引言 Gin框架是基于Go语言的HTTP Web框架,凭借其简单易用、性能卓越和丰富的功能,成为构建高性能Web应用的理想选择。本文将深入浅出地介绍Gin框架的基础知识,并通过一个简单的案例…...
MySQL各种锁详解
什么是锁? 1.1 锁的解释 计算机协调多个进程或线程并发访问某一资源的机制。 1.2 锁的重要性 在数据库中,除传统计算资源(CPU、RAM、I/O等)的争抢,数据也是一种供多用户共享的资源。 如何保证数据并发访问的一致性&…...

海外的bug-hunters,不一样的403bypass
一种绕过403的新技术,跟大家分享一下。研究HTTP协议已经有一段时间了。发现HTTP协议的1.0版本可以绕过403。于是开始对lyncdiscover.microsoft.com域做FUZZ并且发现了几个403Forbidden的文件。 (访问fsip.svc为403) 在经过尝试后࿰…...

React 组件中 State 的定义、使用及正确更新方式
🌈个人主页:前端青山 🔥系列专栏:React篇 🔖人终将被年少不可得之物困其一生 依旧青山,本期给大家带来React篇专栏内容React 组件中 State 的定义、使用及正确更新方式 前言 在 React 应用开发中,state …...

Jenkins 的HTTP Request 插件为什么不能配置Basic认证了
本篇遇到的问题 还是因为Jenkins需要及其所在的OS需要升级,升级策略是在一台新服务器上安装和配置最新版本的Jenkins, 当前的最新版本是: 2.479.2 LTS。 如果需要这个版本的话可以在官方站点下载,也可以到如下地址下载࿱…...
8 Bellman Ford算法SPFA
图论 —— 最短路 —— Bellman-Ford 算法与 SPFA_通信网理论基础 分别使用bellman-ford算法和dijkstra算法的应用-CSDN博客 图解Bellman-Ford计算过程以及正确性证明 - 知乎 (zhihu.com) 语雀版本 1 概念 **适用场景:**单源点,可以有负边࿰…...

nginx不允许静态文件被post请求显示405 not allowed
在单独站点的配置文件中 添加error_page 405 200 $request_uri; 即可!...
【c++笔试强训】(第三十二篇)
目录 数组变换(贪⼼位运算) 题目解析 讲解算法原理 编写代码 装箱问题(动态规划-01背包) 题目解析 讲解算法原理 编写代码 数组变换(贪⼼位运算) 题目解析 1.题目链接:数组变换__牛客网…...

shell脚本实战案例
文章目录 实战第一坑功能说明脚本实现 实战第一坑 实战第一坑:在Windows系统写了一个脚本,比如上面,随后上传到服务,执行会报错 原因: 解决方案:在linux系统touch文件,并通过vim添加内容&…...

OpenCV-图像阈值
简单阈值法 此方法是直截了当的。如果像素值大于阈值,则会被赋为一个值(可能为白色),否则会赋为另一个值(可能为黑色)。使用的函数是 cv.threshold。第一个参数是源图像,它应该是灰度图像。第二…...

深入浅出Asp.Net Core MVC应用开发系列-AspNetCore中的日志记录
ASP.NET Core 是一个跨平台的开源框架,用于在 Windows、macOS 或 Linux 上生成基于云的新式 Web 应用。 ASP.NET Core 中的日志记录 .NET 通过 ILogger API 支持高性能结构化日志记录,以帮助监视应用程序行为和诊断问题。 可以通过配置不同的记录提供程…...

大型活动交通拥堵治理的视觉算法应用
大型活动下智慧交通的视觉分析应用 一、背景与挑战 大型活动(如演唱会、马拉松赛事、高考中考等)期间,城市交通面临瞬时人流车流激增、传统摄像头模糊、交通拥堵识别滞后等问题。以演唱会为例,暖城商圈曾因观众集中离场导致周边…...

Cloudflare 从 Nginx 到 Pingora:性能、效率与安全的全面升级
在互联网的快速发展中,高性能、高效率和高安全性的网络服务成为了各大互联网基础设施提供商的核心追求。Cloudflare 作为全球领先的互联网安全和基础设施公司,近期做出了一个重大技术决策:弃用长期使用的 Nginx,转而采用其内部开发…...

ElasticSearch搜索引擎之倒排索引及其底层算法
文章目录 一、搜索引擎1、什么是搜索引擎?2、搜索引擎的分类3、常用的搜索引擎4、搜索引擎的特点二、倒排索引1、简介2、为什么倒排索引不用B+树1.创建时间长,文件大。2.其次,树深,IO次数可怕。3.索引可能会失效。4.精准度差。三. 倒排索引四、算法1、Term Index的算法2、 …...
GitHub 趋势日报 (2025年06月08日)
📊 由 TrendForge 系统生成 | 🌐 https://trendforge.devlive.org/ 🌐 本日报中的项目描述已自动翻译为中文 📈 今日获星趋势图 今日获星趋势图 884 cognee 566 dify 414 HumanSystemOptimization 414 omni-tools 321 note-gen …...
3403. 从盒子中找出字典序最大的字符串 I
3403. 从盒子中找出字典序最大的字符串 I 题目链接:3403. 从盒子中找出字典序最大的字符串 I 代码如下: class Solution { public:string answerString(string word, int numFriends) {if (numFriends 1) {return word;}string res;for (int i 0;i &…...

mysql已经安装,但是通过rpm -q 没有找mysql相关的已安装包
文章目录 现象:mysql已经安装,但是通过rpm -q 没有找mysql相关的已安装包遇到 rpm 命令找不到已经安装的 MySQL 包时,可能是因为以下几个原因:1.MySQL 不是通过 RPM 包安装的2.RPM 数据库损坏3.使用了不同的包名或路径4.使用其他包…...

算法笔记2
1.字符串拼接最好用StringBuilder,不用String 2.创建List<>类型的数组并创建内存 List arr[] new ArrayList[26]; Arrays.setAll(arr, i -> new ArrayList<>()); 3.去掉首尾空格...
Linux C语言网络编程详细入门教程:如何一步步实现TCP服务端与客户端通信
文章目录 Linux C语言网络编程详细入门教程:如何一步步实现TCP服务端与客户端通信前言一、网络通信基础概念二、服务端与客户端的完整流程图解三、每一步的详细讲解和代码示例1. 创建Socket(服务端和客户端都要)2. 绑定本地地址和端口&#x…...

基于TurtleBot3在Gazebo地图实现机器人远程控制
1. TurtleBot3环境配置 # 下载TurtleBot3核心包 mkdir -p ~/catkin_ws/src cd ~/catkin_ws/src git clone -b noetic-devel https://github.com/ROBOTIS-GIT/turtlebot3.git git clone -b noetic https://github.com/ROBOTIS-GIT/turtlebot3_msgs.git git clone -b noetic-dev…...