顶会新宠!KAN-LSTM完美融合新方案
2024深度学习发论文&模型涨点之——KAN+LSTM
KAN-LSTM混合预测模型是一种结合了自注意力机制(KAN, Key-attention network)和长短时记忆网络(LSTM)的深度学习模型,主要用于序列数据的预测任务,如时间序列分析、自然语言处理等。
KAN-LSTM混合模型的优势在于,KAN提供了全局视角,而LSTM则专注于捕捉局部序列中的有用信息,两者的结合能够提升模型对序列数据的理解和预测能力。通过将KAN的输出作为LSTM的输入,模型能够更有效地整合全局上下文信息和局部细节,从而提高预测的准确性和可靠性。
因为KAN是新提出的模型,这个方向现在也不是很卷,是个很好的发文方向。
我整理了一些KAN+LSTM【论文+代码】合集,需要的同学公人人人号【AI创新工场】自取。
论文精选
论文1:
Core Temperature Estimation of Lithium-Ion Batteries Using Long Short-Term Memory (LSTM) Network and Kolmogorov-Arnold Network (KAN)
利用长短期记忆(LSTM)网络和Kolmogorov-Arnold网络(KAN)估算锂离子电池的核心温度
方法
-
LSTM网络:提出了使用基本操作参数(如电压、电流和环境温度)来估算锂离子电池的表面和核心温度的LSTM网络架构。
-
KAN网络:介绍了一种基于数据驱动的深度学习方法KAN,用于估算锂离子电池的核心和表面温度,而不依赖于表面温度作为神经网络的反馈。

创新点
-
KAN网络的引入:通过KAN网络,能够在不需要物理表面温度传感器的情况下,准确预测电池的内部和表面温度,降低了电池管理系统(BMS)的成本和线路复杂性。
-
性能提升:实验验证显示KAN在估算核心温度时误差为0.5°C,计算成本为2.9ms至3.2ms,相较于传统方法在计算效率和准确性上都有显著提升。
-
适应性和准确性:KAN模型不仅能够适应操作条件的变化,保持电池整个生命周期内的准确性,而且计算成本保持在可接受的范围内,适合于车载BMS和基于云的数字孪生BMS使用。

论文2:
Deep state space recurrent neural networks for time series forecasting
深度状态空间递归神经网络用于时间序列预测
方法
-
状态空间模型与RNN结合:提出了将计量经济学状态空间模型的原理与递归神经网络(RNN)的动态能力相结合的新型神经网络框架。
-
LSTM、GRU和TKAN:提出了使用长短期记忆(LSTM)、门控残差单元(GRU)和时间Kolmogorov-Arnold网络(TKAN)的状态空间模型。

创新点
-
TKAN网络的提出:TKAN网络在Kolmogorov-Arnold网络(KAN)和LSTM的启发下展现出有希望的结果,特别是在时间序列预测方面。
-
状态切换模型:通过引入隐藏的状态切换机制,模型能够根据某些可观察的协变量随时间变化的转换概率,增强了对市场不同状态(如牛市或熊市)的适应性和预测能力。
-
性能提升:TKAN在模拟实验中展现出比LSTM和GRU更优越的性能,特别是在处理复杂非线性关系时,尽管计算复杂度和时间较高,但其预测能力和灵活性的提高是显著的

论文3:
Model Comparisons: XNet Outperforms KAN
模型比较:XNet优于KAN
方法
-
XNet算法:探索了一种新型算法XNet,该算法采用复值柯西积分公式,提供了超越传统多层感知器(MLPs)和Kolmogorov-Arnold网络(KANs)的优越网络架构。
-
柯西激活函数:XNet利用柯西核作为基函数,与KAN使用的B样条基函数形成对比。

创新点
-
函数逼近能力提升:XNet在处理Heaviside步函数和复杂高维场景时展现出比KAN更优越的性能,尤其在局部数据段的逼近上,XNet的均方误差(MSE)比KAN小1000倍。
-
物理信息神经网络(PINN)中的优越性:在Poisson方程的基准测试中,XNet在物理信息神经网络(PINN)框架内的效率和准确性显著超过MLP和KAN。
-
时间序列预测的创新:通过在LSTM架构中用XNet替换传统的前馈神经网络(FNN),引入了XLSTM模型,在时间序列预测实验中,XLSTM在准确性和可靠性方面一致超越了传统的LSTM模型。

论文4:
TKAN: Temporal Kolmogorov-Arnold Networks
TKAN:时序Kolmogorov-Arnold网络
方法
-
时序Kolmogorov-Arnold网络(TKAN):提出了一种新的神经网络架构,结合了Kolmogorov-Arnold网络(KAN)和长短期记忆网络(LSTM)。
-
循环Kolmogorov-Arnold网络(RKAN)层:在TKAN中嵌入了记忆管理,以保持短期记忆。
-
门控机制:通过门控机制管理信息流,决定哪些信息应该被保留或遗忘。
-
B-Spline曲线:使用B-Spline曲线作为1D函数的参数化表示,以学习KAN层中的激活函数。

创新点
-
结合KAN和LSTM:TKAN结合了KAN和LSTM的优点,提升了多步时间序列预测的准确性和效率,特别是在处理复杂序列模式方面。
-
RKAN层:通过在每个层中嵌入记忆管理,RKAN层能够存储与时间上下文相关的信息,并在处理过程中被网络访问,使网络能够显式学习和利用过去的信息。
-
性能提升:在多步预测任务中,TKAN相比于传统的LSTM和GRU模型表现出更好的性能,例如在15步预测中,TKAN的R-squared值比GRU高出至少25%,显示出在长期预测中的优势。
-
模型稳定性:TKAN在多次实验中显示出更好的稳定性,与GRU和LSTM相比,TKAN的性能变化较小,表明其在不同实验间的权重校准更为稳定。

相关文章:
顶会新宠!KAN-LSTM完美融合新方案
2024深度学习发论文&模型涨点之——KANLSTM KAN-LSTM混合预测模型是一种结合了自注意力机制(KAN, Key-attention network)和长短时记忆网络(LSTM)的深度学习模型,主要用于序列数据的预测任务,如时间序…...
JS中对象的浅拷贝,深拷贝和引用
JS中对象的浅拷贝,深拷贝和引用 浅拷贝和深拷贝的区别主要在于它们如何处理引用类型的数据(如数组和对象),而引用简而言之就是换了个变量名。 浅拷贝 引用:浅拷贝只复制对象的第一层属性,对于嵌套的对象或…...
思普企业运营平台 idsCheck Sql注入漏洞复现
0x01 产品描述: 思普企业运营平台是由贵阳思普信息技术有限公司自主研发的国内首款投融建管营云服务平台——...
FSWIND脉动风-风载时程生成器软件下载、安装及注册
1、软件下载 点击文末超链接下载 2、软件安装 以下操作,若被电脑杀毒软件提示风险,请加入白名单,软件无任何病毒和后台,请放心使用! 1)双击Fswind_setup.exe,启动安装程序 2)、点…...
spring通过RequestContextHolder获取HttpServletRequest对象
1.获取HttpServletRequest对象方法: public static HttpServletRequest getRequest() {ServletRequestAttributes attributes ((ServletRequestAttributes) RequestContextHolder.getRequestAttributes());assert attributes ! null;return attributes.getRequest(…...
STM32编码器接口及编码器测速模板代码
编码器是什么? 编码器是一种将角位移或者角速度转换成一连串电数字脉冲的旋转式传感 器,我们可以通过编码器测量到底位移或者速度信息。编码器从输出数据类型上 分,可以分为增量式编码器和绝对式编码器。 从编码器检测原理上来分࿰…...
qt QNetworkAccessManager详解
1、概述 QNetworkAccessManager是QtNetwork模块中的一个核心类,它允许应用程序发送网络请求并接收响应。该类是网络通信的基石,提供了一种方便的方式来处理常见的网络协议,如HTTP、HTTPS等。QNetworkAccessManager对象持有其发送的请求的通用…...
部署 Vue 前端项目到 Linux
看看怎么把一个 Vue 3 项目部署到 Linux 服务器上。准备好你的咖啡,让我们愉快地度过这段部署时光! 前期准备 确保你已经在本地构建了 Vue 3 项目,并生成了 dist 文件夹。 npm run build构建完成后,你将看到一个新鲜出炉的 dis…...
数据分析:探索数据背后的秘密与挑战
在当今这个数据驱动的时代,数据分析已成为各行各业不可或缺的一部分。从市场营销到金融风控,从医疗健康到智能制造,数据分析为企业决策提供了强有力的支持。然而,尽管其重要性日益凸显,数据分析的过程并非一帆风顺&…...
文本域设置高度 加上文字限制并show出来:
文本域设置高度 :rows"4" 加上文字限制并show出来: maxlength"30" show-word-limit 效果: <el-form-item label"产品备注" prop"remark"><el-input v-model"form.remark" type"textarea"…...
深入浅出:Gin框架-简介与API开发入门
深入浅出:Gin框架-简介与API开发入门 引言 Gin框架是基于Go语言的HTTP Web框架,凭借其简单易用、性能卓越和丰富的功能,成为构建高性能Web应用的理想选择。本文将深入浅出地介绍Gin框架的基础知识,并通过一个简单的案例…...
MySQL各种锁详解
什么是锁? 1.1 锁的解释 计算机协调多个进程或线程并发访问某一资源的机制。 1.2 锁的重要性 在数据库中,除传统计算资源(CPU、RAM、I/O等)的争抢,数据也是一种供多用户共享的资源。 如何保证数据并发访问的一致性&…...
海外的bug-hunters,不一样的403bypass
一种绕过403的新技术,跟大家分享一下。研究HTTP协议已经有一段时间了。发现HTTP协议的1.0版本可以绕过403。于是开始对lyncdiscover.microsoft.com域做FUZZ并且发现了几个403Forbidden的文件。 (访问fsip.svc为403) 在经过尝试后࿰…...
React 组件中 State 的定义、使用及正确更新方式
🌈个人主页:前端青山 🔥系列专栏:React篇 🔖人终将被年少不可得之物困其一生 依旧青山,本期给大家带来React篇专栏内容React 组件中 State 的定义、使用及正确更新方式 前言 在 React 应用开发中,state …...
Jenkins 的HTTP Request 插件为什么不能配置Basic认证了
本篇遇到的问题 还是因为Jenkins需要及其所在的OS需要升级,升级策略是在一台新服务器上安装和配置最新版本的Jenkins, 当前的最新版本是: 2.479.2 LTS。 如果需要这个版本的话可以在官方站点下载,也可以到如下地址下载࿱…...
8 Bellman Ford算法SPFA
图论 —— 最短路 —— Bellman-Ford 算法与 SPFA_通信网理论基础 分别使用bellman-ford算法和dijkstra算法的应用-CSDN博客 图解Bellman-Ford计算过程以及正确性证明 - 知乎 (zhihu.com) 语雀版本 1 概念 **适用场景:**单源点,可以有负边࿰…...
nginx不允许静态文件被post请求显示405 not allowed
在单独站点的配置文件中 添加error_page 405 200 $request_uri; 即可!...
【c++笔试强训】(第三十二篇)
目录 数组变换(贪⼼位运算) 题目解析 讲解算法原理 编写代码 装箱问题(动态规划-01背包) 题目解析 讲解算法原理 编写代码 数组变换(贪⼼位运算) 题目解析 1.题目链接:数组变换__牛客网…...
shell脚本实战案例
文章目录 实战第一坑功能说明脚本实现 实战第一坑 实战第一坑:在Windows系统写了一个脚本,比如上面,随后上传到服务,执行会报错 原因: 解决方案:在linux系统touch文件,并通过vim添加内容&…...
OpenCV-图像阈值
简单阈值法 此方法是直截了当的。如果像素值大于阈值,则会被赋为一个值(可能为白色),否则会赋为另一个值(可能为黑色)。使用的函数是 cv.threshold。第一个参数是源图像,它应该是灰度图像。第二…...
OpenLayers 可视化之热力图
注:当前使用的是 ol 5.3.0 版本,天地图使用的key请到天地图官网申请,并替换为自己的key 热力图(Heatmap)又叫热点图,是一种通过特殊高亮显示事物密度分布、变化趋势的数据可视化技术。采用颜色的深浅来显示…...
synchronized 学习
学习源: https://www.bilibili.com/video/BV1aJ411V763?spm_id_from333.788.videopod.episodes&vd_source32e1c41a9370911ab06d12fbc36c4ebc 1.应用场景 不超卖,也要考虑性能问题(场景) 2.常见面试问题: sync出…...
springboot 百货中心供应链管理系统小程序
一、前言 随着我国经济迅速发展,人们对手机的需求越来越大,各种手机软件也都在被广泛应用,但是对于手机进行数据信息管理,对于手机的各种软件也是备受用户的喜爱,百货中心供应链管理系统被用户普遍使用,为方…...
ES6从入门到精通:前言
ES6简介 ES6(ECMAScript 2015)是JavaScript语言的重大更新,引入了许多新特性,包括语法糖、新数据类型、模块化支持等,显著提升了开发效率和代码可维护性。 核心知识点概览 变量声明 let 和 const 取代 var…...
JVM垃圾回收机制全解析
Java虚拟机(JVM)中的垃圾收集器(Garbage Collector,简称GC)是用于自动管理内存的机制。它负责识别和清除不再被程序使用的对象,从而释放内存空间,避免内存泄漏和内存溢出等问题。垃圾收集器在Ja…...
在 Nginx Stream 层“改写”MQTT ngx_stream_mqtt_filter_module
1、为什么要修改 CONNECT 报文? 多租户隔离:自动为接入设备追加租户前缀,后端按 ClientID 拆分队列。零代码鉴权:将入站用户名替换为 OAuth Access-Token,后端 Broker 统一校验。灰度发布:根据 IP/地理位写…...
RNN避坑指南:从数学推导到LSTM/GRU工业级部署实战流程
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。 本文全面剖析RNN核心原理,深入讲解梯度消失/爆炸问题,并通过LSTM/GRU结构实现解决方案,提供时间序列预测和文本生成…...
AI书签管理工具开发全记录(十九):嵌入资源处理
1.前言 📝 在上一篇文章中,我们完成了书签的导入导出功能。本篇文章我们研究如何处理嵌入资源,方便后续将资源打包到一个可执行文件中。 2.embed介绍 🎯 Go 1.16 引入了革命性的 embed 包,彻底改变了静态资源管理的…...
html css js网页制作成品——HTML+CSS榴莲商城网页设计(4页)附源码
目录 一、👨🎓网站题目 二、✍️网站描述 三、📚网站介绍 四、🌐网站效果 五、🪓 代码实现 🧱HTML 六、🥇 如何让学习不再盲目 七、🎁更多干货 一、👨…...
2025季度云服务器排行榜
在全球云服务器市场,各厂商的排名和地位并非一成不变,而是由其独特的优势、战略布局和市场适应性共同决定的。以下是根据2025年市场趋势,对主要云服务器厂商在排行榜中占据重要位置的原因和优势进行深度分析: 一、全球“三巨头”…...
