顶会新宠!KAN-LSTM完美融合新方案
2024深度学习发论文&模型涨点之——KAN+LSTM
KAN-LSTM混合预测模型是一种结合了自注意力机制(KAN, Key-attention network)和长短时记忆网络(LSTM)的深度学习模型,主要用于序列数据的预测任务,如时间序列分析、自然语言处理等。
KAN-LSTM混合模型的优势在于,KAN提供了全局视角,而LSTM则专注于捕捉局部序列中的有用信息,两者的结合能够提升模型对序列数据的理解和预测能力。通过将KAN的输出作为LSTM的输入,模型能够更有效地整合全局上下文信息和局部细节,从而提高预测的准确性和可靠性。
因为KAN是新提出的模型,这个方向现在也不是很卷,是个很好的发文方向。
我整理了一些KAN+LSTM【论文+代码】合集,需要的同学公人人人号【AI创新工场】自取。
论文精选
论文1:
Core Temperature Estimation of Lithium-Ion Batteries Using Long Short-Term Memory (LSTM) Network and Kolmogorov-Arnold Network (KAN)
利用长短期记忆(LSTM)网络和Kolmogorov-Arnold网络(KAN)估算锂离子电池的核心温度
方法
-
LSTM网络:提出了使用基本操作参数(如电压、电流和环境温度)来估算锂离子电池的表面和核心温度的LSTM网络架构。
-
KAN网络:介绍了一种基于数据驱动的深度学习方法KAN,用于估算锂离子电池的核心和表面温度,而不依赖于表面温度作为神经网络的反馈。

创新点
-
KAN网络的引入:通过KAN网络,能够在不需要物理表面温度传感器的情况下,准确预测电池的内部和表面温度,降低了电池管理系统(BMS)的成本和线路复杂性。
-
性能提升:实验验证显示KAN在估算核心温度时误差为0.5°C,计算成本为2.9ms至3.2ms,相较于传统方法在计算效率和准确性上都有显著提升。
-
适应性和准确性:KAN模型不仅能够适应操作条件的变化,保持电池整个生命周期内的准确性,而且计算成本保持在可接受的范围内,适合于车载BMS和基于云的数字孪生BMS使用。

论文2:
Deep state space recurrent neural networks for time series forecasting
深度状态空间递归神经网络用于时间序列预测
方法
-
状态空间模型与RNN结合:提出了将计量经济学状态空间模型的原理与递归神经网络(RNN)的动态能力相结合的新型神经网络框架。
-
LSTM、GRU和TKAN:提出了使用长短期记忆(LSTM)、门控残差单元(GRU)和时间Kolmogorov-Arnold网络(TKAN)的状态空间模型。

创新点
-
TKAN网络的提出:TKAN网络在Kolmogorov-Arnold网络(KAN)和LSTM的启发下展现出有希望的结果,特别是在时间序列预测方面。
-
状态切换模型:通过引入隐藏的状态切换机制,模型能够根据某些可观察的协变量随时间变化的转换概率,增强了对市场不同状态(如牛市或熊市)的适应性和预测能力。
-
性能提升:TKAN在模拟实验中展现出比LSTM和GRU更优越的性能,特别是在处理复杂非线性关系时,尽管计算复杂度和时间较高,但其预测能力和灵活性的提高是显著的

论文3:
Model Comparisons: XNet Outperforms KAN
模型比较:XNet优于KAN
方法
-
XNet算法:探索了一种新型算法XNet,该算法采用复值柯西积分公式,提供了超越传统多层感知器(MLPs)和Kolmogorov-Arnold网络(KANs)的优越网络架构。
-
柯西激活函数:XNet利用柯西核作为基函数,与KAN使用的B样条基函数形成对比。

创新点
-
函数逼近能力提升:XNet在处理Heaviside步函数和复杂高维场景时展现出比KAN更优越的性能,尤其在局部数据段的逼近上,XNet的均方误差(MSE)比KAN小1000倍。
-
物理信息神经网络(PINN)中的优越性:在Poisson方程的基准测试中,XNet在物理信息神经网络(PINN)框架内的效率和准确性显著超过MLP和KAN。
-
时间序列预测的创新:通过在LSTM架构中用XNet替换传统的前馈神经网络(FNN),引入了XLSTM模型,在时间序列预测实验中,XLSTM在准确性和可靠性方面一致超越了传统的LSTM模型。

论文4:
TKAN: Temporal Kolmogorov-Arnold Networks
TKAN:时序Kolmogorov-Arnold网络
方法
-
时序Kolmogorov-Arnold网络(TKAN):提出了一种新的神经网络架构,结合了Kolmogorov-Arnold网络(KAN)和长短期记忆网络(LSTM)。
-
循环Kolmogorov-Arnold网络(RKAN)层:在TKAN中嵌入了记忆管理,以保持短期记忆。
-
门控机制:通过门控机制管理信息流,决定哪些信息应该被保留或遗忘。
-
B-Spline曲线:使用B-Spline曲线作为1D函数的参数化表示,以学习KAN层中的激活函数。

创新点
-
结合KAN和LSTM:TKAN结合了KAN和LSTM的优点,提升了多步时间序列预测的准确性和效率,特别是在处理复杂序列模式方面。
-
RKAN层:通过在每个层中嵌入记忆管理,RKAN层能够存储与时间上下文相关的信息,并在处理过程中被网络访问,使网络能够显式学习和利用过去的信息。
-
性能提升:在多步预测任务中,TKAN相比于传统的LSTM和GRU模型表现出更好的性能,例如在15步预测中,TKAN的R-squared值比GRU高出至少25%,显示出在长期预测中的优势。
-
模型稳定性:TKAN在多次实验中显示出更好的稳定性,与GRU和LSTM相比,TKAN的性能变化较小,表明其在不同实验间的权重校准更为稳定。

相关文章:
顶会新宠!KAN-LSTM完美融合新方案
2024深度学习发论文&模型涨点之——KANLSTM KAN-LSTM混合预测模型是一种结合了自注意力机制(KAN, Key-attention network)和长短时记忆网络(LSTM)的深度学习模型,主要用于序列数据的预测任务,如时间序…...
JS中对象的浅拷贝,深拷贝和引用
JS中对象的浅拷贝,深拷贝和引用 浅拷贝和深拷贝的区别主要在于它们如何处理引用类型的数据(如数组和对象),而引用简而言之就是换了个变量名。 浅拷贝 引用:浅拷贝只复制对象的第一层属性,对于嵌套的对象或…...
思普企业运营平台 idsCheck Sql注入漏洞复现
0x01 产品描述: 思普企业运营平台是由贵阳思普信息技术有限公司自主研发的国内首款投融建管营云服务平台——...
FSWIND脉动风-风载时程生成器软件下载、安装及注册
1、软件下载 点击文末超链接下载 2、软件安装 以下操作,若被电脑杀毒软件提示风险,请加入白名单,软件无任何病毒和后台,请放心使用! 1)双击Fswind_setup.exe,启动安装程序 2)、点…...
spring通过RequestContextHolder获取HttpServletRequest对象
1.获取HttpServletRequest对象方法: public static HttpServletRequest getRequest() {ServletRequestAttributes attributes ((ServletRequestAttributes) RequestContextHolder.getRequestAttributes());assert attributes ! null;return attributes.getRequest(…...
STM32编码器接口及编码器测速模板代码
编码器是什么? 编码器是一种将角位移或者角速度转换成一连串电数字脉冲的旋转式传感 器,我们可以通过编码器测量到底位移或者速度信息。编码器从输出数据类型上 分,可以分为增量式编码器和绝对式编码器。 从编码器检测原理上来分࿰…...
qt QNetworkAccessManager详解
1、概述 QNetworkAccessManager是QtNetwork模块中的一个核心类,它允许应用程序发送网络请求并接收响应。该类是网络通信的基石,提供了一种方便的方式来处理常见的网络协议,如HTTP、HTTPS等。QNetworkAccessManager对象持有其发送的请求的通用…...
部署 Vue 前端项目到 Linux
看看怎么把一个 Vue 3 项目部署到 Linux 服务器上。准备好你的咖啡,让我们愉快地度过这段部署时光! 前期准备 确保你已经在本地构建了 Vue 3 项目,并生成了 dist 文件夹。 npm run build构建完成后,你将看到一个新鲜出炉的 dis…...
数据分析:探索数据背后的秘密与挑战
在当今这个数据驱动的时代,数据分析已成为各行各业不可或缺的一部分。从市场营销到金融风控,从医疗健康到智能制造,数据分析为企业决策提供了强有力的支持。然而,尽管其重要性日益凸显,数据分析的过程并非一帆风顺&…...
文本域设置高度 加上文字限制并show出来:
文本域设置高度 :rows"4" 加上文字限制并show出来: maxlength"30" show-word-limit 效果: <el-form-item label"产品备注" prop"remark"><el-input v-model"form.remark" type"textarea"…...
深入浅出:Gin框架-简介与API开发入门
深入浅出:Gin框架-简介与API开发入门 引言 Gin框架是基于Go语言的HTTP Web框架,凭借其简单易用、性能卓越和丰富的功能,成为构建高性能Web应用的理想选择。本文将深入浅出地介绍Gin框架的基础知识,并通过一个简单的案例…...
MySQL各种锁详解
什么是锁? 1.1 锁的解释 计算机协调多个进程或线程并发访问某一资源的机制。 1.2 锁的重要性 在数据库中,除传统计算资源(CPU、RAM、I/O等)的争抢,数据也是一种供多用户共享的资源。 如何保证数据并发访问的一致性&…...
海外的bug-hunters,不一样的403bypass
一种绕过403的新技术,跟大家分享一下。研究HTTP协议已经有一段时间了。发现HTTP协议的1.0版本可以绕过403。于是开始对lyncdiscover.microsoft.com域做FUZZ并且发现了几个403Forbidden的文件。 (访问fsip.svc为403) 在经过尝试后࿰…...
React 组件中 State 的定义、使用及正确更新方式
🌈个人主页:前端青山 🔥系列专栏:React篇 🔖人终将被年少不可得之物困其一生 依旧青山,本期给大家带来React篇专栏内容React 组件中 State 的定义、使用及正确更新方式 前言 在 React 应用开发中,state …...
Jenkins 的HTTP Request 插件为什么不能配置Basic认证了
本篇遇到的问题 还是因为Jenkins需要及其所在的OS需要升级,升级策略是在一台新服务器上安装和配置最新版本的Jenkins, 当前的最新版本是: 2.479.2 LTS。 如果需要这个版本的话可以在官方站点下载,也可以到如下地址下载࿱…...
8 Bellman Ford算法SPFA
图论 —— 最短路 —— Bellman-Ford 算法与 SPFA_通信网理论基础 分别使用bellman-ford算法和dijkstra算法的应用-CSDN博客 图解Bellman-Ford计算过程以及正确性证明 - 知乎 (zhihu.com) 语雀版本 1 概念 **适用场景:**单源点,可以有负边࿰…...
nginx不允许静态文件被post请求显示405 not allowed
在单独站点的配置文件中 添加error_page 405 200 $request_uri; 即可!...
【c++笔试强训】(第三十二篇)
目录 数组变换(贪⼼位运算) 题目解析 讲解算法原理 编写代码 装箱问题(动态规划-01背包) 题目解析 讲解算法原理 编写代码 数组变换(贪⼼位运算) 题目解析 1.题目链接:数组变换__牛客网…...
shell脚本实战案例
文章目录 实战第一坑功能说明脚本实现 实战第一坑 实战第一坑:在Windows系统写了一个脚本,比如上面,随后上传到服务,执行会报错 原因: 解决方案:在linux系统touch文件,并通过vim添加内容&…...
OpenCV-图像阈值
简单阈值法 此方法是直截了当的。如果像素值大于阈值,则会被赋为一个值(可能为白色),否则会赋为另一个值(可能为黑色)。使用的函数是 cv.threshold。第一个参数是源图像,它应该是灰度图像。第二…...
紧急通知:FAO 2024渔业AI伦理新规已生效!NotebookLM合规使用红线清单(含数据脱敏、模型可解释性、渔民知情权三重校验表)
更多请点击: https://intelliparadigm.com 第一章:FAO 2024渔业AI伦理新规核心要义与NotebookLM适配总览 联合国粮农组织(FAO)于2024年3月发布的《人工智能在渔业与水产养殖中的伦理应用指南》,首次将“可追溯性权”“…...
现在不掌握NotebookLM航天科研工作流,你将错过下一轮国家重大专项申报窗口期——3大航天高校已启用的AI原生课题孵化模板首次解密
更多请点击: https://intelliparadigm.com 第一章:NotebookLM航天科学研究 NotebookLM 是 Google 推出的基于 AI 的研究协作者工具,专为处理长文档、技术报告与多源文献而设计。在航天科学研究中,其语义理解能力与引用溯源机制可…...
gomicro如何安装部暑
根据最新官方文档,以下是 go-micro(v5 最新版) 的完整安装与部署指南。目前最新稳定版本为 v5.16.0,推荐使用特定版本号安装以避免模块路径冲突。---一、环境准备 要求 说明 Go Go 1.21(建议最新版) …...
ComfyUI MixLab Nodes:3分钟掌握AI多模态创作平台,彻底改变你的创意工作流
ComfyUI MixLab Nodes:3分钟掌握AI多模态创作平台,彻底改变你的创意工作流 【免费下载链接】comfyui-mixlab-nodes Workflow-to-APP、ScreenShare&FloatingVideo、GPT & 3D、SpeechRecognition&TTS 项目地址: https://gitcode.com/gh_mirr…...
TypeScript + Next.js + Tailwind CSS 现代Web开发最佳实践模板解析
1. 项目概述:一个现代Web开发的“瑞士军刀”如果你最近在考虑启动一个Next.js项目,并且希望它从一开始就具备现代化的技术栈、清晰的代码结构和高效的开发体验,那么你很可能已经听说过或者正在寻找一个合适的“启动器”。theodorusclarence/t…...
RK3566(泰山派)实战:D310T9362V1SPEC触摸屏驱动从零适配与调试(竖屏)
1. RK3566与D310T9362V1SPEC屏幕简介 RK3566是瑞芯微推出的一款高性能嵌入式处理器,采用四核Cortex-A55架构,主频可达1.8GHz。这款芯片在工业控制、智能家居和物联网设备中广泛应用,特别适合需要图形显示和触摸交互的场景。我最近在一个智能终…...
Shell 相关基础入门,在 Ubuntu 与 CentOS Shell 中的语法差异总结(bash、dash、sh)
新建的test.sh文件,vim进去,每行开头都默认有一个~符号,是什么意思,而且在里面鼠标也失效了? 你问的这两个问题,恰好是初学者刚接触 vim 编辑器时最常遇到的两个困惑。它们完全正常,不是系统出错…...
S32K324双核M7实战:如何利用192KB TCM提升关键代码性能
S32K324双核M7实战:如何利用192KB TCM提升关键代码性能 在嵌入式系统开发中,实时性往往是决定产品成败的关键因素。当您面对电机控制、信号处理等高实时性需求场景时,处理器与内存之间的数据通路可能成为性能瓶颈的隐形杀手。S32K324芯片内置…...
AI Agent Harness Engineering 产品经理指南:如何定义智能体的“人设”与能力边界?
AI Agent Harness Engineering 产品经理指南:如何定义智能体的「人设」与能力边界 关键词:AI Agent、智能体管控工程(Harness Engineering)、产品经理、人设对齐、能力边界、智能体治理、生成式AI落地 摘要 随着生成式AI技术的成熟,AI Agent已经从概念验证阶段进入大规…...
ARMv8-AArch64 异常处理实战:从寄存器解析到调试技巧
1. ARMv8-AArch64异常处理入门指南 第一次接触ARMv8架构的异常处理时,我被那一堆寄存器搞得头晕眼花。ELR、ESR、FAR...这些缩写看起来就像天书一样。但经过几个实际项目的磨练后,我发现只要掌握几个关键点,异常处理其实并没有想象中那么难。…...
