当前位置: 首页 > news >正文

顶会新宠!KAN-LSTM完美融合新方案

2024深度学习发论文&模型涨点之——KAN+LSTM

KAN-LSTM混合预测模型是一种结合了自注意力机制(KAN, Key-attention network)和长短时记忆网络(LSTM)的深度学习模型,主要用于序列数据的预测任务,如时间序列分析、自然语言处理等。

KAN-LSTM混合模型的优势在于,KAN提供了全局视角,而LSTM则专注于捕捉局部序列中的有用信息,两者的结合能够提升模型对序列数据的理解和预测能力。通过将KAN的输出作为LSTM的输入,模型能够更有效地整合全局上下文信息和局部细节,从而提高预测的准确性和可靠性。

因为KAN是新提出的模型,这个方向现在也不是很卷,是个很好的发文方向。

我整理了一些KAN+LSTM【论文+代码】合集,需要的同学公人人人号【AI创新工场】自取。

论文精选

论文1:

Core Temperature Estimation of Lithium-Ion Batteries Using Long Short-Term Memory (LSTM) Network and Kolmogorov-Arnold Network (KAN)

利用长短期记忆(LSTM)网络和Kolmogorov-Arnold网络(KAN)估算锂离子电池的核心温度

方法

  • LSTM网络:提出了使用基本操作参数(如电压、电流和环境温度)来估算锂离子电池的表面和核心温度的LSTM网络架构。

  • KAN网络:介绍了一种基于数据驱动的深度学习方法KAN,用于估算锂离子电池的核心和表面温度,而不依赖于表面温度作为神经网络的反馈。

图片

创新点

  • KAN网络的引入:通过KAN网络,能够在不需要物理表面温度传感器的情况下,准确预测电池的内部和表面温度,降低了电池管理系统(BMS)的成本和线路复杂性。

  • 性能提升:实验验证显示KAN在估算核心温度时误差为0.5°C,计算成本为2.9ms至3.2ms,相较于传统方法在计算效率和准确性上都有显著提升。

  • 适应性和准确性:KAN模型不仅能够适应操作条件的变化,保持电池整个生命周期内的准确性,而且计算成本保持在可接受的范围内,适合于车载BMS和基于云的数字孪生BMS使用。

图片

论文2:

Deep state space recurrent neural networks for time series forecasting

深度状态空间递归神经网络用于时间序列预测

方法

  • 状态空间模型与RNN结合:提出了将计量经济学状态空间模型的原理与递归神经网络(RNN)的动态能力相结合的新型神经网络框架。

  • LSTM、GRU和TKAN:提出了使用长短期记忆(LSTM)、门控残差单元(GRU)和时间Kolmogorov-Arnold网络(TKAN)的状态空间模型。

图片

创新点

  • TKAN网络的提出:TKAN网络在Kolmogorov-Arnold网络(KAN)和LSTM的启发下展现出有希望的结果,特别是在时间序列预测方面。

  • 状态切换模型:通过引入隐藏的状态切换机制,模型能够根据某些可观察的协变量随时间变化的转换概率,增强了对市场不同状态(如牛市或熊市)的适应性和预测能力。

  • 性能提升:TKAN在模拟实验中展现出比LSTM和GRU更优越的性能,特别是在处理复杂非线性关系时,尽管计算复杂度和时间较高,但其预测能力和灵活性的提高是显著的

图片

论文3:

Model Comparisons: XNet Outperforms KAN

模型比较:XNet优于KAN

方法

  • XNet算法:探索了一种新型算法XNet,该算法采用复值柯西积分公式,提供了超越传统多层感知器(MLPs)和Kolmogorov-Arnold网络(KANs)的优越网络架构。

  • 柯西激活函数:XNet利用柯西核作为基函数,与KAN使用的B样条基函数形成对比。

图片

创新点

  • 函数逼近能力提升:XNet在处理Heaviside步函数和复杂高维场景时展现出比KAN更优越的性能,尤其在局部数据段的逼近上,XNet的均方误差(MSE)比KAN小1000倍。

  • 物理信息神经网络(PINN)中的优越性:在Poisson方程的基准测试中,XNet在物理信息神经网络(PINN)框架内的效率和准确性显著超过MLP和KAN。

  • 时间序列预测的创新:通过在LSTM架构中用XNet替换传统的前馈神经网络(FNN),引入了XLSTM模型,在时间序列预测实验中,XLSTM在准确性和可靠性方面一致超越了传统的LSTM模型。

图片

论文4:

TKAN: Temporal Kolmogorov-Arnold Networks

TKAN:时序Kolmogorov-Arnold网络

方法

  • 时序Kolmogorov-Arnold网络(TKAN):提出了一种新的神经网络架构,结合了Kolmogorov-Arnold网络(KAN)和长短期记忆网络(LSTM)。

  • 循环Kolmogorov-Arnold网络(RKAN)层:在TKAN中嵌入了记忆管理,以保持短期记忆。

  • 门控机制:通过门控机制管理信息流,决定哪些信息应该被保留或遗忘。

  • B-Spline曲线:使用B-Spline曲线作为1D函数的参数化表示,以学习KAN层中的激活函数。

图片

创新点

  • 结合KAN和LSTM:TKAN结合了KAN和LSTM的优点,提升了多步时间序列预测的准确性和效率,特别是在处理复杂序列模式方面。

  • RKAN层:通过在每个层中嵌入记忆管理,RKAN层能够存储与时间上下文相关的信息,并在处理过程中被网络访问,使网络能够显式学习和利用过去的信息。

  • 性能提升:在多步预测任务中,TKAN相比于传统的LSTM和GRU模型表现出更好的性能,例如在15步预测中,TKAN的R-squared值比GRU高出至少25%,显示出在长期预测中的优势。

  • 模型稳定性:TKAN在多次实验中显示出更好的稳定性,与GRU和LSTM相比,TKAN的性能变化较小,表明其在不同实验间的权重校准更为稳定。

图片

相关文章:

顶会新宠!KAN-LSTM完美融合新方案

2024深度学习发论文&模型涨点之——KANLSTM KAN-LSTM混合预测模型是一种结合了自注意力机制(KAN, Key-attention network)和长短时记忆网络(LSTM)的深度学习模型,主要用于序列数据的预测任务,如时间序…...

JS中对象的浅拷贝,深拷贝和引用

JS中对象的浅拷贝,深拷贝和引用 浅拷贝和深拷贝的区别主要在于它们如何处理引用类型的数据(如数组和对象),而引用简而言之就是换了个变量名。 浅拷贝 引用:浅拷贝只复制对象的第一层属性,对于嵌套的对象或…...

思普企业运营平台 idsCheck Sql注入漏洞复现

0x01 产品描述: ‌思普企业运营平台‌是由贵阳思普信息技术有限公司自主研发的国内首款投融建管营云服务平台——...

FSWIND脉动风-风载时程生成器软件下载、安装及注册

1、软件下载 点击文末超链接下载 2、软件安装 以下操作,若被电脑杀毒软件提示风险,请加入白名单,软件无任何病毒和后台,请放心使用! 1)双击Fswind_setup.exe,启动安装程序 2)、点…...

spring通过RequestContextHolder获取HttpServletRequest对象

1.获取HttpServletRequest对象方法: public static HttpServletRequest getRequest() {ServletRequestAttributes attributes ((ServletRequestAttributes) RequestContextHolder.getRequestAttributes());assert attributes ! null;return attributes.getRequest(…...

STM32编码器接口及编码器测速模板代码

编码器是什么? 编码器是一种将角位移或者角速度转换成一连串电数字脉冲的旋转式传感 器,我们可以通过编码器测量到底位移或者速度信息。编码器从输出数据类型上 分,可以分为增量式编码器和绝对式编码器。 从编码器检测原理上来分&#xff0…...

qt QNetworkAccessManager详解

1、概述 QNetworkAccessManager是QtNetwork模块中的一个核心类,它允许应用程序发送网络请求并接收响应。该类是网络通信的基石,提供了一种方便的方式来处理常见的网络协议,如HTTP、HTTPS等。QNetworkAccessManager对象持有其发送的请求的通用…...

部署 Vue 前端项目到 Linux

看看怎么把一个 Vue 3 项目部署到 Linux 服务器上。准备好你的咖啡,让我们愉快地度过这段部署时光! 前期准备 确保你已经在本地构建了 Vue 3 项目,并生成了 dist 文件夹。 npm run build构建完成后,你将看到一个新鲜出炉的 dis…...

数据分析:探索数据背后的秘密与挑战

在当今这个数据驱动的时代,数据分析已成为各行各业不可或缺的一部分。从市场营销到金融风控,从医疗健康到智能制造,数据分析为企业决策提供了强有力的支持。然而,尽管其重要性日益凸显,数据分析的过程并非一帆风顺&…...

文本域设置高度 加上文字限制并show出来:

文本域设置高度 :rows"4" 加上文字限制并show出来&#xff1a; maxlength"30" show-word-limit 效果: <el-form-item label"产品备注" prop"remark"><el-input v-model"form.remark" type"textarea"…...

深入浅出:Gin框架-简介与API开发入门

深入浅出&#xff1a;Gin框架-简介与API开发入门 引言 Gin框架是基于Go语言的HTTP Web框架&#xff0c;凭借其简单易用、性能卓越和丰富的功能&#xff0c;成为构建高性能Web应用的理想选择。本文将深入浅出地介绍Gin框架的基础知识&#xff0c;并通过一个简单的案例&#xf…...

MySQL各种锁详解

什么是锁&#xff1f; 1.1 锁的解释 计算机协调多个进程或线程并发访问某一资源的机制。 1.2 锁的重要性 在数据库中&#xff0c;除传统计算资源&#xff08;CPU、RAM、I/O等&#xff09;的争抢&#xff0c;数据也是一种供多用户共享的资源。 如何保证数据并发访问的一致性&…...

海外的bug-hunters,不一样的403bypass

一种绕过403的新技术&#xff0c;跟大家分享一下。研究HTTP协议已经有一段时间了。发现HTTP协议的1.0版本可以绕过403。于是开始对lyncdiscover.microsoft.com域做FUZZ并且发现了几个403Forbidden的文件。 &#xff08;访问fsip.svc为403&#xff09; 在经过尝试后&#xff0…...

React 组件中 State 的定义、使用及正确更新方式

​&#x1f308;个人主页&#xff1a;前端青山 &#x1f525;系列专栏&#xff1a;React篇 &#x1f516;人终将被年少不可得之物困其一生 依旧青山,本期给大家带来React篇专栏内容React 组件中 State 的定义、使用及正确更新方式 前言 在 React 应用开发中&#xff0c;state …...

Jenkins 的HTTP Request 插件为什么不能配置Basic认证了

本篇遇到的问题 还是因为Jenkins需要及其所在的OS需要升级&#xff0c;升级策略是在一台新服务器上安装和配置最新版本的Jenkins&#xff0c; 当前的最新版本是&#xff1a; 2.479.2 LTS。 如果需要这个版本的话可以在官方站点下载&#xff0c;也可以到如下地址下载&#xff1…...

8 Bellman Ford算法SPFA

图论 —— 最短路 —— Bellman-Ford 算法与 SPFA_通信网理论基础 分别使用bellman-ford算法和dijkstra算法的应用-CSDN博客 图解Bellman-Ford计算过程以及正确性证明 - 知乎 (zhihu.com) 语雀版本 1 概念 **适用场景&#xff1a;**单源点&#xff0c;可以有负边&#xff0…...

nginx不允许静态文件被post请求显示405 not allowed

在单独站点的配置文件中 添加error_page 405 200 $request_uri; 即可&#xff01;...

【c++笔试强训】(第三十二篇)

目录 数组变换&#xff08;贪⼼位运算&#xff09; 题目解析 讲解算法原理 编写代码 装箱问题&#xff08;动态规划-01背包&#xff09; 题目解析 讲解算法原理 编写代码 数组变换&#xff08;贪⼼位运算&#xff09; 题目解析 1.题目链接&#xff1a;数组变换__牛客网…...

shell脚本实战案例

文章目录 实战第一坑功能说明脚本实现 实战第一坑 实战第一坑&#xff1a;在Windows系统写了一个脚本&#xff0c;比如上面&#xff0c;随后上传到服务&#xff0c;执行会报错 原因&#xff1a; 解决方案&#xff1a;在linux系统touch文件&#xff0c;并通过vim添加内容&…...

OpenCV-图像阈值

简单阈值法 此方法是直截了当的。如果像素值大于阈值&#xff0c;则会被赋为一个值&#xff08;可能为白色&#xff09;&#xff0c;否则会赋为另一个值&#xff08;可能为黑色&#xff09;。使用的函数是 cv.threshold。第一个参数是源图像&#xff0c;它应该是灰度图像。第二…...

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…...

日语学习-日语知识点小记-构建基础-JLPT-N4阶段(33):にする

日语学习-日语知识点小记-构建基础-JLPT-N4阶段(33):にする 1、前言(1)情况说明(2)工程师的信仰2、知识点(1) にする1,接续:名词+にする2,接续:疑问词+にする3,(A)は(B)にする。(2)復習:(1)复习句子(2)ために & ように(3)そう(4)にする3、…...

基于uniapp+WebSocket实现聊天对话、消息监听、消息推送、聊天室等功能,多端兼容

基于 ​UniApp + WebSocket​实现多端兼容的实时通讯系统,涵盖WebSocket连接建立、消息收发机制、多端兼容性配置、消息实时监听等功能,适配​微信小程序、H5、Android、iOS等终端 目录 技术选型分析WebSocket协议优势UniApp跨平台特性WebSocket 基础实现连接管理消息收发连接…...

DAY 47

三、通道注意力 3.1 通道注意力的定义 # 新增&#xff1a;通道注意力模块&#xff08;SE模块&#xff09; class ChannelAttention(nn.Module):"""通道注意力模块(Squeeze-and-Excitation)"""def __init__(self, in_channels, reduction_rat…...

【git】把本地更改提交远程新分支feature_g

创建并切换新分支 git checkout -b feature_g 添加并提交更改 git add . git commit -m “实现图片上传功能” 推送到远程 git push -u origin feature_g...

涂鸦T5AI手搓语音、emoji、otto机器人从入门到实战

“&#x1f916;手搓TuyaAI语音指令 &#x1f60d;秒变表情包大师&#xff0c;让萌系Otto机器人&#x1f525;玩出智能新花样&#xff01;开整&#xff01;” &#x1f916; Otto机器人 → 直接点明主体 手搓TuyaAI语音 → 强调 自主编程/自定义 语音控制&#xff08;TuyaAI…...

ios苹果系统,js 滑动屏幕、锚定无效

现象&#xff1a;window.addEventListener监听touch无效&#xff0c;划不动屏幕&#xff0c;但是代码逻辑都有执行到。 scrollIntoView也无效。 原因&#xff1a;这是因为 iOS 的触摸事件处理机制和 touch-action: none 的设置有关。ios有太多得交互动作&#xff0c;从而会影响…...

AspectJ 在 Android 中的完整使用指南

一、环境配置&#xff08;Gradle 7.0 适配&#xff09; 1. 项目级 build.gradle // 注意&#xff1a;沪江插件已停更&#xff0c;推荐官方兼容方案 buildscript {dependencies {classpath org.aspectj:aspectjtools:1.9.9.1 // AspectJ 工具} } 2. 模块级 build.gradle plu…...

虚拟电厂发展三大趋势:市场化、技术主导、车网互联

市场化&#xff1a;从政策驱动到多元盈利 政策全面赋能 2025年4月&#xff0c;国家发改委、能源局发布《关于加快推进虚拟电厂发展的指导意见》&#xff0c;首次明确虚拟电厂为“独立市场主体”&#xff0c;提出硬性目标&#xff1a;2027年全国调节能力≥2000万千瓦&#xff0…...

关于uniapp展示PDF的解决方案

在 UniApp 的 H5 环境中使用 pdf-vue3 组件可以实现完整的 PDF 预览功能。以下是详细实现步骤和注意事项&#xff1a; 一、安装依赖 安装 pdf-vue3 和 PDF.js 核心库&#xff1a; npm install pdf-vue3 pdfjs-dist二、基本使用示例 <template><view class"con…...