DMRl-Former用于工业过程预测建模和关键样本分析的数据模式相关可解释Transformer网络
DMRl-Former用于工业过程预测建模和关键样本分析的数据模式相关可解释Transformer网络
Liu, Diju, et al. “Data mode related interpretable transformer network for predictive modeling and key sample analysis in industrial processes.” IEEE Transactions on Industrial Informatics 19.9 (2022): 9325-9336.
文章目录
- DMRl-Former用于工业过程预测建模和关键样本分析的数据模式相关可解释Transformer网络
- 摘要
- 绪论
- 创新点
- 方法
- 工业应用
摘要
准确预测难以测量的质量变量对于工业过程控制和优化至关重要。然而,原材料质量和生产条件的波动可能会导致工业过程数据在多种工作条件下分布。
在相同工作条件下的数据显示出相似的特征,这些特征通常被定义为一种数据模式。因此,整个过程数据表现出多模式特性,这给开发统一的预测模型带来了巨大的挑战。
此外,现有数据驱动预测模型的不可解释性给其实际应用带来了很大的阻力。
为了解决这些问题,本文提出了一种新的与模式相关的可解释Transformer网络(DMRl-Former),用于工业过程中的预测建模和关键样本分析。
在DMRl-Former中,设计了一种新的数据模式相关的可解释自注意机制,以提高每个个体对同模的感知能力,同时捕捉不同模式的跨模特征。
绪论
在碳达峰和碳中和的背景下,工业过程迫切寻求智能化转型升级,过程的实时监控、控制和优化是最重要的任务之一
关键质量变量的实时测量是工业制造状态的最有效反映,不幸的是,由于测量技术和工业环境的限制,大多数质量变量无法及时测量
随着时间的推移,使用易于测量的过程变量预测难以测量的质量变量的软测量技术应运而生
- 就是用工业生产中容易采集的数据去预测难以采集的数据
在实际工业过程中应用数据驱动方法仍有三个关键问题需要解决。
首先,现有的数据驱动模型大多假设数据是单模分布的。在构建实际工业过程的预测模型时,有必要考虑数据的多模特性。
其次,大多数现有的数据驱动模型都是不可解释的,即大多数数据驱动模型都难以实现最基本的可解释性。
第三个问题是,大多数模型基于输入数据进行单步预测。然而,在实际工业过程中,对时间序列数据进行多步预测的需求同样迫切
创新点
本文的主要贡献如下。
1) 提出了一种基于Transformer的新型网络DMRFormer,用于精确预测关键质量变量和对模型过程进行可解释分析。
2) 传统的自我注意机制被增强为数据模式相关的可解释自我注意机制(DMRI-SA),以充分提取数据模式信息。
3) 同模注意旨在描述每个单独模式中样本的相似性,交叉模式注意旨在捕捉不同模式样本之间的相互作用。
4) 可视化技术通过发现不同模式层的作用机制并将密钥样本定位在不同模式集中来提高模型的可解释性。
5) 与其他最先进的方法相比,两个工业过程的实验结果验证了所提出方法的有效性。
方法
- 自注意力不再赘述,一点改进都没有
与数据模式相关的可解释自我注意机制
在工业过程中,属于同一模式的数据具有很高的相关性。此外,相邻模式之间也存在一定的相互作用。
为了充分提取同一模式内的相关性,并考虑过程数据不同模式之间的相互作用,本文提出了一种与数据模式相关的可解释自我注意(DMRI-SA)策略。
DMRI-SA的概念图如图3所示,由模式聚类、同模式注意和跨模式注意组成。
首先,对数据进行聚类以获得数据模式标签。由于收集到的工业过程数据没有数据模式标签,因此使用无监督聚类方法根据数据特征为样本分配数据模式标签。
在这项研究中,K-means方法被用来对过程数据进行聚类,以获得其数据模式标签。
其次,利用获取的数据模式标签进行同模注意。
第三,在跨模式注意力中,考虑了不同数据模式之间的相互作用,以避免仅通过测量同一注意力而造成的信息损失。
在DMRI-SA中,交叉模式注意力被设计为一个可选步骤,由每个模式的大小决定。这主要是因为当一个模式中的数据量足够时,跨模式注意力可能会增加计算复杂性,而同模式注意力可以充分表征每个模式。
值得注意的是,DMRI-SA为关键模式样本的定位提供了一种具有良好可视化和解释意义的新方法。根据上述描述,在DMRI-SA中提取样本模式信息的方法是通过使用查询样本和所有样本键之间的点积相似度作为权重来聚合所有样本信息。
数据模式相关的可解释Transformer
为了充分探索数据模式内部和之间的特征,将提出的DMRI-SA引入传统的转换器中,以取代自注意力,构建一个新的DMRIFormer网络。
DMRl-基于前体的软测量建模
所提出的DMRI-Former网络可以分层提取每种模式的相关性,并充分考虑不同模式之间的相互作用。
同时,可量化的注意力得分提高了建模过程的可解释性,为确定关键模式样本提供了新的思路。
因此,它非常适合工业过程的软测量建模,特别是由于操作条件变化而具有多模特性的过程数据。
它主要通过以下步骤。首先,从工业过程中收集的数据分为训练数据和测试数据。
分类模型用于通过属于无监督学习的无监督聚类算法标记所有未标记训练数据的模式类。
接下来,利用滑动窗口技术,使用相应的标记模式选择编码器和解码器的输入数据。之后,将样本输入DMRI Former模型以预测关键质量变量。随后,通过属于监督学习的反向传播算法,利用标记数据值和预测数据值之间的误差来构建损失函数,以更新模型参数。最后,将测试数据发送到训练好的DMRI Former模型,以获得关键质量变量的预测结果。
工业应用
本节对所提出的DMRI Former网络在工业脱丁烷塔工艺和加氢裂化工艺中进行了实验模拟。
A.脱丁烷塔
脱丁烷塔是一种用于分离C3、C4和其他馏分的精炼工艺,其中C4从塔底抽出。其流程图如图6所示。脱丁烷塔的整个系统由六个主要部分组成,包括换热器、塔顶冷凝器、塔上再沸器、扬程回流泵、液化石油气分离器的进料泵和回流储罐。整个系统的高效运行在很大程度上取决于C4成分的实时测量。然而,由于测量环境的限制,C4的测量目前依赖于塔顶的单个气体探测器。这样,不仅检测精度非常有限,而且检测延迟也很大。因此,构建一个软测量模型来预测脱丁烷塔过程中的C4是必要和紧迫的。如图6中的灰色圆圈所示,选择了七个用于全过程分析的常用辅助变量来构建软传感器模型。
值得注意的是,选择较大的滑动窗口长度编码器和较小的滑动窗口长解码器可以同时保持最佳性能和最小的计算工作量。表III显示了具有最佳超参数组合的八种方法的实验结果。从表III的实验结果可以看出,PCR的预测结果较差。这主要是因为PCR是一种静态方法,无法捕捉序列的动态转换模式。虽然LSTNet和SLSTM可以利用LSTM的递归结构来提取时间序列的变化模式,但当数据模式不同时,它们无法感知不同的进化模式。因此,他们的预测结果仍然表现不佳。STALSTM结合时空注意力在一定程度上解决了这个问题,但由于其捕获远程特征的能力有限,其预测性能仍然不是最优的。此外,随着预测长度的增加,Informer的性能急剧下降。这主要是因为Informer的ProbSparse自关注机制只考虑了少量的历史样本,导致多模式数据集中的信息大量丢失。mvts变换器利用随机掩码预训练使模型能够感知序列的整体特征。但它仍然缺乏感知动态模式的能力,导致其性能欠佳。相比之下,LogTrans的预测性能优于其他方法,但仍不如DMRI Former。这主要是因为LogTrans在计算注意力时考虑了多个最近邻样本,这在一定程度上增加了同一模式样本之间的相似性,削弱了不同模式之间的相似度。从所有实验结果和分析来看,所提出的DMRI形式在所有方法中具有最佳的预测性能。这主要是因为DMRI Former考虑了相同模式之间的相似性和不同模式之间的相互作用。通过这种方式,它提高了从数据中提取更有价值信息的能力,同时避免了信息丢失。
果和分析来看,所提出的DMRI形式在所有方法中具有最佳的预测性能。这主要是因为DMRI Former考虑了相同模式之间的相似性和不同模式之间的相互作用。通过这种方式,它提高了从数据中提取更有价值信息的能力,同时避免了信息丢失。
相关文章:

DMRl-Former用于工业过程预测建模和关键样本分析的数据模式相关可解释Transformer网络
DMRl-Former用于工业过程预测建模和关键样本分析的数据模式相关可解释Transformer网络 Liu, Diju, et al. “Data mode related interpretable transformer network for predictive modeling and key sample analysis in industrial processes.” IEEE Transactions on Indust…...

向量模型Jina Embedding: 从v1到v3论文笔记
文章目录 Jina Embedding: 从v1到v3Jina Embedding v1数据集准备训练过程 Jina Embedding v2预训练修改版BERT在文本对上微调在Hard Negatives上微调 Jina Embedding v2 双语言预训练修改版BERT在文本对上微调用多任务目标微调 Jina Embedding v3预训练在文本对上微调训练任务相…...

Spring学习笔记(一)
一 、Spring概述 (一)Spring是什么 Spring是一个分层的Java SE/EE full-stack(一站式)轻量级开源框架,以 IoC(Inverse Of Control:反转控制)和 AOP(Aspect Oriented Programming:面…...
Java编程基础
Java是一种广泛使用的编程语言,以其跨平台兼容性、面向对象的特性和健壮的安全性而闻名。本篇文章将带你了解Java编程的基础知识。 Java简介 Java是由Sun Microsystems(现在是Oracle Corporation的一部分)在1995年发布的。它是一种静态类型…...

C++【string类,模拟实现string类】
🌟个人主页:落叶 🌟当前专栏: C专栏 目录 为什么学习string类 C语言中的字符串 标准库中的string类 auto和范围for auto关键字 迭代器 范围for string类的常用接口说明和使用 1. string类对象的常见构造 2.string类对象的容量操作 3…...

Jupyter lab 打开时默认使用 Notebook 而不是浏览器
Jupyter lab 打开时默认使用 Notebook 而不是浏览器 正文 正文 今天遇到了一个特别有意思的事情,这里我们以 Windows \textrm{Windows} Windows 系统举例。 我们知道通常我们需要使用如下代码在 Terminal \textrm{Terminal} Terminal 中打开 Jupyter lab \textr…...
【linux】ubunda repo是什么
Ubuntu repo(repository,简称repo)是一个软件仓库,它是存储和分发软件包的服务器或一组服务器。通俗地说,Ubuntu repo就像一个巨大的在线软件商店,用户可以从中下载和安装各种软件。 主要特点 软件集合&a…...

【MySQL】深层理解索引及特性(重点)--下(12)
索引(重点) 1. 索引的作用2. 索引操作2.1 主键索引2.1.1 主键索引的特点2.1.2 创建主键索引 2.2 唯一键索引2.2.1 唯一键索引的特点2.2.2 唯一索引的创建 2.3 普通索引2.3.1 普通索引的特点2.3.2 普通索引的创建 2.4 全文索引2.4.1 全文索引的作用2.4.2 …...

无人机声学侦测算法详解!
一、算法原理 无人机在飞行过程中,其电机工作、旋翼震动以及气流扰动等都会产生一定程度的噪声。这些噪声具有独特的声学特征,如频率范围、时域和频域特性等,可以用于无人机的检测与识别。声学侦测算法利用这些特征,通过一系列步…...
git 提交仓库
创建 git 仓库: mkdir pySoundImage cd pySoundImage git init touch README.md git add README.md git commit -m “first commit” git remote add origin https://gitee.com/hunan-co-changsha-branch/pytest.git git push -u origin master 已有仓库ÿ…...

基于大语言模型(LLM)自主Agent 智能体综述
近年来,LLM(Large Language Model)取得了显著成功,并显示出了达到人类智能的巨大潜力。基于这种能力,使用LLM作为中央控制器来构建自助Agent,以获得类人决策能力。 Autonomous agents 又被称为智能体、Agent。指能够通过感知周围环境、进行规划以及执行动作来完成既定任务。…...
使用命令行管理 Windows 环境变量
1. 使用命令提示符 (CMD) 1.1. 设置环境变量 添加或修改临时环境变量(当前会话有效) set MY_VARvalue添加或修改用户环境变量 setx MY_VAR "value"添加或修改系统环境变量(需要管理员权限): setx /M MY…...

AUTODL配置百度网盘数据传输
AUTODL使用 1.配置百度网盘开放平台 2.接入并创建应用 3.创建应用 4.添加授权...
LeetCode46. 全排列(2024秋季每日一题 57)
给定一个不含重复数字的数组 nums ,返回其 所有可能的全排列 。你可以 按任意顺序 返回答案。 示例 1: 输入:nums [1,2,3] 输出:[[1,2,3],[1,3,2],[2,1,3],[2,3,1],[3,1,2],[3,2,1]] 示例 2: 输入:nums …...

SpringBoot新闻稿件管理系统:架构与实现
3系统分析 3.1可行性分析 通过对本新闻稿件管理系统实行的目的初步调查和分析,提出可行性方案并对其一一进行论证。我们在这里主要从技术可行性、经济可行性、操作可行性等方面进行分析。 3.1.1技术可行性 本新闻稿件管理系统采用SSM框架,JAVA作为开发语…...
MinIO讲解和java应用案例示范
一、MinIO 基本概念 1.1 什么是 MinIO? MinIO 是一个高性能的对象存储服务器,专为云原生应用设计。它支持 Amazon S3 API,因此可以与现有的 S3 客户端和工具集成。MinIO 主要用于存储非结构化数据,如图片、视频、备份文件和日志…...
区块链技术与应用 【全国职业院校技能大赛国赛题目解析】第1套 区块链系统设计与运维部分
模块一:区块链产品方案设计及系统运维(35分) 选手完成本模块的任务后,将任务中设计结果、运行代码、运行结果等截图粘贴至客户端桌面【区块链技术应用赛\重命名为工位号\模块一提交结果.docx】中对应的任务序号下。 前述: 我们收到答案后,将针对比赛的答案和样题进行解…...

yaml文件编写
Kubernetes 支持YAML和JSON格式管理资源 JSON 格式:主要用于 api 接口之间消息的传递 YAML 格式;用于配置和管理,YAML是一种简洁的非标记性语言,内容格式人性化容易读懂 一,yaml语法格式 1.1 基本语法规则 使用空格进行缩进(不使用制表符࿰…...

TOEIC 词汇专题:娱乐休闲篇
TOEIC 词汇专题:娱乐休闲篇 在娱乐和休闲活动中,我们会接触到许多特定的词汇。这些词汇涉及到活动入场、观众互动、评论等各个方面,帮助你在相关场景中更加自如。 1. 入场和观众 一些常用词汇帮助你轻松应对观众与入场管理相关的场景&#…...
驱动TFT-1.44寸屏(ST7735)显示器
目录 一、驱动芯片介绍 二、驱动方式 三、主函数main运行 四、完整代码下载 TFT1.44寸屏,搭配ST7735驱动芯片,是一种专为小型电子设备设计的彩色液晶显示解决方案。该屏幕采用薄膜晶体管(TFT)技术,能够实现高亮度、…...

网络编程(Modbus进阶)
思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…...

智慧工地云平台源码,基于微服务架构+Java+Spring Cloud +UniApp +MySql
智慧工地管理云平台系统,智慧工地全套源码,java版智慧工地源码,支持PC端、大屏端、移动端。 智慧工地聚焦建筑行业的市场需求,提供“平台网络终端”的整体解决方案,提供劳务管理、视频管理、智能监测、绿色施工、安全管…...
蓝桥杯 冶炼金属
原题目链接 🔧 冶炼金属转换率推测题解 📜 原题描述 小蓝有一个神奇的炉子用于将普通金属 O O O 冶炼成为一种特殊金属 X X X。这个炉子有一个属性叫转换率 V V V,是一个正整数,表示每 V V V 个普通金属 O O O 可以冶炼出 …...

保姆级教程:在无网络无显卡的Windows电脑的vscode本地部署deepseek
文章目录 1 前言2 部署流程2.1 准备工作2.2 Ollama2.2.1 使用有网络的电脑下载Ollama2.2.2 安装Ollama(有网络的电脑)2.2.3 安装Ollama(无网络的电脑)2.2.4 安装验证2.2.5 修改大模型安装位置2.2.6 下载Deepseek模型 2.3 将deepse…...
MySQL 索引底层结构揭秘:B-Tree 与 B+Tree 的区别与应用
文章目录 一、背景知识:什么是 B-Tree 和 BTree? B-Tree(平衡多路查找树) BTree(B-Tree 的变种) 二、结构对比:一张图看懂 三、为什么 MySQL InnoDB 选择 BTree? 1. 范围查询更快 2…...
Kafka主题运维全指南:从基础配置到故障处理
#作者:张桐瑞 文章目录 主题日常管理1. 修改主题分区。2. 修改主题级别参数。3. 变更副本数。4. 修改主题限速。5.主题分区迁移。6. 常见主题错误处理常见错误1:主题删除失败。常见错误2:__consumer_offsets占用太多的磁盘。 主题日常管理 …...
在Spring Boot中集成RabbitMQ的完整指南
前言 在现代微服务架构中,消息队列(Message Queue)是实现异步通信、解耦系统组件的重要工具。RabbitMQ 是一个流行的消息中间件,支持多种消息协议,具有高可靠性和可扩展性。 本博客将详细介绍如何在 Spring Boot 项目…...

20250609在荣品的PRO-RK3566开发板的Android13下解决串口可以执行命令但是脚本执行命令异常的问题
20250609在荣品的PRO-RK3566开发板的Android13下解决串口可以执行命令但是脚本执行命令异常的问题 2025/6/9 20:54 缘起,为了跨网段推流,千辛万苦配置好了网络参数。 但是命令iptables -t filter -F tetherctrl_FORWARD可以在调试串口/DEBUG口正确执行。…...
MeanFlow:何凯明新作,单步去噪图像生成新SOTA
1.简介 这篇文章介绍了一种名为MeanFlow的新型生成模型框架,旨在通过单步生成过程高效地将先验分布转换为数据分布。文章的核心创新在于引入了平均速度的概念,这一概念的引入使得模型能够通过单次函数评估完成从先验分布到数据分布的转换,显…...

【Linux】使用1Panel 面板让服务器定时自动执行任务
服务器就是一台24小时开机的主机,相比自己家中不定时开关机的主机更适合完成定时任务,例如下载资源、备份上传,或者登录某个网站执行一些操作,只需要编写 脚本,然后让服务器定时来执行这个脚本就可以。 有很多方法实现…...