当前位置: 首页 > news >正文

DMRl-Former用于工业过程预测建模和关键样本分析的数据模式相关可解释Transformer网络

DMRl-Former用于工业过程预测建模和关键样本分析的数据模式相关可解释Transformer网络

Liu, Diju, et al. “Data mode related interpretable transformer network for predictive modeling and key sample analysis in industrial processes.” IEEE Transactions on Industrial Informatics 19.9 (2022): 9325-9336.

文章目录

    • DMRl-Former用于工业过程预测建模和关键样本分析的数据模式相关可解释Transformer网络
    • 摘要
    • 绪论
    • 创新点
    • 方法
    • 工业应用

摘要

准确预测难以测量的质量变量对于工业过程控制和优化至关重要。然而,原材料质量和生产条件的波动可能会导致工业过程数据在多种工作条件下分布。

在相同工作条件下的数据显示出相似的特征,这些特征通常被定义为一种数据模式。因此,整个过程数据表现出多模式特性,这给开发统一的预测模型带来了巨大的挑战。

此外,现有数据驱动预测模型的不可解释性给其实际应用带来了很大的阻力。

为了解决这些问题,本文提出了一种新的与模式相关的可解释Transformer网络(DMRl-Former),用于工业过程中的预测建模和关键样本分析。

在DMRl-Former中,设计了一种新的数据模式相关的可解释自注意机制,以提高每个个体对同模的感知能力,同时捕捉不同模式的跨模特征。

绪论

在碳达峰和碳中和的背景下,工业过程迫切寻求智能化转型升级,过程的实时监控、控制和优化是最重要的任务之一

关键质量变量的实时测量是工业制造状态的最有效反映,不幸的是,由于测量技术和工业环境的限制,大多数质量变量无法及时测量

随着时间的推移,使用易于测量的过程变量预测难以测量的质量变量的软测量技术应运而生

  • 就是用工业生产中容易采集的数据去预测难以采集的数据

在实际工业过程中应用数据驱动方法仍有三个关键问题需要解决。

首先,现有的数据驱动模型大多假设数据是单模分布的。在构建实际工业过程的预测模型时,有必要考虑数据的多模特性。

其次,大多数现有的数据驱动模型都是不可解释的,即大多数数据驱动模型都难以实现最基本的可解释性。

第三个问题是,大多数模型基于输入数据进行单步预测。然而,在实际工业过程中,对时间序列数据进行多步预测的需求同样迫切

创新点

本文的主要贡献如下。

1) 提出了一种基于Transformer的新型网络DMRFormer,用于精确预测关键质量变量和对模型过程进行可解释分析。

2) 传统的自我注意机制被增强为数据模式相关的可解释自我注意机制(DMRI-SA),以充分提取数据模式信息。

3) 同模注意旨在描述每个单独模式中样本的相似性,交叉模式注意旨在捕捉不同模式样本之间的相互作用。

4) 可视化技术通过发现不同模式层的作用机制并将密钥样本定位在不同模式集中来提高模型的可解释性。

5) 与其他最先进的方法相比,两个工业过程的实验结果验证了所提出方法的有效性。

方法

  • 自注意力不再赘述,一点改进都没有

image-20241105172830666

image-20241105172901842

与数据模式相关的可解释自我注意机制

在工业过程中,属于同一模式的数据具有很高的相关性。此外,相邻模式之间也存在一定的相互作用。

为了充分提取同一模式内的相关性,并考虑过程数据不同模式之间的相互作用,本文提出了一种与数据模式相关的可解释自我注意(DMRI-SA)策略。

DMRI-SA的概念图如图3所示,由模式聚类、同模式注意和跨模式注意组成。

image-20241105172915411

首先,对数据进行聚类以获得数据模式标签。由于收集到的工业过程数据没有数据模式标签,因此使用无监督聚类方法根据数据特征为样本分配数据模式标签。

在这项研究中,K-means方法被用来对过程数据进行聚类,以获得其数据模式标签。

其次,利用获取的数据模式标签进行同模注意。

第三,在跨模式注意力中,考虑了不同数据模式之间的相互作用,以避免仅通过测量同一注意力而造成的信息损失。

在DMRI-SA中,交叉模式注意力被设计为一个可选步骤,由每个模式的大小决定。这主要是因为当一个模式中的数据量足够时,跨模式注意力可能会增加计算复杂性,而同模式注意力可以充分表征每个模式。

值得注意的是,DMRI-SA为关键模式样本的定位提供了一种具有良好可视化和解释意义的新方法。根据上述描述,在DMRI-SA中提取样本模式信息的方法是通过使用查询样本和所有样本键之间的点积相似度作为权重来聚合所有样本信息。

数据模式相关的可解释Transformer

为了充分探索数据模式内部和之间的特征,将提出的DMRI-SA引入传统的转换器中,以取代自注意力,构建一个新的DMRIFormer网络。

image-20241105173709567

DMRl-基于前体的软测量建模

所提出的DMRI-Former网络可以分层提取每种模式的相关性,并充分考虑不同模式之间的相互作用。

同时,可量化的注意力得分提高了建模过程的可解释性,为确定关键模式样本提供了新的思路。

因此,它非常适合工业过程的软测量建模,特别是由于操作条件变化而具有多模特性的过程数据。

它主要通过以下步骤。首先,从工业过程中收集的数据分为训练数据和测试数据。

分类模型用于通过属于无监督学习的无监督聚类算法标记所有未标记训练数据的模式类。

接下来,利用滑动窗口技术,使用相应的标记模式选择编码器和解码器的输入数据。之后,将样本输入DMRI Former模型以预测关键质量变量。随后,通过属于监督学习的反向传播算法,利用标记数据值和预测数据值之间的误差来构建损失函数,以更新模型参数。最后,将测试数据发送到训练好的DMRI Former模型,以获得关键质量变量的预测结果。

image-20241105173751331

工业应用

本节对所提出的DMRI Former网络在工业脱丁烷塔工艺和加氢裂化工艺中进行了实验模拟。

A.脱丁烷塔

脱丁烷塔是一种用于分离C3、C4和其他馏分的精炼工艺,其中C4从塔底抽出。其流程图如图6所示。脱丁烷塔的整个系统由六个主要部分组成,包括换热器、塔顶冷凝器、塔上再沸器、扬程回流泵、液化石油气分离器的进料泵和回流储罐。整个系统的高效运行在很大程度上取决于C4成分的实时测量。然而,由于测量环境的限制,C4的测量目前依赖于塔顶的单个气体探测器。这样,不仅检测精度非常有限,而且检测延迟也很大。因此,构建一个软测量模型来预测脱丁烷塔过程中的C4是必要和紧迫的。如图6中的灰色圆圈所示,选择了七个用于全过程分析的常用辅助变量来构建软传感器模型。

image-20241105175929501

值得注意的是,选择较大的滑动窗口长度编码器和较小的滑动窗口长解码器可以同时保持最佳性能和最小的计算工作量。表III显示了具有最佳超参数组合的八种方法的实验结果。从表III的实验结果可以看出,PCR的预测结果较差。这主要是因为PCR是一种静态方法,无法捕捉序列的动态转换模式。虽然LSTNet和SLSTM可以利用LSTM的递归结构来提取时间序列的变化模式,但当数据模式不同时,它们无法感知不同的进化模式。因此,他们的预测结果仍然表现不佳。STALSTM结合时空注意力在一定程度上解决了这个问题,但由于其捕获远程特征的能力有限,其预测性能仍然不是最优的。此外,随着预测长度的增加,Informer的性能急剧下降。这主要是因为Informer的ProbSparse自关注机制只考虑了少量的历史样本,导致多模式数据集中的信息大量丢失。mvts变换器利用随机掩码预训练使模型能够感知序列的整体特征。但它仍然缺乏感知动态模式的能力,导致其性能欠佳。相比之下,LogTrans的预测性能优于其他方法,但仍不如DMRI Former。这主要是因为LogTrans在计算注意力时考虑了多个最近邻样本,这在一定程度上增加了同一模式样本之间的相似性,削弱了不同模式之间的相似度。从所有实验结果和分析来看,所提出的DMRI形式在所有方法中具有最佳的预测性能。这主要是因为DMRI Former考虑了相同模式之间的相似性和不同模式之间的相互作用。通过这种方式,它提高了从数据中提取更有价值信息的能力,同时避免了信息丢失。

果和分析来看,所提出的DMRI形式在所有方法中具有最佳的预测性能。这主要是因为DMRI Former考虑了相同模式之间的相似性和不同模式之间的相互作用。通过这种方式,它提高了从数据中提取更有价值信息的能力,同时避免了信息丢失。

image-20241105180024974

相关文章:

DMRl-Former用于工业过程预测建模和关键样本分析的数据模式相关可解释Transformer网络

DMRl-Former用于工业过程预测建模和关键样本分析的数据模式相关可解释Transformer网络 Liu, Diju, et al. “Data mode related interpretable transformer network for predictive modeling and key sample analysis in industrial processes.” IEEE Transactions on Indust…...

向量模型Jina Embedding: 从v1到v3论文笔记

文章目录 Jina Embedding: 从v1到v3Jina Embedding v1数据集准备训练过程 Jina Embedding v2预训练修改版BERT在文本对上微调在Hard Negatives上微调 Jina Embedding v2 双语言预训练修改版BERT在文本对上微调用多任务目标微调 Jina Embedding v3预训练在文本对上微调训练任务相…...

Spring学习笔记(一)

一 、Spring概述 (一)Spring是什么 Spring是一个分层的Java SE/EE full-stack(一站式)轻量级开源框架,以 IoC(Inverse Of Control:反转控制)和 AOP(Aspect Oriented Programming:面…...

Java编程基础

Java是一种广泛使用的编程语言,以其跨平台兼容性、面向对象的特性和健壮的安全性而闻名。本篇文章将带你了解Java编程的基础知识。 Java简介 Java是由Sun Microsystems(现在是Oracle Corporation的一部分)在1995年发布的。它是一种静态类型…...

C++【string类,模拟实现string类】

🌟个人主页:落叶 🌟当前专栏: C专栏 目录 为什么学习string类 C语言中的字符串 标准库中的string类 auto和范围for auto关键字 迭代器 范围for string类的常用接口说明和使用 1. string类对象的常见构造 2.string类对象的容量操作 3…...

Jupyter lab 打开时默认使用 Notebook 而不是浏览器

Jupyter lab 打开时默认使用 Notebook 而不是浏览器 正文 正文 今天遇到了一个特别有意思的事情,这里我们以 Windows \textrm{Windows} Windows 系统举例。 我们知道通常我们需要使用如下代码在 Terminal \textrm{Terminal} Terminal 中打开 Jupyter lab \textr…...

【linux】ubunda repo是什么

Ubuntu repo(repository,简称repo)是一个软件仓库,它是存储和分发软件包的服务器或一组服务器。通俗地说,Ubuntu repo就像一个巨大的在线软件商店,用户可以从中下载和安装各种软件。 主要特点 软件集合&a…...

【MySQL】深层理解索引及特性(重点)--下(12)

索引(重点) 1. 索引的作用2. 索引操作2.1 主键索引2.1.1 主键索引的特点2.1.2 创建主键索引 2.2 唯一键索引2.2.1 唯一键索引的特点2.2.2 唯一索引的创建 2.3 普通索引2.3.1 普通索引的特点2.3.2 普通索引的创建 2.4 全文索引2.4.1 全文索引的作用2.4.2 …...

无人机声学侦测算法详解!

一、算法原理 无人机在飞行过程中,其电机工作、旋翼震动以及气流扰动等都会产生一定程度的噪声。这些噪声具有独特的声学特征,如频率范围、时域和频域特性等,可以用于无人机的检测与识别。声学侦测算法利用这些特征,通过一系列步…...

git 提交仓库

创建 git 仓库: mkdir pySoundImage cd pySoundImage git init touch README.md git add README.md git commit -m “first commit” git remote add origin https://gitee.com/hunan-co-changsha-branch/pytest.git git push -u origin master 已有仓库&#xff…...

基于大语言模型(LLM)自主Agent 智能体综述

近年来,LLM(Large Language Model)取得了显著成功,并显示出了达到人类智能的巨大潜力。基于这种能力,使用LLM作为中央控制器来构建自助Agent,以获得类人决策能力。 Autonomous agents 又被称为智能体、Agent。指能够通过感知周围环境、进行规划以及执行动作来完成既定任务。…...

使用命令行管理 Windows 环境变量

1. 使用命令提示符 (CMD) 1.1. 设置环境变量 添加或修改临时环境变量(当前会话有效) set MY_VARvalue添加或修改用户环境变量 setx MY_VAR "value"添加或修改系统环境变量(需要管理员权限): setx /M MY…...

AUTODL配置百度网盘数据传输

AUTODL使用 1.配置百度网盘开放平台 2.接入并创建应用 3.创建应用 4.添加授权...

LeetCode46. 全排列(2024秋季每日一题 57)

给定一个不含重复数字的数组 nums ,返回其 所有可能的全排列 。你可以 按任意顺序 返回答案。 示例 1: 输入:nums [1,2,3] 输出:[[1,2,3],[1,3,2],[2,1,3],[2,3,1],[3,1,2],[3,2,1]] 示例 2: 输入:nums …...

SpringBoot新闻稿件管理系统:架构与实现

3系统分析 3.1可行性分析 通过对本新闻稿件管理系统实行的目的初步调查和分析,提出可行性方案并对其一一进行论证。我们在这里主要从技术可行性、经济可行性、操作可行性等方面进行分析。 3.1.1技术可行性 本新闻稿件管理系统采用SSM框架,JAVA作为开发语…...

MinIO讲解和java应用案例示范

一、MinIO 基本概念 1.1 什么是 MinIO? MinIO 是一个高性能的对象存储服务器,专为云原生应用设计。它支持 Amazon S3 API,因此可以与现有的 S3 客户端和工具集成。MinIO 主要用于存储非结构化数据,如图片、视频、备份文件和日志…...

区块链技术与应用 【全国职业院校技能大赛国赛题目解析】第1套 区块链系统设计与运维部分

模块一:区块链产品方案设计及系统运维(35分) 选手完成本模块的任务后,将任务中设计结果、运行代码、运行结果等截图粘贴至客户端桌面【区块链技术应用赛\重命名为工位号\模块一提交结果.docx】中对应的任务序号下。 前述: 我们收到答案后,将针对比赛的答案和样题进行解…...

yaml文件编写

Kubernetes 支持YAML和JSON格式管理资源 JSON 格式:主要用于 api 接口之间消息的传递 YAML 格式;用于配置和管理,YAML是一种简洁的非标记性语言,内容格式人性化容易读懂 一,yaml语法格式 1.1 基本语法规则 使用空格进行缩进(不使用制表符&#xff0…...

TOEIC 词汇专题:娱乐休闲篇

TOEIC 词汇专题:娱乐休闲篇 在娱乐和休闲活动中,我们会接触到许多特定的词汇。这些词汇涉及到活动入场、观众互动、评论等各个方面,帮助你在相关场景中更加自如。 1. 入场和观众 一些常用词汇帮助你轻松应对观众与入场管理相关的场景&#…...

驱动TFT-1.44寸屏(ST7735)显示器

目录 一、驱动芯片介绍 二、驱动方式 三、主函数main运行 四、完整代码下载 TFT1.44寸屏,搭配ST7735驱动芯片,是一种专为小型电子设备设计的彩色液晶显示解决方案。该屏幕采用薄膜晶体管(TFT)技术,能够实现高亮度、…...

鸿蒙HarmonyOS NEXT一多适配技术方案

鸿蒙一多是什么 HarmonyOS 系统面向多终端提供了“一次开发,多端部署”(后文中简称为“一多”)的能力,让开发者可以基于一种设计,高效构建多端可运行的应用。 一套代码工程,一次开发上架,多端按…...

golang 中map使用的一些坑

golang 中map使用的一些坑 1、使用map[string]interface{},类型断言[]int失败 接收下游的数据是用json转为map[string]any go a : "{\"a\":\"1\",\"b\":[123]}" var marshal map[string]any json.Unmarshal([]byte(a), &…...

cordova 离线打包Android -Linux

背景 已有 cordova 运行环境的docker镜像; 需要在离线环境下执行 cordova 从创建项目到构建安装包一系列命令,最终生成 apk 文件。 方案 先在有网环境(最好与离线环境的OS一致)走一遍 cordova 创建打包工程、添加插件、添加平…...

【python】OpenCV—findContours(4.3)

文章目录 1、功能描述2、代码实现3、完整代码4、结果展示5、涉及到的库函数5.1、cv2.Canny5.2 cv2.boxPoints 6、参考 1、功能描述 找出图片中的轮廓,拟合轮廓外接椭圆和外接矩阵 2、代码实现 导入必要的库,固定好随机种子 import cv2 as cv import …...

前端通过nginx部署一个本地服务的方法

前端通过nginx部署一个本地服务的方法: 1.下载ngnix nginx 下载完成后解压缩后运行nginx.exe文件 2.打包你的前端项目文件 yarn build 把生成的dist文件复制出来,替换到nginx的html文件下 3.配置conf目录的nginx.conf文件 主要配置server监听 ser…...

Linux:防火墙和selinux对服务的影响

1-1selinux 1-1 SELinux是对程序、文件等权限设置依据的一个内核模块。由于启动网络服务的也是程序,因此刚好也 是能够控制网络服务能否访问系统资源的一道关卡。 1-2 SELinux是通过MAC的方式来控制管理进程,它控制的主体是进程,而目标则是…...

从 vue 源码看问题 — vue 如何进行异步更新?

前言 在上一篇 如何理解 vue 响应式? 中,了解到响应式其实是通过 Observer 类中调用 defineReactive() 即 Object.defineProperty() 方法为每个目标对象的 key(key 对应的 value 为非数组的) 设置 getter 和 setter 实现拦截&…...

【go从零单排】go中的基本数据类型和变量

Don’t worry , just coding! 内耗与overthinking只会削弱你的精力,虚度你的光阴,每天迈出一小步,回头时发现已经走了很远。 基本类型 go中的string、int、folat都可以用连接boolen可以用逻辑表达式计算 package mainimport "fmt&quo…...

标签之文字排版,图片,链接,音视频(HTML) 基础版

目录 标签之文字排版,图片,链接,音视频知识点: 练习题一: 效果: 练习题二: 效果: 标签之文字排版,图片,链接,音视频知识点: 超文本:链接 标记:标签<> 双标签 单标签 <br>//换行 <hr>//水平线 向后tab 向前shifttab html注释<!----> css /**/ …...

基于SpringBoot+Gpt个人健康管家管理系统【提供源码+答辩PPT+参考文档+项目部署】

作者简介&#xff1a;✌CSDN新星计划导师、Java领域优质创作者、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流。✌ 主要内容&#xff1a;&#x1f31f;Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能…...