使用数据分析,识别设备异常
设备健康监测系统在工业领域中扮演着至关重要的角色,它能够帮助企业及时发现设备异常,预防故障,提高设备使用寿命和生产效率。而异常诊断技术则是设备健康监测系统中的核心部分,能够实现对设备异常情况的准确判断。根据设备状态数据判断设备是否出现异常情况的方法。在设备健康监测系统中,异常诊断技术的作用主要体现在及时发现设备异常、提高设备使用寿命、提高生产效率等方面。
传统机理方法在设备健康监测中通常采集设备的振动或旋转历程数据,这些数据中蕴含着设备的工作状态信息。通过数字信号处理技术,我们可以对这些数据进行深入分析,从而识别出可能存在的故障信息。这种技术主要基于振动力学和小波理论,结合数字信号处理中的滤波、频谱分析等技术,对设备的运行状态进行深入的剖析。西安交通大学在这个领域有着深厚的积淀,他们在设备健康监测领域的研究成果被广泛应用到工业实践中。
然而,在工业领域除了振动和旋转类设备外还有许多其他类型的设备,如核电系统、卫星系统等。这些设备或部件往往难以使用数字信号直接表达,从而使得传统的异常诊断技术无法有效识别其异常状态。因此,对于这类设备或部件,我们需要探索新的异常识别方法。例如对于核电系统等复杂的大型设备,异常诊断需要结合多方面的数据来进行综合分析。例如,设备的运行温度、压力、液位等参数,以及设备的运行历史数据等,都可以被用来进行异常诊断。又比如对于大量机械系统中的非旋转和振动的部件,我们可以采用声学监测技术来进行异常诊断。通过收集设备的声波信号,我们可以分析设备的运行状态和故障模式,从而实现对设备异常的准确识别。这种技术具有非侵入性和远程监测的优点,适用于各种类型的设备。
下面,我们简要介绍一般工业设备运行中所感知到的数据的特点,以及如何利用这些数据来进行异常诊断。
首先,我们介绍一般工业设备运行中所感知到的数据的特点。与振动类或旋转类型的设备中所采集的数据相比,这种数据具有以下特点:
-
数据类型多样:振动信号通常以连续的实值表示,而一般设备上的感知数据除包含此类数据外通常还有表示开关状态得布尔量和表示不同挡位或级别得数值量。这意味着我们需要对不同类型的数据进行分类处理和分析。下图给出了不同数据类型在可视化上的差异。
-
数据维度高:振动信号可以通过一个或两个通道的信号数据实现故障识别。而一般工业设备的故障识别往往需要基于大量传感器进行。这使得识别模型的输入维数变得非常高,可能从数十个到数百个不等。因此,在处理这些数据时,我们需要采用降维技术,如主成分分析、线性判别分析等,以降低数据的维度,提高计算效率和准确性。
-
数据分布特殊:一般的振动信号通常具有周期性、平稳性特征。一般工业设备往往不具备这个特征。例如排气管上的压力传感器可能表现为随机脉冲信号,又如某挡位指示器可能长期输出某些状态值,而在偶然情形下输出另一些状态值。因此,我们需要根据不同设备的特性,采用适合的数据处理方法和模型来处理这些特殊分布的数据。
-
数据间相关关系复杂:在一般工业设备上,传感器通常被设计布局为感知多种状态参数,这些状态之间存在的相关性就体现在采集数据的相关关系上。当这种相关关系耦合了设备的不同运行工况及设备故障后,采集数据就会呈现出复杂的相关关系。因此,在处理这些数据时,我们需要考虑数据间的相关性,采用适合的相关性分析方法和模型来挖掘数据间的关系。
总之,一般工业设备的感知数据具有多样性、高维度性、特殊分布性和复杂相关性等特点,这给异常诊断带来了挑战。为了实现准确的异常诊断,我们需要采用适合的数据处理方法和模型来处理这些数据,并结合传统的信号处理和数学方法来提高异常诊断的准确性和可靠性。
除数据特点外,我们也需要了解一般工业系统的设备故障特性以及工况对异常诊断技术的影响。
首先,一般工业系统的设备故障类型多种多样,故障可能产生的部位也十分分散。在振动或旋转类设备的故障诊断中,通常聚焦于应力失效或摩擦面损伤。然而,在一般工业系统中,故障可能涉及的范围更加广泛,包括但不限于失稳、过热、失压、随机碰撞、运动锁死、控制错误等等。这种多样性的故障类型使得我们在构建健康监测系统时,第一步往往是对系统运行状态进行异常识别,并确定异常的发生位置。由于故障类型的多样性,我们无法直接给出明确的故障判定,而是需要通过深入分析来确定具体的故障原因。
其次,一般工业系统的设备工况与设备故障之间存在一定的耦合性。在振动或旋转类设备中,工作状态与设备故障之间的耦合性较小。例如,通过将时域信号结合角速度信息转换为角域信号,研究人员可以在设备的任何转速下获得几乎相同的故障特征数据。然而,在一般工业系统中,特定的故障通常发生在某些特定工况下。比如散热循环管路连接不良导致的泄露可能只发生在设备启用散热功能且水流压力达到某阈值的情形下才发生。因此,在建立一般工业系统的故障诊断系统时,我们必须按照不同工况状态分别处理。下图给出了区分工况对异常识别有影响的一个概念性的示例。可以看到当我们将所有数据归为一类时,异常数据会嵌入到正常数据中难以区分。而在有明确工况区分的情形下异常数据比较容易被识别。当然,对于已经具有标签的数据,这种分隔是容易的,但对于故障率很小的工业数据而言,进行工况区分就非常有必要了。
基于一般工业系统的数据特征与故障特征实际,可以看出通过某一类专用数据特征是难以实现异常识别的。在这种情况下,通常选择基于统计的方法实现这一任务。
思考基于数字信号处理方法的异常识别原理,我们可以看到这种方法通常分为三个阶段:
第一阶段是提升所关注信息的信噪比。在这个阶段,我们通常使用滤波、包络等方法去除数据中存在的噪声。例如,对于振动信号,我们可以使用低通滤波器去除高频噪声,使用包络线提取方法提取信号的包络线,从而突出信号中的周期性成分。这些方法可以帮助我们更好地提取出设备运行时的关键信息,提高信号的信噪比。
第二阶段是使用特定算法从数字信号中提取出能表征运行状态的指标量。这些指标量应该能够反映设备的健康状态,并且可以用于区分正常状态和异常状态。例如,对于旋转轴而言,我们可以通过分析振动信号的峭度来检测转轴上是否存在裂纹。峭度是一个反映信号峰值分布情况的统计量,当转轴存在裂纹时,振动信号的峭度会增大。此外,我们还可以使用其他指标量,如均方根值、波形因子等,来进一步表征设备的运行状态。
第三阶段是将指标量与阈值进行比较,从而判断设备是否发生异常。阈值可以是根据经验值设定的固定值,也可以是根据历史数据计算出的动态值。当指标量超过阈值时,我们就可以认为设备发生了异常。需要注意的是,阈值的设定需要考虑到设备的运行工况和环境因素,以及不同类型的异常情况。因此,在设定阈值时需要进行充分的试验和验证,以确保诊断结果的准确性和可靠性。
综上所述,基于数字信号处理方法的异常识别原理包括三个阶段:提升所关注信息的信噪比、提取表征运行状态的指标量和比较指标量与阈值进行异常判断。当然,在实际应用中,我们需要结合设备的具体情况和实际需求进行选择和优化,以确保异常诊断结果的准确性和可靠性。
美林数据所提供的数据分析工具 Tempo AI 提供了面向信号处理的工作模块,可供用户便利的接入信号数据,并提供大量选项可供用户实现对信号数据的过滤、包络谱构建,以及抽取数据中蕴含的各类特征量。结合 Tempo AI 的其余数据分析工具,用户可以方便的实现基于信号数据的振动或旋转类设备的故障诊断。
- 支持解析wav、txt、csv、dat文件、IoTDB连接信号数据。
- 支持多种数字信号处理方法
- 支持多种面向信号数据的特征工程方法
- 支持信号数据处理与特征提取功能自定义
在该基础上更进一步,我们可以从数据分析的角度借鉴这一方法论,基于统计的一般工业设备异常诊断的方法可以分成以下三个阶段:
第一阶段是提升所关注数据的质量。在这个阶段,我们使用数据清洗和基于统计方法的异常值筛选等技术对数据进行整理。数据清洗主要包括去除重复数据、填补缺失值、平滑噪声数据等操作,以保证数据的完整性和准确性。同时,我们还会使用统计方法的异常值筛选技术,如基于均值和标准差的异常值检测、基于距离的异常值检测等,来识别出数据中的异常值,并进行相应的处理。这些操作有助于提高数据的可信度和准确性,为后续的诊断分析提供可靠的基础。
第二阶段是使用所获取的数据构建概率分布模型。考虑到一般工业设备所具有的多工况特征,需要对不同的工况分别建模,或者使用某种混合模型表达这种多工况的情形。例如,对于一台机器设备,它可能有多种不同的运行状态,如节能运行,怠速运行,满负荷运行等。针对每种状态,我们可以使用不同的概率分布模型进行建模,如正态分布、泊松分布、指数分布等。通过构建这些概率分布模型,我们可以更好地理解设备在不同状态下的数据特征和分布情况,为异常诊断提供依据。
第三阶段是设定统计分布的阈值,并使用得到的概率分布模型对当前指标量进行检验,并依据指标量是否超出阈值判断设备是否发生异常。阈值可以是根据经验值设定的固定值,也可以是根据历史数据计算出的动态值。通过将实际指标量与阈值进行比较,我们可以判断设备是否处于正常状态或者出现了异常情况。此外,我们还可以结合设备的运行特性和历史数据进行分析和建模,以提高异常诊断的准确性和可靠性。
在实际的设备健康监测系统中,异常诊断技术的建模过程还需要考虑以下方面:
首先需要考虑高维数据降维问题。由于设备运行过程中会产生大量数据,这些数据往往具有高维性,使得模型训练变得复杂和计算量大。因此,我们需要采用有效的降维方法,如主成分分析、线性判别分析等,将高维数据降维到低维空间,以简化模型训练和提高计算效率。
其次需要考虑不同数域合并建模问题。在设备健康监测中,我们通常会采集设备的多种状态参数,这些状态参数可能属于不同的数域,如温度、压力、振动等。为了更好地描述设备的整体状态和进行综合诊断,我们需要将这些不同数域的数据进行合并建模,以充分利用它们之间的信息。
最后需要考虑实际工业设备上故障发生概率问题。在建立异常诊断模型时,我们需要考虑不同故障发生的概率和影响程度。通过对不同故障发生概率的评估和分析,我们可以优化模型的训练和调整阈值,以提高异常诊断的准确性和可靠性。
下面以混合概率主成分分析算法为例,对前述思想做一个简要的介绍。
混合概率主成分分析(Mixture of Probabilistic Principal Component Analyzers,MPPCA)是一种统计学和机器学习方法,用于对高维数据进行降维和特征提取。它是对传统的概率主成分分析(Probabilistic Principal Component Analysis,PPCA)的扩展,能够更灵活地处理复杂的数据分布。
在混合概率主成分分析中,假设数据是由多个概率主成分分析模型组成的混合体,每个模型对应一个潜在的数据子集。这样,MPPCA 可以更好地处理数据中的多模态性(即数据中存在多种模式或簇)。MPPCA 的模型可以描述如下:
-
假设有 K 个成分(或模态),每个成分都由一个均值向量和一个协方差矩阵所描述。这些成分可以用高斯分布来建模。
-
每个数据点都由这 K 个成分中的一个生成,生成的成分由一个先验概率分布来决定。
-
数据点在给定其所属成分后,由相应成分的概率主成分分析模型生成。
MPPCA 通过最大化似然函数来进行参数估计,从而确定成分的均值、协方差矩阵、以及成分的先验概率。通常使用期望最大化算法(Expectation-Maximization,EM)来实现参数估计。
MPPCA 的优点之一是它可以有效地处理具有复杂数据结构的情况,例如包含多个簇或模态的数据集。这使得它在许多领域中都有广泛的应用,例如图像处理、生物信息学、模式识别等。作为一篇介绍性材料,这里不对 MPPCA 的数学形式做更多说明。
当在工业设备监测和诊断的场景中面对高维度感知数据时,MPPCA 具有很强的可行性:
-
处理多模态数据分布:许多工业设备的性能参数可能会随着工作状态或环境条件的变化而产生多种模态,例如不同的工作负载、温度、湿度等因素。MPPCA 能够更灵活地处理这种多模态数据分布,通过将数据建模为多个成分的混合体,可以更准确地捕获到不同模态之间的关系。
-
降维和特征提取:高维度数据往往包含了大量冗余信息,降低了数据的可解释性和处理效率。MPPCA 可以将高维度数据映射到一个低维的潜在空间中,从而实现降维和特征提取的目的。这有助于减少计算复杂性,并提升异常检测的准确性。
-
灵活性和适应性:MPPCA 具有较强的模型灵活性,可以适应不同工况下的数据分布变化。它可以通过合适的模型参数来适应不同的工作状态,从而提高了异常检测的鲁棒性。
-
可解释的异常检测能力:MPPCA 可以通过对数据点在潜在空间中的重建误差来评估数据的异常程度。异常数据点通常会导致较大的重建误差,从而可以被有效地检测出来。
简单的说,MPPCA 既能够实现数据的降维,同时也能够将数据有效聚类到数个聚集核心。与混合高斯模型相比,MPPCA 提供了对不同维度数据之间存在相关性的描述方法,下图是使用概率主成分方法对数据进行统计性概括的一个示意。
为示意 MPPCA 算法所执行的功能,我们使用两个各自具有高斯分布的数据表示某设备运行的两种工况。为便于可视化,我们只使用两个维度的感知数据。
如果我们使用一般分类方法如 K-Means,可以看到该数据会以空间分割的方法划分为两个 分类。这并没有体现出设备运行参数的统计分布本质。以图上两个黑色点为例,其显然处于任何一种运行工况的一般分布区间,但使用 K-Means 方法并不能识别出这种数据的异常。
而 MPPCA 方法可以将属于不同工况的数据相对准确的区分。通过准确描述工况的统计分布,异常点可以较为准确的发现。它能够有效的以最精确的高斯分布描述数据。代价是协方差矩阵中非对角线项不为零。
当然,在实际设备健康监测系统构建时并没有万能的通用方法。我们必须基于数据和设备、运行机理的复杂性,必须由经验丰富的工业数据分析人员依据实际情形给出最佳的监测方案。美林数据在 PHM 技术领域深耕多年,很愿意与您在相关领域展开合作,共同研究适合您的异常识别技术。
相关文章:

使用数据分析,识别设备异常
设备健康监测系统在工业领域中扮演着至关重要的角色,它能够帮助企业及时发现设备异常,预防故障,提高设备使用寿命和生产效率。而异常诊断技术则是设备健康监测系统中的核心部分,能够实现对设备异常情况的准确判断。根据设备状态数…...

redis数据倾斜如何解决
Redis数据倾斜主要是由于数据访问热点导致的,通常在执行事务操作或范围查询时发生。这会导致大量数据集中在某个实例上,使得集群负载不均衡。以下是一些解决Redis数据倾斜的方法: 避免在同一个键值对上保存过多的数据。可以将大的键值对拆分…...

ATFX汇市:美联储鲍威尔再发鹰派言论,美元指数逼近106关口
ATFX汇市:11月10日,美联储主席鲍威尔在IMF举办的专家小组会议上讲话称:“如果进一步收紧货币政策变得合适,美联储‘将毫不犹豫地’这样做。”他还提到,对目前通胀进展感到满意,但“还有很长的路要走”。鲍威…...

【异常----finally和自定义异常】
文章目录 finally练习问题 异常的处理流程【异常处理流程总结】自定义异常类 finally 有些特定的代码,不论程序是否发生异常,都需要执行,比如程序中打开的资源:在程序正常或者异常退出时,必须要对资源进进行回收。另外…...

C# OpenCvSharp 环形文字处理 直角坐标与极坐标转换
效果1 效果2 项目 代码 using OpenCvSharp; using System; using System.Drawing; using System.Text; using System.Windows.Forms;namespace OpenCvSharp_Demo {public partial class frmMain : Form{public frmMain(){InitializeComponent();}string fileFilter "*.*…...
计算机视觉与深度学习 | 视频/图像转换及保存播放(Matlab源码)
===================================================== github:https://github.com/MichaelBeechan CSDN:https://blog.csdn.net/u011344545 ===================================================== 视频/图像转换及保存/播放 avi2img.m 功能:将视频转换为单张图片avi2m…...

网格变形算法
网格变形 需求分析技术分析 需求分析 根据几何模型上的几个特征点,对几何模型进行变形。比如 技术分析 把几何模型使用三角面片表示,然后通过网格映射变形进行实现。关于网格这块有本经典的书可以参考,《ploygon mesh processing》。上面…...
2. Spark报错,Task is Failed,errorMsg: FileNotFoundException xxxx
完整报错信息 21304, Task is Failed,errorMsg: FileNotFoundException: File does not exist: hdfs://xxxx-bigdata-nameservice/user/hive/warehouse/edw_ic.db/xxxx/part-00000-c8a718b3-54b3-42de-b36c-d6eedefd2e02-c000.snappy.parquet It is possible the xxx报错场景 …...
Flutter开发实战之上传身份照片并认证
思路 UI视图 上传身份证照片可以选择拍照方式上传,相册选择方式上传即可 身份证照片进行认证功能实现 对身份证照片进行认证,包括正面认证和反面认证即可上传给后端 使用第三方插件 image_picker: ^0.8.4Future<XFile> _getCameraImage() async {final cameraImages = …...
C++文件加密、解密
简介 在计算机科学中,密码学是一种通过编码和解码信息以保护数据安全的技术。C++作为一种通用编程语言,可用于实现各种密码学算法。本文将介绍如何使用C++对文件进行加密和解密。以下是使用C++进行文件加密的示例。 文件加密 在C++中,我们可以使用密码学中的异或(XOR)操作…...

使用Java语言实现基本RS触发器
使用Java语言实现计算机程序来模拟基本RS触发器的工作过程,通过本账号2023年10月17日所发布博客“使用Java语言实现数字电路模拟器”中模拟基本逻辑门组成半加器电路的方法来模拟基本触发器的组成和时间延迟。 1 基本RS触发器电路结构 基本RS触发器(又…...
c++函数指针作为std::map值
遇见一个场景,收到的tcp消息有个OperationID,然后执行具体的任务(函数),在c#中使用Dictionary结合委托一点没问题,c#代码如下: public delegate void TcpHandler();Dictionary<OperateID, Tc…...
data对象内新增属性,console.log()可以打印出来,不重新渲染
原因:受 ES5 的限制,Vue.js 不能检测到对象属性的添加或删除。因为 Vue.js 在初始化实例时将属性转为 getter/setter,所以属性必须在 data 对象上才能让 Vue.js 转换它,才能让它是响应的; data(){newTitle:{title:’…...
React:实现一个定时器计数器,每秒自动+1
需求:实现一个定时器计数器,每秒自动1 import React, { useState, useEffect } from "react";export default function App() {let [count, setCount] useState(0);useEffect(() > {let timer setInterval(() > {setCount(count 1);…...

rocksdb 中 db_bench 的使用方法
硬件要求 硬件要求如表1所示。 表1 硬件要求 项目 说明 CPU 12 * AMD Ryzen 5 5500U with Radeon Graphics 内存 DDR4 磁盘 HDD 软件要求 软件要求如表2所示。 表2 软件要求 项目 版本 说明 下载地址 CentOS 7.6 操作系统。 Download kernel 4.14.0 内核。…...

【前端】TypeScript核心知识点讲解
1.TypeScript简介及入门案例 (1)什么是TypeScript? TypeScript 是 JavaScript 的一个超集,支持 ECMAScript 6 (ES6)标准。 TypeScript 由微软开发的自由和开源的编程语言。 TypeScript 设计目标是开发大…...

【工具推荐】一键多平台文章发布神器推荐(免费)
hello,大家好,我是你们老朋友洛林,上一篇文章说到自己深受多平台手动发布的折磨「传送门」,准备开发一款文章多平台工具,后来联系到 Wechatsync 原作者进行了简单的沟通,下面是关于以后的一些规划ÿ…...

PDF有限制密码,不能复制怎么办?
大家现在接触PDF文件越来越多,有的时候在网上下载的PDF文件打开之后,发现选中文字之后无法复制。甚至其他功能也都无法使用,这是怎么回事?该怎么办? 当我们发现文件打开之后,编辑功能无法使用,很…...
【原创学位论文】基于python和定向爬虫的商品比价系统.docx
基于python和定向爬虫的商品比价系统 Price Comparison System for Products Based on Python and Targeted Web Crawling 目录 目录 2 摘要 3 关键词 3 第一章 绪论 4 1.1 研究背景 4 1.2 研究意义 5 1.3 国内外研究现状 7 1.4 本文主要工作和章节安排 8 第二章 Python基础…...

【Proteus仿真】【STM32单片机】汽车尾灯控制设计
文章目录 一、功能简介二、软件设计三、实验现象联系作者 一、功能简介 本项目使用Proteus8仿真STM32单片机控制器,使用按键、LED模块等。 主要功能: 系统运行后,系统运行后,系统开始运行,K1键控制左转向灯ÿ…...
C# SqlSugar:依赖注入与仓储模式实践
C# SqlSugar:依赖注入与仓储模式实践 在 C# 的应用开发中,数据库操作是必不可少的环节。为了让数据访问层更加简洁、高效且易于维护,许多开发者会选择成熟的 ORM(对象关系映射)框架,SqlSugar 就是其中备受…...

智能仓储的未来:自动化、AI与数据分析如何重塑物流中心
当仓库学会“思考”,物流的终极形态正在诞生 想象这样的场景: 凌晨3点,某物流中心灯火通明却空无一人。AGV机器人集群根据实时订单动态规划路径;AI视觉系统在0.1秒内扫描包裹信息;数字孪生平台正模拟次日峰值流量压力…...

如何在最短时间内提升打ctf(web)的水平?
刚刚刷完2遍 bugku 的 web 题,前来答题。 每个人对刷题理解是不同,有的人是看了writeup就等于刷了,有的人是收藏了writeup就等于刷了,有的人是跟着writeup做了一遍就等于刷了,还有的人是独立思考做了一遍就等于刷了。…...

Android 之 kotlin 语言学习笔记三(Kotlin-Java 互操作)
参考官方文档:https://developer.android.google.cn/kotlin/interop?hlzh-cn 一、Java(供 Kotlin 使用) 1、不得使用硬关键字 不要使用 Kotlin 的任何硬关键字作为方法的名称 或字段。允许使用 Kotlin 的软关键字、修饰符关键字和特殊标识…...

Unity | AmplifyShaderEditor插件基础(第七集:平面波动shader)
目录 一、👋🏻前言 二、😈sinx波动的基本原理 三、😈波动起来 1.sinx节点介绍 2.vertexPosition 3.集成Vector3 a.节点Append b.连起来 4.波动起来 a.波动的原理 b.时间节点 c.sinx的处理 四、🌊波动优化…...
Fabric V2.5 通用溯源系统——增加图片上传与下载功能
fabric-trace项目在发布一年后,部署量已突破1000次,为支持更多场景,现新增支持图片信息上链,本文对图片上传、下载功能代码进行梳理,包含智能合约、后端、前端部分。 一、智能合约修改 为了增加图片信息上链溯源,需要对底层数据结构进行修改,在此对智能合约中的农产品数…...

前端开发者常用网站
Can I use网站:一个查询网页技术兼容性的网站 一个查询网页技术兼容性的网站Can I use:Can I use... Support tables for HTML5, CSS3, etc (查询浏览器对HTML5的支持情况) 权威网站:MDN JavaScript权威网站:JavaScript | MDN...

向量几何的二元性:叉乘模长与内积投影的深层联系
在数学与物理的空间世界中,向量运算构成了理解几何结构的基石。叉乘(外积)与点积(内积)作为向量代数的两大支柱,表面上呈现出截然不同的几何意义与代数形式,却在深层次上揭示了向量间相互作用的…...

内窥镜检查中基于提示的息肉分割|文献速递-深度学习医疗AI最新文献
Title 题目 Prompt-based polyp segmentation during endoscopy 内窥镜检查中基于提示的息肉分割 01 文献速递介绍 以下是对这段英文内容的中文翻译: ### 胃肠道癌症的发病率呈上升趋势,且有年轻化倾向(Bray等人,2018&#x…...
32位寻址与64位寻址
32位寻址与64位寻址 32位寻址是什么? 32位寻址是指计算机的CPU、内存或总线系统使用32位二进制数来标识和访问内存中的存储单元(地址),其核心含义与能力如下: 1. 核心定义 地址位宽:CPU或内存控制器用32位…...