文摘
在本文中,一种新的特征提取方法称为精制复合多尺度全球模糊熵(RCMGFE)提出。根据拟议中的RCMGFE和自组织模糊逻辑分类器(SOF),提出了轴承故障诊断的新方法。首先,原始轴承信号的故障特征提取采用全球模糊熵,提出精制复合材料多尺度构造和断层特征组RCMGFE在此基础上。其次,提取的RCMGFE故障特性集分为离线训练样本集,在线训练样本集,和一个测试样本集。离线训练样本集和在线训练样本集,分别输入到离线训练阶段和在线培训阶段选择代表性样本和SOF的构造模糊规则。然后,测试样本集输入到测试阶段SOF的分类。最后,数据驱动端轴承和风扇端轴承凯斯西储大学提供的用于验证所提出的故障诊断方法的有效性。实验结果表明,与其他方法相比,所提出的故障诊断方法具有更高的分类效果。
1。介绍
旋转机械是大型和重要设备的重要组成部分,是应用于许多工程领域,如电力、化工、机械制造。旋转机械的工作环境直接影响到机械操作的安全与稳定。与此同时,滚动轴承不仅是机械设备的重要组成部分,它也是现代工业加工企业不可或缺的一部分。(1- - - - - -4]。然而,滚动轴承是机械设备的操作条件非常敏感。轴承一般容易失败部分之一,和它的故障占很大比重的机械设备故障。因此,它是非常重要的健康管理和轴承的故障诊断5- - - - - -8]。传统的信号分析包括时域分析、频谱分析、和轴承通常显示了非平稳信号的操作,因此传统的方法不能很好描述这个信号的特点(9- - - - - -13]。因此,国内外学者开发了时频分析方法,如变分模态分解(VMD)在2014年提出,和高度自适应经验模态分解(EMD)黄等人提出的在1988年和奇异谱分解(SSD)。其中,VMD分解效率高和分解速度快,并与模态混叠没有问题。然而,VMD的效果和设置参数有很大的关系,它没有自适应性。除了需要设置参数对EMD和SSD,也有模态混叠的问题和边界效应(14- - - - - -17]。此外,由于操作条件的变化,分析方法如VMD不能准确地找到故障的非线性特征信号,所以他们不能有效反映故障信息(18- - - - - -20.]。
人工智能技术的发展促进了故障诊断学科及其相关研究进入阶段的智能诊断。通常,轴承组件的智能诊断技术的第一步是获取足够的从收集到的原始信号的故障特征信息。同时,自从entropy-based方法可以有效地测量信号的障碍,它可以作为有效的手段来区分信号,它已逐渐成为一个重要的方法,提取故障特征,例如,样本熵(SE)、模糊熵(FE)排列熵(PE),色散熵(DE) [21- - - - - -23]。这些方法的共同缺点是只有一个信号不规则的规模被认为是,它将失去大量的故障信息,所以它可能导致误诊的错。为了弥补这种缺陷,研究人员使用多尺度粗粒度的业务改进它们,然后将它们应用于信号特征提取。近年来相关研究如下:科斯塔et al。24]提出的多尺度熵样本(MSE)和应用的评价心率健康医疗领域。朱et al。25]MFE用于轴承故障诊断中提取故障特征。2005年,阿齐兹和Arif [26)结合粗粒度的更换操作与排列熵提出多尺度熵(MPE)和使用它的检测充血性心力衰竭。Azami在2017年提出的多尺度熵离散(身边),它适用于老年性痴呆的决心,后来被许多学者在轴承故障诊断(27- - - - - -29日]。大量的研究已经证明了模糊熵的计算(FE)是有利的信号混乱。它获得初始向量减去当地的意思是,这只能集中信号的局部特性,不利于准确提取故障信息。因此,全球模糊熵(GFE)提出了30.,31日]。因为GFE只能提取故障特征信息从一个规模,很难准确地识别故障类型,如果是用于获得直接信号中包含的信息。为了弥补这个缺陷GFE计算的,我们把粗粒度的处理技术与全球模糊熵和提出完善复合材料多尺度全球模糊熵(RCMGFE)。故障特征提取后的下一步是使用特性集作为分类的分类器的输入向量。机器学习的研究方向,许多分类算法用于故障诊断。例如,核函数极端学习机(凯尔姆经常),最小二乘支持向量机(LSSVM)和极端学习机(ELM) [32]。
自组织模糊逻辑分类器(SOF)计算成本低,透明的计算过程,容易理解,它不需要提前设置参数(33,34]。我们提出一个新的基于RCMGFE和SOF的故障诊断方法。首先,我们使用RCMGFE获取信号特征,然后将获得的特性集输入SOF分类器。两个基准数据集来自凯斯西储大学(CWRU)用于验证所提出的故障诊断方法的合理性,突出我们的优势提出方法通过比较它与其他方法。
2。拟议中的RCMGFE和SOF
2.1。该精制复合多尺度全球模糊熵
2.1.1。模糊熵
菲是一个参数,计算产生新模式的概率时,尺寸变化(35]。它使用了模糊函数估计两个向量的相似性,有限元的计算步骤如下:(1)公式(1)是用于处理收集到的振动信号 获得一个m维向量: 在哪里 , (2)的切比雪夫距离和计算: 在哪里 , 。(3)之间的相似性和计算: 在哪里 一般来说。(4)这个函数 定义: (5) 向量 构造(1)根据步骤(4)。(6)模糊熵计算:
2.1.2。精制复合材料多尺度全球模糊熵
作为一种重要的方法来计算障碍程度的信号,菲适合故障特征提取。然而,它获得的初始矢量减去当地的意思是,只有集中地方特性,忽视全局特征的时间序列36]。因此,一些学者提出了全球模糊熵(GFE) [37]。减去的操作的地方平均铁改为减去整个时间序列的均值计算全球模糊熵。换句话说,在方程(1)改变 ,然后,计算铁GFE之后。
轴承的总体特征信号可能会改变工作状态,和全球模糊熵最初是用来描述当地的短时间内波动。因为全球模糊熵只能计算特征从一个规模,获得的故障信息非常简单,所以它可能不是最理想的直接使用GFE计算信号障碍程度的变化。基于全球模糊熵,我们提出一个精制合成多尺度全球模糊熵(RCMGFE)。计算RCMGFE首先需要多尺度粗粒度的操作,多尺度的公式粗粒度的操作如下: 在哪里 指的是比例因子,k粗粒度的一系列吗 。
执行后粗粒度的操作,每个规模的RCMGFE值可以通过全球模糊熵的计算步骤。对于每个RCMGFE规模,其计算也可以由以下公式表示: 在哪里 和 。 ; 代表对的总数米和米+匹配1维向量。
图1RCMGFE的计算过程。
2.2。自组织模糊逻辑分类器
SOF是一个分类器,效率高。其计算有三个流程(34]。前两个阶段迭代更新meta-parameters构造模糊规则为每个类别。在测试阶段的测试样本进行分类。其具体过程如下。
2.2.1。离线训练阶段
这个过程的目的是选择代表性样本(原型)在不同类型的样本,形成模糊规则基于所选择的原型。假设有K样品样本集(样品指的是多维向量RCMGFE),而类别的样本集表示为 和 。在这两个实验,是4。一组包含所有不同的样本和样本的重复设置的数量 和 ,分别。元素的数量吗 。所以, , ; 是一个独特的所有类别的样本集。应该注意的是,寻找原型在同一类别。选择一个原型的具体过程如下:(1)样品的多通道密度计算使用公式(8),代表了两个样本之间的距离: (2)样本分类的基础上计算和相互的距离。后一组排序处理 ,在哪里 。 最接近的样品吗 。 最接近的样品吗 ,然后,这个规则是紧随其后。多通道密度设置的设置表示为 。排序多通道密度后,最初的原型是由公式(10)。如果的样本分类样本集大于两个相邻的多通道密度样本,它将被用作一个初始原型。需要解释的是什么绝对是一个初始原型。包含初始原型和收集 。(3)最初的原型吸引附近的样本来建立数据云。(4)的在步骤(2)中被定义为获得 ,和重新计算通过以下公式: 在哪里 , 元素的总数吗数据云在上面的步骤中,构造和是样品的数量的总和所有数据中包含的云吗 。(5)如果样本之间的距离的平方不满足初始原型条件在步骤(2)和一个初始原型不大于平均半径受影响的区域的相关样品的粒度,这个示例作为最初的原型和相邻中心这条规则构造相邻中心集合是紧随其后。在本文中,我们设置的粒度l= 12,其计算过程见下面的公式: 在哪里和样品在同一类别不同,之间的距离的平方和不应高于 。 平均半径对应 , 是总数,样本集的任何两个样本之间的距离小于 。样品的总数对不到的距离在一组表示为 。 (6)如果最初的原型的多模密度高于样品的多模密度的原型所吸引,最初的原型被认为是最后一个原型,最后集被定义为原型 在哪里 。(7)步骤(6)后,根据以下公式构造模糊规则。如果样本是类似于某一类别,任何原型样本分为这一类。 在哪里代表相似,是这种样品的数量满足原型歧视条件公式(12);换句话说,是所有原型的总数。
2.2.2。在线培训阶段
为了进一步选择原型,提出了在线培训阶段。SOF分类器的一个重要的阶段,这个过程的基础上,建立了流数据处理样品。如果新输入样本的类别是 ,新样本集 。在线培训阶段的步骤如下:(1)基于考虑降低计算成本,在公式(10)将根据以下公式计算: (2) 被定义为一个原型的多模密度吗大于原型的最大多模密度在同一类或低于最低多模密度的原型在同一个班。也就是说,如果是一个最大或最小呢是一个原型。(3)如果不满足判决条件在步骤(2)中,另一个条件可以用来确定是一个原型。如果最小欧氏距离的平方新输入的样本和原型大于 ,我们仍然认为作为一个原型。(4)如果新的输入样本满足条件的任何一个步骤(2)或(3)步,meta-parameters按照下列公式计算:
如果没有一步是满意 。和相应的meta-parameters更新根据公式(17):
随后,公式中的模糊规则(13)也将被更新,SOF流程下一个样本根据上面的过程,直到所有的在线训练样本已处理。
2.2.3。测试阶段
SOF的最重要的部分,输入样本将被分类在SOF测试阶段。假设输入包含测试样本集 ,和是一个测试的样本。这个过程中的步骤如下:(1)分类测试样品之前,需要获得测试样品和原型之间的相似度值根据以下公式: 在哪里 。(2)测试样品分类,测试样本分为原型所代表的类别相似度最大的价值,和相应的类别标签分配给测试样品。
3所示。提出了故障诊断方法
本文基于该RCMGFE和SOF分类器,提出了一种新方法。图2显示我们提出的方法的流程图。GFE可以计算整体变化程度的信号,所以它可以作为轴承的工作状态的评价指标,用于检测轴承是否有缺陷。然而,GFE只能评估信息一个规模,所以大量的故障信息将会丢失,这是不容易准确地确定轴承组件的当前状态。RCMGFE GFE的基础上增加了粗造粒操作,和多尺度粗粒度的业务可以为我们提供额外的观点通过扩大许多尺度熵提前设定并计算相应的熵值。所以它可以获得更多的故障信息,可以准确区分故障的类型。本文实验信号的RCMGFE用于形成断层特征样本集,对RCMGFE所有参数的设置 。获取故障样本集后,我们分成三组样本根据SOF计算过程的三个步骤:离线训练集,在线训练集和测试集。首先,离线训练样本集是用作输入SOF的离线训练阶段选择原型。然后,网络训练样本输入SOF的在线培训阶段进一步选择原型。最后,SOF分类输入测试样本的测试阶段和输出相应的分类标签。
4所示。实验
4.1。实验1
为了测试该方法的分类效果,驱动器的基准数据收集的结束CWRU实验1中使用。电动机运行时每分钟1797转。每秒加速度信号获得的数量是12000,和信号包含一个正常工作状态和故障工作三个州。三州球出错、内圈故障和外圈故障。有三个不同的断层大小为每个故障状态,0.007英寸及其双大小和它的三倍大小,分别。滚动轴承数据的第一个102400分在每个状态均匀地分为50个样品不相同的数据点,也就是说,每个样本包含2048数据点。它可以得出结论,有50个样品在正常状态下,每个失败的三个州的150个样本。实验进行计算机配备了2.4 GHz CPU和4 GB内存,并在MATLAB中运行2019版本。表1统计数据的细节轴承的工作状态和相应的标签。图3情节相对应的时域波形各种状态信号。我们可以知道信号的振幅在正常工作条件是最小的,这很容易区分信号的故障状态。我们也可以清楚地看到,它是不容易从波形识别这三种故障状态。RCMGFE图对应的图3图中给出了4。我们可以看到,在第一个13个鳞片,外圈故障轴承的熵值是最小的。这是因为,这种轴承的振动很普通,和其复杂性相对较小,所以其熵值相对较低。
计算RCMGFE后,500×25故障特性集成立。这组将被分为三个不同的组。首先,30%的样本是随机选择的每个州在SOF离线训练阶段使用。然后,根据上述步骤,选择另一个样本总数的30%剩余样品的在线培训。最后,其他所有的样品用于SOF的测试阶段。一般来说,离线训练样本集包含150个样本,包括15个样本在正常状态和45个样本在每个失败状态。中使用的在线训练样本集SOF在线培训阶段共有150个样本,其中有15个样品在正常状态和45个样本三种故障状态。所以有200个测试样本实验,包括20个样品在正常状态和60个样本三种故障状态。在本文中,通过改变输入分类器和使用不同的分类方法,它们与提出的方法相比,我们的方法的优点是通过共同的指标定量地证明。不同分类输入多尺度模糊熵(MFE),全球多尺度模糊熵(MGFE)和精制复合多尺度模糊熵(RCMFE)。 The parameter settings of these three fault extraction methods are the same as those of RCMGFE. The classification methods used for the comparison areK最近的邻居(资讯),榆树,LSSVM,凯尔姆经常。所有上述分类方法的参数进行比较是一样的那些参考34 (28,29日,34,38]。基于的角度减少意外因素对实验的影响,提高说服力,我们做了十个实验。根据表中所示的四项指标2各种方法的故障诊断结果进行评估。
从表可以看出2在这10个实验,RCMFE-SOF的故障诊断方法具有最稳定的分类性能在所有方法。RCMFE-SOF相反,它有最大的标准差(Std) MFE-SOF的分类结果。最大和最小值的分类准确性,MFE-SOF分类效果最差。根据分析的结果首先four-fault诊断方法,SOF分类方法时,使用故障特征的提取RCMGFE可以获得更高的分类精度,也就是说,该RCMGFE更适合提取故障特征。最大的分类精度和最小分类RCMGFE-KNN精度和RCMGFE-ELM相同,分别是98.5%和95%。的最大RCMGFE-LSSVM分类精度和RCMGFE-KELM同时达到99%。也可以看到,该方法的分类精度的最小值为96.5%,低于RCMFE-SOF 0.5%。此外,从标准的角度偏差,RCMGFE-SOF不是RCMFE-SOF一样稳定。然而,RCMGFE-SOF在本文提出的最大分类精度达到100%,平均价值的分类精度达到98.4%,这是令人满意的。基于实验结果更直观地显示,结果的混淆矩阵在第三个实验中使用的各种故障诊断方法在图给出5。水平坐标是预测某个类别的标签样本,垂直坐标是真正的标签样本,以及在网格中显示数量的比例预测实际标签或标签错误的标签。MFE-SOF如图的分类结果5(一个)。总共八个样品标签3和标签4被误诊,和它的总准确率为96%。实验结果的方法叫MGFE-SOF如图5 (b)。有分类错误的样本标签3和4。的两个样品标签3被错误地归类为4级,和两个的样品标签4被错误地归类为3级。可以得出结论,MGFE-SOF的总体分类精度达到98%。RCMFE-SOF如图的分类结果5 (c)。错误分类的样本是标签2的样品,和三个的样品被误诊为第三类图所示5 (d)该方法的分类结果。组中的每个样本标识,分类准确率达到100%。RCMGFE-KNN如图的分类结果5 (e)。在样品标签4,两个样品被错误地划分为第三类,一个样本错误地划分为第二类,和第四类样本的分类精度达到95%。RCMGFE-ELM如图的分类结果5 (f)。样品标签3和4,分别三到五分类错误的样本。RCMGFE-ELM的总体分类精度达到96%。RCMGFE-LSSVM如图的分类结果5 (g)。在样品标签3和4,一个和两个样本,分别和总样本识别率为98.5%。RCMGFE-KELM如图的分类结果5 (h)。两个样本的标签4被错误地归类为第三类。第四类的分类精度达到97%,和它的总体分类精度达到99%。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
4.2。实验2
风扇端CWRU提供的数据是另一个常用的指标集,这是被许多学者视为一个更具挑战性的数据库(23]。我们使用此数据集实验2。应该注意的是,这个实验的所有参数设置不不同的参数设置部分4.1。表3提供了每个方法的最终分类的效果。从标准差的角度来看,该方法的稳定性不如RCMGFE-KNN的稳定性,RCMGFE-ELM, RCMGFE-KELM。然而,无论最大值,最小值,或平均分类识别率的价值,我们的方法的分类效果最好。除此之外,我们的方法实现了分类识别率高达99.5%的这十个实验;这个值是大于1.5%的最大RCMGFE-KNN分类精度,RCMGFE-ELM, RCMGFE-KELM。从最低最低分类精度,该方法的分类精度达到97.5%,高于1.5%的最小分类精度RCMGFE-KNN, RCMGFE-ELM, RCMGFE-KELM。该方法的平均分类精度达到98.4%。总的来说,实验2的结果是令人满意的。
5。结论
基于RCMGFE和SOF,我们提出一个新的滚动轴承组件的故障诊断方法。首先,RCMGFE计算根据加速度信号;在此基础上,形成整体的特性集。然后,根据SOF的计算过程的三个阶段,上述总体特性集随机分配到三个相应的特征样本集。最后,三组输入相应的SOF过程得到最终的分类结果。两种CWRU轴承数据集被用来验证该故障诊断方法的合理性。通过与其他方法比较分析,我们得出以下结论:(1)最后的分类结果通过改变输入的SOF表明该RCMGFE可以获得比MFE轴承的故障信息更全面,MGFE, RCMFE。换句话说,RCMGFE是一种有效的方法来测量信号的复杂性。(2)与不同的分类方法相比,自组织模糊逻辑分类器是一种更有效的分类器,这是非常适合故障特征分类。(3)在我们所做的两个实验,该方法的最大分类识别率是100%和99.5%,分别,这使得其有效性和通用性反映。
数据可用性
手稿中使用的数据可以从开源数据库下载:https://csegroups.case.edu/bearingdatacenter/pages/welcome-case-western-reserve-university-bearing-data-center-website。
的利益冲突
作者宣称没有利益冲突。
作者的贡献
Xi张和进行实验;子张写了论文。
确认
这项研究是由山西省自然科学基金(201901 d111298)。
补充材料
DE97数据文件。txt, DE105。txt, DE118。txt和DE130。三种对应图4在报纸上;DE118数据文件。txt, DE130。txt, DE169。txt, DE185。txt, DE197。txt, DE209。txt, DE234。txt和DE222。三种对应于图5。(补充材料)