文摘

滚动轴承是一种极其重要的基本的机械装置。故障的诊断中扮演重要角色机械系统的安全稳定运行。本研究提出了一个方法,基于快速傅里叶变换(FFT)和Decimation-In-Time (DIT)和XGBoost算法,准确而快速地识别轴承的故障类型。首先,最初的滚动轴承的振动信号是改变了DIT-FFT分为训练集和测试集。接下来,使用训练集训练故障诊断XGBoost模型,测试集是用于验证训练有素的XGBoost模型。最后,该方法与一些常见的方法。这是证明,该方法能够快速诊断和识别故障类型的轴承几乎99%的准确率。它比机器学习更准确(89.88%)、整体学习(93.25%),深度学习(95%)。这种方法适用于滚动轴承的故障诊断。

1。介绍

滚动轴承是旋转机械的极其重要的基本的机械组件。广泛用于国民经济各个领域和国防由于其效率高、易装配,和润滑1]。滚动轴承的健康状态直接关系到机械设备的性能和使用寿命。据不完全统计,约有30%的旋转机械故障是由滚动轴承引起的(2]。因此,有必要及时诊断和识别滚动轴承的故障。

多年来,一些方法和技术已经被用于监控设备的健康状态(3- - - - - -7]。轴承的故障诊断,其中大多数是基于轴承的振动信号的分析8- - - - - -13]。一般来说,大多数这些方法由两个阶段组成:数据处理和故障状态的决心11]。对于数据处理,大多数方法提取振动信号的故障参数振幅谱的幅频图,功率谱、小波频谱在时间域和频率域,然后用这些参数构成特征向量进行信号分析。信号分析方法主要包括时域分析、频域分析和时频域分析(12,13]。时域分析方法分析振动信号作为时间的函数(14尖峰能量法等),(15)和信号包络方法(16]。频域分析,基于傅里叶变换的可用性技术,提取振动信号特征更容易比时域分析(16]。傅里叶变换包括短时傅里叶变换、快速傅里叶变换(FFT)和离散傅里叶变换(DFT)。其中,FFT快速DFT可以执行在有限序列。因此它有一个出色的性能故障诊断的特征提取(14,17,18]。时频域分析方法结合时域和频域信息研究的内在特征信号,如伽柏变换(19),连续小波变换(20.),和能量分布21]。也有一些其他的信号处理方法用于构造特性集,如样本熵、模糊熵和振幅谱熵(11]。

故障状态的决心,一些不同的机器学习(ML)方法用于构造一个分类器,例如,传统ML,深度学习(DL)和整体学习(EL)。在传统的ML, Chouri et al。8支持向量机应用于自动化故障诊断过程。它提取故障轴承的振动信号的特点Alpha-stable分布。Bu et al。22)提出了一个方法结合为生物和地方平均分解(LMD)来诊断轴承故障。原始振动信号分解LMD和训练构成特征向量。回归模型被用来确定轴承的健康状态。然而,这些传统方法的诊断精度仅为90%左右。在DL方面,杨et al。10)构造一个数据集后提取振动信号在频域的特性。数据集被用来训练深层神经网络(款)对故障类型进行分类。江et al。23)提出了一个基于卷积神经网络(CNN)的方法。的特性参数Mel-frequency cepstral系数和δ倒频谱提取训练诊断模型。然而,这些DL方法的参数调整困难,训练时间通常很长。在EL方面,胡锦涛等。24)提出了一种结合内核主成分分析方法和随机森林(RF);一群分类器训练在高维内核空间与射频方法。但时出现过度拟合射频数据有很多噪音。EL称为极端梯度增加的新算法(XGBoost)提出了陈25]。这种方法有很多优势,如正则化、并行处理和缺失值处理。它具有良好的性能(回归和分类问题26,27]。Rao et al。28]XGBoost算法应用于检测异常的汽轮机基础上学习历史数据和有前途的结果。

本研究提出了一种基于FFT的方法与Decimation-In-Time (DIT)和XGBoost诊断和识别滚动轴承故障。提供的实验数据是凯斯西储大学轴承数据中心(CWRU)。DIT-FFT用于过程振动信号,XGBoost模型作为分类器来诊断滚动轴承的故障。

2.1。DIT-FFT

FFT是一个快速DFT的计算方法。本节首先介绍DFT。假设x(n)是一个典型的N点有限序列,那么它的DFT的定义是 在哪里 是归一化数字频率, , 展开方程(1)成矩阵的形式,我们可以获得

它的缩写矩阵形式 在哪里 是DFT矩阵, 是序列矩阵,然后呢F表示的变换矩阵。可以看出F的计算复杂度N×N记录为 对于一个N分DFT。它包括 次乘法和N×(N1)倍。因此,它将消耗大量的计算时间和内存空间直接用这种方法处理数据。本研究采用radix-2 FFT算法(29日)来提高计算效率,减少计算复杂度。在实际应用中,有许多不同的radix-2 FFT算法。(其中,radix-2 FFT算法和说radix-2 DIT-FFT)是最重要的。蝴蝶的流程图如图操作定理1

从图可以看出1,上面的分支的输出等于输入的总和的分支和分支越低,也就是说, 较低的分支的输出等于输入的区别上分支和分支越低,也就是说, 与上面的形式, (l是一个正整数),子序列的长度后,第一,第二,…,最后分解吗 , ,…, ,分别。因此,分解的总数 对于每个分解,乘以相应的蝴蝶的乘法和加法操作 N,分别。因此,总乘法倍 (即。,computational complexity) and addition times 如下:

乘法DIT-FFT和DFT的比率 (即。,the ratio of computational complexity) and the ratio of additions

radix-2, DIT-FFT和DFT算法不同N, , 是见图2。从图我们可以看出2,这两个 减少迅速的增加N。换句话说,DIT-FFT方法加快了计算速度,提高计算效率明显时N足够大。但是,当N大于 , 慢慢减少。因此,本文选择了 每组样本的长度减少计算复杂度。

2.2。XGBoost

EL XGBoost是一种算法,是基于分类和回归树(CART) [25]。其目标函数被定义为 在哪里l是一个可微凸损失函数来衡量预测的区别 和目标 是最后的得分函数的样本 圆的, 输入的样本。它可以表示为 在哪里 是叶子向量,树的结构,T代表叶节点的数量。

第二项 右侧的方程(6)惩罚模型的复杂性。它被定义为 在哪里 两个模型参数用于控制的比例 代表 正则化处理 ,它也可以表示为 如果该值的 很小,树的复杂度很低而泛化能力强。

二阶泰勒展开后的方程(6),获得一个新的目标函数: 在哪里 , 第一,在损失函数和二阶梯度统计吗l分别。

最终的目标函数仅依赖于一阶和二阶导数的每个数据点的误差。常数项和扩大 ,更新目标函数 在哪里 被定义为实例的叶子吗j

为了简单起见,我们定义 ;然后,

下一个计算偏导数 并将结果返回给方程(11),可以得到以下公式:

它可以用作一个得分函数来衡量一个树结构的质量。较小的Obj,结构良好的树。这一点就像杂质分数评估决策树,除了它是派生的更广泛的目标函数。一般来说,是不可能列举所有可能的树结构。贪婪算法,从一个叶和迭代添加分支树使用(而不是25]。让 左派和右派的实例集节点分裂后,分别。定义 ,分裂后的损失减少了

这个公式在实践中通常是用于评估节点分裂的候选人。

3所示。轴承故障实验台

本文提出DIT-FFT-XGBoost方法测试的SKF滚动轴承数据集标准数据进行测试的CWRU轴承故障诊断的方法。图3说明了CWRU轴承故障试验台。它由一个2惠普电动机转矩传感器/编码器,测功器,控制电子产品。一般来说,滚动体(RE),内部种族(IR)和外环(或)滚动轴承的电机很容易损坏。试验台可以模拟这些故障类型,也就是说,你的错,红外故障,或错误。或故障,损坏位置位于3点,6点或12点。在这个试验台,有三个加速度传感器用于记录滚动轴承的振动加速度信号。他们放置在机架与磁基地(BA),轴承风扇端(FE)的座位,和驱动端(DE)。振动加速度信号采集的16通道数据记录器。铁是12 kHz的采样频率,采样频率和断层DE是12 kHz或48 kHz。轴承的速度是1730,1750,1772,或1797 rpm。

CWRU试验台的记录大量数据。本文只选择了数据12 k DE和故障诊断的1772 rpm。有9种轴承故障和正常状态。9故障类型的故障,IR的错,并与0.007 -或错误,0.014,和0.021英寸的损害直径,分别。或错误的数据只是从6点钟位置的损害。本文使用的数据表中列出1

4所示。轴承故障诊断

4.1。故障诊断过程

滚动轴承的故障诊断过程DIT-FFT-XGBoost方法如图4。它主要包括两个阶段:数据处理和故障状态的决心。在数据处理阶段有两个步骤。步骤1:计算标准差和输入数据的平均值,然后标准化数据正态分布,消除异常样本数据处理的影响。适用于复杂的大数据。步骤2:处理与DIT-FFT标准化的数据,然后将它们分成训练集和测试集。在故障状态确定阶段,为训练集到XGBoost模型中。XGBoost模型火车损失函数的负梯度每次调整参数。最后,训练有素的模型识别轴承的故障类型。与Python系统分析计算与英特尔笔记本(R)的核心(TM) i5 - 7200 CPU @ 2.70 GHz。

4.2。数据处理

原始数据的断层,红外故障,与0.007英寸的直径收集的损害或故障记录器在DE条件下12 kHz和1772 rpm如图5

拟合和标准化后的数据上面三种断层是正态分布,标准化结果如图6

接下来,变换DIT-FFT标准化结果;它们的绝对值在图所示7

正常状态的处理结果和9故障类型和0.014 - 0.021英寸损害直径数据中所示8- - - - - -14,分别。

对于上面的数据,原始数据波形从上到下,标准化的结果,分别和转换的结果。正如上面提到的, 数据长度被选为一组样本的radix-2 DIT-FFT算法。数据长度是2048上面的所有数据处理数据。据的数据长度12 k德轴承数据列在表中1和上面的数据长度选择样本,我们构造训练集和测试集如表中所示2。对于每个轴承故障类型和正常状态,50组样本取自原始数据作为训练集,也就是说,数据长度为102400。剩下的数据被用来构造测试集。因此,有9组作为测试样本集对每种故障类型(即。、数据长度为18432)和186组样本作为测试集正常状态(即。、数据长度为380928)。因此,训练集和测试集是由500和267组样本,分别。

4.3。故障状态的决心

为了充分利用训练集来提高诊断的准确性XGBoost模型 - - - - - -介绍了折交叉验证划分训练集 折叠。其中, 每次折叠被用于训练模型,剩下的一个是用于测试模型。当XGBoost模型的参数默认值,的影响 训练时间和诊断精度的模型如图15。的增加 从3到7,训练时间逐步增加从31.91到89.62年代,但诊断准确性增加首先然后减少。当 ,诊断精度是最高的;与此同时,训练时间不是很长。因此,训练集划分为5折。

有几个XGBoost模型的参数影响故障诊断的准确性。他们是列在表的详细信息3

其中,最重要的参数是max_depth min_child_weight和γ。max_depth,也就是说,树的最大深度,是一个需要调整的参数在构建树。如果它太大,模型将更复杂,更容易overfit [30.]。这个参数被选中的测试值从3到6。Min_child_weight,最低重量之和实例中需要一个孩子( (15)),是用来避免过度拟合。如果树分区结果在一个叶节点实例的重量之和小于min_child_weight,构建过程将放弃进一步分区(30.]。min_child_weight越大,越保守的模型。其范围从1到5。这两个参数的影响的诊断准确性XGBoost模型如图16

从图可以看出16总的来说,不同max_depths XGBoost模型的诊断精度降低的增加min_child_weight从1到5。诊断精度是最高当max_depth = 4。特别是,该模型的诊断准确性最高(100%)当min_child_weight = 1。

最后一个重要的参数γ 代表所需的最小损失减少,进一步分区树的叶节点( 在方程(8))。更大的 是,更为保守的算法将[30.]。所以,它的范围是从0到0.5在这项研究。的影响 的诊断准确性XGBoost模型如图17

从图可以看出17的诊断准确性XGBoost模型的增加略有减少 从0到0.5。当 或0.1,模型精度最高,达到100%。此外,相比之下, ,小的时候的计算模型 ;因此, XGBoost模型是更好的选择。

4.4。结果和分析

T-distributed随机邻居嵌入(T-SNE)是一个ML算法降维。它是方便数据的可视化。本文采用该算法减少每组样本2 d和DIT-FFT可视化数据处理的影响。图18显示了处理数据的降维的结果。可以看出与DIT-FFT数据处理的效果非常明显。每种类型的数据处理后故障集群在一起。

当XGBoost模型的参数值是默认的表3、原始数据、处理数据和DIT-FFT用于火车XGBoost模型和诊断测试集,分别。模型和诊断准确性的训练时间比较上述两种情况之间的测试集表中列出4

从表可以看出4,使用的原始数据作为输入XGBoost模型,训练时间是52.65秒。但它是大幅减少到31.91 s DIT-FFT使用数据处理。测试集的诊断准确性也大大提高了从约55%至93%。

接下来,XGBoost模型的诊断准确性没有参数调整为每种故障类型进一步分析。与上面的结果相关的混淆矩阵图中所示19

从图可以看出(19日),当XGBoost模型与原始数据训练,它只有高精度与0.021英寸的损坏或故障直径(即。、标签8)。但是当模型是由DIT-FFT训练与数据处理,这对7断层类型(即具有较高的精度。,标签0,1,2,3,5,8,如图10)19 (b)。因此,它所处理的数据进一步表明,DIT-FFT可以大大改善轴承的诊断准确性。

进一步提高模型诊断的准确性,XGBoost模型的参数调整到最佳值,也就是说,max_depth = 4, min_child_weight = 1, 训练集和测试集都是由DIT-FFT之前进行处理。测试集的混淆矩阵图所示20.

我们可以看到从图20.XGBoost模型的最佳参数值具有较高的精度9故障类型(即。,标签0,1,2,3,4,5,7,8,9,10)。总测试集的诊断准确性高达98.12%。但模型诊断精度低故障直径0.021英寸的损伤(即。标签6),识别错这个故障的故障直径0.014英寸的损害(即。,label 3). Analyzing the vibration signals of these two faults, we find that they are very similar so that the model cannot identify them accurately. This problem will be further solved in future work.

5。方法比较

在本部分中,该方法DIT-FFT-XGBoost是从两个方面与其他方法相比,例如,数据处理和故障状态的决心。在数据处理方面,经验模态分解(EMD)方法选择与DIT-FFT方法。EMD有很好的性能在处理非平稳和非线性数据(17,27]。它基于时间尺度分解信号数据本身的特征。把故障直径0.007英寸的损伤(即。,label 0) as an example, the decomposition result of vibration signal by EMD method is illustrated in Figure21

分析后的峰度的固有模态函数(IMF)组件如图21,四个组件IMF1∼IMF4选择建立一个新的数据集作为输入数据来训练XGBoost模型。这个训练有素的模型的诊断准确性label-0故障仅为82.40%。作为对比,当使用label-0故障的振动信号处理DIT-FFT训练XGBoost模型,诊断精度提高到88.9%,高于EMD。

在方面的故障状态的决心,毫升的SVM方法;GBDT EL和射频方法;款和CNN与XGBoost DL选择比较。所有这些模型的输入训练数据由DIT-FFT预处理。比较这些模型的训练时间和诊断精度如表所示5

从表中我们可以看出5支持向量机的训练时间是最短的,但其诊断准确性低于90%。它不满足要求的轴承故障的诊断精度高。与其他方法相比,XGBoost诊断准确性最高(98.12%),而不显著增加训练时间(59.53秒)。因此,它是最好的选择对轴承故障的诊断。

6。结论

本文提出一种方法基于DIT-FFT和XGBoost对滚动轴承的故障诊断。DIT-FFT用于过程振动信号,和XGBoost模型被用来作为故障识别的分类器。该方法测试CWRU轴承数据并与一些常见的方法。可以得出以下结论:(1)在振动信号处理DIT-FFT,培训的时间和诊断XGBoost模型的精度有显著提高。培训时间从52.65秒减少到31.91秒;同时,测试集的诊断精度提高约55%到93%。(2)XGBoost模型的参数调整后的最佳值,模型精度高了9故障类型和总测试集的诊断准确性进一步上升到98.12%。(3)与EMD的数据处理方法相比,DIT-FFT可以提取故障特征和诊断准确性较高。(4)相对于其他传统ML、EL和DL方法,XGBoost诊断准确性最高(98.12%),而不显著增加训练时间(59.53秒)。

毫无疑问,DIT-FFT和XGBoost可以用来诊断轴承故障快速、准确。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是支持部分由中国国家自然科学基金资助51507025,辽宁省自然科学基金资助下20180550822,中央大学和基础研究基金资助下3132019014。