文摘

智能诊断深学习算法应用于机械故障诊断,可以有效机器或部件的故障形式进行分类。目前,智能诊断滚动轴承大多采用单一传感器信号,和多传感器信息可以提供更全面的故障特性提高泛化能力的深度学习模型。为了更有效地应用多传感器信息,提出了一种多尺度卷积神经网络模型基于全球平均分担。诊断模型引入了多尺度卷积内核在特征提取过程中,提高了模型的鲁棒性。与此同时,其平行结构也弥补了多通道输入融合方法的缺点。在多尺度融合过程中,全球平均池方法是用于替换的方式重塑功能映射到一维特征向量在传统的卷积神经网络,有效地保留了空间结构的特征图谱。本文提出的模型验证了轴承故障数据收集的实验平台。实验结果表明,本文提出的算法可以有效地融合多传感器数据。与其他数据融合算法相比,基于全球平均池多尺度卷积神经网络模型训练时期较短,更好的故障诊断结果。

1。介绍

滚动轴承是一种不可或缺的行业的一部分。在应用过程中,为了提高机器操作的安全性和可靠性,必须定期评价滚动轴承的状态(1- - - - - -4]。传统的故障诊断方法是处理和分析故障信号时域和频域的信号处理方法,依靠某些专家经验来达到故障诊断的目的(5- - - - - -7]。然而,在实际的诊断过程,此故障诊断方法更为复杂。近年来,随着机器学习的发展,一些机器学习算法,如安(8),支持向量机(9- - - - - -11),和资讯12,13),已应用于故障诊断。这些机器学习算法已被证明是解决分类问题。然而,这些算法需要提取手动输入功能。在机械故障信号,特别是在早期阶段的缺点或噪声干扰的存在,很难有效地提取故障特征的敏感。

近年来,深度学习基于深层神经网络发展迅速,已成功应用于计算机视觉14,15),自然语言处理(16),语音处理(17],sleep-arousal检测[18),和其他领域。深度学习介绍了卷积内核与变权到深网络自适应提取功能,简化了复杂的特征提取,避免了手动误差特征提取。等优势使得深学习算法卷积神经网络(CNN) (19网络(DBN)[]和很深的信仰20.广泛应用于故障诊断领域。故障诊断将变得更加聪明,更加适合现代工业的趋势。目前,基于CNN的信号预处理方法可以大致分为基于一维(1 d)的故障诊断方法CNN和故障诊断方法基于二维(2 d) CNN。基于1 d CNN的故障诊断方法是将收集到的1 d时域信号直接作为网络的输入。恩斯等人使用一维卷积神经网络模型与自适应特征提取故障诊断(21]。刘等人建造了一个多任务一维卷积神经网络解决故障诊断的问题(22]。刘等人结合去噪卷积autoencoder与一维卷积神经网络故障诊断在嘈杂的环境中(23]。基于2 d CNN的故障诊断方法是一维时域信号转换成一个二维的形式输入到网络。将一维时域信号转换为二维时频图是一种常见的方法(24- - - - - -26]。与此同时,一些研究人员也用巧妙的方法变换时域信号维数(27- - - - - -29日]。模型的改进,研究人员还采用了多种方式来提高模型的诊断能力。王等人改善网络的计算速度和稳定性通过添加一批标准化层(30.]。江等人建造了一个一维多尺度模型故障诊断(31日]。王等人构建一个共同关注模块(果酱)并将它添加到诊断模型,有效地提高了诊断性能的模型32]。

上述故障诊断问题是处理由一个传感器故障信号的测量。单方面的信息往往是片面的,在实践中,和一个传感器的信息可能不完全反映故障特征由于安装位置,安装方向,和其他因素。使用更全面的多传感器信号可以进一步提高诊断能力深度学习的模型。目前,研究者们采用各种方法来诊断故障源数据。王等人构建的时域多传感器信号在不同的位置成一个二维矩阵和改进的二维CNN用于诊断和分类(33]。许等人提出了一个基于多传感器信息融合的一体化模型(34]。山等人融合多个传感器信号的提取特征因素和CNN用于故障分类35]。王等人多传感器数据转换成彩色图像,构造了一个改进的基于LeNet-5 CNN分类(36]。夏等人将多传感器数据输入CNN模型通过多种渠道解决综合诊断问题[37]。顾等人提出了一种多传感器故障诊断模型基于离散小波变换(DWT)和长期短期记忆(LSTM) [38]。口等人融合多传感器的监测信息标准化和分类后,CNN (39]。李等人提出了一种基于多尺度排列熵的故障诊断方法(MPE)和多通道融合卷积神经网络(MCFCNN) [40]。彭等人提取特征从通过短时傅里叶变换(STFT)和多传感器信息融合的特征输入到深度残余神经网络解决故障诊断的问题(41]。

以上方法结合多传感器信息提供更全面的信号特性的深度学习模型来提高表达能力。然而,在实际的信号采集过程中,常常有噪声干扰,这将减少故障特征的重要性在某种程度上,削弱功能不同故障类别之间的差异,并使深度学习模型的训练过程更加困难。当一个特定的传感器数据大大地受到噪音的影响,将它添加到训练样本将减少输入样本的质量。在这种情况下,只有多传感器数据融合,但是模型并不是改善目标的方式,这将减少整体的性能模型。

为了解决上述问题,本文提出一种多尺度CNN模型基于全球平均池(MSCNN-GAP)。首先,没有专家经验用于数据预处理方法将一维时域信号转换为一个二维的形式。然后,处理数据输入到模型中。在这个模型中,引入多尺度卷积核提取样本特征的多样性。Multifeature提取使深学习模式更适合与噪声故障诊断。并行多尺度结构特征提取方法也更好地适应数据融合。在融合网络的一部分,为了保持每个分支通道的特征空间,全球平均池(GAP)层是用来取代传统的完全连接层的降维方法,进一步提高了网络的性能。最后,MSCNN-GAP的有效性验证的数据比较。

本文的主要创新和贡献描述如下:(1)对于多传感器融合模型,噪声因素的影响可能存在的信号采集过程中模型的性能进一步考虑(2)为了提高噪声模型的适应性,MSCNN-GAP模型建立了平行结构(3)在特征融合过程中,使用层的差距。缺口层减少了网络参数的数量和保存期间每个特性的空间结构特征模型的融合,进一步提高性能(4)综合实验是设计和执行验证的有效性和鲁棒性提出MSCNN-GAP全面

本文组织如下。部分2介绍了多尺度的基本理论CNN和全球平均池。部分3介绍了MSCNN-GAP的诊断方法。节4进行了实验验证,实验结果进行了讨论。最后,给出的结论是在部分5

2。基本理论

2.1。多尺度卷积神经网络

CNN是一种常见的网络形式深入学习。被勒存等人首次提出并应用于手写的数字进行分类(42,43]。基本的CNN由三部分组成:卷积、激活、池(44]。卷积是CNN了最基本和必要的操作。卷积操作采用一个固定大小的卷积内核滑动输入提取输入特征。卷积运算的示意图如图1。输出的结果 - - - - - -功能的地图 - - - - - -层可以表示为 在哪里 代表了 - - - - - -前一层的输出特性图, 对应卷积核的重量 - - - - - -th特性图, 代表偏差项, 代表了渠道的总数在前面的层。

卷积运算后,输出非线性激活函数卷积过程。添加一个非线性激活层可以使模型非线性的网络可以用来解决更复杂的非线性问题。常见的非线性激活函数包括乙状结肠函数,双曲正切函数,ReLU函数(45],PReLU函数(46]。非线性激活后的输出结果可以表示为 在哪里 代表了非线性激活函数, 代表之前的卷积的输出层, 代表输出项。

池是将采样的一种方式。添加一个池层在激活函数可以减少参数的数量和提取的关键特性。最大池过程的示意图如图2。与此同时,池操作也可以用作非线性操作来提高模型的表示能力。

随着深度学习的发展,CNN是用来处理更复杂的问题。面对这些问题,叠加深层神经网络是一种常见的解决方案。然而,由于过度的深层神经网络的参数,梯度不稳定的问题是容易发生在训练过程中,使培训更加困难。为了解决这个问题,谷歌团队首先提出了一种多尺度结构(47]。多尺度结构使用多个平行CNN结构取代深度网络最后合并每个分支的特征提取结果。多尺度卷积CNN也可以使用不同的内核提取输入特征的同时,进一步提高了CNN的性能。多尺度结构的示意图如图3。三个分支的多尺度结构的融合过程可以表示为 在哪里 , , 代表每个规模和特征向量提取 代表的融合过程一维向量。

2.2。全球平均分担

通常,CNN将重塑一维特征向量的特征映射到一组特征提取和输出最终的分类结果后,通过使用几个完全连接层。在大量的渠道,将会有更多的参数完全连接层,和模型将更加复杂。在改造过程中,完全连接层也会失去的空间位置信息渠道之间的特征图谱。差距替换每个通道的特征图谱特征数。层的差距可以显著降低模型的数据量,降低过度拟合的风险完全连接层,和有效地保留每个通道的空间位置信息。全球平均分担 渠道可以表示为 在哪里 是输出的差距, 是输入的差距,然后呢 的宽度和高度通道特征图。差距的示意图如图4

3所示。MSCNN-GAP的智能诊断方法

3.1。数据预处理

数据预处理是故障诊断过程的一个重要组成部分。一个优秀的预处理方法可以显示故障特性更好提高深度学习的性能模型。最常见的预处理方法是将时域信号转换成时频图。然而,这种处理方法也更加复杂,需要一定数量的专家经验。在这篇文章中,一维时域数据转换为二维矩阵的维度转换(25]。转换图如图5。对于一维信号, 采样点作为样本,每个 样本点作为一个行,依次排列成列,形成一个二维矩阵 这种预处理方法不需要专家经验。此外,它降低了预处理的复杂性。

3.2。基于MSCNN-GAP故障诊断方法

为了更全面反映了故障特征,本文使用多传感器数据进行故障诊断。多传感器数据将作为公司网络模型的输入。当信号样本收集过程被噪声干扰因素,将故障特征的噪声信息,这将极大地影响特征提取过程,减少模型的诊断能力。为了削弱这种影响和改善模型的鲁棒性,本文构造一个MSCNN-GAP模型。与单一卷积内核CNN相比,多尺度CNN可以选择卷积核的大小更灵活提取输入特征,从而提高噪声模型的公差。与此同时,多尺度CNN是一个并行结构。当面对训练样本集与噪音,可以更新参数的多尺度结构的每个分支更灵活,以更好地适应融合多源数据集。在传统的CNN,提取的特征图谱将重塑为一组一维特征向量,和最后的分类结果将输出通过完全连接层。这个重塑方法会改变地图的空间结构特征。在多尺度融合过程中,保持空间结构特征图的每个分支更有利于训练网络模型。 Therefore, the global average pooling is selected at the end of each branch instead of the traditional method of reshaping the convolution layer into a one-dimensional vector. This makes the output results maintain the spatial structure of the feature maps in the fusion process and better adapt to the multiscale fusion process.

为了包含尽可能多的信号特性,选择4096个采样点作为一个整体的信号样本。在卷积过程中,三种不同尺寸的卷积核是用来提取输入特征的多样性。每次卷积和池计算后,ReLU执行的非线性激活函数,添加和批量标准化层以提高计算速度。最后,与100个神经元隐层是用来减少融合维度的一维向量,最后通过输出层输出分类结果。表1显示每个分支的卷积过程的具体参数。图6显示了图的整体诊断模型结构。

4所示。实验验证

4.1。实验数据集

摘要故障轴承故障实验测量的数据平台是用于验证该算法的有效性。在图所示的实验平台7。平台主要由交流电动机,轴承支持,基础,转轴,测试轴承和加载系统。有缺陷的轴承是SKFNU205模型。有缺陷的轴承的故障类型如表所示2

在信号采集过程中,加载系统施加一定的有缺陷的轴承上的径向力。水平传感器和垂直传感器用于收集信号在不同的方向,分别。信号的采样频率为16384赫兹,和汽车的速度是1487 r / min。为了更好地验证模型提取特征的能力,收集到的故障信号振幅归一化,这会削弱功能类别之间的差距,进一步提高了分类的困难。

为了更好地模拟信号数据的噪声、白噪声具有不同信噪比(信噪比)添加到收集到不同方向的信号。信噪比可以定义为 在哪里 信号和噪声的力量。

每4096个采样点的信号数据作为样本,和几组样本集进行训练和测试是由重采样。其中,集团有一个相对简单的示例,因为没有噪声因素,和500个训练样本将用于训练模型。B组、C组、D组,E组有一定的噪声因素,和1000年将使用训练样本。F组和G组最受噪声的影响,和1500个训练样本用于培训。几个样本集的具体参数如表所示3

4.2。选择卷积的内核

卷积核的大小是一个重要的hyperparameters CNN。卷积核大小不同的适应不同类型的数据集。为了最大化CNN的诊断性能,本文首先进行卷积核的大小不同的影响结果。信号收集的数据在垂直方向选为实验样本。MSCNN-GAP单一传感器信息被选为实验算法。实验结果如图所示8。图的训练集8(一个)使用500个训练样本。图中的训练集8 (b)使用与SNR-5 1500个样本。

结果表明,较小的卷积核特征提取效果很差由于较小的接受域的数据集。在某种程度上,美国有线电视新闻网的性能增强的扩大卷积核的大小。卷积核的大小9是最好的样品时没有噪声干扰。在噪声干扰的情况下,卷积核的大小13有最好的效果。达到最优值后,逐渐扩大的卷积核大小,CNN的诊断能力有下降的趋势。原因是一个大型的卷积核大小为当地的特征提取弱。两组数据的对比结果表明,当信号被噪声干扰,削弱了样品的地方特色,更大的卷积核,可以更好地提取全局特征更适合嘈杂的数据集。

4.3。比较分析的算法

在本节中,我们将验证该算法的计算复杂度及其在multidata融合的表现。为了更好地反映MSCNN-GAP的优越性,其他三个不同的算法进行比较:

CNN(单个传感器)。这个模型使用一个单一传感器信号作为输入的CNN。CNN模型由四个卷积模块和两个完全连接层。每组卷积模块由一个卷积层、汇聚层和归一化层。卷积的末尾,这个功能是重塑映射到一维向量,维度是减少了一个完全连接层。最后,CNN的分类结果输出(25]。

多通道CNN (MCCNN)。为了应用多传感器信息,多传感器数据输入MCCNN多通道的形式输入。MCCNN模型的具体结构是一样的CNN模型算法1 (34]。

多尺度CNN (MSCNN)。基于多通道输入算法2,为了进一步提高性能的CNN,这个算法使用多尺度卷积内核提取输入的功能多样性。卷积运算后的每个分支,该功能将重塑映射到一维向量和减少完全连接层。然后,每个分支的一维向量合并,减少再次被完全连接层。最后,完全连接层用于输出最终的分类结果(29日]。

MSCNN-GAP。本文提出的算法在故障诊断中使用多传感器数据。多传感器数据将被输入到模型作为多个频道。采用基于多尺度CNN,平行结构来减少噪声数据的影响模型,提高模型的鲁棒性。卷积操作后的每个分支,每个分支的功能映射将通过全球平均池层,减少和降低特征向量将融合。差距不仅降低了模型的参数,而且保留了之前地图融合的空间结构特征。融合特征向量将减少通过一个完全连接层,最后,分类结果将输出通过一个完全连接层。

计算复杂度是一个必须考虑的问题的深度学习模型。计算复杂度越小,越短的计算时间和计算效率越高。本文从两个方面验证了所提出模型的复杂性:时间复杂度和模型参数。卷积神经网络,其时间复杂度可以表示为 在哪里 地图的大小输出特性, 卷积核的大小, 卷积的输入通道数层,然后呢 卷积的输出通道数层(48]。

因此,时间复杂度的完全连接层和全球平均池层可以推导出如下: 在哪里 是完全连接层中的神经元的数量。

本文中的算法使用全球平均池层来取代传统的完全连接层的卷积操作。我们输入的网络参数完全连接层和全球平均池层时间复杂度计算公式。涉及的时间复杂度

前者代表了传统多尺度CNN的时间复杂度。后者代表MSCNN-GAP的时间复杂度。结果表明,该算法优于传统的多尺度CNN模型在时间复杂度。从的角度的参数模型, 变量权重需要计算最终的输出包含完全连接层 神经元。全球平均池层输出最终结果得到的平均值功能地图,不需要其他参数参与计算。因此,本文提出的算法有更少的参数。总之,该算法的计算复杂度比传统的多尺度CNN模型。

下面的算法将验证的性能。结果显示前一节中,我们使用一个卷积核的大小9作为CNN的特征提取器提取噪声样本的输入特性。对于噪声样本,我们使用卷积核的大小13。多尺度模型,最好的卷积核的大小和其相邻的卷积核大小用于特征提取。

为了避免偶然性,每个模型旨在十倍,最终结果的平均值。结果如表所示4

结果表明,诊断能力基于CNN算法可以在没有噪声的情况下,达到一个高水平,证明了CNN算法在故障诊断的可行性。在这个实验中,因为周围的噪声干扰弱信号时收集,每个类别的故障特征更明显,算法和结果的差距相对较小。不同故障形式的影响下,断层位置、加载方向,和其他条件,每个方向传感器采集的信号特性的重要程度是不同的。在这个实验中,由于负载应用在垂直方向和水平方向上相比,垂直方向的信号功能将更加明显。因此,该模型由垂直传感器信号采集的训练更好的结果。只为了多传感器数据融合,利用多传感器信息,多通道输入会使结果高于低价值由单一传感器信息和训练低于价值就越高。训练样本的原因是明显的特性,增加样品功能不足引起一定量的噪声干扰,降低了训练集的质量,导致特征提取的难度,降低了模型的性能。为了削弱这一因素的影响,介绍了一种多尺度特征提取方法能够有效地解决特征提取困难的问题,提高诊断的准确性。在此基础上,介绍了全球平均池的多尺度融合方法,有效地保留了空间结构特征,而融合,这样模型达到更高的性能和更稳定的结果。

9显示了每个算法的准确性和损失的形象不同训练时期。结果表明,CNN, MCCNN, MSCNN都需要更多的融合时代达到收敛。的收敛时代MSCNN-GAP大大减少。与此同时,本文提出的算法的损失减少得更快,和收敛过程比其他算法更稳定。

4.4。鲁棒性的比较分析

故障信号采集的过程中,它通常是由机器噪音和干扰周围的噪音。故障信号,当有很多噪音故障特性将覆盖的噪声信息,这就增加了困难从模型中提取有效的特征。噪声会影响数据的质量在某种程度上,从而影响了模型的训练过程和性能。因此,诊断模型需要有更好的鲁棒性。

在本节中,组B, C, D, E将用于比较验证。样品与噪声因素被用作训练集的算法使用单传感器数据。同样,每个算法运行10次,计算平均值。结果如图所示10

结果表明,CNN模型的诊断准确性与单传感器数据低于95%时的噪音是虚弱的。噪音严重时,诊断精度小于85%。它还表明,CNN模型的性能将大大受到噪声的影响。多尺度结构可以提取更多的功能,提高模型的诊断能力。然而,由于噪声的干扰因素,故障特征不够明显,诊断精度相对较低。结合多传感器数据,可以缓解这个问题。在信号采集,由于垂直方向的载荷,故障特征信号的收集在垂直方向上更明显。特征抽取过程将更加困难,这群信号受到噪声的影响因素。这也使得组D和E组的总体精度高于B组和C组的多传感器融合算法。通过添加多尺度信息和使用全局池方法保存功能空间,本文提出的算法更好的适应困难的特征提取的样本。 It improves the diagnosis ability of the model.

11显示了每个算法的混合矩阵。结果表明,两类内圈故障很可能由于相同的故障形式混淆。添加噪声后,这一类的也有一定程度的误判。CNN的诊断能力拒绝某种程度上。多源数据可以提高网络的表达能力。然而,很难提取功能类似的故障类别之间,还有很大程度的混淆两个内圈故障。多尺度模型能更好地提取特征,减少两个类别之间的混淆。结果表明,本文模型的进一步提高性能的多尺度融合方法使用全球平均分担。

为了直观地显示了该算法的有效性,我们使用t-SNE算法来降低维数和可视化特征提取的结果。图12显示了t-SNE可视化结果的四个算法。其中,1 - 5代表五个故障类别的ORF, IRF1, IRF2,裁判,也没有。结果表明,随着持续优化的算法,每个算法的分类效果逐渐提高,这对应于混淆矩阵的结果。该算法显示了更好的聚类性能。有更多优秀的不同类别之间的可分性的特性。它进一步证明了本文提出的算法的有效性。

在极端的情况下,多传感器信号噪声干扰的同时,进一步提高了特征提取的难度。为了进一步验证算法的鲁棒性,F组和G组是用来比较和验证算法。每个算法运行10次,计算平均值。对比结果如图13

结果表明,在噪声因素的影响下,每个算法的诊断准确性在一定程度上的影响。在使用单传感器数据的算法,比传统的CNN MSCNN-GAP具有更好的分类效果。的数据融合算法,数据融合使用多通道输入的结果略低于使用垂直信号的模型。本文提出的数据融合算法可以获得更好的结果比MSCNN-GAP使用单传感器数据。因此,MSCNN-GAP可以更有效地应用多源数据。原因是多尺度模型是一个并行结构,和多个分支机构可以调整的参数。与传统的CNN算法相比,MSCNN-GAP更为灵活。因此,MSCNN-GAP具有更好的鲁棒性,可以更好地适应噪声因素下的多源数据的故障诊断。

同样,数据1415显示了每个算法的混合矩阵和t-SNE可视化结果。结果表明,在噪声因素的影响下,只有多通道数据融合算法的结果输入相对混乱。与此同时,可视化显示,类别之间的界限也模糊。MSCNN-GAP模型能更好地分辨混淆类别和类别之间的界限是比其他算法更明显。

5。结论

为了更有效地利用多传感器数据,本文提出了一个MSCNN-GAP模型。MSCNN-GAP使用多尺度卷积核提取更多样的特性,这缓解了CNN模型的鲁棒性差的问题,根据噪声有效因素。并行结构的多尺度模型是更好地适应数据融合的过程。在融合过程中,而不是重塑特性映射到一维向量,采用全球平均池方法,有效地保留了空间结构和位置特征图的融合过程。验证该模型的轴承故障数据收集的实验平台。实验结果显示,与其它数据融合方法相比,本文提出的算法更有效利用多传感器信息和获得较高的诊断精度和缩短收敛时间。该算法具有较强的鲁棒性和更好的分类结果当信号样本受到噪声的影响因素。

数据可用性

标签数据集用于支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这部分工作是支持下由中国自然科学基金会拨款51675350。