文摘

旋转机械的智能诊断与大数据已被广泛研究。然而,由于工作环境的可变性和困难将故障样本,很难获得足够的高质量的错误标记数据训练轴承故障诊断模型在实际工业应用场景。针对训练数据不平衡的问题,由于缺乏故障样本,小说metalearning故障诊断方法(MOFD)提出了轴承故障诊断的解决方案在数据不平衡。首先,为了提高各种故障样本,特征空间密度自适应合成少数过采样技术(FSDA-SMOTE)提出了本文需要少数样品的密度差在空间域内当地邻居相似的类作为约束来生成新的故障样本数据增大。此外,为了增强模型的学习能力和诊断下的性能故障样本有限,一个residual-attention卷积神经网络(RA-CNN)构造识别故障信号的深层特征,和metalearning策略基于参数梯度优化应用于RA-CNN炼油诊断模型的学习过程。最后,通过实验验证了该方法的可靠性分析数据集的公共关系。

1。介绍

在现代工业生产和应用的过程中,滚动轴承中扮演着重要的角色在机械设备的工作效率的核心组件之一工业旋转机械设备(1]。滚动轴承零件的复杂结构和操作在一个贫穷的环境。他们在高负载状态操作很长一段时间。一旦轴承运行发生故障时,它会增加巨大的操作和维护成本和未知的安全风险2,3]。因此,根据滚动轴承故障诊断的应用可以监视和维护设备更加实时有效地避免工业生产事故。近年来,数据驱动的应用智能工业机械故障诊断领域的快速发展。传统的故障诊断技术依靠专业知识和专家经验机制,结合信号处理方法(4- - - - - -6)和模式识别技术(7- - - - - -9从传感器数据中提取有效的特征,以提高故障诊断精度。你们et al。10)提出了一种基于变分模态分解的信号处理技术(VMD)和机器学习基于粒子群优化的故障诊断模型(PSO-SVM)。该方法重建的振动信号,计算多尺度熵位移(MPE)构建多维特性数据和惩罚参数进行了优化 和内核参数 通过算法改进支持向量机分类器的性能。陆et al。11)使用堆栈去噪autoencoder (SDAE)从振动信号中提取故障特征包含了复杂的环境噪声和运行状态的波动对故障识别和分类。成功实现上述传统的故障诊断方法往往取决于分类特性的可行性从训练数据中提取低维空间。然而,对于传感器数据提取复杂的工作条件下,很难获得代表特性通过先验知识来区分不同故障类别的数据。

深度学习的成功模型在计算机视觉领域,CNN在高维空间的自适应特性学习方法已经引起了学者的注意(12- - - - - -14),温家宝et al。15)提出了一种数据预处理方法,将时间序列信号转换成灰色的图像,和故障诊断是由自适应特征提取基于Lenet-5卷积神经网络。姚明et al。(16)和Ravikumar et al。17]介绍了剩余块学习训练深层神经网络,以确保模型有足够的深度和缓解梯度消失和过度拟合的问题。然而,振动信号序列太长,缺乏与当地空间相关特性,从而导致的偏差特征提取在时间和空间维度。为了解决这个问题,王et al。18]提出一种注意力机制(AM)的图像分类。它提高了底层的感受野特性通过多个up-downsampling操作,所以,深层网络也可以捕捉各种当地的依赖性和获得丰富的上下文特性,模型可以提取更多的代表深刻的特性。你们et al。19]提出了一种时间卷积网络(TCN)基于注意机制,通过因果卷积剩余块中提取有效的地方特色和使用注意机制,使网络倾向于注意故障特性,以便模型检测和诊断故障类型,提高故障诊断的效率要快多了。男人et al。20.]提出了高光谱信息识别结合残留Res-CBAM模型模块和关注模块。提高了分类模型的性能通过引入CBAM计算通道和空间模型的关注和重新分配重量参数。然而,最上面的深度学习模型的成功应用程序依赖于昂贵的计算资源和大量的平衡和注释的训练数据21),但在实际的工业生产应用程序中,没有足够的故障数据训练神经网络模型的支持。原因如下:(1)工业机械和设备的内部结构非常复杂,及其故障将严重阻碍工业生产的进步。(2)滚动轴承的降解周期时间很长,这带来了巨大的困难,收集足够的故障数据;(3)工作条件的非平稳变量下的轴承动态特性极大地引起更多的麻烦故障数据收集和正确识别;当前机器学习分类器算法惯性倾向于多数样本。然而,在实际应用中,它是少数正确分类样本(更有价值22]。因此,对训练数据的不平衡的研究已成为一个焦点在当前工业领域故障诊断(23- - - - - -25]。

目前,取得了一些研究成果在数据不平衡。例如,如信号翻译方法,噪声,时间延伸,提出了重采样来增加训练数据的数量和多样性人工(26- - - - - -29日]。合成少数过采样技术(打)30.)是使用最广泛的数据扩增方法之一。这种方法使用一些样品和他们组成的特征空间 - - - - - -最近的邻居合成新的样品,可以有效地减少过度拟合现象,但容易放大噪声和导致相邻类别数据的模糊边界。魏et al。31日)提出了一种基于集群majority-weighted少数过采样技术(cluster-MWMOTE),进一步提高了模型的适应的内部不平衡故障实例。易et al。32)增强少数民族的数据聚类的基础上,在少数群体样本聚合成几个集群,和新生成的样本邻集群之间的线性插值。然而,由于边界效应的存在,很容易产生噪声样本基于最近邻原则,导致样本类之间的重叠,和干扰模型学习真正的原始数据样本的空间分布。因此,为了解决这个问题,传统的数据合成方法不能深特征数据并生成高质量的样本,生成对抗网络(GAN)提出的格拉汉姆·古德费勒et al。33]。作为近年来最流行的数据增强方法,氮化镓可以生成pseudoimages,音频或视频基于真实数据集来解决训练数据不平衡的问题。赵和元34甘]提出了一种改进的模型。改进GAN引入一个辅助分类器,以便培训过程和一个autoencoder-based方法估计生成的样本的相似度,从而提高质量和多样性生成的样本。尽管故障诊断基于氮化镓的应用非常广泛,不稳定等问题,模态崩溃,和弱梯度在GAN训练过程35- - - - - -38)很难在实际工程应用这些模型。因此,为了克服错误的数据不平衡的挑战,研究社会需要重点发展一个有效的计算模型和快速的学习能力,可以适合任务需求,即使数据集是不平衡的。

最近,性能优越的metalearning few-shot解决问题的故障诊断已逐渐引起了学者们的焦点(39- - - - - -42]。模型不可知论者metalearning (MAML)是一个metalearning方法基于芬恩等人提出的参数优化。43),展示了良好的泛化能力,在图像识别处理少量的训练样本下的新任务。Yu et al。44]提出一种基于梯度优化metalearning故障诊断模型(45),优化模型的初始参数网络通过场景训练机制,以便模型还可以执行故障诊断效率和快速的情况下有限的训练数据。Zhang et al。21)暹罗网络应用于故障诊断的数据不平衡。暹罗网络是用来测量相同或不同的样本对之间的距离来确定他们的相似性,从而达到高精度故障诊断有限的样本。Vinyals et al。46few-shot分类]提出了一种匹配网络,设计了一个短期和长期记忆网络实现基于指标metalearning架构,以避免微调新任务的要求。陈等人。47)提出了一种改进的原型网络更好地提高故障分类模型的识别性能的情况下设置一个不平衡的数据多尺度特征提取器和一个适当的距离测量功能。上述metalearning方法可以解决数据不平衡的问题在当前工业智能故障识别。few-shot学习的优势可以进一步减少训练数据不平衡的问题,提高模型的学习能力对于复杂的工作条件。我们提高轴承故障诊断的框架下metalearning机制和总结以下贡献:(1)本文提出一种metalearning网络(RA-CNN)集成残余学习模块和注意力机制。该方法可以有效地提取故障特征与故障数据有限,避免模型过度拟合(2)本文提出了为数据增加FSDA-SMOTE。与传统的数据扩增方法相比,该方法可以更有效地减少噪声数据的干扰,避免模糊分类边界(3)本文提出一种 - - - - - -的方式 - - - - - -拍摄情景训练机制来完善功能网络模型的学习过程。这种方法使学习更一般的模型从多个不同的metatasks故障信息

本文的其余部分如下:部分2概述了相关理论背景。部分3详细描述了该方法和框架。部分4和部分5分别实验分析和结论。

2.1。Metalearning

Metalearning称为“学会学习”,这是通常用于解决few-shot图像分类。近年来,metalearning研究通常可以分为三个不同的类别,包括优化的初始化参数metalearner快速适应新任务(43- - - - - -45),生成metric-learning网络通过判断样本之间的特征相似性对(21,46)和递归神经网络模型学习记忆存储功能(47]。不同于传统的深度学习方法,metalearning是一个灵活的框架,学习经验从多个相关任务,这依赖于获得的经验来改善其性能目标任务没有从头训练(42]。Metalearning旨在生成一个通用算法基于学习元知识的能力 从不同的任务 对于一个给定的任务 ,这种方法使模型具有较强的泛化能力,加快任务集的适应性 有不同的分布。描述所示 在哪里 代表了损失函数获得的训练数据的任务 使用模型 初始化网络的参数 值得注意的是, 在跨多个metatasks metalearning不断更新学习过程,和 获得任务学习后可以减少损失尽可能多的新任务。

2.2。合成少数过采样技术(打)

击杀,一个常见的过采样方法,提出了拉等人(2002年30.]。杀不仅解决了重复问题引起的过采样,也有效地减少了过度拟合通过创建一个积极的综合特征空间的几类及其实例 最近的邻居(通常, 是5打)。假设一个数据集包含 积极和 负样本( ),为了平衡正负样本, - - - - - - 必须创建合成负样本。首先,样本 是随机选择从n负样本。第二,选择6最近的邻居 该实例所示的欧氏距离来确定的 在哪里 表示样本点的身份 是一个随机数从0到1,保证少数新样品吗 由线性插值生成如图1。重复上面的步骤来获得额外的合成少数样本。因此,击打在处理不平衡数据已被证明有效。

3所示。提出的方法

下的轴承故障诊断数据不平衡可以被视为一个典型的few-shot分类问题,传统的深度学习模型是难以解决的。因此,基于先进的metalearning MOFD方法理论,提出了和流程图如图2。整个过程分为四个部分:(1)在数据增加,轴承振动数据的不同故障类别收集,FSDA-SMOTE用于生成辅助数据,那么数据集是扩大和平衡;(2)在数据预处理中,原平衡的振动数据转换成由STFT时频图像(TFI);(3)在metadataset建筑,TFI数据集用于组织metalearning任务根据情景培训机制;(4)最后,RA-CNN用来微调的网络参数,直到实现最优参数提取的深层断层特征从多个metatraining TFIs任务和磨的任务,和MOFD最佳网络参数可以有效地实现故障分类在数据不平衡。

3.1。数据增加

一个叫做FSDA-SMOTE新的过采样技术的缺点提出了改进传统KNN-based过采样方法(32]。FSDA-SMOTE过滤器异常样本由组内距离的平均值(27]。同时,为了避免合成新的样本之间的模糊边界类,采用距离加权法选择的原始样品合成、集群和少数样本。最后,一个新的少数类样本是根据合成少数类样本的空间密度差集群。算法不仅可以丰富的少数类样本的内部空间集群也避免混淆不同阶层之间的边界。

的细节FSDA-SMOTE算法合成新的少数样本表示算法1。为了方便起见,这些集合的合成由少数模式 样品在 , , 结合得到一套新的,所代表的是哪一个 ,在哪里 代表少数类样本和去噪后的多数类样本。的算法11 - 15、线上面的伪代码适合去噪数据样本。行16 - 20是少数样本聚类过程。21 - 30行密度自适应数据生成基于类内样本密度差异。

3.2。数据预处理

使用加速度计传感器收集轴承原始振动信号是最常见的方法在故障诊断领域41]。然而,原始信号不能直接显示时间信息和故障特征之间的关系。因此,它更有利于学习的故障特征的模型转换成频域信号频域特征稳定通过快速傅里叶变换(FFT)。然而,只有依靠时间和频域一维分析,该模型不能捕获轴承各种故障状态的内部信息来学习和转移应用程序。因此,二维时频分析已经成为一个重要的工具来分析机械振动信号的故障诊断(40,42]。时频分析方法中引用本文短时傅里叶变换(STFT)及其过程如图3。在图3, - - - - - -轴, - - - - - -轴,亮度TFIs代表时域,频域,分别和振幅。

输入:多数的数据 ;少数数据
初始化:最近的邻居 ;
输出:一组 新样品
1:获得 最近的邻居的 和组成的集
2:
3:
4:获得 最近的邻居的 和组成的集
5:
6:
7: :
8: :
9: =之间的最小欧氏距离
10: =之间的欧氏距离 ,
11:如果
12:
13:如果
14:结束了
15:结束了
16: 样品的数量 做的事:
17:如果 :
18:新的集群 =
19:如果
20:结束了
21: 集群的数量Q:
22:中心 - - - - - -意味着集群算法
23:每个样本 :
24:半径( )=的平均距离 - - - - - -最近的邻居
25: ( )=的数量 包含在一个圆的半径
26日: ( )=的总和 在当前spreadnumber圆
27日:密度
28:合成新的样本
29日:
30:结束了
31日:结束了

削减STFT原始信号 段段通过有限尺度窗口函数 并应用FFT的每段时间轴 最后,TFI形成时频域信息。显示了STFT的数学公式

STFT处理的时频分辨率的谱图是由窗口函数的规模。因此,可以获得最好的时频分辨率,通过选择合适的窗函数宽度。的时频分辨率 计算为: 在哪里 意味着排下来 代表的长度的信号。为了减少频谱泄漏,窗函数的规模 本文应用。 重叠点的数量, 是点的数量参与傅里叶变换。

3.3。Metadataset建筑

- - - - - -的方式, - - - - - -拍摄情景训练机制。” ”表示的类别数量的任务必须分类,和“ ”代表了可用的图像数量从每个类别学习。例如,模型共有50图像在10-way每个类(5),5岁学习问题,用于学习和10类的测试图像进行分类。确保RA-CNN学习更一般的故障信息从多个不同的任务,本文提出了使用数据增强前后的TFI ,分别。在准备的metatraining集, TFIs从每个类型的失败是随机抽样,和 TFIs用于形成10-way - - - - - -拍摄支持。支持的每个任务集用于列车故障分类模型,并提供相应的反馈,损失和查询的数据集是用于验证的分类影响训练模型。这样重复很多次,整个metatraining阶段的任务分配,任务的磨设置以同样的方式得到,但值得注意的是, 从平衡数据集获得数据增强后,虽然 从最初的不平衡的数据集。

3.4。RA-CNN架构

CNN已被证明有良好的性能,当原始振动数据处理STFT特征提取在神经网络训练(44),而各种各样的cnn不能学好特性的TFI原始旋转机械故障数据有限。因此,提出了高精度智能故障诊断metalearning网络模型RA-CNN结合二维卷积神经网络(2 d-cnn),剩余的学习,注意机制。在训练数据有限的情况下,为了促进更有代表性的图像特征的提取模型,我们将注意力机制和2 d-cnn故障类型的模型加强学习重量特性与少数样本为故障特性,提高其学习能力。然后,为了避免过度拟合模型,我们把剩余的学习模块添加到模型。自从metalearning关注轻量级网络的优化,RA-CNN的支柱是CNN卷积四层,如图4,这是决定由几个仿真实验的特殊结构ResNet [20.]。

3.4.1。剩余的学习

剩余的学习技术提供一种简单的方法来训练神经网络,一层一层的深度。然而,随着层的扩张,与深层神经网络可能无法学习一些简单的函数;在某个时期,精度可能会停滞不前,甚至下降,导致模型过度拟合问题。在有限样本的情况下训练网络模型过度拟合的问题变得更加严重。因此,剩余块介绍训练网络,学习和神经网络重建的层是简化根据剩余函数的输入层,以避免模型过度拟合的问题。剩余的学习过程如图5,剩余的功能表达学习方程所示(6)。 在哪里 ,分别代表输入和输出向量的残块, 是剩余函数, 剩余块内的重量值。

向前传播的特征向量的CNN,为了确保一致性的输入和输出向量的维度,如果规模变化发生在残块,内部的卷积运算的变换矩阵 是用来调整的尺寸标识映射输入的一部分吗 同时,考虑到增加的比例残余误差可以减少模型训练的难度,系数的基础上添加的原始结构调整价值产出和剩余误差的总和,如所示

3.4.2。注意机制

本文关注机制CBAM引入metalearning提取更具表达性的网络结构特性,如图6。CBAM模块由两个不同的关注,和这两个关注模块互补缺陷,使模型更加注意特征表示和空间的定义。两个推断关注体重频道维度和空间维度的系列,然后将它与剩余的卷积结果网络调整功能,突出特征映射的目标特征,断层的识别能力,提高模型的特性。

频道关注模块(CAM)根据不同渠道的依赖特征映射的响应程度识别目标调整功能映射根据不同的响应程度和计算每个通道使用多层感知器的重量。通道具有高响应度表明它类似于识别目标和分配更高的重量;通道与低反应程度表明识别目标的巨大的差距和分配较低的体重。凸轮的结构如图7,和实现步骤如下:(1)地图的输入特性是最大池和平均池,分别。通道的平均池实现压缩特性,和最大池可以收集目标的特征信息;(2)汇集功能地图发送到多层感知器组成的完整的连接层、汇聚层,平均和最大池层参数共享;(3)多层感知器的输出结果和总结,然后,该频道的关注特性映射输出通过s形的激活函数。因此,地图频道注意特性的计算公式 所示 在哪里 表示乙状结肠函数, 代表共享的网络延时的重量。 代表一个输入特征映射。

学习神经网络提取特征的基于图像特征映射的细节从空间维度信息通过空间模块(SAM),注意补充凸轮的输出。其结构如图7。实施步骤如下:(1)输入特征图顺序汇集和平均和拼接两个特征图通道;(2)连接功能地图发送到卷积层进行特征提取,然后,空间的关注特性映射最终输出通过乙状结肠激活函数。一般来说,地图频道注意特性的计算公式 所示 在哪里 表明一个卷积 过滤器的大小。

3.5。Metalearning过程

的实现提出了MOFD期间,学习过程的特点是序列集,每集包含metatraining和metatesting。RA-CNN作为基本的学习者表达 在这里, 神经网络的初始权值, 的特征向量输入。在metatraining metaparameter 初始化分类模型 ,在哪里 的每一项任务 是不同的。 分为支持集 和查询集 ,和亚当是用于更新参数 基于 最后,metaparameter 据更新多个metatasks的学习吗 并获得最优参数 metatraining的方程所示(12)。 在哪里 表示metatasks的数量。 表示内循环学习速率。

其中,损失函数 损失函数适用于测量的性能更新RA-CNN模型轴承故障与不平衡数据分类,及其数学形式的更新RA-CNN二进制交叉熵损失函数所示 在哪里 是输入向量和标签。训练数据集的支持 的每一项任务

然后,更新RA-CNN模型 用于外循环优化基于查询集吗 ,和所有查询集的全损任务采用以下形式:

为了准确、快速分类下轴承与未知的轴承数据有限样本和梯度大小,我们的metaobjective是多个任务中找到最优模型参数通过最小化总损失 然后,metalearning参数后内循环优化 的更新和学习速率β:

在metatesting阶段,RA-CNN模型参数 可以调整基于磨支持搜索最佳模型参数设置 可以完整准确的故障分类查询集。提出的伪代码实现MOFD介绍的算法2。RA-CNN的参数如表所示1

输入: , 内部和外部学习速率 ,适应气候变化的措施 ,许多few-shot任务 ,metaepochs
输出:轴承故障诊断的分类精度
1:随机初始化
2:分裂
/ Metatraining阶段 /
3:
4:从{随机创建n任务 }
5:
6:创建支持组 和查询设置 从一个任务
7:评估 从公式(11)
8:更新 使用内在的学习速率 和损失
9:结束了
10:最优参数 更新从公式(13)
11:结束了
/ Metatesting阶段 /
12:
13:随机创建 - - - - - -的方式, - - - - - -拍摄few-shot任务从
14:重复步骤5到8,获取更新
15:获得最优参数
16:预测故障类标签 基于
17:计算分类精度
18:结束了

4所示。实验分析

本节将凯斯西储大学(CWRU)轴承数据集实验算例,验证是否MOFD模型可以有效地解决数据不平衡下的轴承故障诊断问题。10-way诊断情况进行CWRU数据集。在实验的过程中,讨论了相关的控制变量在一定范围内,最后与当前先进的相关方法来确定的可行性和先进性在本文提出的故障诊断模型。

4.1。数据集介绍

CWRU数据集是一个广泛使用的轴承数据集智能故障诊断旋转机械。如图8,实验设备包括1.5千瓦电机,电力测试仪,电子控制器,扭矩,和加速度传感器,和单点故障损坏内部,外部,和球轴承模拟,分别通过电火花。断层破坏直径是0.18,0.36,0.54,和0.71英寸。正常轴承和损坏的轴承的振动信号与单点缺陷收集12 kHz的频率或在四个不同的电动机负载下48 kHz。从驱动skf - 6205收集的实验数据,其采样频率相当于12 Khz。在表2,轴承信号数据分为10类(一个健康状态和9故障状态)根据不同故障轴承的直径和故障状态(正常、内座圈外环,和球)。

4.2。数据增加

如表所示2,不平衡比率每个故障数据和正常数据集之间应设置至少小于0.2模拟数据的实验条件不平衡。数据集是一个不平衡的数据集的不平衡比率0.05,720份正常样本和36个样本为每个其他9故障类别;数据集B是一个不平衡与不平衡数据集比0.1,720份正常样本和72个样本为每个其他9故障类别;和数据集C是一个不平衡的数据集的不平衡比率0.2,720份正常样本和144个样本为彼此9故障类别。FSDA-SMOTE使用不平衡数据集A, B, C,加强数据和获得平衡的数据集 , ,为每个类别样本的数量是720。此外,每个类别都有一个测试集与训练720个样本来验证故障诊断模型。数据集D是一个测试集,100个样本在每个类别和共1000个样本。

阶段的抽样数据,原始信号数据分段平均订单。这些片段之间没有重叠,段的长度是512。频谱信号短时傅里叶变换得到的片段,更重要的是物理信息和包含更多有用的故障诊断信息。在图9不同故障状态下的光谱信号,故障直径0.007英寸引入频谱空间和样本故障频谱信号。其中,图左边的部分9分别代表了原始轴承振动信息在不同故障状态下的速度1797 RPM,州1797 RPM的速度,和正确的图的一部分9分别代表了短时傅里叶变换后的频谱信号在不同故障状态。为了测试FSDA-SMOTE算法的有效性在有限的不平衡轴承故障诊断,其他几个数据扩增方法比较,包括2过采样算法(击杀,MWMOTE)和2网络生成模型(LSTM [15甘],[31日])。也就是说,FSDA-SMOTE算法在数据图的扩张阶段2被替换为另一个数据扩增方法。过采样算法的参数设置如下:数据增强算法使采样故障实例的大小一样的正常实例;的 击杀的最近邻参数和MWMOTE是5。MWMOTE FSDA-SMOTE集群的数量是9。此外,为了突出新样本的空间分布的差异所产生的不同的抽样算法,数据表2与可视化应用程序为例T-SNE每个抽样算法。

10显示数据集的投影分布及其合成样品在二维空间中,通过样本密度是可见的区域在不同颜色标签,进一步直观地说明了分布不同的样本类别之间的差异。然而,一些样品也渗透到彼此以外的样本密度区域,甚至导致类之间的模糊边界和异常数据。这时,常常需要考虑是否将他们视为离散点。不同的采样算法对数据集的处理结果如图10。图10 ()原分布显示了各种特征空间的样本不平衡数据集,每个类别的数据分布是混乱的,所以不可能设置边界类之间的单独的每个类别的样本。图10 (b)使用杀算法提高少数断层数据的数据集。

然而,基于传统的合成数据打很容易接收噪声数据的干扰和影响故障数据的实际分布,从而降低合成样品的质量。在图10 (c),虽然MWMOTE可以通过去噪和分配信息重量优化少数民族边界少数故障样本,权重分配的差异也会导致部分故障示例集群(如IR_007 B_021)被忽略,因此未能正确学习故障样本在组织边界内。图10 (d)提出了使用FSDA-SMOTE方法。在这种方法中,合成原始样品和样品之间的相似性是增强通过定义样本的空间密度在少数集群故障样本。由于样品的空间密度图生成10 (d)、样品合成范围更接近中心的少数示例集群。类之间的边界变得非常清晰,这有利于提高合成样品的减少程度。

如表所示3不平衡数据,B和C是平衡与不平衡比率通过使用不同的数据扩增方法和平衡数据 ,B ,和C 得到了。支持向量机作为分类模型与杰出的稳定性,介绍了开展故障诊断和分类不平衡,平衡实验数据集,分别。实验重复10次,10倍的平均精度故障分类作为最终判决结果。从表可以看出3不平衡的训练数据将明显影响模型的分类性能,可以有效地减少这些问题的影响通过扩大故障数据(训练数据的少数民族)通过数据扩增方法。具体来说,FSDA-SMOTE生成的平衡数据集 大约是4.83%,8.03%,和7.73%高于不平衡数据集;打大约是4.69%,3.83%,高出1.68%;MWMOTE增加3.8%、4.87%和2.26%。LSTM增加1.94%、4.44%和7.43%,和氮化镓增加了6.87%,7.37%,4.32%。上述实验数据证明的故障识别能力平衡数据集获得的数据增加比不平衡的数据集,这表明数据扩增方法的可行性和有效性求解故障识别精度低的问题,在数据不平衡。此外,重新平衡数据集的平均精度与不平衡比率也是不同的轴承故障诊断通过使用相同的数据扩增方法。从数据集,数据集C、不平衡率的逐渐增加,生成的复杂平衡数据集的平均精度较高。从这个结论,可以推断出,增加训练数据的数量有利于更好的学习故障诊断模型的信息,这也证明的必要性增强的数据不平衡。最后,FSDA-SMOTE给更好的平均精度三个不平衡比率比其他数据扩增方法。总之,实验结果证明的可行性FSDA-SMOTE合成样本和样本的可靠性质量基于CWRU的数据集。

4.3。数据预处理

如图3,重新平衡数据集转换成一维时域信号通过STFT声谱图图像。STFT的过程中,不同的窗口尺度,重叠点,和傅里叶积分将获得不同的时频分辨率。促进在CNN池,最后一行和最后一列的时频分辨率是奇数时被删除。这个重新平衡数据集 选择基于FSDA-SMOTE RA-CNN分类器的训练数据集测试来得到最优时频分辨率图像输入的大小。RA-CNN输入图像尺寸表中列出4

为了避免意外,20个实验是重复获得平均测试精度和时间消耗。诊断结果如图11。测试精度大于85%,这表明,基于二维时频特征提取图像输入可以更深层次的故障特征提取功能。当输入图像大小 ,故障识别精度平均超过94%。然而,随着图像尺度的增加,消耗的时间故障诊断也显著增加。综合考虑测试准确性和时间成本,规模128和时频图像的窗口函数的规模 STFT的默认参数。轴承振动信号的时频图像short-time-Fourier后10不同健康状态转换图所示12

4.4。实验设置

Metalearning实验应用小说卷积神经网络模型RA-CNN 4卷积层为骨干结构训练Metalearning分类器下的故障诊断数据的不平衡,也包含了时间和空间剩余学习模块和关注模块。metalearning实验过程中,亚当优化器使用(学习速率 )内循环优化和SGD动量( )外部优化。metalearning率 用于metaupdate步骤(10号线定位的算法2)有一个初始值0.1 metaiteration增加和变化动态。子任务N的数量 分别是800和200。metalearning的适应措施(m)是50,和所有metalearning实验允许竞选前4000 metaepochs微调。为了促进公平的比较与其他故障诊断模型,实验中使用的网络条件和hyperparameters尽可能不应改变时,没有必要。输入图像的大小 和规范化[0,1]之间的像素值。早期停止策略是用来避免过度拟合,获得最佳模式。为了避免偶然性可能发生一个实验,我们重复20实验对于每一个验证过程,和平均结果尽可能接近真实模型的诊断结果。所有的模型提出了测试在同一操作环境;具体内容如下:英特尔至强(R)的CPU e3 - 1231 V3 @ 3.40 GHz, NVIDIA GeForce RTX2080Ti, Ubuntu18.04, Python3.6, CUDA 11.2, TensorFlow 2.7。

4.5。实验结果分析

为了进一步证明的可行性和优越性MOFD的错在数据分类能力不平衡,六个基线模型提出了比较的故障诊断结果MOFD方法,其中包括VMD-SVM [7],SDAE-DNN [8],CNN [10],Res-Net [12],Instance-TL [35),和暹罗网络(41]。考虑传统模式之间的差异和metalearning模型在数据训练方法中,基于10-way MOFD和暹罗网络提出了分类任务,和不同的数据增强技术用于1次,5岁,10-shot学习。的准确性和损失曲线1,5日和10个照片是画在数据集,MOFD metatraining期间的变化趋势并观察metatesting自我测试。2000年第一个迭代,metatraining的准确性和metatesting显著提高,然后减慢,最后,接近100%。图(13日)表明MLFD模型没有过度拟合训练有素。图13 (b)显示了1次的损失减少的过程,1200年后趋于收敛的迭代模型。数据13 (c)13 (d)说明5岁和数据的变化13 (e)13 (f)是10-shot,其过程类似于1次,但10-shot最初的损失是一个比别人更低的价值,因为10-shot可以获得更多轴承故障信息训练模型比1次或5岁。因此,我们CNN的故障分类结果相比,MOFD1, MOFD5,和在不同metatask MOFD10集,分别验证metatask集的数据量的影响在模型故障特征的学习。图14显示的准确性MOFD 10-shot表现好于MOFD1-shot在所有6实验变量数据集,和值得强调的是,FSDA-SMOTE数据增加用于解决数据集不平衡在所有六个实验。

确定metalearning的训练方法后,结果表明,模型基于metalearning策略可以更好地识别和分类错误通过比较MOFD和基线CNN没有metalearning,结果如图所示14。很明显,MOFD六集的诊断性能很好,但CNN的性能波动会根据数据不平衡的程度。特别是在实验与数据集,CNN的准确性仅为73.74%,低于MOFD10-shot 9.52%。这是由于不平衡的数据集将分类边界,改变模型的原始数据分布的感知。MOFD有能力获得通用轴承故障先验知识通过已知的故障数据,并将它们应用于故障诊断的数据不平衡。基线CNN很难有效地获得足够的故障特性下的轴承故障诊断数据不平衡基于简单网络结构和有限的样本。

最后,上面提出的七个方法将与对方通过CWRU轴承数据集。表5显示每个故障诊断模型的故障诊断结果在不同数据扩增方法。一致的数据集使用的故障诊断模型与不平衡比率0.05作为训练数据来放大的内部不平衡数据集。

如表所示5,几乎所有模型的平均精度高于平衡数据集在不平衡数据集。将基于实例的学习模型(instance-TL)至少改善(2.61%),和VMD-SVM模型最改善(17.97%)。此外,实验结果表明,在这些数据扩增方法中,FSDA-SMOTE生成的故障数据有效地提高了诊断模型和性能得到最好的或高于平均水平的比较多的方法和模型。因此,提出基于metalearning MOFD模型框架下的轴承故障诊断可以有效地解决这一问题的数据不平衡。

5。结论

本文提出了一种方法基于metalearning框架来描述故障诊断的数据不平衡问题作为few-shot基于图像分类的学习问题。基于时间序列的相关性轴承振动信号频域特征的不变性,时频变换技术STFT用于学习轴承的深层特征信号从形象层面,和FSDA-SMOTE数据扩增方法集群班上少数样本定义样本的密度并生成高质量的故障数据来提高训练数据的多样性。进行了比较,验证了该方法的有效性与几个数据增强技术。此外,metaoptimization (MOFD)故障诊断方法 - - - - - -的方式 - - - - - -提出了拍摄metalearning训练方法。相比与传统的利用CNN metalearner, MOFD使用基于残余的RA-CNN学习和故障特征提取的时空注意力机制,这不仅可以避免过度拟合由于故障训练数据有限,但也提高了故障特征的提取关键metalearner网络的能力。基于公共CWRU数据集的实验结果表明,相对于传统方法,MOFD方法可以显著提高数据不平衡问题,和RA-CNN可以获得更多代表metatask有限的数据下的故障特征信息。此外,它有更好的故障分类性能和良好的鲁棒性和泛化。因此,该方法具有一定的参考价值在解决数据不平衡下的轴承故障诊断问题。

数据可用性

数据是可用的。论文的实验数据采用轴承数据集来自凯斯西储大学(CWRU) (https://engineering.case.edu/bearingdatacenter/welcome)。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究是由湖南省自然科学基金资助(2020号。2022 jj50002 jj6086, 2021 jj50049)