研究文章|开放获取
徐娟,徐鹏飞,魏振春,丁旭,石磊, "DC-NNMN:基于深度少动学习的跨部件故障诊断",冲击和振动, 卷。2020, 文章的ID3152174, 11 页面, 2020. https://doi.org/10.1155/2020/3152174
DC-NNMN:基于深度少动学习的跨部件故障诊断
摘要
近年来,深度学习已经成为工业设备智能故障诊断中的热门话题。在实际工作条件下,如何对带有微小标记样本的不同机械部件实现智能故障诊断是一个具有挑战性的问题。这意味着使用一个组件样本进行训练,但使用另一个组件样本进行测试的问题还没有解决。本文提出了一种基于少拍学习的深度卷积最近邻匹配网络(DC-NNMN)。构造一维卷积嵌入网络提取高维故障特征。cos距离被归并到K-最近邻法建模高维故障特征中,未标记样本从查询集到标记样本从支持集的距离分布。构建多个少镜头学习故障诊断任务作为测试数据集,然后通过多任务训练优化网络参数。从而得到一个鲁棒网络模型,用微小的标记故障样本对不同分量中的未知故障类别进行分类。利用CWRU轴承振动数据集、实验室搭建的轴承振动实验平台选取的轴承振动数据集和另一个齿轮传动跨部件试验数据集验证了所提方法。实验结果表明,在每种故障类型只有一个样本的情况下,该方法对齿轮和轴承的故障诊断准确率分别达到82.19%和82.63%。提出的DC-NNMN模型为解决少镜头学习中的跨部件故障诊断提供了一种新的方法。
1.介绍
在复杂的工业系统中,故障诊断是保证设备和人员安全的重要问题[1,2].近年来,深度神经网络模型学习大量样本故障特征的能力已经在故障诊断领域得到了广泛的应用[3.,4].然而,基于深度学习的故障诊断的成功与否取决于以下两个条件:(1)大量的有标记故障数据;(2)类别空间相同、分布一致的训练数据和测试数据[5- - - - - -7].
目前,许多学者关注的是有限标记样本下的故障诊断。迁移学习是近年来引入的一种方法,它利用源域已有的知识来解决不同目标域的故障分类问题。卢等人[8]提出了一种域自适应的深度神经网络模型,实现了不同负载下的故障诊断[9]提出了一种基于无标记目标域数据的滚动轴承故障诊断的深度迁移学习方法,利用最大均值差异最小化训练数据与测试数据特征差异的损失。Hang等人[10]提出了一种基于改进的SMOTE算法的主成分分析(PCA)方法,并将其应用于高维不平衡故障数据领域。为了增加样本集的大小。
许多学者利用GAN的思想实现了振动样本的生成,用于故障诊断。Cabrera等[11]采用gan模型评估各少数故障模式的数据分布。赵等人[12]提出了一种可切换归一化半监督生成式故障诊断方法网络,通过生成样本辅助模型训练。从而解决了测试条件下故障样本标记不足的问题。
上述研究可以解决深度网络中训练集和测试集具有相同类别空间时,标记数据不足的故障诊断问题。用一个分量的标记数据训练的模型不能对其他分量的故障类别进行分类,因为即使可以从其他分量获得标记数据,但不同分量的故障类别空间和数据分布是不同的;我们称之为跨部件故障诊断。
少镜头学习致力于从几个例子中理解新的类别,是图像分类领域中非常流行的话题。一些实现方法包括基于模型、基于指标和基于优化的方法。基于模型的方法旨在通过设计模型结构,用少量的样本快速更新参数,并直接建立输入的映射函数x和预测值 ,例如增强记忆的方法[13]及元网络[14].
基于度量的方法通过测量批处理集样本与支持集样本之间的距离来完成分类。基于指标的典型方法是Siamese Network [15]、配对网络[16]、原型网络[17],等等。
基于优化的方法由Finn等人表示[18他提出,普通的梯度下降方法很难适应少镜头的场景。基于优化方法的思想通过调整优化方法来完成少镜头分类任务,使方法不受参数大小和模型结构的限制。
然而,由于图像数据与振动数据的分布差异,现有的少镜头学习模型在故障诊断领域不能很好地适应。为此,本文提出了一种基于匹配网络的跨部件少镜头学习故障诊断方法,并通过一系列实验对该模型进行了验证。本研究的主要见解和贡献总结如下:(1)提出了一种基于深度卷积最近邻匹配网络(DC-NNMN)的智能故障诊断方法。设计了一个四层卷积网络来提取高维故障特征。余弦距离合并到K-最近邻法模拟高维故障特征中来自查询集的未标记样本与来自支持集的已标记样本之间的距离分布,使同一类别的故障样本彼此接近,不同类别的样本相距较远。将一个部件的查询集和支持集样本分解为不同的元任务,学习模型在故障类别变化时的泛化能力;这样,在不改变网络模型的情况下,就可以对另一个部件的未知故障类别进行分类。(2)我们使用凯斯西储大学(CWRU)轴承振动数据集作为训练集,分别从实验室搭建的实验平台和另一个齿轮振动数据集中选取轴承振动数据作为实验测试集,以证明本文方法的可行性。实验结果表明,基于轴承故障数据训练的模型在新的轴承和齿轮故障类别上都能实现准确的故障分类。该方法实现了基于微小故障样本的跨部件故障诊断。
本文的其余部分组织如下。部分2介绍了DC-NNMN的基本原理。部分3.详细介绍了所提出的深度卷积最近邻匹配网络模型(DC-NNMN),包括问题描述、模型结构和优化目标。节4,进行了实验验证和相应的分析。结论在本节中得出5.
2.预赛
2.1.很少有镜头学习
少拍学习的主要挑战是如何从几个例子中理解新的类别。具体来说,少镜头学习的训练集包含多个类别,每个类别有多个样本。在培训阶段,在训练集中随机选择类别,每个类别进行选择样品(总共样本)作为支持集 .然后选择从剩余的数据Categories示例用作查询集的模型。该模型的目标是最小化查询集上的预测损失 ,通过提供支持集作为输入。也就是说,模型需要学习如何区分这些类的支持集中的样本。这样的任务叫做C-way k拍摄的问题。在few-shot学习,通常少于20。和可以表示为:
2.2.K最近的邻居
K-最近邻(KNN)最初由Cover和Hart于1968年提出[19]。这是一种相对成熟的非参数统计分类和回归方法。其核心思想是,如果K-特征空间中样本的最近邻属于某个类别,该样本也属于该类别。取一组具有已知标签的数据{( ),( ),…,( )},是样本的特征向量吗我.和是它的标签, .有关训练样本(x,y), KNN算法搜索K最接近的实例基于给定的距离度量,记为 .然后计算样品的标签根据决策规则进行测试: 在哪里我为度量相似性的距离。因此,距离度量确定后,K-最近邻算法只有一个参数K. 如何选择一个最佳方案K值取决于数据集本身。如图所示1,红色圆圈为测试样品,如果K= 3,则为绿色方块,如果K= 5时,它被归类为黄色三角形。它具有简单、易于理解、易于实现、不需要估计参数、不需要训练等优点。它特别适用于多分类问题。
3.该方法
3.1.问题描述
本文将基于匹配网络的少拍学习思想应用于跨类别空间的故障诊断。我们定义跨组件的少枪学习故障诊断问题如下:(1)机械部件A (MCA)和机械部件B (MCB)属于不同的部件,故障类别不同。(2)训练集 中包含了许多类别的已标记故障样本,为振动数据,是否有相应的故障标签、和为数据的个数。(3)给定MCB的支持集 ,它包含不同的故障类别,每个类别包含样品, .给定一个查询集 ,查询集中的数据问具有与支持集相同的类别年代.(4)T和年代有不同的特征空间和类别空间 : (5)一组支持 和一个查询集 从训练集中随机选取T其中,,是一样的年代和是一样的问.在训练过程中,每个任务随机选取和训练故障诊断模型,并多次重复该任务,在元级实现模型训练。
因此,我们的目标是训练模型使用和对故障MCA振动样本进行分类问根据集合年代断层MCB。跨组件问题描述的主要思想如图所示2.
3.2. 深卷积最近邻匹配网络
本文提出了一种深度卷积邻居匹配网络(DC-NNMN)来学习支持集年代然后对查询数据集中的故障样本进行分类问.
如图所示3.本文提出的模型包括两个部分:嵌入模块以及匹配模块 .在嵌入模块中,我们使用卷积网络来完成从样本的输入空间到特征空间的映射,利用K-最近邻算法完成从特征空间到类别空间的匹配,从而实现故障分类任务。
时域振动样本的特征具有平移不变性;也就是说,样本中的某一统计特征随时可能出现。卷积神经网络具有局部连接和权值共享的特点,因此卷积运算特别适合处理时域振动样本。如表所示1,采用具有四层卷积运算的神经网络作为嵌入模块,提取每个故障样本的特征信息。由于样本数量太少,为了防止过拟合,取消了传统卷积操作后的全连通层,减少了网络模型需要训练的参数。第一层为输入层,输入故障样本大小为 .每个后续的卷积操作包括一个卷积和一个批处理正则化。卷积核的大小是卷积核的数量是 .激活函数是Leaky ReLU激活函数。此外,第一层和第二层在卷积操作后增加了一个额外的max-pooling层。前两层的卷积运算如下: 在哪里代表卷积操作,和表示卷积核和偏差,是卷积运算的结果,和代表d-网络的第二层。最后两层是
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
这样,经过四层卷积运算,得到尺寸为的特征向量 ,其中哪个可以表示为
匹配模块主要是利用一个类别中所有故障样本的深度特征描述来构造故障分类的局部特征空间。如果我们直接使用有限数量的数据在少量的学习任务中训练分类器,模型几乎肯定会过拟合。神经网络分类器中有数万个参数需要优化。相反,许多非参数方法更适合。考虑到故障振动样本的离散性,采用KNN算法验证支持集中查询集样本与该类样本的空间距离,如图所示2.
具体来说,每个样本从查询集中是由嵌入模块处理得到的 .K-类别中最近的邻居为依次被发现和得到 .然后,我们计算每个最近邻之间的距离和最后加上距离米当地特色K-最近的邻居,以获得样本的相似性关于查询集与类别匹配 :
两个向量夹角的余弦值用来测量它们之间的相关性。余弦距离可以降低对绝对值的敏感性,适用于离散数据之间距离的测量。向量的余弦相似度和是
3.3.优化目标
在本文中,标记故障样本MCB的个数小于20。如果我们直接训练有限数量的标记样本,模型不可避免地会陷入过拟合,不能准确地进行故障分类。
阶段性训练机制[16]已被证明是一种从训练数据集学习可转移知识的有效方法。具体来说,在每次迭代中,我们使用构造好的训练集来构造与测试集相似的数据结构。所以,网络通过训练N任务。对于每个任务,都有两个输入,即支持集和查询设置 .通过嵌入模块的处理,获取每个样本的特征信息,并根据匹配模块将其与正确的类别进行匹配。对于模型,我们希望,在每个任务中,网络都能尝试对样本有良好的分类效果 ;也就是说, 可以匹配正确的类别。网络的输出被认为是0到1.0的值,表示非常不相似,而1表示完全相似。这样,对于每一个样本 ,得到了真实类别的预测值。该预测值可用于构建单个任务的交叉熵损失函数;也就是说, 在哪里代表了t-第十次培训任务,,的真实标签我th样本,表示通过网络获得的预测标签。为任务,总损失函数为
在训练过程中,损失函数通过反向转移和梯度下降最小化。本文采用自适应矩估计方法对模型参数进行更新。该算法能计算出各参数的自适应学习速率,收敛速度快。同时,它可以纠正其他优化技术中由于更新高方差参数而导致的学习率消失、收敛速度慢或损失函数方差大等问题。参数更新规则如下:
在上面的等式中,是卷积网络参数的表征,是梯度的第一矩的平均值,和为梯度第二矩的非中心方差值。这两个时刻的方差, ,是模型的学习率,是无限小的量吗 ,和和是亚当优化器的两个参数。算法伪代码如表所示2.
|
3.4.基于DC-NNMN的故障诊断
所提出的故障诊断方法的流程图如图所示4.主要包括三个步骤:训练数据集的构建、模型的建立和训练以及故障样本的测试。(1)在构建训练数据集的过程中,需要使用多种不同类别的故障轴承标记振动样本。根据少镜头学习数据集的设置形式,支持集合和查询设置的C收费方法k-射击是随机选择的。(2)在模型构建和训练的步骤中,模型如图所示2首先是建立。然后将每次提取的数据集发送到网络进行训练,并记录为任务。后N训练次数,模型中涉及的参数是固定的。(3)输入支持集和查询设置对网络进行分类,网络的终端将给出分类结果。值得一提的是,在这一阶段,模型的参数将不再更新;也就是说,通过对多个任务的训练和参数的优化,该模型已经具备了对完全不同的任务进行分类的能力C-在屏幕上键入故障样本C收费方法k-快照样本集。
4.案例研究
在本节中,我们使用凯斯西储大学(CWRU)的轴承数据集[20.],选取实验室搭建的实验平台上的轴承振动数据,以及另一个齿轮数据集[21]为我们的实验证明了所提出方法的可行性。
4.1.数据设置
如图所示5, CWRU轴承实验平台包括一个2马力电机(左),一个扭矩传感器(中),一个功率表(右)和电子控制设备。该数据集是故障诊断领域最常用的基准数据集之一。采用电火花加工技术在轴承上布置单点点蚀故障。故障类型包括IF(内环故障)、OF(外环故障)和BF(滚动体故障)。同时,故障轴承的位置也不同,分别位于驱动端和风扇端。从图中可以清楚地看到6轴承故障的类型、负载和故障大小将导致采集信号的显著差异。
(一)
(b)
基于以上,我们选取了不同轴承在两个位置、2种载荷条件、5种故障类别、4种故障大小条件下的振动样本。建立了CWRU轴承80种故障类别的模型训练集,每个类别90个样本。具体描述见表3.,其中轴承位置包含FE(风扇端)和DE(驱动端),故障类别包括BF(球故障)、IF(内圈故障)、N(正常),OF@3表示故障点在轴承外圈3点处;OF@6和OF@9都是一样的。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
在测试步骤中,将在模型上验证来自不同机械部件的两个不同振动数据集。一是轴承故障数据,由我们自建的轴承实验平台采集,如图所示7.二是齿轮故障数据[21].具体数据设置如表所示4.
(一)
(b)
|
||||||||||||||||||||||||
我们选择的轴承故障类别是正常的(N)、球故障(BF)、外圈故障(OF)、内圈故障(IF),以及球故障和外圈故障(B和OF)的复合故障。我们选择的齿轮故障类别有裂纹、健康、缺失、剥落和碎片5a,其中5a表示磨损程度。
4.2.实验结果与分析
4.2.1。准备第一部分故障分类实验结果C收费方法K拍摄的问题
本节的所有实验都围绕着分类任务展开C收费方法K-射击问题。在训练阶段,我们为每个任务提取了5种不同类别的故障数据,每个故障类别包含1、3或5个样本。在每个任务中,每类故障样本为查询集提供15个验证数据。换言之,对于每个5路单点任务,它包含5个支持样本和75个查询样本。
在测试阶段,对轴承数据集和齿轮传动数据集进行验证。实验结果是多个实验结果的平均值,如图所示8.在实验室搭建的轴承数据集上对模型进行测试,5路1拍、5路3拍和5路5拍的故障分类准确率分别为82.63%、92.60%和94.79%。也就是说,对于模型训练,我们只需要每个类别的微小标记数据;当测试集具有相同的类别空间和不同的概率分布时,跨分量故障诊断模型具有较好的泛化性能。
此外,我们还可以看到,在齿轮传动数据集上对模型进行测试时,5向1-shot、5向3-shot和5向5-shot的故障分类准确率分别为82.19%、91.28%和93.00%。考虑到三个跨组件故障诊断实验的测试集具有不同的类别空间和不同的概率分布,虽然分类精度低于实验室构建的轴承数据集,但结果也是合理和有利的。
4.2.2. 第2部分不同模型的故障分类结果
在本节中,我们将本文方法与几种最常用的模型在已知标签样本较少的情况下进行轴承故障诊断的性能进行比较,体现了本文方法的优越性。比较模型包括WDCNN、CNN_SVM、SAE和SS-GAN。我们给出5个、50个或100个标记的故障样本来训练模型并在查询集上进行测试。从实验室搭建的实验平台中选取所有样本,经过多次实验得到故障分类结果,如表所示5.
可以看出,该方法在三个训练集上具有最高的准确率。只有五个已知的故障样本,传统模式的最佳表现是SAE模型,但其故障分类精度仅为58.07%,而该方法的故障分类精度齿轮数据集是82.19%和轴承数据的准确性为82.63%。
我们知道,对于大多数神经网络来说,要想获得良好的分类精度,需要使用大量的标记数据进行训练。因此,当只有少量标注数据时,直接使用传统模型是不合适的。本文提出的方法在微小标记样品上具有良好的性能。随着标记样本数量的增加,故障分类的准确率也有所提高。当使用100个标记样本,即5路20次时,齿轮传动的故障分类精度可达99.62%。
4.2.3。第三部分不同的影响K对实验结果
由于本文提出的模型的匹配模块不需要调整参数,对于网络训练,只需要最近邻数即可会影响分类精度。因此,在本节中,影响对分类结果进行了讨论。不同的 分别选择进行比较。通过实验得到的分类结果如表所示6.
|
||||||||||||||||||||||||||||||||||
从表6,可以看出,对于最近邻算法,并不是值越大是,分类精度越高。相对于不同的数据集各不相同。在本文中,当 在齿轮数据集上,模型效果最好,为93.63%;当 在轴承数据集上,该模型取得了最好的结果,为95.51%。这是因为齿轮传动数据具有较高的离散性,数据分布相对较分散,且较高值会降低分类结果的准确性。而轴承数据的分布更紧凑,可以随着轴承数据的增加而提高分类精度 .
5.结论
本文提出了一种基于少镜头学习的深度卷积邻居匹配网络,该网络可以解决具有微小标记样本的跨部件故障诊断问题。利用卷积网络从小样本数据集中提取故障特征。然后K-采用最近邻算法将未知标签的样本与数据集进行匹配,实现新类别的故障分类。通过使用三组不同分量的数据集,并与四种流行的网络模型进行比较,证明了该方法的优越性。该方法为解决微小标记样本的跨部件故障诊断问题提供了一种思路。
数据可用性
本文的实验数据来自Case西部轴承数据中心;本文详细介绍了从实验室搭建的实验平台和另一个齿轮数据集中选择的轴承振动数据。
的利益冲突
作者声明没有利益冲突。
作者的贡献
徐鹏飞对这篇手稿的撰写、参考文献的撰写、实验结果的分析以及数据的解释做出了贡献。徐娟对研究思路、研究方向、研究获取和研究设计做出了贡献。石磊在文献检索、研究内容、算法流程、数据分析、算法分析、手稿撰写等方面做出了贡献。魏振春对该手稿的实验设计、算法实现、实验分析和手稿评审做出了贡献。徐丁对实验算法做出了贡献。
致谢
本研究由国家重点研发计划资助。基金资助:国家自然科学基金资助项目(2018YFB2000505);基金资助:国家自然科学基金资助项目(61806067);17030901047)。
参考文献
- S.Gahlot、S.R.N.Reddy和D.Kumar,“智能健康监测方法与调查分析和拟议框架的回顾,”IEEE物联网期刊,第6卷,第2期2, pp. 2116-2127, 2019。视图:出版商的网站|谷歌学者
- 黄伟,程建军,杨永强,“基于卷积稀疏组合学习的滚动轴承性能退化评估”,中国机械工程,2017,27(11):1234 - 1234。IEEE接入,第7卷,第17834-17846页,2019。视图:出版商的网站|谷歌学者
- 高志强,丁世贤,“故障诊断与容错技术综述——基于模型和信号的故障诊断方法”,IEEE工业电子学汇刊第62期6, pp. 3757-3767, 2015。视图:出版商的网站|谷歌学者
- 雷勇,林建军,左明君,何志忠,“行星齿轮箱状态监测与故障诊断:综述,”测量, vol. 48, pp. 292 - 305,2014。视图:出版商的网站|谷歌学者
- 刘锐,杨斌,“旋转机械故障诊断的人工智能研究”,《机械工程学报》,机械系统和信号处理,第108卷,第33-47页,2018。视图:出版商的网站|谷歌学者
- 王鹏,“深度学习及其在机器健康监测中的应用”,《计算机科学》,机械系统和信号处理,第115卷,213-237页,2019。视图:出版商的网站|谷歌学者
- 张骞,杨利涛,陈哲,李鹏,“基于大数据的深度学习研究”,信息融合,第42卷,146-157页,2018。视图:出版商的网站|谷歌学者
- 吕伟,梁波,程勇,“基于深度模型的故障诊断领域自适应方法”,中国机械工程,2018,27(11):1279 - 1284。IEEE工业电子学汇刊号,第64卷。3, pp. 2296-2305, 2017。视图:出版商的网站|谷歌学者
- “一种基于稀疏自编码的深度迁移学习的故障诊断方法,”《IEEE系统、人与控制论汇刊:系统》,第49卷,第49期。1, pp. 136-144, 2019。视图:出版商的网站|谷歌学者
- 杨军,邢林,“基于高维不平衡数据分类的滚动轴承故障诊断”,IEEE接入,第7卷,第79159-79172页,2019。视图:出版商的网站|谷歌学者
- “基于生成式对抗网络的往复机械异常不平衡故障诊断方法”,IEEE接入,第7卷,第70643-70653页,2019。视图:出版商的网站|谷歌学者
- 4 .赵德辉,刘福林,H.孟,“基于振动信号一维表示的可切换归一化SSGAN的轴承故障诊断”,传感器第19卷第2期第9页,2019年。视图:出版商的网站|谷歌学者
- A.Santoro、S.Bartunov和M.Botvinick,“使用记忆增强神经网络进行一次性学习,”神经信息处理系统的进展, 2016,https://arxiv.org/abs/1605.06065.视图:谷歌学者
- T.Munkhdalai和Y.Hong,“元网络”,摘自第34届国际机器学习会议论文集,第2554-2563页,澳大利亚悉尼,2017年8月。视图:谷歌学者
- K.Gregory、Z.Richard和S.Ruslan,“用于一次性图像识别的暹罗神经网络”,年第32届机器学习国际会议记录2015年7月,法国里尔。视图:谷歌学者
- O. Vinyals, C. Blundell, T. lilliicrap, K. Kavukcuoglu,和D. Wierstra,《一次性学习的网络匹配》,神经信息处理系统的进展,2017,https://arxiv.org/abs/1606.04080.视图:谷歌学者
- S. Jake, K. Swersky,和R. Zemel,《少数机会学习的典型网络》,神经信息处理系统的进展,2017,https://arxiv.org/abs/1703.05175.视图:谷歌学者
- C. Finn, P. Abbeel,和S. Levine,“深度网络快速适应的模型不可知元学习”,刊于第34届国际机器学习会议论文集,澳大利亚悉尼,2017年8月。视图:谷歌学者
- T.Cover和P.Hart,“最近邻模式分类”IEEE信息理论汇刊,第13卷,第2期1,页21-27,1967。视图:出版商的网站|谷歌学者
- “一种基于无监督特征学习的机械大数据故障诊断方法”,国家自然科学基金青年项目,项目编号:201414720901,项目编号:201414720901IEEE工业电子学汇刊,第63卷,第2期5, pp. 3137-3147, 2016。视图:出版商的网站|谷歌学者
- “基于深度卷积神经网络迁移学习的齿轮无预处理故障诊断方法”,中国机械工程,2018,27(11):1234 - 1234。IEEE接入,第6卷,第26241-262532017页。视图:出版商的网站|谷歌学者
版权
版权所有©2020徐娟等。这是一篇发布在知识共享署名许可协议,允许在任何媒介上不受限制地使用、传播和复制,但必须正确引用原作。