文摘
旋转机械中扮演一个重要的角色在运输、石油化工、工业生产、国防设备、等领域。随着人工智能的发展,设备状态监测尤其需要一个智能故障识别方法来解决这个问题的复杂工作条件下假警报率高。目前,智能识别模型主要是增加网络的复杂性达到高识别率的目的。这种方法常常需要更好的硬件支持,增加了操作时间。因此,本文提出了一种自适应卷积神经网络(一位美国有线新闻网的)结合整体学习和简单的卷积神经网络(CNN)。一位美国有线新闻网的模型由输入层、子网单位融合单元和输出层。模型的输入是一维(1 d)振动信号样本,和子网单元由几种简单的cnn,和融合单元权重的输出子网通过重量单位矩阵。一位美国有线新闻网的识别通过融合权重因子的自适应单元。一位美国有线新闻网的样本识别的自适应性能和鲁棒性验证变量的工作条件下齿轮和轴承试验。
1。介绍
机械传动系统的重要组成部分,旋转机械已经广泛应用于汽车的传动系统1)、船舶(2,风力涡轮机3)、机床等等。然而,在实际工业现场,他们很容易被分解由于恶劣的服务环境和变速和负载(4,5]。它是容易发生灾难性事故如果健康状态的设备不及时。因此,研究智能和高效的识别模型具有重要意义,确保健康运行设备(6- - - - - -8]。
目前,常见的监测技术可分为三组:基于索引的趋势预测方法,频谱ieee分析方法(9),和数据驱动的深度学习(DL)方法10,11]。前两个严重依赖专家经验和需要更多的劳动力输入。过去十年,得益于计算机系统和智能传感技术的快速发展,深度学习方法附加到太多的关注。作为端到端故障诊断技术,深度学习的目标是建立一个学习模式和我的固有的复杂特征空间之间的映射和故障类型通过学习大量的带安全标签的数据时,预测和判断未知样本的诊断。现有的有利的深度学习方法包括深层信念网络(DBN) Auto-Encoder (AE) [12),卷积神经网络(CNN)在解决分类问题的品种呈现显著的优势。小王提出了一个深插值神经网络(DICN) [13),提高了神经网络在时变条件下的故障识别率。Eren et al。14]使用紧凑1 d-cnn从原始故障数据,提取识别特征和分类时间小于1毫秒,非常适合机械设备的监测和诊断。Zhang et al。15)提出了一种深卷积神经网络广泛的第一层内核(WDCNN)第一卷积宽内核层用于提取特征和抑制高频噪音。刘等人。16)提出了一种基于多尺度的残余CNN (MK-ResCNN),克服了问题的梯度深网络消失,故障特征的提取并使用多尺度核能源更准确。杜et al。17)提出了卷积稀疏学习反褶积模型的复杂调制传输路径,并成功检测齿轮箱振动信号的瞬时故障的冲动。黄等。18)使用极小极大凹罚函数构造目标函数和约束稀疏系数。因此,重复瞬态信息的有效提取。李等人。19)提出了一种基于功率谱熵变分模态分解方法引入到神经网络,并实现一个有前途的故障识别率。李等人。20.)提出了一个名为WaveletKernelNet框架标准的CNN的第一层被替换为连续小波变换,实现一个可判断的特征映射和明确的物理意义。太阳et al。21)结合稀疏auto-encoder SAE款和提出了一个SAE-based CNN无标号数据的学习更多的差异化特性,并通过实验验证其有效性。郭et al。22)建立了一个名为层次深卷积神经网络学习速率自适应的二维(2 d) CNN分层框架的自适应学习速率采用识别轴承故障类别和大小。程等。23)提出了一个混合的时频分析方法,它被成功地用于铁路轴承故障识别,可以有效地恢复故障信息从原始信号受到强烈的噪音和其他干扰。
智能识别方法的研究和开发,模型的规模变得越来越大,为了追求高识别率,这显然不符合良好的故障诊断方向。智能识别模型的大规模需要更好的硬件支持,提高了识别操作时间,这显然不利于工业应用的智能识别方法。因此,本文提出了一种自适应卷积神经网络(一位美国有线新闻网的)结合整体学习和简单的卷积神经网络(CNN)。一位美国有线新闻网的模型由输入层、子网单位融合单元和输出层。模型的输入是一维(1 d)振动信号样本,和子网单元由几种简单的cnn,和融合单元权重子网的输出单位由权重矩阵。每个子网的权重矩阵可以调整比例输出,增加识别正确的子网单元输出的影响,并削弱识别错误的子网输出的影响。一位美国有线新闻网的实现模型的集成学习通过自适应地调整简单CNN作为基本分类器的输出,从而提高模型的识别率没有显著增加网络参数。一位美国有线新闻网的样本识别的自适应性能和鲁棒性验证变量的工作条件下齿轮和轴承试验。
总结了本文的主要创新和贡献如下。(1)一位美国有线新闻网的整体学习相结合提出了一种简单的1 d-cnn,可以准确地识别未知的工作条件下旋转机械故障。它提供了一个新的想法和智能故障诊断的方法(2)一位美国有线新闻网的替换策略组合与优化的整体学习传统装袋重量参数。组合策略是通过不断优化重量参数进行了优化(3)拟议的一位美国有线新闻网的可概括的,它也可以应用到其他的机器学习算法。除此之外,它还可以发现,拟议中的一位美国有线新闻网的不仅有很好的识别性能为多个负载条件,还显示了一个强大的未知信息的能力表示样本下变分的工作条件,包括速度、负载、和石油
本文的其余部分组织如下。部分2介绍了理论背景。节3,一位美国有线新闻网的架构提出和介绍了培训的策略模型。节4相比,与其他网络体系结构,探讨了故障诊断的结果一位美国有线新闻网的变速箱轴承数据集,数据集,并验证了模型的有效性。部分5本文总结道。
2。理论背景
本文提出的模型是基于一维(1 d) CNN理论学习和参考。1 d-cnn本质上是一个多层感知器,采用本地接受字段和共享权重的方法。一方面,该方法减少了权重的数量,使网络容易优化;另一方面,它可以减少过度拟合的风险。1 d-cnn通常是由输入层、1 d卷积层,激活函数,池层,和完整的连接层,如图1。
定义一维卷积的计算公式如下。 在哪里的长度是1 d输入 , 卷积核的长度是 ,和卷积的跨步。是正整数的集合。⌊·⌋和⌈·⌉代表排下来,分别。是 - - - - - -卷积th元素的输出层。是1 d原始振动信号。和分别内核和偏见。卷积公式略: ⊗表示卷积操作和在哪里和分别内核和偏见。减少网络参数,保留有效信号特征,max-pooling函数卷积处理后每个小层如下。 在哪里是 - - - - - -th的数据层,的输出是什么 - - - - - -1层,池的步伐,向量的长度,⌈·⌉向上舍入,填充类型设置为相同。修正的线性单元(ReLU)用于每个卷积操作后激活函数。ReLU被定义为:
高维空间特征映射后得到输入数据进行卷积操作将被输入到汇聚层进行二次抽样样品处理。最常用的池操作max-pooling操作。max-pooling操作将把特性映射到几个不重叠的地区根据池区域的相关参数和步长,然后在每个区域中获取最大价值作为这个地区的代表值,并放弃本地区的其他值。不同地区的最大值是按顺序组合成一个新功能池的地图作为输出层。
3所示。自适应卷积神经网络
3.1。动机
整体学习指的是一种机器学习方法,集成了多个基本分类器与某些标准或策略以获得一个强大的学习者达到目标的任务。对于一个复杂的问题,多个专家给予不同的观点和解决方案。如果你能讨论这些不同的观点和方法,并得到一个全面的观点和解决方案,往往是更全面,比任何其中之一。集成学习是基于这个想法来完成学习任务。其概念可以概括如下:对于一个具体的目标任务,使用样本数据训练得到一些基础的学习者有一定的训练标准和策略,然后使用适当的融合准则或算法,集多个基本分类器,以优异的成绩获得一个强分类器来完成目标任务。图2显示了整体学习的总体结构。传统的包装是一个优化的算法的输出弱学习者相结合的策略。装袋算法不仅提高了准确性和稳定性,而且可以避免过度拟合通过减少结果的方差。投票平均法是一种常见的组合策略。然而,传统的组合策略不能被更新。我们使用网络权重参数取代传统的组合策略,并不断调整每个弱分类器的输出的重量通过网络参数更新迭代。结合装袋算法与CNN的概念,提出了一个一位美国有线新闻网的框架。
3.2。一位美国有线新闻网的架构
一位美国有线新闻网的模型主要由以下四个部分:输入层、子网,融合单元和输出层。输入层用于接收时域信号和输入子网单元,结构如图3。子网单元由1 d-cnn断层识别子网。子网的数量是一致的工作条件(速度或负载)的数量的样本在训练数据集。每个子网都有相同的结构和对应不同的工作条件,分别。一位美国有线新闻网的能够准确地提取fault-sensitive信息变量下的旋转机械工作条件和准确地识别故障类型。融合单元商店通过监督培训获得的权重矩阵,用于分配不同的权重的输出结果子网,然后执行融合学习和输出最终的识别结果。
输入数据的处理过程由子网单元如图3。在故障识别,识别故障样本输入到一位美国有线新闻网的;输入层接收样品,并输入到子网。每个子网接收样品,并被激活,使用存储故障类型信息和样本学习和识别样本特征分布信息。
其中,相对应的子网输入样本速度条件将输出原始故障识别结果精度高,和其他子网将显示不一致的反应。因此,子网的建设单位实现了多个工作条件下的故障识别问题转换到故障识别问题单工况下,也就是说,对于每个已知工况识别故障样本,有一个子网识别模块识别精度高相应的工作条件。子网单元完成后的处理输入数据和获得最初的识别结果 , ,…, ,它输入原来的识别结果 , ,…,为下一步融合输出层。当多子网单位完成输入数据的处理和获得最初的识别结果 , ,…, ,我们输入结果融合输出层的加权信息融合学习,融合单元如图所示3。最初的识别结果 , ,…,由不同的CNN输出故障识别子网。确定子网符合工作条件的输入样本输出高精度的故障识别的结果,而其他子网识别输出精度低等故障识别结果。换句话说,融合后输出层对输入进行加权融合学习最初的识别结果 , ,…, ,高精度故障识别结果占据一大部分在最后的识别结果,结果精度较低的压制,所以最终的识别结果的准确性得到保证。
融合层采用权重矩阵通过监督培训执行固定重量融合学习最初的识别结果 , ,…, ;权重矩阵和输出的 - - - - - -th子网定义如下: 在哪里表示输入故障样本的概率值错误类型速度 。 最初的识别结果向量。代表输入故障样本的概率值与故障类型的条件 。 在子网的节点数,等于故障类型的数量。最初的识别结果 , ,…,使用多子网的中间输入的聚变装置。最初的识别结果 , ,…,给出不同的权重,权重矩阵 ,然后输出结果相同的故障类型在不同原始识别结果累积,如以下公式所示:(以1型断层为例)。
最后的识别结果O如下: 在哪里代表输入故障样本的概率属于故障类型 。故障类型对应的最大概率通过最大输出函数,这是最终的故障识别的结果。最大的功能最大的元素集最后的识别结果 为1,其余为0其他元素。因此,一位美国有线新闻网的网络模型的预测结果对输入样本的故障类型对应元素1最终故障识别结果。最大的功能如下:
在哪里
权重矩阵融合的输出层是通过有指导的训练。根据误差之间融合的最终识别结果输出层和真正的标签输入样本,经典的梯度下降算法优化网络参数,和反向传播算法用于传输错误一层一层地在训练过程。网络参数的初始化,采用正态分布的随机模式,的值和参数的初始值(1,1)不等。当模型参数连续更新迭代后达到一个最优值,模型训练完成。假设实际故障样本集的标签和最终的故障识别结果 ,最终识别结果输出之间的误差由输出层融合和真正的输入样本的标签可以计算如下: 在哪里和 ,分别代表最终的故障识别结果输出的模型和实际故障样本集的标签,和是训练样本的数量。在减肥的过程中矩阵培训、权重矩阵优化通过最小化误差 。鉴于后的最终识别结果是获得最大功能的过程中,最大的影响函数训练误差的反向传播过程应该考虑的第一个培训过程中权重矩阵 。根据经典的链推导反向传播算法和最大函数的定义 ,的偏导数对其输入变量计算如下: 在哪里是 - - - - - -th元素在最后的识别结果 。 是无穷小数量。符合最大函数的定义:
任何输入的最大函数的偏导数是1,最大的功能没有影响误差反向传播和链推导过程。因此,没有必要考虑的影响的最大功能训练过程中权重矩阵 。根据融合单元的输出函数和经典的链反向传播算法推导,最终识别结果的偏导数权重矩阵如下:
考虑一个训练样本的情况下,训练误差,即误差函数的偏导数权重矩阵 ,如下: 在哪里最初的识别结果的输出值,属于 - - - - - -的th节点 - - - - - -识别模型。的输出值是- - - - - -th节点在最后的识别结果是 - - - - - -th节点值的输入样本的标签。基于经典的梯度下降算法,优化公式权重矩阵如下: 在哪里我重量的训练过程中学习速率矩阵 。
3.3。一位美国有线新闻网的培训
故障特征映射信息变量条件下提取并保存到不同的模型训练过程,识别子网的条件的分析结果子网通过加权信息融合融合学习算法来获得最终的故障识别结果。一位美国有线新闻网的故障识别方法的流程图如图4。训练和测试步骤如下:(1)提取故障振动的时域信号在不同条件在实际工业现场,在所有条件下构造故障样本集(2)故障样本集划分为样本集在不同条件下,然后训练子网和一位美国有线新闻网的模型的权重矩阵(3)在一定条件下把故障样本在同一场景训练一位美国有线新闻网的网络模型获得故障类型对应于此示例
4所示。实验验证和分析
一位美国有线新闻网的性能验证齿轮数据集和数据集。齿轮数据集(24来自重庆大学,轴承数据集来自凯斯西储大学(CWRU) (25]。
4.1。我:齿轮数据集
(1)测试平台和数据集描述
原理图的齿轮试验台的结构如图5。它由五部分组成:驱动电动机,两级圆柱齿轮减速器,速度传感器、磁粉制动器和控制柜。驱动电动机的速度和磁粉制动器的负载是由控制柜控制,使齿轮箱运行在不同的速度和负载下稳定。两级圆柱齿轮减速器的传动比为3.59,第一个传播阶段的齿轮传动比是23/39,和第二传动齿轮传动比的阶段是25/53。电机是直流电机yvff - 112 m - 4,与4千瓦的额定功率,额定电压380 V,最大速度1200 rpm。磁粉制动器模型CZ10,额定电压为380 V,额定电流是1.2,可以提供稳定可控扭矩加载实验系统在0到500 N。
齿轮箱的结构参数如表所示1。25的中间传动装置故障齿轮的牙齿。齿轮故障包括齿面剥落,根裂纹、齿面麻点,和牙齿断裂,如图6。垂直方向的振动传感器设置三个传动轴。训练和测试数据得到中间传动轴振动信号的位置传感器。
齿轮故障和振动采集设置如表所示2。
振动测量20.48 kHz的采样频率的输入扭矩200海里,收购时间是15秒。在齿轮故障模拟实验中,13个速度条件设置均匀的速度范围500到1100 rpm,和两个相邻的间隔速度是50 rpm。在这个实验中,每个样本包含2048数据点。1000年样本抽样在每个2048步得到的滑动速度和故障类型。为了验证该网络的性能,使用训练集和测试集样本不同速度;4个不同的训练集建立。训练集和测试集的设置如表所示3。每个训练集和测试集包含变速箱的五个州:健康、齿面剥落,齿根裂纹、齿面麻点,破碎的牙齿。训练集的旋转速度是不同的,和测试集的旋转速度从500年到1100 rpm。子网的数量包括在一位美国有线新闻网的数量是一致的工作条件。在这个实验中,一位美国有线新闻网的包含两个子网在训练集和b。一位美国有线新闻网的训练集C和D包含三个子网。(2)分类比较和分析
为了验证一位美国有线新闻网的优势,美国有线电视新闻网(14),剩余网络(ResNet) (26宽),第一层内核(WDCNN) [15,基于多尺度的ResCNN (MK-ResCNN) [16网络)作为比较。比较模型和一位美国有线新闻网的构建基于Python 3.7和Pytorch 1.7.1上。计算机的主要配置如下:cpu - 19 - 9900 k ram - 128 gb, GPU-RTX 2080 ti。五个方法(一位美国有线新闻网的DCNN、ResNet WDCNN,和MK-ResCNN)数据集的训练和测试表3;分类结果如图7。
之间没有交叉样本训练集和测试集,验证方法也称为固定数据集验证。它可以更好的验证识别能力的识别模型未知工作环境样品,提高鲁棒性。CNN的识别率,ResNet、WDCNN MK-ResCNN,和一位美国有线新闻网的91.53%,94.22%,93.8%,94.65%,和95.12%的数据集上,分别。一位美国有线新闻网的模型的识别精度高于其他四个比较模型。一位美国有线新闻网的模型的样本识别率也高于其他模型数据集B, C,以及d。一位美国有线新闻网的平均识别率为3.69%,2.67%,2.33%,和0.86%高于CNN, ResNet, WDCNN和MK-ResCNN分别。虽然识别率MK-ResCNN模型接近一位美国有线新闻网的模型、网络参数MK-ResCNN数量三倍以上的一位美国有线新闻网的模型,及其训练时间较长。实验结果表明,一位美国有线新闻网的具有较高的识别率和强鲁棒性。数据集的识别精度高于C和D样本数据集A和B,因为数据集的训练集C和D包含更多的样本,速度也是合理的。识别结果数据集D的混淆矩阵图所示8。
它可以发现健康样本的识别精度最高的混淆矩阵的识别结果。有75个样本的齿面剥落故障错误归类为牙齿表面点状腐蚀。牙齿表面点蚀故障样本的数量错误地认定为齿面剥落是60。这表明齿面剥落的故障特点和牙齿表面点蚀是相似的。齿根裂纹故障样本的数量错误地认定为齿面剥落和牙齿断裂是21岁和45岁。的参数和计算时间比较模型在数据集如表所示4。可以发现,一位美国有线新闻网的网络的参数小于那些比较模型的训练和测试时间。
4.2。CWRU轴承数据
(1)测试平台和数据描述
实验数据收集的加速度计电机驱动的机械系统(图9)12 kHz的采样频率。有四个种类的轴承故障,这是正常的,内圈故障、球的错,和外环的错。三种故障类型的故障维度分为0.007英寸、0.014英寸和0.021英寸。因此,有10种轴承状态需要分类。轴承故障类型的故障频率(内圈故障、外圈故障和球断层)是不同的,所以我们使用这些数据来验证一位美国有线新闻网的性能。
在这个实验中,以验证模型的识别性能与未知样品加载时,这些数据集分为训练/测试数据集根据负载的样品。输入样本的原始振动信号长度为2048,在400年由200步通过滑动抽样得到的样本一个负载,一个故障状态,所以样品,大小为400×10获得在每个负载。任何两个或三个的样品加载选择的训练数据集,剩下的样品作为测试数据集。训练数据集和测试数据集的信息如表所示5。它可以发现之间没有交叉训练数据集和测试数据集。一位美国有线新闻网的性能模型来识别未知负载下的健康状态样本进一步验证。(2)分类比较和分析
为了验证一位美国有线新闻网的优势,美国有线电视新闻网(14),剩余网络(ResNet) (26宽),第一层内核(WDCNN) [15,基于多尺度的ResCNN (MK-ResCNN) [16网络)作为比较。五个方法(一位美国有线新闻网的DCNN、ResNet WDCNN,和MK-ResCNN)数据集的训练和测试表5;分类结果如图10。一位美国有线新闻网的识别准确率是95.49%,6%,5.79%,7.01%,和13.24%高于CNN, ResNet, WDCNN,分别和MK-ResCNN轴承数据集。一位美国有线新闻网的识别准确率是93.12%,4.49%,0.01%,7.11%,和10.84%高于CNN, ResNet, WDCNN,分别和MK-ResCNN轴承数据集B。一位美国有线新闻网的平均识别率,CNN, ResNet, WDCNN,轴承数据集和MK-ResCNN模型是94.06%,88.33%,8.79%,87.50%,和86.06%,分别。一位美国有线新闻网的超过4.28%的平均精度高于其他模型比较,这证明了一位美国有线新闻网的有很强的识别性能和适应性可变负荷条件下样品。为了研究样本的识别细节通过一位美国有线新闻网的模型,输出的混淆矩阵的结果数据集显示,如图所示11。
混淆矩阵,它可以发现所有健康状态样本正确分类,和0.014英寸内圈故障样本的数量错误地认定为球的缺点是124。球故障样本的数量错误地认定为外圈故障是81。这表明,内圈故障特点和球之间有相似之处故障特征。的参数和计算时间比较模型在数据集如表所示6。可以发现,一位美国有线新闻网的网络的参数小于那些比较模型的训练和测试时间。
5。结论
本文提出了一种自适应卷积神经网络结合整体学习和简单的卷积神经网络。一位美国有线新闻网的模型由输入层、子网单位融合单元和输出层。模型的输入是一维(1 d)振动信号样本,和子网单元由几种简单的cnn,和融合单元权重子网的输出单位由权重矩阵。在齿轮和轴承的实验中,一位美国有线新闻网的模型的性能和鲁棒性验证通过比较与CNN, ResNet WDCNN, MK-ResCNN模型。
数据可用性
数据请求。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作是由重庆市自然科学基金(cstc2019jscx-msxm X0360, cstc2019jcyj-msxmX0346),中国国家自然科学基金(批准号51805051),和中央大学基础研究基金(2020 cdjgfcd 002)。