文摘
止回阀是最重要的组件之一,最容易损坏的部件高压隔膜泵、往复式机械的典型代表。为了确保泵的正常运行,有必要对监测其运行状态和诊断故障。然而,在止回阀的故障诊断,与单一核函数分类模型不能完全解释分类决策函数,同时不合理假设的诊断成本均衡对分类结果产生重大影响。因此,厂商multikernel功能和机制构建的故障诊断模型,介绍了止回阀厂商基于multikernel极端学习机(MKL-CS-ELM)。比较测试结果的高压隔膜泵止回阀显示MKL-CS-ELM可以获得性能相当或略优于榆树,CS-ELM, MKL-ELM,厂商multikernel学习支持向量机模型(MKL-CS-SVM)。同时,提出的方法可以获得很高的精度在不平衡数据集的条件下,有效地克服诊断成本均衡的缺点和改进的可解释性和可靠性分类模型的决策函数。因此,它是更适合实际应用。
1。介绍
高压隔膜泵是最重要的设备,高浓度煤浆管道运输。它的工作情况直接关系到泵是否可以重新启动后停止和交通是否会在批量生产加速流动。止回阀的核心和最容易损坏的组件是高压隔膜泵。为了确保泵的正常运行,有必要对监测其运行状态和故障诊断1]。因此,状态监测和故障诊断的研究的高压隔膜泵具有重要现实意义在促进煤浆管道运输领域的发展。
然而,往复式机械的故障特征难以提取由于其复杂的结构,多种激励源,不稳定操作,等等2]。为了完成往复机械的状态监测和故障诊断,国内外学者们引入了旋转机械的故障诊断方法的故障诊断往复机械,使许多有价值的研究成果3- - - - - -5]。眉目传情,莫里森(6]分析了隔膜泵的失效事故,发现膜片的环境应力开裂的主要原因之一是隔膜泵故障。研究结果为事故预防提供了有效的理论支持和管道维护,大大减少维护成本。近年来,小波变换和傅里叶变换,信息熵,神经网络,双频谱分析、特征融合、证据理论、混沌理论、分形理论、决策树和支持向量机已经广泛应用于往复式机械的故障诊断,取得了许多重要的研究成果7- - - - - -16]。然而相比之下,旋转机械的故障诊断,仍有许多研究内容需要改进:往复式机械的数据样本容量很大,大量的多源异构信息举行内部由于复杂结构的影响,多激励源,多个易损件,耦合的信号,往复式机械的和强大的非线性。不合理使用单个核函数(如径向基函数内核,多项式核函数)来处理所有的样品,并不能完全解释的信号。因此,这是一个必然选择结合多个内核函数实现更好的处理结果(17- - - - - -19]。故障诊断模型,不可能得到理想的分类结果数据集的故障诊断不平衡(故障样本远远低于正常样本)和诊断成本是不平等的(例如,诊断成本之间的“正常状态标识为一个故障状态”和“故障状态识别为一个正常状态”是完全不同的;前者只会导致一个“无效”检查和修复算子,但后者将导致重大安全事故),所以最小分类错误的假设缺陷和诊断成本均衡需要克服现有分类模型(20.]。目前,BP神经网络和支持向量机是相对成熟的分类学习方法和往复式机械的故障诊断中扮演重要的角色。但是,BP神经网络容易陷入局部最小值的问题,不是融合,等等。与此同时,支持向量机优化计算负载的增加与优化参数和数据样本的大小。和许多参数优化是优化支持向量机分类模型。因此,它是一个热门话题,探索新的分类方法训练速度快的优点和更少的优化参数来获得全局最优解(21]。
近年来,榆树广泛应用是因为它的有效性、高速、容易实施,相关领域的multiclassification机器学习(22- - - - - -24]。此外,修改后的榆树模型可以有效地解决不平衡的问题示例和获得更好的性能25- - - - - -28]。因此,修改后的榆树方法已成为主要的研究方向。首先,原来的隐藏层的传递函数基于随机特征映射将代替更高效的传输函数。然后,乙状结肠函数和径向基函数(RBF) (29日- - - - - -32)广泛应用于神经网络引入榆树和得到更好的实验结果。另一方面,如何提高分类性能的榆树下多源异构数据和信息融合也是一个修改后的最新研究趋势的榆树分类模型。刘等人。33提出了multikernel榆树(MKL-ELM)结合multikernel学习约束。相比传统的榆树,MKL-ELM可以解决这些问题,包括multikernel函数的选择和优化,应用多源异构数据处理方法,在分类和信息融合方法。但是,在[33),研究者没有考虑分类成本分类模型的影响。因此,敏感的机制被引入传统的榆树(34),和一个新的分类模型提出了基于厂商征服诊断成本均衡的缺点。但是,它不是很有效地处理多源异构数据和信息融合的限制在后续处理单和永久的内核。
榆树理论的深入研究和应用,MKL-ELM和榆树CS-ELM大大促进了发展。但仍有许多需要改进的地方和扩展。这通常是体现在两个方面:厂商如何选择最合适的方法;如何构建更一般的multikernel功能,可以广泛应用于故障诊断领域。基于点上面所讨论的,厂商multikernel功能和机制引入基于MKL-CS-ELM榆树构建故障诊断模型的高压隔膜泵止回阀。
本文有以下主要贡献。首先,优点,缺点,应用范围的过采样,采样,分析了阈值调整提供理论支持厂商的选择方法。其次,提出了一种新的基于MKL-CS-ELM故障诊断方法诊断高压隔膜泵止回阀故障。第三,比较实验的榆树,CS-ELM MKL-ELM, MKL-CS-SVM,和MKL-CS-ELM, MKL-CS-ELM提出方法的有效性验证。
本文的其余部分组织如下。部分2描述了榆树的基本理论、MKL-ELM厂商学习,评价指标的分类模型。部分3详细介绍了该方法的实现过程。部分4阐述了实验过程。部分5展示了实验结果分析。部分6提供了讨论和结论。
2。相关工作
2.1。极限学习机(ELM)
从分类优化的角度来看,榆树的原理类似于支持向量机和LSSVM的目标是获得最小训练误差和最大分类保证金或泛化能力。支持向量机原理分析的基础上,优化数学模型,榆树描述如下(35]:
在(1), 代表隐藏层和输出层之间的连接权重系数,弗罗贝尼乌斯成为常态,代表正则化参数或惩罚因子,达到训练误差最小和最大分类之间的平衡, 是误差矩阵的列 表示矩阵的转置(下同)是输出函数输入的隐层神经元 , 代表给定的训练集, 代表的样本属于的分类标签 。 和分别训练样本的数量和类别。根据马(Karush库恩塔克)理论,分析解决方案(1)计算和详细的解决方案过程中可以读36]。解决方案输出的重量解决了使用Moore-Penrose吗 :
在(2),输出矩阵的隐层 ,榆树分类模型的输出结果 ,是单位矩阵。
对于一个给定的新样品 ,输出的决策函数榆树的显示如下:
2.2。Multikernel极端学习机(MKL-ELM)
的共同定义multikernel函数基本内核函数的线性组合。所以,组合系数最优核函数和榆树的最大优势是MKL-ELM[的关键和核心33]。一种典型的multikernel函数所示
在(4),代表基本的内核函数。
为方便处理和计算,结合系数基本的内核函数满足限制条件 。特征映射(4)所示
在(5),和高维特征的映射吗和 ,分别。
multikernel施工过程的函数,RBF核函数,拉普拉斯内核函数,inverse-distance内核函数选为基本内核函数。
在(6),是核函数的参数。本文的价值通过计算 。与此同时,代表的意思是样本之间的欧氏距离。
为了确保最终的解决方案和multikernel优化问题的组合核函数的有界性和对称半正定,分别准则作为约束条件的组合系数multikernel函数。不同的价值在规范代表不同的约束规范。根据multikernel支持向量机的理论基础37,38)和(5),传统的理论表达式MKL-ELM描述如下:
在(7),连接权重系数是 和 连接的权重吗基本的核函数。
如果 等于 ,然后(8)可以简化
方程(9)类似于榆树的表达。所以,可以计算MKL-ELM的拉格朗日函数:
在(10), 和拉格朗日乘数。然后,马所示的计算和优化条件
的矩阵形式(11)表示
在(12),复合核函数代表 。的解决方案显示如下:
同时,结合系数multikernel函数的导数可以计算
稀疏MKL-ELM约束规范是由 在(14)。最优参数和通过迭代优化方法计算。现在,对于一个给定的样本 ,输出的决策函数MKL-ELM表示如下:
在(15)的组件代表 。
2.3。敏感的方法
敏感的方法主要分为三组(39直接厂商:构建分类模型,建立厂商使用贝叶斯分类模型风险理论,厂商和构建分类模型通过改变样本分布。后者着重介绍两种方法(40]。
假设给定的训练集的类标签的数量在每个类别和训练样本的数量 ,成本分类定义如下。
成本( )被描述为误分类代价的类别分类错误的类别 。然后,成本 是显而易见的。
成本( )代表类别的总成本函数 ,也就是说, 。
的成本表达式过采样、采样和阈值调整根据定义讨论如下。
过采样和采样的成本被定义为 在哪里类别的数量吗 。 代表重新取样的过采样采样,计算(17)和(18),分别为:
然而,阈值调整的实现原理可以解释如下:
在(19), 不同的输出节点的实际产出的榆树,它满足约束条件 。归一化系数 。同时,阈值的输出调整也满足约束条件 。
2.4。分类模型的评价指标
介绍了评价指标的二元分类和multiclassification来验证该方法的有效性在部分。
2.4.1。厂商的二元分类的评价指标
在二进制不平衡学习、成本矩阵如表所示1。人们普遍认识到正确的成本分类的定义是 。
基于表1二进制的厂商评估指标分类定义如下。
积极样本的分类精度(美联社):
负样本的分类精度(一个):
全球分类精度(精度):
2.4.2。Multiclassification的敏感的评价指标
厂商评估的指标比二进制分类multiclassification更复杂。鲁棒性的指标指在41]介绍了描述multiclassification的分类性能。鲁棒性指标通过计算
在(23),平均成本法 。 代表的最大平均成本设计方法。鲁棒性的指标较低,方法的鲁棒性能更好。
3所示。基于MKL-CS-ELM样本分布不平衡的分类方法
MKL-CS-ELM提出方法的主要过程包括数据预处理(数据归一化和特征提取),建设multikernel函数,和降低成本的学习方案。MKL-CS-ELM如图的短暂过程1。该方法的详细过程描述的算法1和2。过采样过程指的是算法1和欠采样原则类似于采样过密。算法2阈值调整方法的实现过程。
4所示。实验描述
4.1。止回阀的原理和实验平台
以下4.4.1。止回阀的原则
止回阀完成喂养和卸货的过程在每一个隔膜泵的冲程。假设隔膜泵的冲程系数是50 r / min,进口和出口止回阀的往复作用将会72000倍的正常操作时一天。因此,止回阀在隔膜泵频繁的运动的核心组成部分,它也变成了最重要的一个原因止回阀故障。高压隔膜泵和失败对于矿物泥浆止回阀管运输与固液两相流图所示2。
在图2的止回阀,高压隔膜泵是一个锥形阀,其简单的结构如图3。和“spool-spring”形成一个弱阻尼振荡系统。有两个原因的振动系统:一个是外部因素(共振);另一种是由于自己的特点。当外部激励源的频率的整数倍的固有频率阀系统,整个系统的共振发生在工作。所以,止回阀的不同运行状态可以有效地判断通过分析振动信号的止回阀。
4.1.2。振动数据采集实验平台
图4是止回阀的实验平台。三筒隔膜泵包括3双止回阀,这意味着它包括3进口止回阀和3出口止回阀。因此,在数据采集的过程中,六个PCB 352 c33加速器上安装止回阀住房pxi - 3342收集振动数据。数据采样频率是2560 Hz,数据点吗是20480。
(一)进口止回阀
(b)出口止回阀
(c)数据采集设备
4.2。实验设置
止回阀和分类信息的数据属性被定义为在表2。
4.3。小波包能量熵的特征提取
图5显示的是时间和频率的振动信号波形的止回阀在3个不同的操作条件下,包括正常状态(NC)、固定阀故障(NK)和磨损故障(NM)。从时域和频域波形,可以看出发生了异常的止回阀,但无法获得进一步的原因或类别。为了实现不同运行状态的自动识别的止回阀,需要提取有效特征的运行状态,然后构建状态识别模型。
(一)数控
(b)纳米
(c) NK
的特征提取充分利用小波包和熵的优势。第三层小波包能量分布系数和能量熵作为特征参数提取下列分类模型(42]。特征提取方法的选择是基于以下几点考虑。
这是通过使用小波包技术,止回阀的振动信号可以被映射到wavelet-basis功能没有信息损失和卓越的能力定位的非平稳信号的分析。
熵引入描述止回阀的运行状态特征。这主要是因为系统越无序,熵就越大。然后,我们可以提取敏感和瞬态特性来描述止回阀的操作状态。
下面列出了特征提取的步骤。
信号分解和重建:止回阀的振动信号分析了三层的小波包变换得到第三层分解的小波系数。本文选择“db10小波”作为基本wavelet-basis功能,这主要是因为“db10小波”可以反映振动信号的敏感和瞬态特性的止回阀。
提取特征向量:小波包能量分布系数第三层重构信号的小波包系数和能量熵组成特征向量 和可以计算如下: 在哪里表示组件的数量信号( ),代表第三层小波系数的重构信号的能量。
根据定义的特征提取(27)和(28),止回阀的特性向量可以计算。由于空间有限,部分功能(并非所有功能)如表所示3。相比正常与故障止回阀,止回阀操作条件会很容易被认出来基于小波包能量分布系数熵和能量 。它表明,基于小波包能量熵特征提取方法是有效和可靠的。
5。实验结果的讨论
基于成本函数的定义、诊断成本矩阵构造和表所示4。诊断价值的成本从1到5 ( 按一定步长),增加实验(通常是0.5)。
在实验处理,收集到的110个数据样本,其中包括70数控数据样本,20 NK数据样本,20 NM数据样本。止回阀的样本数据处理结合成本矩阵见表4理论说明的过采样,采样和阈值的调整部分2.3。然后,榆树的故障诊断分类模型,CS-ELM, MKL-ELM MKL-CS-ELM, MKL-CS-SVM构造。实验结果的二元分类和multiclassification止回阀详细阐述如下。
5.1。实验结果分析二进制分类的止回阀
在二进制分类实验中,数控和NK选为数据集的测试数据。成本矩阵表是一致的4。实验结果描述如下。
5.1.1。过采样的实验结果
过采样的数据样本分布和计算表所示5根据成本矩阵表4,(16)和(17)。收集的90个数据样本,选择54个样本作为训练样本,其余36个样本作为测试样本。然后分类模型的识别结果呈现在图6。
()美联社
(b)一个
(c)准确性
见图6可以观察到,一些结论,包括以下几点:过采样的厂商处理,美联社CS-ELM, MKL-CS-SVM,起初和MKL-CS-SVM增加然后减少成本增加 ,起初增加然后达到稳定状态,增加成本 ,和全球分类精度(精度)增加,然后降低而增加成本 。 榆树和MKL-ELM方法的识别结果不改变与增加成本 ,这主要是因为提到榆树的数据分布和MKL-ELM也不会改变。因此,只有对实验结果的比较和独立诊断的成本 。 在CS-ELM MKL-CS-SVM MKL-CS-ELM方法,最优识别诊断成本时取得的效果 。榆树和MKL-ELM方法相比没有诊断成本,成本诊断可以提高分类的准确性和可靠性模型在CS-ELM MKL-CS-SVM, MKL-CS-SVM方法。从实验结果,我们还可以看到,multikernel学习机制也有助于进一步提高诊断分类模型的性能。与此同时,数字6还显示CS-ELM成本和MKL-CS-ELM更敏感MKL-CS-SVM。
5.1.2中。欠采样的实验结果
基于欠采样计算的数据样本分布在桌子上4,(16)和(18)。然后,上述分类模型的识别结果显示在图中7。
()美联社
(b)一个
(c)准确性
如图7可以获得一些结论,过采样方法的结果是相似的。此外,提到了止回阀的分类模型的分类性能略差在欠采样。实验结果发现主要问题大多是由于缺乏足够的止回阀的样本和样本分布的极端不平衡引起的欠采样处理。同时,我们也可以观察到一个有趣的现象,当样本很小,分类结果MKL-CS-ELM略比其他分类模型。这可能是一种间接论证MKL-CS-ELM的训练过程也需要足够的样本和MKL-CS-ELM的本质是单隐层前馈神经网络。同时,给出了结果也间接证明支持向量机在小样本分类的优越性。
5.1.3。阈值调整的实验结果
基于表4和(19),五分类模型的识别结果在阈值调整呈现在图8。
()美联社
(b)一个
(c)准确性
在图8CS-ELM的分类模型,MKL-CS-SVM, MKL-CS-ELM可以获得良好的厂商由于引进学习机制的影响。俺,美联社,上述分类模型精度显著提高,增加成本 。同时,误分类和错失诊断样本与增加的成本大幅降低。与过采样采样的性能相比,实验结果表明,该阈值调整算法也可以达到令人满意的结果。因此,敏感的阈值调整的方法也是有效的不平衡和不平等的选择诊断成本二元分类问题。
5.2。实验结果分析Multiclassification止回阀
为了测试的有效性和泛化能力MKL-CS-ELM,上述三个敏感的方法应用于确定multioperation止回阀。然后验证了该方法的有效性通过multiclassification测试。
5.2.1。过采样的实验结果
multiclassification实验处理,收集110个数据样本,选择66个样本作为训练样本,其余44样品作为测试样本。过采样的数据样本分布计算的基础上(16)和(17)。和分类模型的识别结果呈现在图9。
()美联社
(b)一个
(c)准确性
见图9的分类精度CS-ELM、MKL-CS-SVM MKL-CS-ELM增加而增加成本 。相反,错误分类样本大幅减少和增加成本。CS-ELM的三种分类模型、MKL-CS-SVM MKL-CS-ELM成本时可以获得最佳的分类性能等于2.5过采样处理。与此同时,相比之下,实验结果见图9(一个),9 (b),9 (c)一些结论总结如下:CS-ELM和MKL-CS-ELM更敏感的成本MKL-CS-SVM。MKL-CS-ELM的分类性能略优于其他上述分类模型。分类精度的变化规律,错误分类,错过了诊断和样品费用获得列示如下:诊断的成本 可以认为是一个分界线,拐点的分类精度。误分类和错失诊断样本时大大减少成本小于2.5。和错误分类样本减少到0,当成本达到平衡状态大于2.5。但错过的诊断样本都大幅增加,分类精度也逐渐减少。实验结果表明,上述厂商在止回阀故障诊断方法是可行的工业领域。
5.2.2。欠采样的实验结果
类似于前面的过采样方法,计算采样的数据样本分布。然后,根据以上分类模型的实验结果呈现在图10。
()美联社
(b)一个
(c)准确性
如图10,厂商multikernel诊断模型的分类精度明显降低由于大幅减少在欠采样的数据样本。但是,错误分类样本也可以有效地抑制(甚至减少到0)欠采样时的成本等于2.5。然而,图10还表明,欠采样方法不应该用于样本不足的条件和高精度的要求。
5.2.3。阈值调整的实验结果
同样,multiclassification识别结果提到的五分类模型的阈值调整呈现在图11。
()美联社
(b)一个
(c)准确性
如图11在阈值调整处理,减少误分类样本为0时的成本增加到2.5。厂商分类模型达到平衡状态时的成本增加到2.5,但错过了诊断样本和CS-ELM精度,MKL-CS-SVM,和MKL-CS-ELM没有明显改变以不断增加的成本吗 。
5.3。健壮的止回阀厂商绩效评估的三个方法
为了评估三个厂商分类方法的有效性,选择合适的评价指标止回阀的故障诊断,强劲的性能评估根据描述部分2.4。2计算;鲁棒性能指标的变化规律不同的成本得到如图12。
(一)CS-ELM
(b) MKL-CS-SVM
(c) MKL-CS-ELM
图12显示了强劲的性能评估的比较测试厂商在三个方法。鲁棒性能指标欠采样是最大的。也就是说,当样本分布很不平衡,厂商不适合采用欠采样的方法。此外,在CS-ELM、MKL-CS-SVM MKL-CS-ELM方法,强劲的性能指标在过采样减少第一次增加而增加成本和健壮的性能指标在阈值调整降低,然后达到稳定状态,增加成本 。与此同时,数字12也表明,强劲的性能指标过采样小于阈值的调整,当诊断成本小于2.5,然后当诊断成本变化趋势正好相反大于2.5。因此,过采样和阈值调整multioperation州的厂商更合适的方法识别的止回阀。
6。讨论和结论
6.1。讨论
高压隔膜泵通常是使用煤浆管道运输为核心的电力设备及其操作条件极其复杂。因此,它是至关重要的改善状态识别精度,以确保操作安全与稳定。然而,止回阀高压隔膜泵的核心部分,它是一种最容易受损和频繁更换部件。同时,开发了数据采集系统的止回阀,振动数据与正常操作大部分时间一直在收集;相反,故障时间和故障状态的振动数据占更少。因此,识别运行状态具有重要意义的止回阀有效条件下复杂的操作和信息不对称。灵感来自multikernel厂商学习和分析,快速诊断方法提出了基于MKL-CS-ELM的止回阀。提出MKL-CS-ELM方法可以完成止回阀故障的快速定位和分析,提供理论支持止回阀的调整和优化操作条件在后续操作。
multikernel学习机制介绍实现multikernel投影非线性和非平稳的数据,它可以克服的局限性不完整的信息具有有效的单一核函数和改进的能力来表示信号。三种常见的核函数是用来构造multikernel分类模型在实验。multikernel学习的引入可以有效提高分类模型的识别精度,通过分析MKL-ELM和榆树。在这种情况下,什么样的内核函数和有多少核函数选择仍然缺乏规范性的选择机制。因此,我们需要将信号特征和先前的经验规则选择核函数,完成有效的核函数的选择和构建multikernel功能。
为了克服假设的缺陷分类成本等于通过分类模型和提高实际模型的适应性,本文选择厂商的常见处理方法构建CS-ELM模型。厂商介绍机制的有效性已经证明通过二进制分类和multiclassification识别结果;实验结果厂商在使用三种方法也被相互比较在不同的情况下提供理论支持和指导厂商的选择方法。然而,诊断的成本需要通过实验比较温和;否则它将减少总体分类模型的识别精度。
6.2。结论
的故障诊断模型基于multikernel MKL-CS-ELM厂商学习和学习了,和止回阀的数据集是用来验证该方法的有效性。通过对比试验,一些结论可以概括如下。
MKL-CS-ELM可以获得公平的或更好的性能比其他分类模型,包括榆树,CS-ELM MKL-ELM, MKL-CS-SVM。
强劲的性能评估的比较分析证明了过采样和厂商阈值调整方法更合适的选择multiclassification止回阀的应用。
三个厂商方法的研究表明,通过选择适当的成本 ,构造分类模型可以减少误分类率,实现误分类率之间的平衡,诊断速度,小姐的整体可靠性和准确性,提高分类模型。
止回阀的整体实验结果表明厂商multikernel学习和理论学习可以有效地克服样本分布不平衡的缺点和诊断成本均衡应该在传统的分类模型,提高分类模型的准确性和可靠性。
缩写
| 榆树: | 极端的学习机器 |
| MKL-ELM: | Multikernel榆树 |
| MKL-CS-ELM: | 厂商Multikernel榆树 |
| RBF: | 径向基函数 |
| 马: | Karush库恩塔克 |
| NK: | 固定阀故障 |
| : | 正则化参数 |
| 记者: | 正样本的分类精度 |
| : | 的的数量基本的内核函数 |
| multikernel函数的典型形式 | |
| : | 高维特征的映射 |
| 支持向量机: | 支持向量机 |
| CS-ELM: | 敏感的榆树 |
| MKL-CS-SVM: | Multikernel厂商支持向量机 |
| LSSVM: | 最小二乘支持向量机 |
| NC: | 正常状态 |
| 纳米: | 磨损故障 |
| 准确性: | 全球分类精度 |
| 一个: | 负样本的分类精度 |
| : | 的组合系数基本内核函数 |
| : | 高维特征的映射 。 |
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作是由中国国家自然科学基金(51765022,51765022,51169007)和云南省科学与研究项目(2015 zc005)。