文摘
针对故障诊断的轴向柱塞泵,一种新的融合方法基于极点对称模态分解法(ESMD)和随机森林(RFs)提出。首先,轴向活塞泵的振动信号是由ESMD分解得到几个固有模式函数(货币)和一种自适应全球平均曲线(AGMC)在当地的一边。其次,总能量被选为特征提取的数据通过分析整个振荡信号的强度。第三,数据预处理和标签集,然后,他们采用机器学习样本的训练和测试集。最后,RFs模型创建的基于机器学习服务(MLS)轴向活塞泵的故障诊断在云上。使用比较的测试和验证数据集测试、故障诊断精度模型的率高于90.6%,召回率超过90.9%,F1分数高于90.7%,这个模型的准确率达到97.14%。基准数据模拟机械传动系统和一个轴向活塞泵的实验数据调查清单的优越性目前执行方法进行比较和分类回归树(CART)和支持向量机(SVM)。
1。介绍
活塞泵是容积式泵,可以分为三大类,即活塞泵轴弯曲、径向活塞泵,旋转斜盘轴向柱塞泵。在报纸上,在考虑旋转斜盘轴向柱塞泵,通常称为轴向活塞泵。广泛应用于冶金机械、航空航天、工程设备领域,等等1- - - - - -2]。作为液压系统的功率组件,它决定了整个系统的压力和流量。轴向活塞泵的失败将导致巨大的经济损失,甚至严重的安全事故。此外,轴向活塞泵通常持续在高压力下和不良的工作环境下工作,和被污染的油很容易导致其失败。有必要研究轴向活塞泵的故障诊断(3- - - - - -6]。
在学术研究和实际应用,许多研究已经广泛使用的故障特征提取,进行故障诊断算法融合,智能诊断应用程序(7- - - - - -10]。提取故障特征而言,王等人应用最小熵反褶积,沃尔什变换去噪,Teager能量算子(TEO)解调,和其他轴向活塞泵的故障诊断的方法,有效地解决了技术问题从振动信号中提取故障特征被强烈的背景噪声污染(11- - - - - -13]。Casoli等人提出使用主成分分析(PCA)的特征提取技术和不同的分类检测的健康状态基于振动信号的位移变量轴向柱塞泵(14]。李等人提出了一种轴向活塞泵故障特征选择方法基于量子遗传算法(15]。刘等人采用一种新方法来评估的状态multi-information强度特性基于断层机制液压泵磨损故障的拖鞋(16]。高等人应用TEO解调使用改善clustering-based分割和L-Kurtosis在轴向柱塞泵故障特征的提取方法。王等人采用稀疏编码方法提取微弱故障的特点液压泵(17]。好等人应用加速度计时间序列分析的诊断方法基于自回归和移动平均(ARMA)模型被用来计算出泵衰竭(18]。
集成多个故障诊断算法,唐等人提出了一种故障诊断方法基于经验模式分解(EMD)和包络谱针对泵的早期故障诊断的困难。贾等人提出了一个新颖的基于符号感知重要故障诊断方法(SPIP)和隐马尔可夫模型(HMM) [19]。刘等人提出了一个loose-slip轴向柱塞泵故障诊断方法基于最小熵反褶积,集成经验模态分解,以及极端学习机(20.]。江等人整合地方平均分解和改进的自适应多尺度形态学分析液压泵故障信号解调。陆等人提出了一种故障诊断方法相结合的两步EMD方法基于波形匹配和极值镜子扩展与模糊c均值聚类确定泵的故障(21]。田等人应用一个液压泵的故障诊断方法基于局部均值分解(LMD),奇异值分解(计算),和information-geometric支持向量机(IG-SVM) [22]。郑等人提出了一种新的基于辛几何模式的融合方法分解(SGMD)和一般形态分形维度(GMFDs)液压泵的故障诊断(23]。
针对人工智能算法的应用,杜等人结合敏感性分析和概率神经网络(并提高速度和准确性的液压泵故障诊断(24]。Babikir等人集成人工神经网络(ANN)算法,猫群优化算法(方案),和萤火虫算法(FA)的噪声预测潜水器轴向活塞泵(25]。Lv等人应用当地characteristic-scale分解(LCD),模糊熵,并自组织映射(SOM)神经网络故障诊断的液压泵26]。拉萨罗和Pinilla提出了一种基于小波分析的方法和安的磨损检测液压轴向柱塞泵(27]。沈等人采用基于小波包分析的故障诊断方法和算法优化神经网络28]。Bensaad等人提出了基于物理模型的一种新方法的识别磨损的活塞泵健康的(29日]。蔡等人提出了一种基于小波包分解的故障诊断方法和有向无环图支持向量机(MDAG SVM)来解决问题,模糊故障特性的活塞泵和难以准确定位(30.]。汉等人还提出了一种综合评价方法的变分模态分解(VMD)和支持向量数据描述(SVDD)评估定量液压泵的性能下降(31日]。总而言之,上述诊断方法是高度依赖经验和人,在实际应用具有一定的局限性。
与传统方法相比,ESMD不仅可以顺利的一系列复杂的信号,同时也有效地解决了模式EMD的叠加问题。此外,总能量的脉冲模式的基础上可以计算ESMD模态分解,能量变化特征可用于故障诊断的过程(32- - - - - -35]。和RFs是一个集成的算法,与车相比,不需要删除大量的样本数据,overfit并不容易。对异常值和噪声数据,可以保持高精度,能够处理高维数据,并行处理能力的优势和可伸缩性。它可以应用于各种环境,如聚类分析和故障诊断分类(36- - - - - -39]。因此,ESMD的优点和RFS结合并应用于轴向活塞泵故障诊断的研究。
我们都知道,现在是数据驱动的时代。这是一个重要的倾向于轴向活塞泵的故障诊断基于软件即服务(SaaS)。美国职业足球大联盟是一种新的数据挖掘和分析平台。它集成了多个算法节点创建一个可视化工作流基于研究任务数据处理、模型训练、评估和预测(40- - - - - -41]。然而,轴向柱塞泵的故障诊断数据采集频率较高,通常是必需的。有必要执行边缘特征提取的计算,以降低数据维度和促进信息的传播到云平台(42,43]。摘要ESMD用于提取故障特征轴向活塞泵状态监测信号的边缘,和RFs用于构造MLS的诊断模型。
论文的大纲如下:部分2总结的原则ESMD RFs。节3与基准数据,进行仿真验证。节4、轴向活塞泵故障模拟试验台。节5,该方法应用于分析振动信号从一个轴向活塞泵。部分6总结了建议的方法和关于数据分析展示了未来的工作。
2。简要回顾ESMD RFs
2.1。ESMD的原则
ESMD通常采用奇偶极对称模态分解,和算法如下32]:第一步:找到所有的极端点(最大和最小)的原始信号Z和马克他们E我(我= 1,2,…n)。第二步:连接所有相邻极值点E我一条线段,标志着线段的中点O我(我= 1,2,…n−1)。步骤3:中间点O0和左右边界都辅以线性插值。步骤4:两个插值曲线L1和L2构造基于奇数和偶数的序数n+ 1中点。然后L1插值生成的奇怪的序数的中点,L2插值生成的中点的顺序,和他们的平均曲线L∗计算: 第五步:数据Z- - - - - -l∗后去除均值曲线l∗重复步骤1 - 4,直到(容许误差)过滤器集倍达到预设值年代。现在,我们有我们的第一个模式米1。第六步:重复上述步骤1 - 5Z- - - - - -米1获得米2,米3…,直到剩余组件r满足终止条件:极端点的数量r不超过预设值。第七步:让过滤器(S整数区间内连续变化(年代最小值,年代马克斯),重复上述步骤1 - 6获得一系列的分解结果。然后,计算方差Z的数据- r删除后残留r和标准偏差的数据Z,画均值-方差比的关系曲线 关于年代。 在哪里样本数据的价值吗 ; 的样本值保证金吗 ; 是全球平均值的数据 ; 是原始数据采样点的数量。第八步:找到价值年代0对应于最小均方误差比率 在整数区间[年代最小值,年代马克斯];集年代=年代0,重复以上步骤1 - 6恢复模式米1,米2,…。和保证金r。在这一点上,产生的利润r是一个最佳的AGM曲线。
从上面的步骤可以看出,ESMD方法可以将信号分解成一些固有模式函数(货币)和剩余组件r。在实际应用中,通常选为 。和均值-方差比 用于表示的优化程度的意思吗的保证金r。
自脉动的振幅模式反映了的能量,和每一个脉动的振幅模式随时间,所以能量变化特征可以作为研究对象。
原始信号后由ESMD来分解,将获得一系列固有模式函数。其中,的解析表达式jth固有模式函数可以表示为
其中,是jth固有模式振幅函数;是jth固有模式相函数。
的奇偶极对称模态分解,振幅函数缓慢变化的特点。总能量可以被定义为波浪能量的形式:
振动加速度信号的总能量表现为整体的振动强度振动脉动。
2.2。RFs的算法原理
RFs是一个基于决策树分类器集成学习算法。结合装袋算法和随机子空间算法的优点,介绍了两个随机过程,每棵树都有不同的分类能力。集成学习比单个分类器更好的分类性能,能有效 提高学习系统的泛化能力。
2.2.1。RFs原则
RFs是一个组合分类器的基础上K决策树 ,在哪里是一个独立同分布随机变量序列;X分类器的输入变量。基本原则:第一,引导重采样方法随机抽取从训练集样本的训练集,每个样本训练集的大小是一致的与训练集;然后决策树模型被建立了样本训练集和分类结果。最后,每个结果根据投票K分类结果来确定最优分类(44]。具体的过程如图1。
后 培训的时候,将获得一个分类模型序列,系统将形成multiclassification模型。系统的最终分类结果采用简单多数投票方法,和分类决策表达式如下: 在哪里代表了组合分类模型;是一个分类模型;代表正确的类别;指标函数。
2.2.2。RFs收敛
设置一组分类模型 ,和每个分类的样本训练集模型是随机抽样从训练集X;然后,剩余的利润函数 在哪里指标函数;Y是正确的类别;j是不正确的类别;和是平均水平。
边际函数是在多大程度上正确的类别的票数超过选票的数量不正确的类别。利润函数越大,分类器的信心就越高。泛化误差推导如下:
RFs, ,当决策树分类模型是足够大,它服从大数定律。增加的决策树分类模型,它可以证明泛化误差所有的随机序列 收敛于以下表达式:
它可以看到从(8RFs不会导致过度拟合的问题),增加的决策树,并融合。
2.2.3。树节点的定量评价
RFs由多个决策树,每一个都是独立的。熵决策树,或经常使用基尼系数量化程度的一组顺序和定量评估每个节点的分裂属性。
(1)信息熵。信息熵是信息理论的基本概念,用来代表一组的障碍程度,熵值越高,越是混沌集或命令集。这是定义如下:假设D离散随机变量吗类的范畴吗我,那么它的概率分布
然后,随机变量的熵D是 在哪里是一类样本容量的比例我在所有样本;n数据类别的数量。
(2)基尼系数。CART算法选择测试属性根据基尼系数。该算法计算基尼系数为每个样本集。基尼系数越小,越合理。它是定义如下。
在分类问题中,如果有n类和样本点的概率属于类我是 ,基尼系数被定义为 在哪里D代表所有的样本数据集;是一类样本容量的比例我在所有样本;n数据类别的数量。
3所示。故障诊断方法和仿真验证
3.1。故障诊断使用ESMD和RFs
本文结合RFs ESMD方法集成学习和应用于液压泵故障诊断。首先,液压泵状态监测信号的收集、选择和有效的原始信号故障诊断;其次,选择的原始信号的模态分解利用ESMD方法进行。第三,计算信号的总能量作为机器学习的数据源特征提取。然后,滑动窗口方法用于计算均值,方差,最大,最小值在窗口生成数据集和故障统计特征。最后,根据液压泵的故障状态,机器构造学习样本,训练集和测试集是根据比例来划分。RFs模型是建立在对MLS在云平台和测试和评估。具体方法流程如图2。
3.2。与基准数据仿真验证
进行仿真验证与基准数据来自凯斯西储大学(CWRU)轴承数据中心。轴承试验台如图3。
实验轴承测试包括电动机、转矩传感器/编码器,和测功器;它提供了正常和故障轴承的实验数据。我们使用的数据是由驱动端轴承的转速(类型:SKF6205)约1797 rpm,和采样频率设置为12 kHz。实验数据包括正常基线状态和三种故障状态的球,内心的种族,和外圈故障(6点),介绍了故障的测试轴承使用放电加工故障直径为0.1778毫米(轻微的错误),0.3556毫米(适度的错),0.5334毫米(严重的故障)。有1000000数据点在这项研究中,包括轴承十州,每个州都有100000数据点。
这些数据点是建立在三个仿真验证样本数据集,包括轻微、中等和严重故障状态。和每一个仿真验证样本集包含四种缺点:正常状态下,球的错,内心的种族的错,和外环的错。当我们进行仿真验证,ESMD用于分解数据样本获得的总能量E(t)。然后,它用于解决均值,方差,最大,最小的总能量E(t20的滑动窗口宽度)。最后,输入样本集构造机器学习,和样品标签设置如表所示1。
在相同的环境中在美国职业足球大联盟平台,由RFs构造模型与购物车模型和支持向量机模型。比较图显示在图中4。
功能设置基于ESMD随机分为训练集和测试集的比例7:3毫升。然后比较了基于混淆矩阵的模型评价指标。比较结果从轻微、中等和严重故障状态如图5。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(我)
图5显示了规范化后的测试集混淆矩阵ESMD下不同的分类器。数据5(一个)- - - - - -5 (c)RFs的结果,每个模式被确定为92%以上,最正确的分类;数据5 (b))- - -5 (h)是车的结果分类器,每个模式被确定为本身只超过58%,有更多的数据判断错误。数据5 (g))- - -5(我)不仅显示正常状态是错误地判断了还出错状态是误判为正常;大多数州的数据的支持向量机分类器判断失误。RFs分类器的分类结果与车分类器相似,以及混合矩阵的对角线价值远远大于nondiagonal线的值,但RFs分类器比车分类器。接下来,ESMD-RFs用于轴向活塞泵故障诊断方法。
4所示。轴向柱塞泵故障诊断试验台
4.1。液压系统原理
轴向柱塞泵故障试验台采用双泵供油系统。轴向活塞泵供应石油系统,在叶片泵轴向活塞泵的石油供应,防止吸入。实验对象是轴向活塞泵(MCY14-1B)。驱动电动机的额定转速(Y132M-4) 1480 rpm,工作压力设定在15 MPa。实验原理如图6。
4.2。信号采集传感器布局
三个压电振动加速度传感器(YD72D)粘到泵端负责收集轴向活塞泵的故障状态监测信号,采样频率设置为f年代= 50千赫,安装位置的振动加速度传感器是互相垂直。定义为水平方向x设在,垂直方向被定义为y设在,沿着泵轴平行的方向被定义为z设在,如图7。
(一)
(b)
4.3。轴向活塞泵的故障注入
在实验的过程中,故障注入是通过更换不同类型的故障组件与正常组件,和五个错误操作的轴向活塞泵,如正常状态,单一的拖鞋穿,单宽松的拖鞋,旋转斜盘磨损,春天穿和中心,分别复制。这些故障组件是由液压泵提供的维修单位,可以复制轴向活塞泵的运行状态,当实际的故障。其中,部分故障组件如图8。
(一)
(b)
(c)
(d)
5。故障诊断过程和建立模型
5.1。状态监测信号的选择
由于轴向活塞泵是严格与耦合驱动电动机,它可以知道泵的速度n= 1480 rpm,旋转T的泵可以计算如下:
收集正常无过错状态信号的轴向活塞泵,三个方向的振动加速度的时域波形信号的周期(和0.04 s)是随机拦截的,如图9。
从图可以看出9的振动振幅的振动加速度信号x和y显著的方向不会改变,而振动振幅的振动加速度z -方向变化显著7次在1期,准确地反映7活塞的物理特性有一个对每个时期的旋转斜盘的影响。因此,z方向状态监测加速度传感器可以敏感地拿起轴向活塞泵的运行状态变化特征,可以作为有效的数据源数据驱动建模。
5.2。原始数据采集
通过观察和分析信号数据的轴向活塞泵,原始的振动加速度信号z方向收集研究了轴向活塞泵的操作的五个州,包括正常无故障的,活塞拖鞋穿错,活塞宽松的鞋穿错,旋转斜盘穿错,和中心春天穿错,原始信号包含500000个数据点和100000数据点在每个州和相应的采样时间是2 s。每个状态的时域波形图所示10。
此外,根据远程云机器学习的需求构建训练样本和测试样本,原始信号划分计算在当地的优势,其中每个轴向活塞泵的运行状态分为10组,并且每个数据集包含10000数据点,对应0.2秒采样时间。最后,50原始信号数据集。
5.3。基于ESMD特征值提取
当地边缘计算的过程中,原始信号数据集是由ESMD首先分解方法,然后提取原始信号的特征值是通过计算的总能量E(t)。下面是一个例子的原始信号数据集旋转斜盘穿一套轴向柱塞泵的故障。
5.3.1。基于ESMD模式分解
ESMD方法用于自适应分解原始信号数据的旋转斜盘轴向活塞泵磨损故障,和相应的分解模式得到如图11。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(我)
(j)
剩余组件r通过分解是一个优化AGMC,可视为相应的原始信号的趋势项。
5.3.2。总能量特征提取的价值E(t)
不同故障状态下的轴向活塞泵,fault-induced振动所产生的能量是不同的,和获得的固有模式函数的振幅ESMD也随时间。基于ESMD,根据(4),总能量E(t)的原始信号在旋转的旋转斜盘磨损故障,如图12。
所有50集的原始信号数据分解基于ESMD模式和总能量E(t)计算,从而获得50集的样本数据集,提取的特征值不同的轴向活塞泵的故障状态。
5.4。建模基于MLS RFs
5.4.1之前。建立一个机器学习样本集
云机器学习建模需要高质量的数据,建立有效的样本集建模是一个重要的步骤和关键环节。摘要滑动窗口方法用于数据预处理。具体步骤是设置一个滑动窗口的窗口宽度20和步长为1的一维时间序列,计算均值,方差最大,和最小统计中数据的窗口,作为机器学习样本的输入。然后设置样品标签根据轴向活塞泵的故障状态(如表所示2),以价值为机器学习训练样本的期望输出。因此,50套样品适合机器学习建模构造。
5.4.2。模型建设基于RFs
考虑到机器学习的平衡训练数据,三组样本随机选择对于每个轴向活塞泵的故障状态,共15集。然后,总结了15套样品模型训练样本数据。然后,RFs的工作流建模训练是建于MLS,如图13。
培训模式是通过学习训练样本训练,调整参数,优化模型在培训过程中。最后,RFs模型的最优参数确定决策树在森林里的数量是200,树的最大深度设置为4,决策树在森林里使用最低基尼系数来确定内部的分裂属性节点,和RFs特征子集选择策略的选择值并将其保存为轴向活塞泵故障诊断PMML模型文件。
5.4.3。模型测试和评估
在相同的环境中在美国职业足球大联盟平台,由RFs算法构造模型与购物车分类模型和支持向量机模型基于轴向活塞泵故障数据。比较是基于模型评价指标如混淆矩阵,精确率、召回率,F1-score,图中可以看到14。
(一)
(b)
(c)
图(14日)RFs的结果,模式0本身被确定为95%,模式1被认为是本身有93%,模式2本身被确定为94%,模式3本身被确定为91%,和模式4本身被确定为94%;所有的模式被确定为自己超过91%,模型的精确率高于90.6%,召回率超过90.9%,F1分数高于90.7%。图14 (b)是车的结果;每个模式被确定为本身只有60%以上,和模型的精确率高于60.8%,召回率超过59.7%,F1分数高于60.3%。图14 (c)支持向量机分类器的结果;很多模式被确定为模式2,和最状态数据的支持向量机分类器判断失误。上述结果表明,ESMD-RFs模型更有效轴向活塞泵故障诊断。
5.5。模型应用和分析
剩下的35个样本集是用于验证数据集的轴向活塞泵故障诊断模型。首先,每个测试样本数据集上传到云上的水桶,一个接一个地和节点,如阅读测试集的数据观察,修改元数据,阅读随机森林模型,模型应用程序,将数据保存到数据集用于MLS在云上。验证工作流轴向活塞泵故障诊断模型的建立,如图15。
在故障诊断模型验证的过程中,首先,根据轴向活塞泵的故障状态,验证数据集分为5类(每个类别包括7组验证数据集),和每个类别对应一个唯一的标签值。然后,35集验证集的数据输入到轴向活塞泵故障模型根据类别,一个接一个地诊断和模型输出数据得到图所示16。
(一)
(b)
(c)
(d)
(e)
视觉过程中故障诊断数据的分析轴向活塞泵,雷达图中的箭头的位置代表的故障诊断类型测试集,它可以看到从图16正常状态16 (a),单个松散拖鞋16 (c),旋转斜盘穿16 (d)和中心春天穿错16 (e),四种轴向活塞泵故障可以描述清楚。其中,单一拖鞋穿如图16 (b),有6组验证数据集与正确的故障诊断和1组故障诊断错误;故障类型与正常无故障的状态容易混淆。如果比较16 (b)和(a),发现的错误单拖鞋穿在上升,而正常状态的下滑。这种现象反映了轴向活塞泵,有早期的小断层和其性能逐渐恶化。
总之,RFs模型轴向活塞泵故障诊断与35验证数据集验证和评估。其中,34个样本正确诊断和1样品是错误的。该方法的准确性为轴向活塞泵故障诊断是97.14%。
6。结论
针对轴向活塞泵的故障诊断,一个新的轴向活塞泵的远程故障诊断方法,提出了结合边缘计算使用ESMD和RFs诊断算法使用MLS的云计算平台。通过测试和验证轴向活塞泵正常无故障的,单一的拖鞋穿,单宽松的拖鞋穿,旋转斜盘磨损,和中心春天穿,模型的精确率高于90.6%,召回率超过90.9%,F1分数高于90.7%,和模型的故障诊断准确率为97.14%,这表明该方法的准确性和有效性。此外,研究有机整合的轴向活塞泵状态监测信号,计算特征提取当地优势,和云故障诊断模型,它可以提供一个实现方法建设的轴向活塞泵远程故障诊断系统。
数据可用性
这些数据可以从凯斯西储大学轴承数据中心访问网站(http://csegroups.case.edu/bear-ingdatacenter/pages/downloaddata-file)。和其他. csv数据用于支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作是由博士科研启动项目的中国北方航空航天工程学院(bky - 2021 - 05),中国国家自然科学基金(51875498)和关键项目河北省自然科学基金(E2018203339)。