文摘
旨在解决低诊断准确性造成的类似的数据分布的传感器部分的缺点,提出了一种传感器故障诊断方法的基础上灰太狼优化支持向量机(α-GWO-SVM)。首先,融合与核主成分分析(KPCA)和时域参数执行进行特征提取和故障数据的降维。然后,一种改进的灰太狼优化(拥有)算法应用于提高其全局搜索能力,加快收敛,为了进一步优化支持向量机的参数。最后,得出实验结果表明,该方法在优化性能更好比其他基于支持向量机的智能诊断算法,有效地提高故障诊断的准确性。
1。介绍
传感器功能作为主要检测设备的监控系统(1- - - - - -3),检测精度将大大减少故障。此外,它将影响监测系统的性能,甚至导致经济损失和人员伤亡在某些极端的情况下。因此,有必要作出准确的传感器故障的诊断,以确保监测系统能平稳、可靠地运行。
当断层强度保持低时,会有某些形式的传感器故障显示类似的数据分布的特点,这是一个低水平的主要原因诊断的准确性(4]。在传统的故障诊断方法5- - - - - -7]、基于模型的方法需要建立一个精确的数学模型为研究对象。然而在实践中,通常很难构建数学模型的非线性系统。对于以知识为基础的方法,他们严重依赖专家的经验,这使得他们缺乏适应性时,新的问题出现。此外,数据驱动的方法需要历史数据的学习,而不是精确的数学模型或专家知识。
与人工智能(AI)技术的迅速发展,基于AI诊断方法吸引了更多的兴趣在故障诊断领域的研究。在[8),递归神经网络(RNN)提出对非线性系统建模,从而实现故障检测与隔离的传感器。提出了一种非常随机树的方法来检测和诊断故障的传感器网络在9),很强的鲁棒性进行处理的信号噪声,但忽略了传感器节点的故障诊断。在[4),混合连续密度HMM-based合奏神经网络方法应用于检测和传感器节点故障进行分类。
然而,由于一些错误的相似的分布数据,有必要训练不同的分类器对不同故障的准确分类。此外,提出了一种故障诊断方法用于机组传感器(10),不仅通过集群来实现特征提取也识别故障类型的故障数据设置聚类指标。
传感器数据被认为是最有效的指标异常失败,非线性和巨大,使数据驱动的智能诊断方法更适合传感器故障的诊断(11- - - - - -13]。机器学习算法是一种常用的智能诊断方法,包括神经网络(NNs)、支持向量机(svm),等等。然而,大量的故障样本通常是有限的,导致神经网络的不良表现。SVM吸引了太多的关注由于其能力处理非线性和小样本故障诊断(14,15),但必须选择正确的hyperparameters来提高性能。机制可能是不同的,不同的算法和关键参数的优化通常可以提高该算法的性能(16,17]。研究人员提出或改进算法解决优化问题(18- - - - - -20.),取得了举世瞩目的成就,这给了我们一些灵感来选择合适的hyperparameters SVM。除此之外,它是一个有效的策略来提高诊断的准确性,采用适当的方法提取故障的特征数据。然而,传统的数据特征提取方法如主成分分析(PCA) (21)更适合处理线性数据。同时,时域参数也可以作为诊断的参考指标,但并不是所有的敏感,各种失败(22]。
为了解决上述问题,有很多解决方案提出了。首先,从传感器故障数据中提取多个时域参数,和内核主成分分析(KPCA)进行进行主成分分析的时域参数。然后,一些拒绝获得融合时域参数特性,可以准确反映故障的特点。其次,一个灰太狼优化( - - - - - -拥有)算法提出了支持向量机实现参数优化。引入竞争机制,增强算法进行搜索的能力。与此同时,的主导地位狼在后期加强加快收敛的算法。最后,融合特征的样本由输入到不同的诊断模型训练和测试的目的。实验结果比较分析来验证本文提出的方法对传感器故障诊断。
本文组织如下。部分2简要解释拥有的改进算法。部分3说明了基于故障诊断方法 - - - - - -GWO-SVM。仿真结果和性能分析提供了部分4。给出该方法的贡献5。
2。一种改进的灰太狼算法
灰太狼优化(拥有)算法达到最优结果的搜索目标通过模拟的领导层次和群体狩猎机制灰色的狼。它显示了搜索速度快等优势和令人满意的优化效果23]。然而,仍有改进的空间的搜索策略GWO [24,25]。因此,改进的建议灰太狼优化( - - - - - -拥有)算法如下。狼群仍分为四个水平,而违约 , ,和狼有强大的搜索功能。社会等级是最高的人口,剩下的狼被指示为 。寻找猎物的数学模型表示如下: 在哪里代表当前迭代的数量,和表示协同系数,指示猎物的位置是指当前灰太狼的位置,从2 0而线性降低,而和站的随机向量[0,1]。在 - - - - - -拥有,头狼之间的竞争关系介绍提高全局搜索能力。相应的搜索目标头狼在每个迭代中,作为故障分类错误的分数获得α得分,β分数,和δ得分。头狼级别是根据故障错误得分,重新安排和狼群的位置更新根据方程(2)- (4): 在哪里X代表狼群的位置,而 , ,和是指当前的候选人之间的距离三狼狼和最好的。当 ,猎物的狼是分散在搜索;当 ,狼开始集中精力攻击猎物。同时确保选定的狼人口最强的能力,它是根据误差变化和调整当前迭代的数量逐渐提高的主导地位狼。表达的改进如下: 在哪里代表当前迭代的数量,显示最大分类错误,表示当前分类错误,T是指的总次数的迭代。
3所示。基于故障诊断方法 - - - - - -GWO-SVM
3.1。数据预处理
在这篇文章中,英特尔实验室(网上发布的数据26)是用于执行故障注入符合现有的方法(27]。尖峰,偏见,漂移,精度下降,卡住了,数据丢失,随机故障注入原始数据。原始数据见附录,获得的故障样本数据所示1- - - - - -7。
3.2。数据特征提取
核主成分分析(KPCA)通常是进行提取特征和减少非线性数据的维数28]。KPCA的主要步骤是详细如下。假设是一家集时域参数, , 的向量 ,和每个向量由时域参数。内核矩阵计算根据以下方程:
雅可比矩阵应用于计算内核矩阵的特征值 和特征向量 ,然后是特征值降序排序。gram - schmidt正交化过程是遵循执行单位正交化特征向量,以获得 。然后,组件提取获得的变换矩阵:
公式(9)通过变换矩阵应用到转换向量 ,在哪里 是指提取的主成分向量。
提取的主成分融合时域参数。熔融特性不仅包含错误数据的整体特征也反映了地方特色的错。通过多个实验比较,均值,方差,波峰因素,和偏态系数指标作为参考当地断层数据的特点,虽然最终的融合特性被当作样本。
总共有342组样本选择的这个实验,与242组作为训练数据集100年,另一组作为测试数据集。标签1 - 8代表飙升,漂移,偏见,随机,卡住了,精度下降,数据丢失的错,分别和正常。样本训练集和测试集样本表中列出1。
3.3。建立 - - - - - -GWO-SVM诊断模型
支持向量机提供了一个有效的解决有限样本大小和非线性(29日,30.]。在模型的训练和测试,数据集通常由特征向量和标签。支持向量是通过使用特征向量和标签的样本,然后建立了超平面分离不同类型的样品。更多关于支持向量机的问题数学建模详细(31日]。“一对一”、“一对多”和“多对多”的方法用于解决multiclassification问题[32]。
标记的故障数据样本用于支持向量机训练,通过使用样本和标签来构建支持向量,然后建立了超平面,从而达到分工的不同类型的样本数据。从本质上讲,多类支持向量机的数学模型是一个凸二次规划问题。一个关键的步骤是确定合适的核函数系数和惩罚因子 。多类支持向量机的数学建模过程,详细如下。
目标函数是凸二次规划的构建 在哪里代表了拉格朗日乘子,和显示输入向量,表示的类别标签, 指的是核函数。事实上,并不是所有的数据可以线性充分分离,这提示损失考虑: 在哪里代表了法向平面向量,表明松弛变量,每个样本对应一个 ,表示程度的样本不满足约束条件,和表示惩罚因子。表示为相应的分类函数 在哪里代表了抵消常数。核函数的引入有效地提高支持向量机的能力来处理非线性。在这篇文章中,以优越的性能应用高斯核函数:
它可以看到从方程(11)和(13)这两个点球的因素和核函数参数发挥重要作用在确定支持向量机的分类性能。惩罚因子的确定合适的程度,核函数参数确定支持向量的范围,从而确定支持向量机的泛化能力。因此,选择合适的参数对提高分类的准确性是至关重要的。
3.4。 - - - - - -拥有算法优化支持向量机
当 - - - - - -拥有算法来优化支持向量机的参数,核函数和惩罚因子的参数优化。优化的流程图如图8。优化过程详细如下:(我)步骤1:设置狼群的大小 ,最大迭代次数 ,和搜索维度 ,之前初始化狼群的位置。(2)步骤2:支持向量机进行初始化 参数和搜索范围: , 。(3)步骤3:计算错误的分数的三个狼在当前 参数重新排列的狼。(iv)步骤4:最小的分类误差阿尔法狼在选举后的健身价值,更新狼群位置根据方程(2)- (5)。(v)第五步:执行与上一次迭代的健身价值进行比较。如果低于比原来的健身价值,它不会被更新;否则,健身价值将被更新。(vi)第六步:执行周期性计算,直到达到最大循环数,输出 这个时候作为支持向量机的最优参数,并构造支持向量机模型。
为了验证改进算法的有效性,这个函数 选择测试如图9。其中, , , ,和 。
图10显示了取对数后的收敛曲线; - - - - - -拥有100年之后往往收敛迭代,而拥有经过近350次迭代收敛,表明的融合 - - - - - -拥有比这更快的拥有。此外, - - - - - -拥有比拥有更准确的寻找最优值。
测试数据集组成的融合特征输入到分类器进行测试。图11显示了迭代和误差曲线GWO-SVM和数量 - - - - - -GWO-SVM。13后拥有的迭代算法,支持向量机的分类误差达到0.08 - - - - - -拥有算法表明,原始灰太狼算法的优越性是显而易见的,和支持向量机的分类误差可以达到0.04后6迭代。此外,它可以从分类错误的 - - - - - -拥有性能更好的参数优化支持向量机算法在每次迭代中,表明改进后的算法具有更好的性能优化。
4所示。仿真结果和性能分析
4.1。诊断结果
以下4.4.1。在特征选择的诊断结果比较(BFS)
故障数据通过故障注入的原始温度数据作为一节中提到的。均值,方差,均方根,峰值,峰值因子,偏态系数,和峰度系数确定的故障数据,和七个时域参数提取的主成分。通过仿真实验,高峰值,方差,峰值因子,偏态系数,提取主成分最终选择和集成得到最终数据集对支持向量机训练和测试。
在本节中,两部分的实验安排。第一部分是主成分提取的影响的比较数据集和融合数据集,第二部分是比较不同算法的支持向量机优化的效果。
BFS样本输入到 - - - - - -GWO-SVM诊断模型进行训练和测试。然后,比较执行GWO-SVM和自适应粒子群优化支持向量机(APSO-SVM)诊断模型。诊断的结果是数据所示12- - - - - -14。
从诊断结果的比较可以看出,APSO-SVM GWO-SVM是不是有多种类型的缺点,建议最低的识别数据丢失故障的能力。 - - - - - -GWO-SVM使共9套错误,和性能比其他的要好。尽管如此,仍然存在着各种各样的缺点被误诊。证明,只有利用KPCA特征训练模型提取的实现准确诊断导致的失败。
4.1.2。诊断结果比较后的特征选择(AFS)
AFS的诊断结果如图15- - - - - -17。根据诊断结果的分析,APSO-SVM和GWO-SVM更准确,团体的数量分类样本较小,和分类性能明显改善。它是证明了熔融特性可以有效地提高诊断的可靠性。
4.2。分类器性能的比较分析
由于这个实验是multiclassification样本分布的不均衡的问题(33)、精密和kappa系数考虑评估分类器的性能。其中,精确代表了分类器的性能正确区分每种类型的样品,和一个更大的值表示的分类具有更好的性能。kappa系数分类器产生的证据的一致性的诊断结果与实际类别的样本(34]。此外,更大的值表示的分类具有更好的性能。精度和kappa系数的数学公式表达如下:
精度。分别计算每个标签的精度,与未加权的平均水平。 在哪里代表真正的积极和的数量指的是假阳性的数量。显示的能力诊断样本准确分类器,根据各自的类。意味着样本分类诊断不准确。 在哪里是所有样品的分类精度,是真正的样本类的数量吗 , 是诊断类样品的数量 ,和是样品的总数。
分类器的性能指标比较结果如图18和19和表2和3,分别。至于BFS,精度 - - - - - -GWO-SVM达到93.83%,kappa系数达到89.91%。除此之外,只有9组的样品是错误的,说明最佳的分类性能。GWO算法相比,精度提高了1.32%,而kappa系数增加了2.24%,这表明改进算法性能更好的优化支持向量机的参数。
关于AFS,分类器产生一个优秀的性能。精度 - - - - - -GWO-SVM是97.29%,kappa系数是95.52%。除此之外,还有只有4套样品得到更进一步的。BFS相比,精度提高了2.82%,kappa系数增加了4.49%,这表明特征融合是有效地提高诊断的可靠性。
5。结论
提出了相当大的贡献的传感器故障诊断方法相比,以前的方法总结如下:(我)为了提高传感器故障诊断的准确性,一个集成的传感器故障诊断方法的基础上,提出了结合数据驱动和智能诊断。结果显示,该方法能够实现传感器故障的准确诊断故障时保持低强度。(2为了充分从故障数据中提取有价值的信息,提出了一种特征提取方法的基础上融合KPCA和时域参数,进行实验,证明融合特性有效地提高诊断的准确性。(3)此外, - - - - - -拥有算法来优化支持向量机的参数,从而提高支持向量机的泛化能力。通过多重比较实验和分析精度和kappa系数等性能指标,结果表明,相比其他基于支持向量机的智能诊断算法, - - - - - -GWO-SVM诊断方法产生一个更好的分类性能,该方法是有效地提高诊断的可靠性。未来研究的重点将对这种方法提出的普遍性。
数据可用性
使用的数据来支持本研究的结果中包括补充信息文件。
的利益冲突
作者宣称没有利益冲突。
确认
这项研究得到了国家自然科学基金项目批准号下62073198,山东的主要研究开发项目批准号下的中国2016 gsf117009。
补充材料
“实验数据。多克斯”包含了用于实验的数据集。(补充材料)