文摘
与智能制造业和工业物联网的快速发展,许多工业控制系统系统本身的安全性有很高的要求。工业控制设备的故障将导致异常操作的工业控制设备和浪费资源。是很有意义的检测和识别潜在的设备异常和故障时间和实施有效的容错策略。在工业物联网环境下,工业控制设备的指令和参数经常变化由于实际需求的变化。然而,它是不切实际的定制每个参数值的学习方法。针对这个问题,本文提出一种基于集成学习的故障诊断模型,提出了一种基于动态更新投票权重方法编程来帮助决策。这种方法是基于装袋策略并结合动态规划投票权重调整方法完成故障类型的预测。最后,本文使用不同的负载动态条件;Bagging-based故障诊断的诊断功能集成模型在动态变化的工业控制系统环境是由实验验证。工业控制设备的故障诊断模型基于集成学习有效地提高模型的自适应能力,使真正的智能故障诊断框架。 The voting weight adjustment method based on dynamic programming further improves the reliability of voting.
1。介绍
传统的工业控制系统安全故障诊断主要集中在工业控制设备的机械故障。然而,随着智能制造业和工业物联网的快速发展,工业控制设备之间的联系日益密切,和操作环境变得更加复杂。这也在一定程度上增加了设备故障的概率,从而进一步提高设备管理和控制成本。在工业物联网环境下,工业控制设备的指令和参数经常变化由于实际需要的变化。例如,因为更多的工业任务需要在很短的时间内完成,电流、电压、速度、负载、工业控制设备和其他参数必须调整,这样可以成功完成手术。实际环境参数变化,安全返回的故障信号传感器和操作参数的变化也会改变。这些动态因素带来了巨大的挑战在工业控制设备安全故障诊断环境。工业物联网环境中,参数是不断变化的,所以它不是实际定制每个参数值的学习方法。
如何智能地检测改变安全故障序列根据实际参数的动态变化是本文的重点。
本文的主要内容如下:(我)一组安全故障诊断模型提出了基于整体学习。安全故障诊断模型具有较高的精度条件下,设备参数变化。(2)调整投票权重的方法提出了基于动态规划。权重可以评估每个学习者的基于当前的性能。权重然后评估完成后更新。
2。相关工作
近年来,大量的研究一直在进行智能故障诊断和预测工业物联网。故障诊断和预测是最重要的一个功能在复杂和高安全性的工程系统时,特别是故障诊断,已被深入研究的主题在过去四十年。此功能允许检测和隔离早期发展中失败和预测故障传播,使预防性维护,甚至可以作为一个对策灾难性事件由于失败的可能性。陈等人。1)提出了一个分布式快速故障诊断方法基于确定性的多机电力系统学习(DL)理论。穆萨维的研究等。2),一个有效的策略,故障检测和隔离(FDI)介绍了一种工业燃气轮机的基于集成学习的方法。Soleimani et al。3]研究早期绝缘恶化的影响在变压器内部的温度使用有限元electromagnetic-thermofluid方法,提出在线传感器决策预测基于观测的故障诊断方法。Kumar et al。4)建立在推理模糊管理的思想分散控制的设置和发展框架推理分散的诊断。关等。5)提出了一个控制和保护框架基于多重代理系统(MAS),在这情况下区域代理的意识起着重要的作用。
集成学习是一个非常受欢迎的机器学习领域的研究方向(Dietterich, 2002)6]。它的核心思想是建立多个模型,然后合并他们的决定的结果,从而获得更好的结果比单一模型。常见的集成学习方法包括装袋(Breiman, 1996)7),增加(Freund, 1996)8),随机森林(RF) (Breiman, 2001)9),XGboost(陈,2016)10],GBDT(弗里德曼,2001)11]。有许多相似之处综合学习和信息融合。信息融合主要分为三类:数据层融合、特征层融合和决策融合层。集成学习的内容包括决策融合。集成学习有两个重要的步骤:一是建设的基本模型,另一个是融合方法的选择。良好的融合方法能有效提高集成的效果。
接下来,我们总结了基本模型选择方法和决策融合方法。
整体学习可以被视为一个multimodel系统。有两个主要因素影响集成效应:一个是单个模型的性能;另一个模型之间的多样性。模型之间的差异越大,整合后的效果越明显。为提高模型的多样性,主要有以下方法:(1)使用不同的训练数据集训练相同类型的模式12,13]。装袋和随机森林方法都以这种方式产生不同的基础模型。通过这种方式,不同的基本模型生成。上述两种方法生成不同的训练数据集通过重采样原始训练数据集。然后,相同的基本模型是单独训练。例如,随机森林使用不同的训练集训练决策树模型。装袋可以选择任何基本模型,如决策树模型或神经网络模型(14,15]。(2)通过不同的特征子集,模型训练和随机森林建立决策树每个节点,和不同的特征子集是随机选择的16]。这进一步增强了决策树的区别,可以达到更好的集成性能(17,18]。(3)完全不同类型的模型作为基础模型(19,20.]。(4)不同的模型参数是用于构建基本模型(21]。
大多数现有的集成学习方法构建基本模型通过上述4种方法。
决策融合方法主要可以分为两类:一是基于标签的融合方法的输出,另一个是基于概率融合方法的输出。基于标签的方法主要包括投票方法(林,1997)22),Borda计数法(爱默生,2013)23),和行为知识空间方法(noble)(黄,1993)24]。概率的方法主要包括决策模板法(Kuncheva, 2001)25),Dempster-Shafer (DS)证据融合方法(Sentz, 2002)26),而贝叶斯融合方法(Stathaki, 2011)27]。
3所示。安全故障检测模型基于集成学习的工业控制设备
为了能够自适应工业控制系统环境的变化,提出了一种安全故障诊断模型基于集成学习的工业控制设备。模型是一个复合模型由多个个体安全故障分类器。个人安全故障分类器投票安全故障检测的结果,和安全故障组合分类器进行安全故障诊断基于每个分类器的投票结果。图1显示了特定结构的安全故障分类器基于复合模型。相比之下,个人安全故障分类器(28,29日)、安全故障分类器基于复合模型往往有更精确的结果。
工业控制设备的安全故障检测,让安全故障类型的集合 ,真正的功能安全故障分类 ,和个人安全故障分类器的错误率 。然后,为每个单独的安全故障分类器 ,有
在这里,米是个人安全故障分类器的数量是奇数, 是安全故障类型和x是输入安全故障序列。当超过一半的个人安全故障分类器能正确分类的安全故障序列,故障安全集成分类器能正确分类如下:
假设每个安全故障分类器的错误率是相互独立的。然后,根据它,它可以知道检测错误率的安全故障分类器组合如下:
它可以从公式(3),当个人安全故障分类器的数量增加,安全故障组合分类器的错误率会变得越来越低。
根据是否有很强的相关性之间的个体学习者,当前集成学习方法可分为两类。在第一类中,个人学习者有很强的依赖关系。在这种情况下,必须使用串行代集成学习。这种方法的主要代表是提高。另一方面,个体学习者之间的依赖关系是低,它没有很强的相关性。在这种情况下,使用并行化方法,可以同时生成。这种方法的主要代表是装袋和随机森林。
由于工业控制环境中的安全故障诊断实时要求高,如果使用串行继承方法,结果每一轮的训练集的选择与学习前几轮的结果。这个过程有一个很大的时间开销,很难满足工业控制系统的实时要求。因此,本文采用一种并行集成学习模型自适应诊断工业控制设备安全的缺点。
3.1。综合安全模型故障诊断基于装袋
在工业控制的安全故障诊断系统中,如果一个安全故障诊断需要集成模型具有较强的泛化能力,个人安全故障学习者综合模型应该尽可能独立从对方30.量32]。然而,由于工业控制环境的影响,几乎不可能在实际情况实现独立于彼此。如何使安全问题相对较大区别个体学习者已成为研究的关键。
并行集成学习的代表,装袋算法具有广阔的应用前景。假定安全故障样本数据集在当前工业控制环境下都安全故障序列参数 ,在哪里 。下的安全故障数据参数需要检测, 。
的基本过程基于装袋算法的故障诊断方法如下。
首先,训练集组成的分裂和取样设备状态数据,和几个不同的subtraining集。然后,安全故障数据集扩张方法基于周期重叠采样用于扩大安全故障数据集。其次,通过深卷积模型训练,我们训练多个独立故障学习者从这些subtraining集。然后,我们输入下的故障训练改变参数。通过投票决定,我们可以得到故障类别的输出。
安全故障诊断方法的基本流程的基础上,装袋算法如图2。
首先,安全故障数据集扩充方法基于周期重叠采样用于扩大安全故障数据集。假设增强的数据集包含米安全故障样本。选择一个随机样本的安全故障数据集和添加到样本集,选择完成后安全返回错误的数据集。这样,下次样本可能被选中。后重复这个过程米次,一组抽样包含米样品可以获得。这样,一些样品在最初失败的数据集将会出现多次采样集,虽然有些不会出现在采样集。这种抽样方法,样本不会被选中的概率
从图可以看出3当样品的数量米安全故障数据集足够大,样本的概率并不总是趋向于稳定的采样。它可以从公式(4),增加安全错误的数据集,约63.2%的样品出现在采样集。重复上述过程k次,分别,我们可以得到k样本集包含米样本。
利用卷积神经网络安全故障诊断方法作为一个个体学习算法,每个参数下的样本集训练获得个体学习者。然后,这些个体安全故障学习者结合预测安全故障类别通过投票策略。如果有多个类别的票数最高的投票后,故障类型是随机选择算法的输出。
安全的复杂性分析下面执行基于装袋的故障检测方法。假设每个单独的计算时间复杂度安全故障的学习者 。因为包装方法支持并行计算,假设个体之间的上下文切换时间安全故障的学习者和时间选择投票 。因此,装袋算法的时间复杂度 。事实上,与个别学习者的计算时间相比,上下文切换的时间和投票的时间选择在装袋并行计算可以忽略不计。因此,在时间复杂度方面,Bagging-based安全集成故障诊断方法只有一个恒定的水平差距相比个体学习者和更高的性能。
3.2。组合策略基于投票的安全故障诊断方法
常见的基本的集成策略包括投票,平均,和学习。这些方法相对简单但非常强大的。工业控制设备安全等分类问题的故障诊断,结合战略基于投票的方法得到了广泛的应用,取得了良好的效果。投票方法采用少数服从多数的原则。个人安全故障分类器需要选择一个预测标签 。此外,投票方法可以分为绝对多数投票方法,相对多数表决的方法,等等。
对于绝对多数投票方法,为一个特定的安全故障类别 ,如果它超过一半的个人安全故障分类器,然后这一类用作输出类别;否则,预测是拒绝。公式如下:
在这里,代表和计数功能代表所有的预测结果。
相对多数的投票方法,策略将选择得票最多的类型作为最终的预测结果。如果有多个安全故障类型和相同数量的选票票数最高,然后随机选择其中一个安全故障类型作为最终的输出,这是
4所示。基于动态规划的方法来调整投票权重
每一个现有的k采样集包含米安全故障样本。因为这些收集的样本集初始故障数据集和初始数据集包含n失败的样品在不同的参数下,样品类型 。如何确定初始重量的投票权重调整方法基于动态规划和体重状态转换方程的关键是是否Bagging-based合奏学习方法可以自适应预测未知参数下的安全故障序列。
从理论上讲,每个分类器应该有相同的初始重量。理论上,每个分类器应该有相同的初始重量,因为他们都从初始故障数据集。由于随机性的提取,比例参数对应的安全故障序列米采样集不能完全相同。下故障序列的检测参数θt,如果之间的距离θ我和θt更接近,理论上,序列的波动和振幅错θt可以被认为是类似的故障序列检测。换句话说,下参数,个体学习者应该更好的泛化能力,而参数下的个体学习者远离 。
基于分析,初始个体学习者的投票权重确定过程如下。
首先,根据之间的距离 和 ,设置参数距离影响系数 。参数越接近是,大影响系数的值是, 。
其次,计算每个参数下的数据的比例在每个采样设置为 , 。
第三,解决初始化权重参数,解决公式如下:
在这里,k是学习者个人的失败。在这一点上,投票权重的初始参数的确定。接下来,投票权重参数的状态转换方程确定。
加权状态传输的每个安全故障学习者投票根据前面的安全故障检测结果。如果以前的检测成功,那么安全缺陷个体学习者被认为参数下有更好的效果 ,和安全的重量错误的个体学习者应适当增加。如果前面的安全故障检测未能预测成功,安全缺陷个体学习者的投票权重应适当减少。
体重增加或减少的比例也是动态变化的。变化的比例是由测试数据的规模和安全故障检测的准确性。当数据规模很小,重量的比例调整是相对较小的,不管成功或失败的个人安全故障学习者检测。因为统计特征不明显,当数据很小,可能会有一些机会。相反,当数据量很大,个别学习者的总体性能可以反映。如果安全缺陷个体学习者已经显示出好的结果在前面的检测,如果它成功地检测到当前的测试样本,调整比例的体重增加也将增加;如果当前样本失败,减肥是相对较小。如果安全故障学习者在前面表现不好检测,然后如果它成功地预测当前安全故障样本,然后改善体重的比例很小。如果当前的测试样本预测失败,失败的投票权重也相对较大。具体投票权重传递方程如下:
在这里,重量计算,最后的投票权重,代表一个加权函数的增量功能测试失败的数量样品和检测精度时,检测是正确的,函数代表一个减肥功能测试失败样本的数量和检测错误率时检测错误,代表的数量目前样品测试失败,代表的检测结果jth个人安全故障的学习者我th测试集,故障数据样本空间,代表真正的功能安全故障类别。
集成安全故障诊断模型中基于装袋,绝对多数投票和相对多数表决投票。当绝对多数投票方法可以直接确定故障类型,类型选择投票是输出;当绝对多数投票方法不能确定故障类型,相对多数表决方法用于选择。
5。实验结果和分析
本文使用CWRU轴承故障数据集来验证所提出的故障诊断方法的可行性实验。CWRU轴承故障数据集来自凯斯西储大学的实验室(http://www.grouplens.org/node/73)。在这个实验中,数据集分为正常数据,12 k驱动端轴承故障数据,48 k轴承驱动端故障数据,和12 k轴承风扇端故障数据根据不同的频率。对于每个类型的数据,故障样本收集了在四种不同负载下(0惠普,1惠普,2惠普,3惠普)。本实验采用12 k驱动端轴承故障数据进行实验。断层位置分为内环,外环故障和滚动体故障。故障直径的不同部分分为四种类型:0.007英寸、0.014英寸、0.021英寸和0.028英寸。为外环的失败,没有样品失败的直径为0.028英寸。因此,与正常数据,总共有12个故障状态。为了验证诊断能力的集成故障诊断模型基于装袋在动态工业控制系统环境中,这个实验将使用不同的负载动态条件来验证模型的诊断能力。具体的实验策略如下。
安全故障实验中使用的数据集包含安全故障样本与负载大小为0惠普,1惠普,2惠普,3惠普。这个实验在三个负载下使用安全故障数据综合培训和使用训练模型对另一个负载下的数据集进行分类。安全故障数据集定义在0惠普,1惠普,2惠普,3惠普为A, B, C和D的数据集。有四组实验验证。具体实验组如表所示1。
在这里,有18000个样本的每种类型的失败为每个数据集。在以下,第一组实验为例进行分析。自从Bagging-based安全故障诊断综合模型使用的投票机制分类、学习者学习的数量设置为奇数促进投票。在这个实验中,学习者学习的数量设置为9。三种类型的样本数据集A, B和C是第一,混合和混合数据集称为S分为9部分,并确保每个数据集不包含重复的样本。每个抽样的样本分布均衡后设置如表所示2。
对于每个采样数据集,训练集由self-sampling选择方法和狼狈的数据集作为数据集的验证集。self-collection self-sampling后对应于每个安全故障诊断模型如表所示3:
如表所示,self-sampled样本数据分布每个学习者的学习。传统的安全故障诊断模型基于卷积神经网络学习训练集获得每个安全缺陷个体学习者。然后,现有的模型用于合奏学习。实验数据如表所示4。
使用安全故障数据集A、B和C诊断预测的数据安全故障数据集D,个体学习者的平均诊断正确率为91.23%,平均精度综合学习者是94.93%;安全故障数据集的A、B和D,预测故障数据集C的数据诊断。个体学习者的平均诊断的准确性为91.53%,平均精度综合学习者是95.79%。故障数据集A, C和D B数据集用于预测失败。数据诊断。个体学习者的平均诊断正确率为91.95%,和综合学习者的平均准确率为95.86%。安全故障数据集B, C, D是用于诊断预测的数据安全故障数据集a个体学习者的平均诊断正确率为91.48%。诊断的准确性为91.48%,平均精度综合学习者是95.41%。实验结果表明,基于整体学习安全故障诊断方法可以获得更高的诊断精度的动态变化下设备参数。
从以上实验结果,我们可以清楚地看到工业控制设备安全的优点基于集成学习的故障检测算法:(我)我们处理的动态因素,工业控制系统,提出一种故障诊断模型的工业控制设备基于整体学习。这有效地提高了模型的自适应能力,使真正的智能故障诊断框架。(2)我们使用基于动态规划的投票权重调整方法以进一步提高可靠性的投票。
通过验证,安全故障检测模型基于集成学习的工业控制设备,我们建议可以有效地处理工业控制系统的动态因素。
6。结论
针对问题的实际参数的动态变化环境的智能制造业和工业物联网,本文着重于安全工业控制设备的故障诊断。本文研究如何通过现有的自适应完成安全故障诊断模型和创新提出了一种基于集成学习的安全故障诊断方法模型。这有效地提高了模型的自适应能力,使真正的智能故障诊断框架。此外,这种方法是基于投票权重调整方法,有效地提高了投票的可靠性。
数据可用性
所需的原始/处理数据复制这些发现也不能在这个时候作为数据共享一个正在进行的研究的一部分。
的利益冲突
作者宣称没有利益冲突。
确认
本文部分支持中国国家重点研发项目(2020号yfb1805503),江苏省现代教育技术研究项目(84365),全国职业教育教师企业实践基地“集成工业和教育”特殊项目(研究人工智能的评价标准职业技能水平)。