文摘
机械设备制造业的应用越来越复杂的技术开发和采用。为了保持生产线的高可靠性和稳定性,减少停机时间,维修和日常维护的频率是必要的。因为机器和组件的退化是不可避免的,准确估算的剩余使用寿命至关重要。我们提出了一个集成的深度学习方法与卷积神经网络和长期短期记忆网络学习的特点和估计剩余使用寿命值与深度生存模型基于离散威布尔分布。我们进行了涡扇发动机退化模拟数据集从商业模块化Aero-Propulsion NASA提供的系统仿真数据集来验证我们的方法。改进的结果证明,我们的模型可以捕捉错误的退化趋势,在复杂条件下性能优越而现有最先进的方法。我们的研究提供了一种有效的特征提取方案和提供了一个有前途的预测方法做出更好的维护策略。
1。介绍
与物联网(物联网)技术的发展及其应用的工业环境中,数据分析方法可以应用于机械设备健康和性能。事实上,任何机器故障可能会导致巨大的损失对生产产量。然而,有时甚至是一个专业的和有经验的工程师无法找到错在哪里,也不能找出故障的主要原因。在这种情况下,公司别无选择,只能暂停生产线彻底检查,这的确是一个灾难性的情况下对公司的业务。为了保持生产线的高可靠性和稳定性,减少停机时间修复故障和日常维护的频率是必要的。最早的维护技术发生只有当故障发生时,即故障维修或run-to-failure维护。后,公司往往有基于时间的预防性维护。这意味着工程师定期进行预防性维护,尽管机器尽管它的状态是在健康的状态。预防性维护将会造成很大的成本,成为许多企业的主要费用。为了节省成本,另一个维护策略等状态维修(CBM)想出了解决的情况。 CBM proposes to reduce the number of unnecessary regular preventive maintenance and improves the reliability of machine by implementing maintenance only when there is an evidence that an exception occurs [1,2]。因为它是有效的节省公司成本,煤层气已经越来越流行。预测和健康管理(榜单)是煤层气的主要任务之一。物理加工的核心是剩余使用寿命的评估(原则)的机器根据收集到的信息的历史和正在进行的降解趋势(2- - - - - -4]。榜单的流程图包含五个主要流程如图1,包括数据采集、信号处理、诊断、预后和维护决策。数据采集是第一个物理加工过程是由传感器、数据传输和数据存储设备。不同种类的传感器是用来收集不同类型的数据,这是健康状况相关,能够反映监控机的退化过程。信号处理的任务就是从数据中提取有用的信息从上一步获得的。诊断是一个过程把机器的一生分成不同的健康状况。预后是旨在估计从当前时间的时间当它需要修理或更换,这也是原则的定义。维修决策是榜单的最后过程和用于分析诊断和预测的输出。如果我们能预测原则,我们可以提出一个策略调度维护,避免计划外停机,并优化操作效率和频率节省更多的成本。然而,知道机器和组件的恶化是不可避免的,适当的调度的挑战随着机器的复杂性。预见性维护的一个关键问题是设备故障的预测应该足够早,以便适当的维护可以预定在它发生之前。 Therefore, predictive maintenance is based on the continual monitoring of the equipment in order to determine the right maintenance actions at the right times. The organization of this paper is as follows. Related works on RUL prediction is introduced in Section2。我们提出了深度学习的方法与生存模型中描述的部分3。节4,实验结果和评价与现有的方法相比,显示了该方法的有效性。我们结束我们的方法的贡献和局限性5。
2。相关的工作
一般来说,荷重软化的方法可以分为基于模型的估计问题,数据驱动和混合的方法。基于模型的预测应用系统退化的物理模型(5]。这种方法可以进一步分为微级模型(6)和宏观的模型(7]。微程序级模型需要考虑的假设和简化在不确定的环境。宏观的模型是建立在不同操作条件下的物理系统包括输入变量之间的关系,状态变量和系统输出。然而,基于模型的方法需要大量的先验知识。物理模型很难建立在许多组件,限制了该方法的有效性。数据驱动的方法检测通过大量的传感器系统的状态监控,更适用于复杂的系统,不需要一个全面的理解的物理理解(8]。目前,高维数据收集在真实物理加工应用中很难直接发现的趋势预测算法。有不同的操作条件和健康状态相同类型的系统,可能会导致不同的降解过程以及unit-to-unit可变性(UtUV) [9]。这种情况为原则估计带来了困难。Javed等人贡献了一个基于数据驱动的预测方法在极端学习机(ELM),就是能模型退化状态没有假设均匀模式(10]。刘和陈总和间接健康指示器(嗨)和光滑单调信号从感官数据和多个高斯过程回归(GPR)模型实现原则预测(11]。以前作品基于Box-Cox转换(BCT)建造了一个模型和蒙特卡罗(MC)模拟预测电池原则(12]。Khelif等人开发了一个程序来估计原则直接从传感器值利用支持向量回归方法模型之间的直接关系传感器值或卫生指标(13]。然而,戏剧性的变化和变化的指标做一个训练有素的预测模型,可能不适合实际应用。传统的特征提取方法很难从测量得到高层表示,和穷人预后性能可能会实现。因此,从高维数据有效地捕捉隐藏模式是特征提取过程中的一个必要的过程14]。混合方法来补充基于模型和数据驱动方法的优越性(15]。然而,它仍然是一个具有挑战性的工作,利用这两种方法的优点,避免缺点。
最近,数据驱动的预测方法侧重于灵活的深度学习模型从高维数据有效地捕捉有用的信息。张等人采用多目标进化算法与传统的深层信念网络原则(DBN)估计在预测16]。序列学习方法如隐马尔科夫模型(HMM)用于捕获时间序列信息从感官数据(17- - - - - -19]。在模型中,每个国家只能依靠以前立即状态和隐状态必须来自离散空间。然而,长时间的依赖关系建模可能导致高计算复杂度增大而设置的隐藏的阶段。递归神经网络(RNN)模型时间序列数据,和一些工作应用它来估算原则(20.]。但RNN有其限制获取长期的时间依赖性,在许多隐藏层梯度传播往往消失或爆炸(21]。长短期记忆(LSTM) RNN的网络是一个重要的分支,可以长期的依赖,避免梯度消失和爆炸在长序列训练。以前的研究已经表明LSTM网络可以揭露隐藏模式的顺序与多个操作条件下,传感器数据的错,和退化模型(22,23]。等新方法基于LSTM双向长期短期记忆(BLSTM)网络(24]和香草LSTM [25),提出了。王等人提出了一个传输基于BLSTM网络的学习算法,可以第一个训练数据集和调整模型不同但相关的数据集26]。最近的工作也增强LSTM网络注意力机制和生成对抗网络(GAN)提高深层网络的可解释性和准确性(27- - - - - -29日]。卷积神经网络(CNN)的体系结构已经被证明是有效的多通道连续的传感器数据提取抽象信息(30.- - - - - -32]。尽管LSTM网络使我们能够构建和获取长期的时间依赖性,其特征提取能力略低于美国有线电视新闻网(33]。CNN可以提取空间特征而LSTM可以学习时间特性。因此,它是更好的学习时间特性的缓慢通过梳理这两个结构固有的长期退化过程。最近的一篇论文提出了一个使用LSTM和CNN深层神经网络结构,可以以串行或并行的方式组合在一起,从而提高设备的原则预测的准确性(34,35]。
之前的大多数作品集中在荷重软化原则预测问题,提出一个数字值。然而,它是几乎不可能找到一个方法,可以预测原则一模一样真正的一个。如果差异很大,很难有信心的预测结果。荷重软化预测问题也类似于常用的生存分析模型time-to-death事件在医疗领域34]。例如,失败的模型预测将发生在8天以80%的概率比预测10天,直到失败。Martinsson递归神经网络提出了威布尔比较,这是一个简单的框架,用于时间序列预测的时间到下一个事件适用(36]。Aggarwal等人用威布尔分布的假设与线性失效事件故障率对应线性退化模型,大多数文献是(34]。
由于复杂环境在现实生活中的物理加工应用中,监测顺序传感器数据受到操作条件和故障模式的预测算法。现有的数据驱动的方法往往依赖于整个传感器的测量数据进行训练,可能会导致更少的效果和偏见。为了应对这个问题,有一个巨大的潜力提高荷重软化估计从部分信息中提取潜在的模式,是一个必要的过程从高维连续的传感器数据获取有用的信息。也是有价值的估计还剩下多少时间的设备,一起失败的概率。因此,我们整合CNN和LSTM深生存模型来提高特征提取的能力和捕获错误的退化趋势,合理预测地平线。
3所示。材料和方法
我们的方法的总体工作流程如图2。不同的传感器可能有不同的物理意义和数值范围。为了消除价值的影响范围,我们首先应用min-max归一化法作为调整缩放功能传感器值的范围在0和1之间。第二,训练数据和测试数据准备与滑动时间窗口(TW)生成连续的样本。第三,我们使用一维时序曲线玲珑学会隐藏模式在这些连续的样本没有任何其他传感器值的干扰。,提取的时间模式从一维卷积会送入LSTM网络学习长期短期的时间依赖关系。第五,我们同时使用回归和生存分析离散威布尔分布来估计荷重软化和失效概率在训练阶段。最后,我们可以预测原则和失败的概率测试数据训练模型在测试阶段。
3.1。数据准备与时间窗口
输入顺序从发动机传感器数据被认为是一个矩阵 与传感器(测量),表示发动机ID和表示过去的观察周期或故障发生的周期图3。采用滑动时间窗口的策略生成时间序列数据除了在一个采样时间步可以更好的进行有效的特征提取。采取作为输入和提取顺序方程(1)通过滑动固定时窗长度(TW) ,这可以呈现在图3: 在哪里 代表一个 - - - - - -维数组的测量时间(周期)TW的大小 。因此,每个数组的大小由TW提取每一次 k(TW数量的传感器),数组的数量 - - - - - - (终生cycles-TW)。
3.2。时间回旋的层
更有效地处理顺序信息,CNN层可以用来提取抽象和高级特性之前LSTM层。颞卷积层由三层组成,从1 d-convolution 1 d-max-pooling,紧随其后的是激活函数。1 d代表卷积滤波窗口长度和走向对面的深度数据。我们考虑到输入数据矩阵大小 数组中 ,还有探测器与类型的特性内核大小。所以,每个特征检测器 时间和生成的一组特征检测器的地区 。然后,我们加1 d-convolution重量内核和偏见所以卷积操作显示为
在哪里表示产品(element-wise产品)和阿达玛代表了非线性激活函数,线性整流函数(Rectified Linear Unit)。因此,1的输出特征图谱d-convolution层的大小 。因为我们有多个时间卷积层,我们和的输入和输出分别th层。我们表示功能层的地图作为可以计算吗
3.3。长时间的短期记忆
盖茨LSTM细胞状态依赖于三个控制:输入门,忘记门,门输出。输入门控制的程度传入的数据流入细胞。忘记门法官从上述细胞状态数据在考虑或被忽略。输出门决定细胞中的值用于计算输出。在LTSM层,它执行多个内部方程如下所述
在哪里表示忘记门,其主要功能是忽视的数据之前LSTM细胞状态。是一个激活函数乙状结肠。是忘记了门口的权重矩阵,表示短期LSTM细胞的上一层,层的特征映射LSTM细胞的输入,是忘记门的偏差向量。输入门由两部分组成,在短期内是一个矢量,确定哪些数据用于更新新细胞状态。被选中后 , 将被添加到长期的细胞状态和是一个激活函数。和表示矩阵和重量和表示输入的偏差向量门。然后,忘记和输入登机口将用于更新的长期状态之前LSTM细胞。门的输出也是由变量在哪里表示矩阵和重量表示偏差向量。
最后,LSTM层连接到完全连接层估计输出目标原则的价值。辍学技术是一个随机的正则化技术滴隐藏节点与一个给定的概率在训练。它形成平行的神经网络与不同的体系结构,然后以一个整体,防止相互适应。为了缓解过度拟合问题,使用辍学之间最后LSTM层和第一次完全连接层(37]。
3.4。损失函数
生存分析也称为比较分析是统计分析的一个分支,它预期的时间,直到一个或多个事件发生(38]。这种方法计算的概率服从“生存”的天数或周期(39]。一个生存分析中最常用的分布离散威布尔分布可以表示为方程(10)。失效建模与一个随机变量给失败的可能性之间的时间间隔和 。概率质量函数(及)的离散随机变量的特征是两个参数:α( )是一个尺度参数,它表示期望值和分布模式定位,而参数β( )是一个指示器的形状以及方差的预测。
我们必须利用一个特殊的对数似作为损失函数,称为离散威布尔分布对数似[34]。离散对数似惩罚威布尔分布模型预测高概率的失败发生在一生中没有对所有样本。此外,离散威布尔分布对数似将奖励分配给高概率的事件发生在那个时间点样本的故障时间。离散威布尔分布对数似可以定义如下: 在哪里(周期),表示比较值表示一个0或1机械卫生事件指标。因为它是一个平均值,我们表达它 。在每个培训步骤中,我们运用两种类型的损失函数。我们应用线性激活函数为输出值在回归分析方法和使用均方误差(MSE),衡量平均平方差异原则估计价值和真正的原则作为损失函数的价值。另一方面,激活层离散威布尔分布是一个盛装的函数,设置为α和使用一个指数函数softplus功能测试(34]。我们使用离散的威布尔分布作为损失函数对数似在生存分析方法和失效概率估计威布尔参数的输出层给我们训练数据的分布。
3.5。绩效评估
为了可比性与其他现有最先进的方法,使用了相同的指标来评估性能。在使用模型来预测回归和生存分析方法的原则,之间有一个错误预测的原则和实际原则称为均方根误差(RMSE)方程(13)。已故的预测可能会推迟安排适当的维护操作,和过早预测可能不是有害的,但仍然浪费更多的维护资源。由于关键方面是为了避免失败,早期预测通常是比预测后期更可取。得分函数方程(14)惩罚迟到的预测比早期预测评估模型。此外,我们也算美方程(15),(方)确定系数是如何预测的统计测量近似真实的数据点比较两种分析方法。越高值意味着更多的信息的一个模型可以解释道。
4所示。结果与讨论
4.1。数据集
我们采用的数据集商业模块化Aero-Propulsion系统仿真(cmaps) NASA提供的数据集40]。cmaps数据集是众所周知的在榜单社区,已被广泛用于评估预测性能。数据集由模拟退化数据产生的涡扇发动机热力学仿真模型。这个数据集包括四个subdatasets与不同的操作条件和故障模式。四个subdatasets的描述如表所示1。车队的引擎FD001数据集的一个操作条件下高压压缩机故障。FD002,样品6操作条件下高压压缩机的故障。FD003情况,样本遭受高压压缩机和风扇一个操作条件下退化,而FD004样品遭受6操作条件。有26个列在每个subdataset,包括引擎单元号,数量的周期中,三个操作设置,21传感器测量。每个subdataset分为一个训练集,一个测试集,原则和实际的测试数据。与各种不同的子集有不同数量的引擎操作周期。随着操作时间的增加,发动机开始降低,直到故障发生在训练数据集,而退化的测试数据集结束之前失败的发生。该算法的目的是预测的荷重软化测试数据集,和真正的原则目标提供的测试数据集也计算预测性能。
4.2。回归和生存分析的性能
我们随机选择80%的样本训练集训练模型和剩余的20%的实例作为验证集的选择参数在训练阶段。我们预测的原则使用训练模型和测试数据表示在表的性能比较先进的方法2。在表2,斜体数字表示排名前三的结果在这些方法。前三个是regression-related算法包括多层感知(MLP) [41),支持向量回归(SVR) [42),和相关向量回归(RVR) [43),和其他人是深层神经网络相关的。深度学习的方法表现出更好的性能比传统的机器学习方法。我们建议的方法达到最低的RMSE值和得分函数回归分析或基于离散FD002威布尔分布,在FD004得分函数性能优越。我们执行显著降低5.19和0.15的RMSE并展示改进和的得分函数,分别为FD002和FD004。样品在多通道切换FD002和FD004数据集是获得准确的预测结果更具挑战性。我们建议网络结构能够发现隐藏的模式,和该方法的预测能力比现有的荷重软化预测方法在复杂条件下。根据方程(RMSE的定义13所示),外推原则价值FD001 FD003导致小大RMSE结果。尽管这些子集RMSE没有达到最佳性能,分数值接近最好的。实验结果还表明,集成的深入学习相关方法如DAG和我们的方法获得更好的性能比以前单一的CNN或LSTM方法。基于评分函数评估标准的比较,可以看出,我们的方法出现在排名前三的结果在所有四个基准数据集,但DAG方法得到四分之三的实验结果。这表明,我们的方法可以避免失败与早期预测。
一个引擎单元可能有它自己的历史的传感器数据,我们应用固定滑动时间窗口扫描历史数据生成几个连续的传感器数据。我们估计原则及其相应的故障概率顺序数据,然后构造kaplan meier存活曲线。图4显示了预测和实际的退化过程的四个随机选择的引擎在每个subdataset从测试数据与kaplan meier曲线。我们可以发现发动机有20%概率保持运行100次后,即发动机有80%的概率会失败后操作100次图4(一)。这些引擎的生存概率降低10% ~ 20%,每20周期。从FD002在图4 (b)和FD004在图4 (d)、退化趋势开始快速下降,成为稳定当左10%概率的可用性,这是非常接近失败。至于FD003图4 (c)在正确的推断,都有一个高原尾巴kaplan meier曲线的,它可能会导致预测和真实值之间的误差和周期变得更大。这是原因,RMSE FD003不能超过其他方法。
(一)FD001
(b) FD002
(c) FD003
(d) FD004
我们描述的差异our7方法基于离散威布尔分布和回归分析与线性模型来预测失败的循环。在数据5- - - - - -8,我们随机选择四个引擎在每个subdataset为例,kaplan meier曲线与置信区间和基于离散威布尔分布的概率和荷重软化价值基于线性回归分析在时间周期。结果在图5- - - - - -8 (b)开始有更多的方差和误差估计的回归分析方法,尤其是当情况变得更加复杂。很容易发现预测错误的早期退化大于后期退化的回归分析方法。由于后期更多的顺序信息比较早期阶段,预测结果可以获得更好的性能。传统的荷重软化方法基于回归分析可能导致不一致的预测,是维护决策带来了难题。相反,基于离散生存分析威布尔分布与kaplan meier曲线数据平滑的趋势5- - - - - -8(一个)。另一方面,以前作品只基于回归分析评估每个引擎的性能在最后时间步的荷重软化估计和不原则实现相应的置信区间预测。我们的模型基于离散威布尔分布代表了失败的概率和值得信赖的置信区间与降解过程中固有的不确定性。
(一)
(b)
(一)
(b)
(一)
(b)
(一)
(b)
4.3。性能与不同时间窗口
我们申请更多的参考比较的性能与不同TW长度为每个subdataset基于两种分析方法在表3- - - - - -6。斜体数字表示最好的结果在不同TW下两个分析。至于美和RMSE,回归分析方法比威布尔分布通常有更好的性能。至于 ,结果表明,离散威布尔分布更可辩解的,还表示,涡扇发动机的退化趋势更类似于威布尔分布。
5。结论
智能制造产业的发展,越来越多的数据将被收集和深度学习模型非常适用于估计的健康声明一个机器的维护策略。提出预见性维护可以带来竞争优势的策略来优化维修计划的目标减少计划外停机,以及不必要的预防性维护,为公司节省更多的成本。我们提出了一个集成的深度学习方法与卷积神经网络和长期短期记忆网络学习的特点和估计剩余使用寿命值与深度生存模型基于离散威布尔分布。我们的作品不仅可以估计原则还学失效概率。我们可以提供参考做决定何时以及如何经常替换应该实现。特别是,我们的方法在复杂条件下的更艰巨的任务是与一个微妙的错误和得分下降函数相对于其他现有最先进的方法。改进的结果证明,我们的模型可以捕捉错误在复杂条件下的降解趋势早期预测和避免失败。我们的方法的限制是,我们的模型依赖于特定的概率分布对应于两个参数离散的混合威布尔分布,可能不适合每一个退化过程。仍然有一些可用的发行版,可以实现在生存分析的方法。数据驱动的深度学习的方法依赖于数据的质量和强烈要求大标签的训练数据集在监督学习。 But getting sufficient run-to-failure data for training process is very difficult, especially for new systems. For further improvements, it may be possible to use a generative adversarial network for data augmentation or generation for the future research. Since the data condition and fault mode are different between subdatasets, further optimization via transfer learning method is still necessary to improve the stability of the method and then efficiently apply to solve other problems.
缩写
| : | 矩阵包括周期和传感器的测量th引擎 |
| : | 类型的传感器测量(功能) |
| : | 最后观察循环或循环故障发生 |
| : | 时间窗长度(TW) |
| : | - - - - - -维数组在循环的一个引擎 |
| : | 顺序数据提取与大小 |
| : | 价值周期和传感器测量在 |
| : | 种滑动窗口(特征检测器)在CNN |
| : | 组特征检测器与w内核区域的大小在美国有线电视新闻网 |
| : | 卷积th层 |
| : | 忘记是激活矢量层的门在LSTM |
| : | 单元格输入向量层的激活在LSTM |
| : | 细胞层的状态向量在LSTM。 |
数据可用性
本文使用的数据集是涡扇发动机退化仿真数据集,由NASA提供检索https://ti.arc.nasa.gov/tech/dash/groups/pcoe/prognostic-data-repository/。
的利益冲突
作者宣称没有利益冲突。