文摘
我们提出一个预测框架来评估设备的剩余使用寿命(原则)的基础上生成敌对的归责净(增益)和多尺度卷积神经网络和长期短期记忆(MSDCNN-LSTM)。我们提出的方法解决了传感器故障导致了缺失数据问题在工程应用。首先,一个二进制矩阵是用来调整“0”的比例来模拟在工程环境中缺失的数据的数量。然后,获得模型用于转嫁丢失的数据和近似真实的样本分布。最后,MSDCNN-LSTM原则模型用于预测。实验是进行商业模块化aero-propulsion系统仿真(C-MAPSS)数据集来验证该方法。预测结果表明,该方法优于其他方法当发生丢包时,显示显著改善的均方根误差(RMSE)和得分函数值。
1。介绍
预测与健康管理(榜单)旨在监测、预测和管理系统的健康通过模型和算法,广泛应用于航空、军事装备,工业制造等领域1]。作为物理加工的重要研究问题之一,剩余使用寿命预测(原则)可以提供策略支持建立最好的设备维护管理。荷重软化的数据驱动的方法预测了通过建模分析设备运行数据来确定设备的剩余可用时间。因此,数据的质量直接关系到原则预测的准确性(2]。
精密设备和多传感器融合被广泛使用在工业领域,并获得完整的监测数据预测的关键设备的剩余使用寿命(原则)。在工程应用中,各种因素,如失败,数据存储,传感器损坏,机械故障,可能会导致丢失的信息在设备信息收集和存储3]。数据包损失尤其有害的复杂和恶劣的工作环境,如航空航天和农业生产环境(4]。获取设备的高成本和难度退化数据样本之间的间隔和信息的存在使原则预测具有挑战性。
1987年,鲁宾(5)提出,缺失数据机制分为三类:随机缺失(MAR),缺少完全随机(MCAR),和失踪不是随机(MNAR)。适当地处理缺失数据的准确性尤为重要,以确保缺失的数据归责(6]。学者们进行了大量研究,方法大致可以分为三类:忽略或删除的数据,归责和统计模型。
删除丢失的物品的数据集是最简单的数据处理方法。罢工等。7)模拟三种机制来处理缺失数据和不同的技术用于处理缺失数据,如listwise删除意味着归责,和八种hot-deck非难。进行了详细的仿真研究,得出的结论是,简单的删除是一个合适的选择当丢失的数据量很小。归责方法填充缺失值。最可能的值通常用于归责,造成信息损失低于不完整的样品通过删除所有缺失值。常用的方法包括意味着归罪,平均归罪,归责方式,最大似然估计。受机器学习的启发,预测模型被用来估计缺失值中的可用信息数据集(8]。Troyanskaya et al。9再使用(资讯)来估计基因微阵列数据的缺失值。污名效应比基于奇异值分解的归责方法(计算)。段et al。10)用深学习模型去噪堆叠autoencoder (DSAE)估计缺失值在交通数据。这种方法被证明是有效的交通数据归责和分析。一个统计模型被用来转嫁缺失值基于之间的线性或非线性关系缺失数据和观察到的数据。倪et al。11)提出了一个先进的计算方法基于贝叶斯网络学习原始数据。马尔可夫链蒙特卡罗方法用于采样基于概率分布的贝叶斯网络学习。它多次背景缺失的数据,使统计推断结果。李等人。12)提出了一个系统的计算方法基于概率主成分分析的交通流数据和历史数据估计丢失的流数据。一个统计模型被用来转嫁缺失值基于数据模型的先验知识,提供优秀的结果。然而,统计模型的缺点由于不完整的数据集和不完整的先验知识。机器学习有巨大应用潜力数据归责。本研究侧重于利用现有数据的使用和机器学习算法推导出缺失值。
我们提出一个基于数据归责原则预测框架来处理传感器数据在工程应用中失踪。首先,缺失数据模拟使用各种失踪样本率。然后,生成敌对的归责净(获得)模型用于嫁祸于失踪的价值观和填充数据集。最后,提出多尺度卷积神经网络和长期短期记忆(MSDCNN-LSTM)预测模型用于获取设备的价值原则。该方法非常适合预测设备的原则,如果传感器数据在工程应用中受到数据包损失。演示了该方法的性能使用商业模块化aero-propulsion系统仿真(C-MAPSS)数据集。
2。相关工作
近年来,深学习强大的函数映射功能和数据处理功能。提取频谱内的复杂特征和预测烟草的尼古丁量,江et al。13(1)提出了一个一维完全卷积网络d-fcn)模型。胡锦涛et al。(14)提出了一个深层神经网络视觉分析方法来处理视频检测扩大和选择通信用户不同的实践课程。
深度学习也被广泛应用于数据驱动的原则预测方法。先生等。15)第一次试图利用卷积神经网络(CNN)预测引擎的荷重软化,这提高了自动提取多维特征的能力。然后,李et al。16)提高了预测精度通过使用深CNN (DCNN)结构和时间窗口数据处理。为了使CNN模型学习更详细的功能,李et al。17MSDCNN]提出了一种算法,也就是说,DCNN卷积核的大小不同。为了提取状态监测数据的时间相关特性,香港et al。17]提出了一种混合算法的CNN和长期短期记忆(LSTM)学习空间和时间特性。黄等。18)开发了一种新颖的深卷积神经network-bootstrap-based综合剩余使用寿命的预测方法预测滚动轴承(原则)。胡锦涛et al。(19]应用长期短期记忆(LSTM)涡轮发动机和研究原则预测模型参数优化方法和贝叶斯理论。
在本文中,我们使用原则预测模型提出的MSDCNN-LSTM刘et al。20.)了解更多详细的特性在高维空间和预测飞机引擎的原则。混合MSDCNN-LSTM模型由一个MSDCNN子模型和一个LSTM子模型。在MSDCNN MSDCNN-LSTM模型,用于从输入数据中提取高维特征的时间窗口处理,和LSTM对输入数据执行时间序列学习在同一时间。然后,功能MSDCNN和LSTM添加地图和压平。最后,输出被发送到一个致密层,代表了荷重软化输出值。的结构图表MSCNN-LSTM图所示1。
3所示。该方法
3.1。缺失的数据归责方法基于增益
2014年,局域网格拉汉姆·古德费勒et al。21)首次提出生殖敌对的净(甘),生成数据以对抗性的方式与发电机和鉴别器。方法吸引了研究者的注意和验证了理论上和实际工程应用。甘已经广泛应用于图像、文本和音频处理等领域。
我们使用增益模型(22)生成与类似的分布与原始时间序列数据缺失的数据归责。模型的基本结构如图2。
发电机用于观察真实数据的每个部分,根据观察和缺失数据估算。向量缺失数据的归责表示如下: 在哪里代表一个小样本缺失的数据,表示一个二进制矩阵具有相同的大小 , 代表的是噪音,代表相应的元素的乘法。
最后,发电机输出一个完整的向量归责后如下:
因为一些发电机的输出是真实的和一些生成,增益和氮化镓的区别是,获得不确定真实性的鉴别器整个矢量但检测到真正的和生成的部分,即。,它预测的价值在 。该模型火车通过最大化准确预测的概率和火车通过最小化的概率正确预测 。目标函数表示为
来源的鉴别器区分每个输入数据的一部分,和判别矩阵是由获得的 。叉损失函数是用来评估中的每个元素 :
的损失函数发生器被定义为
3.2。原则基于增益和MSDCNN-LSTM预测框架
一个原则预测框架,结合增益和MSDCNN-LSTM设计;它包括三个部分:预处理丢失的数据,丢失的数据归责基于增益模型,基于MSDCNN-LSTM和荷重软化预测模型,如图3。
首先,数据预处理是C-MAPSS数据集上执行。一节中描述的方法1用于构造训练集的样本数据与不同的缺失的数据率。随后,获得网络用于嫁祸于样品与不同缺失的数据率,发电机和鉴别器生成数据以对抗性的方式获得接近于原始的数据集。最后,生成的样本作为MSDCNN-LSTM预测模型的输入。同时MSDCNN和LSTM模型处理数据。的多尺度结构MSDCNN大幅提高了特征提取能力。卷积核的大小不同( , ,和 )用于从输入数据中提取特征,和特征图拼接在一起,结合时间序列获得LSTM的预测结果。连续迭代使用两个指标用于评估训练模型(均方根误差(RMSE)和得分函数),和测试集数据输入原则得到预测结果。
荷重软化预测过程基于增益和MSDCNN-LSTM图所示4。首先,使用缺失数据丢失的数据生成率为0.1,0.2,0.3,0.4和0.5。然后,我们使用获得网络转嫁的缺失值样本。获得网络的训练期间,我们设置了时代1000倍,新生成的时间序列数据集是标准化和加工时间窗口。原则设置标签后的训练集和测试集,下一阶段是系统模型训练和预测。并行MSDCNN-LSTM混合模型对时间序列训练集,执行多尺度特征提取和模型中的参数和权值更新使用minibatch 512。当早期的停止条件设定的系统满足,模型训练提前结束了。如果不满足停止条件,minibatch训练直到最大的时代。模型训练后,我们输入测试集数据预测的荷重软化结果每个引擎。
4所示。实验和结果
4.1。实验数据和设置
实验是在服务器计算机上配置了一个英特尔(R)至强(R)的CPU e5 - 2620 v4 @ 2.10 GHz和NVIDIA GeForce泰坦XP。C-MAPSS数据集被用来验证该方法。C-MAPSS数据集分为四个子集(FD001, FD002、FD003 FD004)根据操作条件和失效模式。每个数据集包含引擎退化21个传感器监测的数据,如表中列出1。每个子集划分为训练集和测试集,FD002 FD004 6操作条件,和FD003 FD004 2失效模式。
得分函数和RMSE作为评价指标。得分函数的公式是23]
均方根误差的公式 在哪里代表不同的预测价值原则和真正的价值, 。当小于0,预测值小于真实值,结果被称为一种先进的预测;否则,它是一个滞后的预测。
得分函数和RMSE值越低,模型的预测能力越好。RMSE对称函数,提供了一种先进的预测和滞后的相同的结果的预测。然而,得分函数是一个不对称函数和滞后的预测更敏感。因为落后的预测更为严重的后果,它导致更强的惩罚比先进的预测。因此,这些指标综合衡量算法的性能。
4.2。模拟缺失的数据率
假设原始数据集 , ,在哪里是传感器的数量,时间序列的长度,的测量值是传感器对应期。在这里,我们定义一个二进制矩阵 , 和 ,有相同的大小与原始数据,由0和1的值。重建丢失的数据可以表示为 在哪里代表观察到的组成部分 。值为- 1指示观测数据,值0表示丢失的数据 。数据集与不同的失踪样本率可以通过改变创建0到另一个值。
4.3。数据归责仿真结果和分析
在4 C-MAPSS数据集的子集,7传感器数据没有变化了。因此,在这个实验中使用的传感器的数字是2,3,4,7,8,9,11、12、13、14、15、17、20日和21日。RMSE被用作评估获得的归责效果评价指标。
表2列出了污名获得不同精度缺失的数据率(0.1,0.2,0.3,0.4,和0.5)C-MAPSS数据集。
随着缺失的数据率的增加,RMSE值的四个subdatasets FD001, FD002, FD003, FD004增加,精度降低。在缺失数据率高的情况下,有更少的样本信息,很难填写缺失的样本数据。FD002的污名获得更好的性能和FD004与复杂的工作条件和大样本数据集的大小比FD001 FD003数据集和简单的工作条件和小样本大小。因此,归责性能更好更大的样本量,和预测精度降低丢失的数据速率增加。
图5显示缺失数据之后获得的可视化结果归责缺失的数据率为0.5。水平轴代表的操作周期第一引擎,纵轴是最大最小标准化后的第一个传感器数据的结果。中间黑色矩形代表真实数据,红色代表归责后得到的结果。尽管缺失数据的影响更为严重时丢失的数据速率高,数据后归责的基础上获得真实数据在一个小范围内波动,和整体分布与实际数据分布是一致的。
表3显示的影响损失函数获得模型的性能。在数据归责,损失函数是特别重要的培训生成器和鉴别器模型。进行实验后,我们发现,模型性能最佳时熵损失函数和均方误差损失函数。我们使用FD001数据缺失的数据率为0.5作为一个例子来验证损失函数对模型性能的影响,比较仿真结果从不同的损失函数的组合。从表可以看出3的组合两个损失函数和参数的调整显著影响的结果。最优权值时得到熵损失函数用于鉴别器,损失函数和叉+均方用于发电机。在实验中,使用不同的组合在相同条件下验证参数的影响损失函数。表中列出的结果4。
添加参数发电机损失函数提高了归责的准确性,但是 和大幅提高RMSE值。因此,模型提供了最佳的性能系数时的RMSE发电机损失函数 。
图6显示获得的结果归责和其他方法。增益归责,意味着归罪,归责中值,归责模式使用FD001数据集进行比较。水平轴代表了缺失的数据率,纵轴代表了RMSE。随着缺失的数据率增加,rms的四个方法表现出上升趋势,和归责性能降低。不同缺失的数据率的结果表明,均值归责结果更稳定模式和中值归责方法。然而,获得达到最小的RMSE值不同的缺失的数据率,表明它优于其他方法。
图7显示所有发动机单位后获得的荷重软化预测结果归责在C-MAPSS数据集缺失的数据率是0.1。测试引擎是按原则从小型到大型,以便更好地观察变化的预测精度。水平轴代表测试机组,纵轴代表了原则。在图中,黑点代表真正的荷重软化,红点代表模型预测的结果。从图可以看出7在发动机运行的初始阶段,荷重软化值相对较大,预测误差相对较大。当发动机运行很长一段时间或即将失败,更明显的退化信息,预测性能明显提高。拟议的框架反映了良好的预测效果。
(一)
(b)
(c)
(d)
表5显示了有或没有获得归责原则预测结果缺失的数据率为0.1。值得注意的是,与0系统自动取代缺失的数据,确保顺利执行原则预测算法。因此,当缺失的数据率是0.1,得分函数值不能获得,导致随后的荷重软化预测困难,如RMSE值大幅度增加。然而,在获得丢失的数据估算,预测结果明显改善。RMSE至少增加了80.16%,得分函数值增加了至少99.98%。
表6显示了预测的结果提出了缺失数据获得方法的0.1,0.2,0.3,0.4和0.5。随着缺失的数据率的增加,4 subdatasets的预测精度降低。得分函数比RMSE影响更大。缺失率小于0.4时,提出了基于数据归责原则预测框架可以显示出更好的性能。当丢失的数据率高于或等于0.4,太多的数据信息丢失,导致较低的预测性能。然而,拟议的框架是更好的预测结果比使用没有缺失数据归责缺失的数据率为0.1。
5。结论
原则提出了一种基于获得的组合预测方法和MSDCNN-LSTM。实验进行了缺失数据率0.1 - -0.5的模拟在工业生产数据丢包。获得方法,发电机与鉴别器交互转嫁缺失的数据,生成一个样本数据集,接近现实。这个数据集作为MSDCNN-LSTM预测模型的输入。比较得到的仿真结果和其他方法表明,收益归责方法表现的意思是,中位数,和模式归责方法。提出了预测框架与没有数据归责包损失发生时,表现出显著的改善。荷重软化预测框架显示比其他方法更好的预测性能的C-MAPSS数据集不同的缺失的数据率。
数据可用性
使用的数据来支持这个研究的发现包括在本文中。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作得到了北京自然科学基金(批准号4202026),秦新北京信息科技大学人才培养计划(QXTCP A202102),中国博士后科学基金(批准号zz - 2019 - 65),朝阳区博士后科学基金(批准号2019 zz-45),中国国家重点研发项目(批准号2018 yfb1308300),中国国家自然科学基金(批准号62103056)。