复杂性

在这一页上

文摘介绍相关工作材料和方法分析结论数据可用性的利益冲突确认引用版权相关文章

研究文章|开放获取

体积2021年| 文章的ID5854096| https://doi.org/10.1155/2021/5854096

异常检测与差异率时间序列样本熵和生成对抗的网络

柯克·高 ,^1、2 Wenbin冯 ,¹ 夏赵 ,² 虫虫余 ,² Weijun苏 ,² (牛 ,² 和陆汉 ²

学术编辑器: 弗朗西斯科·罗Iudice

收到了 2021年6月19日

修改后的 2021年9月27日

接受 2021年10月15日

发表 2021年11月19日

文摘

剩余采空区煤炭自燃的往往会引起爆炸,这是一种严重的煤矿和热力学复合灾害导致严重损失人们的生活和生产安全。热力学煤矿灾害的预测和预警的变化主要是由指数在煤矿采空区气体浓度模式不断收集。时间序列异常模式检测方法主要是用来达到气体浓度的状态变化模式。气体浓度的变化遵循一定规则随着时间的变化。一个伟大的气体浓度的变化表明煤炭自燃和其他灾害的可能性。强调制造商收集气体的特性,克服低异常检测精度不足造成的正常模式的学习,本文采用了一种异常检测方法与差异率时间序列样本熵和生成对抗的网络。因为差异率异常数据的熵特性是更大的比正常模式,本文改进了计算方法的异常给予不同的权重来检测分提高检出率。来验证该方法的有效性,本文采用采空区的仿真模型,采用Dafosi煤矿的煤炭样本进行实验。初步测试了使用从煤矿监控数据。实验比较不同时间序列的熵结果生成的检测结果对抗网络和自动编码器和表明,本文提出的方法具有较高的检测精度。

1。介绍

煤矿的热力学复合灾害是指复合灾害引起的爆炸残留在采空区煤炭自燃的。为主要能源,煤炭在中国能源结构中扮演着不可替代的作用。煤炭的安全供应直接关系到国民经济的可持续发展和国家的能源安全。煤炭开采后,剩下的面积是采空区,通风不良和残留煤。残煤氧化持续漏气的影响下,可能会导致气体积累(1- - - - - -3]。因此,很容易导致煤炭自燃和其他煤热力学灾害。热在煤矿动力灾害严重影响煤矿的安全生产和工人。因此,有必要了解相关因素火电煤矿复杂灾害的发生,然后分析它们通过时间序列挖掘技术来预测可能的热功率的灾难。

煤矿热灾害预测和预警煤田是非常重要的任务。早期灾害预测方法主要包括氧测量、温度测量、指标气体分析(4]。氧气测量方法主要用于煤矿测量氧含量,确定它是否达到阈值。温度测量监控一些地区的温度,然后使用测量温度的数据来推断可能的煤自燃灾害。指标气体分析是观察是否单个或多个量化指标与夹沟矿采空区煤炭自燃或瓦斯爆炸超过临界值,主要包括气体指数、煤层地产指数、综合指数(5]。大量实验研究表明,气体就像有限公司生产过程中煤炭自燃。气体的产生可以改变的数量显著增加煤的温度。根据实验结果,选择合适的气体的指标气体,和阶段的煤氧化过程大致可以判断通过分析指标气体的形成状态的变化(6]。气体收集和分析技术的发展,指标气体分析已广泛应用于自燃的早期预测7]。在实践中,许多预测提出了基于气指数。有相对简单的单一气体指标,如CO, C2H4。也有相对复杂形式的双或复合气体指标,如有限公司/有限公司₂和碳氢化合物的比例。预测指标和临界值的指标是基于经验和大量的实验数据的统计分析。由于手工操作因素的影响,煤炭和应力不均匀分布和预测方面显示了很大的局限性,和预测的准确性难以提高8]。

随着信息技术的发展,越来越多的时间序列数据产生和变得更复杂。异常检测时间序列(9)已成为近年来的研究热点。时间序列异常通常指的是数据显然是不同于其他数据在一系列的数据集。这个异常不是随机偏差造成的,而是由于不同的模式差异。常用的时间序列异常检测研究方法主要包含统计方法和机器学习的方法。Canizo et al。10)提出了一系列监督多基于深度学习的异常检测方法,结合卷积神经网络(CNN)和递归神经网络(RNN)以不同的方式,并分别处理每个传感器,以避免数据预处理的必要性,大大提高操作速度。由于模型使用一个数据集包含一个固定长度的时间序列来验证提出的架构,在一些真正的用例,它们不是。因此,必须做进一步的研究来分析建议的体系结构的性能时,处理时间序列具有不同的频率。Beggel et al。11]提出了一种新的基于小波变换的无监督异常检测方法的时间序列,可以有效地检测出异常的测试数据没有再培训的时间序列模型通过反复学习特性表示。然而,这还需要进一步的研究多变量时间序列的异常检测。Malhotra et al。12)使用可叠起堆放的LSTM网络异常/故障检测时间序列。网络训练nonabnormal数据和在多个时间作为预测步骤。由此产生的预测错误被建模为多元高斯分布,用来评估异常的可能性。Chauhan和中收取13)采用深度递归神经网络结构的帮助下长短期记忆(LSTM)制定健康的ECG信号的预测模型。这些复发的预测错误的概率分布模型是用来显示正常或异常行为。但使用多层网络或深度递归网络在一定程度上可以降低运行速度。Rajagopalan和雷(14)提出了一种小波分区方法代象征,而不是当前实践的相空间分区的方法。然而,有必要延长分离到多个时间序列和降低噪声的时间序列来实现健壮的异常检测。Izakian和Pedrycz15)考虑模糊c——(FCM)作为概念和算法设置处理异常检测的问题。使用滑动窗口,时间序列分为几个子序列,可用的时空结构在每一个时间窗口使用FCM方法发现的。然而,这个算法,迭代次数在集群的选择中心点更可能导致算法模型是弱可伸缩性和弱敏感性和陷入局部最小值。上述方法的预测能力有限,计算成本很大,不能有效地发现在大型数据集大型数据的大小和尺寸。基于氮化镓的检测方法可以实现异常检测的目的没有收集大量的异常数据和使用正常数据训练。

近年来,生成敌对的网络框架(16)提出了建立深度学习模型通过对抗训练。李等人。17]提出的方法对时间序列数据进行多元异常检测基于对抗网络的生成和使用LSTM甘神经网络的基本模型框架来捕获与时间相关的时间序列分布。异常检测的神经网络,双autoencoder生成对抗网络(在职),是由唐et al。18)解决样本不平衡的问题。skip-connection和双autoencoder架构,该方法表现出优秀的图像重建稳定能力和培训。异常模式的检测气体时间数据可以提供一个理论依据煤自燃或氧化和瓦斯爆炸。

可燃气体的浓度变化释放浮煤遵循某些模式随着时间的推移。当气体浓度变化很大,它可以被视为进入异常模式,表明煤炭自燃和其他可能发生的灾难。因此,有效的监控数据的拐点检测在不同阶段可以协助判断不同氧化阶段,煤自燃的发生。不同的煤矿有不同数量的气体积累。如果天然气的数量积累被认为是标准的确定灾害,伟大的错误可能发生在应用于其他煤矿。因此,异常模式的检测可以提高灾难判断和概括为检测提供一个新想法的煤炭综合灾害。

本文的主要贡献如下。(1)根据CO气体数据的趋势特点,差异率熵特征提取加工特征序列,熵特征值的异常模式和正常模式高较低,突出异常模式和正常模式之间的区别。(2)序列熵特征是检测到的异常模式通过使用网络生成对策,并提出了一种新的异常面积计算方法得分在检测阶段,既考虑加权离群值生成的样本和离群值评分分数歧视的结果,和法官的数据段是否一维时间序列是由计算样本的异常分数。

本文的其余部分安排如下。部分2主要介绍了基本概念的差异率样本熵,时间序列和异常模式分析。节3一维时间序列异常检测算法,基于不同的样本熵率和生成对抗网络提出了。节4,算法的有效性和可行性在这种背景说明了实验。结论和未来在上一节中给出的建议。

2.1。气异常模式分析

当气体浓度增加的早期阶段,异常信息是相对较弱,很难被探测到。当气体浓度增加明显,达到阈值,检测将失去灾害预测的重要性。因此,重要的是要检测异常发生时尽可能早。

尽早检测数据异常,本研究定义了过程数据变化很大的异常模式的数据变化速率不同于正常模式。不同于正常模式,异常模式,数据的变化率明显不同于之前。以指数气体为例,首先浓度变化分析的整个过程,如图1。整个过程大致可以分为四个阶段:在第一阶段,增加浓度较低速度和持续时间最长的在第二阶段中,气体浓度迅速上升,增长速度也增加在第三阶段,气体浓度上升速度相对较高,并且增长率保持几乎不变在第四阶段,浓度开始下降

与此同时,数据的总体趋势在前三个阶段增加,和第四阶段开始下降。CO气体浓度的不断增加,煤自燃氧化过程进入一个不同的氧化阶段。当气体浓度不断增加的增长率在第二阶段,这意味着气体浓度会迅速增加。这种模式的检测可以提前做出判断的煤炭自燃的氧化阶段的识别。因此,当数据阶段开始迅速增加被定义为异常模式。

接下来,时间序列的模式解释道。一维时间序列的原始气体样本给出。它包含T时间点,每个时间点对应于一个集中的价值。时间序列的表示模式可以理解为时间序列的分段时间维度和每一部分的功能表示。时间序列的表示模式可以理解为分段时间序列在时间维度,然后,每个序列的特征表示进行,然后可以检测到异常点和异常序列相关算法。

表1显示了原始数据样本的监测,包括象征性的气体和温度的值。这些气体传感器产生时变多变量对不同气体的响应。

通过时间序列数据的分析,可以看出,仅从数据大小,数据的异常变化并不明显,不能导致随后的异常检测工作。因此,根据时间序列数据的特点,差异率计算的计算方法是首先对时间序列数据。这时,一个更全面的时间序列的特征提取是通过样本熵。异常模式的数据往往是复杂的。更准确地确定异常模式,产生敌对的网络(甘斯)。网络可以生成类似于真实数据样本的发电机,发电机和鉴频器可以判断输入数据通过后的异常分数学习真正的样本实现异常的识别模式。

2.2。差异率样本熵

首先,简要介绍微分率计算。微分率计算可以提取中的确定性信息系列利用自回归,所示(1)。当线性趋势是包含在系列中,可以通过一阶差分提取的线性特性。系列包含一个非线性趋势时,第二次或三阶差可以用来提取非线性趋势。

其中,本系列的乙阶差分,数值系数的时候吗 ;例如,数据2(一个)和2 (b)分别代表CO浓度的特征图和二阶差分特征图,图2 (b)通过二阶差分图的操作2(一个)。

(一)

(b)

针对不同的想法,本研究提出差异率的概念,这是计算基于n阶差分序列的变化差异。的定义如下。

的定义(2)差异率:时间序列 ,每个系列的观点是。是乙阶差分系列。然后,e+ 1不同系列的系列S 。元素在不同系列。所示的计算在哪里是乙阶差分价值的时间点U,是乙阶差分价值的时间点。

的定义(2)样本熵:它是用来测量时间序列的复杂性和规律性。系列的样本熵就越大,相应的时间序列的复杂性就越大。对时间序列 ,它被定义为所示(3)。子系列的长度的长度是子系列相似概率和意思r是相似性阈值(19,20.]。

系列图2(一个)作为一个实例;这是一个二阶差异率样本熵特征如图3。图中所示,样本熵分割系列的上下波动,在后期会增加,对应于原始序列。

2.3。产生敌对的网络

本文着重于研究时间序列数据的异常检测。由于工业时间序列数据的复杂性,传统的异常检测方法不能及时预测,不能使用和监督机器学习方法由于缺少带安全标签的数据时(21]。为了解决这个问题,本文提出了一种基于生成的无监督异常检测方法对抗网络(甘斯)。先前的研究已经证明,生成敌对的网络是非常成功的在图像处理任务,比如生成高质量的图像,图像转换,图像修复、文本生成,视频生成和增强照片(22]。甘也被证明是有效地生成时间序列预测和检测根据先前的研究23]。从传统的分类方法不同,鉴别器由GAN检测到错误的数据输入训练数据以一种无监督的方式,这使得它有吸引力的非监督机器学习技术(24]。网络实现了决策的输入数据通过学习生成器和鉴别器和玩游戏。图4显示了氮化镓网络模型图。

模型中产生敌对的网络,主要结构是发电机G和鉴别器D,是函数,可以配合相应的生成和歧视。在网络训练的过程中,发电机转换从一个潜在的随机噪声向量空间生成的样本。网络的优化,生成的样本发电机变得越来越类似于真正的样本。鉴频器接受真实数据生成的样本或发电机确定输入数据是否真实的样品或生成的样本。鉴频器的输出用于鉴别器的优化参数和发电机。这样,发电机产生更现实的生成样本,和鉴频器就可以更好的区分真正的样本生成的样本。

可以生成样本生成对抗网络,非常类似于真正的样本。在时间序列预测中,可以使用网络学习的历史数据系列和学习时间序列生成的模式预测未来时刻的价值。

3所示。材料和方法

在本节中,我们讨论我们提出的总体结构模型及其关键元素呈现在图5。异常检测框架分为三个阶段:异常模式特征提取、模型训练和异常的判断。异常模式特征提取阶段,原始数据提取更彻底。在模型训练阶段,功能系列预处理,生成对抗的训练网络模型就完成了。在异常检测阶段,训练网络模型和指数加权误差用来确定异常模式。

3.1。样本熵特征提取的差异率

步骤提取系列的功能通过使用不同样本熵率如下:步骤1:保持依赖原始时间序列的时间系列数据,原来的一维时间序列数据的输入由滑动窗口大小分段吗和步长。的时间序列片段是。第二步:执行(2)系列得到二阶差异率系列及其标准差性病。步骤3:把时间序列数据点作为亚节;二阶微分率序列数据点分为子分段,表示。第四步:计算距离任何两个子系列段之间和 ,这是由相应的位置元素的最大差值在两次分类部分。第五步:计算的概率子系列之间的相似性和其他子系列,见(4的比例),这意味着次分类子系列之间的距离小于阈值。是相似的阈值, 任意两个子序列片段之间的距离吗和 , 是时间序列数据是二阶的区别率序列数据点。二阶差异率的平均概率相似性系列所示(5)。第六步:根据步骤4∼6,意味着相似概率重新计算了子系列的长度。然后,二阶的熵特征差异率样本所示第七步:回到步骤1来计算二阶的熵特征差异率样本下一个系列的一部分。最后,一个完整的二阶差分率样本熵系列。

3.2。DRSe-GAN异常检测模型

在DRSe-GAN异常检测框架主要包括输入数据,发电机,鉴别器和异常检测。输入数据是由微分率特征序列中提取的样本熵。发电机用于捕获数据并生成新的样本的分布更接近真实的数据通过学习。鉴频器是用来区分正常的数据异常数据。在迭代过程中,生成的数据生成器和真正的训练数据是作为鉴别器的输入。发电机和鉴频器的参数更新的歧视的结果最终获得更好的参数。在异常检测的阶段,一种新的异常面积计算方法的分数是根据时间序列数据的特点设计,提高检测精度。如果训练系列重建的发电机异常分数高于正常样本,然后可以确定当前的时间序列异常。与其他方法相比,基于DRSe-GAN检测方法能实现异常检测的目的没有收集大量的异常数据和使用正常数据训练。模型可以识别异常数据不符合训练数据的分布,提高模型的能力通过改善损失函数和判断分数。

训练数据集训练网络参数,在哪里是数据点的数据集,所有训练数据中的数据是正常的。验证数据集确定阈值的异常分数。测试数据集用于异常检测、验证和验证和测试异常和正常数据中包含的数据集。

在模型训练过程中,发电机和鉴频器使用长期短期记忆(LSTM)提取时间序列数据之间的时间信息。从RNN LSTM是进化而来的。增加输入门,忘记大门,大门和输出神经元细胞,使网络使用时间比RNN状态预测。

有别于传统的神经元节点,LSTM的隐藏层的基本单元是一种特殊的细胞结构,它包含一个self-connected存储单元和三个门单元控制信息流。其中,输入和输出登机口控制信息的流动的神经元,分别和忘记门控制的程度之前记忆细胞的状态记忆。

在培训过程中,有必要定制适当的损失函数来指导培训根据任务的要求。损失函数本文包括两个部分,鉴频器的损失和发电机损失。意味着两个共同损失影响网络参数的变化。换句话说,两个部分的损失共同影响网络参数的变化。发电机是用于生成数据类似于真实数据,和损失函数的公式所示(7),随机输入数据吗输入数据的分布是随机的。鉴频器的输出代表的概率输出生成的数据是正确的。无监督学习的损失函数可以表示为(8)。

根据损失函数模型参数更新训练有素的发电机和鉴频器。以下是培训阶段的详细步骤:步骤1: 噪声数据的随机抽样,在哪里对应样本的数量。发电机模型是几个LSTM内存单元。内存单元设置的数量。Z是输入生成器模型G生成重构样本序列数据。步骤2:真正的示例数据系列X(正常模式数据)和噪声产生的样本数据输入到建立判别模型D。发电机模型是几个LSTM内存单元。模型输出的输入数据是实际数据的概率,和损失函数计算根据发电机的输出和鉴频器。步骤3:更新模型参数使用梯度下降算法根据损失函数的值。更新的参数根据噪声发生器鉴别器的参数更新后的数据。第四步:保存模型参数,返回步骤1为循环迭代,最后得到了训练有素的发电机模型和鉴别器模型。

3.3。异常模式的决心

本文利用测试样本之间的差异和重建的发电机和样本鉴别器的结果建立一个新方法来计算分数和异常检测异常模式。摘要异常模式的不同的样本熵率相对较大,和正常模式样本熵的差异率较小,所以我们考虑使用的相对差异最大值重构样本和真正的样本构造异常分数和给予不同的权重数据段的数据点被探测到。最后,当数据段的异常分数超出阈值,确定样本的异常。具体步骤如下:步骤1:首先,最大平均差损失函数生成的样本之间的随机噪声特性Z和真正的样品是用来获取最优。最大平均差损失函数是用来测量两个不同但相关的分布之间的距离。步骤2:训练有素的鉴别器用于输出样本的概率P属于真正的样品,和歧视异常分数吗是计算。步骤3:训练有素的发电机用于生成重构基于随机噪声样本。的连续调整发电机的参数,它能产生样品非常类似于真正的样本。同时,仅包括正常模式样本在训练样本。因此,重构样本的分布类似于正常模式的样本。当有异常模式样本的测试样本集,生成的样本的分布和实际样品在异常系列点会产生更大的错误。一代的错误是用来计算异常分数分数。步骤4:异常分数分数和示例生成的异常分数用于计算异常分数分数吗年代,见在哪里和是歧视异常分数的权重和示例生成的异常分数,分别。最后可以通过结合两个异常分数。的计算确定异常分数和示例生成的异常分数如下。

3.3.1。确定异常分数

给定一个测试样本集 ,测试样本使用训练有素的鉴别器输出的概率P样品是一个真正的样品。样品的正常模式,P值大时更与训练集的数据分布一致。对于异常模式样本,异常样本的分布明显不同于正常样本,因为异常数据远远偏离了正常的数据,和P值相对较小。结果,识别异常分数是1−P。

3.3.2。产生异常分数

假设样本长度n发电机是用于生成一个样本基于随机噪声而真正的样品。计算绝对误差在每次异常一代,不同重量绝对误差e考虑到正常和异常模式最大的区别是数据的偏差的平均分数异常模式,不存在在正常模式。不同的权重构成加权绝对误差。设置为加权系列和权重指数变化。加权指数影响变更的值作为数据最接近最大加权最大的影响力。样品的异常分数。体重系列的设置如下:步骤1:排序的元素与一个绝对错误的长度从最小到最大的获取绝对误差。元素的大小不改变但元素的位置改变。步骤2:计算平均值米的绝对误差后排序。样本,如果有异常数据的价值米将会增加。假定数据元素在大于平均值米与的大小。初始化权重系列 ,并设置相应的重量作为。相应的重量的是。步骤3:更新元素的大小重量系列。的更新所示在公式(15),只有错误的数据元素大于均值减少参数的数量和计算考虑之间的主要错误正常模式和异常模式。也就是说,数据元素的重量比的意思设置为0。当 , 增加而增加的。更大的是,更大的重量最大价值。当 , 。步骤4:使用更新后的重量和分类的样本计算生成的异常分数测试的样本,如图所示

异常分数越高,异常的概率就越高。为了更好的区分正常样本和正常样本,确定阈值的异常分数通过验证样本集。也就是说,最大和最小的异常分数在验证样本集的结果作为最大和最小边界和平均分割。的异常分数验证所示在哪里设置部门的数量。是最小边界,是最大的边界。自包括模型的精度和召回(25),相对应的异常分数最高分数被选中作为阈值。的计算显示如下: 在哪里

在(14),是积极的样本预测模型是正的,负样本预测模型是正的,然后呢是一个正样本预测模型是负的。在确定阈值,测试集用于测试网络的性能。

4所示。实验和分析

4.1。实验数据

在这个实验中使用的数据是实验数据的采空区模型和实际数据Dafosi煤矿。原型模型的实验平台是40118年Dafosi机械化放顶煤的脸。残煤的厚度的两车道Dafosi工作面是12米,中间和剩余的厚度煤采空区的0.92米。采空区模型的大小是1.2×1.2×0.6 (m),几何相似性比例是150:1,剩余的厚度两车道的煤炭采空区模型是8厘米,和剩余煤炭采空区中部的厚度是0.6厘米。模型分为三层:上,中间,和更低的。每一层分为9个平方的地区。每个区域有四个监控位置,每个位置都有气体传感器、温度传感器和压力传感器。因此,有108个监视点。实验平台的配置如表所示2。

在实验中,CO气体的系列值随时间变化在收集残煤的氧化过程,包括CO气体浓度的变化在不同氧化阶段。训练数据。验证数据。测试数据。

首先,区别率熵特征提取一系列原始数据,然后,系列的特点是标准化的,见公式(15)。本系列的最小值,本系列的最大价值。

第二,标准化系列分割和平均公式描述的方法(5)获得真正的网络模型的输入数据。实验数据描述如表所示3。实验对象是Dafosi煤炭和时间序列的维数是一维的,也就是说,一维系列。数据大小如下:训练数据 ,验证数据 ,和测试数据。只有正常样本训练数据和正常与异常样本的验证集。

最后,滑动窗口是用来对数据进行分段,以有效地提取数据模式中包含不同的煤自燃阶段。这样,窗口中的数据可以及时检测和分析。设置窗口大小和步长 ;然后,每个窗口数据段是一个示例中,对应于一个标签。0表示正常,1表示异常样品的总数。当窗口大小和步长不同,样本的数量会有所不同,实验结果会有所不同。

4.2。实验结果

图6(一)显示了原始系列段包含正常模式和异常模式100∼250年数据段的异常模式数据段气体的浓度变化很大。图6 (b)显示了微分率系列原系列的曲线段。本系列的窗口大小段设置为10,步长为1。可以看出差异率的最大值对应的数据段异常模式是0.6,和数据变化是负的。样本熵的特性系列图所示6 (c),子系列的长度是2,相似性比较标准差的阈值。较大的部分特征值对应于原系列的异常模式。正常模型的特征值大约在0.25和0.75之间波动,而异常模型的波动幅度远远超出其他部分的范围波动,最高达到1.79。系列后聚合平均流程段的段如图6 (d)。可以看出,数据平滑。它可以减少正常模式的波动数据,使大错误异常模式检测不改变特征值异常模式和正常模式之间的区别。

(一)

(b)

(c)

(d)

图7显示的特点,不同的熵一系列相同的差异率序列数据7(一)- - - - - -7 (c)分别是香农熵,样本熵,熵和排列。这些熵度量时间序列在单一尺度的复杂性。相应的统计特征如表所示3,包括最小值、最大值和平均值的数据段的正常模式和异常模式,以及阈值的异常模式。表4显示比例差异的统计特征异常模式和正常模式。

(一)

(b)

(c)

从表可以看出4、最小、最大和平均异常模式的值低于正常模式的香农熵和排列熵,而样本熵是相反的。此外,之前出现的异常模式,熵系列发现状态异常的模式开始提前出现,也就是说,出现异常模式的阈值,这有助于预测和警告。样本熵的最小阈值是62,和最大香农熵的阈值是111,表明样本熵可以体现异常模式。从表可以看出5,至于比例误差的统计特征熵异常模式的系列,样本熵取得大的结果,这表明,在样本熵系列中,异常模式是明显不同于正常模式。它更有利于区分两种模式。

数据处理的微分熵率特性是预处理的输入信号生成对抗网络训练网络。网络训练的迭代的数量是1000,学习速率为0.1,发电机和鉴别器训练的数量设置为100。此设置下,鉴别器损失和发电机损失函数的变化曲线如图所示8。

(一)

(b)

从图可以看出8发电机和鉴别器依次交替训练在训练过程中,相应的发电机损失函数和鉴别器损失函数相反的变化趋势。发电机损失先降低,然后增加,然后降低,然后增加,而鉴别器损失先增加,然后降低,然后增加,然后降低。最后一个鉴别器损失函数收敛于约0.1311,和发电机损失函数收敛于约13.99。

图9是原理图生成的示例图和实际样品在不同的迭代数。图9(一个)是比较图生成的样品和实际样品的第五代。可以看出,生成的样本不能学好曲线模式的真实数据。在这个时候,是0.1825,是5.701。图9 (b)展示了生成的样本之间的比较和实际样品在第78代。可以看出,可以更好的学习曲线生成的样本模式的真实数据。在这个时候,是4.4680,是0.0509。

(一)

(b)

样品的系列区段长度可以在一定程度上影响检测结果。它可以是太短的,包括整个模式分布或太长时间来处理网络学习的困难,从而导致更高的错误率。因此,有必要找到适当的样本系列段长度优化检测精度。表6显示了不同的样品长度检测结果。

如表所示5样品的长度,精度低于召回,表明一些正常的样品检测异常样本,而几乎是检测异常样本。系列段40时,F1得分达到最大值0.8916,相应的精度是83.87%,召回是96.3%。系列段大于40时,检测能力显著降低和精度相对较低。它表明当系列长度太长,许多正常的模式也将确定异常模式。系列段小于40时,检测率也降低。它表明,正常的分布模式还没有被很好地学习,从而影响异常模式的决心。表7显示了该方法的比较,一些常见的无监督方法和结果未经处理的差异率样本熵。

如表所示6DRSe-GAN模型的测试结果是最好的,和资讯网络模型的预测结果是最坏的打算。GAN网络的预测结果类似于AutoEncoder,甚至比他们还好。甘比一般无监督网络,网络可以学习正常模式更好的分布和相对更敏感异常模式。同时,实施差异率样本熵特征处理可以突出异常和正常样本之间的差异来提高模型的检测精度。同时,DRSe-GAN模型的运行时间略长与其他模型相比,由于添加不同的熵率样本数据的处理。然而,运行时间短于气体传感器数据的收集时间间隔。总之,时间序列异常检测基于熵率差异特征和生成对抗网络更适合处理煤矿指数使用气体浓度数据在目前的研究中,最高的检测精度和相对合适的运行时间。

5。结论

根据采空区煤复合灾害的特点,分析了数据的指标气体有限公司,可以体现灾难的过程,提出一个方法利用时间序列熵特性和生成对抗网络来检测异常。方法检测系列是否包含异常模式的判断提供参考热力学在煤矿灾害的发生。

该方法具有以下特点:(1)该方法包括两个模块:异常模式提取模块和异常模式检测模块。异常模式提取模块处理原始数据,最后产生最初的差异率样本熵序列作为输入的检测网络。(2)在异常模式检测模块中,根据其数据特点,提出了一种新的异常面积计算方法的评分。生成的样本之间的差异和实际样品添加基于判别输出生成对抗产生的网络。不同的权重在不同时间点的错误,提高检出率。(3)实验相比,这种方法与其他方法的检测精度,证明了该方法的有效性和检测精度最高。

这种方法旨在标志性气体数据在一个特定的采空区。虽然这种类型的数据的变化规律是相似的,不同的煤矿,数据的边界和标志性气体的类型会有所不同。因此,在未来的研究中,我们希望进一步研究数据特征提取的概念,进一步提高算法的模型,提高模型的泛化,努力将模型应用于更多的煤矿。

数据可用性

数据用于支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究是由国家重点研究和开发项目(2018 yfc0807903),中国辽宁省自然科学基金(2020 - kf - 23 - 06) 2020年,中央指导地方科技发展专项资金补贴(2021 jh6/10500134)。

引用

m . Onifade和b . Genc煤炭自燃的研究评论,”国际矿业科技杂志》上,30卷,不。3、303 - 311年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
h . Sechman m . j . Kotarba s Kędzior et al .,“在近地表的甲烷和二氧化碳浓度波动区,他们的基因特征在废弃的和活跃的煤矿上西里西亚煤盆地的西南部分,波兰,”国际煤炭地质杂志》上文章ID 103529卷,227年,2020年。
视图: 谷歌学术搜索
江美国歌曲,s, s . et al .,“Multifield耦合动态模拟在煤矿长壁采空区煤氧化和自热,“卷。2020年,文章ID 9075657, 16页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
r·k·Mishra p . n . s .罗伊诉k·辛格et al .,“检测和描述Jharia煤田煤矿火灾的印度使用地球物理方法:一个案例研究中,“地球系统科学杂志》上,卷127,不。8 - 10,2018页。
视图: 出版商的网站 | 谷歌学术搜索
周x,杨,x, z,胡锦涛和c”采空区煤炭自燃预测使用混沌分析气体指标从上层隧道,”天然气的科学与工程》杂志上26卷,第469 - 461页,2015年。
视图: 出版商的网站 | 谷歌学术搜索
d, l . i .贝l . i振宝et al .,“实验研究天然气索引优化煤炭自燃预测,“煤炭ence和技术,4卷,不。21日,第2056 - 2055页,2014年。
视图: 谷歌学术搜索
x y Wan和h·杨,”研究在煤矿采空区自燃预测系统基于多传感器融合技术,”先进材料的研究卷,550 - 553,2887 - 2890年,2012页。
视图: 出版商的网站 | 谷歌学术搜索
H.-y。妞妞,X.-l。邓,S.-l。李et al .,“实验研究,优化煤炭自燃预测指标气体,”中南大学学报,23卷,不。9日,第2328 - 2321页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
w . j . Li Pedrycz,贾马尔,“多元时间序列异常检测方法:隐马尔可夫模型的框架,“应用软计算,60卷,第240 - 229页,2017年。
视图: 出版商的网站 | 谷歌学术搜索
m . Canizo Triguero, a Conde, e . Onieva“多头CNN-RNN多次异常检测系列:工业案例研究中,“Neurocomputing卷,363年,第260 - 246页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
l . Beggel b . x Kausler m . Schiegg m·菲佛和b . Bischl”时间序列异常检测基于shapelet学习”,计算统计数据,34卷,不。3、945 - 976年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
l . p . Malhotra中收取,g .鉴定et al .,“短期记忆网络异常检测的时间长系列中,“程序,按de鲁汶大学医疗,89卷,2015年。
视图: 谷歌学术搜索
Chauhan和l .中收取“异常检测心电图时间信号通过深度长期短期记忆网络”学报2015年IEEE国际会议数据科学和先进的分析方法(DSAA)IEEE,页1 - 7,巴黎,法国,2015年10月。
视图: 出版商的网站 | 谷歌学术搜索
诉Rajagopalan a射线,通过小波分区符号时间序列分析,“信号处理,卷86,不。11日,第3320 - 3309页,2006年。
视图: 出版商的网站 | 谷歌学术搜索
h . Izakian和w . Pedrycz异常检测和表征在空间时间序列数据:cluster-centric方法,”IEEE模糊系统,22卷,不。6,1612 - 1624年,2014页。
视图: 出版商的网站 | 谷歌学术搜索
j·格拉汉姆·古德费勒,j . Pouget-Abadie m . Mirza et al .,“生成对抗网络”先进的神经信息处理系统,3卷,第2680 - 2672页,2014年。
视图: 谷歌学术搜索
施d, d, l . et al .,“MAD-GAN:多元时间序列数据的异常检测与生成对抗的网络,”2019年。
视图: 出版商的网站 | 谷歌学术搜索
w·H·T·w . Tang郭,j . H .局域网c F叮,H Hsu)和H T年轻,“异常检测神经网络具有双重auto-encoders GAN和工业检测应用程序,”传感器,20卷,不。12日,2020年。
视图: 出版商的网站 | 谷歌学术搜索
y贾和h .顾样本熵结合k - means聚类算法揭示了六的大脑功能网络,“21卷,没有。12日,2019年。
视图: 出版商的网站 | 谷歌学术搜索
d·鲁尼t . Adjei Mandic和p·达尼洛。”一种新型多元样本熵,”时间序列建模算法同步,20卷,不。2、2018。
视图: 出版商的网站 | 谷歌学术搜索
t . Amarbayasgalan v . h .范教授:Theera-Umpon,和k h . Ryu”时间序列的无监督异常检测方法在多域使用深度重建误差,“对称,12卷,不。8,1251年,页2020。
视图: 出版商的网站 | 谷歌学术搜索
m·t·藤冈,县政府k .日本久保田公司Mori et al .,“有效的与生殖敌对的网络异常检测乳腺癌超声成像,”诊断,10卷,不。7日,2020年。
视图: 出版商的网站 | 谷歌学术搜索
m . n . Fekri a . m . Ghosh和k . Grolinger”发电与复发性生殖机器学习,数据”敌对的网络,13卷,不。1,2019。
视图: 出版商的网站 | 谷歌学术搜索
翟z,“Auto-encoder生成对抗的网络。”智能和模糊系统杂志》上,35卷,不。3、1 - 7,2018页。
视图: 出版商的网站 | 谷歌学术搜索
a . Borji“甘利弊的评价措施,”计算机视觉和图像理解,卷179,41 - 65,2019页。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

555年

下载

658年

引用

复杂性

异常检测与差异率时间序列样本熵和生成对抗的网络

文摘

1。介绍

2。相关工作

2.1。气异常模式分析

2.2。差异率样本熵

2.3。产生敌对的网络

3所示。材料和方法

3.1。样本熵特征提取的差异率

3.2。DRSe-GAN异常检测模型

3.3。异常模式的决心

3.3.1。确定异常分数

3.3.2。产生异常分数

4所示。实验和分析

4.1。实验数据

4.2。实验结果

5。结论

数据可用性

的利益冲突

确认

引用

版权