文摘
许多工业过程是在多个模式由于不同的生产经营策略。多峰性过程的数据往往是伴随着非线性和非高斯特性,这使得数据驱动的监控更为复杂。本文介绍了统计模式分析(SPA)从原料中提取低收入和高阶统计流程数据。支持向量数据描述(SVDD),它可以处理非线性和非高斯问题,应用于监控多模过程。改善检测性能的SVDD培训多模数据异常值,修改本地可达性密度比(mLRDR)提出了作为加权因子嵌入在weighted-SVDD (wSVDD)模型,在本地邻居的空间和时间。最后,我们演示了该方法的有效性和优越性,通过(TE)过程和污水处理过程(WWTP)。
1。介绍
工业过程的操作条件与多样化的客户需求,将不可避免地改变设定值变化,和不同的内在特性,导致多种模式(1- - - - - -3]。因为多通道过程的复杂性,很难获得满意的监测结果。在过去的几十年中,多模的有效监控流程已经吸引了大量的关注。
最近总结了数据驱动的多模过程的监控方法广泛Quinones-Grueiro et al。4]。他们表示,multimodel方案是广泛应用的监控方法之一,应该执行的识别不同的模式。例如,Du et al。5应用k - means解决多模聚类问题。同样,张和赵(6)集群多模模糊c数据到不同的集群通过内核(KFCM)算法。在这些方法中,集群数量应该提前确认。作为一种替代方法,移动窗口方法,例如,递归当地异常因素(LOF) [7),测量窗口之间相似性的时空信息特征来识别集群。在模式识别,每个模式监控等传统方法主成分分析/独立分量分析(PCA、ICA)和他们的扩展等等。(8- - - - - -10]。最近,一些努力已经应用多个模型与贝叶斯融合多模监控。具体来说,高斯混合模型(GMM)部署完成故障诊断,同时考虑多个模型(11,12]。
与multimodel方案相比,single-model-based方法简化了建模和监测过程。基于隐马尔可夫模型(HMM)的方法,提出了在13,14),而他们的参数设置仍然是一个复杂的任务。朱et al。15)提出了一种递归的混合因子分析对多模时变过程建模和监视。考虑到在不同的模式中,有相互连接的一个策略是掌握在他们共同特征构造一个监控模型。黄和汉16)提出了超级主成分分析(PCA)方法,它可以被认为是基于这个想法的第一次尝试。然后,Zhang et al。17由PCA-based]建立了公共和个人监测模型和偏最小二乘法(PLS)建立方案。此外,Zhang et al。17)利用常见的基向量提取多模之间的共同特征数据。对近邻的方法,不同的模式应该是标准化(18]。例如,马等。19)提出了一个于社区的全球协调(NBGC)方法通过调整当地模型为全球多模过程监控。
在single-model-based方法,SVDD模型及其扩展被广泛应用。由支持向量机(20.],SVDD提出了基于分类的想法看到下面成了。SVDD项目没有需求的数据转换为高维特征空间的高斯分布(21]。因此,SVDD方法可以处理非线性和非高斯数据(22]。然而,SVDD麻木不仁的只有很小一部分的离群值,以及训练有素的超球面有时会倾向于包围远离正常数据集的异常值。此外,正常样本和不同密度没有对SVDD建模的影响。多模的训练数据集,抽样数量与不同的模式和数据密度显著不同。因此,SVDD是不适合直接应用于多模监控。wSVDD方法是为了解决这个问题,开发的重量系数通常是由加权信息。减少离群值的影响在单模的建模过程中,陈et al。23]提出robust-SVDD通过引入cutoff-distance-based当地每个数据样本和密度 - - - - - -不敏感损失函数和负样本。小王和局域网24]利用SD outlyingness分配较低的体重值异常值。对于多模过程,赵等人利用每个样本的加权平均值和标准偏差的邻国标准化数据集和应用加权当地标准化(WLS)策略wSVDD [25]。李等人。26)提出了一个当地的密度比加权支持向量数据描述(LDR-wSVDD)来维持一个超球面的监控效率模型。然而,空间信息仍没有完全挖掘,和时间信息不是受雇于wSVDD建筑的重量,这可能会导致不满意现有的方法的性能。因此,wSVDD仍然需要进一步的研究。
最近,Breunig et al。27]定义的局部密度可达性(上),表示样本上的相关的本地信息不仅本身,而且其最近的邻居。通过包含更全面的密度信息,上有可能被转换为一个新的wSVDD体重因素。然而,上与不同的模式变化显著;因此,它同样还没有反映出当地的信息。此外,传统上只考虑空间信息,不考虑时间信息。
此外,在不同模式的数据可能互相重叠在实际工业过程中,原始数据,这样有时未能体现某些模式的独特性。统计模式分析(SPA)被王首先介绍,他(28),这是我能够基本数据的统计特性,应用于过程监控(29日]。朱和顾SPA集成到当地核主成分分析(LKPCA)来提高故障检测的性能30.]。
本文应用SPA获得充分挖掘潜在信息的统计特征首先多模的数据集。wSVDD被选中作为监测模型,和修改的地方可达性密度比(mLRDR)提出了一个新的体重wSVDD消除过程的多峰性,减少异常值的影响。本地信息的空间和时间被认为是在mLRDR计算进一步加强监测性能。最终,小说计划叫做温泉修改本地可达性密度比加权支持向量数据描述(SmLRDR-wSVDD)建立了非线性多模监控。
本文的其余部分组织如下:在部分2,提出了非线性多模过程监测方案详细阐述;节3,结果和讨论给出了TE过程和WWTP;最后,给出了结论部分4。
2。方法
在本节中,SmLRDR-wSVDD方法监测提出了非线性多模过程,统计模式的数据集是由温泉,和一个新的加权因子命名mLRDR提出基于LRD wSVDD监测方法。
2.1。统计模式的建设
虽然不同的模式的具体特征可能不是从原始数据体现,它们可以表达的统计数据。在水疗中心框架(28),选择不同的数据模式为观测变量来捕获动力学和非线性等主要工艺特点和使用了该方法建模和监测对象。
假设 是原始测量数据集样品和变量和样本的窗口来标示 在哪里窗口宽度和吗是时候指数。一般来说,统计模式(SP)由三组数据:一阶,二阶,和高阶统计信息,可以表示为 在哪里表示一阶统计,即是说,及其元素从窗口中的数据计算: 在哪里表示二阶统计,包括方差( ),相关性( ),自相关( ),和互相关( )不同的变量在窗口 与表示变量间的时滞;表示高阶统计包括偏态( )和峰态( )测量的非线性程度和量化过程变量的同时31日]
SP是由堆积选择统计由方程(1)- (9)一个行向量。摘要三种统计数据 , ,和选择从一阶、二阶和高阶统计信息来构造数据矩阵 与 , ,和 。
2.2。mLRDR加权SVDD
SVDD的主要想法是为建设项目数据到高维空间最小超球面。训练数据集 根据方程(获得2),它是标准化的 。在SVDD建模的过程,首先从原始空间映射到一个更高的特征空间的非线性变换函数 。传统SVDD,所有训练数据具有相同的影响模型建设,这使得它的异常值和数据密度。因此,采用wSVDD通过引入权重对于每个训练数据,可以计算和相应的超球面解决以下原始优化问题: 在哪里和分别是超球面的中心和半径;权衡参数 介绍的超球面尽可能小而防止误分类的样本,在吗表示离群值的比例允许在训练集26];是松弛变量,允许超球面的离群值;和的重量是数据,小显示更多的局外人的可能性。
对于多模的流程,wSVDD的重量系数应充分反映当地的每一块训练数据的分布特征。密度是一个指标反映了数据分布,广泛用于重量的设计因素。本地可达性密度(上)(27)的数据点不仅取决于其距离点的邻居还有邻居的邻国。
除了空间密度、当前数据也与前面和第二点的时间序列,将改善和监控性能考虑空间信息和时间信息(32]。因此,修改后的上提出本文通过考虑当地的邻居在这两个时间和空间,全面提取数据的地方特色。
首先,再所有的邻居 选择构建一套吗 ,满足 ,在哪里和邻居在时间和空间上的数量,分别。
假设欧几里得距离吗对其 - - - - - -最近的邻居。然后的距离 之间的和(k= 1,2,…,计算K),是 - - - - - -最近邻的 。的距离可达性关于被定义为
因此,mLRD构造
多模的主要属性加权因子的过程应该平衡不同的模式和减少建模中异常值的影响。根据方程(12),如果分布特征与不同的模式差异很大,mLRD在不同模式将改变很多;和一些异常值将很难脱离正常的数据;即局部密度较低的正常数据的全局密度可能类似于周围的异常值数据和全球密度更高。因此,削弱多峰性特性和离群值之间的差距扩大和正常数据,修改本地可达性密度比(mLRDR)开发wSVDD的加权因子
很明显,保存在 。
根据方程(13),如果是一个正常的点,mLRD接近其邻国和相应的mLRDR方法1。如果是个例外,其mLRD显著低于正常的邻国和mLRDR接近0,这表明异常值将会微不足道的影响超球面的决心。
与现有的重量等因素异地恋(26),mLRDR包含更广泛的空间和额外的时间信息,它可以区分正常数据较低的密度和密度较高的数据点周围的异常值数据;因此它将提高wSVDD监控性能。
wSVDD建模,方程(10)可以转化为dual-optimization问题通过引入拉格朗日乘数法 如下: 在哪里 核函数,可以通过检测确定决策边界的“紧张”(33]。在求解方程(14),只有对象与 被称为支持向量(sv),下标集 。因此,超球面的中心和半径 分别。
当新样品获得了窗口,计算了SPs方程(2)和归一化 ,和之间的距离和中心可以通过计算
如果 ,系统被认为是在正常的状态。否则,发生错误。
2.3。SmLRDR-wSVDD方案的过程
在本节中,提出SmLRDR-wSVDD方案见图1。列出具体的离线建模和在线监测步骤如下: (我)步骤1:采用多模集水疗 获得统计数据矩阵 由方程(2)- (9)。(2)步骤2:规范化数据矩阵并获得 。(3)步骤3:计算mLRDR作为加权因子由方程(11)- (13)。(iv)第四步:设置weighted-SVDD模型与重量 ,求解方程(14),获得中心和超球面的半径由方程(15)和(16),分别。 (我)步骤1:当前窗口的数据集 ,统计数据向量 通过方程计算(2)- (9)。(2)步骤2:规范化统计向量获得 。(3)步骤3:计算距离之间的和超球面的中心(17 fd17)。(iv)步骤4:如果 , 被认为是正常的;否则,它处于故障状态。
在这篇文章中,如果年代连续3窗口的控制极限 ,系统被认为是在错误的情况下,最后一个样本在第一个错误的窗口确定错误的开始。
必须指出新常态模式的识别是不被认为是在该方法。虽然能够探测到一个新的正常模式SmLRDR-wSVDD故障,它可能是重新定义了通过分析采样数据的平稳性后收集足够的数据。
总之,该方法采用SPA开采更多的功能从不同的顺序统计的原始数据与其他现有SVDD-based方法相比。此外,提出了一种新的加权因子wSVDD建模,在其他邻居的地方被认为是空间信息和时间信息,这使得该方法对异常值和密度与其他方法相比更敏感。
3所示。案例研究
在本节中,提出通过SmLRDR-wSVDD方法应用于(TE)基准过程和污水处理过程(WWTP)。在这两种情况下,该方法与现有的方法相比KPCA(包括34)、常规SVDD LDR-wSVDD [26]。
3.1。通过基准测试过程
通过过程(TE过程)在1993年提出了波动和沃格尔35),已广泛采用科学研究(36]。有五个单位,反应堆,冷凝器、压缩机、脱衣舞女,和分离器,在这种非线性过程。根据不同的 质量比(和是两个产品),6稳定模式可以获得所列在表吗1。
堆垛机提供的控制方案和正常操作(37)和相应的仿真平台可以下载http://depts.washington.edu/control/LARRY/TE/download.html。模式1和模式3模拟生成建模和测试数据集。有53个变量:12操纵变量,22个连续过程变量,19组成测量。自稳态值的回收价值和蒸汽价值模式1和搅拌器率在两种模式下不改变,他们不包括在监控变量,其余9操纵变量和22容易测量连续变量选择。此外,TE过程仿真平台包含20的缺点。排除故障3、9和15日轻微扰动,和未知的错误- 12故障表中给出2被录用;和采样间隔设置为3分钟。
模型训练,800正常样本模式1和200正常样本收集模式3,和20离群值混合。在线监控,每个测试数据集包含了1000个样本,200年第一次样品是正常的,和故障的发生样本。选择KPCA的信心水平 。对于其他三个算法,高斯核宽度参数是由的方法33),而 惩罚参数的选择吗 。在拟议的方法中,窗口的宽度被分配为10,邻居在时间和空间上的数字吗和分别选为8和图2。上述参数两种情况下是相同的。
这四个方法,KPCA, SVDD, LDR-wSVDD,提出SmLRDR-wSVDD, TE过程应用和比较。错过的报警率(火星)38为每种故障类型的模式1和模式3如表所示3,最好的结果是显著的大胆,和假警报率(远)如表所示4。具体来说,火星的KPCA故障4、5、6、7、10、11、12和14的模式1和错误4,5,6,7,10,11日和14模式3都超过0.5,表明一个KPCA模型不适合监控多模过程。在四种方法中,提出SmLRDR-wSVDD方法达到的最低火星几乎所有的故障除了故障5模式1的第2和故障模式3。例如,该方法大大降低了火星的断层10模式1和模式3和故障12比LDR-wSVDD模式1 9%以上。必须指出所有方法为故障高3月5的模式1,因为它实际上是一个轻微的扰动。
此外,四种方法的详细的监测结果对不同故障的两种模式数据所示2- - - - - -5。故障11模式1,SPE KPCA和Dist SVDD的剧烈波动,有些是在限制如图2(一个)和2 (b);如图2 (c)Dist略有波动,一些低于限制LDR-wSVDD;同时,由于该方法如图2 (d),所有的统计数据都远远高于控制极限。同样,该SmLRDR-wSVDD能独立正常状态和故障明显比其他方法如图33和4。故障的监测结果为模式3如图135。错,有48个,47岁,27岁,和9个样本检测延迟的KPCA, SVDD LDR-wSVDD, SmLRDR-wSVDD。因此,可以推断SmLRDR-wSVDD比另一个更敏感的四个错误的方法。
(一)
(b)
(c)
(d)
(一)
(b)
(c)
(d)
(一)
(b)
(c)
(d)
(一)
(b)
(c)
(d)
法尔斯的方法总结表4。对于所有故障模式1,法尔斯的KPCA和LDR-wSVDD内 和 ,分别,而传统的SVDD和SmLRDR-wSVDD内 。在模式3中,法尔斯KPCA的SPE的最大缺点,有时甚至大于0.05,和那些LDR-wSVDD故障范围从0.015到0.035。注意所有的法尔斯提出SmLRDR-wSVDD方法是小于0.02,虽然大部分都是高于传统SVDD在0.01。
图6显示上和每个训练样本的重量基于存贷比和拟议的mLRDR分别,蓝色,绿色,红点从模式1,模式3,分别和异常值。在图6(一),很容易发现,正常模式差异很大的上,没有独特的模式3和离群值之间的差距。如数据所示6 (b)和6 (c),贷款存款比率和mLRDRs样品在两个正常模式下均匀地分配在0.6和0.9。与LDRs相比,mLRDRs的异常值明显低于正常的数据。因此,决策边界不容易受到异常值的方法,这将提高其监控性能与其他方法相比。
(一)
(b)
(c)
3.2。污水处理过程(WWTP)
在本节内,基准仿真模型。1 (BSM1) WWTP [39被认为是。这个基准测试是一个复杂的非线性系统,它由五个隔间(两个缺氧和三个有氧)在生物反应器和ten-layer澄清器。工厂的布局图所示7,更详细的信息关于BSM1可以找到http://www.benchmarkwwtp.org/。
通过改变流速和氧转移系数在生物反应器,可以获得三种不同的模式(40]。不失一般性,模式1和模式2选择在这种情况下,和相应的参数如表所示5。过程包含223个变量,其中20个相关的生物现象,他们选择在这个例子中,如表所示6。
有两种扰动类型的基准仿真(41]:外部干扰和内部干扰。具体来说,干燥的天气之后,风暴事件,和长时间的雨是三个天气情况,其中第一个被认为是正常的,后两个是外部干扰,可以检测到的影响特征。至于内部干扰,降低硝化作用,减少沉降速度,硝酸传感器故障,选点的变化做控制器被提到41]。
在这个例子中,样品每15分钟收集一次。1344样品的干燥的天气模式1和模式2表所示7混合着20额外的异常值作为训练数据集。5仿真案例(案例1例5)是用于测试的目的40,41),这也说明表7。
四个上述算法执行5例,其中的参数是一样的那些TE过程研究。所有错误的火星表所示8。对于每个案例,最好的结果就是以粗体显示。所有的四个方法低火星在例1和4。同时KPCA超出0.2的火星在病例2,3,5,这些传统SVDD超过0.1例2和5。大多数火星LDR-wSVDD低于0.05,除了0.1265例2。必须指出的是,该方法的火星在例1中,3、4和5只0和0.0164 2,都是最低的。
具体来说,例1的监测结果如图所示8。如数据所示8(一个)- - - - - -8 (c)故障检测与6 8和7分的延迟SPE的KPCA,传统SVDD LDR-wSVDD,分别;同时该方法可以检测出故障后立即发生,如图8 (d)。例2所示图9故障发生后从正常样本,它慢慢地改变。从数据9(一个)和9 (b),有很多统计低于后的控制限度样品在KPCA和传统的SVDD。如图9 (c),尽管体重因素,异地恋,在wSVDD应用,许多统计仍在极限之初的错。如图9 (d),该方法快速检测到故障,和下面的数据远高于控制极限。与其他方法相比,SmLRDR-wSVDD更有效的故障与缓慢漂移在萌芽阶段。
(一)
(b)
(c)
(d)
(一)
(b)
(c)
(d)
法尔斯表所示9,提出SmLRDR-wSVDD方法最低法尔斯在例2中,3和4。尽管它的法尔斯略高于常规SVDD病例1和5,他们都是少于0.03,太容易被考虑。
同样,上每个训练样本的异地恋,mLRDR可视化图10解释我们的方法的优越性。蓝色,绿色,红点是模式1,模式2,分别和异常值。显然,上的变化与不同的模式,在图的异常值接近正常10 ()。尽管贷款存款比率可以删除多峰性如图10 (b)贷款存款比率的异常值和正常样本没有区别。作为比较,mLRDRs的异常值远离那些正常的,如图10 (c)。再次证明,该方法可以处理多个模式均匀,减少异常值对建模的影响。
(一)
(b)
(c)
4所示。结论
本文提出了一种非线性多模SmLRDR-wSVDD过程监控方法,进一步提高监测的性能。具体地说,使用SPA首先提取低收入和高阶统计;然后,weight-SVDD建立监测模型,采用一个新的权重因数mLRDR提出基于上。与传统方法相比,更多的功能难以显示由该方法从原始数据挖掘,和更全面的当地时间和空间信息集成到加权因子,可以消除多峰性均匀,极大地削弱了异常值对超球面的边界的影响。TE过程和WWTP中的应用表明,该方法是有效的非线性多模过程中监测3月/远较低和较高的故障灵敏度比其他三个现有的方法。
数据可用性
手稿中的数据是根据生成的http://depts.washington.edu/control/LARRY/TE/download.html和http://www.benchmarkwwtp.org/。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作得到了国家自然科学基金资助下的中国61873102。