文摘

适当的蒸馏塔的控制需要估计一些具有挑战性的在线测量的关键变量(如成分),通常使用推理模型估计。常用的推理模型包括潜变量回归(LVR)技术,如主成分回归(PCR)、部分最小二乘(PLS),和正规化的典型相关分析(RCCA)。不幸的是,实际测量数据通常含有错误,降低推理模型的预测能力。因此,噪声测量需要过滤来提高这些模型的预测精度。多尺度滤波已被证明是一个强大的特征提取工具。在这个工作中,多尺度滤波的优点是利用提高LVR模型的预测精度通过开发一个集成的多尺度LVR (IMSLVR)建模算法集成建模和特征提取。背后的想法IMSLVR建模算法来过滤过程数据在不同分解水平,模型从每一层过滤后的数据,然后选择LVR模型,优化模型选择准则。发达IMSLVR算法的性能使用三个例子说明,一个使用合成数据,一个使用模拟蒸馏塔的数据,一个使用填充床精馏实验数据。所有例子清楚地证明的有效性IMSLVR算法在传统的方法。

1。介绍

化学过程工业,模型中扮演一个关键的角色在不同的流程操作,如过程控制、监控和调度。例如,蒸馏塔的控制需要蒸馏的可用性和底部流组成。在线测量成分极具挑战性和昂贵的;因此,这些作品通常估计从其他流程变量(使用推理模型),这是容易衡量,如温度、压力、流量、热量职责等等。不过,还是有几个问题可以影响这些推理模型的准确性,包括存在的共线性(或变量)之间的冗余和测量数据中噪声的存在。

共线性的存在,这是由于大量的变量与推理模型,增加了估计模型参数的不确定性和降低其预测精度。潜变量回归(LVR),这是一个常用的框架推理建模、处理变量之间的共线性通过改变变量的大部分数据信息捕获在一个小数量的变量可以用来构建模型。事实上,LVR模型对少数潜在变量进行回归原始变量的线性组合。这通常导致状态良好的模型和良好的预测(1]。LVR模型估计方法包括主成分回归(PCR) (2,3],偏最小二乘(PLS) [2,4,5],正规化的典型相关分析(RCCA) [6- - - - - -9]。PCR是在两个主要步骤:将输入变量使用主成分分析(PCA),然后输出相关的构造一个简单的模型转换的输入(主成分)使用普通最小二乘法(OLS)。因此,PCR完全忽略输出(s)在确定的主要组件。部分最小二乘(PLS),另一方面,将变量考虑投入产出关系通过最大化输出和转换后的输入变量之间的协方差。这就是为什么请已广泛运用于实践中,比如在化工行业估计蒸馏柱组成(10- - - - - -13]。其他LVR模型评估方法包括正规化的典型相关分析(RCCA)。RCCA是另一种评估技术的扩展名为典型相关分析(CCA),这决定了转换后的输入变量通过最大化转换后的输入和输出之间的相关性(s) (6,14]。因此,CCA时也考虑了输入-输出关系改变的变量。CCA,然而,需要计算输入协方差矩阵的逆。因此,对于变量之间的共线性或等级不足,执行这些矩阵的正则化来提高估计模型的条件,因此,被称为正规化CCA (RCCA)。自协方差和相关性改变变量是相关的,RCCA减少请在某些假设。

另一个挑战在构建推理模型是测量数据中噪声的存在。测量过程数据通常由随机污染和严重错误由于正常波动,干扰,仪器退化,人类的错误。这些错误掩盖了重要功能的数据和降低估计推理模型的预测能力。因此,测量噪声需要过滤来提高模型的预测。不幸的是,测量数据通常是多尺度的性质,也就是说它们包含的特性和噪声与不同贡献时间和频率(15]。例如,一个数据跨越了一个广泛的突然改变在频域和一个小范围在时域,虽然缓慢变化跨度广泛在时域和频域的一个小范围。过滤这些数据使用传统的低通滤波器,如均值滤波器(MF)或指数加权移动平均(EWMA)过滤器,通常不会提供一个良好的噪声特点,因为这些过滤分离技术分类噪声高频特性和过滤数据通过删除所有功能有频率高于定义阈值。因此,建模多尺度数据需要发展多尺度建模技术,可以考虑这个数据的多尺度性质。

许多调查人员使用多尺度技术来提高估计精度的实证模型(16- - - - - -27]。例如,在[17],作者设计小波多尺度表示的数据预用于建模的目的。在[16),另一方面,作者讨论了使用多尺度表示的优点在实证建模中,并在18),他开发了一种多尺度PCA建模技术在过程监控和使用它。此外,在19,20.,23),作者使用多尺度表示减少共线性和缩小巨大的冷杉模型参数的变化。此外,在[21,24),是利用多尺度表示加强预测和吝啬的模糊和ARX模型,分别。在[22),作者扩展了经典single-scale系统识别工具多尺度系统的描述。在[25),作者开发了一种多尺度潜变量回归(MSLVR)建模算法将输入-输出数据在使用小波多尺度分解和缩放功能,然后构建多个潜变量回归模型使用了信号多尺度数据的近似。注意,在这种MSLVR方法(25),LVR模型估计只使用了信号,从而忽略任何重要的小波系数的影响在模型的输入-输出关系。后,同样的作者扩展使用多尺度表示同样的原理来构造非线性模型(26]。最后,在[27),小波被用作调制函数控制好相关系统识别。不幸的是,没有充分利用多尺度滤波的优点,提高预测的准确性的一般类潜变量回归(LVR)模型(例如,PCR,请和RCCA),这是本文的重点。

本文的目的是利用小波多尺度滤波增强LVR模型的预测精度通过开发一个建模技术相结合的多尺度滤波和LVR模型估计。寻求技术应该提供比常规LVR方法以及通过前置过滤过程数据(使用低通或多尺度过滤器)。

本文的其余部分组织如下。节2在这项工作,问题的解决,其次是描述的几个常用LVR模型估算技术部分3。节4简要的描述,提出了低通和多尺度滤波技术。然后,在节5的优势,利用多尺度滤波在实证建模进行了讨论,紧随其后的是一个算法的描述,称为综合多尺度LVR建模(IMSLVR)相结合的多尺度滤波和LVR建模。然后,在节6,发达IMSLVR建模技术的性能评估是通过三个例子,两个模拟的例子使用合成数据和蒸馏列数据,和一个实验的例子使用实际填充床蒸馏列数据。最后,给出了结论7

2。问题陈述

这项工作地址的问题提高线性推理模型的预测精度,可用于估计或推断出关键过程变量困难或昂贵的测量更容易测量的)使用多尺度滤波。所有变量的输入和输出,假定为添加剂污染的零均值高斯噪声。同时,假设存在一个强大的变量之间的共线性。因此,考虑到输入和输出数据噪声的测量,它需要构建一个线性模型提高预测能力(相对于现有LVR建模方法)使用多尺度数据过滤。线性推理模型的一般形式可以表示为 在哪里 是输入矩阵, 是输出向量, 是未知模型参数向量,然后呢 分别是模型误差。

多尺度滤波很有特征提取属性部分将讨论45。然而,建模预滤器数据可能导致消除模型变得可行的信息过滤的输入-输出数据。因此,发展多尺度建模技术预计将多尺度滤波和LVR模型估计提高LVR估计模型的预测能力。一些传统LVR建模方法描述。

3所示。潜变量回归(LVR)建模

发展中推理模型的主要挑战之一是大量过程变量之间的共线性存在与这些模型,从而影响他们的预测能力。多元统计投影PCR等方法,请和RCCA可以用来处理这个问题上执行回归小数量的转换变量,称为潜变量(或主成分),这是原始变量的线性组合。这种方法被称为潜变量回归(LVR),通常导致状态良好的参数估计和模型预测(1]。

在本节中,描述的一些知名LVR建模技术,包括PCR、请,RCCA,。然而,在我们描述这些技术,让我们介绍一些定义。让矩阵 被定义为增强了输入和输出数据,也就是说, 。注意,扩展数据通过执行每个变量(输入和输出)为单位方差。的协方差 可以定义如下9]: 的矩阵 , , , 的维度 , , , ,分别。

自潜变量模型将被开发使用转换(潜在的)变量,让我们定义转换的输入如下: 在哪里 th潜在的输入变量 , th输入荷载向量,它的维度

3.1。主成分回归(PCR)

PCR占共线性的输入变量通过减少维度使用主成分分析(PCA),并利用奇异值分解(圣)计算潜在的变量或主成分。然后,它构造一个简单的线性模型之间的潜变量和输出用普通最小二乘法(OLS)回归2,3]。因此,PCR可以制定两个连续的估计问题。首先,加载向量估计通过最大化主成分估计的方差如下: (因为数据意味着集中)也可以用输入协方差矩阵来表示 如下: 优化问题的解决方案(5)可以使用拉格朗日乘数法,获得的结果在以下特征值问题(3,28]: 这意味着估计加载向量矩阵的特征向量

其次,计算主成分(pc)后,这些电脑的子集(或者全部)(对应于最大的特征值)被用来构造一个简单的线性模型(有关这些电脑输出)使用OLS。让电脑的子集用于构造模型被定义为 ,在那里 ,那么这些电脑输出可以相关的模型参数估计使用如下的优化问题: 下面的封闭解, 注意,如果所有的主成分估计用于构建推理模型(例如, ),然后PCR OLS减少。还请注意,所有主要组件在PCR同时估计(使用(6),没有考虑到模型的输出。其他方法时考虑投入产出关系估算的主要组件包括部分最小二乘(PLS)和正规化的典型相关分析(RCCA),进行下一个。

3.2。偏最小二乘(PLS)

请计算输入荷载向量, 通过最大化估计潜变量之间的协方差 和模型输出, ,(14,29日), 在哪里 , 。自 和数据中心,(9)也可以表示的协方差矩阵 如下:

优化问题的解决方案(10)可以使用拉格朗日乘数法获得,导致以下特征值问题[3,28]: 这意味着估计加载向量矩阵的特征向量( )。

请注意,请利用迭代算法(14,30.]估计中使用的潜在变量模型,其中一个潜变量迭代或主成分被添加到模型中。潜变量的加入后,输入和输出残差计算过程是重复使用剩余数据直到交叉验证误差准则是最小化2,3,30.,31日]。

3.3。正规化的典型相关分析(RCCA)

RCCA是一个扩展方法的典型相关分析(CCA),由霍特林(首次提出6]。CCA减少模型输入空间的维数,利用输入和输出变量之间的相关性。CCA背后的假设是,输入和输出数据包含一些共同的信息,可以用这些变量之间的相关性。因此,CCA计算模型加载向量通过最大化之间的相关性估计主要组件和模型输出(6- - - - - -9),也就是说, 在哪里 , 。因为两个变量之间的相关性是协方差除以单个变量的方差的产物,(12)可以写成之间的协方差 受以下两个额外的约束: 。因此,CCA配方可以表示如下: 注意,约束( 从(省略)13),因为它是满足通过扩展数据零均值和单位方差节中描述3。由于数据集中,(13)的协方差矩阵可以写成 如下: 优化问题的解决方案(14)可以使用拉格朗日乘数法获得,导致以下特征值问题[14,28]: 这意味着估计加载向量矩阵的特征向量

方程(15CCA)显示,要求反相矩阵 获取加载向量, 。的共线性模型中输入空间,矩阵 成为近奇异,导致可怜的加载向量的估计,因此一个贫穷的模型。因此,CCA的正规化版本(称为RCCA)开发占CCA的这个缺点(14]。制定RCCA可以表示如下: 优化问题的解决方案(16)可以使用拉格朗日乘数法获得,导致以下特征值问题[14]: 这意味着估计加载向量矩阵的特征向量 。注意从(17),RCCA处理可能的共线性模型中的反相输入空间的矩阵的加权和 和单位矩阵,即 ,而不是反相矩阵 本身。然而,这需要知识的权重或正则化参数 。然而,我们知道,当 RCCA解决方案(17CCA)减少解决方案(15),当 RCCA解决方案(17)减少请解决方案(11)自 是一个标量。

3.3.1。优化RCCA正则化参数

上述讨论表明,取决于的价值 ,在那里 收敛于CCA, RCCA提供了一个解决方案或请两个端点, ,分别。在[14已经证明我们],“商资归农可以提供更好的结果比请一些中间的值 之间的 。因此,在本节中,我们提出优化的性能RCCA通过优化解决下面的嵌套优化问题的正则化参数的最佳值 : (所示的内循环的优化问题18)解决RCCA模型预测给定的正则化参数的值 ,外层循环选择的价值 提供了用看不见的测试数据交叉验证均方误差最小。

注意RCCA解决潜变量的回归模型以迭代方式类似于请,一个潜变量估计在每一次迭代14]。然后,潜变量的贡献及其相应的模型预测减去从输入和输出数据,并不断重复使用的残留数据,直到一个最佳主成分数或潜在变量根据一些使用交叉验证误差准则。

4所示。数据过滤

在本节中,简要的描述的一些过滤技术将用于提高LVR的预测模型。这些技术包括线性(或低通)以及多尺度滤波技术。

4.1。线性数据过滤

线性滤波技术滤之前测量的数据通过计算加权和有限或无限的窗口长度和被称为有限脉冲响应(杉木)和无限脉冲响应(IIR)过滤器。一个线性滤波器可以写成: 在哪里 , 是滤波器长度。知名FIR和IIR滤波器包括均值滤波器(MF)和指数加权移动平均(EWMA)滤波器,分别。均值滤波器使用相同的权重, ,而指数加权移动平均(EWMA)平均过滤所有先前的测量。EWMA过滤器也可以递归实现如下: 在哪里 是测量和过滤数据样本在时间步吗 。的参数 是一个可调节的平滑参数躺在0和1之间,一个值对应于没有过滤和零的值对应于只保留第一个测试点。更详细的讨论提出了不同类型的过滤器(32]。

在线性过滤,代表原始测量数据的基函数有一个本地化等于采样间隔时间。这意味着线性过滤器是单一规模自然因为所有的基函数具有相同的固定时频定位。因此,这些方法面临着权衡的准确表示暂时暂时全球的局部变化,有效的去除噪声(33]。因此,同时噪声去除和准确测量信号的特征表示包含多尺度特性不能有效地通过single-scale过滤方法(33]。增强去噪可以通过使用多尺度滤波接下来会被描述。

4.2。多尺度数据过滤

在本节中,提出了多尺度滤波的简要描述。然而,由于多尺度滤波依靠使用小波多尺度表示的数据和扩展功能,简要介绍了多尺度表示。

4.2.1。准备多尺度表示的数据

任何精确性信号向量(或数据)可以在多尺度表达信号小波的叠加和缩放功能,如图1。信号数据1(b),1(d)1(f)在越来越粗尺度比原始信号图所示1(一个)。这些扩展信号是由使用一个低通滤波器过滤数据的长度 , ,相当于将原始信号在一组标准正交尺度函数的形式 另一方面,在数字信号1(c),1(e)1(g),这被称为细节信号,捕获任何扩展信号之间的细节,在细尺度扩展信号。这些详细的信号是由预测信号的小波基函数的形式 或者说通过过滤扩展信号更好的规模使用高通滤波器的长度 , ,这是来自小波基函数。因此,原始信号可以表示成详细的总和信号在所有尺度和比例信号粗规模如下: 在哪里 , , , 翻译是扩张的参数,参数,最大数量的尺度(或分解深度),和原始信号的长度,分别27,34- - - - - -36]。

快速小波变换算法 复杂二元离散信号的长度已经开发(37]。例如,在特定尺度小波尺度函数系数 , 紧凑的方式,可以计算乘以换算系数向量在规模越细, 的矩阵 分别为, 在那里,

注意扩展的长度和详细的信号减少dyadically粗决议(更高 )。换句话说,在规模扩大信号的长度 一半的长度比例在细尺度信号吗 。这是由于将采样,用于离散小波变换。

4.2.2。多尺度数据滤波算法

使用小波多尺度滤波是基于这样的观察:随机误差信号存在在所有小波系数而确定的变化得到捕获在一个小数量的相对较大的系数(16,38- - - - - -41]。因此,平稳高斯噪声可以通过三步法(40]。(我)变换的信号在时频域分解的信号在选定的一组标准正交小波基函数。(2)任何系数小于阈值的小波系数通过抑制一个选定的阈值。(3)变换阈值系数回原始时域。

Donoho和同事研究了小波阈值的统计特性,表明噪声信号的长度 内,过滤后的信号将会有一个错误 无噪声的信号和信号之间的误差与先验知识过滤底层信号的平滑的39]。

选择合适的阈值是一个关键的步骤,这个筛选过程,和已经设计了很多方法。过滤信号的良好的视觉质量,Visushrink方法确定阈值(42] 在哪里 信号长度和吗 在规模的标准偏差是错误吗 ,可以估计的小波系数在尺度使用以下关系: 其他方法确定阈值的值(描述43]。

5。多尺度LVR建模

在本节中,将利用多尺度滤波提高预测精度的各种LVR建模技术在测量数据中噪声的存在。重要的是要注意,在实际的过程数据,特性和噪声跨度宽范围随时间和频率。换句话说,功能的输入-输出数据可能会改变在一个较高的频率在一定的时间跨度,但以低得多的频率在不同的时间跨度。同时,噪声(特别是有色或相关)可能有不同的频率随着时间的内容。多尺度数据等建模,模型估计技术应该能够提取重要特征数据和删除不良这些干扰噪声和干扰的影响降到最低的估计模型。

5.1。多尺度滤波在LVR建模的优点

由于实际过程数据通常是多尺度在自然界中,建模这些数据需要多尺度建模技术,占这种类型的数据。下面是一个描述的多尺度滤波的优点在LVR模型估计(44]。(我)测量数据中噪声的存在会大大影响LVR模型估计的准确性。这种效果可以大大减少了使用小波多尺度滤波数据过滤,提供有效的噪声分离的重要特性改善的质量估计模型。这种分离噪声特点可以直观地看到从图1,这表明,在粗尺度上信号是低噪音破坏。(2)多尺度表示的另一个优点是,相关噪声(在每个变量)被大约decorrelated多尺度。相关(或彩色)噪声产生的来源的情况下错误并不是完全独立的和随机的,如传感器故障或错误的传感器校准。有相关噪声数据使得建模更加具有挑战性,因为这样的噪音是解释为重要特征的数据,虽然实际上是噪音。这个属性的多尺度表示是非常有用的在实践中,在测量误差并不总是随机的(33]。

将利用这些优势来增强LVR模型的准确性通过开发一个算法相结合的多尺度滤波和LVR模型估计所述。

5.2。综合多尺度LVR (IMSLVR)建模

发达背后的想法综合多尺度LVR (IMSLVR)建模算法是结合多尺度滤波的优点和LVR模型估算提供推理模型与改进的预测。让时域输入和输出数据 ,让过滤后的数据(使用一节中描述的多尺度滤波算法4.2.2)在一个特定的规模 ;然后推理模型(据估计使用这些过滤数据)可以表示如下: 在哪里 过滤输入数据矩阵的规模吗 , 是过滤输出向量在规模 , 是使用过滤后的数据估计模型参数向量的规模 , 模型误差当过滤数据规模 分别使用。

在我们目前的配方LVR使用多尺度建模技术过滤数据,让我们定义以下。让矩阵 被定义为增强比例和过滤输入和输出数据,也就是说, 。的协方差 可以定义如下9]:

也,因为LVR模型开发使用转换变量,改变输入变量使用过滤的输入规模 可以表示如下: 在哪里 th潜在的输入变量 th输入加载向量估计大规模使用过滤后的数据 使用任何LVR建模技术,也就是说,PCR,请或RCCA。因此,LVR模型估计问题(使用多尺度过滤数据规模 )可以制定如下。

5.2.1。LVR建模使用多尺度过滤数据

PCR模型可以估计大规模使用多尺度过滤数据 如下: 同样,请模型可以估计大规模使用多尺度过滤数据 如下: 最后,使用多尺度的RCCA模型可以估计过滤数据的规模 如下:

5.2.2。综合多尺度LVR建模算法

重要的是要注意,多尺度滤波提高数据的质量和LVR模型估计使用这些数据的准确性。然而,过滤的输入和输出数据先验没有考虑到这两个数据集之间的关系可能导致重要的特性模型。因此,需要结合LVR多尺度滤波模型噪声去除。这就是被称为综合多尺度LVR (IMSLVR)建模。实现这一目标的方法之间的集成多尺度滤波和使用以下IMSLVR LVR建模建模算法示意图如图2:(我)把数据分成两组:训练和测试,(2)规模的训练和测试数据集,(3)滤波器的输入和输出训练数据在不同尺度(分解深度)使用中描述的算法部分4.2.2,(iv)从每个规模使用过滤后的训练数据,构建一个LVR模型。主成分的数量优化使用交叉验证,(v)使用估计模型从每个规模预测的输出测试数据,并计算交叉验证均方误差,(vi)选择LVR与IMSLVR交叉验证均方误差最小的模型。

6。说明性的例子

在本节中,IMSLVR建模算法的性能描述的部分5.2.2说明和比较与传统LVR建模方法以及模型获得的前置过滤的数据(使用多尺度滤波或低通滤波)。这种比较是通过三个例子。前两个例子是模拟的例子,一个使用合成数据和其他使用模拟蒸馏列数据。第三个例子是一个实际的例子,使用实验填充床蒸馏列数据。在所有例子中,使用交叉验证估计模型进行了优化和比较,通过最小化输出预测均方误差(MSE)用看不见的测试数据: 在哪里 在时间步是测量和预测输出吗 , 测试测量的总数。数量的同时,保留潜在的变量(主成分)的各种LVR建模技术(RCCA,请和PCR)是优化使用交叉验证。注意数据(输入和输出)扩展(通过减去均值和除以标准差)之前构建LVR模型来提高他们的预测能力。

6.1。示例1:推理合成数据的建模

在这个例子中,表演的各种LVR建模技术通过合成数据建模比较组成的十个输入变量和一个输出变量。

但是。数据生成

数据生成如下。前两个输入变量是“块”和“heavy-sine”信号,计算,另一个输入变量的线性组合,前两个输入如下: 这意味着输入矩阵 的排名 。然后,输出计算的重量和所有输入如下: 在哪里 ,因为 。生成的数据样本的总数是512。所有的变量、输入和输出,无噪声的假设,然后添加剂污染的零均值高斯噪声。不同程度的噪声,这对应于信噪比(信噪比)的5,10,20,是用来说明各种方法的性能在不同噪声的贡献。信噪比被定义为无噪声的数据的方差除以污染噪声的方差。一个示例的输出数据, ,如图3

6.1.2。选择分解深度和最佳滤波器参数

分解深度用于多尺度滤波和低通滤波器的参数(即。的长度,意味着滤波器和平滑参数的值 使用交叉验证准则)进行了优化,提出了在43]。这里的想法是把数据分成两组:奇怪的( )和( );过滤器的设置,计算偶数编号的数据过滤奇数的估计数据,平均两个相邻过滤样品,也就是说, ,然后计算交叉验证MSE (CVMSE)对数据样本如下: 重复相同的过程使用偶数编号的样本作为训练数据,然后选择最佳滤波器参数通过最小化的和交叉验证均方误差使用奇怪的甚至数据样本。

6.1.3。仿真结果

在本节中,IMSLVR建模算法的性能比传统的LVR算法(RCCA,请和PCR)和那些通过使用多尺度滤波前置过滤数据,意味着过滤(MF)和EWMA过滤。Daubechies小波滤波器的多尺度滤波,使用顺序三个,和所有滤波技术的滤波参数优化使用交叉验证。获得统计上有效的结论,使用1000年蒙特卡洛模拟实现,执行和结果如表所示1。结果在表1清楚地表明,建模预滤器数据(使用多尺度滤波(MSF + LVR) EWMA过滤(EWMA + LVR),或意味着过滤(MF + LVR))提供了一个显著的改善了传统LVR建模技术。这个优势是更清晰的多尺度滤波在single-scale(低通)过滤技术。然而,IMSLVR算法提供了一个进一步改善对多尺度前置过滤(MSF + LVR)噪音水平。这是因为IMSLVR算法集成建模和特征提取保留重要的特性在数据模型中,提高模型的预测能力。最后,在表的结果1还表明,IMSLVR算法的优点是清晰的大噪声内容,也就是说,较小的信噪比。作为一个例子,所有人的表现在图演示了使用RCCA估计模型4的情况 ,这清楚地显示出比其他LVR IMSLVR建模技术的优点。

6.1.4。小波滤波器对模型预测的影响

小波滤波器的选择有很大影响的性能估计模型使用IMSLVR建模算法。学习上的小波滤波器性能的影响的估计模型,在本例中,我们反复模拟使用不同的小波滤波器(哈雾,Daubechies第二和第三级过滤器)和蒙特卡罗模拟的结果使用1000实现如图所示5。仿真结果清楚地表明,Daubechies三阶滤波器是最好的滤波器对于这个示例,这是有道理的,因为它比其他两个过滤器,平滑,因此它适合数据的性质更好。

6.2。示例2:推论蒸馏塔数据的建模

在这个例子中,预测能力的各种建模技术(即。,IMSLVR, MSF+LVR, EWMA+LVR, MF+LVR, and LVR) are compared through their application to model the distillate and bottom stream compositions of a distillation column. The dynamic operation of the distillation column, which consists of 32 theoretical stages (including the reboiler and a total condenser), is simulated using Aspen Tech 7.2. The feed stream, which is a binary mixture of propane and isobutene, enters the column at stage 16 as a saturated liquid having a flow rate of 1 kmol/s, a temperature of 322 K, and compositions of 40 mole% propane and 60 mole% isobutene. The nominal steady state operating conditions of the column are presented in Table2

6.2.1。数据生成

这个建模问题中使用的数据是由扰动生成提要的流速和回流流从他们的名义操作值。首先,一步改变给水流量大小±2%的名义条件介绍,在每种情况下,这个过程可以解决到一个新的稳定状态。再次获得名义条件之后,类似的步骤的变化大小±2%回流流量围绕其名义介绍了条件。这些扰动是用来生成训练和测试数据(每个512数据点)组成的用于开发各种型号。这些扰动在训练数据集和测试数据所示6 (e),6 (f),6 (g),6 (h)

在这个模拟的建模问题,输入变量包括十列的温度在不同的托盘,除了提要和回流流的流速。输出变量,另一方面,是光的组成成分(丙烷)馏出物和底流(即, 、职责)。动态温度和成分生成的数据使用阿斯彭模拟器(由于饲料和回流的扰动流率)被认为是无噪声的,然后含有零均值高斯噪声。评估各种建模技术对不同噪声的鲁棒性贡献,不同程度的噪音(对应信噪比5、10和20)。样本训练和测试数据集显示列上的扰动的影响成分数据所示6(一),6 (b),6 (c),6 (d)的情况下,信噪比是10。

6.2.2。仿真结果

在本节中,IMSLVR算法的性能比传统LVR模型以及模型估计使用预滤器数据。获得统计上有效的结论,执行1000年蒙特卡洛模拟实现,和这项研究的结果发表在表34顶部和底部的估计蒸馏塔组成,也就是说, ,分别。在第一个示例中,两个表中的结果34表明建模预滤器数据显著提高预测精度的估计LVR模型在传统的模型估计方法。然而IMSLVR算法,进一步提高了估计LVR模型的预测,特别是在高噪声内容,也就是说,在较小的信噪比。为了说明各种LVR建模技术的相对表现,作为一个例子,估计RCCA模型顶部的表演成分( )的情况 如图7

6.3。示例3:动态LVR建模实验填充床的蒸馏塔

在这个例子中,发达IMSLVR建模算法用于模型实际填充床蒸馏塔循环流。更详细的流程、数据收集和模型估计了下一个。

6.3.1。填充层蒸馏塔的描述

中使用的填充层蒸馏塔这个实验建模的例子是一个6英寸直径不锈钢列组成的三个包装部分(底,中间,和顶部部分)上升到20英尺的高度。列,用于分离甲醇-水混合物,与液体分销商Koch-Sulzer结构化包装每个包装部分之上。工业质量分布式控制系统(DCS)是用来控制列。填充床精馏的原理图如图8。十个电阻温度检测器(RTD)传感器是固定在不同位置设置监控列温度曲线。各种流的流速和密度(如饲料、回流,顶级产品,和底部产品)也监控。此外,设置包括四个泵和五个热交换器在不同的位置。

原料流进入列中点附近。上面列的一部分提要构成整流部分,和下面的部分(包括)饲料构成了提馏段。提要的提馏段流入底部的列,在一定程度的液体是由一个闭环控制器。蒸汽加热重沸器是用来加热和蒸发流底部的一部分,然后发送回列。蒸汽穿过整个列联系下行液体向下。底部产品退出柱的底部,然后发送到一个热交换器,用于加热原料流。蒸气通过整流部分完全凝聚在冷凝器的冷凝收集回流鼓,一个指定的液位。冷凝液的一部分发送回列使用回流泵。馏分油不用作回流冷却热交换器。冷却馏分油和底流收集在一个提要,在哪里混,后来作为一个提要发送列。

再。数据生成和推理建模

4 s的采样时间是选择收集数据用于建模问题。扰动所产生的数据提要的流速和回流流从他们的名义操作值,如表所示5。首先,步骤的变化大小±50%饲料流量介绍了围绕其标称值,并在每种情况下,可以解决一个新的稳定状态。再次获得名义条件之后,类似的步骤的变化大小±40%回流流量围绕其标称值。这些扰动是用来生成训练和测试数据(每个组成的4096个数据样本)用于开发各种型号。这些扰动数据所示9 (e),9 (f),9 (g),9 (h),这些扰动的影响在馏分油和底部流成分数据所示9(一个),9 (b),9 (c),9 (d)

在这个建模问题,输入变量包括六列中不同位置的温度,除了提要和回流流的流速。输出变量,另一方面,是光的组成成分(甲烷)馏出物和底流( 、职责)。因为该列的动态特性和循环流的存在,列总是在瞬态条件下运行。这些过程动力学可以占在推理模型包括输入和输出滞后到模型(13,45- - - - - -48]。因此,在这个动态建模问题,滞后LVR模型用于输入和输出列的动态行为。因此,模型的输入矩阵由17列:八列输入(六个温度和流速的饲料和回流流),8列滞后的输入,输出滞后的一列。显示IMSLVR算法的优点,其性能比传统的LVR使用多尺度模型和模型估计预滤器数据,结果如图所示10。结果清楚地表明,多尺度前置过滤提供了一个重要的改进传统LVR (RCCA)方法(试图overfit测量),和IMSLVR算法提供的平滑度和预测精度进一步提高。注意,图10只显示测试数据的一部分而清晰。

7所示。结论

潜变量回归模型是常用的在实践中来估计变量难以衡量其他更容易衡量的变量。本文提出一种建模技术来改善LVR模型的预测能力通过集成多尺度滤波和LVR模型估计,叫做集成多尺度LVR (IMSLVR)建模。发达IMSLVR算法背后的想法是滤波器的输入和输出数据在不同的尺度,构造不同的模型使用过滤后的数据从每个规模,然后选择模型提供了交叉验证均方误差最小。IMSLVR建模算法的性能比传统LVR建模方法以及建模预滤器数据,使用低通滤波(如均值滤波或EMWA过滤)或使用多尺度滤波通过三个例子,两个模拟的例子和一个实际的例子。模拟例子使用合成数据和模拟蒸馏列数据,而实际的例子使用填充床精馏实验数据。所有例子的结果表明数据前置过滤(尤其是使用多尺度滤波)提供了一个显著的改善了对流的LVR方法,IMSLVR算法提供了一个进一步提高,特别是在高噪音水平。的主要原因IMSLVR算法在建模预滤器数据的优点是,它集成了多尺度滤波和LVR建模,这有助于保留模型变得可行功能可以提供增强模型预测的数据。

承认

这项工作是支持的卡塔尔国家研究基金(卡塔尔基金会的成员)授予NPRP 09-530-2-199。