Semi-Supervised混合本地内核回归炼过程的软测量模型

文摘

软测量技术在化工行业广泛采用估算的重要指标无法在线测量的硬件传感器。不幸的是,由于本能实时变化,小样本条件和原材料的漂流带来的不确定性,这是极难模式馈料式流程,例如,橡胶内部混合处理。与此同时,全球学习算法受到传统过时的样品同时在线学习算法缺乏实用性因为太多的标签样品目前的批处理需要建立软测量。摘要semi-supervised混合本地内核回归(SHLKR)提出了利用历史和在线样本semi-supervised模型提出的软传感器使用时间窗系列。此外,递归公式推导,以改善其适应性和可行性。此外,橡胶穆尼软传感器内部混合处理使用真正实现现场数据来验证该方法。与经典算法相比,SHLKR的性能评估和未标记的样本的贡献进行了探讨。

1。介绍

馈料式过程化学和生化行业发挥着重要的作用。他们是广泛采用的生产很多fermentation-derived精细化工行业等产品,制药和食品。橡胶内部混合(1)是一个经典馈料式过程中执行一个密炼机来实现最优的门尼粘度进行进一步处理。因为门尼粘度无法在线测量而其实验室化验是劳动密集型和耗时,软测量方法研究了建立实时评估。此外,数据驱动的但不是mechanism-modelling方法是常用的软测量建模,因为它是一个复杂的非线性过程,没有成熟的机制。此外,其本能的实时变化,不同属性的天然橡胶和添加剂伴随着过程漂移引起的现场条件。例如,设备老化,引入大量的复杂过程。此外,为了避免影响常规产品,小样本情况总是发生,这进一步橡胶内部混合建模的困难。

在过去的几十年中,许多数据驱动技术。广泛的评论可以在工作中找到Kadlec [2]。在这些方法中,多元静态技术(3- - - - - -6)已被广泛使用。然而,这些算法是相对敏感的测量噪声,通常需要大量的样本构建有前途的软测量。与此同时,各种人工神经网络(ANN)算法(7)已经提出并成功地应用于聚合过程,但是如何有效地构建网络拓扑,仍然是一个悬而未决的问题。为了克服这些缺点,基于内核的方法,如支持向量回归(8),最小二乘支持向量回归(9]。这些内核技术可以实现更好的性能在小样本条件下由于结构风险最小化准则。

注意,所有上述算法离线方法,可以实现一个通用的泛化性能,但缺乏利用实时变化的机制特征如漂流的过程。因此,基于内核的在线建模算法(10- - - - - -13]。然而,太多的标签样品所需的当前批网络构建模型,而在大多数情况下,在工业领域,这些样本还必须预测而不是实验室化验。

因此,在线和离线算法不能有效实现承诺的模式14- - - - - -17]。另一方面,利用信息技术和工业自动化的发展,有很多生产过程历史数据保存在数据库的制造执行系统(18]。利用这些数据,当地学习建模算法(19,20.提出了。然而,这些模型是不稳定由于过时的数据,这将被用于训练。同时,未标记的数据非常丰富,它包含了生产数据没有指数预测。根据semi-supervised学习理论,那些未标记的数据可能用于提高预测模型。因此,如何有效地利用现有的历史和在线生产过程数据创建健壮的软测量模型仍然需要解决。

在我们的工作中,我们探索潜在的混合当地semi-supervised机制利用未标记的和标签数据通过该时间窗口与历史和在线混合样品。增强其可行性,扣除相应的递归计算公式。此外,软传感器使用提出和比较算法实现对其性能进行评估。我们所知,没有这样的混合当地semi-supervised算法提出了迄今为止任何文章。

本文的其余部分组织如下。节2提出SHLKR方法的细节,包括它的递归计算推导。节3橡胶、软测量建模实验内部混合过程使用SHLKR方法与实际工业现场数据和比较算法。最后,在节4总结了本文的主要贡献。

2。材料和方法

思考的地方学习是创建的预测模型用于预测目标未标记的样本而不是构建全局模型使用所有样本。自创建的模型只能预测是必要的,它也被称为“即时学习”或懒惰的学习(21]。理论上它可以更精确的模型条件下,类似的输入导致相似的输出。

基本上,有当地学习造型三个步骤:

(1)类似的样本集的选择:选择类似的历史样本数据基于一个或一些相似度计算算法根据预测样本的特性。(2)当地造型:使用选定的样本构建当地的学习模型和相应的算法。(3)预测:预测和沙漠的预测模型。

显然,当地学习的重点是评估样本的相似性的算法,建立局部模型。目前有两类基于相关性(19和基于距离/角10相似度计算算法。在这个工作中,基于距离的内核是使用,因为简单的算法在工业应用情况下容易被采纳。

有两个主要提到的地方学习算法的缺点:

(1)在许多情况下,在线时间变化和漂移特性不能追踪因为只有相似的历史数据将用于建模。(2)许多未标记的历史和在线样品标签样本间存在有序。理论上这些时序序列数据可以用来改善模型基于流形假设[22),但目前未使用的离开。

为了利用这些闲置的广泛存在的未标记的数据,我们提出递归加权内核回归(RWKR) [23之前,已验证在青霉素生产过程软测量建模。但其行为不承诺对于其他馈料式的流程,如橡胶内部混合,因为它表现更漂流和基于时间的加权机制不工作因为橡胶的门尼粘度不是单调增加青霉素浓度的青霉素发酵过程。因此,本文semi-supervised混合本地内核回归(SHLKR)提出了充分利用标记和未标记的数据选自历史和在线数据。

不同于传统本地内核学习算法:

(1)除了标签样本,结合标签样本,也未标记的样本作为训练SHLKR期间时间窗口。(2)历史数据和在线制造的数据都是在训练使用。根据当前运行的批处理,指数混合训练数据集是由选择相应的历史样本与在线制造的样品,这可能提高实用性和软测量的精度。

2.1。SHLKR流

作为显示在图1时间窗口被定义为运行的标签样本与这是未标记样本序列之间和当前的批处理。通过这种方式,每一个标记的样本与它有关未标记样本是形成一个有序序列,它将完全用于semi-supervised软测量模型。根据廖semi-supervised学习理论的假设24- - - - - -27样本),当地的小空间内的趋势是相似的,未标记的样本数据空间密度更精确地描述样本数据的特点。所以理论上提出semi-supervised数据组合机制可以更有效的模型比只使用软传感器标签样本。

从第一批第一次运行,当前标签样本的数量是0。如果生产过程数据的当前运行只会为造型收集在未来,它将被添加到未标记的样本集吗当前的批处理,否则,因为这个时候只能用于历史数据建模、评估的相似性 , 最相似的历史标签样本与未标记样本在相应的时间内选择windows semi-supervised训练模型。另一方面,如果有标签样本现有的,他们和相关的未标记样本将用于训练,在这种情况下,如果 ,只有在线生产过程数据将被使用,否则,最相似的历史标记样本和对应的未标记样本也将用于训练模型。

2.2。SHLKR递归计算推导

谐波函数适应semi-supervised火车模型。其有效性和递归(之前已经验证23]。尽管训练集的历史数据不能被递归地采用因为他们依赖剩余的在线生产过程数据可以递归地添加,因为它们将用于培训。更大的后就越多,它将减少从递归计算推导。

这里我们指的是朱等人提出的方法。28),正则化框架定义如下:

在哪里是真正的标签样品吗我,可视为样本之间的相似性我和j,因为高斯内核通常用来计算相似度,通常定义为

格拉姆矩阵可以分割成4块标签样品吗l和未标记的样本U:

那么方程解(1)是制定为:

在这里也可以分为四个部分:

在哪里是内核之间的矩阵onlinemanufactural数据和历史数据的时间吗。是它的转置。和是在线的内核矩阵分别制造的数据和历史数据。首先,被认为是如下:

在这里 , 和:

应用Sherman-Morrison-Woodbury公式,然后我们得到:

然后可以递归地计算了吗。

2.3。应用系统

内部混合智能监控系统的产物MESNAC有限公司有限公司,这是广泛应用于许多橡胶工厂在中国。它主要由四个部分组成:内部混合造型,门尼粘度预测,内部混合流程优化和内部混合专家系统。如下图所示2,聪明的内部混合系统是嵌入在制造执行系统,可以监控网络制造的数据和检索历史制造的数据。

2.4。实验数据

授权一个橡胶制品厂,222批次包含19148运行历史样本检索系统。2140人贴上标签,17008分是未标记的这只包含制造的信息没有门尼粘度值。所有样品都从一个橡胶内部混合公式的公式变异的影响。在工业应用环境中,为了获得更好的性能,它还致力于模型软传感器分别根据不同的橡胶内部混合公式。每个样本都包括:

(1)当前运行的指数。(2)密度。(3)硬度。(4)最小转矩。(5)最大扭矩。(6)运行时间达到30%最大扭矩。(7)运行时间达到60%最大扭矩。(8)运行时间增加2单位在达到最低扭矩。

标签样品,所有门尼粘度值手动实验室化验。前10个批次的门尼粘度值在图所示3,未标记的样本的门尼粘度值是0,虚线是用于分离不同的批次。显然,每一批的运行数量变化很多由于其工业制造业的要求和实验室试验执行一般每8分。除此之外,尽管需要由门尼粘度,但事实是它变化很多内部和不同批次之间没有明显的规则。它验证了我们的假设,数据驱动算法的工作在这种情况下火车软传感器。

3所示。结果和讨论

验证SHLKR的性能,支持向量机(SVM)和基于调和函数的软传感器也实现分别进行比较,只有使用标签样本。光滑,所有这三个算法只使用相同的标记样本和未标记的样本各自的标签样品另外SHLKR使用。

作为显示在图4所有三种不同算法的预测结果绘制。最后的结果是27 222批次,以及1777年的19148分,包括1577未标记的运行和200年预测。为了预测这些200个样本,15431年1940标记和未标记的样本用于火车软传感器。

训练的第一步是选择参数。在1.1内核的宽度是由分析交叉验证(29日),从2到20,使用不同的结果如数据所示5(一个)- - - - - -5 (c)。

(一)

(b)

(c)

由于支持向量机无法解决时 ,只有SHLKR和谐波函数结果中显示这些数据。显然,当 ,他们有最好的性能,当他们都表现不稳定他们都糟,但稳定的趋势。这意味着:onlycontrols历史样本的数量而不是在线样本数量,除了样本量太小的条件下,该模型遭受太多的历史样本,以及将会有一个优化现有underfitting之间的权衡和过度拟合。因此,从理论上讲可以自动选择从较小的穿越到更大的。除了算法,也取决于历史数据的规模和种类的噪声和公式。这里的优化值SHLKR,调和函数和支持向量机,也取决于分析交叉验证。

一些研究表明,许多指标都有自己的优点来验证软测量模型。为了充分研究模型性能,3常用的标准:均方根误差(RMSE),相对均方根误差(RE)和平均绝对误差(MAE) [30.采用。所示的数字5(一个)- - - - - -5 (c)和表1- - - - - -4,N_h表示批号,N_p表示运行相应的批处理。在所有算法,支持向量机以来表现最糟糕的调和函数和SHLKR算法都是光滑的假设为基础。利用未标记的样本,SHLKR表现最好,RMSE 2.7%小于SVM, RMSE 1.9%小于调和函数,比其他人小1.5% RE,梅比SVM小美3.9%和1.7%小于谐波函数。


	RMSE	再保险	美

支持向量机	1.772	0.0479		1.363
高频	1.751	0.0473		1.344
SHLKR	1.718	0.0466		1.321


N_h	0	1	2	3	4	5	6	7	8

N_p	43	12	13	17	19	20.	24	25	27

支持向量机	1.621	1.408	1.156	1.286	1.174	2.244	2.251	1.831	1.961

高频	1.616	1.015	1.045	1.538	1.140	2.209	2.313	2.047	2.038

SHLKR	1.701	1.016	1.096	1.523	1.064	2.064	2.115	1.807	2.029


N_h	0	1	2	3	4	5	6	7	8

N_p	43	12	13	17	19	20.	24	25	27

支持向量机	0.046	0.040	0.033	0.043	0.032	0.063	0.062	0.053	0.054

高频	0.044	0.027	0.028	0.042	0.031	0.059	0.061	0.055	0.055

SHLKR	0.047	0.028	0.030	0.041	0.029	0.056	0.056	0.048	0.054


N_h	0	1	2	3	4	5	6	7	8

N_p	43	12	13	17	19	20.	24	25	27

支持向量机	1.253	1.277	0.942	0.937	1.010	1.895	1.643	1.406	1.577

高频	1.299	0.850	0.770	1.126	0.927	1.752	1.592	1.647	1.697

SHLKR	1.360	0.857	0.858	1.093	0.882	1.644	1.453	1.408	1.666

4所示。结论

在本文中,我们提出一种新的semi-supervised混合本地内核回归模型内部橡胶混合软测量建模的处理。有别于传统的监管模式,它利用未标记的样本与标记相关的受益于普遍存在监督数据。和混合动力机制提出有效地利用历史和网络制造的数据来提高其实用性。此外递归公式推导出增强其可行性。与现场数据,软传感器使用提出和比较算法实现做出评估。实验结果表明,它有一个更好的性能比传统的。在未来的工作中,SHLKR将被应用到各种橡胶制造厂和更多的功能将被添加到您的模型中,如生橡胶信息、能源成本每个橡胶内部混合阶段等,这将进一步提高模型的精度。

数据可用性

橡胶混合处理数据用于支持本研究的发现是由Haiqing Yu在许可证,所以不能免费提供。请求访问这些数据应该Haiqing Yu,10130207 @qq.com。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

Haiqing Yu和小君霁同样贡献了这项工作。

资金

这部分工作是由中国国家自然科学(61503208),山东的国家科学基金会(没有。ZR2015PF002)和教育部人文社会科学项目(15 yjc860001)。

引用

p . Freakley和s·帕特尔,”内部混合:流量和温度的实际调查资料在混合循环,”橡胶化学与技术,卷。58岁的没有。4、751 - 773年,1985页。视图:出版商的网站|谷歌学术搜索
p . Kadlec b Gabrys, s . Strandt“数据驱动的软传感器在流程行业,”计算机与化学工程,33卷,不。4、795 - 814年,2009页。视图:出版商的网站|谷歌学术搜索
f p . Facco f . Doplicher Bezzo m·巴罗洛葡萄酒“移动平均线请在线产品质量软测量估计在一批工业聚合过程中,“《过程控制,19卷,不。3、520 - 529年,2009页。视图:出版商的网站|谷歌学术搜索
k金,人类。李,I.-B。李”,一个新颖的基于核偏最小二乘的多元回归方法与正交信号校正”化学计量学和智能实验室系统,卷79,不。1 - 2,比如22 - 30,2005页。视图:出版商的网站|谷歌学术搜索
问:宣,b方,y刘et al .,“自动珍珠分类机基于多流道卷积神经网络,”IEEE工业电子产品,卷65,不。8,6538 - 6547年,2018页。视图:出版商的网站|谷歌学术搜索
y姚明和f·高”,调查多级/批处理过程的多相统计建模方法,”年度审核控制,33卷,不。2、172 - 183年,2009页。视图:出版商的网站|谷歌学术搜索
j·c·b·贡扎加l·a·c·Meleiro c .西藏野驴和球场r·马舍尔更“ANN-based软实时过程监控和控制工业聚合过程中,“计算机与化学工程,33卷,不。1,43-49,2009页。视图:出版商的网站|谷歌学术搜索
v . n . Vapnik统计学习理论的本质施普林格科学与商业媒体,柏林,2013年。
j . a . k . Suykens t . v . Gestel j·d·布拉班特b . d .沼泽和j·范德维尔“最小二乘支持向量机,”国际期刊的电路理论和应用程序,27卷,不。6,605 - 615年,2002页。视图:出版商的网站|谷歌学术搜索
y高,j .霁h . Wang和p·李,“自适应至少贡献消除内核学习橡胶混合软测量建模方法,”IEEE国际智能计算与智能会议系统IEEE,页470 - 474年,厦门,中国,2010。视图:出版商的网站|谷歌学术搜索
”刘y和z高,实时性与概率预测一个工业炼过程整体高斯过程回归模型,”应用聚合物科学杂志》上,卷132,不。6、2015。视图:出版商的网站|谷歌学术搜索
n . y . Liu,李和p h . Wang“软化学分析仪开发使用自适应最小二乘支持向量回归和选择性修剪和变量移动窗口大小,”工业化学与工程化学研究,48卷,不。12日,第5741 - 5731页,2009年。视图:出版商的网站|谷歌学术搜索
f p h . Wang Li高,z的歌,和s . x叮”内核与自适应分类器结构和固定内存诊断过程,”AIChE杂志,52卷,不。10日,3515 - 3531年,2006页。视图:出版商的网站|谷歌学术搜索
c . y . Liu Yang,高z和y姚明,“合奏深层内核学习与应用程序在工业聚合过程质量预测,“化学计量学与智能实验室系统卷。174年,15至21,2018页。视图:出版商的网站|谷歌学术搜索
宣,y, z . Chen黄h . g .包,和d·张,“多视图生成对抗网络及其应用在珍珠分类,“IEEE工业电子产品,卷66,不。10日,8244 - 8252年,2019页。视图:出版商的网站|谷歌学术搜索
y, y风扇,j·陈,“燃烧火焰图像氧含量预测系统使用DBN,”能源和燃料没有,卷。31日。8,8776 - 8783年,2017页。视图:出版商的网站|谷歌学术搜索
l·w·郑高x, y . Liu, j .杨和z高,“工业门尼粘度预测使用快速semi-supervised实证模型,”化学计量学和智能实验室系统卷,171年,第92 - 86页,2017年。视图:出版商的网站|谷歌学术搜索
陈t . y . Liu, j·陈,“自动开关高斯过程回归概率软传感器的工业多品位的过程转变,”工业化学与工程化学研究,54卷,不。18日,第5047 - 5037页,2015年。视图:出版商的网站|谷歌学术搜索
k .藤原m·卡诺美国周年,a . Takinami”使用correlation-based即时建模、土木工程的开发”AIChE杂志,55卷,不。7,1754 - 1765年,2010页。视图:出版商的网站|谷歌学术搜索
y, z高,p, h·王,“实时内核学习自适应参数选择软测量建模的批处理过程,”工业化学与工程化学研究,51卷,不。11日,第4327 - 4313页,2012年。视图:出版商的网站|谷歌学术搜索
郑z和g . i .韦伯“懒惰学习贝叶斯规则,”机器学习第41卷。。1,53 - 84年,2000页。视图:出版商的网站|谷歌学术搜索
m·贝尔金p .他诉Sindhwani, p . Bartlett”廖正规化:几何框架从例子,学习”机器学习研究杂志》上,7卷,不。1,第2434 - 2399页,2006。视图:谷歌学术搜索
k . j .霁h . Wang Chen y . Liu n . Zhang和j .严“递归加权内核回归semi-supervised馈料式的软测量建模过程,”台湾化学工程师学会杂志》上,43卷,不。1,第76 - 67页,2012。视图:出版商的网站|谷歌学术搜索
朱x和a·b·戈德堡”semi-supervised概论学习”,综合课程人工智能和机器学习,3卷,不。1,130页,2009。视图:出版商的网站|谷歌学术搜索
w .郑,刘y, z高,j .杨“即时semi-supervised质量软测量预测工业橡胶混炼机,”化学计量学和智能实验室系统卷。180年,36-41,2018页。视图:出版商的网站|谷歌学术搜索
y刘和j·陈,“集成软传感器使用即时支持向量回归函数和多级过程质量预测的概率分析,“《过程控制,23卷,不。6,793 - 804年,2013页。视图:出版商的网站|谷歌学术搜索
问:吴y, y . Liu和j·陈,“主动选择信息数据的连续质量改进的软测量模型与潜变量,“工业化学与工程化学研究卷,56号16,4804 - 4817年,2017页。视图:出版商的网站|谷歌学术搜索
朱x, j·拉弗蒂,r·罗森菲尔德Semi-Supervised学习与图、卡内基梅隆大学语言技术研究所计算机科学学院,匹兹堡,宾夕法尼亚州,美国,2005年。
k . Tuda g . Ratsch米卡,和k·r·穆勒”学习分类器预测内核的分析误差,”国际会议上人工神经网络施普林格,页331 - 338年,柏林,2001年。视图:出版商的网站|谷歌学术搜索
c·j·威尔默特和k .松”优势的平均绝对误差(MAE)的均方根误差(RMSE)在评估平均模型的性能,”气候研究,30卷,不。1,第82 - 79页,2005。视图:出版商的网站|谷歌学术搜索

聚合物技术的进步

机器学习先进聚合物的制造、加工和测试

文摘