文摘

高炉的检测周期数据的不一致和关键参数的大延时使铁水硅含量的预测面临着巨大的挑战。针对铁水硅含量的问题不符合检测的时间系列的多个控制参数三次样条插值拟合模型被用来实现数据集成的多个检测时间。大型高炉炼铁过程的时间延迟进行了分析。此外,斯皮尔曼分析结合加权移动平均法预测优化硅的数据集内容。针对问题的普通神经网络模型的预测精度较低,使用遗传算法优化参数对BP神经网络模型来提高模型的收敛速度,实现全局优化。结合铁水硅含量的自相关分析,修改模型的预测铁水硅含量误差分析的基础上提出了进一步提高预测的准确性。模型全面考虑问题,如数据检测不一致,大时间延迟和预测结果的不准确。它的平均绝对误差为0.05009,可用于实际生产。

1。介绍

在钢铁生产过程中,高炉提供优质铁水炼钢通过复杂的过程,如离散,连续冶炼、和离散输出。熔炼过程的控制参数超过100,高非线性的特点,随机性很大的时间差,所以控制炉温的稳定状态的关键之一是确保高炉炼铁的顺利进行1- - - - - -4]。由于复杂的高炉内部环境和各种物理和化学因素的干扰,很难准确地监控炉温。生产实践表明,铁水硅含量有很强的相关性与高炉的温度,它可以用来间接反映炉的温度变化(5- - - - - -8]。

近年来,许多研究人员已经研究了铁水硅含量的预测。刘等人这三个模型的预测效果相比,包括随机森林、演算法、决策树。他们发现演算法模型有更好的预测效度,但模型过于敏感异常样本(9]。黄等人改善铁水硅含量的预测的准确性结合主成分分析和极端学习机和优化权重和阈值使用粒子群优化算法。但是他们没有考虑冶炼过程的大时滞(10]。李等人派生铁水硅含量的计算公式,通过分析数据,高炉煤气和渣铁温度,并把它与实际结果。然而,模型的智能应用程序(11]。虽然李等人LSTM-RNN铁水硅含量的预测模型,请和RNN模型相比,该模型的数据处理和分析很少进行(12]。随着大数据的时代,数据驱动的方法吸引了广泛关注。受等因素影响现有检测技术的准确性和复杂的高炉操作条件,数据驱动方法的使用需要考虑的完整性和波动性,以及数据的时滞特性(13- - - - - -16]。因此,它是非常重要的选择一个合适的数学模型数据中挖掘有用的信息。

由于上述原因,bp神经网络优化的遗传算法(GA-BPNN)铁水硅含量误差修正预测模型提出了基于数据优化。为了达到准确预测铁水硅含量的高炉的复杂环境中,多个控制参数,如煤炭注入率、热空气压力、热空气温度,空气渗透性和富氧流量,应该充分利用作为输入(17,18]。然而,多个数据输入是伴随着不一致的数据检测和大时间滞后的关键参数,因此有必要优化和集成数据(19]。也就是说,通过分析趋势和相关的数据,数据集,有利于后续的预测铁水硅含量的提取,数据优化。高炉数据的非线性及高维特征(20.)要求模型具有良好的非线性映射能力和自适应能力。预测模型的准确性的铁水硅含量可以进一步提高了结合强大的时间序列的特征的铁水硅含量21]。

2。该模型

2.1。数据预处理

消除异常值:3σ标准是用来消除异常值在高炉样本集。假设样本集X= { ,…, },值之差的绝对值 和平均值 大于3σ,它将被视为局外人和消除22,23]。的计算公式σ

在这里, 是平均值。

的数据分布显示了铁水硅含量的箱线图的方法,如图1。可以看出,铁水的硅含量主要是集中在0.5。

标准化:高炉炼铁过程中,数据方面有很大的不同。例如,高炉透气性指数之间的范围[100],和冷气流参数的范围(1800、2300)。很明显不合理将直接应用于铁水硅含量的预测,使得各种数据对预测结果有很大的影响。对于后续的模型预测的准确性,数据归一化法是用来控制喷煤量等控制参数的范围与风压[0,1]。计算公式是

2.2。三次样条插值

在钢高炉的操作数据集从5月到8月,每个数据变量的检测时间和频率有很大的不同。例如,检测时间间隔的控制变量,如透气性和富氧流量是1小时,而铁水和渣约1.33小时。为了预测铁水硅含量通常,多项式拟合,高斯曲线拟合和三次样条插值拟合方法,介绍了减少的维数不同的控制参数24]。以富氧率为例,每天24探测值替换成三个拟合函数作为输入样本得到拟合函数和曲线,它反映的富氧率的变化趋势。通过平滑曲线,拟合数据的富氧率每一刻。根据铁水硅含量的采样时间,18点在曲线上选择作为输出,如图2

高斯曲线和多项式拟合关注描述富氧的总体趋势但不需要通过采样点的曲线25]。可以看出拟合的效果比较的算法如图2三次样条插值方法能够更好地反映的周期性变化的富氧率一天当采样点少。因此,在本文中,使用三次样条插值方法来补充和整合数据,也就是说,曲线拟合进行有限数量的采样点。相应的值Y设在曲线的获得在一个较小的时间间隔,这是用作后续预测数据集的铁水硅含量。

2.3。分析的数据延迟基于斯皮尔曼和加权移动平均的组合

由于大型高炉炼铁过程的时滞,很难准确获得控制参数的影响,如大量喷吹煤粉和空气压力在不同时期铁水硅含量(26,27]。斯皮尔曼相关系数分析一个算法来判断数据的程度协会和它的值范围是[−1,1]。系数的绝对值越大,两个属性之间的相关性就越高。斯皮尔曼相关分析是用来分析不同控制参数的时间序列和铁水硅含量,这将更好地反映高炉样本数据的实时变化。斯皮尔曼相关系数的计算公式 在哪里 控制参数的th; 硅的内容吗th炉;和 控制参数的平均值,铁水硅含量,分别。

3展示了一些控制参数之间的相关分析和铁水硅含量在不同的时间延迟。可以看出,喷吹煤粉和空气渗透率的数量与铁水硅含量最大的相关性在0时间延迟。热空气温度和炉最高温度的相关性最大的铁水硅含量在3时间延迟。寒冷的空气压力最大关联与铁水硅含量4时间延迟。通过这种方式,所有控制参数的相关系数和铁水硅含量。

1显示了一些控制参数的相关系数和铁水硅含量在不同滞后熔炉。然后,分析了高炉样本集通过组合多个时间序列和斯皮尔曼的分析方法,以及多个控制参数之间的关系数据和铁水硅含量是安装。各种控制参数的影响在铁水中的硅含量是连续的,模拟高炉的内部反应条件尽可能多,本文采用加权移动平均法(WMA)调整数据28]。假设控制参数 ,然后加权移动平均公式(方程(4)) 在哪里 控制参数的加权移动平均线吗 在时间t, 控制参数的真正价值在时间吗t, 斯皮尔曼相关系数在时间延迟吗, n重量(的价值n需要根据根据斯皮尔曼相关系数)。

如表所示1斯皮尔曼相关系数的计算多个控制参数和不同的时间延迟。炉顶温度作为一个例子,斯皮尔曼相关系数的绝对值炉顶温度按顺序排序,和最优炉屋顶温度阈值0.0632是通过多个实验。也就是0∼2延时炉最高温度数据选择的重量加权移动平均法。以同样的方式,设定合理的阈值基于权重的数量是3的原理和计算其他控制参数的权重。然后代入公式(4)获得铁水硅含量的预测数据集基于时滞分析。

2.4。反向传播神经网络

摘要利用反向传播神经网络是一种多层前馈网络(29日),其结构如图4。在这里, 输入的值吗n高炉控制参数, 铁水硅含量的输入值。 隐藏层和输出层的重量, 分别隐藏层和输出层阈值。其节点元素特征(传递函数)是乙状结肠类型(30.]。

摘要利用更新的参数通过广义感知器,和重量和阈值的调整公式表示如下:

2.5。遗传算法

摘要算法采用梯度下降方法修改权重和阈值,它有一个积累的经验和不足有一定的缺陷。这些缺陷具体表现如下:(1)学习效率低,收敛速度慢(2)很容易陷入局部最小值的状态

解决上面的问题,介绍了遗传算法(GA)优化参数,提高收敛速度,实现全局优化(31日,32]。遗传算法的基本步骤如下:(1)确定实数编码的数量根据权重和阈值的摘要,和随机生成初始种群。(2)为了实现全局优化神经网络训练的错误。摘要利用预测误差的绝对值作为健身F,个体编码转化为决策变量的问题空间。适应度函数如下: 在这里, 是硅的真实值和预测值的内容吗th铁水,分别k是系数。(3)采用轮盘赌法,根据个人健身的大小, 概率选择一些人的更大的健身人口形成交配池。公式如下: 在哪里N是人口的数量, 健身的吗th个人,k是系数。(4)使用交叉和变异操作来更新交配池。交叉操作采用实数交叉方法。公式如下: 在哪里b一个随机数在区间[0,1]。(5)重复步骤(2)-(4),直到满足收敛性判断。

总之,GA-BPNN模型构造。流程图如图5

2.6。模型预测和误差分析

基于传统的摘要利用预测模型,使用遗传算法优化参数得到初步预测铁水硅含量的结果。然而,摘要模型优化的遗传算法有很大误差的铁水硅含量。误差分析如图6。可以看出,误差曲线几乎一样的铁水硅含量的变化趋势,所以推断是错误的形成与铁水硅含量的时间序列。为了进一步提高预测精度,自相关分析的时间序列进行铁水硅含量。自相关系数作为重量,近3炉的实际价值是输入,初始预测误差是输出,误差分析模型建立。误差分析的预测功能也由GA-BPNN实现算法(这里不包括细节)。训练集和测试集划分优化预测模型的参数错误。当预测精度稳定,预测误差值添加到初步预测价值的铁水硅含量的下一批得到修改后的铁水硅含量的预测价值。总之,GA-BPNN热金属硅含量的误差修正预测模型基于数据优化如图7

3所示。结果分析

3.1。模型的初步预测

为了消除每组数据的维数,进行去噪和归一化处理为选定的预测铁水硅含量的样本。三次样条插值拟合模型用于实现多个检测周期的数据集成。斯皮尔曼分析和加权移动平均法结合分析集成数据的时间间隔,以获得新的数据集对应于控制参数和铁水硅含量。摘要利用改进的遗传算法用于预测。选择1500预处理高炉样本,其中1000被用作训练集和500作为测试集进行模型训练。由于大量数据训练集,它不利于模型调优,所以交叉验证方法用于训练模型。设置参数k= 20,将训练集划分为20的部分。然后分别做出初步的预测,可以通过以下公式表示:

在这里, 代表了控制参数集用于培训(所有四个步骤的预测)。

在这里, 代表了训练集用于标签预测。

在这里, 代表了控制参数设置用于测试(所有四个步骤的预测)。

在这里, 代表了用于测试集标签预测。

8显示了比较的初步预测结果和实际值400炉。可以看出,基于遗传算法的改进的摘要模型已基本实现铁水硅含量的预测,但仍然需要提高准确率。

3.2。误差分析

分析铁水硅含量的时间序列的自相关系数并获得硅内容如图9。的X设在代表熔炉的数量,Y设在代表硅含量的自相关系数。可以看出,最大的熔炉的相关性n熔炉是n−1n−2,n−3炉,他们显示一个下降的趋势。如表所示2,将阈值设置为0.2,选择第一个n−1n−2,nreprediction−3炉数据作为输入错误。(图获得的错误预测(10))。摘要利用遗传算法通过误差分析模型修正得到修正的预测价值和比较它与直接的初步预测结果摘要。

3.3。模型评价

错误的预报值添加到初步预测铁水硅含量的结果得到修改后的铁水硅含量的预测价值。预测结果之前和之后的对比校正图所示11。可以看出,预报值修正的误差分析更接近于真实值。为了定量分析预测精度校正前后的变化,介绍了三个评价指标分析模型错误。他们是均方根误差(RMSE),平均绝对误差(MAE)、平均绝对百分误差(日军)。从表可以看出3GA-BPNN模式提出了明显小于普通摘要模型在所有三个预测错误,和GA-BPNN模型基于误差修正达到最好的预测效果。

4所示。结论

铁水硅含量的预测起着至关重要的作用在温度控制和高炉的正常运行。三次样条插值拟合相结合的方法,斯皮尔曼分析,分别提出了加权移动平均法来优化数据。基于BP神经网络模型,使用遗传算法优化参数来提高模型的收敛速度,实现全局优化。结合自相关分析铁水硅含量的校正模型的预测铁水硅含量误差分析的基础上提出了进一步提高预测模型的准确性。

结果表明,预测的平均绝对误差修正模型基于数据优化的铁水硅含量为0.05009,大大提高了预测精度与误差校正。

该模型充分利用有限的数据集的价值和具有较强的可移植性。在随后的发展,模型的预测精度可以进一步提高通过两步和3步误差分析。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作得到了国家自然科学基金(批准号5207041692)和河北杰出青年基金项目(批准号E2020209082)。