文摘

快速和可靠的最优控制注塑机器(imm)有效的射出成型产品的生产是至关重要的,特别是在受限制的计算机资源的情况imm的嵌入式设备。在本文中,一个最优跟踪注射速度控制问题产生在一个典型的IMM进行了研究。一个有效的混合智能控制方法减少计算资源实时实现基于深度学习(DL)方法模拟经典模型预测控制规则是开发处理的跟踪控制注射速度。该方法利用封闭的复发性单元神经网络学习和预测最优控制过程方面的时间序列数据由传统的模型预测控制器。这种方法的好处在传统优化方法通过仿真结果说明,这表明收敛DL-based控制器可以有效地避免复杂计算imm的控制过程和满足更健壮性和抵抗环境不确定性的需求一定程度和可能实现的嵌入式硬件更加高效和方便与更小的内存占用和更快的计算时间。

1。介绍

塑料制品已经成为所有工业和日常生活中不可分割的元素在世界各地因其出色的灵活性、耐久性好、低成本等优点[1]。在离散制造业领域,imm专业操作设备用于生产塑料零件和其他聚合物。近70%的塑料制品是由imm,已成为一个重要的航空航天领域,国防、电子和光电通信。他们提供重要的设备支持航空航天等高端制造业,电力电子,清洁能源,芯片生产。

imm的注塑过程是一个复杂的技术,使树脂材料加工成塑料制品。在这个过程中,imm的参数设置是非常重要的,与最终产品密切相关。任何不当的参数的变化会影响最终产品的质量和生产各种缺陷(1- - - - - -3]。注塑过程一般包括六个阶段:模具夹紧,注入,保持压力,塑化、制冷和模具。注射成型是一个循环过程,每个过程包含最重要的阶段。一个典型的IMM的简化结构如图1。塑料颗粒被送入IMM通过料斗和融化的摩擦加热通过加热带桶。当熔融树脂均匀加热到适当的温度和注射填充材料区域单位,可以开始注入和填充。伺服阀使往复式螺杆注射筒迅速行动,允许树脂材料通过喷嘴注入封闭的金属模具。然后保持恒定的压力,螺杆和熔融树脂注入模具树脂留下的缺口的冷却和收缩。当树脂冷却并完全凝固,螺杆上的压力了。组件被释放从模具上的推动demolding机制和落入收集盒模具一旦打开。这个过程不仅是一个循环过程也是一个复杂的参数变化过程。射出成型零件的生产过程,如何实现精确控制的系统变量在每个生产阶段是一个重要的先决条件,以确保产品质量。在不同的阶段,也有不同的IMM的参数要求。 As the high-end manufacturing industry puts forward higher and higher requirements for the quality of plastic products, the traditional IMM control technology is gradually unable to meet the requirements in terms of accuracy and efficiency, especially the traditional PID-based control strategies, which have high requirements on the technology of the engineers, and is not easy to resolve problems in production as quickly as possible.

近年来,有很多相关研究控制技术领域的注塑工艺(3- - - - - -12]。例如,棕褐色等人提出了一个自适应控制方法控制注射速度变化在整个注塑过程(4]。策略显示出更好的性能比传统的PID控制策略,可以自适应地调整数学模型处理参数变化速度的突然变化。高等人提出了一种迭代学习控制理论基础健壮的IMM方法与完美的性能对系统未知的起始和干扰5]。Hopmann等人提出了一种迭代学习控制系统的跟踪参考腔压力可以提高在几个周期和循环障碍可以自动纠正进一步提高组件质量(7]。随着越来越多的相关研究的发展,MPC-based方法也被广泛用于注塑过程控制(13- - - - - -19]。杜贝使用货币政策委员会自优化策略来控制注塑的融化温度(17]。此外,Reiter等人提出了一个基于IMM MPC-based控制方法物理灰箱模型,实现IMM的空腔压力控制(18]。Hopmann等人提出了一个基于MPC策略自优化注塑工艺控制腔压力的IMM和工艺参数的自适应调整19]。MPC是一项成熟的技术,已成为实现约束的标准方法,多变量控制过程中行业今天20.]。然而,仍存在一些问题,限制MPC的应用,特别是在复杂系统的实时控制。在实际控制过程中,由于复杂的模型或复杂的约束,MPC的计算有时是耗费时间,很难实现实时控制和设备有很高的要求。MPC为IMM系统实现机载处理能力有限,高采样率,和强劲的动力仍然是一个艰巨的任务(21),尤其是在IMM设备相关的嵌入式设备。

快速增长的人工智能理论深度学习(DL)和机器学习等(ML) [22- - - - - -33),深层神经网络(款)显示伟大的能力在各个领域34- - - - - -37]。除了计算机视觉和自然语言处理、DL在控制领域已经广泛应用,尤其在高控制精度的领域,出现了一些很棒的结果通过DL和控制方法的结合23,25,30.,31日,38]。款强大的学习能力往往可以复制复杂的控制过程,简化控制理论的应用,使它能够快速部署在复杂模型。现有研究表明,DL具有更好的影响预测控制的有效表示和近似法(39- - - - - -41]。在本文中,我们研究如何结合与传统MPC DL生产高性能预测控制器设计简单,更多的时间效率,同时提供约束满足的概念,以确保安全。主要目的是为了克服传统MPC的缺点在解决效率和充分利用深度学习网络的优势,实现数据驱动的实时最优控制器的设计。为此,我们提出一个DL-based预测控制器可以应用于最优速度曲线在典型的IMM系统跟踪控制问题。封闭的复发性单元(格勒乌)网络设计研究的预测控制过程控制器,以便替换原来的模型预测控制器,避免复杂的计算和节省运行时间带来的传统的优化过程。GRU-based构造神经网络模块可以扮演相同的角色与原始MPC控制器通过学习大量的时间序列数据,允许格勒乌神经网络模块遵循目标输出的变化并进行最优控制。此外,计算时间长造成的问题重复递归计算和原始模型预测控制滚动优化可以有效地避免使用格勒乌网络模块,允许实时最优控制注塑机器的各种跟踪输出目标。实验结果还表明,我们设计的DL-based预测控制器能够准确近似小内存占用的控制律,非常简单的实现,和较低的计算复杂度。在注塑领域,尤其是IMM领域的控制,这种策略可以快速部署嵌入式控制器的IMM没有设备硬件性能要求高,具有良好的应用前景。

本文的其余部分组织如下。节2介绍的问题描述和约束IMM的注射速度控制。节3,我们提出一个DL-based MPC的注塑速度控制。节4,数值实验结果验证该方法的可行性。最后,我们得出本文的部分5

2。问题公式化

本节主要是简要介绍数学模型的内存速度,初始状态,IMM的约束和成本函数。我们制定控制任务的内存速度作为一个动态的最优控制问题。

2.1。数学建模

作为一个复杂的控制过程、树脂温度、空腔压力、速度和ram是关键过程控制参数密切相关塑料制品的最终质量(42]。因此,许多数学模型描述这些参数的变化也被提出和重要的研究方向之一是速度控制。在这个过程中,熔融塑料,注入模具型腔以一定速度控制信号的驱动。螺杆速度控制是一个过程,随着时间的变化,和注射速度剖面有几个区域,如图2。在不同的区域,ram的速度需要达到相应的值以确保零件符合生产要求(43]。当速度曲线设置不合理,可能会造成塑料部件的缺陷。

因为注射速度的价值需要与参考轨迹的变化,改变控制器的控制精度要求更高。在本文中,我们采用以下四阶传递函数模型(44)作为我们的控制模型,给出了相关的阀门开度注射活塞速度: 在哪里 , , , , 配置参数,可以根据不同的IMM系统设置。通过改变上面的传递函数和状态方程离散化与零级保护方法,IMM研究系统的动态模型可以表示成离散状态方程如下: 在哪里 , , , 内存速度模型的参数矩阵的IMM。 状态向量, IMM注入速度测量的传感器, 是控制变量与输入信号成比例伺服阀, 是一个不相关的随机序列代表过程噪音,然后呢 是控制时间。在这篇文章中, 与零均值高斯噪声序列和随机方差的范围 在实践中为IMM,未来噪音难以预测;因此,我们采取以下离散时间模型为控制对象: 在哪里 介绍了描述模型错误在时间范围 是卡尔曼滤波增益。在采样时间 ,我们把错误 显示在[13),如果数学模型是稳定的,观察者 可以被视为 模型的控制目标是计算一个控制轨迹 以便控制内存的速度 之前预定的轨迹 尽可能多的和它们之间的误差最小化。

2.2。初始状态和约束

在实际控制过程中,初始状态的注塑通常是略有不同的。这些差异是由于外部干扰或噪音。为了简化计算,我们假设没有噪音在系统的工作原理。在开始时候IMM的初始状态 表示如下: 所有的初始值在哪里 设置为0。IMM,内存速度 和控制变量 受限于机器。由于实际的物理限制, 在方程(2)和(3)应满足以下约束约束: 在哪里 给定的最大速度常数的ram和控制变量。在注塑过程中, 需要满足上述约束和改变在这个区间。通过结合数学模型(3)和约束(5),然后,我们可以应用MPC方法在IMM内存速度控制。

2.3。目标指数

在本文中,我们的主要目标是控制内存的速度IMM系统尽快收敛到指定的目标价值。在这项工作中,我们定义以下客观指标作为控制目标: 在哪里 , , 是参考跟踪输出,输出的植物,和控制输入增量离散时间 ,分别。控制输入增量满足 的权重矩阵 , 的权重矩阵 动态模型的精确控制最终可以达到通过最小化损失函数的值(8),ram速度 也可以快速收敛于目标速度

3所示。基于深度学习预测控制

在本节中,我们将介绍我们提出的控制策略在三个部分:模型预测控制、数据集建设、和深度学习架构设计和优化。首先,我们将介绍如何使用货币政策委员会来解决速度控制问题。第二,我们将介绍我们的设计理念的DL网络和优化策略。最后,我们将介绍如何构建一个MPC-based数据集和连接上述两部分形成一个封闭的循环。

3.1。模型预测控制

货币政策委员会是一个动态的优化方法确定最优控制输入和输出轨迹。预测的最优矢量可以通过求解优化问题的预测和控制时间域周期性的方式。QP问题是一个受欢迎的MPC标准类型。在图3,我们说明了控制过程的原理基于MPC的IMM的策略。通过输入给定的参考价值 MPC控制器,控制器优化最优控制的计算值 在下一时刻结合当前状态变量。线性MPC的关键思想是预测的轨迹参数在预测地平线的结合当前状态向量和数学模型。基于MPC,动态模型(3)可以新配方如下: 在哪里 表示预测地平线 表示控制地平线。

结合上述公式,我们可以得到下列约束最优控制问题的ram imm的速度控制如下:

MPC-based控制序列 在预测地平线可以通过解决QP问题解决的优化问题。

尽管MPC与传统控制方法相比有许多优点,如控制精度更高、更快的响应速度,和更好的控制效果,基于大量的优化计算,为工业控制过程变得越来越复杂,模型用于MPC的复杂性也越来越高,这无疑增加了控制过程的计算负担。这个问题尤其明显的低计算性能设备等嵌入式设备。大量的矩阵运算和内存使用MPC计算过程中无法承受的地步,嵌入式设备广泛应用于工业,所以实时控制很难保证。可以有效地克服这个困难深度学习的进步。DL-based MPC控制器可以大大减少计算资源的消耗,同时实现货币政策委员会控制功能,实现实时控制,同时保证了控制精度和鲁棒性。解决这个问题在注塑预测控制过程,我们提出一个DL-based MPC方法实现实时快速控制内存的速度。

3.2。深度学习

DL是更广泛的一个子集类的机器学习技术,可以用来有效地代表高度不同功能和帮助从数据中提取抽象的非线性特性。近年来它已经得到普及,因为它的成功解决以前无法解决的困难问题在人工智能领域(34,36,45,46]。许多令人印象深刻的应用程序已经使用DL架构如卷积神经网络、深层信念网络,深入强化学习有监督和无监督学习。使用DL多层深的功能架构、大标签数据集可以学习和评估。款许多非线性隐藏层单元和一个输出层现在可以教更多的成功由于机器学习技术和计算机技术的进步。

在这篇文章中,我们将DL技术与传统的MPC生产高性能的预测控制器设计简单和时间效率,同时提供约束满足的概念,以确保安全。我们构建一个格勒乌神经网络学习的最佳时间序列由传统的模型预测控制器产生控制过程数据并替换原来的模型预测控制器,避免了复杂的计算与传统的优化过程和缩短计算时间的优化解决方案。注射成型机的实时在线控制从而实现,基于保证稳定性、鲁棒性和实时。

3.3。基于深度学习架构设计和优化

在本节中,我们现在提出一个DL-based架构设计框架和详细调查各种网络配置的影响。我们提出的总体流程图DL-based IMM的MPC控制策略如图4,主要由两部分组成:离线控制器设计和培训,在线控制器验证和应用。前者主要是由四个部分组成。我们首先选择控制模型,设计的MPC控制器的数学模型,实现闭环MPC控制过程模拟根据MPC控制理论。在仿真的过程中,控制过程的状态向量被收集和离线数据集形成,用于后续的培训和调优的控制器。后者是训练控制器应用于模型来验证并分析其性能。与MPC控制器相比,DL-based控制器结构简单。预测结果可以通过网络的正向计算在控制过程中,避免单调乏味的优化计算。

DL-based MPC战略的框架中,将要设计最重要的部分是DL学习神经网络控制器。为此,我们构建一个GRU-based神经网络学习的最佳时间序列控制过程数据由传统的模型预测控制器。格勒乌的DL-based架构设计主要由模块,sequence-to-sequence (Seq2Seq)模块,和关注模块,如图5。模块包括编码器和译码器部分,负责数据采集和预测输出,分别。显示在[47- - - - - -49],Seq2Seq架构学会变长编码序列和解码固定长度的向量表示成固定长度的向量表示回变长序列。在深度学习,特别是在自然语言处理、Seq2Seq网络通常用来解决机器翻译等任务。此外,Seq2Seq表现良好的结构等解决问题的时间序列预测(45)和序列轨迹预测(50]。这种结构使我们能够预测未来的变化模式,结合来自多个过去的数据采样时间。

encoder-decoder学习结构由格勒乌是一个流行的方案学习序列数据的依赖性特征。格勒乌是一个LSTM变体与控制单元控制信息流动单元内部但没有离散记忆细胞。的学习和大量的时间序列数据集数据、时间序列神经网络如RNN和LSTM经常有性能优良51,52]。LSTM相比,格勒乌包含更少的计算,使控制器更容易实现实时控制。他门格勒乌由一个更新 和一个重置门 : 在哪里 的激活是格勒乌单位时间吗 , 是候选人的激活, 以聪明元素的乘法, 是一个物流乙状结肠函数。 , , , , , 是格勒乌参数都是在每个训练步骤更新和存储。计算当前输出 和下一个激活 ,格勒乌单位使用以前的激活 和当前状态 为了避免消失的渐变,更新门 确定频率单位改变其激活或内容。重设门 部队单位读第一个符号的输入序列,从而消除先前计算的状态。

在我们的实验中,网络的输入设置的总数 ,包括向量 过去的6个采样时间,开始和结束的标志。格勒乌网络预测控制的输出计算结果,这关系到下一步的控制输入。为提高网络的性能,注意模块添加到Seq2Seq模型。模块可以帮助网络更加关注网络中重要的信息输入,从而提高网络的预测精度。注意机制的数学公式可以作为制定 在哪里 是预测输出和编码器的隐藏状态,分别。 是权重矩阵可以被视为多个单层神经网络。

均方误差(MSE)选为格勒乌神经网络的损失函数,及其数学公式如下: 在哪里 在每个培训时代表明批量大小, 是网络的预测控制, 是真正的最优控制根据IMM MPC获得的控制输入。网络结构的深度成正比,网络的训练速度。虽然一个更深层次的网络结构可以产生更高的收敛结果,培训和向前计算所需的时间增加比例和肤浅的网络性能变差。编码器是6隐藏层的架构和译码器是3隐藏层。解码器是紧随其后的是一个单层神经网络输出预测结果。

3.4。建设数据集

设计神经网络的学习之后,我们需要考虑如何构建一个高效的训练数据集和测试我们的设计DL-based控制网络。在DL,训练神经网络主要依赖于大量的数据。DL和培训网络控制器设计之前,我们首先需要收集数据并覆盖整个内存速度和动力学过程应该考虑。有一个潜在的数据和数据之间的相关性在注塑过程中不同采样时间。在实践中,我们获得的数据通过收集器是时间序列数据,其中包含不同参数之间的数学关系。通过评估收集数据并确定输入和输出之间的内部关系变化随着时间的推移,我们可以开发一个模型的学习和预测未来值时间序列。

为了有效地培养DL-based MPC控制器设计,我们得到的数据从360年截然不同的运行,每个持续1秒,包括200步,导致72000年的数据对。所有运行在相同的初始条件,但不同的参考输出 和高斯噪声 每个数据包括状态向量 ,输出向量 ,参考输出向量 ,和预测控制输入向量 在采样时间 混合方法应该能够训练计划网络遵循MPC生成的控制规则,达到所需的最终预测价值,我们希望。递归的在线计算方法不再需要一旦我们训练足够数量的各种指导任务的格勒乌,与优化阶段由GRU-trained控制器所取代。

此外,为了使网络训练收敛于一个稳定值更快和避免坏的局部最优解在培训过程中,我们进行min-max正常化(12)技术对收集到的数据如下:

min-max正常化可以压缩原始数据的维数在0和1之间,从而提高数据的可识别性和提高网络的预测精度。图中可以看到6各种未经处理的数据的分布是不同的,数据大小的范围并不是集中,所以培训过程网络将更倾向于符合参数在较大的值。min-max规范化提供的数据预处理方法可以解决这个问题。图7显示了网络训练的结果使用原始和min-max数据。实验结果表明,该方法可以使网络更快地收敛于稳定。

4所示。数值实验

仿真和实验结果报道在这部分来验证我们的建议DL-based控制方法的有效性。使用MATLAB / PyTorch系统模拟运行,这是由英特尔酷睿i7 - 8700处理器和16 GB的RAM。我们用90%的收集的数据集进行训练,剩下的10%作为验证集,在我们的实验中,编码器和译码器是由6格勒乌单位和3格勒乌单位,分别的隐藏状态seq2seq 5维度。学习速率和批量大小 和64年,分别。亚当算法用于神经网络的优化,而ReLU函数作为激活函数。在图8,我们将展示ReLU的影响,乙状结肠,棕褐色h网络结构的功能。结果表明,ReLU-based网络收敛速度比其他常用的激活函数。图9显示了网络的训练和评估错误100年时代,以及它们之间的误差非常小,不会出现过度拟合。最低的网络参数MSE在训练和验证将保存最好的一次每一轮的培训完成,相比之前的结果。表1显示了训练后100时代的最好的结果。培训和验证MSE的最后训练网络基本上是相同的和不足

在我们的实验模拟,获得不同的方法的仿真运行过程在相同条件下利用不同的控制器来控制IMM模型。为了进一步比较不同控制器的性能,我们还设计了注射成型模拟的基础上,广泛采用PID控制器。图8显示了200步的结果使用MPC控制器,提出DL-based控制器和PID控制器。如图10,图10 ()模型预测输入的轨迹吗 计算了MPC、DL-based控制器和PID控制器和数字10 (b)是噪音的轨迹 ,参考 ,和植物输出 对应不同的控制器 当噪声 是0,DL-based控制器完美再现了MPC控制器和pid控制器的控制过程。为进一步比较,我们还生成两组数据运行结果10 (c)- - - - - -10 (f)不同噪声条件下,具有相同的条件但是不同的噪声方差 DL-based提出的结果表明,该控制器可以实现类似的性能比货币政策委员会在每个样本时间和PID控制器。内存的速度 网络和MPC技术下曲线几乎是相同的,这意味着当参考 变化,格勒乌网络做出最好的决定。即使在与PID方法的比较,深刻的学习方法仍然显示了相同或更好的性能比PID。此外,该方法不需要调整控制参数。即使在外部干扰的存在,DL-based MPC控制器仍能跟踪参考,这样的效果基本上是一样的MPC控制器。然而,MPC策略,我们使用的限制,当引用内存速度达到最大值与噪声、控制曲线波动极大地为了使变速控制在限制范围内尽可能多。

11显示内存速度的控制过程在无噪声和噪声条件下的约束。当 接近边界约束,网络容易受到噪声干扰和频繁波动。模型的训练数据的限制,网络的训练可能会过度拟合的问题。我们也采取了一些措施来解决这个问题。首先是扩大训练数据,以确保它的覆盖范围可以覆盖大部分IMM的变化。其次,过度拟合的一个重要原因是经常高模型的复杂性和深度。压缩模型的大小和减少网络的复杂性通常可以缓解这个问题。最后,我们可以减少网络的训练时间,并选择最好的模型重量在100次迭代。

2说明了两个控制器的平均跟踪误差在30模拟运行,证明他们有几乎相同的控制能力在相同的初始条件和随机干扰。我们采取MPC控制器控制的曲线输出作为参考和计算之间的平均跟踪误差下的曲线设计的控制器和参考。一个很小的错误是获得该DL-based MPC。每次迭代的计算时间大大减少了从4.677到1.691毫秒,女士和MSE损失是接近于零的水平,如表所示2。这一发现表明,DL-based MPC控制器具有预测控制功能与MPC控制器。当前系统状态预测最优控制输入下一时刻的价值。错误主要出现在内存速度变化的区域。我们可以得出结论,控制器设计主要有相同的控制性能和鲁棒性MPC控制器和它消耗更少的时间。此外,我们还做了一个比较实验包含注意力机制和网络上的网络,不包含这种机制。在相同的条件下,训练的MSE格勒乌网络没有注意机制是0.000388和运行时间是1.02毫秒。显然,时间消耗的增加相比,注意力机制大大提高网络的预测精度。深层的机制不仅极大地提高了性能神经网络用于文本或图像,但也有效数据驱动控制任务。这个DL-based方法在典型的关键优势MPC-based IMM控制方法是非常简单的构造和计算,最高的时间消耗来自转发设计网络的计算。 This unquestionably reduces the control process’s computation time and lowers the MPC method’s equipment threshold.

5。结论

以最少的计算提出了一个有效的控制战略的努力为实时实现基于DL技术近似经典MPC战略来应对的最优跟踪控制注射速度在一个典型的IMM。系统运行数据通过经典的MPC策略注入速度的IMM被收集并用于训练网络设计。基于训练学习控制器可以根据实时输出相应的预测控制结果IMM的采样状态系统。数值模拟结果表明,该方法是可行的和需要较少的计算时间比传统的预测控制方法。同时确保预测控制的准确性,该方法可以完成复杂的控制任务的IMM系统和输出快速预测控制结果,满足实时要求。显著较低的内存占用和更快的计算时间,也可以实现在嵌入式硬件更有效和简单。

在接下来的工作中,我们将继续研究DL-based预测控制方法和进一步改进实验方法,如考虑到数据集的大小对网络学习效率的影响,比较不同的激活函数和标准化方法的影响,等等。此外,该方法将被应用到更复杂的注塑系统结合如网络压缩、网络修剪,和其他方法,实现更高效的实时预测控制。注意,尽管该方法提出了本文主要集中在数值模拟和实现,这是一个第一和一个漂亮的初步尝试注塑工艺制造的智能控制区域。此外,本文提出的数值方法和实验也有积极的指导作用随后实际实验。现在我们也建立一个真正的实验平台,并试图实现该战略实验室芯片,和实验工作仍在进行中。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这部分工作是支持关键领域的研究和发展项目广东省(2021 b0101200005),中国国家自然科学基金(62073088和U1911401),广东基础研究和应用基础研究基金会(2019 a1515011606),和实验室开放研究基金来自广东的人工智能和数字经济(深圳)。