研究文章|开放获取
李Yufei阮,黄高,成交, ”改善注塑产品一致性的智能温度补偿控制”,聚合物技术的进步, 卷。2019年, 文章的ID1591204, 13 页面, 2019年。 https://doi.org/10.1155/2019/1591204
改善注塑产品一致性的智能温度补偿控制
文摘
温度稳定性是至关重要的产品质量的一致性在注塑过程中,它是非常必要的在动态条件下提高温度控制精度。然而,由于大时滞、强耦合,和现有系统的动态特性,它不是一项容易的任务,以实现精确的注射成型过程中的温度控制。在本文中,一个新的智能温度补偿控制策略对注塑工艺在动态条件下,提出了以补偿控制策略解决两个关键问题:补偿和补偿量。基于数据的前馈迭代学习控制(ILC)算法的目的是学习最优补偿时间。一旦学会了最优补偿时间,深q学习算法结合q学习与人工神经网络(ANN)提出了学习的最佳补偿量。设计一个实验平台来验证该方法的优越性。实验结果表明,该方法在动态条件下能有效地提高温度控制精度。与此同时,产品的一致性也得到了改进。
1。介绍
聚合物注射成型是一种使用最广泛的加工方法生产聚合物产品(1]。作为一个典型的批量生产过程中,产品在注塑工艺的一致性是非常重要的2]。温度是影响产品一致性的两个主要因素之一(另一个是压力)。在工作报告Gim et al。3)、温度显示了一个更强的相关性。因此,提高温度控制的稳定提高产品质量一致性非常重要。一般来说,除了机械设计和材料的影响,温度的稳定性主要取决于以下工艺参数:桶温度、螺杆转速、背压、保压时间,注入中风。加工技术和生产效率的限制,除了桶温度,其他参数在生产过程中不可控变量。因此,精确的桶温度控制是至关重要的改善熔体温度的稳定性和产品的一致性。
然而,难以实现精确的控制桶温度由于两大特殊的特征,即大的时间延迟和强耦合4]。通常,利用电阻加热管加热。加热器是缠绕在桶的外表面。因此,热量集中在桶的外表面和加热筒内的材料的热传导。由于桶壁厚,通常需要几十秒或更多,直到热转移到内部桶的一部分。因此,系统中有一个巨大的时间延迟。另一方面,由于间歇性扰动引起的(1)易于导热,(2)新鲜的原材料进入,(3)环境的变化,和(4)产生的剪切热操作,这使它成为一个强耦合系统。
在大多数现有的注塑过程,温度通常是由一个比例积分微分(PID)控制算法(5]。PID算法已经广泛应用于温度控制(6,7]。它很容易实现,可以在静态条件下提供良好的鲁棒性。但聚合物注射成型过程包含几个迭代和重复操作。每个操作间歇地执行。因此,桶在注塑过程中动态条件。因此,PID算法不能提供令人满意的桶温度控制整个操作过程的性能。在过去的几十年里,为了解决桶温度控制问题,提出了许多先进的控制方法,如自适应解耦控制(8),模型预测同步控制(9),多变量自校正预测控制(10),自优化的模型预测控制(11),自适应广义预测控制(12),和响应识别和内模控制(13]。这些方法可以有效地解决大时延的问题。然而,大多数这些现有的方法是基于反馈控制策略,不能处理间歇性扰动。另一方面,这些方法不考虑注塑过程的动态特性。
考虑到重复操作聚合物注射成型过程的特点,它是可行的使用前馈补偿策略消除间歇性扰动的影响。例如,姚明等人提出了一个桶温度控制方法用广义预测控制相结合的迭代学习前馈控制(14]。实验结果表明,采用前馈补偿策略可以有效防止大的温度变化由间歇性扰动引起的。有两个要点必须确认在使用前馈补偿策略桶温度控制:(1)补偿时间和(2)补偿量。然而,这不是一项容易的任务来获得准确的补偿,补偿量桶温度控制。他们受到许多复杂因素的影响,如原材料、环境、注塑模具和工艺参数。因此,很难获得准确的补偿,补偿量通过基于模型的方法。
根据前面的分析,这是至关重要的获取准确的补偿,补偿量使用前馈补偿控制策略时注塑温度控制。考虑系统的重复行为,迭代学习控制(ILC)被认为是一种有效的控制方法,重复的特色系统(15,16]。ILC学习控制方法是一种基于数据(17]。ILC产生前馈控制信号,适用于下一批通过使用来自以前的批次已存储的信息。基于数据的控制方法,ILC不需要一个精确的系统模型,所以它可以很容易地适应各种复杂的环境。因此,它是可行的,使用ILC获取准确的补偿时间。然而,ILC作为前馈控制策略不能实现准确的补偿量控制。作为一个典型的批生产过程,它是可行的,采用强化学习(RL)算法控制系统(18]。
在本文中,一个新的智能桶温度控制方法,这充分考虑了注射成型过程的动态特性,提出了。提出的控制方法采用前馈补偿的策略来提高温度控制在动态条件下的稳定性。该方法首先学习最优补偿时间在每一批使用前馈ILC算法。随后,采用深安q学习算法结合q学习与学习的最佳补偿量为每一个补偿。这种创新的控制策略,可以有效提高温度控制的稳定性,和产品的一致性可以显著改善。
本文的其余部分组织如下。节2,系统描述了。部分3发展前馈补偿温度控制策略。节4,用不同的温度控制实验条件。节5,产品一致性给出实验验证了控制策略的有效性,提高产品一致性。最后,结论部分6。
2。系统描述
的典型结构图注塑机注射单元如图1。主要由一个螺丝,一桶,喷嘴和供暖系统。一般来说,供暖系统有多个加热区。对于每个加热区,有一个加热器和温度传感器。在大多数情况下,为每个加热区温度设置根据不同的需求的过程。为了节约能源,供暖系统是覆盖着一层保温材料。系统没有冷却系统。因此,系统的冷却速度是非常缓慢的。
在注塑过程中,原材料从料斗进入桶。原材料被加热到熔融状态的桶。螺杆旋转,撤退,从而混合融化均匀,挤压融化的前面。最后,螺旋推进熔体注入模具。在这个过程中,温度受多种因素影响:(1)周围的加热盘管外的桶是在静态条件下的主导因素(2)剪切热,生成的螺丝和融化,温度是影响的另一个主要因素(3)造成的热耦合不同温度条件下不同的加热区和金属的优良的导热系数(4)还有工艺参数设置(螺杆转速、背压等),材料、模具、周边环境等等
因此,对于这样一个复杂的系统,它是一个巨大的挑战,实现精确的温度控制。之前的研究表明,解决这个问题是不可能使用一个建模方法(12]。
3所示。方法
3.1。前馈补偿或时间控制ILC
ILC是基于数据的控制方法;与传统的基于模型的控制方法相比,它不需要一个精确的系统模型,只需要少量的历史数据从之前的批次。ILC的目的是生成一个前馈控制信号通过利用信息从之前的批次和减少跟踪误差迭代。本文设计前馈控制器ILC-based获取温度补偿时间。
的示意图表示ILC-based补偿时间控制算法如图2。 代表迭代的数量, 代表了样本时间,在每一批样品的总数。在批处理 , 表示系统输出步骤 , 表示输入步骤 , 表示控制目标的步骤t,表示温度误差的一步 ,和表示时间的错误。控制算法包括主要包括三个部分:(1)前馈控制器,(2)一个学习函数,和(3)温度误差转换。前馈控制器用于处理之间的关系之前批处理输入和输入下一批。学习函数用于计算下一批的输入变化。温度误差转化为根据温度误差补偿时间误差转换。
补偿时间控制算法的目的是获得最优补偿时间。在实际控制过程中,温度传感器返回每个采样周期的温度。每个周期的数据在每一批都保存在内存中。最后一批,温度误差曲线整个批处理是通过比较获得的参考价值。错误的时间通过分析温度误差曲线。是由系统的输入 在哪里是一个过滤器,是以前的批量的控制输入,的变化控制输入的下一批学习获得的功能。它可以计算如下: 和代表权重矩阵,是一个托普利兹矩阵。在学习的过程中,时间常数, ,被选中的最大允许误差。学习过程结束,直到时间误差 。
3.2。强化学习赔偿数量控制
在RL的问题,一个代理可以改善其性能从自己的经验与环境的交互19]。一个典型的代理主要由以下三个部分:状态 ,行动 ,和奖励 。代理的目标是学习最优行动策略以最大化回报将获得在未来。在一个时间步 ,代理选择一个行动基于当前状态 ;系统所选的执行操作,并返回一个奖励然后到下一个状态 。与此同时,政府行动的价值观 被记录。本文采用q学习学习的最佳温度补偿量。q学习的是一种模范自由off-policy RL算法(20.]。作为一种广泛使用的RL算法,q学习发现最优政策通过学习最优行动价值函数 在每一个国家。
动作值函数 更新如下: 在哪里 是折扣因素, 是学习速率,是行动的空间。
的示意图表示RL-based温度补偿量控制方法如图3。采样的温度 ,温度误差 ,和控制输入构成了状态空间 ;它可以表达的 操作空间表示为 是最小控制电压值, 。三个操作:增加输入( ),减少输入( ),和0意味着没有修改;系统执行之前的温度控制信号。
为了防止算法陷入局部最优解,算法采用选择行动。该算法选择一个行动在一个州用一个概率 。它可以被描述为 是一个小正的常数。在控制过程中,该算法将与一个概率选择一个贪婪的行动 或与一个概率随机选择一个动作 。
该系统将执行选定的操作并返回一个奖励然后到下一个状态 。代理将得到积极的奖励(+ 1)如果温度误差小于最大允许误差。如果温度误差大于最大允许误差,但低于之前的温度误差 ,代理会收到一个小积极奖励(+ 0.1)。在其他情况下,代理会收到奖励(1)。总之,奖励函数可以定义如下:
一般来说,q学习方法需要一个查找表来存储每一对政府行动的价值。然而,它是不可能建立一个查找表实际控制问题。温度控制过程的状态空间是非常大的。它可能会导致一系列的问题当使用一个查找表。例如,它可能会导致高计算成本,或算法不能收敛。为了处理这个问题,大量的政府行动对温度控制,本文应用神经网络近似最优行动价值函数。在每一步 ,动作值可以表示如下: 在哪里 是神经网络的隐节点数,神经网络输入的数量,和代表的输入和输出th隐藏节点,和 是连接权重, 是th元素 。
根据(5),权重矩阵安的更新如下: 代表了连接权重矩阵或 ,和 是一个向量的梯度,计算如下:
使用神经网络近似动作值函数将解决一些存在的问题。然而,一些新的问题将会出现当RL与神经网络相结合。首先,政府行动之间的相关性对(21]。在实际的控制问题中,当前状态通常是非常相似的相邻采样周期,所以样本之间的相关性非常强。其次,目标重量值是影响网络。网络在当前步骤的更新会影响目标价值的其他措施。因此,如果网络权值更新在每个步骤中,这将导致很长一段时间内收敛,甚至发散。
本文采用称为“经验重演”的机制来解决问题引起的使用神经网络(22]。在学习的过程中,政府行动对每个采样周期的第一个存储。然后你可以随机选择内存的数据来更新网络,从而消除政府行动对之间的相关性。此外,与传统的神经网络在线更新策略不同,神经网络的连接权值更新离线。连接权值将被更新一批结束后。离线更新策略,重量的影响,更新传统的在线更新策略可以有效地消除。这些创新不仅有效地减少了计算时间,而且还使该方法更加可行。
4所示。温度控制实验
4.1。实验设置
一个实验平台是为了验证该方法,如图4。为了满足实验需求,修改注塑机器用于实验。一套新的注塑机控制系统,如图4是建立在最初的注塑机。注塑机的参数表中列出相关实验1。有五个加热区域包括one-nozzle区;剩下的四个区域编号1 - 4从料斗喷嘴。实验的材料是聚丙烯(PP)、聚苯乙烯(PS)。PP, PS的热物理性质如表所示2。q学习算法的参数表中列出3。
|
||||||||||||||||||
|
||||||||||||||||||||||||
|
|||||||||||||||||||||
4.2。单区温度控制与开环控制
显示大的时间延迟和供热系统的强耦合,一个开环控制策略应用于区域3。目标温度设定在180°C,和所有区域从室温加热。除了带3,其他区域没有输入。的温度结果区3区2区4图所示5(a),控制电压如图5(b);10 V意味着加热线圈的最大力量。区域3的温度达到目标温度后1023秒;然后停止供暖。可以看出,停止加热后,区域3的温度继续上升,直到最高温度达到(184.2°C)在1085秒。在那之后,区域3的温度逐渐下降。在这个过程中,区域2和区域的温度上升4也将由于热传导。它可以观察到,即使带3的温度开始下降,区域2和区域的温度上升4仍然只要有温度差异。因此,加热系统是一个大型的时间延迟和强耦合系统。
4.3。温度控制与动态条件
如前所述,在注塑过程中,加热系统是一个动态的条件。为了验证提出的温度控制策略在动态条件下,几组进行比较实验。拟议中的温度控制策略相比,广义预测控制(GPC)方法和PID方法。PID算法是应用最广泛的控制算法领域的温度控制;离散PID模型可以表示如下: 在哪里
代表了样本时间,代表控制输入的变化, , ,和 在不同的采样时间是错误,是控制周期,比例增益,积分时间,是时间的导数。GPC算法已广泛应用于近年来温度控制领域,取得了良好的性能。它可以表示如下: 在哪里 代表了样本时间,代表了控制输入, 是权重因子,的步长控制时域。
与材料PS,一组进行实验。所有实验从静态条件。区域的温度结果如图36(a),设定温度为220°C。它可以观察到,所有的三种控制方法在静态条件下可以获得优良的控制性能。温度变化非常小。然后系统切换到动态条件。首先,螺旋推进注入融化。在这个过程中,原材料会流入桶。通常,原材料是在室温下。因此,它将导致温度下降。如图6(一个),有一个大温度下降时利用GPC和PID控制方法。特别是在PID方法,温度下降了2.5°C。然而,当使用该控制方法,温度只有下降约0.4°C。与此同时,如图6(b),控制电压将会增加。但由于时间延迟,温度不会立即上升。在注射完成后,系统进入塑化作用的过程。螺杆旋转,撤退,螺杆速度如图6(c)。在这个过程中,剪切热引起的温度将上升,增加的输入。塑炼过程完成后,系统返回静态条件。由于热惯性的影响,温度将继续上升。然后,气温会逐渐下降。最后,温度将稳定在设定值。在整个过程中,温度超调。它可以观察到,最高温度超过只有0.5°C,在使用该方法时。然而,当使用PID方法,最高温度超过4.5°C。温度过冲影响产品质量,甚至会导致材料分解。GPC方法可以有效降低温度超调。 The maximum temperature overshoot is about 1.3°C under the GPC method.
4.4。温度控制与不同的材料
不同的聚合物材料的热物理性质有很大区别。物质的变化将显著影响温度控制性能。为了检验该方法的性能改变材料后,进行另一个实验。在这个实验中,取而代之的是聚丙烯高分子材料PS。螺旋定期执行行动来模拟实际生产过程。其他条件保持不变。
结果如图所示7。这是观察到的温度变化非常大开始;最大温度变化大于2.5°C。这主要是由热容的差异造成的。如表所示2PP的热容比PS大得多。在改变材料、前馈补偿策略还没有更新。此时,学习过程将学习新的补偿策略执行。经过1500秒,最大温度变化是减少到0.5°C。这表明该系统已经学会了新薪酬策略页之后,学习过程将暂时停止,新的薪酬策略将被存储。当最大温度变化大于设置值,学习过程将重新激活获得新的补偿策略。
5。产品一致性的实验
如前所述,桶温度控制是产品一致性的关键。本文的目的是提高注塑产品的一致性通过提高温度的稳定性。因此,在本节中,产品一致性的实验进行进一步验证该方法的有效性通过比较GPC方法和PID方法。在本文中,产品一致性是反映在产品的重量。有多个定义,注塑产品的质量,如重量、弯曲、表面性能、机械性能、光学性能和结晶23]。翘曲是反映产品质量的一个重要因素。温度不平衡是一个重要因素导致翘曲。但许多其他因素也会导致弯曲,如冷却时间、弹射机制,注入压力。本文的目的是改善过程的稳定温度补偿控制提高产品一致性。产品重量可以反映过程的稳定性和产品的一致性很好。例如,在周工作报告等。24),他们声称产品重量有密切关系到其他质量属性和产品的重量是一个很好的指标过程稳定。另一方面,产品的重量可以非常方便的测量和量化。因此,它是可行的使用产品的重量,以反映产品的一致性。
5.1。实验设置
上述实验平台上进行实验。一条产品用于实验。该产品是用双腔模具的。塑造产品的CAD模型图所示8(一个)。实际的模制产品的图片如图8 (b)。在实验中使用的高分子材料是页的设置相应的工艺参数表中列出4。除了这些参数,直接影响到融化温度桶,注射速度也是一个重要因素影响的温度融化进入腔。为了消除不同注入速度的影响,注射速度设置为相同的实验。梅特勒-托利多的冷却产品加权分析天平LE204E最小分辨率0.0001 g。此外,为了减少机器的影响波动对产品重量,共有80个周期的生产将在每组实验。前30周期将废弃的;只剩下50周期将被用于测量。
|
|||||||||||||||||||||||||||||
(一)
(b)
5.2。产品一致性在不同的温度控制方法
产品重量的结果如图所示9。它可以观察到,在该温度控制方法,这两种产品有非常小的重量变化。最大重量差异小于0.4克。这表明优秀的产品一致性可以当使用该控制方法实现。然而,当使用PID方法,产品重量的一致性显著恶化。最大重量差异大约是1.2克。此外,体重的差异产品和产品两个之间有时是非常大的甚至在相同的批处理。这表明由于温度变化有充填不平衡。重量的一致性和GPC方法是优于PID控制方法,但产品重量变化仍相对大的相比,该方法。
(一)
(b)
此外,一些统计方法用于分析和比较数据。如表所示5,平均绝对偏差是用来描述数据分散的程度。重量可重复性计算如下: 在哪里 表示样本数量,样品的总数量,是平均体重,样品的重量。的值越小 ,重量可重复性越好。统计分析结果表明,提出的控制方法,产品重量的平均绝对偏差和可重复性比PID和GPC方法。另一方面,区别不同的蛀牙也很小,这意味着优秀的一致性可以实现在不同批次和不同蛀牙。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
5.3。产品一致性和不同的工艺参数
除了桶温度的影响,熔体温度桶也受到以下工艺参数:螺杆转速、背压、保压时间,注入中风。这些工艺参数对熔体温度一致性的影响如表所示6。可以看出,降低螺杆转速,剪切所产生的热量将降低,熔体温度差异由于螺杆转速也会减少。因此,降低螺杆转速可以提高熔体温度在一定程度上的一致性。另一方面,随着背压的增加在塑炼过程中,螺杆撤退的速度减少。因此,熔体停留时间的桶和桶的材料的密度。因此,增加背压可以增加熔体温度和熔体温度的一致性。增加保压时间允许将桶中的融化为更长一段时间热身,和热传导更充分,从而提高熔体温度一致性。然而,它将增加周期时间,这对批量生产的过程是不可接受的。在实际生产过程中,为了提高生产效率,停留时间通常是设置尽可能小。因此,在本文中,保压时间不选中。 Decreasing the injection stroke can improve the melt temperature consistency. But the injection stroke is limited by the mold and cannot be adjusted at will during the production process. In summary, due to process conditions or production efficiency limitations, the screw rotation speed and back pressure are selected to justify the effectiveness of the proposed method.
|
||||||||||||||||||||||||
在这组实验中,选择背压和螺杆转速为变量。其他工艺参数实验期间保持不变。实验设计表中列出7。
|
|||||||||||||||||||||||||||||||||||
如图10 (),背压变化从2 MPa到3 MPa经过20周期。由于背压的变化,产生剪切热量在操作过程中会改变,温度也会改变。因此,产品一致性会受到影响,导致突然改变产品的重量。随后,当温度恢复稳定,产品重量逐渐返回到原来的范围。在使用该方法时,产品重量可以回到原来的范围在大约5周期。然而,当使用PID方法和GPC方法,需要超过10周期直到产品重量的回报稳定。类似地,如图10 (b),当螺杆转速变化从90转到60 rpm,还有一个突然的改变产品的重量。不同背压变化,降低螺杆转速会降低温度,导致产品重量的增加。使用该方法,产品重量可以迅速返回到原始范围由于温度的快速恢复。这表明,该方法能有效地消除由于温度变化工艺参数改变,从而提高产品的一致性。
(一)
(b)
统计分析的结果与工艺参数修改表中列出8。它可以观察到,随着工艺参数变化,平均绝对偏差和可重复性将恶化。然而,与PID和GPC方法相比,该方法仍能取得优秀的成果。另一方面,可以看出,降低螺杆转速后,产品一致性将会改善。这意味着减少螺杆速度会使温度分布更均匀,导致产品一致性的增加。
|
|||||||||||||||||||||||||||||||||||||||||||||||
6。结论
在本文中,一个新的智能温度补偿控制策略,这充分考虑了注射成型过程的动态特性,提出了。根据实验结果,可以得出的结论如下:(1)该桶温度控制方法明显减少了动态条件下的温度变化。实验结果表明,最大温度变化是约±0.5°C下该方法,相比之下,GPC (±2.5°C)和PID (±4.5°C)(2)该方法可以有效地提高注塑产品的一致性在不同批次和不同蛀牙。统计分析的结果表明,重复性小于0.3%在使用该方法时,这是比PID方法(约1%)和GPC方法(大约0.7%)(3)提出的策略是一种基于数据的学习控制方法。它不需要一个精确的系统模型,该系统可以改善其性能通过学习从它的历史数据。因此,它可以很容易地应用到不同的机器上,材料和工艺条件
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作是由中国国家自然科学基金(格兰特数字51635006,51635006)和基础研究基金为中央大学(2015年格兰特数字2016 yxzd059 zdtd028)。
引用
- 周赵p, h . y . Li和d·李”工艺参数优化注塑使用快速地带分析作为代理模式,”国际先进制造技术杂志》上卷,49号9 - 12,949 - 959年,2010页。视图:出版商的网站|谷歌学术搜索
- r, r ., a .雪和f·高,“预测函数控制下的线性系统部分执行器故障和应用一批注塑过程中,“工业化学与工程化学研究,53卷,不。2、723 - 731年,2014页。视图:出版商的网站|谷歌学术搜索
- j . Gim j . Tae j .全j . Choi和b . Rhee”检测方法多腔模具的充填不平衡对小镜头,“国际期刊的精密工程和制造业,16卷,不。3、531 - 535年,2015页。视图:出版商的网站|谷歌学术搜索
- k .姚明和f·高,“最优开始量控制注塑桶的温度,“高分子材料工程与科学卷,47号3、254 - 261年,2007页。视图:出版商的网站|谷歌学术搜索
- c . Abeykoon”单螺杆挤压控制:一个全面的评估和改进方向,”控制工程实践,51卷,第80 - 69页,2016年。视图:出版商的网站|谷歌学术搜索
- 问:y . Wang Jin, r·张“改进的模糊PID控制器的设计采用预测函数控制结构,“ISA®事务卷,71年,第363 - 354页,2017年。视图:出版商的网站|谷歌学术搜索
- n .帕乔里a王妃,辛格诉,“生物反应器温度控制使用修改分数阶IMC-PID乙醇生产,”化学工程的研究和设计卷,122年,第112 - 97页,2017年。视图:出版商的网站|谷歌学术搜索
- 学术界。陆和c c。蔡”,自适应解耦预测温度控制的挤压筒在塑料注射成型过程中,“IEEE工业电子产品,48卷,不。5,968 - 975年,2001页。视图:出版商的网站|谷歌学术搜索
- y彭、w·魏和j .王”模型预测同步控制注塑机筒温度的基于对角递归神经网络,”材料和制造工艺,28卷,不。1、能力2012页。视图:出版商的网站|谷歌学术搜索
- 碳碳。蔡学术界。陆”,多变量自调优为塑料注塑工艺温度控制,”IEEE行业应用,34卷,不。2、310 - 318年,1998页。视图:出版商的网站|谷歌学术搜索
- r·杜贝,“货币政策委员会自优化注塑的融化温度”ISA®事务第41卷。。1,第94 - 81页,2002。视图:出版商的网站|谷歌学术搜索
- 美国黄、k . Tan和t·李,“自适应GPC控制注塑的融化温度”ISA®事务,38卷,不。4、361 - 373年,1999页。视图:出版商的网站|谷歌学术搜索
- t·刘,k .姚明,f .高,“识别和注塑温度控制系统与应用程序的自动调谐,”IEEE控制系统技术,17卷,不。6,1282 - 1294年,2009页。视图:出版商的网站|谷歌学术搜索
- 高k .姚明,f, f . Allgower“桶温度控制在注塑操作过渡期间,“控制工程实践,16卷,不。11日,第1264 - 1259页,2008年。视图:出版商的网站|谷歌学术搜索
- p . j . f . l . Wang Liu Yu, r . Zhang和f·高,“迭代学习容错控制注塑过程对致动器的缺点,”《过程控制卷,59岁,59 - 72年,2017页。视图:出版商的网站|谷歌学术搜索
- 陈y . k . Liu, t, s .田和x张,“间歇过程运行控制的调查。”ISA事务卷,83年,第125 - 107页,2018年。视图:谷歌学术搜索
- r . r . x, x Liu, z侯,和黄,“限制数据驱动的最优迭代学习控制,”《过程控制卷,55 10-29,2017页。视图:出版商的网站|谷歌学术搜索
- k .容易引起m . p . Deisenroth m . Brundage和a . a . Bharath深强化学习:一个简单的调查,“IEEE信号处理杂志,34卷,不。6,26-38,2017页。视图:出版商的网站|谷歌学术搜索
- r·s·萨顿和a·g·Barto强化学习:介绍英格兰剑桥,麻省理工学院出版社,1998年。视图:MathSciNet
- 罗,刘、黄t和d . Wang“模范自由最优跟踪控制通过critic-only q学习的,”IEEE神经网络和学习系统,27卷,不。10日,2134 - 2144年,2016页。视图:出版商的网站|谷歌学术搜索
- 诉Mnih k . Kavukcuoglu d银et al .,“人类控制通过强化学习,”自然,卷518,不。7540年,第533 - 529页,2015年。视图:出版商的网站|谷歌学术搜索
- 阮y, y, t·毛x周,d . Li和h .周”轨迹优化使用学习批处理控制和定位控制,”控制工程实践卷,85年,页1 - 10,2019。视图:出版商的网站|谷歌学术搜索
- p .赵y Peng w·杨,j .傅和L.-S。Turng“结晶通过超声测量速度:研究聚(乳酸)部分,“高分子科学杂志B部分:高分子物理,53卷,不。10日,700 - 708年,2015页。视图:出版商的网站|谷歌学术搜索
- 张周x d, y, t·毛和h . m .周”监控和动态控制注塑工艺的质量稳定,”材料加工技术杂志》上卷,249年,第366 - 358页,2017年。视图:出版商的网站|谷歌学术搜索
版权
版权©2019 Yufei阮等。这是一个开放分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。