文摘
对于非线性离散时间系统,高阶迭代学习控制(HOILC)最优控制收益基于进化算法(EA)开发。自跟踪信息的更新操作是构成从几个以前的迭代,设计HOILC方案与适当的控制收益通常实现收敛速度快。优化控制收益HOILC方法,介绍了EA。编码策略,EA种群初始化和适应度函数的设计是根据HOILC特征。EA的全局优化、最优控制涨幅HOILC自适应选择,以便在ILC过程收敛迭代数量减少了。仿真所示,绝对误差,总平方误差,最大绝对误差的跟踪提出了基于EA HOILC收敛速度比传统HOILC。
1。介绍
在真实的应用程序中,如机器人机械手系统(1- - - - - -5)和灵活的系统(6- - - - - -8),有许多无人自治系统在复杂的环境中。精确的数学模型很难建立。对于这些系统,提出了迭代学习控制(ILC)。它是一种有效的智能控制方法应用于动力系统执行重复性任务跟踪一个特定的轨迹在一定的时间间隔。利用前一次迭代的控制输入和跟踪信息,控制输入信号可以逐渐从迭代更新迭代,这样可以提高跟踪性能。少了以前的知识理论领域的控制系统使ILC流行[9- - - - - -14)以及适用的领域(15- - - - - -19]。
一阶ILC,生成控制输入跟踪信息最后迭代,被广泛应用于动力系统完美的跟踪在一个有限的时间间隔20.- - - - - -26]。然而,只有最后一次迭代的跟踪信息是利用一阶ILC更新当前的控制输入,因此很难获得令人满意的收敛速度。为了实现更快的收敛速度,高阶ILC (HOILC)采用许多先前的迭代生成的跟踪信息提出了电流控制输入信号(27- - - - - -31日]。自跟踪信息的更新操作是构成从几个以前的迭代,适当的跟踪性能设计HOILC优于一阶ILC。具体来说,适当的控制收益可以加速HOILC的收敛过程。因此,如何选择最优控制增益是在HOILC设计中一个重要问题。
出于以上的观察,本文进化算法(EA)来自生物进化论采用选择自适应最优控制在HOILC方案。EA是一个启发式优化算法,模拟了繁殖,选择、交叉和变异生物进化的过程。它被广泛引入处理各种优化问题(32- - - - - -34]。本文编码策略,EA的种群初始化和适应度函数设计根据HOILC特征这样一代又一代的EA减少。然后,设计EA参与HOILC优化控制收益。之后,最优控制涨幅,同时生成的控制输入。与传统HOILC相比,收敛的迭代的数量减少的EA计划提出HOILC (EA-HOILC)。介绍了EA与全局优化优化控制HOILC本文的成果。
剩下的纸是组织如下。这个问题制定节中给出2。HOILC的收敛性分析中提供了部分3。部分4介绍了设计EA-HOILC方案与最优控制收益。节5,提供了一个例子来说明我们提出的有效性EA-HOILC。部分6本文总结道。
2。问题公式化
考虑下面的非线性离散时间系统,执行重复的操作: 在哪里 和 分别代表了迭代索引和时间点。 , ,和 表示状态、控制输入和输出系统(1),分别。 , ,和 。 为 参考输出,在哪里相应的参考状态。 ILC的跟踪误差th迭代的 。以下假设所需的技术分析。代表所需的规范。
假设1。对所有 ,初始状态满足 在相同的初始条件考虑的假设1不能满意,提出的技术(29日- - - - - -31日)可以引入处理初始状态的振动。
假设2。非线性函数在系统(1)被认为是可微的和全局李普希茨在第一个变量,也就是说, , 在哪里 李普希茨是常数。
假设3。数量 。
备注1。它指出,假设3意味着相对程度的系统(1)就是其中之一。非线性离散时间系统的相对较高的学位,ILC法律可以修改根据系统相对程度的顺序进行(31日]。
假设参考输出是可实现的,存在一个独特的控制输入
这样
本文的目的是开发一个EA-HOILC方法,生成控制输入跟踪信息的几个以前的迭代。EA的控制增益优化减少收敛迭代。对于HOILC收敛分析,采用下面的引理。
引理1(见[31日])。让被定义为一个真正的序列 为 ,在哪里是一个特定的序列。如果 非负数字令人满意 然后 意味着 。
3所示。HOILC设计和收敛性分析
在本节中,对非线性离散时间系统(1)假设1- - - - - -3,以下HOILC法律是专为 和 : 在哪里 HOILC法律的顺序(7), 和 ( )为 是控制收益。
备注2。在现有HOILC计划(30.,31日),初始控制输入 通常设置为零向量。本文自控制输入可以通过EA以及最优控制涨幅,我们可以设置初始控制输入 与生成的控制输入。这意味着初始控制输入由EA优化,也可以加快收敛速度。
定理1。对非线性离散时间系统(1)假设1- - - - - -3HOILC法(7)是应用。如果控制收益和( )为 选择使 然后 为 。
证明。让
和
。减去双方(7),和考虑(1),(4)和(8),我们得到
然后,注意收敛条件(9)和假设2进一步,我们可以推断出
在哪里
和
为
。
另一方面,它遵循从(1)和(4),
以规范双方的13)和考虑的假设1- - - - - -2,它的收益率
在哪里
。用(14)(12),
作为
,考虑(2)的假设1,它源于(12),
应用引理1(16)和收敛条件(10),我们有
作为
,从(16),有
应用引理1(18)和收敛条件(10)和考虑(17),我们得到
假设
,有
作为
,它遵循从(15),
应用引理1(21)和收敛条件(10)和考虑(17)和(20.),我们可以推出
最后,基于数学归纳法,可以推导出以下结果:
注意的是(2在假设1,那么它可以获得(15)和(24),
此外,为
,它遵循从(1)和(4),
然后,我们有
为
。完成证明。
4所示。EA-HOILC方案与最优控制收益
定理1提供HOILC提出的渐近收敛。众所周知,控制收益可以显著地影响收敛性能。在本节中,控制收益HOILC发达的部分3由EA优化减少收敛迭代。
EA是智能优化算法,模拟生物进化的过程中,获得最优的解决方案。EA-HOILC提出了如下的主要思想。
4.1。编码策略
本文的控制收益HOILC实数,这是适当的选择真正的编码策略。优化的控制收益HOILC法(7)和( )。自收敛条件(8),它很容易获得 。因此,我们可以假设变量向量在EA ,表示为和编码策略
4.2。种群初始化和个人评价
基于收敛条件(8)- (10),的值范围控制收益和为 可以确定。因此,可以根据产生初始种群收敛条件。让人口规模,不失一般性,假设是偶数。变量的向量个人在人群中表示为 这是初始化为 为 。另一方面,为变量 ,让系统输出th个人在个时间点是 。评估个体优势,以下适应度函数 的th个人建立: 在哪里是一个常数足够大吗是跟踪误差的绝对值的总和表示为
适应度函数(27)和初始变量 ,最初的健身价值th个人是获得。然后,我们有以下初步健身向量 人口:
因此,最初的人口 被构造成 人口的初始变量在哪里吗
从(31日),th ( )变量的th ( )个人表示为th排列。最后一列的所示(30.)中相应的初始变量的健身价值。
4.3。选择策略
个人到下一代轮盘赌选择策略和精英主义的策略。个人更大的健身价值更高概率的轮盘赌选择策略。然而,轮盘战略的一个缺点是,最好的个人老人口可能会错过。所以,我们采用精英策略,以确保最好的个人可以保留上一代。由于这两种方法,收敛数代的EA可以减少。
4.4。交叉算子
交叉概率 取决于一个人需要交叉。为th个人, ,一个随机数产生0和1之间,表示为 。如果 ,交叉操作发生。否则,不发生交叉操作。由于真正的编码策略,采用算术交叉算子。假设的变量向量th和 th父个体和 ,分别选择交叉。交叉后,生成两个新的个体,变量的向量表示为和 。为 ,交叉操作表示为 在哪里 交叉的权重吗th和 父个体。
4.5。变异算子
在本文中,我们采用随机变异策略。让 变异概率。为th个体之间的号码是随机产生0和1表示为 , 。如果 ,变异操作发生。否则,不发生变异操作。让变量的向量个人选择的变异。突变后,一个新的变量向量生产。变异算子的定义是 在哪里 突变的权重吗个人。
4.6。终结的条件
终结的条件可以由健身价值或跟踪误差。在模拟,生成在EA设置为100。最后,我们可以获得最优控制收益( )和( )从最好的个体根据收敛条件(由EA。8),最后控制增益推导出的 。
4.7。拟议中的EA-HOILC的概述
提出EA-HOILC描绘在图的流程图1。首先,根据控制收益特点和收敛条件(9)和(10),初始变量( )是获得。然后,我们应用传统HOILC 在每个初始控制收益 ,在收敛条件(8)被认为是。通过跟踪误差与所示(29日)由HOILC,对应的健康( )来自(27)。结合和为 ,最初的人口所示(31日)和(30.)和(32)生产。其次,选择、交叉和变异是由选择策略、交叉算子和变异算子,分别。在那之后,一个新的输入 , ,获得的最优控制收益。EA-HOILC设置初始控制输入 , 。然后,HOILC与最优控制增益过程就开始了。
5。模拟
验证的有效性提出EA-HOILC,采用双连杆机械鱼。系统的动态双连杆机械鱼描述如下(22]: 在哪里 机器鱼的质量, 公斤/米水阻力系数,表示速度是尾运动产生的推力。让速度 和向前的推力 是系统状态和控制输入 ,分别在哪里 是采样时间。我们可以使离散系统(34)通过使用 。因此,离散时间系统 在哪里 和 。
参考轨迹是表示为输出 与 。拟定HOILC算法,设置命令 。控制收益 , ,和由EA选择。另一个控制增益 是获得收敛条件(8)。交叉概率 ,和变异概率 。评估跟踪性能,三个跟踪上的索引和绝对误差 ,总平方误差 ,和最大绝对误差定义如下:
运行仿真,EA-HOILC 10次,和优化控制收益表所示1。
图2展品在迭代系统输出性能 , ,和 通过使用EA-HOILC平均值的最优控制在10次。EA-HOILC之间比较收敛速度和传统HOILC与不同的参数,控制收益HOILC提出(30.分别与二阶),选择如下两种情况。案例1: , , ,和 和案例2: , , ,和 。相应的绝对误差之和 ,总平方误差 ,和最大绝对误差跟踪图所示3。从图3啤酒,一个人可以观察到这种情况控制收益 , ,和可以实现传统HOILC更快的收敛速度。此外,它显然是表明该EA-HOILC可以使收敛迭代小于传统HOILC相同的顺序。
6。结论
摘要HOILC法利用几个以前的跟踪信息迭代非线性离散时间系统,提出了。收敛是严格地分析了基于数学归纳法。为了提高发达HOILC的收敛性能,介绍了EA与全局优化来优化控制收益。与最优控制,提出EA-HOILC可以实现更快的收敛速度。在模拟,结果表明,绝对误差,总平方误差,最大绝对误差的跟踪EA-HOILC收敛速度比传统HOILC顺序相同。然而,值得注意的是,因为EA采用选择控制收益,EA-HOILC的离线计算时间较长。它非常适合的情况下只需要更少的迭代。例如,使用炸弹摧毁目标,该方法可以减少炸弹的数量计算时间的成本。未来的研究将延长EA-HOILC本文开发的动力系统的不确定性在真实的应用程序中35- - - - - -37]。
数据可用性
使用的数据来支持本研究的结果包括在本文中。
的利益冲突
作者宣称没有利益冲突。
确认
这项研究的部分资金由中国国家自然科学基金批准号。61903096和62173101,广州的科技项目批准号201904010475,和芷江实验室开放项目批准号2021 kf0ab06。