复杂性

在这一页上

文摘介绍结论数据可用性的利益冲突确认引用版权相关文章

特殊的问题

2021年无人自治系统在复杂环境中

把这个特殊的问题

研究文章|开放获取

体积2021年| 文章的ID4281006| https://doi.org/10.1155/2021/4281006

高阶迭代学习控制与最优控制收益基于进化算法的非线性系统

Yun-Shan魏 ,¹ Xiaofen杨,² Wenli商 ,¹ 和"陈¹

学术编辑器: (陆

收到了 2021年10月12日

接受 2021年12月20日

发表 2021年12月30日

文摘

对于非线性离散时间系统,高阶迭代学习控制(HOILC)最优控制收益基于进化算法(EA)开发。自跟踪信息的更新操作是构成从几个以前的迭代,设计HOILC方案与适当的控制收益通常实现收敛速度快。优化控制收益HOILC方法,介绍了EA。编码策略,EA种群初始化和适应度函数的设计是根据HOILC特征。EA的全局优化、最优控制涨幅HOILC自适应选择,以便在ILC过程收敛迭代数量减少了。仿真所示,绝对误差,总平方误差,最大绝对误差的跟踪提出了基于EA HOILC收敛速度比传统HOILC。

1。介绍

在真实的应用程序中,如机器人机械手系统(1- - - - - -5)和灵活的系统(6- - - - - -8),有许多无人自治系统在复杂的环境中。精确的数学模型很难建立。对于这些系统,提出了迭代学习控制(ILC)。它是一种有效的智能控制方法应用于动力系统执行重复性任务跟踪一个特定的轨迹在一定的时间间隔。利用前一次迭代的控制输入和跟踪信息,控制输入信号可以逐渐从迭代更新迭代,这样可以提高跟踪性能。少了以前的知识理论领域的控制系统使ILC流行[9- - - - - -14)以及适用的领域(15- - - - - -19]。

一阶ILC,生成控制输入跟踪信息最后迭代,被广泛应用于动力系统完美的跟踪在一个有限的时间间隔20.- - - - - -26]。然而,只有最后一次迭代的跟踪信息是利用一阶ILC更新当前的控制输入,因此很难获得令人满意的收敛速度。为了实现更快的收敛速度,高阶ILC (HOILC)采用许多先前的迭代生成的跟踪信息提出了电流控制输入信号(27- - - - - -31日]。自跟踪信息的更新操作是构成从几个以前的迭代,适当的跟踪性能设计HOILC优于一阶ILC。具体来说,适当的控制收益可以加速HOILC的收敛过程。因此,如何选择最优控制增益是在HOILC设计中一个重要问题。

出于以上的观察,本文进化算法(EA)来自生物进化论采用选择自适应最优控制在HOILC方案。EA是一个启发式优化算法,模拟了繁殖,选择、交叉和变异生物进化的过程。它被广泛引入处理各种优化问题(32- - - - - -34]。本文编码策略,EA的种群初始化和适应度函数设计根据HOILC特征这样一代又一代的EA减少。然后,设计EA参与HOILC优化控制收益。之后,最优控制涨幅,同时生成的控制输入。与传统HOILC相比,收敛的迭代的数量减少的EA计划提出HOILC (EA-HOILC)。介绍了EA与全局优化优化控制HOILC本文的成果。

剩下的纸是组织如下。这个问题制定节中给出2。HOILC的收敛性分析中提供了部分3。部分4介绍了设计EA-HOILC方案与最优控制收益。节5,提供了一个例子来说明我们提出的有效性EA-HOILC。部分6本文总结道。

2。问题公式化

考虑下面的非线性离散时间系统,执行重复的操作: 在哪里和分别代表了迭代索引和时间点。 , ,和表示状态、控制输入和输出系统(1),分别。 , ,和。为参考输出,在哪里相应的参考状态。 ILC的跟踪误差th迭代的。以下假设所需的技术分析。代表所需的规范。

假设1。对所有 ,初始状态满足在相同的初始条件考虑的假设1不能满意,提出的技术(29日- - - - - -31日)可以引入处理初始状态的振动。

假设2。非线性函数在系统(1)被认为是可微的和全局李普希茨在第一个变量,也就是说, , 在哪里李普希茨是常数。

假设3。数量。

备注1。它指出,假设3意味着相对程度的系统(1)就是其中之一。非线性离散时间系统的相对较高的学位,ILC法律可以修改根据系统相对程度的顺序进行(31日]。
假设参考输出是可实现的,存在一个独特的控制输入这样本文的目的是开发一个EA-HOILC方法,生成控制输入跟踪信息的几个以前的迭代。EA的控制增益优化减少收敛迭代。对于HOILC收敛分析,采用下面的引理。

引理1(见[31日])。让被定义为一个真正的序列为 ,在哪里是一个特定的序列。如果非负数字令人满意然后意味着。

3所示。HOILC设计和收敛性分析

在本节中,对非线性离散时间系统(1)假设1- - - - - -3,以下HOILC法律是专为和 : 在哪里 HOILC法律的顺序(7), 和 ( )为是控制收益。

备注2。在现有HOILC计划(30.,31日),初始控制输入通常设置为零向量。本文自控制输入可以通过EA以及最优控制涨幅,我们可以设置初始控制输入与生成的控制输入。这意味着初始控制输入由EA优化,也可以加快收敛速度。

定理1。对非线性离散时间系统(1)假设1- - - - - -3HOILC法(7)是应用。如果控制收益和( )为选择使然后为。

证明。让和。减去双方(7),和考虑(1),(4)和(8),我们得到然后,注意收敛条件(9)和假设2进一步,我们可以推断出在哪里和为。
另一方面,它遵循从(1)和(4), 以规范双方的13)和考虑的假设1- - - - - -2,它的收益率在哪里。用(14)(12), 作为 ,考虑(2)的假设1,它源于(12), 应用引理1(16)和收敛条件(10),我们有作为 ,从(16),有应用引理1(18)和收敛条件(10)和考虑(17),我们得到假设 ,有作为 ,它遵循从(15), 应用引理1(21)和收敛条件(10)和考虑(17)和(20.),我们可以推出最后,基于数学归纳法,可以推导出以下结果: 注意的是(2在假设1,那么它可以获得(15)和(24), 此外,为 ,它遵循从(1)和(4), 然后,我们有为。完成证明。

4所示。EA-HOILC方案与最优控制收益

定理1提供HOILC提出的渐近收敛。众所周知,控制收益可以显著地影响收敛性能。在本节中,控制收益HOILC发达的部分3由EA优化减少收敛迭代。

EA是智能优化算法,模拟生物进化的过程中,获得最优的解决方案。EA-HOILC提出了如下的主要思想。

4.1。编码策略

本文的控制收益HOILC实数,这是适当的选择真正的编码策略。优化的控制收益HOILC法(7)和( )。自收敛条件(8),它很容易获得。因此,我们可以假设变量向量在EA ,表示为和编码策略

4.2。种群初始化和个人评价

基于收敛条件(8)- (10),的值范围控制收益和为可以确定。因此,可以根据产生初始种群收敛条件。让人口规模,不失一般性,假设是偶数。变量的向量个人在人群中表示为这是初始化为为。另一方面,为变量 ,让系统输出th个人在个时间点是。评估个体优势,以下适应度函数的th个人建立: 在哪里是一个常数足够大吗是跟踪误差的绝对值的总和表示为

适应度函数(27)和初始变量 ,最初的健身价值th个人是获得。然后,我们有以下初步健身向量人口:

因此,最初的人口被构造成人口的初始变量在哪里吗

从(31日),th ( )变量的th ( )个人表示为th排列。最后一列的所示(30.)中相应的初始变量的健身价值。

4.3。选择策略

个人到下一代轮盘赌选择策略和精英主义的策略。个人更大的健身价值更高概率的轮盘赌选择策略。然而,轮盘战略的一个缺点是,最好的个人老人口可能会错过。所以,我们采用精英策略,以确保最好的个人可以保留上一代。由于这两种方法,收敛数代的EA可以减少。

4.4。交叉算子

交叉概率取决于一个人需要交叉。为th个人, ,一个随机数产生0和1之间,表示为。如果 ,交叉操作发生。否则,不发生交叉操作。由于真正的编码策略,采用算术交叉算子。假设的变量向量th和 th父个体和 ,分别选择交叉。交叉后,生成两个新的个体,变量的向量表示为和。为 ,交叉操作表示为在哪里交叉的权重吗th和父个体。

4.5。变异算子

在本文中,我们采用随机变异策略。让变异概率。为th个体之间的号码是随机产生0和1表示为 , 。如果 ,变异操作发生。否则,不发生变异操作。让变量的向量个人选择的变异。突变后,一个新的变量向量生产。变异算子的定义是在哪里突变的权重吗个人。

4.6。终结的条件

终结的条件可以由健身价值或跟踪误差。在模拟,生成在EA设置为100。最后,我们可以获得最优控制收益( )和( )从最好的个体根据收敛条件(由EA。8),最后控制增益推导出的。

4.7。拟议中的EA-HOILC的概述

提出EA-HOILC描绘在图的流程图1。首先,根据控制收益特点和收敛条件(9)和(10),初始变量( )是获得。然后,我们应用传统HOILC 在每个初始控制收益 ,在收敛条件(8)被认为是。通过跟踪误差与所示(29日)由HOILC,对应的健康( )来自(27)。结合和为 ,最初的人口所示(31日)和(30.)和(32)生产。其次,选择、交叉和变异是由选择策略、交叉算子和变异算子,分别。在那之后,一个新的输入 , ,获得的最优控制收益。EA-HOILC设置初始控制输入 , 。然后,HOILC与最优控制增益过程就开始了。

5。模拟

验证的有效性提出EA-HOILC,采用双连杆机械鱼。系统的动态双连杆机械鱼描述如下(22]: 在哪里机器鱼的质量, 公斤/米水阻力系数,表示速度是尾运动产生的推力。让速度和向前的推力是系统状态和控制输入 ,分别在哪里是采样时间。我们可以使离散系统(34)通过使用。因此,离散时间系统在哪里和。

参考轨迹是表示为输出与。拟定HOILC算法,设置命令。控制收益 , ,和由EA选择。另一个控制增益是获得收敛条件(8)。交叉概率 ,和变异概率。评估跟踪性能,三个跟踪上的索引和绝对误差 ,总平方误差 ,和最大绝对误差定义如下:

运行仿真,EA-HOILC 10次,和优化控制收益表所示1。

图2展品在迭代系统输出性能 , ,和通过使用EA-HOILC平均值的最优控制在10次。EA-HOILC之间比较收敛速度和传统HOILC与不同的参数,控制收益HOILC提出(30.分别与二阶),选择如下两种情况。案例1: , , ,和和案例2: , , ,和。相应的绝对误差之和 ,总平方误差 ,和最大绝对误差跟踪图所示3。从图3啤酒,一个人可以观察到这种情况控制收益 , ,和可以实现传统HOILC更快的收敛速度。此外,它显然是表明该EA-HOILC可以使收敛迭代小于传统HOILC相同的顺序。

6。结论

摘要HOILC法利用几个以前的跟踪信息迭代非线性离散时间系统,提出了。收敛是严格地分析了基于数学归纳法。为了提高发达HOILC的收敛性能,介绍了EA与全局优化来优化控制收益。与最优控制,提出EA-HOILC可以实现更快的收敛速度。在模拟,结果表明,绝对误差,总平方误差,最大绝对误差的跟踪EA-HOILC收敛速度比传统HOILC顺序相同。然而,值得注意的是,因为EA采用选择控制收益,EA-HOILC的离线计算时间较长。它非常适合的情况下只需要更少的迭代。例如,使用炸弹摧毁目标,该方法可以减少炸弹的数量计算时间的成本。未来的研究将延长EA-HOILC本文开发的动力系统的不确定性在真实的应用程序中35- - - - - -37]。

数据可用性

使用的数据来支持本研究的结果包括在本文中。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究的部分资金由中国国家自然科学基金批准号。61903096和62173101,广州的科技项目批准号201904010475,和芷江实验室开放项目批准号2021 kf0ab06。

引用

c·l·p·g . Peng陈,c .杨”增强神经网络最优导纳控制robot-environment交互使用强化学习,”IEEE神经网络和学习系统,1 - 11,2021页。
视图: 出版商的网站 | 谷歌学术搜索
d .黄、h·詹和c·杨“阻抗模型最优监管力量和用双手的机器人的位置来保存一个对象,“复杂性ID 3561807条,卷。2020年,13页,2020。
视图: 出版商的网站 | 谷歌学术搜索
h .黄、杨c和c·l·p·陈,“最佳robot-environment交互在广义模糊神经自适应控制下,“IEEE控制论,51卷,不。7,3824 - 3835年,2021页。
视图: 出版商的网站 | 谷歌学术搜索
杨黄d . c . y .锅,l . Cheng“综合学习增强神经控制机器人机械手与输出误差约束,“IEEE工业信息,17卷,不。1,第218 - 209页,2020。
视图: 谷歌学术搜索
黄c, d . w .他和l . Cheng”神经控制的机器人机械手轨迹跟踪输入饱和约束和,“IEEE神经网络和学习系统,32卷,不。9日,第4242 - 4231页,2021年。
视图: 出版商的网站 | 谷歌学术搜索
z赵,z . Liu w .他k . s .香港和h x,“边界自适应容错控制对于backlash-like滞后的一个灵活的得票率最高的手臂,“自动化ID 109690条,卷。13日,2021年。
视图: 谷歌学术搜索
z赵、c·k·安和H.-X。李,“边界抗干扰控制空间非线性柔性字符串系统,”IEEE工业电子产品,卷67,不。6,4846 - 4856年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
赵z、x他和c·k·安”边界扰动observer-based单键柔性机械臂振动控制,”IEEE系统,人,和控制论:系统,51卷,不。4、2382 - 2390年,2021页。
视图: 出版商的网站 | 谷歌学术搜索
w·他·t·孟,s, j。刘、李g和c .太阳”Dual-loop自适应迭代学习控制的得票率最高输出约束和梁输入反弹,”IEEE系统,人,和控制论:系统卷,49号5,1027 - 1038年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
k .广域网和X.-D。李,”鲁棒迭代学习控制的二维线性离散FMMII系统iteration-dependent不确定性,”IEEE系统,人,和控制论:系统,51卷,不。10日,5949 - 5961年,2021页。
视图: 出版商的网站 | 谷歌学术搜索
d .濛和j·张,”鲁棒迭代学习控制的收敛分析对nonrepetitive不确定性:系统等价变换,“IEEE神经网络和学习系统,32卷,不。9日,第3879 - 3867页,2021年。
视图: 出版商的网站 | 谷歌学术搜索
郑阮j·刘,x, y,“迭代学习控制离散时间系统与完整的易学性,”IEEE神经网络和学习系统,2020年1 - 15页。
视图: 出版商的网站 | 谷歌学术搜索
c . j . Chen华,x关”迭代学习模范自由控制网络系统的双向数据辍学和致动器的缺点,”IEEE神经网络和学习系统,32卷,不。11日,第5240 - 5232页,2021年。
视图: 出版商的网站 | 谷歌学术搜索
侯问:Yu z、x布鲁里溃疡,和玉,“RBFNN-based数据驱动的预测不均匀的非线性系统的迭代学习控制,”IEEE神经网络和学习系统没有,卷。31日。4、1170 - 1182年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
x布鲁里溃疡,j .梁z侯,r .太极,“数据驱动的终端迭代学习共识为非线性多重代理系统输出饱和,”IEEE神经网络和学习系统,32卷,不。5,1963 - 1973年,2021页。
视图: 出版商的网站 | 谷歌学术搜索
十斤,“容错迭代学习控制移动机器人非重复性的轨迹跟踪和输出约束,“自动化卷,94年,第71 - 63页,2018年。
视图: 出版商的网站 | 谷歌学术搜索
x t·孟、w .他和他,”一个灵活的弦系统的跟踪控制基于迭代学习控制,”IEEE控制系统技术卷,29号1,第443 - 436页,2021。
视图: 出版商的网站 | 谷歌学术搜索
w·他·t·孟,x, c .太阳”迭代学习控制分布式干扰下扑翼微型飞行器,“IEEE控制论卷,49号4、1524 - 1535年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
x布鲁里溃疡,问:玉、侯z和w·钱”模型自由自适应迭代学习共识为一类非线性多重代理系统跟踪控制,”IEEE系统,人,和控制论:系统卷,49号4、677 - 686年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
x, d .沈,b .叮”迭代学习控制非线性系统的输出跟踪与不可用状态信息,“IEEE神经网络和学习系统,1 - 8,2021页。
视图: 出版商的网站 | 谷歌学术搜索
r . j . l . Wang Yu, p . Li和f·高,“迭代学习控制多相间歇过程与异步切换、”IEEE系统,人,和控制论:系统,51卷,不。4、2536 - 2549年,2021页。
视图: 出版商的网站 | 谷歌学术搜索
李x、问:任和j .徐“精确速度跟踪控制的机器鱼通过迭代学习控制,”IEEE工业电子产品,卷63,不。4、2221 - 2228年,2016页。
视图: 谷歌学术搜索
孟d和k·l·摩尔:“基于映射收缩健壮的不确定的迭代学习控制收敛,局部李普希非线性、”IEEE系统,人,和控制论:系统,50卷,不。2、442 - 454年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
王x和j·王,“迭代学习控制的特色站李普希茨非线性奇异微分方程一致的,”国际期刊的健壮和非线性控制,30卷,不。17日,第7805 - 7791页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
r . x、y Lv和z侯,“补偿基础地理数据驱动的ILC与输入和输出包辍学,”国际期刊的健壮和非线性控制,30卷,不。3、950 - 965年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
j .孟张和d“收敛分析饱和与局部李普希茨非线性迭代学习控制系统,”IEEE神经网络和学习系统没有,卷。31日。10日,4025 - 4035年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
j .史j .徐j .太阳,y,“时变系统的迭代学习控制问题变量通过长度:应用机器人机械手,”IEEE工业电子产品,卷67,不。10日,8629 - 8637年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
问:Ai, d·柯j .左et al .,“高阶模范自由自适应迭代学习控制的气动人工肌肉增强的融合,“IEEE工业电子产品,卷67,不。11日,第9559 - 9548页,2020年。
视图: 出版商的网站 | 谷歌学术搜索
d .濛和j·张,”鲁棒跟踪nonrepetitive学习控制系统与iteration-dependent引用,“IEEE系统,人,和控制论:系统,51卷,不。2、842 - 852年,2021页。
视图: 出版商的网站 | 谷歌学术搜索
y s魏x·d·李,“强大的高阶非线性离散时间系统的ILC不同轨迹长度和随机初始状态的变化,“专业控制理论与应用,11卷,不。15日,第2247 - 2240页,2017年。
视图: 出版商的网站 | 谷歌学术搜索
m .太阳和d . Wang”分析非线性离散时间系统的高阶迭代学习控制,”动力学和控制11卷,第96 - 81页,2001年。
视图: 谷歌学术搜索
z的歌,h . Wang c .他和y,”一个Kriging-assisted two-archive进化算法对昂贵许多客观优化”IEEE进化计算,25卷,不。6,1013 - 1027年,2021页。
视图: 出版商的网站 | 谷歌学术搜索
张x, y田c . Wang和y,“大规模稀疏的多目标优化问题的进化算法,”IEEE进化计算,24卷,不。2、380 - 393年,2020页。
视图: 出版商的网站 | 谷歌学术搜索
l . Chen H.-L。刘、k . c . Tan和k . Li”转移学习基于并行进化算法框架,双层的优化,“IEEE进化计算,p . 2021。
视图: 出版商的网站 | 谷歌学术搜索
赵z和z刘”,限定时间收敛扰动抑制控制灵活的得票率最高操纵者,”IEEE / CAA自动化杂志》上,8卷,不。1,第168 - 157页,2021。
视图: 出版商的网站 | 谷歌学术搜索
k .广域网和x·d·李,”鲁棒迭代学习控制的二维线性离散FMMII系统受iteration-dependent不确定性,”IEEE反式。系统。,Man, Cybern., Syst.,51卷,不。3、1462 - 1472年,2021页。
视图: 出版商的网站 | 谷歌学术搜索
z赵、c·k·安和H.-X。李:“死区补偿和自适应不确定的空间柔性立管系统的振动控制,”IEEE,25卷,不。3、1398 - 1408年,2020页。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

294年

下载

694年

引用