文摘

的问题当然跟踪控制under-driven USV在复杂的外部环境下,自适应控制律设计是通过构造迭代滑模函数,利用李雅普诺夫稳定性理论的基础上,船舶运动的动力学模型。RBF神经网络控制技术和自适应控制技术集成到控制算法和迭代滑模跟踪控制器的无人水面舰艇adaptive-neural网络设计。RBF神经网络的在线强化学习是由强化学习算法,提高了网络的逼近性能。此外,收缩因子的粒子群优化应用于控制参数的优化来提高控制系统的适应性和鲁棒性。性能实验验证的有效性和实用性自适应迭代滑模控制算法基于强化学习的无人水面舰艇和粒子群优化算法;同时,比较跟踪实验验证提出USV综合性能的过程跟踪控制系统优于遗传优化神经网络滑模控制系统。因此,融合多种算法可以应用于改善控制系统的性能。

1。介绍

无人水面舰艇(USV)是一种任务主要用于执行危险的任务或任务不适合载人船只。具有良好的应用需求和发展前景。研究USV的运动控制具有重要的理论意义和实用价值。自主技术可以减少USV远程操作符和无线传输带宽的依赖。通过自主技术,USV可以配合海洋表面车辆,水下潜水器,和低空的车辆。过程跟踪控制的核心技术之一是USV自主导航,它已成为学术界的一个研究热点。同时,针对USV独特的数学模型的特点,在多变的环境干扰,这是一个潜在的工程应用需求建立一个适当的和有效的控制系统来提高USV课程跟踪性能。

USV的具体操作要求,国内外学者试图控制方法及其改进方法应用于USV的运动控制系统。在[1],针对twin-body通道类型的自主导航控制需求USV USV过程控制的操作过程进行了分析,模糊数学理论用于构造控制的模糊集,和模糊PID控制算法的设计。实际船舶航行测试验证,该算法具有较强的环境适应性和快速收敛能力。捕获过程跟踪控制的问题USV命名为“Lanxin”,运动控制器USV基于模糊自适应PID设计并实现在2]。卡尔曼滤波算法用于融合的态度数据USV和“Lanxin”无人地面车辆嵌入设计并实现。船的实际验证结果表明,在实际海洋环境干扰条件下,航向跟踪控制器具有良好的动态和静态控制性能和抗干扰能力。文献[3)研究合作USV航向和速度控制的一种方法基于模糊自适应算法,避免了船体运动建模问题在传统的方法,提高了模糊控制策略和算法,结合自适应因子,提高了控制方法的不确定性和地表环境中适应性和鲁棒性。进一步提高的路径跟踪算法的适应性自治停泊在4),PID控制器实现航向控制,模糊控制纳入视线的方法,自主无人船的靠泊控制完成。在[5),基于网络的建立USV航向控制系统模型,借助李雅普诺夫稳定性原理和凸分析方法,逆设计的渐进稳定性判据的控制系统进行网络环境下,基于网络的航向控制器和观察。推方法和李雅普诺夫理论,非线性航向控制器设计(6,仿真结果证明了该控制器的动态特性和良好的鲁棒性。在视图的限制控制输入,一个径向基函数(RBF)神经网络(7)是用于构建一个在线补偿,这是融入SMC USV实现鲁棒航向控制的控制输入饱和。

由于滑模控制(SMC)是不变的系统参数变化和外部干扰,和算法的设计过程相对简单,所以它适用于非线性动态系统的控制设计。在[8),设计滑模控制器通过构造李雅普诺夫能量函数,这简化了heading-maintaining非线性控制器的设计过程。然而,一个控制器构造李雅普诺夫函数不能保证设计的控制器具有良好的控制性能和鲁棒性性能。文献[9)提出了一种新颖的非线性反馈控制方法通过调节滑模控制的错误一个正弦函数和喂养它回控制器。与线性反馈控制相比,该方法的优点是更安全、节能。非线性迭代滑模变结构的基础上,船舶航向控制增量反馈算法构造(10),这是用于USV航向控制系统的设计,和应用仿真验证算法对系统的扰动不敏感模型和外部干扰变化。消除稳态误差的控制系统,在11滑模设计的),在这个过程中,积分函数结合来构造一个线性auto-disturbance-rejection积分滑模控制器,它能加速系统的收敛速度。仿真表明,所设计的控制器的结构可以快速、准确地跟踪期望的过程很简单。降低抖振引起的滑模切换,如收敛速度慢收敛时间长和严重的喋喋不休,一个新的终端滑模控制与小说达到法律提出了usv过程控制(12]。自适应动态表面基于神经网络的滑模控制器(13)提出了(14克服系统模型的不确定性,和模拟显示,这艘船可以快速稳定在某一指定标题。

然而,固定参数严重限制了SMC系统的适应性和鲁棒性,和这些参数需要同时优化的网络。群优化算法有能力的多参数综合优化,它提供了一种新方法来解决这个问题。自动驾驶的智能控制器usv卷积神经网络和蚁群优化设计(15),并与PID控制算法相比,新智能预测控制器性能优越。粒子群优化算法应用于在线课程的优化参数的控制器(usv的16),提高了控制器的自适应能力和抗干扰能力。针对不确定因素的滑模控制律设计RBF网络,采用改进的遗传算法优化RBF网络的参数(17)在线获取理想的滑模控制律(18)为USV到达准确的过程跟踪控制。这是一个事实,而遗传算法(GA)和粒子群算法(PSA)在相同的情况下,微分进化算法(DEA) (19是最快的进化算法。

船舶运动控制系统的设计几乎是基于船舶操纵运动数学模型。目前,船舶模型常用于设计过程跟踪控制主要包括野本模型,Fossen模型和MMG模型(19]。其中,一些研究结果使用野本模型设计控制系统,例如,在20.),在分析的过程中存在的干扰因素USV帆船和运动数学模型的基础上USV干扰模型分类和建模。然后,自适应运动的数学模型USV航行方向的干扰下wind-wave-currents环境建立了基于模糊控制理论(21野本)和模型。针对航向控制问题的影响下的动态环境中导航无人船,野本USV运动数学模型的基础上,介绍了动态面控制技术解决控制系统的非线性特征,确保全球稳定;和RBF神经网络用于近似不确定项消除全球海洋环境的影响,实现精确的航向控制的效果22]。一种鲁棒自适应usv转向控制方法是将自适应模糊系统纳入设计的动态面控制克服模型不确定性和控制输入饱和的问题(23,24]。在USV非线性控制器的设计,由于部分的介绍 控制操作符和非线性多项式,控制器调优参数的数量增加,以及控制器优化的难度增加。因此,膜系统的算法的基础上,应用粒子群算法优化细胞膜算法防止当地的最适条件,提高控制器的效率和适应性(25]。轨迹线性化控制算法应用于实际工程的航向控制“Lanxin”无人表面工艺,考虑到未建模动态的影响和海洋环境干扰的运动控制水面无人艇。扰动观测器结合轨迹线性化控制和轨迹线性化控制器根据时标分离的快和慢循环提出了26]。在[27),针对的问题无人地面车辆(USV)航向跟踪很容易受到风的影响,波,和电流干扰,a 健壮的航向跟踪控制器的基础上,提出了线性参数不同(LPV)模型。船,实际的实验验证了该控制器的有效性。

其他人使用Fossen模型控制设计,例如,在文献[28),针对大型的外部干扰和未知参数的问题标题在标题控制USV控制模型;的基础上Fossen USV运动数学模型,构造动态反馈控制算法通过使用控制性能指标作为事件驱动因素和多个识别模型的转换方法。在文献[29日),为提高USV运动系统的鲁棒性在不同的海洋条件下,在Fossen模型中,国家的错误和系统纵向速度,作为独立变量,应用于构建在线优化PID方法处理的影响系统的纵向速度耦合项的标题USV。此外,李雅普诺夫理论验证控制算法的稳定性。系统测试在不同的海洋条件下显示在线自优化控制参数可以优化网络根据系统的纵向速度和航向误差,验证控制系统具有较强的抗干扰能力和鲁棒性。考虑洋流等外部干扰的影响,Fossen USV运动模型的基础上,无人机航向和速度控制算法设计使用滑模自适应技术来实现纵向速度和航向角的稳定跟踪误差(30.]。基于李雅普诺夫理论和串级系统理论,统一semi-global指数和均匀的轨迹跟踪控制系统的全局渐近稳定。

与野本和Fossen模型相比,MMG模型的优点是,控制系统的输入是主要的发动机转速和舵角,这是符合的实际驾驶船。所以,在文献[31日),针对吊舱式推进USV的航向保持控制,一种快速、非奇异终端滑模航向保持策略,提出了基于线性滑模和非奇异终端滑模。快速,非奇异终端滑模控制器提出了(32基于RBF神经网络和模糊算法。扰动观测器用于补偿干扰减少控制增益,和RBF神经网络与模糊算法应用于近似符号函数来减少切换喋喋不休。2型模糊神经网络(33)添加到滑模控制有效地处理不确定性的系统,提高方法的非线性表示功能,控制系统的性能将会加强。同样,在文献[19),船的轨迹跟踪控制问题,MMG模型用于迭代滑模控制设计,得到系统控制变量是输入值的主要发动机转速和舵角,这是符合现代商船的实际驾驶模式。控制系统,一组参数优化(18)单位综合提高控制器的适应性和鲁棒性。

灵感来自研究结果,构建迭代的方法使用滑模设计二阶迭代滑模面综合运动数学模型的基础上“Fossen + MMG”(34),和航向控制问题转化为稳定的滑模面问题;航向控制律是获得与李雅普诺夫稳定理论。

针对系统不确定项和未知的存在外部干扰项的控制律,计算不能直接执行。系统不确定性项由RBF神经网络近似,未知的范围和外部干扰项估计的自适应控制技术,然后自适应迭代滑模控制律。通过定义控制输入颤振测量变量和强化学习信号,RBF神经网络的参数在线调整与强化学习方法进一步提高网络的逼近性能和抑制颤振的控制变量。

此外,考虑到有大量的设计参数设计的控制系统,其价值组合对系统控制性能的影响更大,由人类和主观的选择未必使系统健壮。因此,粒子群优化算法集成到控制系统形成一个闭环,实现在线控制参数优化。最后,通过上述系统控制律设计可以有效地处理模型不确定性和海洋状态扰动的影响。系统设计方案的基础上,两种优化算法的融合奠定了基础数学USV轨迹跟踪控制设计复杂的工作环境和自主停泊控制数学模型设计无人驾驶船只。

2。船舶运动模型

很难将船舶的航行速度和外部干扰集成到使用野本的控制设计模型。,Fossen模型需要船舶纵向推力和转向力矩控制器输出,这是方便船控制的设计与分析力和扭矩,但它们不能直接获得。然而,使用数学模型的MMG模型船舶运动控制的研究可以进一步将其转换为舵角和柴油机油门,控制系统的输入。自船舶运动依赖柴油引擎和舵角的速度,控制变量设计MMG模型实际感到满意。

考虑到两种模型的优点,本文将合并这两个模型和互相学习。Fossen模型的原型,只有纵向螺旋桨的推力和转向舵机的时刻,也就是说,两个自由度的升沉和船舶摇摆,发挥主要作用的MMG模型被认为是;而其他自由度相对较少的力量影响导航过程被视为干涉力量,如纵向推力和横向推力转向后生成。此外,数学模型船舶运动模型转化为一个仿射非线性系统(35)与舵角和螺旋桨速度作为控制变量。

其中,纵向螺旋桨的推力 和操舵装置的转向力矩 表示为 在哪里 螺旋桨的推力分数; 纵向横向的协调行动点舵; 的校正因子steering-induced船体的侧向力; 是距离中心的侧向力船的中心;和 操舵装置的舵角。的表达式 如下(36]: 在哪里 螺旋桨的速度; 是海水密度和螺旋桨的直径,分别; 分别是螺旋桨推力系数和速度系数; 舵叶的面积; 斜率值升力系数的攻角吗 ; 舵叶的有效流速;和 是有效的攻角。在的范围 ,的近似计算 可以使用。

为数学USV单螺旋桨和舵,综合运动“Fossen + MMG”的数学模型 在哪里 中心的位置; , , 代表了影响速度、偏航速度和偏航速度USV分别; 是USV的航向角; 当前的速度; 电流的方向; , , 高阶水动力条件; , , 代表惯性参数,包括额外的质量; 的修正项是粘性流体动力学的船体的时刻; 螺旋桨增益; 是控制舵增益; , , 主要用于表示无边无际的海洋环境外部干涉力和力矩包括风力、波浪、洋流。在实际工程中,获得螺旋桨和舵舵是有限的,和螺旋桨增益的表达式 和舵 在哪里 相关因素,如船舶类型,与船体螺旋桨大小和相对位置。很难从理论计算方法。它通常是获得经验公式,它可以知道 ; 通常是0∼1的范围内变化; 总是积极的,所以呢 总是正的。 , 是这艘船的长度; 一般0∼1的范围内变化; 的范围随−0.5∼−0.4;根据船舶操舵的约束条件 , 是一个常数积极词; , , 都是大于零,所以呢 也是常数。

3所示。当然设计跟踪控制与迭代USV滑动模式

3.1。双曲正切函数迭代设计滑模控制与基于李雅普诺夫稳定性

数学模型USV运动模型(3)用于课程设计迭代滑模跟踪控制器。控制的目的是将实际的课程 USV能够跟踪所需的课程 ,也就是说, 定义的偏差 随着 ,,并 课程的目的为目标,控制转化为标量的稳定控制系统。

事实是,滑动模式决定了变结构系统的控制性能和控制滑动阶段的质量。自转向驱动输入的舵角USV是有限的范围内(−35°35°),当偏差很大,应适当减少避免控制增益饱和的操舵装置;当偏差值很小,为了稳定USV所需的课程尽快控制增益应适当增加。

上述点不能通过线性滑模控制来实现的。出于这个原因,介绍了非线性双曲正切函数与饱和特性对滑模设计。双曲正切函数表示为

从(5),它可以获得,当 ,函数的斜率值较大;作为 逐渐增加,斜率值非线性减小,直到接近零。因此,双曲正切函数满足控制目标要求和操舵舵的约束条件。此外,使用双曲正切函数控制设计也可以确保控制信号有界,和界限明显。

的具体步骤将双曲正切函数集成到设计的非线性迭代滑模控制器如下:

第一步是设计非线性滑模当然偏差 在哪里 是标题的滑模面函数偏差 ; 是正实数。

它可以看到从(6),当 , ,也就是说,当 很小, 将收敛指数形式;当 很大, 将线性形式接近收敛 的联合行动 ,非线性滑模的最大斜率 可以调整。因此,航向控制问题转化为稳定的问题

第二步是构造一阶滑模面和功能关系控制舵角 结合双曲正切函数,第二个滑模设计 在哪里 是正实数。

的基础上(6在(),它可以获得7),当 , ,然后控制目标是进一步转化为稳定的控制 确保的收敛速度 是速度比 ,预设,

此外,(7)是扩大获得 在哪里 ,

第三步是利用李雅普诺夫稳定性理论设计的控制律USV过程跟踪。以下构造李雅普诺夫函数:

此外,通过(9),它被称为

为了使系统逐步稳定,是确保(10)是小于或等于零,构造以下形式: 在哪里 是正实数。

因此,它得到了

因此,如果 满足(12),设计控制系统逐渐稳定。这种稳定状态可以抑制滑模抖振问题的表面,使系统动态适应不确定性和外部干扰。

最后,它是获得了舵角控制律用(8)(12)。

舵角控制律的作用下(13),过程控制数学模型的误差USV渐近收敛,并最终趋于零。

然而,由于非线性函数 模型包含高阶系统的水动力条件,它不能直接计算;和外部 不能直接测量。因此,舵角控制律(13)需要进一步改善。

3.2。设计RBF神经网络的自适应控制器和自适应算法

由于神经网络具有很强的非线性逼近能力,介绍了RBF神经网络近似 在纸上。此外,采用一种自适应算法来估计未知外来干涉的边界值 随的变化当然USV。

基于的理念,本节设计一个adaptive-neural网络迭代滑模跟踪控制算法,和它的设计架构如图所示1

在图1,系统的输入是所需的课程 ,和输出是实际的课程 的偏差 通过反馈可以从控制舵角 通过非线性迭代滑模控制器。

在滑模控制律设计(13)估计分别使用RBF神经网络算法和自适应算法,然后两人重新分配的估计价值的控制律。

RBF神经网络的输入和输出算法 在哪里 是网络输出; 是理想的网络重量; 是网络近似误差;和 是高斯函数,计算方程, 在哪里 网络的输入; 高斯函数的参数。

RBF网络图1,作为它的输入 ,那么它的输出是 在哪里 无法在实践中获取 用作估计价值的 , 是估计错误, ; 由RBF神经网络获得的估计价值的

用RBF神经网络的输出值(16)(13),这是获得

假设:干扰 ,的估计误差 ,和近似误差 RBF神经网络,是一种理想的边界值 , 建立了。

所以,下面的舵角的自适应控制律可以设计: 在哪里 , 是设计参数,函数的 是抑制抖振的控制舵角,然后呢 估计的价值吗

用自适应控制律设计的(18) 在(8),是获得

然后,它被称为 在哪里 的估计误差 ,

此外,借助李雅普诺夫稳定性理论,自适应RBF神经网络权重法和外部干扰的设计。

全球构造李雅普诺夫函数如下: 在哪里 设计参数。

通过推导(21),它是后天获得的,

为了确保的价值(22)不是积极的,以下选择自适应法:

用(23)(22),是获得

因此,设计的舵角控制律的作用下(18),过程跟踪控制误差的数学模型USV运动系统逐渐收敛,最终趋于0。因此,设计adaptive-neural网络迭代滑模控制系统是稳定的。

3.3。参数优化的自适应跟踪控制器

它可以知道USV控制特点的课程价值的大小与转向角的大小密切相关。在实际操作中,减少横向倾角的风险,除了在紧急情况下,应避免过度的舵角时转向。一旦控制器设计不合理或参数不合适,这种波动的频率和幅度将会增加。所以,颤振的输出应该最小化舵延长设备的寿命,提高控制效果(15]。可以看出,在不同的外部环境和工作条件下,如果非线性迭代设计滑模控制器的参数可以调整和优化,提高控制系统的性能。

在控制器设计部分3.2在RBF神经网络 可以学习、调整和优化根据自适应法律,但 没有这种能力。同样,舵角控制律,七个控制参数( , , , , , , , )没有调整的能力。众所周知,每个参数的控制器或多或少影响了控制效果。由于大量的手动控制参数难以充分优化,很难达到预期的目标(17]。

因此,为了改善系统的控制性能,提高使用寿命,强化学习(37,38)和粒子群算法(39,40)应用于优化RBF本地网络和设计参数的迭代滑模控制系统,分别,然后集成到优化输出非线性迭代USV滑模过程跟踪控制系统,所以设计系统的自适应能力。

3.3.1。自主学习在RBF神经网络的参数

学习算法(41)与导师通常采用RBF神经网络的参数学习。但对于未知的词f模型的输出结构,其不同工况下的期望值是未知的。所以,是不可能获得一个清晰的导师信号。因此,本文使用的强化学习算法42)更换导师学习算法。只使用相对粗糙的训练数据,基于“评估”信号,也就是说,增强信号,控制效果的利弊评估通过与环境的互动,和RBF网络加强通过“奖励”和“处罚”,提高RBF网络的逼近性能。在本节中,强化信号是根据测量值轰轰烈烈的计算 ,然后使用上述强化学习方法实现自主学习在RBF神经网络的参数。

在每一个学习周期,每个神经网络的输出对应于变异 宽度参数的高斯函数,和宽度参数 将调整根据以下表达式: 在哪里 代表了j宽度参数在时间 ; 是下一个周期的宽度参数; 的变化吗j宽度参数在时间

输出错误 RBF神经网络被定义为 在哪里 是未知的期望值

因为系统的控制效果,可以间接反映参数是否合适,喋喋不休的控制舵角 是用来近似这个错误(43]。

在这里, 是预期的舵角喋喋不休,的绝对值的和控制的变化n迭代周期。

n周期,如果 的增加, 增加,否则, 减少。因此,实时改变 用于动态调整参数的神经网络系统。的计算 是(19), 在哪里 期, 舵角相邻时期之前和之后, 表示数量的积累, 被定义为

系统输出的变化趋势随抖振的发生。聊天是通过方程(28在最后一个周期。

然后,宽度参数的变化 表示为 在哪里 是学习效率的因素。

因此,学习的过程jth宽度参数 可以计算为

同样,中间参数的学习算法 的高斯函数

3.3.2。迭代滑模控制器的参数优化

迭代滑模控制器的参数优化的目的是获取一组合适的初始参数( , , , , , , )通过构建绩效指标和解决其最优值。在这里,ITAE指标(44选择如下: 在哪里 是定义的索引; 是时间;和 是跟踪误差。

优化的目的是最小化 控制系统,通过多个实验找到最优参数组合。完成所需的USV作为优化的数据中获得最优参数。是更有效的使用电脑搜索参数的最佳组合。

粒子群优化(PSO) (45)在1995年提出。PSO算法应用于寻找最优解决方案 维搜索空间。人口 粒子。和粒子被表示为一个向量 ,代表的位置吗粒子在空间。设计适应度函数 采用计算每个粒子的适应度值位置 这代表了潜在的最优解。同样,的速度th粒子 和个人的极端值 ;人口的极值

在优化过程中,每个粒子的速度调整动态实时地根据自身的经验和其他粒子的运动情况来完成优化的解决方案空间(46]。和每个粒子的速度和位置更新由以下方程: 在哪里 是惯性因素; , ; 迭代次数; 粒子速度; 因素, ; 分布的随机数在[0,1]。

为了防止盲目搜索,更新的速度调整粒子群根据PSO与收缩率的方法(47),(34)是适应, 在哪里 , ; 收缩因子,用于控制系统的收敛速度,所以算法实现高质量的解决方案。然而,当 是人为确定, 也决定和固定。

由于粒子群优化算法搜索速度慢的在以后的阶段,很容易产生局部极值的问题(48]。该方法在47)被称为固定收缩因子方法,限制了算法的效果。为了解决这个问题,本文引入了混沌模型改进算法。混沌优化算法(COA)对初始值敏感,高计算精度和全局收敛性(49]。因此,介绍了优化算法的逻辑映射模型的参数(50]。 在哪里 调整后的值; 是惯性因子的上界和下界。 在哪里 在哪里 ; 是上下界。

在这个过程中,参数之间的过渡混沌粒子群优化(复)模块和仿真软件模块是粒子和健身价值。首先,混沌粒子群产生粒子;接下来,粒子直接分配给过程跟踪控制器的参数;然后,控制系统仿真软件模块贯穿USV运动模型获取评价指标;此外,评价指标被发送回复模块;最后,它是判断是否满足终止条件。具体操作过程如下:步骤1。初始化参数复随机生成所有粒子的位置和速度和获取 由方程(34)和(35)。步骤2。混沌粒子群将值赋给控制器参数,用于进行过程跟踪控制USV,然后健身价值计算的性能指标函数 步骤3。与当前选择更好的健身价值 从通过每个粒子的最优位置。步骤4。选择更好的健身每个粒子当前的价值 从整个混沌粒子群的所有粒子。第5步。判断结束或回去。如果不能满足终止条件,回到第2步。如果满意,参数优化过程结束并退出。

4所示。计算机模拟

在实际的导航,USV需要不同的工作条件下执行任务。单个标题维护不能满足工作需求,并需要进行变量跟踪控制。验证设计课程的有效性跟踪控制器USV神经网络的基础上强化学习和混沌粒子群优化算法,USV命名为“Lanxin”(17)是引用的仿真实验。

4.1。变量过程跟踪实验
以下4.4.1。实验最初的环境和参数设置

在仿真过程中,所需的USV选择变化分别为30°和0°和周期是500年代。最初的船是0°,和最初的船的速度是8.5 kn。外部的干扰海洋环境设置为:风的速度和方向分别为10 m / s和110°;海流的速度和方向分别为2米/秒和110°;波高是3米,0.75赫兹接触的频率。

RBF网络的隐层的数量是41岁的c1是均匀分布在(−20、20)c2(−1,1)上均匀分布,c3上均匀分布(−0.5,0.5),c4均匀分布在(−0.25,0.25), , , , 在混沌粒子群参数设置, , , , ,和迭代的最大数量是50。

4.1.2。结果和分析变量的跟踪控制实验课程

课程设计跟踪控制器USV基于强化学习和混沌粒子群优化算法应用于跟踪控制实验变量课程导航条件下预设的under-driven USV部分以下4.4.1。跟踪控制实验的结果变量课程中演示了数据3- - - - - -6

3演示了under-driven USV课程的期望和实际曲线跟踪。它获得的实际课程under-driven USV完全跟踪所需的标题在170年代,拥有之后;同时,实际的曲线输出光滑没有嚷嚷起来。所以,课程设计跟踪控制器的有效性和稳定性基于强化学习的USV和混沌粒子群优化算法验证的角度航向输出。

4控制器的输入曲线,即输入舵角控制曲线。它获得输入舵角曲线光滑连续,无嚷嚷起来。除此之外,而误差接近于零,控制舵角变化至近零水准,和舵角实现合理;同时,峰舵角很小的价值和过渡过程相对温和,这有利于操舵装置的使用寿命。所以,设计课程的适应性和抗干扰能力跟踪控制器USV基于强化学习和混沌粒子群优化算法验证的角度舵角输入。

5显示了神经网络逼近曲线。它获得一个标题内循环,RBF网络的上层模型可以近似未知项,这在100年代改变标题之后,只有约0.1的一个错误。验证,RBF神经网络在强化学习快速和稳定的逼近性能。

6显示的实际价值和有界估计外部环境干扰和逼近误差的总和。得到的图,当然是改变每一次,和风能和波浪的扰动变化一起估计有界值的变化。设计约束变量可以估计干扰自适应律。所以,课程设计跟踪控制器的鲁棒性验证USV。

与数据的结果3- - - - - -6,获得的有效性和实用性课程设计跟踪控制器USV神经网络的基础上强化学习和混沌粒子群优化算法从一个全面的角度验证。

4.2。比较跟踪变量的实验课程
4.2.1。准备实验最初的环境和参数设置

在仿真过程中,所需的USV选择变化30°和0°,分别和周期是500年代。最初的船是0°,和最初的船的速度是8.5kn。外部的干扰海洋环境设置为:风的速度和方向是10 m / s和110°,分别;海流的速度和方向是2米/秒和110°,分别;和波高是3米0.75赫兹接触的频率。

RBF网络的隐层的数量是41岁的c1是均匀分布在(−20、20)c2(−1,1)上均匀分布,c3上均匀分布(−0.5,0.5),c4均匀分布在(−0.25,0.25), , , , 在混沌粒子群参数设置, , , , ,和迭代的最大数量是50。

4.2.2。结果和分析变量的跟踪控制实验课程

此外,强调课程跟踪控制器设计的新奇USV神经网络的基础上强化学习和混沌粒子群优化算法,比较跟踪控制实验进行的部分。

三个性能指标的基础上“稳定时间,”“过度”和“喋喋不休”,我们先前的研究结果在文献[16)发现,以下三种控制算法的控制性能关系是:基于IGA的智能控制算法优化RBF神经网络>滑模控制算法的控制性能基于模糊神经网络>滑模控制算法的控制性能基于RBF神经网络。具体来说,在文献[16),使用了相同的船模型参数,仿真的步骤选择信号。三种控制方法的结果如图所示7两个方面的航向输出和控制舵角输入;在同等条件下,它可以获得的智能控制算法的跟踪精度USV基于IGA优化RBF神经网络是最高与滑模控制算法相比,基于模糊神经网络和滑模控制算法基于RBF神经网络。

所以,比较执行跟踪控制实验提出的控制系统和控制系统设计(16]。同时和两个控制系统是应用于USV过程跟踪控制实验变量条件下预设在部分4.2.1。和比较实验的结果是获得和展示数据89

8演示了上述两种控制算法的过程输出曲线应用于课程under-driven USV的跟踪控制。获得,在同等条件下包括外部干扰,如风能、波,和当前,他们两人可以稳定地跟踪期望的标题。但是,前者的上升时间是15秒速度比晚;USV课程前的输出是稳定而不过度而后者有一个小超调;与后者相比,前者有更好的抗干扰能力的外部干扰。因此,控制系统的稳定性和速度提出了基于优化的控制算法在本文中比控制系统提出了基于改进遗传算法。

9显示输入曲线舵角的两种控制算法应用于课程under-driven USV的跟踪控制。在图9,前者是平滑的控制输入没有喋喋不休,而后者有少量的嚷嚷起来。它获得的前进一步抑制抖振控制系统相比。和相对,在本文的舵角控制器的抖振是弱于控制器的抖振的舵角(16]。

在实践中,较弱的舵角喋喋不休,负荷越小,这有助于保护舵机。所以,耐用性能和节能性能USV课程设计跟踪控制器的神经网络的基础上强化学习和混沌粒子群优化算法验证的角度保护舵机。

与数据的结果89,获得自适应和鲁棒控制系统的性能USV本文提出进一步改进USV与控制系统设计的基础上,从全面的角度改进遗传算法。

5。结论

针对under-driven USV的过程跟踪控制问题在复杂的外部环境,控制律的设计通过构造迭代滑模函数,利用李雅普诺夫稳定性理论。考虑到不确定性和干扰的控制律是很难直接计算,介绍了RBF神经网络近似系统的不确定性,和自适应控制技术用于估计边界值未知的外部干扰。此外,比例因子的粒子群优化算法集成到形成一个闭环控制系统,实现多控件的参数组优化,避免了人为选择参数的不确定影响,大大提高了控制系统的鲁棒性。

比较跟踪实验验证控制系统的适应性和鲁棒性性能USV本文提出进一步改进与控制系统相比USV基于改进遗传算法的设计。这进一步验证多个算法的融合促进改善控制系统的性能。

数据可用性

用于实验验证的相关数据文本中列出。

的利益冲突

作者宣称没有利益冲突,财务或其他。

作者的贡献

所有作者同样起到了推波助澜的作用。

确认

这项工作得到了国家自然科学基金批准号。52071201和52071201下的中国和支持的基础科学(自然科学)研究项目批准号下的大学江苏省21 kjb580009和“蓝色工程”优秀青年骨干教师人才项目于2021年在江苏省。