文摘

介绍了几种控制方法,实现了倒立摆系统稳定跟踪。基于RBF的优点和传统PID,一种新颖的基于RBF神经网络的PID控制器监督控制方法(PID-RBF)提出。该方法实现稳定跟踪的自适应调整系统的信号。此外,一种改进的基于RBF神经网络的PID控制器监督控制策略(IPID-RBF)。该控制策略采用前馈和反馈的监督控制方法。进一步提高系统的响应速度,和过度的跟踪信号进一步降低。倒立摆的跟踪控制仿真系统三种不同的信号,说明了该方法的有效性。

1。介绍

倒立摆系统已经被广泛的研究在过去几十年基于高阶、强耦合的两个重要特点,在控制领域的重要问题。这是一种不稳定的、非线性和多变量系统。倒立摆控制方法已经广泛的应用于军事、航天、机器人和一般工业过程,如平衡问题在机器人行走、火箭发射过程中垂直度问题,在卫星飞行和姿态控制问题。RBF神经网络的学习控制算法一直是当前学术研究的热点话题。该算法可以解决非线性问题,跟踪问题,和外部干扰的问题。因此,使用这种方法来研究倒立摆的跟踪问题具有重要意义。

RBF(径向基函数)神经网络的非线性系统的控制器的设计是基于比例积分微分(PID),和这些方法具有良好的控制效果。这里有一些相关的研究成果。在[1),提出了RBF网络估计复杂和精确的动力学主要解决问题的不确定性和外部干扰的环境中复杂的空间。该方法用于解决模型的不确定性和输入错误的问题。在[2),提出了一种神经网络与PID自适应控制算法。自学能力和自适应不确定系统的动态特性是用来显著减少阻力扰动速度的影响。该系统在参数变化和外部干扰具有很强的鲁棒性。在[3),计划比例微分控制相结合、RBF神经网络自适应控制算法。其中,它使用PD控制跟踪的轨迹wire-driven并联机器人的终端执行器(WDPR)。RBF神经网络控制算法应用于近似参数。这两种方法的结合降低了近似误差,提高了鲁棒性,提高了WDPR的准确性。在[4),一个模糊的基于逻辑的离线控制策略的独轮倒立摆机器人(SWIPR)提出研究错误,系统设置时间,和上升时间,等。最后,取得了良好的控制效果。在[5),RBF网络应用于减少喋喋不休和增加稳定性。在[6),它提出了一个单层非线性控制器来实现倒立摆的稳定状态可以调整任何初始位置,达到四个自由度。侯赛因(7)提出了一种改进的基于RBF神经网络的PID控制方法。结果表明,该算法具有更好的控制效果比传统的PID张力。在[8,9),自适应控制方法应用于非线性系统的输入或输出。它们分别适用于一类非光滑非线性系统和一类多输入multioutput非线性时滞系统具有输入饱和。在[10,11),两种不同的自适应方法,提出了解决未知和随机非线性系统的非线性跟踪问题。和其他学者研究了系统的稳定性和收敛性(12- - - - - -14]。Kumar et al。15)利用自适应控制技术处理跟踪问题。目前,许多研究人员(16- - - - - -20.)进行了深入研究各种倒立摆模型采用不同的控制方法。

事实上,无论什么是控制系统,该系统将倾向于稳定的控制器的作用下。因此,RBF神经网络作为模型来逼近不确定性,研究误差收敛,并取得了良好的收敛结果(21]。在[22],提出了利用RBF算法估计剩余误差,通过控制器的设计减少误差,提高控制信号,获得良好的采暖需求。在[23),机械系统的动态特性是探索和RBF神经网络的特点是用于研究跟踪的问题。在RBF神经网络的大型结构下,不同的基函数选择消除抖振的比较研究[24]。在[25),RBF神经网络实现自反馈控制,精确的预测,合理数据的实时控制。它提高了跟踪精度和估计未建模动态和外部干扰问题[26]。随着越来越多的学术研究者理解RBF的近似特征,他们添加RBF神经网络各领域研究不同系统的动态特性。主要解决非线性问题、不确定和外部干扰和使用李雅普诺夫函数来确保算法的有效性,以便它可以减少系统错误,会达到一个稳定状态27- - - - - -34]。

近年来,足迹PID的应用程序可以在不同的领域。从简单的PID控制算法复杂的PID算法控制,它扮演了一个角色在不同的控制领域。在[35,36),研究了PID控制算法和操作规则,分别。探索PID算法的特点,通过模拟PID有一定程度的适应性。根据PID算法的特点,一些学者已经研究了PID控制器的优化37,38]。使用优化PID参数根据实际情况优化系统性能。作为PID参数调优技术变得越来越成熟,一些感兴趣的学者利用PID控制器来研究系统的稳定性和跟踪问题(39- - - - - -42]。为了PID适应更多的情况下,一些学者发起了模糊PID的控制研究[43,44]和分段PID [45,46]。可以看出,PID控制算法是一个比较经典的控制方法。

根据参考文献,我们可以发现,RBF神经网络控制算法主要利用李雅普诺夫函数来确定稳定条件。在[47),基于非线性U模型、RBF神经网络和PD控制算法提出了平行。李雅普诺夫函数决定了系统稳定的条件,在这个条件下,跟踪效果已得到改进。然而,从跟踪效果,系统输出之间的误差和跟踪信号大,与外部干扰和跟踪情况不考虑。因此,在本文中,我们考虑这些问题基于倒立摆模型研究其跟踪问题。

简而言之,倒立摆的控制模型主要包括三个主要控制表演,即稳定性、精度和速度。然后,倒立摆的跟踪问题,这三个综合表演也需要考虑。因此,我们设计了一个PID-RBF监督控制方法。我们进一步设计IPID-RBF另一个监督控制策略。信号的稳定跟踪是通过监督控制策略。总的来说,本文的主要创新包括以下:(1)PID-RBF策略保证了系统的稳定性。系统的过度降低,系统的鲁棒性增强。在干扰的情况下,可以调整的参数自适应控制信号跟踪。(2)IPID-RBF战略大超调控制的进一步解决问题的过程。系统的调整时间进一步减少。这种策略具有较强的抗干扰能力,快速稳定,小错误跟踪曲线。(3)在控制过程中,我们可以使用PID-RBF策略来取代传统的PID控制策略。这种方式可以使系统超调小,系统稳定性好。IPID-RBF策略进一步提高系统的整体性能。IPID-RBF控制策略,系统具有更快的响应速度、更好的稳定性和鲁棒性。

剩下的纸是组织如下。相关控制目标提出了部分2。提出了神经网络监督控制设计第三节。模拟研究中讨论第四节。最后,给出了结论第五节

2。控制目标

倒立摆系统很难控制随着订单的增加。与此同时,倒立摆系统本身具有复杂性的特点,不稳定性和非线性。倒立摆系统经常被用作实验项目在现实社会。与此同时,一些控制方法的有效性在引言部分通过控制倒立摆系统进行验证。因此,对倒立摆的研究具有重要意义。为了研究信号跟踪问题,我们考虑基于PID的倒立摆模型和RBF神经网络控制。倒立摆模型类似于(48]。倒立摆系统的受力分析如图1

在图1,外力作用在电车及其移动位移用符号表示 ,分别。 表示为摆和垂直方向之间的角度。在区分其位移 这是小车的速度,摩擦系数 它和电车和导轨之间的阶段。然后我们可以获得耐药性 的导轨在水平方向上电车。

此外,电车之间的交互和钟摆分解为两种力量在垂直平面互相垂直,在那里 分别用来表示垂直和水平方向的分力。

我们使用三个动作来表达一个倒立摆的摆杆运动:水平运动的重心,重心的垂直运动,旋转重心。根据牛顿力学定律,我们可以得到三个运动方程, 代表之间的角度摆和垂直向下的方向:

方程(1)相当于以下方程:

方程(2)也相当于以下方程:

水平方向上的合力电车可以表示如下:

把(4)(6),外部力量 可以写成

类似地,用(4)和(5)(3)的收益率

公式(7)和(8)车载倒立摆系统的非线性运动方程。为了便于控制,线性化系统。假设 的误差范围内保持稳定。因为 , 太小;因此, , , 线性化后,系统转换成数学模型如下:

以拉普拉斯变换(9),一个获得

通过消除 从方程集(10),电车的摆角的传递函数得到如下: 在哪里 是一个常数。

3所示。神经网络监督控制设计

3.1。PID-RBF和IPID-RBF控制设计

在这里,我们介绍PID-RBF控制和IPID-RBF控制。正如我们所知,PID控制器包括三个重要的参数,调节系数成比例 ,积分调节系数 ,和微分调节系数 比例调节系数 可以改变系统的响应速度,改善系统的调节精度。调整积分系数 可以消除残余的错误。可以改善系统的动态性能差的调整系数 如图2,不同的PID参数有不同的响应速度和稳定性。当响应曲线大幅震荡, 应该增加, 应该增加, 应该是小。当响应曲线的误差很大, 应该减少, 应该减少, 应适当增加。根据这种方法,选择最优的参数达到最佳的倒立摆系统的控制效果。

RBF神经网络是一个三层前馈神经网络,从输入到输出的映射是线性大大加快学习速度和避免局部最小值的问题。RBF神经网络监督控制是研究传统的控制器,在线调整网络的重量,使反馈控制输入 倾向于零。RBF神经网络监督控制系统的结构如图3

在RBF网络结构,作为网络的输入信号 , 径向基函数向量,高斯基函数是什么 这是表示如下: 在哪里 , 节点的基准宽度参数吗 , , 是节点的中心向量 , ,

给出了网络的权向量

用RBF网络的输出 在哪里 在网络隐层神经元的数目。

给出了控制律

调整神经网络给出的性能指标

近似如下:

造成的误差近似是由重量补偿调整。采用梯度下降法调整网络的权值。 在哪里 是学习速率。

是动力因素,得到神经网络权值的调整过程如下: (1)基于RBF神经网络的PID控制器监督控制方法(PID-RBF)包括错误信号 ,累积误差信号 ,当前的错误,和上次错误信号的差异 处理。PID-RBF控制律可以表示如下: 的网络输入向量PID-RBF控制是由 在哪里 表示采样时间, ,输入信号 , 系统响应的输出序列, 网络的输出PID-RBF控制 根据(15),(20.)和(22),我们可以表达其总控制律 RBF神经网络的权重调整过程表示为监督 (2)一种改进的基于RBF神经网络的PID控制器监督控制策略(IPID-RBF)包括错误信号 ,累积误差信号 ,当前的错误,和上次错误信号的差异 处理。

的网络输入向量IPID-RBF控制 在哪里 系统响应的输出序列, , , 表示采样时间。

网络的输出IPID-RBF控制如下:

根据(15),(25)和(27),我们可以表达其总控制律

RBF神经网络的权重调整过程表示为监督

3.2。控制算法稳定性分析

控制算法的稳定性分析,我们充分考虑性能指标调整神经网络 ,方程(16) 状态方程的自由运动的线性平稳离散系统

离散的李雅普诺夫方程 在哪里 是系统矩阵和 是正定实对称矩阵。

李雅普诺夫函数表示为

, 是下面的状态方程的解决方案(47]:

李雅普诺夫函数的增量

PID-RBF控制功能 从方程(34), 可以表示为

结合前面的错误和体重调整方法,我们可以表达 作为

使用梯度下降法调整网络的重量可以写成

结合方程(36)和(37)和性能指标 ,我们可以得到以下方程: 在哪里

根据方程(38),(35)可以表示如下:

当价值的领域 ,我们可以得到 我们分析方程(39),发现的产物 是正的。因此,我们可以得出这样的结论 ,系统是稳定的。因为 ,之间的关系之前,下面是表示为 ,然后 , 因此,控制算法是收敛的。

4所示。模拟研究

本节提供一些模拟显示的倒立摆跟踪效果PID-RBF监督控制和IPID-RBF监督控制。我们认为倒立摆模型和以摆杆的摆动角为控制对象。在零初始条件下, , , , , , 传递函数可以表示为

倒立摆系统的传递函数离散 转换。之后的离散对象 转换

是由基础宽度参数

中心向量如下:

我们考虑 , , , , ,

在图4图表是给定一个方波信号使用神经网络监督控制和传统的PID控制。它的振幅。从图中,可以看出神经网络监督控制的振幅振荡小于传统的PID控制器。IPID-RBF监督控制趋于稳定,速度最快,更温柔。显然,PID-RBF IPID-RBF监督控制速度和稳定精度高而单纯的PID控制。

在图5图表显示,RBF神经网络监督控制跟踪输入方波信号参数曲线, 径向基函数神经网络监督控制是在线学习调整曲线,和 RBF网络的PID调整曲线监督控制;叠加曲线 的总和 在RBF网络监督控制。三条曲线的比较两个调整,因为转换的方波信号从正到负的RBF网络监督控制在线学习的价值调整曲线变化从零到积极、PID调节曲线在RBF网络监督控制是负跳即时,和叠加的变化曲线相对平稳。

在图6步信号给出的图是使用RBF神经网络监督控制和传统的PID控制。它的振幅。从图中,振幅振荡的RBF网络监控小于传统的PID控制。3.8秒后PID-RBF监督控制是稳定的。2.5秒后IPID-RBF监督控制是稳定的。显然,IPID-RBF监督控制更加稳定和准确的。

在图7图表显示,RBF神经网络监督控制跟踪阶跃信号的输入参数曲线。RBF神经网络监督控制在线学习调整曲线 和叠加曲线 变化趋势基本上是一致的。

在图8,图为正弦波信号 使用RBF神经网络监督控制和传统PID控制跟踪。它的振幅。从这幅图中我们可以看出,径向基函数神经网络监督控制振幅的振荡小于纯PID,和RBF神经网络监督控制的效果优于单纯的PID控制的时间从0到20年代。没有错误之间的巧合RBF神经网络监督控制曲线( ) 曲线。RBF网络监督控制减少误差和精度比单纯的PID控制。它可以清楚地观察到的部分放大图IPID-RBF巧合最高和最好的跟踪控制效果。

在图9,图中显示了RBF神经网络监督控制跟踪输入的参数曲线正弦波信号。在RBF网络监督控制,PID调节的变化曲线 很小,和的变化 在RBF网络监督控制是温和的。

从数据89RBF神经网络监督控制在线学习调整曲线 和输入信号 表现出相反的趋势变化下输入正弦波信号。随着输入信号的增加,调整曲线 减少。输入信号 减少,调整曲线 增加。的调整趋势 有关重量的变化吗 在调整的过程中,价值的 是正的, 当输入信号的值是正数,重量 变化 相应的值是负的;当输入信号的值是负的,重量 变化 相应的价值是正的。

10表明,对于一个给定的阶跃信号的振幅,给定过程扰动振幅就是其中之一。干扰时间是0.5秒。纯粹的PID和RBF神经网络监督控制用于追踪,分别。添加了扰动的时候是5 s在图10。和径向基函数神经网络监督控制是小振幅振荡的扰动时比单纯的PID控制。然后,系统可以适应扰动消失后的稳定状态迅速意识到步信号跟踪。

11显示了RBF神经网络监督控制与已知的干扰信号和阶跃信号输入。总共有三个大规模调整:调整系统的稳定扰动之前补充说,错误的调整引起的扰动补偿,和调整系统的稳定性。在RBF网络监督控制,曲线 在线学习后趋于稳定。

在图12图是给定一个方波信号。它的信号振幅就是其中之一。给定过程扰动振幅型两种,时间是0.5秒。当时间是5 s,干扰是补充道。干扰出现时,径向基函数神经网络监督控制是小振幅振荡的比纯粹的PID。观察图中,系统快速调整到稳定状态没有振荡和实现方波信号跟踪IPID-RBF控制下。

在图13,这张照片显示了RBF神经网络监督控制输入的方波信号和干扰信号。在图中,有三个大规模调整0到10秒,如系统稳定性扰动前的调整补充说,错误的调整引起的扰动补偿,和调整系统的稳定性。结合的规定补偿扰动阶跃输入的情况下,传统的PID和RBF神经网络监督控制用于补偿扰动的规定0.5秒的时间。0.5秒后,稳定的系统调整到稳定跟踪信号。其中,IPID-RBF控制最少的速度调整。

在图14,图为正弦波信号。它的信号振幅就是其中之一。给定过程扰动振幅型两种,时间是0.5秒。当时间是5 s,干扰是补充道。可以看出的偏差 小于纯PID, RBF神经网络监督控制的曲线有一个更高的巧合与给定的正弦信号扰动后就消失了。

15表明,扰动振幅给一个,时间是0.5秒,这是进行RBF网络的输入正弦波。与非微扰条件相比,在线学习的价值调整曲线 RBF神经网络监督控制是大。有三个大过程的跳跃 叠加曲线 在RBF网络监控。其他时间RBF网络监督控制在线学习调整曲线 叠加和RBF神经网络监督控制曲线 变化趋势基本上是一致的。

结合表1从数据和误差图1621,我们可以发现,传统的PID控制有坏的影响,调整时间长,比其他两个更大的误差控制算法。IPID-RBF控制可以在短时间内达到一个稳定状态无论没有干扰或干扰。

5。结论

从仿真效果,IPID-RBF控制应用到模型具有更好的性能。同时,输入信号跟踪是实现。在三种不同的输入信号,实现实时跟踪输入信号通过在线学习,和错误的输入和输出不断调整,最终使系统误差趋于零。与传统的PID控制相比,IPID-RBF控制输入信号的跟踪效果最好在三个不同的输入信号。它改进了传统PID较低精度的特点。与PID-RBF监督控制相比,IPID-RBF控制小曲线振荡幅度在调整过程中,系统在短时间内达到一个稳定状态,具有较强的抗干扰能力。该算法简单控制和良好的跟踪精度。

因此,改进控制算法具有良好的鲁棒性,系统的稳定性很好。仿真图形和数据表明,IPID-RBF控制受控对象通过在线学习来实现在线识别和控制。控制精度高,动态特性好,抗干扰能力。

数据可用性

没有数据被用来支持本研究。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项工作得到了国家自然科学基金资助下的中国61971181、61971181和2016年湖北省自然科学基金资助下cfc735。