使用神经气体网络的前馈非线性控制

摘要

非线性系统控制是控制理论中的一个主要问题。许多已开发的应用程序受到数学基础的影响，而不像线性系统理论那样普遍。本文提出了一种利用有监督神经气体网络获得的一组局部线性模型对具有未知动力学的非线性系统进行控制的策略。该方法利用了神经气体特征，使算法产生了一个非常健壮的聚类过程。被控对象的直接模型构成了非线性系统的分段线性逼近，每个神经元代表了一个局部线性模型，并设计了一个线性控制器。神经气体模型既是观测器又是控制器。利用局部线性模型提供的局部传递函数对状态变量进行估计，实现状态反馈控制。由有监督神经气体算法得到的梯度向量为前馈非线性控制提供了一个鲁棒的过程，即假设不存在扰动。

1.介绍

虽然一些物理系统可以近似为线性模型，但几乎所有真实工厂实际上都具有非线性功能。可以广泛了解非线性过程的行为，但有时难以选择合适的控制方法。Lyapunov理论是非线性系统控制的经典方法。如果并且只有在控制设计的合适条件下衍生物为负的正定明确连续功能，则保证控制渐近稳定性。然而，这种方法是不幸的，因为获得Lyapunov函数很难。在处理未在数学上没有定义的未知植物时，此问题甚至更糟糕。因此，通常不容易保证复杂非线性系统的稳定性[1］．但是，如果对应于平衡点的本地线性系统是可控的，则可以向局部稳定性说明足够的条件[2］．

哈特曼-格罗布曼定理表明非线性系统在平衡点附近的行为可以用它的线性模型来近似。系统理论是基于许多关于线性系统的稳定性、能控性和可观察性的数学程序。线性系统的稳定性和在很大程度上的动态响应可以用状态空间设计中系统矩阵的特征值或传递函数的极点来描述。对于非线性系统不存在这样的方法。由于这个原因，工业控制过程仍然通常使用这种线性控制理论设计。线性化后，典型的方法是设计固定参数的PID等线性控制器。

通过RLS（递归最小二乘）方法可以实现获得本地线性模型的经典方法。然而，有时这种方法由于待控制的过程的内在非线性而引起不利的结果。问题是建立非线性系统的不同操作点。此时，所提出的算法可以将每个操作点作为神经气体网络的集群中心建立。由于这种原因，人工智能技术提高了控制性能。

通过神经网络（NN）识别和控制非线性系统（NN）在二十年前开始了[3.］．神经网络控制的主要优点之一是不需要精确的对象知识，如数学模型。最初，使用神经网络的控制应用是基于试错方法。研究工作改进了控制算法，一些期刊发表了具有强大数学基础的特殊问题[4.］．许多应用都是基于前馈和递归神经网络的结合。递归，也称为动态反向传播，是必要的，因为输出依赖于相同输出的前一个值，这也是权值的函数[5.］．张和王[6.]使用复制NN提出了极点分配控制。

典型的设计过程是进行系统辨识，以对被控对象进行建模，然后获得控制器。传统方法严重依赖从物理原理中提取的模型，而基于神经网络理论的方法通常使用从工厂获得的数据创建黑箱模型作为函数近似器。关于植物的数学模型或任何其他物理原理的知识是不必要的。

神经毒气(NG)是一种无监督的基于原型的方法[7.，其中原型向量为权值，并对训练数据空间进行划分。该算法考虑了合作-竞争计算，避免了算法出现局部极小值问题。此外，批处理NG允许快速训练，使收敛在少数时代实现[8.］．本署亦开发了NG的监督版本，特别用于分类[9.那10］．该算法对聚类任务具有很强的鲁棒性，但也被证明对获取植物的直接模型具有鲁棒性[11］．

在通过神经网络进行动态系统辨识和控制的多年工作之后，研究人员一致认为线性辨识器和控制器应该作为第一次尝试，如Chen和Narendra所述[2］．如果几个平衡点对应的一组局部线性模型能够以一定的精度逼近一个非线性系统，则可以为每个模型设计线性控制器，全局控制与切换线性模型控制相关。

这种分行和征服方法适用于这项工作。生成的模型是一组本地线性图。NG模型的每个神经元对应于一个本地模型。在NG培训之后获得这些本地模型。以这种方式，获得植物的直接模型。获得该NG模型后，本地线性控制器的设计比全局非线性控制器更简单。使用其他基于原型的算法（如SOM）的本地线性映射在美国宇航局设施中成功进行了测试[12］．

本文旨在应用NG的稳健性建模能力，以控制非线性工厂，如典型的机器人操纵器。

本文在Section中包含了所考虑的NG算法的学习规则2，植物的模型和控制策略在部分中解释3.和4.分别在截面中测试了所提出的技术5.．

2.神经气体的方法

NG算法的无监督版本基于能量成本函数(1)根据欧几里得度规。欧几里得距离的平方用(2）.而且，

邻域函数(3.)来实现算法。秩函数表示原型之间的等级距离和数据矢量．最小距离取这个值最大距离的秩等于,在那里是神经元的数量还是原型的数量为邻域半径:

邻域半径通常选择指数递减，根据(4.）.从初始值开始递减，，到一个较小的最终正值，：在哪里是时代的脚步，最大纪元数是多少，和被选为地图单位数量的一半（)，如Arnonkijpanich等人[13］．此外，为了使训练结束时的量化误差最小化。

批量版本的学习规则在Cottrell等中得到[8.］．批量算法可以通过使用雅各比和黑森州矩阵的牛顿的方法来获得，和，分别为代价函数．原型的改造基于该方法相应地制定

内核功能可以被认为是局部恒定的[8.］．用这种方法得到雅可比矩阵和Hessian矩阵

用(6.) (5.），可以获得增量

最后，将显示每个原型向量的更新规则

2.1。监督学习

通过通过原型向量定义的每个Voronoi区域，通过局部线性映射来监督学习．一个常数和一个矢量和分配给每个神经元．目标是近似函数从到,在那里是训练变量的数量，即数据向量的维度．因此，培训变得监督，数据集包含输入输出对数据向量和变量作为目标函数。估计是由在哪里是估计的输出值，是参考价值学到的那是在中获得的近似函数的梯度定义的Voronoi区域,是神经元与最亲密的矢量数据，即，最好的匹配单元（BMU）。星号超级索引表示输入数据向量的获胜神经元．

输入数据的概率分布由原型向量表示之前根据算法无监督版本的典型规则进行了更新[14] 使用（8.）.每个原型向量可以被认为是Th Voronoi地区。经过监督的培训后，这些载体的区域很好地定义。此时，将在每个区域中创建本地模型，以便局部模型将代表整个数据分布。

算法的监督版本的能量成本函数基于每个voronoi区域的输出变量估计的平均误差[15根据…10）.原型已于(8.)，而适应规则和，考虑牛顿法计算的能源成本(10）.学习规则和显示在（11）和（12），分别：

3.工厂模式

经过NG训练后，该系统被建模为一组线性系统，其输出是取决于输出的先前值和输入．非线性自回归移动平均（NARMA）模型已被证明是非线性识别的[16.那17.，可以表示为在哪里系统是否在采样时刻输出那系统是否立即输入,是系统延迟。

考虑零延迟系统并代替（13）为了（9.）遗骸

以下，梯度将表示为系数和．

那那那．

下面的项将被集合成变量：

表示具有向后换档操作员的多项式经过和这提醒了一个ARMAX模型，是一个零均值独立同分布白噪声过程，也是根据(15），它取决于输入和输出值，因为它是bmu获得的．系统内部噪声可以包括在内．

使用变换,是系统输出和是控制器必须连接的系统输入。

4.局部反馈的局部线性控制

若系统为线性(局部)，则叠加定理可使系统输出与控制输入之间的线性传递函数保持如下:

定义并选择状态变量之间的以下关系:那．

转换功能（17.）可以用控制规范形式表示为线性状态空间设计

假设系统是可控的，通过极点配置进行状态反馈控制的目的是为闭环系统分配一组极点位置，这些极点位置在上升时间、稳定时间和瞬态响应超调时间方面对应满意的动态响应。控制律是状态变量的线性组合估计在（19.)，通过局部传递函数(17.）.

基于系统矩阵的闭环系统特征多项式，输入矩阵和增益矢量是而所需杆位置的特征多项式是

对于一个Th阶系统，增益矢量对于状态反馈通过匹配系数（21.）和（22.）强制闭环磁极放置在所需的位置：

有可能有足够的自由度通过选择适当的值来任意选择任何想要的根位置．这是一个不精确的过程，可能需要设计师进行一些迭代。局部线性模型的求解在于找出实现状态反馈控制的矩阵或调节器系数。线性离散系统的稳定性条件是所有的特征值都必须在单位圆内。显然，这个判据对非线性系统无效，但在稳定的线性区域内存在一个区域，该区域实现了切换线性系统的渐近稳定性[18.］．因此，不仅可以设计所需的动态响应，而且还可以实现稳定标准。在这项工作中，通过不同特征值的试验和错误发现这种稳定区域。

所提出的控制策略方案如图所示1．获得矢量为满足根据(22.)取决于当前获胜神经元定义的局部线性模型或BMU。状态变量也通过NG的局部线性模型获得（19.）.利用反馈回路的反静态增益可以跟踪设定点参考。此外，自扰民已知（模型包括在内），可以补偿．预滤波器的传递函数选择为并确定局部线性模型的切换率。尽管极值分配方法不影响植物的零，但是可以选择性地设计预滤器以取消位于单位圈内的主导零。

5.实验测试

目的是控制图中描绘的典型机器人臂问题2．Hagan等[19.]的研究重点是利用模型参考控制体系结构，通过动态传播算法对该植物进行控制。显然，建议控制不是基于电站的数学模型，但这是一个众所周知的二阶非线性微分方程: 在哪里= 1公斤,= 1 kgm²那= 1米,= 1 kgm²/秒,= 10 m / s²．粘性摩擦系数对于稳定性和动态响应是重要的。如果然后，系统在开环中不稳定，并且无法通过工厂的开环仿真获得必要的训练数据。在本作工作中，系统在开环中模拟，以考虑培训数据为了提出一种与Hagan等人相比具有更多振荡响应的植物[19.] 在哪里．植物输入是一个均匀分布的随机信号，分别为-4和8.1，分别为幅度的最小值和最大值。必须仔细选择脉冲宽度以便正确模拟瞬态和稳态状态。因此，脉冲宽度等于14秒。由于NG是根据训练数据的概率分布函数更新神经元的矢量量化算法，因此获得输出值的均匀分布非常重要在训练数据中。经过现场仿真，观察了当前系统的输出情况没有依赖于当前系统输入在训练数据集中。如果，则不能正确地建模，只近似稳态，而不近似瞬态。如果，则被控对象模型相当精确，但由于系统的非线性，控制效果不佳。最优值为．考虑50个纪元和49个神经元进行批量NG训练，获得该植物的直接模型。更少的神经元会产生与上面提到的类似的效果使用更多的神经元并不能改善控制。数据3.和4.在培训后显示测试数据的结果．显然，采样时间必须符合Nyquist-Shannon定理的标准。考虑的采样时间为0.1秒。

特征值在（22.）提供渐近稳定性和合适的动态响应。我们认为所有特征值都是平等的;那是，．为了调整，对控制系统进行了不同特征值和预滤波极点的测试。此后使用了参考设定值处振幅为0.9的台阶接近0.9的值代表了具有高非线性的最差系统工作区。明显地，大于0.9的值更糟糕，但我们指的是训练数据范围。特征值从0.2增加到0.9，级数为0.1幅值步长。数据5.和6.显示结果。如果预滤器有宽带宽(是低)，然后较低的值产生不稳定。在图中5.，降低值产生了模型扰动的相当大的影响过冲很高，而两个BMU线性模型之间存在一些篮板值。较低的，上升时间越低（带宽宽）。最佳选择范围是[0.5-0.6]．因此，当使用切换线性模型时，存在一个稳定区域在线性系统理论(单位圆)的全局稳定区域内，取决于NG局部线性模型的切换率[18.］．这里，切换速率由预滤波率决定。如果是增加然后获得好的结果，见图6.．

一旦确定了参数，测试了NG方法以跟踪控制图中位置的恒定参考7.和可变参考，例如正弦信号，以检查图中的速度8.．线性估计输出不是NG估计吗在（9.）但是通过（20.）并增加已知干扰的价值．

当参考值接近0.9时，控制效果最差。为了说明这一问题，将PI控制与NG方法进行了比较。显然，由于微分作用，PID控制可以实现快速稳定的响应，但代价是一个无法实现的控制动作，系统控制会受到噪声信号的影响。线性化模型使用在邻域内的-变换,表示,是

关于稳定时间和平滑度响应的合适PI设计是考虑．数字9.表明，当考虑时，由该PI的系统控制的系统变得更加振荡因为植物的两个复杂极点改变了它们的位置，涉及闭环磁极的变化。两个复杂的闭环杆更大，因此系统增加了振荡。在这种设计中，权衡是在响应的稳定时间和振荡组件之间。调整是改变保持恒定零的位置在-10;那是，．数字10显示调整的影响在控制设计中，并显示与该设计的NG方法。

上述控制策略对于前馈控制是有效的，即假设扰动的不存在性。在这些条件下，该算法的性能非常好。但是，可以实现干扰抑制添加额外的状态变量，以便,在那里为跟踪误差，按照(21.）到（23.),图11显示抑制幅度0.05的恒定输出干扰。

6。结论

本文提出了一种监督神经气体（NG）算法的监督版本，以控制动态数学模型未知的非线性系统。用NG模型实现植物的鉴定。与其他类型的神经网络相比，NG模型的形成是一种稳健的程序，因为既没有局部最小值问题也没有过度拟合。必须仔细选择培训数据以便正确模拟瞬态和稳定状态。NG算法倾向于模拟稳态状态。显然，必须正确建模瞬态以控制工厂。通过这种方式，延迟样本的数量以及神经元的数量是关键参数。必须有足够数量的神经元，但如果它太大，控制不会得到改善。

训练有素的NG网络产生一组典型的局部线性模型。这些中的每一个由神经元表示。全局控制器是一组线性控制器，通过通过极点分配通过状态反馈获得。此控件不会影响零，但如果这些控制在单位圈内，则可以通过预滤器的极点取消它们。

特征值在单位圈内，不保证渐近稳定性，因为待控制的植物是非线性的。因此，稳定性对应于单元圈内的区域[18.］．这组这些值是通过试错法确定的。最坏的性能出现在出现非线性的最高设定值上。与传统的固定参数PI相比，该方法具有更平稳、更快的响应速度。

综上所述，NG算法不仅为聚类任务提供了一个鲁棒的过程，而且为使用监督版本获得的梯度向量进行前馈非线性控制提供了一个鲁棒的过程。这些梯度向量构成了植物的局部传递函数的极点和零点。由于批处理过程的高效实现，计算复杂度与样本数、神经元数和变量数成线性关系。

利益争夺

两位作者宣称他们没有相互竞争的利益。

参考

B. Jakubczyk和E. D.Sontag，“非线性离散时间系统的可控性：谎言 - 代数方法”，暹罗杂志控制和优化第28卷第2期1，第1 - 33页，1990。视图:出版商网站|谷歌学术搜索|MathSciNet
L. Chen和K. S. Narendra，“基于线性化的非线性离散时间系统的识别和控制:一个统一的框架，”神经网络上的IEEE交易，第15卷，第5期。3，页663-673,2004。视图:出版商网站|谷歌学术搜索
K. S. Narendra和K. Parthasarathy，“利用神经网络识别和控制动力系统”，神经网络上的IEEE交易， vol. 1, no. 11，第4-27页，1990。视图:出版商网站|谷歌学术搜索
K. S. Narendra和F. L. Lewis，“编辑：神经网络反馈控制的特殊问题介绍，自动化，第37卷，第2期8，页1147-1148,2001。视图:出版商网站|谷歌学术搜索|MathSciNet
O. deJesús和M.T. Hagan，“广泛的动态网络的BackProjagation算法”，神经网络上的IEEE交易，卷。18，不。1，pp。14-27,2007。视图:出版商网站|谷歌学术搜索
Y. Zhang and J. Wang，“用于非线性输出监管的经常性神经网络”，自动化。国际自动控制联合会，第37卷，第2期8，页1161-1173,2001。视图:出版商网站|谷歌学术搜索|Zentralblatt数学|MathSciNet
T. M. Marinetz，S.G.Berkovich和K. J. Schulten，“神经气体”网络，用于矢量量化及其在时间序列预测中的应用，“神经网络上的IEEE交易，第4卷，第4期。4，第558-569页，1993。视图:出版商网站|谷歌学术搜索
M. Cottrell, B. Hammer, A. Hasenfuß， and T. Villmann， " Batch and median neural gas， "神经网络第19卷第2期6-7，第762-771页，2006。视图:出版商网站|谷歌学术搜索|Zentralblatt数学
B. Hammer，M. Strickert和T. Villmann，“具有一般相似度措施的神经气体”，“神经处理字母第21卷第2期1，页21-44,2005。视图:出版商网站|谷歌学术搜索
B. Hammer, A. Hasenfuss, F. M. Schleif, and T. Villmann， " Supervised batch neural gas "， in模式识别中的人工神经网络，计算机科学的讲义说明，PP。33-45，Springer，柏林，德国，2006年。视图:谷歌学术搜索
I. Machon-Gonzalez，H.Lopez-Garcia，J.Ropez-Garcia，E.Maranën-Maison，L. Castrillon-Pelaez，Y.Fernandez-Nava，“比较前馈与神经气体作为估算器：应用于焦炭处理，“环境技术，卷。34，没有。9，pp。1131-1140,2013。视图:出版商网站|谷歌学术搜索
D. Erdogmus，J.Cho，J. Lan，M. Motter和J. C. Principe，“自适应局部线性建模和非线性动力系统控制”使用计算智能技术的智能控制系统，A.罗诺，ed。，pp.119-152，IET，2005。视图:谷歌学术搜索
B. Arnonkijpanich, A. Hasenfuss，和B. Hammer，“地形神经图中的局部矩阵适应”，Neurocomputing第74卷第1期4, pp. 522-539, 2011。视图:出版商网站|谷歌学术搜索
I.Machón-gonzález，H.López-garcía和J.LuísCalvo-Rolle，“一种混合批量Som-NG算法”，第6届IEEE世界大会上关于计算智力，WCCI 2010-2010国际神经网络联席会议（IJCNN'10），第1-5页，2010年7月。视图:出版商网站|谷歌学术搜索
M. J. Crespo-Ramos, I. Machón-González, H. López-García，和J. L. Calvo-Rolle，“使用SOM-NG算法检测局部相关变量”，人工智能工程应用第26卷第2期8, pp. 1992-2000, 2013。视图:出版商网站|谷歌学术搜索
L. Chen和K. S. Narendra，“使用神经网络和多模型的非线性自适应控制”，自动化，第37卷，第2期8，pp。1245-1255,2001。视图:出版商网站|谷歌学术搜索|MathSciNet
K. S. Narendra和S. Mukhopadhyay，“使用神经网络和近似模型的自适应控制”，神经网络上的IEEE交易，第8卷，第2期3，第475-485页，1997。视图:出版商网站|谷歌学术搜索
“切换线性系统的状态反馈控制:一种LMI方法，”计算与应用数学学报，卷。194，否。2，pp。192-206，2006。视图:出版商网站|谷歌学术搜索|MathSciNet
M.T. Hagan，H. B. Demuth，以及O. deJesús，“在控制系统中使用神经网络的介绍”国际鲁棒与非线性控制杂志，第12卷，第2期11，页959-985,2002。视图:出版商网站|谷歌学术搜索|Zentralblatt数学

复杂

摘要