文摘
作为一种模仿生物神经系统的神经网络(NNs),已被描述为强大的学习工具,用于各种各样的应用程序,如复杂的非线性系统的控制、优化、系统辨识、模式识别。本文旨在将最先进的海军新闻的简要回顾总结最新进展的复杂非线性系统NNs在理论和实际应用。具体地说,这个调查还评论数量的基于神经网络的机器人控制算法,包括基于神经网络的机械手控制,基于神经网络的人机交互,以及基于神经网络的认知控制。
1。介绍
近年来,神经网络(NN)的研究已经引起了极大关注。众所周知,哺乳动物的大脑,包括数十亿神经元相互连接,有能力处理复杂和计算要求的任务,如人脸识别、身体运动规划、控制和肌肉活动。图1显示了哺乳动物的神经元的细胞结构。灵感来自于神经元结构,人工神经网络(ANN)是模仿生物神经系统的学习能力(1- - - - - -3]。人工得到的概念最初是在1940年代由McCulloch和皮特的调查(3),建立了网络平行结构。神经网络的基本数学模型由三层组成,即输入层、隐藏层和输出层,并行计算结构简单但吸引人的学习能力和计算能力来预测非线性动态模式。
在过去的几十年里,研究了神经网络技术在控制工程等领域广泛,航空航天、医药、汽车、心理学、经济学、能源科学、和许多其他领域(4- - - - - -7]。据报道,神经网络可以近似任何未知的连续非线性函数通过重叠每个神经元的输出。此外,可以任意小的近似错误选择足够的神经元。这使我们能够处理复杂的非线性系统控制问题(8- - - - - -13]。除了系统建模和控制,神经网络也已成功地应用在各个领域,如学习(14- - - - - -17),模式识别(18),和信号处理19]。和神经网络已被广泛用于函数近似,如补偿的影响未知动力学非线性系统(20.- - - - - -31日]。神经网络控制已经被证明是有效的不确定非线性系统控制和演示了在许多方面的优越性。
最近,研究人员主要集中在机器人技术的研究越来越重要的在日常生活和工业应用(33- - - - - -38]。许多先进的机器人,如弓由ABB,巴克斯特由反思,Rolins贾斯汀由德国航空航天机构(DLR)也被广泛分配。机器人机械手系统是具有高度非线性、强耦合、时变动力学,从而控制机器人不仅定位精度,但也足够的灵活性来完成一项复杂的任务成为一个有趣的挑战的工作。为了实现高性能控制,机器人的动力学应该提前知道。然而,在实践中,机器人动力学模型常常是很少知道由于复杂的机器人机制,更不用说等不确定性参数的不确定性或机器人动力学中存在的建模错误。因此,推进下一代机器人的控制算法势在必行。由于通用逼近和学习能力,神经网络已经被广泛应用于机器人控制与各种应用程序。结合神经网络和机器人控制器可以提供可能的解决方案对于复杂的操作任务,例如,机器人控制与非结构化环境未知动力学和机器人控制。在本文中,我们提出一个简短的回顾机器人控制的神经网络。剩下的纸是组织如下。
介绍,后部分2,预赛几个流行的神经网络结构,如时滞和大小小脑模型神经网络。部分3介绍了许多领域的神经网络自适应控制的理论发展,优化和进化计算。此外,部分4再次使用机器人神经网络控制应用程序的操作,人机交互,认知控制机器人。部分5简要讨论了神经网络控制及其未来的研究。
2。预赛的神经网络
在本节中,我们将介绍几种类型的神经网络结构,控制工程中普遍采用。
2.1。径向基函数神经网络(时滞)大小14,15]
时滞网络大小的基本架构图所示2,它包括三个层次,即输入层、隐藏层和输出层。在输入层,应用神经网络的输入。在隐藏层,数据转换从输入空间到隐藏的空间,总是与更高的维度。时滞可以用来近似大小的任何连续向量函数,例如, : 在哪里的估计是和是神经网络的输入向量。 是神经网络最优的估计重量, 是回归量,表示神经网络的节点的数量。通常,回归量可以被选择作为激进高斯基函数如下: 在哪里 不同的点在状态空间和吗是高斯隶属函数的宽度。已经认识到,使用强大的时滞,大小的近似能力我们可以逼近任意非线性连续函数在一个紧集 在哪里最优权向量和吗是近似误差。
2.2。小脑模型关节控制器(小脑)神经网络39]
有主要倾向于研究机器人的学习和控制技术通过研究生物系统的原则。这是由于生物、机制和基本原则可能会带来新颖想法改善控制机器人在复杂环境下的性能。1972年,阿不思·学习机制,提出了一个模仿小脑的结构和功能,称为小脑模型关节控制器(小脑),设计基于小脑的神经生理学模型(40]。反向传播神经网络相比,小脑模型神经网络在建模和控制的机器人系统广泛采用的快速学习速度,结构简单,数据序列的不敏感,容易实现(39,41]。
图3显示了小脑模型神经网络的基本结构。的小脑模型可以用来近似未知的连续函数, ,在那里 表示维输入空间。如图3,两个组件参与小脑模型神经网络来确定近似非线性函数的值 : 在哪里 是米维输入空间F是n维输出空间C是维空间协会
和协会表示映射从输入向量空间;也就是说, 。计算输出 ,通过使用一个协会的投影向量α到权重向量,这样
应该注意的是,函数可以表示为一个多维接受申请,这样在输入每个点吗与一个激活值分配。协会的接受域基函数向量可以被选为高斯函数如下: 在哪里l块的关联空间,表示k与输入相关的块 , 表示接受域的中心,是高斯函数的方差。然后,可以被描述为多维接受域函数 在哪里 , , 。下面的属性显示了近似小脑模型神经网络所提供的能力。
引理1。连续非线性函数 ,存在一个理想体重值 ,这样可能是由小脑模型与统一近似最优权重的乘法和关联向量作为 在哪里神经网络结构错误和满意吗 和是一个小型有界的积极价值。
3所示。理论的发展
3.1。自适应神经控制
在过去的二十年里,各种神经网络已经融入自适应控制与未知非线性系统动力学。在[42),多人离散神经网络控制器构造了一类多输入multioutput (MIMO)动力系统,神经网络权重被训练使用一种改进的在线优化算法。提出了一种自适应神经网络输出反馈控制来控制两类离散时间系统在未知面前控制方向(4]。鲁棒自适应神经控制器开发了一类strict-feedback系统(43),努斯鲍姆获得技术用来处理未知的虚拟控制系数。动态回归神经网络用于建筑的一种自适应观测器在线把权重参数(44)和处理的一类非线性时滞动力系统(45]。strict-feedback的时滞非线性系统也解决了使用神经网络控制与适当的设计Lyapunov-Krasovskii函数(46]。针对一类未知非线性仿射时滞系统,提出了一种自适应控制方案通过构造两个高阶NNs识别系统不确定性(47]。这个想法进一步扩展到仿射非线性系统具有输入时滞(48]。
应该注意到,分段连续函数,如摩擦、反弹,死区广泛存在于工业工厂。除了连续非线性函数,这些分段函数的近似是更具挑战性由于神经网络的通用近似仅仅适用于持续的功能。这些分段连续函数近似,一种新的神经网络结构设计的有关标准的激活函数和一个跳近似基函数(49]。在[47)、小脑模型神经网络采用非线性动力系统的闭环控制与严格的稳定性分析,和在50一个鲁棒自适应神经网络控制方案为合作开发的高阶非线性系统的跟踪控制。
自适应神经网络控制方案也提出了pure-feedback系统。在[51),提出了一种高阶滑模观测器来估计未知系统状态,而两个NNs构造处理近似错误和未知的非线性,分别。相比传统pure-feedback系统控制设计,实现了状态反馈控制不使用逐步退焊法技术。在[52),提出了一种神经控制框架的非线性伺服机制来保证稳态和瞬态跟踪性能。在这项工作中,规定受雇于一个输出误差性能函数变换,这样跟踪性能可以保证按规定的控制输出。在[53),还设计了一个自适应神经控制一类非线性系统的时延和输入死区,和高阶神经网络是用来处理未知的不确定性。在这项工作中,显著特征在于,只有规范得到的权重(标量)需要在线更新,这样在网络实现可以显著提高计算效率。在[54),作者开发了一种基于神经网络前馈控制补偿的非线性和不确定性动态子结构系统组成的数值和物理子结构,在一个自适应法与神经网络权重的新漏项错误信息是实现开发改进收敛。一个实验在一个quasi-motorcycle测试平台验证了这种控制策略的有效性。在[55),一个神经动态控制纳入strict-feedback一类未知的非线性系统的控制通过使用动态面控制技术。针对一类不确定非线性系统与未知的滞后,神经网络是用于补偿的非线性56]。在[57),来应对未知的不均匀系统的未知输入饱和度的不对称,NNs状态输出反馈控制中使用了基于中值定理和隐式函数。避免使用逐步退焊法合成,表面动态控制方案设计相结合的神经网络非线性扰动观测器(58]。
3.2。基于神经网络的自适应动态规划
除了自适应控制,神经网络也被用来解决非线性系统的优化问题。在传统最优控制,动态规划方法被广泛使用。它的目标是最小化一个预定义的成本函数,这样可以推导出一系列最优控制输入。然而,成本函数通常很难获得在线计算由于计算的复杂性的解决Hamilton-Jacobi-Bellman HJB方程。因此,一个自适应/近似动态规划(ADP)技术开发59),训练一个神经网络估计成本函数,然后推导ADP的解决方案。一般来说,ADP有几个不同的同义词,包括近似动态规划,启发式动态规划(黄芪丹参滴丸),批评网络,强化学习(RL) [60- - - - - -62年]。图4显示与critic-actor黄芪丹参滴丸的基本框架结构。在[63年),一个离散时间HJB方程解决了使用基于神经网络的黄芪丹参滴丸算法推导非线性离散时间系统的最优控制。在[64年),三个神经网络构造了迭代ADP,这样最优反馈控制的离散时间仿射非线性系统可以实现。在[65年),提出了一种全球化的双重启发式编程来解决离散系统的最优控制。在每个迭代中,三个神经网络是用来学习成本函数和未知的非线性系统。在[66年),参考网络结合行动网络和评论家网络介绍了ADP架构获得内部目标表示,这样可以促进学习和优化过程。参考网络也被引入在线action-dependent启发式动态规划采用双重评论家网络框架。策略迭代算法引入无限的地平线非线性系统的最优控制中使用ADP (67年]。在[68年),介绍了强化学习方法的不确定非线性系统的稳定控制输入约束的存在。通过使用这个RL-based控制器,解决了约束最优控制问题,只有一个评论家神经网络的建设。在[69年),一份ADP技术在线学习控制的广义多输入多输出(MIMO)系统进行了研究。在[70年ADP),基于自适应神经网络控制方案,提出了一类非线性系统与未知的动力。最优控制律计算通过使用双重神经网络方案评论家神经网络和神经网络的标识符。特别是,参数估计误差是用于在线识别学习权重达到限定时间收敛。一类非线性系统的最优跟踪控制研究(71年),提出了一种新的基于“identifier-critic”ADP框架。
3.3。进化计算
除了逼近能力和神经网络的优化,也有一个伟大的兴趣使用进化方法来训练神经网络。的演化神经网络结构、学习规则,连接权重,和输入功能,进化的人工神经网络(EANN)旨在提供优越的性能相比,传统的训练方法(72年]。一个EANN得到的文献综述73年),进化策略如前馈人工神经网络和遗传算法(GA) EANNs介绍了。在[72年),介绍了几个EANN框架通过嵌入进化算法(EA)进化神经网络结构。在[74年],EPNet进化系统提出了进化的前馈神经网络基于福格尔的进化编程(EP)方法,可以提高神经网络的连接权值和结构同时健身以及减少噪音评估。良好的泛化能力进化神经网络的构造和验证实验。在[75年),一个基于GA的技术被用来训练NNs直接神经控制系统,这样可以优化神经网络架构。EANN是优化过程的缺乏常常导致较低的训练速度。要解决这个问题,促进适应过程,混合多目标进化方法开发的(76年),奇异值分解(圣)技术是用来选择必要的神经元数量的训练前馈神经网络。进化的方法应用于确定一个灰色矩形模型与多目标优化显然知道实际系统之间和近似非线性系统77年]。介绍了进化算法的机器人导航的应用和研究78年]。机器学习技术的调查报告(79年),综述了几种方法提高进化计算。
进化算法已在许多方面得到的演变,比如训练神经网络连接权值或获取算法神经网络架构,以及学习规则得到适应他们的环境。一句话,进化算法提供NNs学会学习的能力以及构建进化和学习之间的关系,这样EANN可以执行良好的适应环境的动态变化的能力。
4所示。在机器人中的应用
4.1。基于神经网络的机器人机械手的控制
一般来说,机器人机械手的控制方法大致可以分为两组,模范自由控制和基于模型的控制。模范自由控制方法如proportional-integral-derivative (PID)控制,满意的控制性能可能无法保证。相比之下,基于模型的控制方法表现出更好的控制行为,但严重依赖于机器人模型的有效性。然而在实践中,一个完美的机器人动力学模型总是没有由于和不确定性的复杂机制。此外,负载可能是不同的根据不同的任务,这使得准确的动力学模型很难获得。解决这些问题,NN approximation-based控制方法已被广泛用于机器人机械手控制的应用程序。一个基本的结构自适应神经网络控制的机器人机械手图所示5。考虑机器人机械手的动力学模型给出如下(80年]: 在哪里 , ,是惯性矩阵,科里奥利矩阵,分别和重力矢量。神经网络控制设计可以给出如下: 在哪里跟踪误差,速度跟踪误差,是神经网络控制器权重矩阵和是神经网络回归量向量,和是控制获得指定的设计师。
从(10),我们可以看到机器人控制器由一个PD-like控制器和一个神经网络控制器。在传统的基于模型的控制器,机器人的动力学模型可以视为一个前馈解决机器人运动造成的影响。然而在实践中, , ,可能不知道。因此,得到用于近似未知动力学 和提高系统的性能通过在线估计。适应神经网络权重自适应法设计如下: 在哪里和积极的指定参数。右边的上学期(11σ)是修改,用于增强适应参数的收敛性和鲁棒性。
在[80年),研制了基于神经网络的共享控制方法来控制一个遥控机器人与环境的不确定性。在这部作品中,时滞是构造大小弥补未知动力学的遥控机器人。尤其是一个共享的控制策略是发展成控制器实现自动避障结合视觉摄像机和机器人身体的信息,这样的障碍可能是成功地避免和操作员可能更关注操作任务而不是环境保证稳定性和操纵。此外,错误转换集成到自适应神经网络控制保证瞬态控制性能。这是表明,采用神经网络技术,控制性能的运动水平和遥控机器人的动态水平提高。在[81年),一个极端学习机(ELM)提出了控制策略为基础确定机器人机械手来确定弹性和几何对象的。这榆树处理未知的非线性机器人的机械手提高控制性能。特别是利用榆树,该控制器可以保证机器人动力学遵循一个参考模型,这样所需的设置点和前馈力可以更新估计物体的几何形状和刚度。结果,参考模型可以完全与数量有限的迭代。
在[82年),神经网络控制器也被用来控制轮式倒立摆,被分解成两个子系统,一个完全驱动二阶平面移动子系统和一个被动的一阶摆子系统。然后时滞来弥补大小的不确定动态这两个子系统通过使用其强大的学习能力,这样增强的控制性能可以实现通过使用神经网络学习。在[83年),提出了一种全局自适应神经控制的机器人机械手与限定时间学习收敛性能。这种控制方案采用平滑切换机制结合名义神经网络控制器和鲁棒控制器,以确保全球一致最终有界稳定。得到了最优权值的限定时间估计算法,在学习过程中,学习权重可以重用下次重复任务。全球神经网络控制机制进一步扩展到双手臂机器人机械手的控制(84年),了解机器人机械手和提前把握对象不可用。规定的功能集成到设计控制器,双手臂机器人控制的瞬态性能是经常得到保证。神经网络也用来解决同步问题的多个机器人机械手(85年),可用的参考轨迹只是团队成员的一部分。利用神经网络逼近控制器,机器人已经显示出更好的控制性能与增强的瞬态性能和增强鲁棒性。时滞是构造大小来补偿非线性的杆操纵器基于一个错误的变换函数(86年]。神经网络控制也被应用于机器人遥操作控制(87年,88年]。此外,神经网络近似技术用来处理未知动力学、运动学、机械手跟踪控制(驱动器属性89年]。
4.2。基于神经网络的机器人控制与非线性输入
机器人机械手的另一个挑战是输入非线性摩擦等死区,执行机构饱和也不可避免的存在于机器人系统。这些输入非线性可能导致较大的跟踪误差和控制性能的退化。因此,大量的作品提出了处理非线性利用神经网络设计。神经自适应控制器被设计来处理输入饱和的影响机器人的机械手在[90年)如下: 在哪里是机器人的位置跟踪误差,速度跟踪误差,是一个辅助控制器。 , ,和神经网络权值, , ,和是神经网络回归量向量,然后呢和是控制获得指定的设计师。是一个辅助系统旨在减少饱和的影响定义如下。 在哪里是转矩误差引起的饱和,是一个小的积极价值。神经网络权重更新,适应法律设计如下: 在哪里 , ,和积极指定参数和 , ,和是积极的参数。
在[91年),一种自适应神经网络控制器构造近似输入死区和不确定机器人机械手的动力学,而输出约束也被认为是在反馈控制。在[92年),应用神经网络对未知模型参数的估计一个海军的水面舰艇和(93年全状态约束的n链接机器人机械手是通过使用神经网络控制。灵活的机器人机械手的神经网络控制器也构造处理振动抑制弹簧质点模型进行基于集总(94年]在[95年),两个RBFNNs构造灵活的机器人机械手来弥补未知动力学和死区效应,分别。
神经网络也被应用在许多重要的工业领域,如智能水下机器人(auv和高超音速飞行器(HFV)。在[96年),构造了神经网络处理的态度水下机器人的输入死区和不确定模型参数。在[97年),自适应神经控制来处理水下航行器控制与未知输入非线性离散时间域遇到,外部干扰和模型的不确定性。然后强化学习应用于解决这些不确定性通过使用一个评论家神经网络和神经网络。高超音速飞行器控制研究[98年)空气动力学的不确定性和未知扰动被基于扰动观测器的神经网络解决。在[99年),神经学习控制嵌入到HFV控制器实现通过切换机制和全球稳定鲁棒控制器。
4.3。基于神经网络的人机交互控制
最近,有一个主要倾向于雇佣机器人在human-surrounded环境中,比如家庭服务或工业应用,人类和机器人可以直接相互作用。因此,交互控制已经成为一种很有前途的研究领域,已被广泛研究。在[One hundred.),这样的学习方法是机械臂的动力学可以遵循目标阻抗模型只有机械的知识结构(见图6)。
神经网络的进一步应用于机器人控制在与环境的交互101年),阻抗控制是实现完全未知的机器人动力学。在[102年),这样的学习方法是,机器人能够调整阻抗参数与未知的环境。为了学习最佳阻抗参数的机器人机械手控制,自适应动态规划(ADP)法当机器人与未知时变环境,得到被用于评论家和演员网络(103年]。ADP也用于协调multirobots [104年),可能的分歧处理不同的机械手和机器人的动力学和操纵对象并不需要知道。
在这部作品中,控制器由两部分组成,一个评论家网络用来近似成本函数和一个实际的神经网络设计来控制机器人。评论家神经网络设计如下(104年]: 在哪里 , 与被物体的位置跟踪误差,是神经网络的重量,是解释变量向量。
评论家神经网络用于近似一个成本函数 ,在那里表示控制输入和正定矩阵。自控制的目标是最小化控制努力,适应法律设计 在哪里学习速率和吗 。
另一方面,实际的神经网络控制的目的是控制机器人 在哪里可以学习机器人的动力学,是神经网络权重和被解释变量向量。和分别的位置和速度跟踪错误,然后呢是控制增益。
自控制的目标是保证机器人动力学和成本函数的估计 ,自适应选择法如下: 在哪里和都是正的常数。
另一方面,作为一个基本元素的下一代机器人,机器人协作(HRC)已被广泛研究的机器人专家,神经网络是用于HRC以其强大的学习能力。在[105年),得到了估计人类伙伴的运动意图在人机协作,使得机器人能够积极遵循它的人类伙伴。调整机器人的角色带领或遵循人类的意图,根据博弈理论是用于人机交互的基本分析和制定一套适应法律[106年]。政策采用迭代结合神经网络提供了一个严格的解决问题的办法在人机交互系统的平衡107年]。
4.4。基于神经网络的机器人认知控制
根据预测加工理论(108年),人类的大脑总是积极预测传入的感觉运动信息。这一过程的存在,因为生物表现出延迟由于神经处理延迟和带宽有限的感觉运动加工。为了弥补这样的延迟,在人类的大脑,神经反馈信号(包括横向和自上而下连接)调节神经活动通过抑制或兴奋性连接通过影响人口的神经编码的自底向上的丰富性非常在意perception-action系统中的信号。同样,在机器人系统中,据称这种延迟和带宽有限也可以补偿预测复发性神经学的功能模型。这样的一个学习的过程只能通过视觉处理(109年]或循环的观念和行动110年]。
基于层次感觉运动集成理论,主张行动和感知交织在一起通过共享相同的表征基础(111年),表示在不同层次的感官知觉没有明确表示行动;相反,有一个编码的未来可能的认知从之前感觉运动知识。
在贝叶斯,一旦这个知觉和动作链接已经建立了学习之后,这些perception-action协会在此体系结构允许以下操作。
首先,这些协会允许预测特定行为的感知结果通过远期模型(例如,贝叶斯模型)。它可以写成 在哪里E估计即将到来的知觉证据给出一个执行的行动一个你已经在之前和其他信息 。这个词 表明prelearnt模型代表电机动作的可能性一个将考虑到执行(可能)产生的感官证据吗被认为(向后计算)。
第二,这些协会允许选择一个适当的运动目的给出一个感性表示。从逆向计算中引入以下方程,预测感觉运动集成发生: 在哪里一个表明一个特定操作选择(目的)感官信息和一个目标G。这里我们假设一个的行动只取决于当前感觉输入和目标。
的分层组织,它还允许此操作:用双向信息途径,低水平的感知表示可以表示在一个更高的层面上,与更复杂的感受野,反之亦然 。这可以实现双向深架构等(112年]。从概念上讲,这些操作可以通过提取统计规律如图7。
自感知和行动过程可以被视为时间序列,从数学的角度来看,复发性网络是图灵完备的,有学习能力学习时间序列具有任意长度(113年),如果适当地训练。此外,这样的反复连接可以放置在一个分层的方式预测函数在不同层试图预测非线性时间序列在不同时间尺度(114年]。从这一点上,与递归神经网络的参数偏差单元(RNNPB) [115年递归神经网络)和多个时间尺度(MTRNN) [116年)应用于预测序列通过理解他们在不同时间的水平。
时间的差异水平控制不同级别的属性表示的复发性网络。例如,在MTRNN网络(112年),每个神经元的学习遵循古典发射率模型的更新规则,在一个神经元的活动是由平均所有连接神经元的放电频率。此外,神经活动也随着时间腐烂后漏水的积分器模型的更新规则。假设我th MTRNN神经元的数量N连接,当前的神经元膜电位状态可以定义为以前的激活和当前的突触输入: 在哪里代表了突触的重量jth神经元的我th神经元,的活动jth神经元在tth时间步,τ是时间尺度参数决定了这个神经元的衰变率:一个更大的吗τ意味着他们的活动随时间变化缓慢而那些小时间尺度参数τ。
在[117年),详细讨论了预测编码的概念,在那里学习,生成和识别的操作可以进行通过预测误差最小化的原则。通过使用预测编码,RNNPB MTRNN能够生成自己的行为和识别由他人执行相同的操作。最近,研究neurorobotics实验表明,动态预测编码方案可以用来解决时间的波动模式在培训递归神经网络(RNN)模型(118年]。这种预测编码方案使生物体预测感知结果基于当前的行动意图外部环境和知觉预测序列对应于给定目的状态(118年]。
基于该体系结构,两层RNN模型被用来提取视觉信息(119年和理解意图120年)或情绪状态(121年在社会机器人;三层RNN模型被用来集成和理解一个人形iCub机器人的多通道信息(112年,122年]。此外,预测编码框架一直延伸到变分贝叶斯预测编码MTRNN,可仲裁之间的确定性模型和概率模型通过设置一个metaparameter [123年]。这些扩展可以提供显著的改善在处理噪声波动感觉输入机器人预计将经历更多的现实世界。在[124年MTRNN),是用来控制一个仿人机器人和实验结果表明,通过只使用部分训练数据,控制模型可以通过学习实现泛化特性感知较低水平。
RNN展览的层次结构存储多通道信息的一个很好的学习能力,有利于机器人系统理解和预测在一个复杂的环境。随着未来模型和应用程序,先进的深度学习技术或机械系统的运动行为可以进一步融入这种预测架构。
5。结论
总之,伟大的成就为控制非线性系统的神经网络设计已经获得了在过去的二十年。尽管识别或不可能列出所有相关的贡献在这简短的回顾,一直努力总结,最近的进步领域的神经网络控制及其在机器人学习特定的应用程序控制,机器人交互控制和机器人识别控制。在这篇文章中,我们已经表明,取得了重大进展的神经网络控制的非线性系统,在解决优化问题,在系统动力学近似,在处理非线性的输入,在人机交互,在模式识别中。所有这些发展伴随不仅控制和先进制造技术的发展,但也戏剧性的进展在建设和发展中神经网络。虽然作出了极大的努力来嵌入神经网络在实际控制系统中,仍有大量的理论和实践之间的差距。改进的可行性和可用性,进化计算理论提出了训练得到。它可以自动发现算法神经网络的体系结构,允许一个神经网络学习规则的适应环境。然而,进化算法的复杂和长期的训练过程阻止了它们的实际应用。更需要努力进化神经网络体系结构和神经网络学习技术在控制设计。另一方面,人类大脑的神经活动调制通过抑制或兴奋性连接通过影响人口的神经编码的自底向上的丰富性非常在意perception-action系统中的信号。 In this sense, how to integrate the sensor-motor information into the network to make NNs more feasible to adapt to the environment and to resemble the capacity of the human brain deserves further investigations.
总之,简要回顾对神经网络自适应神经控制提供的复杂非线性系统,基于神经网络的动态规划,进化计算,及其在机器人领域的实际应用。我们相信这个区域可以促进增加调查的理论和应用。和新兴的话题,像深度学习125年- - - - - -128年),大数据(129年- - - - - -131年),云计算,可能被纳入复杂的神经网络控制系统;例如,深层神经网络可以用来处理大量的无监督数据在复杂场景中,神经网络可以帮助降低数据维数,和神经网络训练的优化可能是用来提高学习和适应机器人的性能。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作是国家自然科学基金支持的部分(国家自然科学基金委)拨款61473120,广东省自然科学基金,2014 a030313266,国际科技合作、格兰特2015 a050502017,广州市科技计划项目,201607010006,机器人技术与系统国家重点实验室(打击)授予sklrs - 2017 kf - 13,中央大学和基础研究基金。