复杂性

在这一页上

文摘介绍结论的利益冲突确认引用版权相关文章

特殊的问题

神经网络对复杂系统:理论和应用程序

把这个特殊的问题

评论文章|开放获取

体积2017年| 文章的ID1895897| https://doi.org/10.1155/2017/1895897

简要回顾基础学习和神经网络控制及其应用的机器人

翳明江,¹ 晨光杨 ,¹ 京娜,² 光李,³ 延安李 ,⁴ 和纯平钟⁵

学术编辑器: 蒂埃里弗洛凯

收到了 2017年6月15日

接受 2017年10月01

发表 2017年10月31日

文摘

作为一种模仿生物神经系统的神经网络(NNs),已被描述为强大的学习工具,用于各种各样的应用程序,如复杂的非线性系统的控制、优化、系统辨识、模式识别。本文旨在将最先进的海军新闻的简要回顾总结最新进展的复杂非线性系统NNs在理论和实际应用。具体地说,这个调查还评论数量的基于神经网络的机器人控制算法,包括基于神经网络的机械手控制,基于神经网络的人机交互,以及基于神经网络的认知控制。

1。介绍

近年来,神经网络(NN)的研究已经引起了极大关注。众所周知,哺乳动物的大脑,包括数十亿神经元相互连接,有能力处理复杂和计算要求的任务,如人脸识别、身体运动规划、控制和肌肉活动。图1显示了哺乳动物的神经元的细胞结构。灵感来自于神经元结构,人工神经网络(ANN)是模仿生物神经系统的学习能力(1- - - - - -3]。人工得到的概念最初是在1940年代由McCulloch和皮特的调查(3),建立了网络平行结构。神经网络的基本数学模型由三层组成,即输入层、隐藏层和输出层,并行计算结构简单但吸引人的学习能力和计算能力来预测非线性动态模式。

在过去的几十年里,研究了神经网络技术在控制工程等领域广泛,航空航天、医药、汽车、心理学、经济学、能源科学、和许多其他领域(4- - - - - -7]。据报道,神经网络可以近似任何未知的连续非线性函数通过重叠每个神经元的输出。此外,可以任意小的近似错误选择足够的神经元。这使我们能够处理复杂的非线性系统控制问题(8- - - - - -13]。除了系统建模和控制,神经网络也已成功地应用在各个领域,如学习(14- - - - - -17),模式识别(18),和信号处理19]。和神经网络已被广泛用于函数近似,如补偿的影响未知动力学非线性系统(20.- - - - - -31日]。神经网络控制已经被证明是有效的不确定非线性系统控制和演示了在许多方面的优越性。

最近,研究人员主要集中在机器人技术的研究越来越重要的在日常生活和工业应用(33- - - - - -38]。许多先进的机器人,如弓由ABB,巴克斯特由反思,Rolins贾斯汀由德国航空航天机构(DLR)也被广泛分配。机器人机械手系统是具有高度非线性、强耦合、时变动力学,从而控制机器人不仅定位精度,但也足够的灵活性来完成一项复杂的任务成为一个有趣的挑战的工作。为了实现高性能控制,机器人的动力学应该提前知道。然而,在实践中,机器人动力学模型常常是很少知道由于复杂的机器人机制,更不用说等不确定性参数的不确定性或机器人动力学中存在的建模错误。因此,推进下一代机器人的控制算法势在必行。由于通用逼近和学习能力,神经网络已经被广泛应用于机器人控制与各种应用程序。结合神经网络和机器人控制器可以提供可能的解决方案对于复杂的操作任务,例如,机器人控制与非结构化环境未知动力学和机器人控制。在本文中,我们提出一个简短的回顾机器人控制的神经网络。剩下的纸是组织如下。

介绍,后部分2,预赛几个流行的神经网络结构,如时滞和大小小脑模型神经网络。部分3介绍了许多领域的神经网络自适应控制的理论发展,优化和进化计算。此外,部分4再次使用机器人神经网络控制应用程序的操作,人机交互,认知控制机器人。部分5简要讨论了神经网络控制及其未来的研究。

2。预赛的神经网络

在本节中,我们将介绍几种类型的神经网络结构,控制工程中普遍采用。

2.1。径向基函数神经网络(时滞)大小14,15]

时滞网络大小的基本架构图所示2,它包括三个层次,即输入层、隐藏层和输出层。在输入层,应用神经网络的输入。在隐藏层,数据转换从输入空间到隐藏的空间,总是与更高的维度。时滞可以用来近似大小的任何连续向量函数,例如, : 在哪里的估计是和是神经网络的输入向量。是神经网络最优的估计重量, 是回归量,表示神经网络的节点的数量。通常,回归量可以被选择作为激进高斯基函数如下: 在哪里不同的点在状态空间和吗是高斯隶属函数的宽度。已经认识到,使用强大的时滞,大小的近似能力我们可以逼近任意非线性连续函数在一个紧集在哪里最优权向量和吗是近似误差。

2.2。小脑模型关节控制器(小脑)神经网络39]

有主要倾向于研究机器人的学习和控制技术通过研究生物系统的原则。这是由于生物、机制和基本原则可能会带来新颖想法改善控制机器人在复杂环境下的性能。1972年,阿不思·学习机制,提出了一个模仿小脑的结构和功能,称为小脑模型关节控制器(小脑),设计基于小脑的神经生理学模型(40]。反向传播神经网络相比,小脑模型神经网络在建模和控制的机器人系统广泛采用的快速学习速度,结构简单,数据序列的不敏感,容易实现(39,41]。

图3显示了小脑模型神经网络的基本结构。的小脑模型可以用来近似未知的连续函数, ,在那里表示维输入空间。如图3,两个组件参与小脑模型神经网络来确定近似非线性函数的值 : 在哪里是米维输入空间F是n维输出空间C是维空间协会

和协会表示映射从输入向量空间;也就是说, 。计算输出 ,通过使用一个协会的投影向量α到权重向量,这样

应该注意的是,函数可以表示为一个多维接受申请,这样在输入每个点吗与一个激活值分配。协会的接受域基函数向量可以被选为高斯函数如下: 在哪里l块的关联空间,表示k与输入相关的块 , 表示接受域的中心,是高斯函数的方差。然后,可以被描述为多维接受域函数在哪里 , , 。下面的属性显示了近似小脑模型神经网络所提供的能力。

引理1。连续非线性函数 ,存在一个理想体重值 ,这样可能是由小脑模型与统一近似最优权重的乘法和关联向量作为在哪里神经网络结构错误和满意吗和是一个小型有界的积极价值。

3所示。理论的发展

3.1。自适应神经控制

在过去的二十年里,各种神经网络已经融入自适应控制与未知非线性系统动力学。在[42),多人离散神经网络控制器构造了一类多输入multioutput (MIMO)动力系统,神经网络权重被训练使用一种改进的在线优化算法。提出了一种自适应神经网络输出反馈控制来控制两类离散时间系统在未知面前控制方向(4]。鲁棒自适应神经控制器开发了一类strict-feedback系统(43),努斯鲍姆获得技术用来处理未知的虚拟控制系数。动态回归神经网络用于建筑的一种自适应观测器在线把权重参数(44)和处理的一类非线性时滞动力系统(45]。strict-feedback的时滞非线性系统也解决了使用神经网络控制与适当的设计Lyapunov-Krasovskii函数(46]。针对一类未知非线性仿射时滞系统,提出了一种自适应控制方案通过构造两个高阶NNs识别系统不确定性(47]。这个想法进一步扩展到仿射非线性系统具有输入时滞(48]。

应该注意到,分段连续函数,如摩擦、反弹,死区广泛存在于工业工厂。除了连续非线性函数,这些分段函数的近似是更具挑战性由于神经网络的通用近似仅仅适用于持续的功能。这些分段连续函数近似,一种新的神经网络结构设计的有关标准的激活函数和一个跳近似基函数(49]。在[47)、小脑模型神经网络采用非线性动力系统的闭环控制与严格的稳定性分析,和在50一个鲁棒自适应神经网络控制方案为合作开发的高阶非线性系统的跟踪控制。

自适应神经网络控制方案也提出了pure-feedback系统。在[51),提出了一种高阶滑模观测器来估计未知系统状态,而两个NNs构造处理近似错误和未知的非线性,分别。相比传统pure-feedback系统控制设计,实现了状态反馈控制不使用逐步退焊法技术。在[52),提出了一种神经控制框架的非线性伺服机制来保证稳态和瞬态跟踪性能。在这项工作中,规定受雇于一个输出误差性能函数变换,这样跟踪性能可以保证按规定的控制输出。在[53),还设计了一个自适应神经控制一类非线性系统的时延和输入死区,和高阶神经网络是用来处理未知的不确定性。在这项工作中,显著特征在于,只有规范得到的权重(标量)需要在线更新,这样在网络实现可以显著提高计算效率。在[54),作者开发了一种基于神经网络前馈控制补偿的非线性和不确定性动态子结构系统组成的数值和物理子结构,在一个自适应法与神经网络权重的新漏项错误信息是实现开发改进收敛。一个实验在一个quasi-motorcycle测试平台验证了这种控制策略的有效性。在[55),一个神经动态控制纳入strict-feedback一类未知的非线性系统的控制通过使用动态面控制技术。针对一类不确定非线性系统与未知的滞后,神经网络是用于补偿的非线性56]。在[57),来应对未知的不均匀系统的未知输入饱和度的不对称,NNs状态输出反馈控制中使用了基于中值定理和隐式函数。避免使用逐步退焊法合成,表面动态控制方案设计相结合的神经网络非线性扰动观测器(58]。

3.2。基于神经网络的自适应动态规划

除了自适应控制,神经网络也被用来解决非线性系统的优化问题。在传统最优控制,动态规划方法被广泛使用。它的目标是最小化一个预定义的成本函数,这样可以推导出一系列最优控制输入。然而,成本函数通常很难获得在线计算由于计算的复杂性的解决Hamilton-Jacobi-Bellman HJB方程。因此,一个自适应/近似动态规划(ADP)技术开发59),训练一个神经网络估计成本函数,然后推导ADP的解决方案。一般来说,ADP有几个不同的同义词,包括近似动态规划,启发式动态规划(黄芪丹参滴丸),批评网络,强化学习(RL) [60- - - - - -62年]。图4显示与critic-actor黄芪丹参滴丸的基本框架结构。在[63年),一个离散时间HJB方程解决了使用基于神经网络的黄芪丹参滴丸算法推导非线性离散时间系统的最优控制。在[64年),三个神经网络构造了迭代ADP,这样最优反馈控制的离散时间仿射非线性系统可以实现。在[65年),提出了一种全球化的双重启发式编程来解决离散系统的最优控制。在每个迭代中,三个神经网络是用来学习成本函数和未知的非线性系统。在[66年),参考网络结合行动网络和评论家网络介绍了ADP架构获得内部目标表示,这样可以促进学习和优化过程。参考网络也被引入在线action-dependent启发式动态规划采用双重评论家网络框架。策略迭代算法引入无限的地平线非线性系统的最优控制中使用ADP (67年]。在[68年),介绍了强化学习方法的不确定非线性系统的稳定控制输入约束的存在。通过使用这个RL-based控制器,解决了约束最优控制问题,只有一个评论家神经网络的建设。在[69年),一份ADP技术在线学习控制的广义多输入多输出(MIMO)系统进行了研究。在[70年ADP),基于自适应神经网络控制方案,提出了一类非线性系统与未知的动力。最优控制律计算通过使用双重神经网络方案评论家神经网络和神经网络的标识符。特别是,参数估计误差是用于在线识别学习权重达到限定时间收敛。一类非线性系统的最优跟踪控制研究(71年),提出了一种新的基于“identifier-critic”ADP框架。

3.3。进化计算

除了逼近能力和神经网络的优化,也有一个伟大的兴趣使用进化方法来训练神经网络。的演化神经网络结构、学习规则,连接权重,和输入功能,进化的人工神经网络(EANN)旨在提供优越的性能相比,传统的训练方法(72年]。一个EANN得到的文献综述73年),进化策略如前馈人工神经网络和遗传算法(GA) EANNs介绍了。在[72年),介绍了几个EANN框架通过嵌入进化算法(EA)进化神经网络结构。在[74年],EPNet进化系统提出了进化的前馈神经网络基于福格尔的进化编程(EP)方法,可以提高神经网络的连接权值和结构同时健身以及减少噪音评估。良好的泛化能力进化神经网络的构造和验证实验。在[75年),一个基于GA的技术被用来训练NNs直接神经控制系统,这样可以优化神经网络架构。EANN是优化过程的缺乏常常导致较低的训练速度。要解决这个问题,促进适应过程,混合多目标进化方法开发的(76年),奇异值分解(圣)技术是用来选择必要的神经元数量的训练前馈神经网络。进化的方法应用于确定一个灰色矩形模型与多目标优化显然知道实际系统之间和近似非线性系统77年]。介绍了进化算法的机器人导航的应用和研究78年]。机器学习技术的调查报告(79年),综述了几种方法提高进化计算。

进化算法已在许多方面得到的演变,比如训练神经网络连接权值或获取算法神经网络架构,以及学习规则得到适应他们的环境。一句话,进化算法提供NNs学会学习的能力以及构建进化和学习之间的关系,这样EANN可以执行良好的适应环境的动态变化的能力。

4所示。在机器人中的应用

4.1。基于神经网络的机器人机械手的控制

一般来说,机器人机械手的控制方法大致可以分为两组,模范自由控制和基于模型的控制。模范自由控制方法如proportional-integral-derivative (PID)控制,满意的控制性能可能无法保证。相比之下,基于模型的控制方法表现出更好的控制行为,但严重依赖于机器人模型的有效性。然而在实践中,一个完美的机器人动力学模型总是没有由于和不确定性的复杂机制。此外,负载可能是不同的根据不同的任务,这使得准确的动力学模型很难获得。解决这些问题,NN approximation-based控制方法已被广泛用于机器人机械手控制的应用程序。一个基本的结构自适应神经网络控制的机器人机械手图所示5。考虑机器人机械手的动力学模型给出如下(80年]: 在哪里 , ,是惯性矩阵,科里奥利矩阵,分别和重力矢量。神经网络控制设计可以给出如下: 在哪里跟踪误差,速度跟踪误差,是神经网络控制器权重矩阵和是神经网络回归量向量,和是控制获得指定的设计师。

从(10),我们可以看到机器人控制器由一个PD-like控制器和一个神经网络控制器。在传统的基于模型的控制器,机器人的动力学模型可以视为一个前馈解决机器人运动造成的影响。然而在实践中, , ,可能不知道。因此,得到用于近似未知动力学和提高系统的性能通过在线估计。适应神经网络权重自适应法设计如下: 在哪里和积极的指定参数。右边的上学期(11σ)是修改,用于增强适应参数的收敛性和鲁棒性。

在[80年),研制了基于神经网络的共享控制方法来控制一个遥控机器人与环境的不确定性。在这部作品中,时滞是构造大小弥补未知动力学的遥控机器人。尤其是一个共享的控制策略是发展成控制器实现自动避障结合视觉摄像机和机器人身体的信息,这样的障碍可能是成功地避免和操作员可能更关注操作任务而不是环境保证稳定性和操纵。此外,错误转换集成到自适应神经网络控制保证瞬态控制性能。这是表明,采用神经网络技术,控制性能的运动水平和遥控机器人的动态水平提高。在[81年),一个极端学习机(ELM)提出了控制策略为基础确定机器人机械手来确定弹性和几何对象的。这榆树处理未知的非线性机器人的机械手提高控制性能。特别是利用榆树,该控制器可以保证机器人动力学遵循一个参考模型,这样所需的设置点和前馈力可以更新估计物体的几何形状和刚度。结果,参考模型可以完全与数量有限的迭代。

在[82年),神经网络控制器也被用来控制轮式倒立摆,被分解成两个子系统,一个完全驱动二阶平面移动子系统和一个被动的一阶摆子系统。然后时滞来弥补大小的不确定动态这两个子系统通过使用其强大的学习能力,这样增强的控制性能可以实现通过使用神经网络学习。在[83年),提出了一种全局自适应神经控制的机器人机械手与限定时间学习收敛性能。这种控制方案采用平滑切换机制结合名义神经网络控制器和鲁棒控制器,以确保全球一致最终有界稳定。得到了最优权值的限定时间估计算法,在学习过程中,学习权重可以重用下次重复任务。全球神经网络控制机制进一步扩展到双手臂机器人机械手的控制(84年),了解机器人机械手和提前把握对象不可用。规定的功能集成到设计控制器,双手臂机器人控制的瞬态性能是经常得到保证。神经网络也用来解决同步问题的多个机器人机械手(85年),可用的参考轨迹只是团队成员的一部分。利用神经网络逼近控制器,机器人已经显示出更好的控制性能与增强的瞬态性能和增强鲁棒性。时滞是构造大小来补偿非线性的杆操纵器基于一个错误的变换函数(86年]。神经网络控制也被应用于机器人遥操作控制(87年,88年]。此外,神经网络近似技术用来处理未知动力学、运动学、机械手跟踪控制(驱动器属性89年]。

4.2。基于神经网络的机器人控制与非线性输入

机器人机械手的另一个挑战是输入非线性摩擦等死区,执行机构饱和也不可避免的存在于机器人系统。这些输入非线性可能导致较大的跟踪误差和控制性能的退化。因此,大量的作品提出了处理非线性利用神经网络设计。神经自适应控制器被设计来处理输入饱和的影响机器人的机械手在[90年)如下: 在哪里是机器人的位置跟踪误差,速度跟踪误差,是一个辅助控制器。 , ,和神经网络权值, , ,和是神经网络回归量向量,然后呢和是控制获得指定的设计师。是一个辅助系统旨在减少饱和的影响定义如下。在哪里是转矩误差引起的饱和,是一个小的积极价值。神经网络权重更新,适应法律设计如下: 在哪里 , ,和积极指定参数和 , ,和是积极的参数。

在[91年),一种自适应神经网络控制器构造近似输入死区和不确定机器人机械手的动力学,而输出约束也被认为是在反馈控制。在[92年),应用神经网络对未知模型参数的估计一个海军的水面舰艇和(93年全状态约束的n链接机器人机械手是通过使用神经网络控制。灵活的机器人机械手的神经网络控制器也构造处理振动抑制弹簧质点模型进行基于集总(94年]在[95年),两个RBFNNs构造灵活的机器人机械手来弥补未知动力学和死区效应,分别。

神经网络也被应用在许多重要的工业领域,如智能水下机器人(auv和高超音速飞行器(HFV)。在[96年),构造了神经网络处理的态度水下机器人的输入死区和不确定模型参数。在[97年),自适应神经控制来处理水下航行器控制与未知输入非线性离散时间域遇到,外部干扰和模型的不确定性。然后强化学习应用于解决这些不确定性通过使用一个评论家神经网络和神经网络。高超音速飞行器控制研究[98年)空气动力学的不确定性和未知扰动被基于扰动观测器的神经网络解决。在[99年),神经学习控制嵌入到HFV控制器实现通过切换机制和全球稳定鲁棒控制器。

4.3。基于神经网络的人机交互控制

最近,有一个主要倾向于雇佣机器人在human-surrounded环境中,比如家庭服务或工业应用,人类和机器人可以直接相互作用。因此,交互控制已经成为一种很有前途的研究领域,已被广泛研究。在[One hundred.),这样的学习方法是机械臂的动力学可以遵循目标阻抗模型只有机械的知识结构(见图6)。

神经网络的进一步应用于机器人控制在与环境的交互101年),阻抗控制是实现完全未知的机器人动力学。在[102年),这样的学习方法是,机器人能够调整阻抗参数与未知的环境。为了学习最佳阻抗参数的机器人机械手控制,自适应动态规划(ADP)法当机器人与未知时变环境,得到被用于评论家和演员网络(103年]。ADP也用于协调multirobots [104年),可能的分歧处理不同的机械手和机器人的动力学和操纵对象并不需要知道。

在这部作品中,控制器由两部分组成,一个评论家网络用来近似成本函数和一个实际的神经网络设计来控制机器人。评论家神经网络设计如下(104年]: 在哪里 , 与被物体的位置跟踪误差,是神经网络的重量,是解释变量向量。

评论家神经网络用于近似一个成本函数 ,在那里表示控制输入和正定矩阵。自控制的目标是最小化控制努力,适应法律设计在哪里学习速率和吗。

另一方面,实际的神经网络控制的目的是控制机器人在哪里可以学习机器人的动力学,是神经网络权重和被解释变量向量。和分别的位置和速度跟踪错误,然后呢是控制增益。

自控制的目标是保证机器人动力学和成本函数的估计 ,自适应选择法如下: 在哪里和都是正的常数。

另一方面,作为一个基本元素的下一代机器人,机器人协作(HRC)已被广泛研究的机器人专家,神经网络是用于HRC以其强大的学习能力。在[105年),得到了估计人类伙伴的运动意图在人机协作,使得机器人能够积极遵循它的人类伙伴。调整机器人的角色带领或遵循人类的意图,根据博弈理论是用于人机交互的基本分析和制定一套适应法律[106年]。政策采用迭代结合神经网络提供了一个严格的解决问题的办法在人机交互系统的平衡107年]。

4.4。基于神经网络的机器人认知控制

根据预测加工理论(108年),人类的大脑总是积极预测传入的感觉运动信息。这一过程的存在,因为生物表现出延迟由于神经处理延迟和带宽有限的感觉运动加工。为了弥补这样的延迟,在人类的大脑,神经反馈信号(包括横向和自上而下连接)调节神经活动通过抑制或兴奋性连接通过影响人口的神经编码的自底向上的丰富性非常在意perception-action系统中的信号。同样,在机器人系统中,据称这种延迟和带宽有限也可以补偿预测复发性神经学的功能模型。这样的一个学习的过程只能通过视觉处理(109年]或循环的观念和行动110年]。

基于层次感觉运动集成理论,主张行动和感知交织在一起通过共享相同的表征基础(111年),表示在不同层次的感官知觉没有明确表示行动;相反,有一个编码的未来可能的认知从之前感觉运动知识。

在贝叶斯,一旦这个知觉和动作链接已经建立了学习之后,这些perception-action协会在此体系结构允许以下操作。

首先,这些协会允许预测特定行为的感知结果通过远期模型(例如,贝叶斯模型)。它可以写成在哪里E估计即将到来的知觉证据给出一个执行的行动一个你已经在之前和其他信息。这个词表明prelearnt模型代表电机动作的可能性一个将考虑到执行(可能)产生的感官证据吗被认为(向后计算)。

第二,这些协会允许选择一个适当的运动目的给出一个感性表示。从逆向计算中引入以下方程,预测感觉运动集成发生: 在哪里一个表明一个特定操作选择(目的)感官信息和一个目标G。这里我们假设一个的行动只取决于当前感觉输入和目标。

的分层组织,它还允许此操作:用双向信息途径,低水平的感知表示可以表示在一个更高的层面上,与更复杂的感受野,反之亦然。这可以实现双向深架构等(112年]。从概念上讲,这些操作可以通过提取统计规律如图7。

自感知和行动过程可以被视为时间序列,从数学的角度来看,复发性网络是图灵完备的,有学习能力学习时间序列具有任意长度(113年),如果适当地训练。此外,这样的反复连接可以放置在一个分层的方式预测函数在不同层试图预测非线性时间序列在不同时间尺度(114年]。从这一点上,与递归神经网络的参数偏差单元(RNNPB) [115年递归神经网络)和多个时间尺度(MTRNN) [116年)应用于预测序列通过理解他们在不同时间的水平。

时间的差异水平控制不同级别的属性表示的复发性网络。例如,在MTRNN网络(112年),每个神经元的学习遵循古典发射率模型的更新规则,在一个神经元的活动是由平均所有连接神经元的放电频率。此外,神经活动也随着时间腐烂后漏水的积分器模型的更新规则。假设我th MTRNN神经元的数量N连接,当前的神经元膜电位状态可以定义为以前的激活和当前的突触输入: 在哪里代表了突触的重量jth神经元的我th神经元,的活动jth神经元在tth时间步,τ是时间尺度参数决定了这个神经元的衰变率:一个更大的吗τ意味着他们的活动随时间变化缓慢而那些小时间尺度参数τ。

在[117年),详细讨论了预测编码的概念,在那里学习,生成和识别的操作可以进行通过预测误差最小化的原则。通过使用预测编码,RNNPB MTRNN能够生成自己的行为和识别由他人执行相同的操作。最近,研究neurorobotics实验表明,动态预测编码方案可以用来解决时间的波动模式在培训递归神经网络(RNN)模型(118年]。这种预测编码方案使生物体预测感知结果基于当前的行动意图外部环境和知觉预测序列对应于给定目的状态(118年]。

基于该体系结构,两层RNN模型被用来提取视觉信息(119年和理解意图120年)或情绪状态(121年在社会机器人;三层RNN模型被用来集成和理解一个人形iCub机器人的多通道信息(112年,122年]。此外,预测编码框架一直延伸到变分贝叶斯预测编码MTRNN,可仲裁之间的确定性模型和概率模型通过设置一个metaparameter [123年]。这些扩展可以提供显著的改善在处理噪声波动感觉输入机器人预计将经历更多的现实世界。在[124年MTRNN),是用来控制一个仿人机器人和实验结果表明,通过只使用部分训练数据,控制模型可以通过学习实现泛化特性感知较低水平。

RNN展览的层次结构存储多通道信息的一个很好的学习能力,有利于机器人系统理解和预测在一个复杂的环境。随着未来模型和应用程序,先进的深度学习技术或机械系统的运动行为可以进一步融入这种预测架构。

5。结论

总之,伟大的成就为控制非线性系统的神经网络设计已经获得了在过去的二十年。尽管识别或不可能列出所有相关的贡献在这简短的回顾,一直努力总结,最近的进步领域的神经网络控制及其在机器人学习特定的应用程序控制,机器人交互控制和机器人识别控制。在这篇文章中,我们已经表明,取得了重大进展的神经网络控制的非线性系统,在解决优化问题,在系统动力学近似,在处理非线性的输入,在人机交互,在模式识别中。所有这些发展伴随不仅控制和先进制造技术的发展,但也戏剧性的进展在建设和发展中神经网络。虽然作出了极大的努力来嵌入神经网络在实际控制系统中,仍有大量的理论和实践之间的差距。改进的可行性和可用性,进化计算理论提出了训练得到。它可以自动发现算法神经网络的体系结构,允许一个神经网络学习规则的适应环境。然而,进化算法的复杂和长期的训练过程阻止了它们的实际应用。更需要努力进化神经网络体系结构和神经网络学习技术在控制设计。另一方面,人类大脑的神经活动调制通过抑制或兴奋性连接通过影响人口的神经编码的自底向上的丰富性非常在意perception-action系统中的信号。 In this sense, how to integrate the sensor-motor information into the network to make NNs more feasible to adapt to the environment and to resemble the capacity of the human brain deserves further investigations.

总之,简要回顾对神经网络自适应神经控制提供的复杂非线性系统,基于神经网络的动态规划,进化计算,及其在机器人领域的实际应用。我们相信这个区域可以促进增加调查的理论和应用。和新兴的话题,像深度学习125年- - - - - -128年),大数据(129年- - - - - -131年),云计算,可能被纳入复杂的神经网络控制系统;例如,深层神经网络可以用来处理大量的无监督数据在复杂场景中,神经网络可以帮助降低数据维数,和神经网络训练的优化可能是用来提高学习和适应机器人的性能。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是国家自然科学基金支持的部分(国家自然科学基金委)拨款61473120,广东省自然科学基金,2014 a030313266,国际科技合作、格兰特2015 a050502017,广州市科技计划项目,201607010006,机器人技术与系统国家重点实验室(打击)授予sklrs - 2017 kf - 13,中央大学和基础研究基金。

引用

f . Gruau·d·惠特利和l . Pyeatt”比较细胞编码和直接编码遗传神经网络”学报第一年会在遗传编程,第89 - 81页,1996年。
视图: 谷歌学术搜索
h . de粗毛,“人造大脑ATR CAM-Brain项目旨在构建/进化与一百万年人造大脑神经网络模块一万亿细胞内细胞自动机的机器,”新一代计算,12卷,不。2、215 - 221年,1994页。
视图: 出版商的网站 | 谷歌学术搜索
w·s·麦克洛克和w·皮特,”一个逻辑微积分思想内在的神经活动,“通讯的数学生物学,5卷,不。4、115 - 133年,1943页。
视图: 出版商的网站 | 谷歌学术搜索
c, s .美国通用电气、c, t·柴和t·h·李,“两类离散时间系统的输出反馈神经网络控制具有未知控制方向在一个统一的方法中,“IEEE神经网络和学习系统,19卷,不。11日,第1886 - 1873页,2008年。
视图: 出版商的网站 | 谷歌学术搜索
r·库马尔·r·k·Aggarwal, j·d·沙玛,“能源分析建筑使用人工神经网络:复习一下,”能源和建筑卷,65年,第358 - 352页,2013年。
视图: 出版商的网站 | 谷歌学术搜索
c . Alippi c . De Russis诉Piuri,“一个基于神经网络的控制方案为汽车燃油喷射系统空燃比控制,”IEEE系统,人,控制论,C部分:应用程序和评论,33卷,不。2、259 - 268年,2003页。
视图: 出版商的网站 | 谷歌学术搜索
e . m . Azoff神经网络时间序列预测的金融市场约翰•威利& Sons . n:行情),1994年。
拳头,p . n . Suganthan j .拳头et al .,“人工神经网络回归作为整体的本地搜索的启发式策略微分进化,”非线性动力学,卷84,不。2、895 - 914年,2016页。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
y张,李,和h .郭”的一种偏见一致同意的分布式神经网络路径规划,“非线性动力学,卷89,不。3、1803 - 1815年,2017页。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
x, z . Wang和l .汉”限定时间随机时滞神经网络的同步和噪声干扰,”非线性动力学,卷88,不。4、2747 - 2755年,2017页。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
p .他和李y,“H∞的同步耦合反应扩散与混合神经网络延迟,”复杂性,21卷,不。S2, 42-53, 2016页。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
z, j .曹a . Alsaedi f . e . Alsaadi和t .是“全球拉格朗日复数神经网络稳定性的中立型时变延迟,”复杂性,21卷,不。S2, 438 - 450年,2016页。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
c, s .郭,徐y”形成autapse连接神经元及其生物功能,“复杂性卷,2017篇文章ID 5436737、9页,2017。
视图: 出版商的网站 | 谷歌学术搜索
j·d·j·卢比奥,伊莱亚斯,d·r·克鲁兹和j·帕切科”统一稳定的径向基函数神经网络预测的两个机械电子流程,“Neurocomputing卷,227年,第130 - 122页,2017年。
视图: 出版商的网站 | 谷歌学术搜索
j . d,卢比奥USNFIS:均匀稳定的神经模糊推理系统”,Neurocomputing卷,262年,页57 - 66,2017。
视图: 出版商的网站 | 谷歌学术搜索
问:刘,j .阴v c . m .梁黄永发。翟、z Cai和j·林”,应用一个新的局部泛化误差模型来设计神经网络训练与极端的学习机器,”神经计算和应用,1 - 8,2014页。
视图: 出版商的网站 | 谷歌学术搜索
r·j·德·耶稣“插值神经网络模型制造的风力涡轮机的,”神经计算和应用,2016年,页1 - 12。
视图: 出版商的网站 | 谷歌学术搜索
μc和d . Wang”神经元网络自适应保成本控制的非线性动力系统匹配不确定性,”Neurocomputing卷。245年,46 - 54岁,2017页。
视图: 出版商的网站 | 谷歌学术搜索
林z, d .妈,j .孟和l·陈,“相对排序学习飙升为模式识别、神经网络”Neurocomputing,2017年。
视图: 出版商的网站 | 谷歌学术搜索
j . j . Yu唱,x高,“机器学习和大型多媒体信号处理分析,“Neurocomputing卷,257年,页1 - 4,2017。
视图: 出版商的网站 | 谷歌学术搜索
t, s .美国通用电气,c . c .挂“strict-feedback非线性系统自适应神经网络控制使用逐步退焊法设计,“自动化,36卷,不。12日,第1846 - 1835页,2000年。
视图: 出版商的网站 | 谷歌学术搜索
美国美国通用电气和t .张”,神经网络控制不均匀的非线性系统零动态的状态和输出反馈,”IEEE神经网络和学习系统,14卷,不。4、900 - 918年,2003页。
视图: 出版商的网站 | 谷歌学术搜索
美国美国通用电气、c·杨和t·h·李,“使用神经网络的自适应预测控制pure-feedback在离散时间系统,”IEEE神经网络和学习系统,19卷,不。9日,第1614 - 1599页,2008年。
视图: 出版商的网站 | 谷歌学术搜索
f·w·刘易斯,美国Jagannathan, a . Yesildirak神经网络控制的机器人机械手和非线性系统,CRC出版社,1998年。
美国Jagannathan f·l·刘易斯,“使用多层神经网络识别的非线性动力系统,”自动化,32卷,不。12日,第1712 - 1707页,1996年。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
d . Vrabie f·刘易斯,“连续时间神经网络方法直接自适应最优控制部分未知的非线性系统,”神经网络,22卷,不。3、237 - 246年,2009页。
视图: 出版商的网站 | 谷歌学术搜索
c·杨,美国美国通用电气,t·h·李,“输出反馈自适应控制的一类非线性离散时间系统具有未知控制方向,”自动化,45卷,不。1,第276 - 270页,2009。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
c·杨、李z和j .李”轨迹规划和优化的自适应控制的轮式倒立摆车模型,”IEEE控制论,43卷,不。1,24-36,2013页。
视图: 出版商的网站 | 谷歌学术搜索
y江、杨c和h .妈,“回顾模糊逻辑为离散时间系统和基于神经网络的智能控制设计,“离散动力学性质和社会,文章ID 7217364,艺术。ID 7217364, 11页,2016年。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
江y, c .杨S.-L。戴,b .任“确定性学习增强神经网络控制的无人直升机,”国际先进的机器人系统杂志》上,13卷,不。6、1 - 12,2016页。
视图: 出版商的网站 | 谷歌学术搜索
江y, z . Liu c·陈,y,“自适应鲁棒模糊控制与死区非线性未知输入,双手臂机器人”非线性动力学,卷81,不。3、1301 - 1314年,2015页。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
https://stemcellthailand.org/neurons-definition-function-neurotransmitters/。
m . Defoort t·弗洛凯,a . Kokosy和w·Perruquetti”结合滑模控制形成合作自主移动机器人IEEE工业电子产品,55卷,不。11日,第3953 - 3944页,2008年。
视图: 出版商的网站 | 谷歌学术搜索
c . x Liu Yang, z . Chen m . Wang和c·苏,“Neuro-adaptive观察者建立柔性关节机器人的控制,“Neurocomputing,2017年。
视图: 出版商的网站 | 谷歌学术搜索
f . Hamerlain、t·弗洛凯和w·Perruquetti”实验测试滑模控制器的轮式移动机器人轨迹跟踪的特点,“Robotica,32卷,不。1,第76 - 63页,2014。
视图: 出版商的网站 | 谷歌学术搜索
r . j . de耶稣,“离散时间控制基于神经网络对钟摆,”应用软计算,2017年。
视图: 出版商的网站 | 谷歌学术搜索
y, m . j .呃,t .太阳,徐,和H . Yu”自适应模糊PD控制和H∞跟踪保证稳定,”Neurocomputing卷,237年,第78 - 71页,2017年。
视图: 出版商的网站 | 谷歌学术搜索
r . j . de耶稣,“离散时间的自适应最小二乘控制机器人手臂,“软计算,19卷,不。12日,第3676 - 3665页,2015年。
视图: 出版商的网站 | 谷歌学术搜索
美国Commuri、美国Jagannathan和f·l·刘易斯“小脑模型神经网络机器人机械手的控制,”《机器人系统,14卷,不。6,465 - 482年,1997页。
视图: 出版商的网站 | 谷歌学术搜索
j·s·阿不思·”,小脑模型的理论和实验方面,“发育障碍的研究评论,17卷,第101 - 93页,1972年。
视图: 谷歌学术搜索
杨,r·鲍和h·汉,“鲁棒混合控制基于PD和小说不需改进的体系结构和电动负载模拟器、学习计划”IEEE工业电子产品,卷61,不。10日,5271 - 5279年,2014页。
视图: 出版商的网站 | 谷歌学术搜索
Jagannathan和f·l·刘易斯“多层离散神经网络控制器在保证性能,”IEEE神经网络和学习系统,7卷,不。1,第130 - 107页,1996。
视图: 出版商的网站 | 谷歌学术搜索
通用电气和j .王”一类摄动的鲁棒自适应神经控制严格反馈非线性系统,”IEEE神经网络和学习系统,13卷,不。6,1409 - 1419年,2002页。
视图: 出版商的网站 | 谷歌学术搜索
黄懿慧金、f·l·刘易斯和c·t·阿卜杜拉,“动态神经元网络自适应观测器复发对于一类非线性系统,”自动化,33卷,不。8,1539 - 1543年,1997页。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
J.-Q。黄和f·l·刘易斯与时滞神经网络对非线性动态系统的预测控制,”IEEE神经网络和学习系统,14卷,不。2、377 - 389年,2003页。
视图: 出版商的网站 | 谷歌学术搜索
美国美国通用电气、f .香港和t·h·李,“非线性时滞系统的自适应神经控制与未知的虚拟控制系数,”IEEE系统,人,控制论,B部分:控制论,34卷,不。1,第516 - 499页,2004。
视图: 出版商的网站 | 谷歌学术搜索
j . Na x m . Ren, h .黄”非线性时滞系统的时滞正反馈控制与神经网络补偿,”Zidonghua学报/《自动化学报》,34卷,不。9日,第1202 - 1196页,2008年。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
j . Na x任、c .商和y郭,“自适应神经网络预测控制非线性纯反馈系统的输入延迟,”《过程控制,22卷,不。1,第206 - 194页,2012。
视图: 出版商的网站 | 谷歌学术搜索
r . r . Selmic f·l·刘易斯,“分段连续函数的神经网络近似:应用摩擦补偿,”IEEE神经网络和学习系统,13卷,不。3、745 - 751年,2002页。
视图: 出版商的网站 | 谷歌学术搜索
h .张和f·l·刘易斯“适应性合作高阶非线性系统的跟踪控制未知的动力,”自动化,48卷,不。7,1432 - 1439年,2012页。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
j . Na x任,d .郑”自适应控制对于高阶滑模观测器的非线性pure-feedback系统,”IEEE神经网络和学习系统,24卷,不。3、370 - 382年,2013页。
视图: 出版商的网站 | 谷歌学术搜索
j . Na问:陈、任x和y,“规定性能的伺服运动控制自适应摩擦补偿机制,“IEEE工业电子产品,卷61,不。1,第494 - 486页,2014。
视图: 出版商的网站 | 谷歌学术搜索
赫曼·g·j . Na任x, z乔,“自适应神经动态面控制伺服系统与未知死区,“控制工程实践,19卷,不。11日,第1343 - 1328页,2011年。
视图: 出版商的网站 | 谷歌学术搜索
j·g . Li Na, d . p . Stoten x任,“动态子结构系统自适应神经网络前馈控制,”IEEE控制系统技术,22卷,不。3、944 - 954年,2014页。
视图: 出版商的网站 | 谷歌学术搜索
徐,z史、c·杨和f .太阳,“复合神经动态面控制的一类不确定非线性系统strict-feedback形式,“IEEE控制论,2014年。
视图: 出版商的网站 | 谷歌学术搜索
m·陈和美国通用电气、“自适应神经与未知的不确定非线性系统的输出反馈控制滞后利用扰动观测器,”IEEE工业电子产品,2015年。
视图: 出版商的网站 | 谷歌学术搜索
m .陈和美国通用电气,“直接自适应神经控制针对一类不确定的不均匀基于扰动观测器的非线性系统,”IEEE控制论,43卷,不。4、1213 - 1225年,2013页。
视图: 出版商的网站 | 谷歌学术搜索
g . m . Chen道,b .江“动态面控制使用神经网络针对一类不确定非线性系统具有输入饱和,”IEEE神经网络和学习系统,26卷,不。9日,第2097 - 2086页,2015年。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
p . j . Werbos”近似动态规划实时控制和神经建模”手册的智能控制,1992年。
视图: 谷歌学术搜索
F.-Y。王、张h . d . Liu”自适应动态规划:介绍,“IEEE计算机情报杂志,4卷,不。2,39-47,2009页。
视图: 出版商的网站 | 谷歌学术搜索
f·l·刘易斯·d·Vrabie, k。Vamvoudakis”、强化学习和反馈控制:使用自然决策方法来设计最优自适应控制器,”IEEE控制系统杂志,32卷,不。6,76 - 105年,2012页。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
f·l·刘易斯和d Vrabie”,强化学习反馈控制和自适应动态规划,“IEEE电路和系统杂志,9卷,不。3,32-50,2009页。
视图: 出版商的网站 | 谷歌学术搜索
a . Al-Tamimi f·l·刘易斯和m . Abu-Khalaf“离散时间非线性HJB使用近似动态规划解决方案:收敛性证明,“IEEE系统,人,控制论,B部分:控制论,38卷,不。4、943 - 949年,2008页。
视图: 出版商的网站 | 谷歌学术搜索
罗h·张,y,刘”神经元网络算法控制一类离散时间仿射非线性系统控制约束,“IEEE神经网络和学习系统,20卷,不。9日,第1503 - 1490页,2009年。
视图: 出版商的网站 | 谷歌学术搜索
问:d, d . Liu, d .赵和n .金”未知的不均匀的非线性离散系统的最优控制基于自适应动态规划,“自动化,48卷,不。8,1825 - 1832年,2012页。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
z h .他倪,j .傅”三家网络架构的在线学习和优化基于自适应动态规划,“Neurocomputing,卷78,不。1,2012页。3日到13。
视图: 出版商的网站 | 谷歌学术搜索
刘问:魏,“政策迭代自适应动态规划算法对离散时间非线性系统,”IEEE神经网络和学习系统,25卷,不。3、621 - 634年,2014页。
视图: 出版商的网站 | 谷歌学术搜索
刘、杨x·d·王,问:,“Reinforcement-learning-based连续时间不确定的非线性系统鲁棒控制器设计输入约束,“IEEE控制论,45卷,不。7,1372 - 1385年,2015页。
视图: 出版商的网站 | 谷歌学术搜索
j .傅h .他和周x”自适应学习和控制对MIMO系统基于自适应动态规划,“IEEE神经网络和学习系统,22卷,不。7,1133 - 1148年,2011页。
视图: 出版商的网站 | 谷歌学术搜索
y Lv, j . Na问:杨,吴x和y,“在线自适应最优控制与完全未知的连续时间非线性系统动力学,”国际期刊的控制,卷89,不。1,第112 - 99页,2016。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
j . Na和g·赫尔曼,”在线自适应近似最优跟踪控制简化为连续时间双近似结构未知的非线性系统,”IEEE / CAA自动化杂志》上,1卷,不。4、412 - 422年,2014页。
视图: 出版商的网站 | 谷歌学术搜索
x姚明,“进化人工神经网络”,IEEE学报》,卷87,不。9日,第1447 - 1423页,1999年。
视图: 出版商的网站 | 谷歌学术搜索
s . f .叮,h·李,c . y . Su j . z . Yu和f . x,“进化人工神经网络:一个评论,”人工智能审查,39卷,不。3、251 - 260年,2013页。
视图: 出版商的网站 | 谷歌学术搜索
姚x和y刘”,一个新的进化系统进化人工神经网络,”IEEE神经网络和学习系统,8卷,不。3、694 - 713年,1997页。
视图: 出版商的网站 | 谷歌学术搜索
李y和a . Haußler”人工进化神经网络及其应用的反馈控制,”人工智能技术在工程,10卷,不。2、143 - 152年,1996页。
视图: 出版商的网站 | 谷歌学术搜索
C.-K。吴作栋,E.-J。销量,k . c . Tan“人工神经网络混合多目标进化型设计,”IEEE神经网络和学习系统,19卷,不。9日,第1548 - 1531页,2008年。
视图: 出版商的网站 | 谷歌学术搜索
k . c . Tan和李y“灰色矩形模型识别通过进化计算,”控制工程实践,10卷,不。7,673 - 684年,2002页。
视图: 出版商的网站 | 谷歌学术搜索
和c . m . c . k . l . Wang Tan咀嚼,进化机器人:从算法来实现咀嚼C M .进化机器人,从算法实现[M]。新泽西,2006年。
j . Zhang Z.-H。张,林y . et al .,“进化计算与机器学习:一项调查,”IEEE计算机情报杂志》第六卷,没有。4、68 - 75年,2011页。
视图: 出版商的网站 | 谷歌学术搜索
l·c·杨x Wang程,h·马”Neural-learning-based远程控制与保证性能,”IEEE控制论,2017年。
视图: 出版商的网站 | 谷歌学术搜索
y . c .杨k黄h Cheng Li和c·苏,“触觉ELM-controlled确定机械手,鉴定”IEEE系统,人,和控制论:系统卷,47号8,2017。
视图: 出版商的网站 | 谷歌学术搜索
c·杨,李z, r .崔,徐,”神经网络运动控制的驱动轮式倒立摆模型,”IEEE神经网络和学习系统,2014年。
视图: 出版商的网站 | 谷歌学术搜索
c·杨,t·邓徐,z . Li j . Na和c·苏,“全球机器人机械手的自适应跟踪控制使用限定时间的神经网络学习收敛,“国际期刊的控制、自动化和系统,15卷,不。4、1916 - 1924年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
江c·杨,y, z, w .他和彭译葶。苏,”神经控制与保证全球稳定和运动精度,用双手的机器人”IEEE工业信息,2017年。
视图: 出版商的网站 | 谷歌学术搜索
r·崔和w .燕”,相互同步多个机器人机械手的未知的动力,”《智能与机器人系统,卷68,不。2、105 - 119年,2012页。
视图: 出版商的网站 | 谷歌学术搜索
l . Cheng Z.-G。侯,m . Tan和w·j·张,“闭链五杆机器人的跟踪控制集成两个自由度的approximation-based方法和机械设计,“IEEE系统,人,控制论,B部分:控制论,42卷,不。5,1470 - 1479年,2012页。
视图: 出版商的网站 | 谷歌学术搜索
c·杨,x, y, z . Li和c·苏,“遥操作控制基于波变量和神经网络的结合,“IEEE系统,人,和控制论:系统,2017年。
视图: 出版商的网站 | 谷歌学术搜索
c .杨j .罗y, z . Liu和c·苏,“个性化变量与地震衰减增益控制机器人遥操作”IEEE系统,人,和控制论:系统,2017年,页1 - 12。
视图: 出版商的网站 | 谷歌学术搜索
l . Cheng Z.-G。侯,m . Tan“自适应神经网络跟踪控制机械手与不确定的运动学、动力学和执行机构模型,”自动化,45卷,不。10日,2312 - 2318年,2009页。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
w .他、y盾和c .太阳,”机器人机械手的自适应神经阻抗控制输入饱和,”IEEE系统,人,和控制论:系统,46卷,不。3、334 - 344年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
w .他,a·o·大卫z阴,和c太阳,”机器人机械手的神经网络控制死区输入和输出约束,“IEEE系统,人,和控制论:系统,2015年。
视图: 出版商的网站 | 谷歌学术搜索
w .他、z阴和c .太阳,“自适应神经网络控制的海洋船舶使用非对称势垒李雅普诺夫函数约束,“IEEE控制论,2016年。
视图: 出版商的网站 | 谷歌学术搜索
w .他,陈y和z阴,“一个不确定的自适应神经网络控制机器人全状态约束,“IEEE控制论,46卷,不。3、620 - 629年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
c .太阳,w .他和j .香港“神经网络控制灵活的机器人机械手使用弹簧质点模型进行集中,“IEEE系统,人,和控制论:系统卷,47号8,1863 - 1874年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
w .他,y欧阳,j .香港“灵活的机器人机械手的振动控制输入的存在死区,“IEEE工业信息,13卷,不。1,48-59,2017页。
视图: 出版商的网站 | 谷歌学术搜索
r·崔、张x和d·崔”时自适应滑模姿态控制与输入非线性自治水下车辆,”海洋工程卷。123年,45 - 2016页。
视图: 出版商的网站 | 谷歌学术搜索
r·崔c·杨,李y,沙玛,“自适应神经网络控制的水下机器人控制输入非线性利用强化学习,”IEEE系统,人,和控制论:系统卷,47号6,1019 - 1029年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
张b, d . Wang y, z,”罗伯特基于神经控制灵活的高超音速飞行器考虑风的影响,“IEEE工业电子产品卷,页没有。99年,p . 2017。
视图: 出版商的网站 | 谷歌学术搜索
徐b、c·杨和y,“全球神经strict-feedback的动态表面跟踪控制系统与应用程序高超音速飞行器,“IEEE神经网络和学习系统,26卷,不。10日,2563 - 2575年,2015页。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
y,美国美国通用电气,c .杨“学习阻抗控制物理robot-environment互动,”国际期刊的控制,卷85,不。2、182 - 193年,2012页。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
y,美国美国通用电气、问:张先生,t。李,“神经网络阻抗控制的机器人与环境互动,”专业控制理论与应用,7卷,不。11日,第1519 - 1509页,2013年。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
李y和美国通用电气,“阻抗学习对于机器人与未知的交互环境,”IEEE控制系统技术,22卷,不。4、1422 - 1432年,2014页。
视图: 出版商的网站 | 谷歌学术搜索
y . c . Wang,美国美国通用电气,t。李,“最佳评论家学习机器人控制在时变环境中,“IEEE神经网络和学习系统,26卷,不。10日,2301 - 2310年,2015页。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
李y l . Chen k . p .三通和李问:“强化学习控制多机器人协调操作。”Neurocomputing卷,170年,第175 - 168页,2015年。
视图: 出版商的网站 | 谷歌学术搜索
李y和美国通用电气,“人机协作基于运动估计,意图”IEEE / ASME举办,19卷,不。3、1007 - 1014年,2013页。
视图: 出版商的网站 | 谷歌学术搜索
k . p . y . Li三通,w . l . Chan r .严y蔡,和d . k . Limbu”连续角色适应机器人共享控制。”IEEE机器人没有,卷。31日。3、672 - 681年,2015页。
视图: 出版商的网站 | 谷歌学术搜索
严r . k . p . y . Li三通,w . l . Chan和吴y,“一个框架基于博弈论的人机协调和政策迭代,”IEEE机器人,32卷,不。6,1408 - 1418年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
a·克拉克冲浪的不确定性:预测,行动,和体现,牛津大学出版社,2015年。
j .钟、c·韦伯和s . Wermter”学习特性和基于水平产品模型预测转换编码,“神经网络和机器LearningICANN,第546 - 539页,2012年。
视图: 谷歌学术搜索
j .钟、c·韦伯和s . Wermter”预测网络架构一个健壮的和光滑的机器人对接的行为,”行为杂志》上的机器人,3卷,不。4、172 - 180年,2012页。
视图: 谷歌学术搜索
w·普林茨“感知和行动计划”,欧洲认知心理学杂志》上,9卷,不。2、129 - 154年,1997页。
视图: 出版商的网站 | 谷歌学术搜索
j .钟m . Peniak j .塔理事长绪方t . a . Cangelosi,“感觉运动输入语言概括工具:Neurorobotics模型生成和概括的名词-动词组合感觉运动输入,“技术代表、arXiv, 1605.03261, 2016年,arXiv: 1605.03261。
视图: 谷歌学术搜索
h·t·Siegelmann和e·d·桑塔格”,在神经网络的计算能力,”计算机与系统科学杂志》上,50卷,不。1,第150 - 132页,1995。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
j .钟感觉运动集成人工神经模型反馈通路,。
j . " m .伊藤,y杉”为代表的分布式自组织多个镜像系统的行为模式:使用RNNPB评论机器人实验,”神经网络,17卷,不。8 - 9,1273 - 1289年,2004页。
视图: 出版商的网站 | 谷歌学术搜索
w·Hinoshita h·阿里,j . " h . g . Okuno理事长绪方和t”出现的分层结构镜像语言递归神经网络组成,”神经网络,24卷,不。4、311 - 320年,2011页。
视图: 出版商的网站 | 谷歌学术搜索
j .塔尼语探索机器人的头脑:行动、符号和意识自组织动态现象,牛津大学出版社,2016年。
视图: 出版商的网站
a .艾哈迈迪j·塔尼语,“如何复发性神经能的预测编码模式应对波动时间模式?机器人模仿交互实验”,神经网络卷。92年,3-16,2017页。
视图: 出版商的网站 | 谷歌学术搜索
j .钟a Cangelosi, s . Wermter”走向自组织pre-symbolic神经模型代表感觉运动原语,“行为神经科学前沿,8卷,货号。22日,2014年。
视图: 出版商的网站 | 谷歌学术搜索
h·k·阿巴斯,r . m . Zablotowicz和h·a·布鲁斯”建模的殖民化玉米产毒素的和non-toxigenic黄曲霉菌株:对生物防治的影响。”世界霉菌毒素杂志,1卷,不。3、333 - 340年,2008页。
视图: 出版商的网站 | 谷歌学术搜索
j .钟和l .梅洛”连续情感空间连续表达空间:非语言行为识别和生成”学报4日联合IEEE国际会议上发展和学习和表观遗传机器人、IEEE ICDL-EPIROB 2014ita,页75 - 80年,2014年10月。
视图: 出版商的网站 | 谷歌学术搜索
理事长绪方j .钟、a . Cangelosi和t”向抽象从综合数据:实证研究在多个时间尺度复发模型,”人工神经网络国际联合会议(IJCNN),2017年。
视图: 谷歌学术搜索
g .公园和j·塔尼语”,成分和上下文传染性一致的发展机器人利用动态神经网络模型,”神经网络卷,72年,第122 - 109页,2015年。
视图: 出版商的网站 | 谷歌学术搜索
艾哈迈迪和j·塔尼语,“缩小之间的差距概率和确定性模型:变分上的模拟研究贝叶斯递归神经网络预测编码模型,”2017年,https://arxiv.org/abs/1706.10240。
视图: 谷歌学术搜索
y LeCun (y Bengio g·辛顿,“深度学习”,自然,卷521,不。7553年,第444 - 436页,2015年。
视图: 出版商的网站 | 谷歌学术搜索
,的j。施密德胡贝尔表示“深度学习神经网络:概述”,神经网络卷,61年,第117 - 85页,2015年。
视图: 出版商的网站 | 谷歌学术搜索
a . Krizhevsky i Sutskever, g·e·辛顿“Imagenet分类与深卷积神经网络,”学报》第26届年会在神经信息处理系统(捏12)太浩湖,页1097 - 1105年,内华达州,美国,2012年12月。
视图: 谷歌学术搜索
w·刘,刘x, z . Wang n .曾y . Liu和f . e . Alsaadi“深层神经网络体系结构及其应用的调查,“Neurocomputing卷。234年,11-26,2017页。
视图: 出版商的网站 | 谷歌学术搜索
g·e·辛顿和r . r . Salakhutdinov”,与神经网络,降低数据的维数”美国科学促进协会:科学,卷313,不。5786年,第507 - 504页,2006年。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
公元前Pijanowski, A . Tayyebi j .多赛特b . k .北京d·布劳恩和j . Plourde”在全国范围内大数据城市增长仿真:配置GIS和基于神经网络的土地转换模型运行在高性能计算(HPC)环境中,“环境建模与软件,51卷,第268 - 250页,2014年。
视图: 出版商的网站 | 谷歌学术搜索
d . c . Cireşan迈耶,l . m . Gambardella,的和j。施密德胡贝尔表示“深大,简单的神经网络的手写数字识别,”神经计算,22卷,不。12日,第3220 - 3207页,2010年。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

13215年

下载

3792年

引用