文摘
每个执行不同的日常活动,如达到和用手举起,显示了机器人设计的重要作用估计物体的位置或肌肉力量。了解人体的肌肉骨骼系统的学习控制机制可以让我们来开发一种鲁棒控制技术,可以应用到康复机器人。人类手臂的肌肉骨骼模型在这项研究中的应用是一个3-link机器人加上6肌肉neurofuzzy控制器啧啧的类型以及multicritic代理用于培训和学习模糊规则。自适应评论家代理基于强化学习监督控制器的参数和避免过度训练。仿真结果表明,在这两个州的有/没有优化,控制器可以顺利跟踪期望轨迹和可接受的精度。力量的大小优化模型是显著降低,这意味着控制器的正确操作。链接也采取同样的轨迹整体位移较低的可行模式,符合手的自然运动,寻求最优轨迹。
1。介绍
在许多国家,人口老龄化导致生产力下降的有用的工作,这将导致严重的问题。许多机器人设计和用于self-rehabilitation的老年人,残疾人,受损的人们在日常活动1- - - - - -11]。手是身体的一部分,经常涉及,在大多数人的日常活动。每个执行不同的日常活动,如达到和解除与他的手在这个领域显示了机器人设计的重要作用来估计的位置的力的手。全世界,一个趋势是,越来越多的应用程序处理机器,灵感来自人类的武器,在所有的工业领域,把材料从一个目标到另一个在有限的操作条件。机械手的发展都体现在他们的高技术水平和经济增长和安全(12]。在人类机器人手臂,两个链接通常用作手臂和前臂段与二自由度(自由度)和至少四个肌肉元素用于在2 d空间移动。逆动力学模型应用于生成关节力矩在这个机器人13]。运动或力预先确定的和强大的控制器设计的康复中使用的应用程序。培训是一个重要的因素控制臂实现静态目标,和身体的肌肉骨骼系统逐渐获得这种能力通过与周围环境的交互。例如,一个足球运动员执行一系列随机活动提供球的门,但在这个领域更专业的他变得更快和更高效的他击出的球(14,15]。这是通过逐步训练肌肉的运动,相关信息可以保存和使用在未来16]。因此,了解身体的肌肉骨骼系统的培训机制可以让我们使用一个强大的身体康复机器人控制器。许多研究人员使用训练控制,逐渐训练手臂控制器(17- - - - - -21]。Golkhou et al。22)采用一种改进的单键手臂肌肉骨骼Actor-Critic算法的控制器和两个伸肌和屈肌肌肉在振动运动。小脑模型控制器应用于批评部分估计最优活动和更新演员部分的系数。Zacharie et al。23)一种先进的基于逻辑神经网络应用于机器人的手。逻辑函数确定基于端点的胳膊在空间的任意轨迹计算的可能条件反应神经元的活动所需的字段。Bouganis和沙24)提出了一个神经网络能够自动学会控制与五自由度机械手和电机的初始时间条件。Kambara et al。25)提出了一种基于逆静态控制模型进行运动训练模型,直接动态模型,结合Actor-Critic和反馈控制。他们的模型支持轨迹预测的二自由度手臂有六个人造肌肉。托马斯et al。26)应用一种改进的学习控制器基于比例微分(PD)控制技术来控制机器人的手和四个肌肉进行活动。董et al。27,28]实现的一种自适应滑模控制策略与biarticular肌肉,这样双自由度机械手的动态参数更新,造成系统的输入扰动和刺激被认为是。Zadravec et al。29日)实现一个最优控制器的成本函数最小化关节力矩,双自由度机械手。在这项研究中,作者可以预测最优轨迹以及肌肉的功能限制。
这个模型需要准确的动态参数;但是,准确地确定这些参数对不同的人是不现实的。根据上面的文献综述中,适应性和最优性是人类大脑的基本特征,以及缺乏一个强大的控制器,可以实现大脑的控制策略在某种程度上是非常明显的。在目前的研究中,首先,管理3-link人类手臂的运动方程及相关动力学方程表达2。一种自适应neurofuzzy控制器是在下一小节中介绍。从控制器的仿真结果有/没有优化提出了部分4。最后,本研究的总结讲话中描述的部分5。
2。人类的三自由度手臂肌肉骨骼模型
人类的多体平面模型与三自由度手臂是呈现在图1,上臂、前臂和手被认为是三个刚性连接。该模型考虑了平面运动三个转动关节周围的肩膀,手肘、手腕和忽略了重力的影响。如图1,该模型包含六个肌肉只能应用拉力,这样每个联合旋转其中的一些相关的肌肉。肌肉认为是没有重量和设计基于希尔模型,这是直接连接到链接(30.]: 表示的输出力th肌肉,肌肉最大收缩力,表示控制肌肉的激活水平是肌肉收缩速度。 分别也肌肉阻尼系数和刚度。考虑六个肌肉的数量,情商的矩阵形式。1)是
下列方程表示的关系结束的位置矢量的胳膊,关节角的效应: 在哪里 , ,和代表第一、第二和第三个链接,分别。 , ,和也是相关链接的角度吗 - - - - - -轴,第二个和第三个链接。速度的终端执行器的手臂,这是依赖于角速度,表示如下:
是雅可比矩阵显示之间的关系部门的终端执行器的线速度和角速度。向量长度的肌肉被定义为 和 在哪里和代表了扭矩表面,如图1。下面的方程是通过采取上述方程的时间导数:
是雅可比矩阵,与肌肉的收缩速度关节的角速度,然后呢 代表了伸展肌肉。通过应用虚功原理,所做的功肌肉力矩定义如下:
在哪里 是向量代表了拉伸肌肉和力量吗 是关节转矩向量。如表中所描绘的一样1通过将肌肉参数Eq。6),定义如下:
利用拉格朗日方程(29日]
是一个对称矩阵代表大众势头,是一个斜对称的矩阵的科里奥利、离心和摩擦力矩。用情商。8)上面的方程,获得肌肉骨骼系统的动力学方程
3所示。控制器设计
控制器设计的主要目的是为每个肌肉使用适当的运动命令的过程中与环境和交互学习的手臂运动的运动学朝着一个固定的目标。Neurofuzzy系统相结合的神经网络与模糊逻辑系统和利用来简化问题,运用主观的,复杂的规则和概念。模仿人类大脑的功能在这些系统中,由一组人工神经元,使用一个人工神经网络与模糊逻辑规则。Ghanooni et al。31日)发现,自适应multicritic neurofuzzy控制框架可以帮助识别未知的系统,建议此控制器的参数所需的计算负载兼容性是低于传统neurofuzzy控制器,这是一个实时应用程序的这个控制器的优点。他们还声称,控制器将受益于强化学习与监督学习在网络输出的评价,导致控制系统中不确定性的能力。
一个新的自适应neurofuzzy控制框架结构由几个输入和输出基于强化学习调查Balaghi et al。32]。他们的研究旨在控制运动轨迹通过优化二自由度模型的人类手臂的肌肉收缩力量。“评论家估计系统的成就,”和“演员”更新控制器参数通过生成相关的信号。他们认为难以确定精确的生物规范值,如质量和惯性让他们使用这个控制器,因为它是独立于模型参数。此外,该控制器的输入生成最优,这是重要的肌肉骨骼系统由于人类肌肉的生物限制的局限性。该控制器实现对现有三自由度模型在这项研究中,因为上面提到的优势。模型在任意轨迹的端点必须直接对所有初始值在X和Y方向上由多个肌肉收缩力量。因此,一个多输入多输出系统(MIMO)组成的肌肉应该考虑输入和端点输出。
3.1。Neurofuzzy网络
模糊系统由模糊化单元、去模糊化,模糊规则库和推理引擎。模糊系统可以被看作是执行一个真正的和非线性的映射一个输入向量 一个输出向量 ,在哪里和输入和输出向量的维度,分别。位接口和模糊的世界fuzzifier defuzzifier,分别。早期的真实地址输入相关的模糊集,而后者用于解决输出变量的模糊集相关联的实际输出在相反的方向。
两种类型的模糊系统,称为Takagi-Sugeno-Kang(啧啧)和系统与fuzzifiers defuzzifiers (Mamdani),在文献中更常见,啧啧类型是在这项研究中用于自适应neurofuzzy控制框架。对于多输入变量(味噌)neurofuzzy系统包括规则定义如下:
规则我:如果( 是 )如果( 是 )和…如果( 是 )
如果
在哪里是规则的数字,的输入数,表示输入的模糊集,的线性关系输入评估作为脆函数
因此,啧啧neurofuzzy输出可以表示为
在情商。12),的规则数量,的隶属函数是规则。
输入的自适应批评家neurofuzzy控制器应用于人类手臂的端点模型研究 , , ,和作为 在哪里 和 预期的和实际的输出系统的二维空间,分别。 和 也想要和真正的手臂的端点在任务空间的速度。因此,啧啧的向量形式neurofuzzy输出规则计算
一种自适应神经网络的模糊系统是一个标准的啧啧系统,导致基础课网络的形成。在第一层,所有的输入都是直接到[1]隶属函数的范围。基于图2,三个隶属度函数确定为每个输入和使用的标签 , ,和 ,代表消极的,零,分别和积极的表达。同时,模糊化和去模糊化过程是执行在第二和第四层,分别。第三层执行决策与Max-Product法律。因此,有81个规则啧啧的每个控制器系统。
3.2。自适应评论家
评论家代理是任何学习系统的主要部分。每个评论家代理检查系统的状态评估其输出信号并生成一个评论家 。信号是实数范围内的(1,1)和由学习过程实现训练和调整TSK模糊系统的参数来减少信号到达零值表明,系统不需要更多的培训。在multicritic系统中,评价系统的性能是由单独每个代理。因此,所有评论家信号应该成为零,这表明批评家是满足系统的性能。这里,两个成本函数研究了满足批评家通过最小化的(33]
在哪里和手臂的位置和速度跟踪误差的端点,和批评者们的体重,这表明组件成本偏好函数,和规模变量把项目[1],和正如前面提到的是控制肌肉的激活水平。在情商。16),右边的第二项是啧啧系统的优化,最大限度地减少肌肉的拉力。改革的上述方程的数量肌肉和系统的输出表示为 在哪里收缩的力量吗th肌肉,是最大的 , 和评论家重量,是一个任意正数。如上所述,目的是控制手臂的肌肉骨骼系统的端点到达期望的位置同时减少收缩肌肉力量;因此,在情商。17), 和 。控制器的框图和评论家规则如图所示3。
3.3。学习系统
如前所述,学习机制的主要目的是最小化误差函数的批评效果和满足所有批评的标准。在学习系统中,更新neurofuzzy控制参数通过关键信号被称为情感训练。因此,情感训练旨在最小化代价函数在情商。17)。通过使用牛顿梯度下降法,评论家权重的变化应符合以下规则: 在哪里相应的学习速率neurofuzzy控制器和控制器的可调参数。用情商。17和情商。18)在上面的方程,用链式法则产量
是输入的数量模型和术语,然后呢 是情商的雅可比矩阵。7)。根据裁判的方法。33),提出了一种矩阵通过实现一个神经网络,雅可比矩阵 获得的是 在哪里大众动力系统的动力学方程。同时,通过情商。1),考虑到这个词 是计算
情商。19)更新系数的啧啧控制器作为评论家规则。
4所示。结果
在本节中,三自由度模型,随着neurofuzzy批评家控制器分别分配给每一个肌肉,数值模拟。首先,隶属度函数的极限和啧啧系统决定的。仿真模型的任意显示的值 ,以及 ,可以接受的。在下一步中,随机选取初始值的范围被分配到矩阵在情商。15),六个肌肉。这些系数更新的情商。19在每一步来最小化代价函数值。最小化是最初由最小化错误的值和最终导致适当的系统的性能。相关的参数选择控制器
显示控制器的性能没有考虑肌肉优化的影响,也与执行的过程 。与联合相关的模型参数和值类型的肌肉表中列出2和表1。
对控制器的性能,应用一个半圆形轨迹在工作区中由以下方程:
总被认为是模拟时间 ,在上述期间,预计将完全通过轨迹模型。显示控制器对系统不确定性的鲁棒性,转移被认为是10%的值在模型中质量和惯性。图4显示模型的运动轨迹在这两种情况下,不考虑肌肉的优化。中,这两种模型可以按照所需的轨迹与可接受的精度。应该注意,少一点以下错误的可行模式。这是因为专注,在这种情况下,只有降低轨迹误差,模型不是寻求优化的肌肉力量。
图5显示力量的大小应用到每一块肌肉在运动。肌肉力量的值显著降低优化模式,正确显示控制器的性能。力的最大值也在预定的范围内,适当控制。这些有限的值在肌肉力量的一个主要特性,导致应用最优控制模型。
最后,图6说明各关节在运动取代。该值意味着两种情况有选择完全不同的配置通过轨迹。在优化的情况下肌肉,肌肉较低的位移,即。,links got through the trajectory with a lower overall displacement than the optimized muscles. The obtained results are in good agreement with the hand’s natural motion, which is always sought the optimal trajectory of motion. This figure shows the advantage of the muscle optimization method.
5。结论
给定的轨迹之后适当的控制器有/没有肌肉的优化。然而,跟踪误差略低缺乏优化的情况下,由控制器跟踪期望轨迹的关注没有减少肌肉的力量。结合最优控制器,肌肉力量远低于那些nonoptimal控制器,提出一个重要的角色的肌肉在提高控制器的性能优化。肌肉力量的最大值也在所需的范围和控制。这个有限的力量的一个主要特征应用到模型最优控制策略。在优化的情况下肌肉,关节位移较低。,links go through the trajectory with a lower overall displacement compared to nonoptimized muscles case, and this shows the good agreement of results with the natural motion of the hand, which is always sought the optimal trajectory of motion. We intend to enable the movement of the arm exactly along complex trajectories as well as the compensation of dominant external disturbances [34,35]。此外,未来的研究将主要致力于实验分析获得的结果。的可行性提出neurofuzzy控制系统提出了未来的研究。提出neurofuzzy控制器应该包含自适应性和肌肉力量优化等基本特征。此外,其他方法如机器学习和人工智能可以应用达到最优结果。
数据可用性
提取数据从一篇名为“控制达到运动Musculo-Skeletal冗余手臂模型”。
的利益冲突
作者宣称他们没有利益冲突的关系研究。
确认
作者宣称他们没有任何资源的财政资金关系研究和出版。