研究文章|开放获取
在物理人机交互意图识别基于径向基函数神经网络
文摘
在人机触觉协作解决问题同步运动,机器人通常需要认识到合作伙伴的意图。在这篇文章中,一个方法基于径向基函数神经网络(时滞)大小模型提出了识别运动合作者的意图。在这里,人类的目的是定义为所需的速度在人类肢体的模型中,获得的估计基于实时交互力和接触点运动特征(机器人)的当前位置和速度的训练有素的时滞模型大小。获取训练样本,自适应阻抗控制方法用于控制机器人在数据采集过程中,然后执行数据匹配阻抗函数的相位延迟。的优势提出意图根据系统实时状态估计方法,该模型克服了困难估计人体阻抗参数的缺点。实验结果表明,这种方法提高了同步人机协作和降低了合作的力量。
1。介绍
人机协作是用于许多领域,如军事、空间技术、工业、医疗、康复、帮助老人或残疾人,和娱乐1,2]。然而,人机合作的方式的缺点同步,过度的相互作用力,和穷人运动遵从性。
规定使机器人跟踪轨迹,阻抗控制被公认为是一个有前途的交互控制方法。毫无疑问,在不同的应用程序人机共享控制系统,改变的方法助理杠杆的阻抗参数经常使用。Ikeura等人提出了在线调整阻尼参数以优化的方式通过减少所选成本函数在帮助人类携带一个大,沉重,或尴尬的对象(3]。克里Mizanoor拉赫曼等人修改了助动控制通过使用一种新型控制策略基于重量感知和加载力特性。控制修改应用负载的过度压力减少了受试者在每个提升方案(4]。
有许多方法基于视觉图像采集的行为特征来预测人类行为(5),包括面部识别(6)和轮廓识别(7]。然而,这些方法不仅可用于应用程序中提供的信息都是相互作用力的物理人机交互。
Kazuhiro Kosuge和Norihide Kazamura提出几种算法来生成基于故意力和运动实验进行比较,包括力增强的方法类型、位置控制的方法类型和方法的速度控制类型(8]。迪伦p一丁点它们等人提供了一个人类和机器人共享任务执行的统一视图。他们定义三个关键主题出现在共享控制场景,即意图检测、仲裁,和反馈9]。共享任务的第一步,有必要探索方法的耦合pHRI系统可以检测到人类正在做什么,以及如何利用物理耦合本身检测目的。
在许多物理人机交互(pHRI)应用程序中,可以定义在一个二进制的意图。通常是确定从脑机接口(BMI),见(10]。在其他应用程序中,用户的目的是定义的速度或位置轨迹,预测发展路径的用户和/或机器人。人类运动控制是复杂的,涉及活动的中枢神经系统(CNS),周围神经系统(pn),肌肉骨骼系统,最后对环境的相互作用所控制。在每个子系统有可测量的物理量,称为状态变量,它是人类意图的表现。为了管理一个上肢机器人假肢的复杂性,在许多研究中,用户通常是给预定义的姿势,掌握或假肢可以自动完成功能。在[11- - - - - -14),上肢假肢控制由用户在选择一个预定义的函数;因此,它是可能的用户意图是由单个类别变量。有两种主要的方法来识别人类意图基于myographic信号:模式识别和映射到连续工作。的模式识别方法是地图模式任意数量的信号特性所需的假肢的姿势,掌握或功能。控制算法学习这种映射的方式各不相同,但共同的LDA方法,支持向量机、人工神经网络(ann) [11,12,15]。其他研究人员正致力于开发控制系统,明确学习EMG信号之间的映射和用户所需的关节转矩。由Kiguchi等人一个很好的例子是使用一种自适应neurofuzzy修饰符学习广场均方根(RMS)之间的关系的EMG信号测量和估计用户所需的力矩(16]。
人与人之间的互动的经验,而不是测量myographic信号来估计人类的意图,两个合作者可以很容易地完成一个握手任务或objects-carrying基于人类之间的相互作用力。此外,相互作用力很容易和精确测量相比,机电信号通过使用一个6自由度力/力矩传感器在机器人终端执行器监视人机交互。因此,下面的讨论是基于相互作用力来识别人类的意图。
很多用户意图检测的例子围绕评估交互用户贡献力量。为了获得相互作用力,实现机器人协助用户最低限度实现预定义的轨迹,Pehlivan等人使用一个机器人的逆动力学模型来估计用户力量应用到机器人的机器人编码器测量(17]。一些研究人员定义运动意图的人类伙伴所需的轨迹采用人类肢体模型,估计的发展中一个神经网络方法。然而,真正的人类运动意图需要在培训阶段很难在实践中获得。在[18),一个隐马尔科夫模型高级控制器是用来估计随机的意图,但它非常复杂,很难建立一个意图识别的模型。c·李使用Baum-Welch算法训练隐马尔可夫模型,预测合作者的意图通过学习合作者的手势的意思。然而,这种方法并不真正实现识别合作伙伴的目的意图(19]。在[20.- - - - - -22),人类的意图是通过建立一个动态模型预测的合作者。Passenberg c使用模型和混蛋模型识别人类意图与扩展卡尔曼滤波方法(23]。这些评估方法基于人体模型是非常困难的,因为人体的阻抗参数是可变的,可以很难获得(24]。此外,测量相互作用力可以用来估计其他形式的运动意图。例如,交互部队以处理来预测可能的行走模式或沃克的转发路径(25,26]。
本文方法对于识别合作者提出了基于机器学习的目的。通过使用径向基函数神经网络,人类意图识别的智能预测模型。它可以帮助人类的机器人获取一些知识运动意图根据合作伙伴的力量和合作过程中机器人的运动特性,这样可以控制机器人的行为。这种方法的优点在于克服的困难的缺点建立人机协作模型和避免的困难估计人体阻抗参数的传统方法。实验结果表明,该方法提高了同步人机协作和降低了合作的力量。
2。问题陈述
在本文中,我们假设机器人身体的最终效应与人类交互的手(如图1)。特别是,它假定只有一个交互点。
在这个模型中,人类的目的是定义为预期的加速度,速度,和地位,这是由 在笛卡儿坐标。 用于表示预计加速度、速度和位置的机器人。 和 ,分别代表当前加速度、速度和位置的人类的手,机器人。 和 ,分别代表惯性矩阵、阻尼矩阵和刚度矩阵的合作者和机器人。 是相互作用力。
在操作空间机械臂动力学被描述为(27] 在哪里 在哪里 雅可比矩阵; , , ,分别代表惯性矩阵、阻尼矩阵和刚度矩阵的机器人; 是关节力矩向量; 约束的向量是由人类肢体力。很难估计机器人动力学参数。一种自适应方法如下经常使用而不是(1)。 在哪里是一个正定矩阵;的估计是 。 更新如下: 在哪里是一个正定矩阵;是一个大于0的值。
估计人类肢体的运动意图,mass-damper-spring模型,描述了人类肢体动力学(28,29日)被公认为 在哪里 惯性矩阵、阻尼矩阵和刚度矩阵,分别。本文认识到合作者的意图意味着怎么走 。短,被定义为人类肢体的运动的目的。在下面,我们的目标是获得在这个模型中。被定义为估计的运动意图。
如果我们能得到这个人类的意图和设置 ,同步问题将得到解决。但是,它是很难估计的 从(5),因为惯性、阻尼和刚度矩阵的合作者是人类手臂位置和时变基于不同的任务(30.]。
人与人之间的互动在场景中,自然认识到合作伙伴的意图通过研究相互作用力,交互双方之间的位置和速度。本文基于这个想法,机器人也应该预测合作者意图通过收集上面的力量,位置和速度数据交互点。因此,我们试图利用机器学习算法来解决这个问题。换句话说,我们可以指定一个之间的映射和当前状态数据的交互 ,这是 ,在哪里估计的价值吗 。
3所示。意图识别基于时滞。大小
3.1。整体
作为一个受欢迎的机器学习算法,径向基函数神经网络(时滞)大小是解释。总体框架主要由三部分组成:数据收集、离线学习部分,和在线实时估计部分,如图2。
在数据收集过程中,为了获得可靠的样本信息,自适应阻抗控制方法用于采集大量的样本,如人类的意图和系统动力学。
在离线学习过程,训练径向基函数神经网络(时滞)大小模型,数据匹配是必要的,因为阻抗函数的相位延迟。延迟的大小是 (31日]。为了获得有效的训练数据,我们复赛交互力,位置,速度和速度的目的 。在这个培训过程中,一些参数隐藏节点的数量和隐层到输出层的重量。
目的在线估计的过程中,互动的力量,最后的位置,和机器人收集的速度信息,训练神经网络离线可以预测意图信息(估计速度)的人。这个速度信息从笛卡儿空间机器人关节空间,从而实现机器人运动。最后,比较了两种控制方法的结果。
3.2。离线训练
3.2.1之上。自适应阻抗控制
在离线训练过程中,自适应阻抗控制方法(32)用于获取样本。机器人动力学模型 在哪里 分别是所需的惯性矩阵和阻尼矩阵。和是真正的力和所需的力。自适应补偿项采用消除相互作用力的错误。被设计为 在哪里采样周期,更新率,是恒定的。
3.2.2。径向基函数神经网络
时滞是大小的模型表示如下: 在哪里神经网络的输出,p是隐藏节点的数量,重量值从隐层到输出层,径向基函数的扩展常数,神经网络的输入,神经网络的基函数的中心。
为了建立网络模型,网络参数定义与接触人机协作系统变量。参数的名称和描述如下:
代表n后观察组(样本)的数据匹配。
代表了i人类意图向量;
代表了i接触点的速度矢量;
代表了i接触点的位置向量;
代表了它h交互力矢量。力矢量是由力传感器收集的方向运动。
为了定义的隐层节点数,k - means使用方法。k - means算法通常是用作标记的数据预处理方法或data-assisted分类。一般来说,集群的数量必须是一个规模小得多的正整数,它可以确定通过枚举从1开始。根据文献[33),K值可以确定通过枚举。在本文中,我们使用加权平均值(Wmv集群)参数(如下)的半径来确定K值。
在哪里k代表了集群数量,的平均半径i集群,数据点的数量吗i集群,机密数据的总量。
梯度下降法是一种有效的优化算法在迭代过程中扮演一个重要的角色的反向传播算法。摘要梯度下降方法用于解决神经网络的权重从隐层到输出层。假设有米样品 ,可以被定义为成本函数
在哪里是模型函数。
3.3。在线预测
在线预测过程中,输入的交互力、速度、和位置的机器人, 。输出是 。经过训练的神经网络可以预测意图的信息的人。这个速度信息从笛卡儿空间机器人关节空间,从而实现机器人运动。
4所示。实验装置
4.1。实验设备
交互系统的原理和实验照片如图所示3;系统中的参数如表所示1。交互力来自于六维力传感器安装在机器人的结束,只有一维力信息提取滑动运动的方向。系统的工作频率是1 kHz。
|
|||||||||||||||||||||||||||||
(一)原理图
(b)实验照片
4.2。样本数据采集和时滞。大小
为了获取训练数据和测试数据的径向基函数神经网络,采用自适应阻抗控制方法基于上述单自由度机器人协作系统。使用训练数据训练径向基函数神经网络,测试数据是用来测试训练的神经网络模型的准确性。为了最大化的覆盖机器人协作空间数据收集的数据,合作者操作处理覆盖空间机器人的运动速度与多个数据收集过程中尽可能多的。例如,根据正弦或余弦处理移动速度运动。采样频率是50赫兹,整个收购过程持续了10年代,抽样过程重复3次。为了获得有效的训练数据和测试数据,数据匹配执行根据延迟的大小 ,质量矩阵和阻尼矩阵的机器人设置 , 。
在这个培训过程中,一些参数如隐藏节点的数量和隐层到输出层的重量。在线评估的目的,过程中收集的互动力量,最后的位置,速度和速度信息的机器人,意图的合作者可以预测的离线训练神经网络。这个速度信息从笛卡儿空间机器人关节空间,从而实现机器人运动。
5。实验结果和分析
为了验证同步的性能,一种自适应阻抗控制方法(32)与时滞方法大小。两种方法得到的跟踪速度曲线,如图4和5,分别。
从图4,我们可以看到,实际的机器人自适应阻抗控制方法的跟踪速度落后于合作伙伴的预期速度,因为机器人总是处于被动跟随状态。然而,与自适应阻抗控制方法相比,该方法的合作者意图识别基于径向基函数神经网络提出了消除了大约70毫秒的延迟和实现机器人和合作者的同步运动从图5。
为了验证这个识别目的方法基于合作者时滞可以节省强度大小;力量的交互通过使用两种控制策略,分别如图6。在两个实验中,运行轨迹和速度是尽可能保持不变。从图6,与自适应阻抗控制方法相比,基于径向基函数神经网络的意图识别方法可以大大减少合作伙伴的力量。详细数据见下表2。
|
|||||||||||||||
从表2,看到的相互作用力基于时滞很小,大小只有3.9175 n。方法相比,基于自适应阻抗控制,相互作用力的意思是减少到83.81%。
彻底证明结论,本文提出的方法可以确保同步过程中的人机交互与一个小的合作力,在图7,脆弱的项目(在实验中使用蛋卷)之间的合作伙伴的手,使用机器人手臂。实验结果表明,合作者可以快速随机操作处理,而脆弱的项目不被破坏。
6。结论
在本文中,一种机器学习方法(径向基函数神经网络模型)采用实现评估的合作意向联系人机协作。首先,为了获得训练数据和测试数据的神经网络自适应阻抗控制方法用于收集样本数据。其次,依据神经网络模型建立后映射示例数据。最后,合作者的意图识别通过在线预测。
为了验证的有效性时滞方法本文大小机器人的接触点的速度和相互作用力进行了分析通过比较与相应的实验参数值自适应阻抗控制算法。实验结果表明,该方法基于时滞可以准确地识别大小合作者联系人机交互的意图,这不仅可以改善运动同步,而且还可以有效地减少相互作用力。
在这篇文章中,仿真和实验结果验证了该方法在单个物理人机交互系统的自由。然而,该方法需要进行自由的如果我们想将它应用到multidegree模型。
数据可用性
所以这个手稿的算法和数据用于支持本研究的发现正在禁运而研究成果商业化。请求数据,本文的发表之后的12个月内,将被相应的作者。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作是支持的研究项目和CATARC(天津)汽车工程研究院有限公司有限公司(人机交互参数的评价的方法研究(18191221),中国。
引用
- b .西西里岛舞蹈和k Oussama教授机器人手册[M] .斯普林格出版社,柏林,德国海德堡2008。
- b . d . Argall和A·g·桌球”,触觉humanrobot交互的调查。”机器人和自治系统,卷。58岁的没有。10日,1159 - 1176年,2010页。视图:出版商的网站|谷歌学术搜索
- r . Ikeura t .守口,k .弘水谷”最佳变阻抗控制一个机器人及其应用与人类解除对象,”学报》第11届IEEE国际研讨会上机器人和人类互动沟通,IEEE 2002年罗马,页500 - 505,德国,2002年9月。视图:谷歌学术搜索
- s·m·m·拉赫曼r . Ikeura m . Nobe h·萨瓦伊,“控制电源辅助机器人解除对象的考虑人的unimanual,用双手的合作重量知觉,”《2010年IEEE机器人与自动化国际会议上,ICRA 2010美国,页2356 - 2362,2010年5月。视图:谷歌学术搜索
- r波”,调查的人类行为识别,建立“图像和视觉计算,28卷,不。6,976 - 990年,2010页。视图:出版商的网站|谷歌学术搜索
- k .严、r . Sukthankar和m·赫伯特“时空形状和流相关行动识别,”美国明尼苏达州:IEEE计算机视觉模式识别会议明尼阿波利斯,页1 - 8,2007。视图:谷歌学术搜索
- l . Wang和d·苏特“学习和匹配的动态形状集合管对人类行为识别,”IEEE图像处理,16卷,不。6,1646 - 1661年,2007页。视图:出版商的网站|谷歌学术搜索|MathSciNet
- k . Kosuge和n . Kazamura”控制的机器人处理对象与人类合作,”学报1997年第六届IEEE国际研讨会上机器人和人类交流(RO-MAN ' 97)仙台,页142 - 147年,东北,日本,1997年10月。视图:谷歌学术搜索
- d . p .一丁点它们c·g·麦克唐纳·e·巴塔利亚,和m . k . O ' malley”回顾意图检测、仲裁和共享控制物理机器人互动的沟通方面,“应用力学的评论,卷70,不。1 - 2018页。视图:谷歌学术搜索
- d·p·麦克伦g . Hotson k·d·Katyal et al .,“示范的半自治的混合使用人类颅内脑电图、脑机接口的眼睛跟踪,和计算机视觉来控制机器人上肢假肢,”IEEE神经系统和康复工程,22卷,不。4、784 - 796年,2014页。视图:出版商的网站|谷歌学术搜索
- A . Radmand大肠计划,和k . Englehart”表征的影响肢体位置EMG特性指导有效的假肢控制的发展计划,”学报2014年第36届IEEE工程国际会议在医学和生物学的社会,EMBC 2014美国芝加哥,页662 - 667,2014年8月。视图:谷歌学术搜索
- m . Rasouli k . Chellamuthu j j。Cabibihan, s . l . Kukreja”对增强上假肢的控制:force-myographic方法,”学报第六届IEEE RAS /磨床生物医学机器人国际会议和生物,BioRob 2016新加坡,页232 - 236年,2016年6月。视图:谷歌学术搜索
- h . k . Yap毛,j . c . h .吴作栋和学术界。友江”,设计可穿戴消费品传感系统的用户意图检测与软机械手套,手康复期间”学报第六届IEEE RAS /磨床生物医学机器人国际会议和生物,BioRob 2016新加坡,页781 - 786年,2016年6月。视图:谷歌学术搜索
- e .赵r . Chen L.-K。肖迈尔希,z, b . Pousett和c·梅农”迫使myography控制机器人上肢假肢:可行性研究,“在生物工程和生物技术前沿,4卷,不。18日,1 - 12,2016页。视图:谷歌学术搜索
- 美国非盟、m . Berniker和h·赫尔”动力ankle-foot假肢协助平地stair-descent步态,”神经网络,21卷,不。4、654 - 666年,2008页。视图:出版商的网站|谷歌学术搜索
- k . Kiguchi和y Hayashi EMG-based控制上肢助动的外骨骼机器人,”IEEE系统,人,控制论,B部分:控制论,42卷,不。4、1064 - 1071年,2012页。视图:出版商的网站|谷歌学术搜索
- 答:美国Pehlivan、d . p .一丁点它们和m . k . Omalley“最小assist-as-needed上肢康复机器人的控制器,”IEEE机器人,32卷,不。1,第124 - 113页,2016。视图:出版商的网站|谷歌学术搜索
- r·凯利a . Tavakkoli c·王,m . Nicolescu m . Nicolescu和g . Bebis“理解人类意图通过隐马尔可夫模型在自主移动机器人,”学报》第三届ACM和IEEE国际会议在人机交互,HRI 2008,页367 - 374年,荷兰阿姆斯特丹,2008年3月。视图:谷歌学术搜索
- c·李和y徐”,在线互动学习人类的手势/机器人界面,”《机器人与自动化国际会议上)举行(“国际机器人与自动化会议”,页2982 - 2987,明尼阿波利斯,明尼苏达州,美国,1996年。视图:谷歌学术搜索
- Maeda y、t . Hara和t .时候,“人机合作与运动估计操纵,”《IEEE / RSJ智能机器人和系统国际会议毛伊岛,页2240 - 2245年,美国,2001年。视图:谷歌学术搜索
- t·霍根Flash和n”,手臂运动的协调:一个实验证实数学模型,”《神经科学杂志》上,5卷,不。7,1688 - 1703年,1985页。视图:出版商的网站|谷歌学术搜索
- n . Diolaiti c . Melchiorri和s . Stramigioli”接触阻抗估计机器人系统”,IEEE机器人,21卷,不。5,925 - 935年,2005页。视图:出版商的网站|谷歌学术搜索
- c . Passenberg r . Groten a .同行,m·巴斯”对实时触觉援助适应优化任务性能和人类的努力,”学报2011年IEEE世界触觉技术会议,2011年通车,页155 - 160,伊斯坦布尔,土耳其,2011年6月。视图:谷歌学术搜索
- m . Awais和d·亨利克先生,”在线学习意图人机交互通过现场观察,“先进的机器人技术及其社会影响,21卷,不。5,十三至十八页,2012年。视图:谷歌学术搜索
- f . b .沈j . Li呗,c .嚼”运动意图识别的控制下肢辅助设备(铅)”学报2013年IEEE国际会议上机电一体化和自动化(国际)卡尔斯鲁厄,页926 - 931年,德国,2013年8月。视图:出版商的网站|谷歌学术搜索
- 黄k . Wakita j . p . Di, k . Sekiyama和t .福田”Human-walking-intention-based omnidirectional-type甘蔗机器人的运动控制,”IEEE / ASME举办,18卷,不。1,第296 - 285页,2013。视图:出版商的网站|谷歌学术搜索
- 美国美国通用电气、李y和h .他“物理人机交互,神经元网络人类意图的评估”《2011年国际会议上无处不在的机器人和环境智能仁川,页390 - 395年,韩国,2011年。视图:谷歌学术搜索
- t . Tsumugiwa r .横河,k . Hara”变阻抗控制基于估计人类手臂的刚度对于人机合作书法任务,”学报2002年IEEE机器人与自动化国际会议上美国华盛顿,页1 - 10,2002年5月。视图:谷歌学术搜索
- y蔡、k . p .三通和r .严“人机运动同步使用反应性和预测控制器,”学报2010年IEEE机器人仿生学,国际会议上ROBIO 2010天津,页223 - 228年,中国,2010年12月。视图:谷歌学术搜索
- m . Awais和d·亨利克先生,”在线学习意图人机交互通过现场观察,“先进的机器人技术及其社会影响,21卷,不。05年,十三至十八页,2012年。视图:谷歌学术搜索
- 美国荣格、y . g . Bae和m . Tomizuka”一个简化的时滞扰动观测器机器人的位置控制,”学报2012年IEEE自动化科学与工程国际会议:绿色自动化走向一个可持续发展的社会,2012年560年,页555 -韩国,2012年8月。视图:谷歌学术搜索
- 荣格,t . c .夏朝,r . g . Bonitz”力跟踪阻抗与阻尼控制机器人机械手的环境,”IEEE控制系统技术,12卷,不。3、474 - 483年,2004页。视图:谷歌学术搜索
- a·拉贾,j . Leskovec和j . Ullman矿业的大规模数据集、文章和电信媒体,中国,2014。视图:MathSciNet
版权
版权©2019 Zhiguang刘和Jianhong豪。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。