raybet雷竞app|雷竞技官网下载|雷电竞下载苹果

小gydF4y2Ba

机器人杂志gydF4y2Ba

1687 - 9619gydF4y2Ba 1687 - 9600gydF4y2Ba

Hindawi出版公司gydF4y2Ba

10.1155 / 2016/3081048gydF4y2Ba

3081048gydF4y2Ba

研究文章gydF4y2Ba

Indexicality到来的声音来源的方向,和人机交互gydF4y2Ba

面向社会gydF4y2Ba

伊凡gydF4y2Ba

1gydF4y2Ba RascongydF4y2Ba

迦勒gydF4y2Ba

1gydF4y2Ba 富恩特斯gydF4y2Ba

纪伯伦gydF4y2Ba

1gydF4y2Ba 皮内gydF4y2Ba

路易斯。gydF4y2Ba

1gydF4y2Ba PennockgydF4y2Ba

戈登·R。gydF4y2Ba

皇家研究院Investigaciones en Matematicas Aplicadas y在系统gydF4y2Ba

大学根据墨西哥gydF4y2Ba

城市大学联盟gydF4y2Ba

CoyocangydF4y2Ba

04510年墨西哥城gydF4y2Ba

墨西哥人gydF4y2Ba

墨西哥gydF4y2Ba

2016年gydF4y2Ba

23gydF4y2Ba 5gydF4y2Ba 2016年gydF4y2Ba

2016年gydF4y2Ba 30.gydF4y2Ba 11gydF4y2Ba 2015年gydF4y2Ba 07年gydF4y2Ba 03gydF4y2Ba 2016年gydF4y2Ba 10gydF4y2Ba 04gydF4y2Ba 2016年gydF4y2Ba 23gydF4y2Ba 5gydF4y2Ba 2016年gydF4y2Ba

2016年gydF4y2Ba

这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。gydF4y2Ba

我们现在使用到达方向(DOA)的声音来源索引在人类之间的交互和服务机器人。这些指数遵循定义的概念的理论解释皮尔斯的迹象。这个概念建立了一个强大的物理信号(DOAs)和对象之间的关系在特定上下文中所指。记住这一点,我们建模在远处叫机器人作为索引的。这些指标可以稍后解释为用户和用户的位置他/她自己。之间的关系叫和发射器是形式化的框架的发展服务机器人基于SitLog编程语言。特别是,我们创建一组行为基于到达方向信息用于服务机器人的编程任务。基于这些行为,我们实现了四个任务,严重依赖他们:一个人后,将出席一个类,玩马可波罗,作为一个服务员在餐馆。gydF4y2Ba

1。介绍gydF4y2Ba

知道一个声源的起源是一个机器人的一个重要技能。通常,这个技能是与生存相关的行为,知识是用来应对天敌或杰出的危险。然而,这个技能也在互动的过程中起着关键作用,例如,在调用一个服务员过去。起初,知道到达方向(DOA)的声源似乎太基本元素的交互;然而,正如我们将显示,这些信息可以是有意义的,这样的机器人可以以适当的方式,提高交互反应。gydF4y2Ba

我们考虑的方向到达信息作为一个索引的皮尔斯的符号理论提出的gydF4y2Ba 1gydF4y2Ba,gydF4y2Ba 2gydF4y2Ba]。在这个理论中,考虑到他们的关系有三种类型的迹象表示对象。这些类型gydF4y2Ba 图标gydF4y2Ba,gydF4y2Ba 指数,gydF4y2Ba和gydF4y2Ba 象征gydF4y2Ba。gydF4y2Ba 图标gydF4y2Ba反映对象的定性特征,例如,对象的图片或图纸。gydF4y2Ba 指数gydF4y2Ba有一个存在或与特定上下文中的对象物理连接;例如,一个乌云是下雨。另一方面,gydF4y2Ba 符号gydF4y2Ba有一个稳定的解释基于公约,连接他们的对象,例如,一个产品的标志。这也适用于口语沟通;拟声词,例如,标志性的因为他们像他们代表什么(例如,gydF4y2Ba 切gydF4y2Ba),代词是指数,因为他们“点”他们所代表的对象,和名词是象征性的,因为他们是传统和脱离他们所代表的对象。在这个分类的背景下,DOA信息有一个索引的质量;索引的对象的位置也发出声音和物体本身,因为它拥有一个强烈的声音发射器之间的联系(对象)和到达方向(迹象)。在这项工作中,我们利用这个索引的使用机器人之间的交互和用户的支持。gydF4y2Ba

目前工作的索引的新风是SitLog形式化和实现编程语言,我们开发并用于项目服务机器人(gydF4y2Ba 3gydF4y2Ba,gydF4y2Ba 4gydF4y2Ba]。SitLog定义了一组行为,从简单的(一个技能)组成(不止一个技能)行为。这些行为的基本块用于计划我们的机器人在一个更高的水平。简单的行为的例子gydF4y2Ba 走gydF4y2Ba,机器人从当前位置到目的地,和gydF4y2Ba 问gydF4y2Ba,提示用户并等待口语答案的问题。由行为的一个例子gydF4y2Ba 寻找一个对象gydF4y2Ba在不同的位置,因为它依赖于其他基本行为等gydF4y2Ba 走gydF4y2Ba和gydF4y2Ba 看到对象gydF4y2Ba。从本质上讲,一个行为必须是(1)便携式,所以它可以用在不同的任务,(2)组成,所以通过耦合不同的行为我们可以创建更复杂的行为或程序任务,和(3)能够处理潜在故障(例如,不是到达目的地,从用户不听答案,或者找不到对象)。gydF4y2Ba

为了模型的indexicality DOAs并将其融入到交互功能的机器人,我们提出一个简单的行为来处理新风和解释这些指标。这支持的交互通过允许调用在远处。在这种情况下,用户或用户可以使机器人的注意到一个特定的区域中产生声音。这种行为也可以结合使用gydF4y2Ba 走gydF4y2Ba行为允许中断期间行走如调用一个服务员过去。此外,还支持行为验证来源的数量在谈话。特别是,这可以结合使用gydF4y2Ba 问gydF4y2Ba行为,以确保当机器人听答案,只有一个人说话。gydF4y2Ba

本文的组织结构如下:部分gydF4y2Ba 2gydF4y2Ba了以前的工作声音信息服务机器人的任务的一部分。部分gydF4y2Ba 3gydF4y2Ba评论indexicality为解释过程。部分gydF4y2Ba 4gydF4y2Ba介绍了框架我们用来DOAs迹象解释为指标。部分gydF4y2Ba 5gydF4y2Ba描述了DOA行为的方式解决了DOA指标。部分gydF4y2Ba 6gydF4y2Ba显示的四个任务指标声音来源用于直接交互。部分gydF4y2Ba 7gydF4y2Ba提供了一个讨论我们的建议和发现。gydF4y2Ba

2。以前的工作gydF4y2Ba

使用机器人声源定位(SSL)是一个盛开的领域;Okuno和Nakadai Argentieri et al .,现在评论的主要方法及其使用不同类型的机器人(gydF4y2Ba 6gydF4y2Ba- - - - - -gydF4y2Ba 8gydF4y2Ba]。应用机器人技术以来,SSL被提拔为机器人的主要技能。布鲁克斯等人提出齿轮项目中作为交互的基本技能(gydF4y2Ba 9gydF4y2Ba]。提出了机器人团体作为世界杯赛的实验设置竞争(gydF4y2Ba 10gydF4y2Ba];和机器人斯巴达克斯党参加了2005年AAAI移动机器人挑战实现SSL作为它的一部分技能(gydF4y2Ba 11gydF4y2Ba]。gydF4y2Ba

虽然互动的目标是一种动力,有一个努力开发一个健壮的SSL模块。记住这个目标,首选设置数组的使用麦克风上的机器人。many-microphone解决方案提供了不错的性能由于其冗余。在[gydF4y2Ba 12gydF4y2Ba)、华菱等人提出的gydF4y2Ba 8gydF4y2Ba 麦克风3 d数组来提高语音识别和DOA估计的序言。更多的可能是麦克风。Hara等人用两个数组gydF4y2Ba 8gydF4y2Ba 麦克风(总共16日)(gydF4y2Ba 13gydF4y2Ba]。然而,最小的系统gydF4y2Ba 2gydF4y2Ba 麦克风也是有可能的,比如在[gydF4y2Ba 14gydF4y2Ba]。一个常见的设置,我们遵循,是使用gydF4y2Ba 3gydF4y2Ba 麦克风(gydF4y2Ba 15gydF4y2Ba,gydF4y2Ba 16gydF4y2Ba]。最好的方法和配置仍然是一个悬而未决的问题。Badali等人提出了一个评估的主要方法gydF4y2Ba 8gydF4y2Ba 麦克风阵列的移动机器人(gydF4y2Ba 17gydF4y2Ba]。gydF4y2Ba

源定位活性,可以作为互动的形态呈现在作品处理后的谈话(gydF4y2Ba 18gydF4y2Ba- - - - - -gydF4y2Ba 21gydF4y2Ba];也可以是交互的一个重要组成部分,比如使用声音控制机器人的导航定位。特别是,Teachasrisaksakul等人提出一个系统,是一个人通过一个房间她或他的声音gydF4y2Ba 22gydF4y2Ba]。另一方面,李等人证明了一个机器人gydF4y2Ba 捉迷藏gydF4y2Ba使用视觉和听觉形式的交互(gydF4y2Ba 23gydF4y2Ba]。这些作品遵循类似的方法对如何将声源位置作为交互的一部分我们的建议。然而,由于只有一个用户存在于他们的工作,其治疗指数是微不足道的。DOA标志直接解读为用户;没有冲突对于谁可以代表签字。gydF4y2Ba

考虑到该领域的进展,针对捕获一个更复杂的交互。例如,Fransen等人提出一个多通道的机器人它遵循两个用户之间的指令到达一个目标(gydF4y2Ba 24gydF4y2Ba]。Nakadai等人提出一个机器人能够判断剪刀声音游戏(gydF4y2Ba 25gydF4y2Ba]。Quizmaster机器人玩一个游戏,它要求一个问题4参与者和使用SSL和源分离决定谁先回答gydF4y2Ba 26gydF4y2Ba]。做等人提出一个机器人一起照顾者日志和检测某些声音的来源gydF4y2Ba 27gydF4y2Ba]。在这个水平的相互作用的复杂性,DOA的迹象正在间接用作指数:新风成为指数表示直接的用户和这些信息是用来消除歧义调用或赢。在[gydF4y2Ba 27gydF4y2Ba),新风和相关类别表示类型的事件。在这个层次上,多个源使一个方法来分配必要的DOA的实体。我们会看到在这个工作,考虑DOA作为索引的好处在正确的上下文中允许我们使用索引的决议执行该消歧的情况下多个DOA竞争。在这项工作中,我们形式化这项决议同样对机器人其他引用解析机制,如直证的引用(gydF4y2Ba 28gydF4y2Ba,gydF4y2Ba 29日gydF4y2Ba]。这不同于其他方法的研究和多通道信息互补消歧gydF4y2Ba 30.gydF4y2Ba]。gydF4y2Ba

3所示。索引的表达式gydF4y2Ba

交互式剂如机器人理解用户的意图或预期的事件可以发生在环境为了产生足够的反应。考虑皮尔斯的符号理论,我们可以制定“理解”的目标提供一个信号或一组符号识别所指对象或对象(gydF4y2Ba 1gydF4y2Ba,gydF4y2Ba 2gydF4y2Ba,gydF4y2Ba 31日gydF4y2Ba]。为了表示的对象,它的机器人构建表示法。例如,如果用户命令gydF4y2Ba 机器人去厨房,gydF4y2Ba符号的序列gydF4y2Ba 机器人gydF4y2Ba,gydF4y2Ba 去gydF4y2Ba,gydF4y2Ba 来gydF4y2Ba,gydF4y2Ba 的,gydF4y2Ba和gydF4y2Ba 厨房gydF4y2Ba把翻译成表示gydF4y2Ba ggydF4y2Ba ogydF4y2Ba (gydF4y2Ba rgydF4y2Ba ogydF4y2Ba bgydF4y2Ba ogydF4y2Ba tgydF4y2Ba ,gydF4y2Ba kgydF4y2Ba 我gydF4y2Ba tgydF4y2Ba cgydF4y2Ba hgydF4y2Ba egydF4y2Ba ngydF4y2Ba )gydF4y2Ba ,机器人可以建立所指对象(本身,厨房,和行动)并采取相应行动。一个类似的机制可以用于标志性符号的解释;例如,当机器人看到一个表,确定了一瓶果汁,它将生成表示gydF4y2Ba ogydF4y2Ba ngydF4y2Ba (gydF4y2Ba jgydF4y2Ba ugydF4y2Ba 我gydF4y2Ba cgydF4y2Ba egydF4y2Ba ,gydF4y2Ba tgydF4y2Ba 一个gydF4y2Ba bgydF4y2Ba lgydF4y2Ba egydF4y2Ba )gydF4y2Ba ,表示完全的对应汁对象。gydF4y2Ba

当一组交互的迹象包括索引的迹象,表示不完全指定的迹象以来该指数有关决议一个额外的步骤中表示对象。例如,如果用户状态的命令gydF4y2Ba 机器人来这里gydF4y2Ba,这话语是不作为的表现gydF4y2Ba λgydF4y2Ba hgydF4y2Ba 。gydF4y2Ba ggydF4y2Ba ogydF4y2Ba (gydF4y2Ba rgydF4y2Ba ogydF4y2Ba bgydF4y2Ba ogydF4y2Ba tgydF4y2Ba ,gydF4y2Ba hgydF4y2Ba )gydF4y2Ba 。为了充分指定这个表达式,它必须是关于任务的背景下,分析中可以推断出用户的位置。例如,如果用户位于厨房,表情应该解决gydF4y2Ba ggydF4y2Ba ogydF4y2Ba (gydF4y2Ba rgydF4y2Ba ogydF4y2Ba bgydF4y2Ba ogydF4y2Ba tgydF4y2Ba ,gydF4y2Ba kgydF4y2Ba 我gydF4y2Ba tgydF4y2Ba cgydF4y2Ba hgydF4y2Ba egydF4y2Ba ngydF4y2Ba )gydF4y2Ba 。gydF4y2Ba

在这个方案中,产生一个未指定索引的迹象表示在以后首先应解决的上下文信息。此外,指标提供额外的约束类型的对象可以解析表达式;例如,在前面的例子中,机器人的目的是解决有效的位置。为了解释这种现象,受到的治疗指数(gydF4y2Ba 32gydF4y2Ba),我们建议以下公式演算的一个索引,我们使用符号”gydF4y2Ba :gydF4y2Ba “信号约束gydF4y2Ba αgydF4y2Ba 在一个特定的变量gydF4y2Ba xgydF4y2Ba :gydF4y2Ba (1)gydF4y2Ba λgydF4y2Ba αgydF4y2Ba 问gydF4y2Ba xgydF4y2Ba 。gydF4y2Ba 问gydF4y2Ba @gydF4y2Ba xgydF4y2Ba :gydF4y2Ba αgydF4y2Ba 。gydF4y2Ba 指标定义这种形式接受作为参数约束gydF4y2Ba αgydF4y2Ba 遗漏和谓词gydF4y2Ba 问gydF4y2Ba ;应用这些参数的影响是约束变量的绑定gydF4y2Ba xgydF4y2Ba :gydF4y2Ba αgydF4y2Ba 到表达式gydF4y2Ba 问gydF4y2Ba 。在这种情况下,符号gydF4y2Ba @gydF4y2Ba 象征功能的应用程序(例如,gydF4y2Ba βgydF4y2Ba 减少演算)。如果我们在前一个例子应用指数gydF4y2Ba 问gydF4y2Ba =gydF4y2Ba λgydF4y2Ba hgydF4y2Ba 。gydF4y2Ba ggydF4y2Ba ogydF4y2Ba (gydF4y2Ba rgydF4y2Ba ogydF4y2Ba bgydF4y2Ba ogydF4y2Ba tgydF4y2Ba ,gydF4y2Ba hgydF4y2Ba )gydF4y2Ba 和gydF4y2Ba αgydF4y2Ba =gydF4y2Ba ugydF4y2Ba 年代gydF4y2Ba egydF4y2Ba rgydF4y2Ba pgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba 产生如下表示:gydF4y2Ba λgydF4y2Ba hgydF4y2Ba 。gydF4y2Ba ggydF4y2Ba ogydF4y2Ba (gydF4y2Ba rgydF4y2Ba ogydF4y2Ba bgydF4y2Ba ogydF4y2Ba tgydF4y2Ba ,gydF4y2Ba hgydF4y2Ba :gydF4y2Ba ugydF4y2Ba 年代gydF4y2Ba egydF4y2Ba rgydF4y2Ba pgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba )gydF4y2Ba 。还未指定,但限制了变量gydF4y2Ba hgydF4y2Ba 用户的位置。第二个决议过程识别从上下文用户是在厨房里。gydF4y2Ba

表gydF4y2Ba 1gydF4y2Ba索引的的两个例子显示使用该配方与一个机器人。对于这些例子,考虑以下背景:用户和机器人在桌子前有一个橙汁放在它。第一个插图示例是一个多通道表达式:用户说什么和指向一个对象。这个词gydF4y2Ba 这gydF4y2Ba会同指向手势定义一个索引,对所指的对象空间约束。在这种情况下,约束对象的构成(从视觉系统提取的位置和姿态)。这个约束是用来识别场景中的对象,在这个例子中要解决的一瓶果汁。第二个例子展示了一个索引的引用这个词gydF4y2Ba 它gydF4y2Ba也增加了约束(gydF4y2Ba 33gydF4y2Ba]。在这种情况下,遗漏变量必须解决一个对象在现实世界中,一瓶果汁。请注意,我们调用一个空间和直证的分辨率;然而,我们没有指定一个特定的机制来执行这种类型的决议。有效的解决机制的主题索引的表情仍是研究在不同领域gydF4y2Ba 34gydF4y2Ba- - - - - -gydF4y2Ba 36gydF4y2Ba),应用机制取决于类型的表达式和类型的任务得到解决。在这项工作中,我们定义索引的DOA的解析表达式和机制可以应用的条件。gydF4y2Ba

表1gydF4y2Ba

索引的表情和他们的决议的例子。gydF4y2Ba

标志gydF4y2Ba	表示gydF4y2Ba	约束gydF4y2Ba	解决gydF4y2Ba
这是果汁gydF4y2Ba+指向手势gydF4y2Ba	λgydF4y2Ba xgydF4y2Ba 。gydF4y2Ba ngydF4y2Ba 一个gydF4y2Ba 米gydF4y2Ba egydF4y2Ba (gydF4y2Ba xgydF4y2Ba :gydF4y2Ba pgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba egydF4y2Ba ,gydF4y2Ba jgydF4y2Ba ugydF4y2Ba 我gydF4y2Ba cgydF4y2Ba egydF4y2Ba )gydF4y2Ba	构成的对象gydF4y2Ba	ngydF4y2Ba 一个gydF4y2Ba 米gydF4y2Ba egydF4y2Ba (gydF4y2Ba ogydF4y2Ba bgydF4y2Ba jgydF4y2Ba egydF4y2Ba cgydF4y2Ba tgydF4y2Ba ,gydF4y2Ba jgydF4y2Ba ugydF4y2Ba 我gydF4y2Ba cgydF4y2Ba egydF4y2Ba )gydF4y2Ba
把它gydF4y2Ba	λgydF4y2Ba xgydF4y2Ba 。gydF4y2Ba tgydF4y2Ba 一个gydF4y2Ba kgydF4y2Ba egydF4y2Ba (gydF4y2Ba xgydF4y2Ba :gydF4y2Ba ogydF4y2Ba bgydF4y2Ba jgydF4y2Ba egydF4y2Ba cgydF4y2Ba tgydF4y2Ba )gydF4y2Ba	对象gydF4y2Ba	tgydF4y2Ba 一个gydF4y2Ba kgydF4y2Ba egydF4y2Ba (gydF4y2Ba jgydF4y2Ba ugydF4y2Ba 我gydF4y2Ba cgydF4y2Ba egydF4y2Ba )gydF4y2Ba

4所示。对话模型和机器人gydF4y2Ba

在我们的机器人,模块之间的协调执行期间执行的任务是通过对话模型。这些对话模型使用SitLog编程语言编写服务机器人。模型由一组对话gydF4y2Ba 的情况下gydF4y2Ba有一个相关的元组的gydF4y2Ba 预期gydF4y2Ba,gydF4y2Ba 行动,gydF4y2Ba和明年gydF4y2Ba 的情况下gydF4y2Ba。在一个典型的互动循环,机器人是在一个给定的情况下,它有一定的期望;如果到达解释匹配一些期望,机器人继续执行相关的操作和移动到另一个的情况。在这个框架中,执行一个任务包含在遍历一个对话模型模块提供解释和执行的操作定义的对话模型。此外,在SitLog,可以动态的主要元素定义为函数,构建对话的结构模型。也可以调用另一个对话模型从一个特定的情况。图gydF4y2Ba 1gydF4y2Ba描述了这些情况:gydF4y2Ba (一)gydF4y2Ba

它显示了一个典型的SitLog弧的情况gydF4y2Ba 年代gydF4y2Ba 我gydF4y2Ba 有一个期望gydF4y2Ba αgydF4y2Ba ;如果这是满意的,行为的集合gydF4y2Ba βgydF4y2Ba 执行和电弧到达情况gydF4y2Ba 年代gydF4y2Ba jgydF4y2Ba 。gydF4y2Ba

(b)gydF4y2Ba

这是定义的元素是函数和定义的期望将评价函数gydF4y2Ba fgydF4y2Ba ,行动gydF4y2Ba ggydF4y2Ba ,接下来的情况gydF4y2Ba hgydF4y2Ba 。特别是,这些属性使它可能计划动态对话模型变化任务执行。gydF4y2Ba

(c)gydF4y2Ba

它显示的情况gydF4y2Ba 递归gydF4y2Ba情况下,形势下整个对话模型执行,完成时,它使用过去情况的名字作为自己的期望。算法gydF4y2Ba 1gydF4y2Ba介绍了为这些情况下SitLog代码。gydF4y2Ba

<大胆>算法1:< /大胆> SitLog代码的例子:(a)典型SitLog弧功能弧(b)和(c)递归情况。gydF4y2Ba

(gydF4y2Ba idgydF4y2Ba = = >gydF4y2Ba s_i,gydF4y2Ba

弧gydF4y2Ba = = >gydF4y2Ba (gydF4y2Ba αgydF4y2Ba :gydF4y2Ba bethagydF4y2Ba = >gydF4y2Ba s_jgydF4y2Ba ]gydF4y2Ba

]gydF4y2Ba

(gydF4y2Ba idgydF4y2Ba = = >gydF4y2Ba s_i,gydF4y2Ba

弧gydF4y2Ba = = >gydF4y2Ba (gydF4y2Ba f (x)gydF4y2Ba :gydF4y2Ba g (y)gydF4y2Ba = >gydF4y2Ba h (z)gydF4y2Ba ]gydF4y2Ba

]gydF4y2Ba

(gydF4y2Ba idgydF4y2Ba = = >gydF4y2Ba s_i,gydF4y2Ba

embeded_dmgydF4y2Ba = = >gydF4y2Ba r (m)gydF4y2Ba

弧gydF4y2Ba = = >gydF4y2Ba (gydF4y2Ba αgydF4y2Ba :gydF4y2Ba bethagydF4y2Ba = >gydF4y2Ba s_jgydF4y2Ba ]gydF4y2Ba

]gydF4y2Ba

图1gydF4y2Ba

例子的情况,期望和行动。(一)典型SitLog弧,功能弧(b)和(c)递归情况。gydF4y2Ba

(一)gydF4y2Ba (b)gydF4y2Ba (c)gydF4y2Ba

SitLog framework-agnostic的核心;一个可以实现不同的框架如包容(gydF4y2Ba 37gydF4y2Ba),反应(gydF4y2Ba 38gydF4y2Ba),或简单状态机架构。在我们目前的实验室,我们已经开发出一个完整的图书馆基于我们的交互行为和任务周期的这是一个高水平的认知体系结构(IOCA [gydF4y2Ba 4gydF4y2Ba,gydF4y2Ba 39gydF4y2Ba])。与体系结构相关,我们已经实现了一些技能如视觉、语言(gydF4y2Ba 40gydF4y2Ba)、声音(gydF4y2Ba 5gydF4y2Ba),导航,操作,和运动。使用这个框架,我们编程Golem-II +机器人(如在图所示gydF4y2Ba 2gydF4y2Ba(gydF4y2Ba 41gydF4y2Ba])。表gydF4y2Ba 2gydF4y2Ba总结了主要功能模块和硬件组成的机器人。在这个框架和当前版本的硬件,我们实现了几个任务,比如一个人后,介绍自己,寻找对象,作为宴会或餐厅的服务员gydF4y2Ba 42gydF4y2Ba),保护博物馆,玩游戏比赛的记忆(任务的例子,请访问gydF4y2Ba http://golem.iimas.unam.mx/gydF4y2Ba)。gydF4y2Ba

表2gydF4y2Ba

功能、模块和硬件上使用Golem-II +机器人(IH:内部开发的)。gydF4y2Ba

模块gydF4y2Ba	硬件gydF4y2Ba	软件库gydF4y2Ba
对话管理gydF4y2Ba
对话管理器gydF4y2Ba	- - - - - -gydF4y2Ba	SitLoggydF4y2Ba
以知识为基础gydF4y2Ba	- - - - - -gydF4y2Ba	序言gydF4y2Ba

愿景gydF4y2Ba
对象识别gydF4y2Ba	跳蚤3相机gydF4y2Ba	机动脚踏两用车gydF4y2Ba
人识别gydF4y2Ba	网络摄像头gydF4y2Ba	OpenCVgydF4y2Ba
人跟踪gydF4y2Ba	KinectgydF4y2Ba	OpenNIgydF4y2Ba
手势识别gydF4y2Ba	KinectgydF4y2Ba	OpenNIgydF4y2Ba

语言gydF4y2Ba
语音识别gydF4y2Ba	定向麦克风gydF4y2Ba	PocketSphinxgydF4y2Ba
语音合成器gydF4y2Ba	演讲者gydF4y2Ba	节日TTSgydF4y2Ba
理解gydF4y2Ba	- - - - - -gydF4y2Ba	GF语法,IH解析器gydF4y2Ba

声音感知gydF4y2Ba
DOA系统gydF4y2Ba	3全向麦克风gydF4y2Ba	- - - - - -gydF4y2Ba
量监控gydF4y2Ba	定向麦克风gydF4y2Ba	杰克,IH图书馆gydF4y2Ba
量监控gydF4y2Ba	M-Audio快速通道接口gydF4y2Ba	杰克,IH图书馆gydF4y2Ba

导航、操纵和脖子gydF4y2Ba
导航gydF4y2Ba	机器人基地,激光gydF4y2Ba	球员gydF4y2Ba
操纵gydF4y2Ba	IH机械手臂gydF4y2Ba	Dynamixel RoboPlusgydF4y2Ba
颈部运动gydF4y2Ba	IH的脖子gydF4y2Ba	Dynamixel RoboPlusgydF4y2Ba

图2gydF4y2Ba

Golem-II +机器人。gydF4y2Ba

4.1。Multiple-DOA评估系统gydF4y2Ba

执行的DOA技能是multiple-DOA评估系统。这是基于以前的工作集中在一个小,轻量级的硬件设置,能够估计新风比的麦克风使用(gydF4y2Ba 5gydF4y2Ba,gydF4y2Ba 43gydF4y2Ba]。gydF4y2Ba

从硬件的角度来看(见表gydF4y2Ba 2gydF4y2Ba、声音感知部分),系统使用一个二维数组3-microphone(见图gydF4y2Ba 4gydF4y2Ba)经历4-channel USB接口。从软件的角度来看,架构图中可以看到gydF4y2Ba 3gydF4y2Ba。系统分为三个部分。gydF4y2Ba

图3gydF4y2Ba

multiple-DOA估计系统的体系结构。gydF4y2Ba

图4gydF4y2Ba

麦克风的音频定位系统在机器人Golem-II +。gydF4y2Ba

音频采集。gydF4y2Ba这是底层模块为音频数据到另一个系统的一部分。它是基于杰克音频连接工具包(gydF4y2Ba 44gydF4y2Ba),它提供了高分辨率数据(48 kHz,在我们的例子中)在实时速度非常高的公差在麦克风的数量管理和资源需求相对较小。这个捕获音频通过VAD激活本地化。gydF4y2Ba

初始Single-DOA估计。gydF4y2Ba对于每一个时间窗口,每一对麦克风用于估计使用互相关信号延迟向量(闭路)方法(请参见图gydF4y2Ba 3gydF4y2Ba,single-DOA估计块)。每个延迟是用来计算两个初步DOAs(考虑前后颠倒的镜像问题gydF4y2Ba 1gydF4y2Ba 维数组构成)。使用一个基本的搜索方法,最gydF4y2Ba 连贯的gydF4y2Ba组gydF4y2Ba 3gydF4y2Ba DOAs (gydF4y2Ba 1gydF4y2Ba 从每一对麦克风),使用提出的一致性指标(见图gydF4y2Ba 5gydF4y2Ba)。如果相干的组高于某个阈值,一双垂直向的DOA源提出了作为其DOA;这双是选择避免非线性延迟之间的关系和由此产生的DOA。图gydF4y2Ba 5gydF4y2Ba说明了这个舞台。gydF4y2Ba

图5gydF4y2Ba

(一)不一致的措施。组(b)一致的措施(取自[gydF4y2Ba 5gydF4y2Ba])。gydF4y2Ba

(一)gydF4y2Ba (b)gydF4y2Ba

Multiple-DOA跟踪。gydF4y2Ba因为前面的部分进行DOA估计接近实时的速度,它能够从一个源估计DOA小时间窗口,甚至在有两个或更多的实例同时声音来源(见图gydF4y2Ba 3gydF4y2Ba,multi-DOA跟踪块)。不过,很幸运的发生时间窗口在这种情况下是随机源。这种效应,提出了一种DOA从之前的系统的一部分,采用了一种聚类方法来几个附近的DOAs分组到一个或多个估计声音来源的方向。gydF4y2Ba

图gydF4y2Ba 6gydF4y2Ba显示三个扬声器的跟踪gydF4y2Ba 30.gydF4y2Ba 秒;每个演讲者是隔开的gydF4y2Ba 120年gydF4y2Ba 度。可以看到,这个跟踪是很有效的,因为它可以本地化的每个发现的来源。在这个例子中,系统精度69%和60%召回在帧级性能。表gydF4y2Ba 3gydF4y2Ba提出了一种评估整个系统。虽然它可能会认为这对HRI交互性能是不够的,因为它是在帧标签(即。,One hundred. ms), in an interaction setting when turns are being taken, this performance is more than enough to catch the interaction of a user. An extensive evaluation of this module can be consulted in [ 43gydF4y2Ba]。gydF4y2Ba

表3gydF4y2Ba

Multiple-DOA估计系统性能。gydF4y2Ba

最小距离的演讲者gydF4y2Ba	30厘米gydF4y2Ba
最大距离的演讲者gydF4y2Ba	5米gydF4y2Ba
最大数量的同时扬声器gydF4y2Ba	4gydF4y2Ba
响应时间gydF4y2Ba	年代gydF4y2Ba
范围(最小夹角扬声器)gydF4y2Ba	10gydF4y2Ba
报道gydF4y2Ba	360年gydF4y2Ba
FgydF4y2Ba 1gydF4y2Ba - - - - - -gydF4y2Ba 年代gydF4y2Ba cgydF4y2Ba ogydF4y2Ba rgydF4y2Ba egydF4y2Ba 1人gydF4y2Ba	100.00%gydF4y2Ba
FgydF4y2Ba 1gydF4y2Ba - - - - - -gydF4y2Ba 年代gydF4y2Ba cgydF4y2Ba ogydF4y2Ba rgydF4y2Ba egydF4y2Ba 2人gydF4y2Ba	78.79%gydF4y2Ba
FgydF4y2Ba 1gydF4y2Ba - - - - - -gydF4y2Ba 年代gydF4y2Ba cgydF4y2Ba ogydF4y2Ba rgydF4y2Ba egydF4y2Ba 3人gydF4y2Ba	72.34%gydF4y2Ba
FgydF4y2Ba 1gydF4y2Ba - - - - - -gydF4y2Ba 年代gydF4y2Ba cgydF4y2Ba ogydF4y2Ba rgydF4y2Ba egydF4y2Ba 4人gydF4y2Ba	61.02%gydF4y2Ba

图6gydF4y2Ba

DOAs三扬声器gydF4y2Ba 90年gydF4y2Ba ,gydF4y2Ba - - - - - -gydF4y2Ba 30.gydF4y2Ba ,gydF4y2Ba - - - - - -gydF4y2Ba 150年gydF4y2Ba 度。gydF4y2Ba

5。DOA的行为gydF4y2Ba

DOA行为的目标是将DOA的测量转换为参考对象上下文中的任务。当DOA系统检测到一个源,这个标志与声音的发射器有很强的关系。这个强大的DOA行为利用关系来解决对象被征收“指向”空间限制可能的来源。空间约束的相对位置gydF4y2Ba 一个gydF4y2Ba 的源gydF4y2Ba xgydF4y2Ba 鉴于目前机器人的位置(例如,gydF4y2Ba λgydF4y2Ba 一个gydF4y2Ba xgydF4y2Ba 。gydF4y2Ba rgydF4y2Ba egydF4y2Ba lgydF4y2Ba _gydF4y2Ba pgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba (gydF4y2Ba xgydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba )gydF4y2Ba )。在这一点上,我们只有是在位置的信息gydF4y2Ba 一个gydF4y2Ba ;然而,由于我们考虑DOA索引,我们可以使用公式(gydF4y2Ba 1gydF4y2Ba减少为指标),这样我们得到以下:gydF4y2Ba (2)gydF4y2Ba λgydF4y2Ba xgydF4y2Ba 。gydF4y2Ba rgydF4y2Ba egydF4y2Ba lgydF4y2Ba _gydF4y2Ba pgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba xgydF4y2Ba :gydF4y2Ba 一个gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 。gydF4y2Ba 尽管我们能够限制的对象,到目前为止,我们还没有解决了索引正确的指示物;为了达到这个目标,我们需要使用上下文信息。DOA的角度是用来识别潜在对象的上下文。算法gydF4y2Ba 2gydF4y2Ba负责这项决议阶段通过分析哪些对象上下文约束满足DOA。gydF4y2Ba

<大胆>算法2:< /大胆> DOAS的解释指标的实现算法。gydF4y2Ba

需要gydF4y2Ba:DOAs Pred上下文gydF4y2Ba

确保gydF4y2Ba:gydF4y2Ba PgydF4y2Ba rgydF4y2Ba egydF4y2Ba dgydF4y2Ba (gydF4y2Ba lgydF4y2Ba 我gydF4y2Ba 年代gydF4y2Ba tgydF4y2Ba OgydF4y2Ba bgydF4y2Ba jgydF4y2Ba egydF4y2Ba cgydF4y2Ba tgydF4y2Ba 年代gydF4y2Ba ,gydF4y2Ba lgydF4y2Ba 我gydF4y2Ba 年代gydF4y2Ba tgydF4y2Ba DgydF4y2Ba OgydF4y2Ba 一个gydF4y2Ba 年代gydF4y2Ba )gydF4y2Ba

lgydF4y2Ba 我gydF4y2Ba 年代gydF4y2Ba tgydF4y2Ba OgydF4y2Ba bgydF4y2Ba jgydF4y2Ba egydF4y2Ba cgydF4y2Ba tgydF4y2Ba 年代gydF4y2Ba ←gydF4y2Ba (gydF4y2Ba ]gydF4y2Ba

lgydF4y2Ba 我gydF4y2Ba 年代gydF4y2Ba tgydF4y2Ba DgydF4y2Ba OgydF4y2Ba 一个gydF4y2Ba 年代gydF4y2Ba ←gydF4y2Ba (gydF4y2Ba ]gydF4y2Ba

为gydF4y2Ba dgydF4y2Ba ogydF4y2Ba 一个gydF4y2Ba ←gydF4y2Ba DgydF4y2Ba OgydF4y2Ba 一个gydF4y2Ba 年代gydF4y2Ba 做gydF4y2Ba

为gydF4y2Ba 我gydF4y2Ba dgydF4y2Ba ,gydF4y2Ba αgydF4y2Ba ←gydF4y2Ba CgydF4y2Ba ogydF4y2Ba ngydF4y2Ba tgydF4y2Ba egydF4y2Ba xgydF4y2Ba tgydF4y2Ba 做gydF4y2Ba

如果gydF4y2Ba dgydF4y2Ba ogydF4y2Ba 一个gydF4y2Ba αgydF4y2Ba 然后gydF4y2Ba

lgydF4y2Ba 我gydF4y2Ba 年代gydF4y2Ba tgydF4y2Ba OgydF4y2Ba bgydF4y2Ba jgydF4y2Ba egydF4y2Ba cgydF4y2Ba tgydF4y2Ba 年代gydF4y2Ba 。gydF4y2Ba pgydF4y2Ba ugydF4y2Ba 年代gydF4y2Ba hgydF4y2Ba (gydF4y2Ba 我gydF4y2Ba dgydF4y2Ba )gydF4y2Ba

lgydF4y2Ba 我gydF4y2Ba 年代gydF4y2Ba tgydF4y2Ba DgydF4y2Ba OgydF4y2Ba 一个gydF4y2Ba 年代gydF4y2Ba 。gydF4y2Ba pgydF4y2Ba ugydF4y2Ba 年代gydF4y2Ba hgydF4y2Ba (gydF4y2Ba dgydF4y2Ba ogydF4y2Ba 一个gydF4y2Ba )gydF4y2Ba

如果gydF4y2Ba

结束了gydF4y2Ba

整个机制是封装在一个行为的编程模型(参见图作为一个简单的对话gydF4y2Ba 7gydF4y2Ba)。这个对话模型可以处理多个独立;对于每个人来说,这将试图解决被提到的对象。如果成功,它创建一个gydF4y2Ba ogydF4y2Ba kgydF4y2Ba 情况与所指对象的列表,否则,它达到gydF4y2Ba 错误gydF4y2Ba的情况。拟议的DOA行为支持交互两个模式:gydF4y2Ba (我)gydF4y2Ba

无限制的电话。gydF4y2Ba

(2)gydF4y2Ba

更符合实际的调用。gydF4y2Ba

图7gydF4y2Ba

对话模型简单的DOA的行为。gydF4y2Ba

第一种情况对应的场景,在该场景中,用户的位置不能期望/事先预测;在本例中,上下文的描述gydF4y2Ba CgydF4y2Ba 是空的意思是只有一个用户存在(图gydF4y2Ba 8(一个)gydF4y2Ba描述了机器人在这种情况下);即指标直接解释为用户机器人互动。在第二种情况下,机器人有一个期望的方向,它将调用使用这种期望确定调用者。例如,图gydF4y2Ba 8 (b)gydF4y2Ba描述了机器人和两个用户对话;的信息的位置,它可以丢弃三分之一用户不是谈话的一部分。gydF4y2Ba

图8gydF4y2Ba

电话在远处的例子:无限制,一个用户不是在预测位置,和语境化多个用户在可预测的位置。gydF4y2Ba

(一)gydF4y2Ba (b)gydF4y2Ba

到目前为止,我们已经假定机器人不动,但是用户应该能够调用机器人移动时。为了解决这种情况下,我们创建了一个由行为使机器人行走距离和监听可能调用。图gydF4y2Ba 9gydF4y2Ba显示了这种行为的对话模型。要求这种行为gydF4y2Ba wgydF4y2Ba 一个gydF4y2Ba lgydF4y2Ba kgydF4y2Ba dgydF4y2Ba ogydF4y2Ba 一个gydF4y2Ba (gydF4y2Ba DgydF4y2Ba ,gydF4y2Ba CgydF4y2Ba )gydF4y2Ba ;gydF4y2Ba DgydF4y2Ba 代表了目的地,gydF4y2Ba CgydF4y2Ba 空间环境的描述。首先,行为开始的行动gydF4y2Ba 走gydF4y2Ba来gydF4y2Ba DgydF4y2Ba 的机器人的民意调查,尽管这样做可能DOAs的来源gydF4y2Ba CgydF4y2Ba 。如果没有,它继续走;否则,它结束了对话的情况gydF4y2Ba 我gydF4y2Ba ngydF4y2Ba tgydF4y2Ba egydF4y2Ba rgydF4y2Ba rgydF4y2Ba ugydF4y2Ba pgydF4y2Ba tgydF4y2Ba egydF4y2Ba dgydF4y2Ba 它包含相关的信息中断。空间上下文在每次调用更新当前位置的机器人。注意,这种行为重用简单DOA行为(情况gydF4y2Ba RgydF4y2Ba dgydF4y2Ba ogydF4y2Ba 一个gydF4y2Ba 年代gydF4y2Ba (gydF4y2Ba CgydF4y2Ba )gydF4y2Ba )。gydF4y2Ba

图9gydF4y2Ba

对话模式走DOA的行为。gydF4y2Ba

对于另一种情况,当用户移动时,信号DOA强加了一个额外的约束指数。这个约束是相对位置的DOA之前来自同一声源DOA这额外的信息是由multiple-DOA估计系统的跟踪阶段。多亏了这个约束,我们可以使用相同的机制迄今概述来处理这种情况。结合散步和听的行为,他们可以蜡烛场景,在该场景中,用户和机器人移动。gydF4y2Ba

另外,我们还建议使用DOA行为来验证声音来源的数量在一个特定的时刻。特别是,我们已经创建了一个由行为之间的问和DOA行为,利用这种情况。图gydF4y2Ba 10gydF4y2Ba这种行为显示了对话模型。后问一个问题gydF4y2Ba PgydF4y2Ba 从用户和听答案,机器人检查有多少指数(即恢复。元素的个数gydF4y2Ba ZgydF4y2Ba ):如果只有一个,它可以进行交互;如果不止一个,多个用户的机器人推断说话,所以它会产生一个错误必须由机器人处理。类似于行走行为,这种行为重用简单的DOA的行为。gydF4y2Ba

图10gydF4y2Ba

对话模式问DOA的行为。gydF4y2Ba

6。执行任务gydF4y2Ba

DOA行为被用来与我们的机器人程序以下任务Golem-II +(这些任务可以观看的视频gydF4y2Ba https://youtube/Q6prwIjoDnE?list=PL4EiERt__u4faJoxHF1M5EMwhEoNH4NScgydF4y2Ba)。gydF4y2Ba

后一个人。gydF4y2Ba在这个任务中,机器人是一个人通过视觉跟踪系统(基于kinect)。机器人试图保持1米的距离;在用户移动,机器人试图捕捉它在一个安全的速度。在机器人失去他,它要求用户称之为所以机器人可以推断出哪个方向去寻找。一旦放置在正确的方向上,它使用视觉继续跟踪使用。失去时,用户可以在任何方向和在一个5米的比例和机器人将确定它在哪里。如果用户没有找到,它会坚持被称为并再次尝试找到他(全系统的演示,请参阅补充视频gydF4y2Ba person.mp4后gydF4y2Ba在网上补充材料gydF4y2Ba http://dx.doi.org/10.1155/2016/3081048gydF4y2Ba)。gydF4y2Ba

出席。gydF4y2Ba在这个任务中,机器人将出席在类通过调用类的成员的名字和每个调用,预计听觉反应。确定反应的方向时,它面临着向那个方向,检查如果有一个人问波,并接近核实学生的身份。学生的数量是有限的视觉系统只可以看到多达四个不同的人。他们必须位于一条直线;目前,任务不考虑多个行。我们利用这个设置指定一个空间环境中,学生只有在前面的机器人(全系统的演示,请参阅补充视频gydF4y2Ba 采取class.mp4出席gydF4y2Ba)。gydF4y2Ba

在马可波罗。gydF4y2Ba在这个任务中,机器人的角色寻找用户,适合gydF4y2Ba 马可gydF4y2Ba和期待一个或多个gydF4y2Ba 马球gydF4y2Ba响应。当确定响应的方向,它走向那个方向。当这个方向前进,如果前面的激光传感器承认有人近距离,它假定它赢得了比赛;否则,它继续打电话gydF4y2Ba 马可gydF4y2Ba直到用户响应。机器人有gydF4y2Ba ngydF4y2Ba 试图抓住用户;如果不是,它放弃和失去了比赛。激光假设有人在前面,如果它检测到一个不连续的阅读。在此设置中,玩家可以位于任何方向的比例5米(全系统的演示,请参阅补充视频gydF4y2Ba 玩Marco-Polo.mp4gydF4y2Ba)。gydF4y2Ba

服务员。gydF4y2Ba在前面的例子中,DOA的行为依赖于机器人的倡议。这个任务将行为mixed-initiative策略。在这种情况下,机器人是一个服务员,它等待电话用户位于餐厅表。一次表调用在远处,机器人会走到表的订单客户。然而,尽管走,它会倾听其他调用不同的表;如果发生这种情况,它可以让用户在相应的表中知道它将尽快完成表目前步行。在接受订单时,机器人将交互如果多个客户端同时进行谈判。一旦订单,继续把它的饮料/食物从指定的传感器位置在厨房区域或直接问厨师。这个任务的最大数量是有限的资源,可以同时检测(gydF4y2Ba 4gydF4y2Ba )。在这种情况下,表参加的最大数量gydF4y2Ba 4gydF4y2Ba 的最大数量gydF4y2Ba 4gydF4y2Ba 客户在每个表;这要比5米(整个系统的演示,看到补充视频gydF4y2Ba 服务员在restaurant.mp4gydF4y2Ba)。gydF4y2Ba

我们假设的成功交互的每个任务是有可能的,因为利用DOA信息索引完全解释每个任务的上下文中。这些上下文之间的物理关系符号(调用)和对象(用户或用户)明显。见表gydF4y2Ba 4gydF4y2Ba总结的主要元素参与的分辨率DOA指标在每个任务和详细如下。gydF4y2Ba

表4gydF4y2Ba

使用DOA行为特征的任务。gydF4y2Ba

	后一个人gydF4y2Ba	将出席gydF4y2Ba
代理gydF4y2Ba	人被跟踪gydF4y2Ba	学生gydF4y2Ba
机器人的目标gydF4y2Ba	跟踪一个人gydF4y2Ba	验证学生现在gydF4y2Ba
用户目标gydF4y2Ba	被跟踪gydF4y2Ba	是在课堂上gydF4y2Ba
DOA的行为gydF4y2Ba	在远处叫gydF4y2Ba	在远处叫gydF4y2Ba
情况gydF4y2Ba	用户丢失gydF4y2Ba	叫学生的名字gydF4y2Ba
标志gydF4y2Ba	在这里gydF4y2Ba	现在gydF4y2Ba
表达式gydF4y2Ba	λgydF4y2Ba xgydF4y2Ba 。gydF4y2Ba rgydF4y2Ba egydF4y2Ba lgydF4y2Ba _gydF4y2Ba pgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba (gydF4y2Ba xgydF4y2Ba :gydF4y2Ba 一个gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba )gydF4y2Ba	λgydF4y2Ba xgydF4y2Ba 。gydF4y2Ba rgydF4y2Ba egydF4y2Ba lgydF4y2Ba pgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba (gydF4y2Ba xgydF4y2Ba :gydF4y2Ba 一个gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba )gydF4y2Ba
决议gydF4y2Ba	rgydF4y2Ba egydF4y2Ba lgydF4y2Ba pgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba (gydF4y2Ba ugydF4y2Ba 年代gydF4y2Ba egydF4y2Ba rgydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba )gydF4y2Ba	rgydF4y2Ba egydF4y2Ba lgydF4y2Ba pgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba (gydF4y2Ba ngydF4y2Ba 一个gydF4y2Ba 米gydF4y2Ba egydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba )gydF4y2Ba
解释gydF4y2Ba	目标和它的位置gydF4y2Ba	学生和位置gydF4y2Ba

	在马可波罗gydF4y2Ba	服务员gydF4y2Ba

代理gydF4y2Ba	球员gydF4y2Ba	客户gydF4y2Ba
机器人的目标gydF4y2Ba	抓住一个球员gydF4y2Ba	接受和交付订货gydF4y2Ba
用户目标gydF4y2Ba	不被抓住gydF4y2Ba	收到订单gydF4y2Ba
DOA的行为gydF4y2Ba	在远处叫gydF4y2Ba	在远处叫验证gydF4y2Ba
情况gydF4y2Ba	说gydF4y2Ba 马可gydF4y2Ba	机器人无所作为或要求秩序gydF4y2Ba
标志gydF4y2Ba	马球gydF4y2Ba	服务员gydF4y2Ba
表达式gydF4y2Ba	λgydF4y2Ba xgydF4y2Ba 。gydF4y2Ba rgydF4y2Ba egydF4y2Ba lgydF4y2Ba _gydF4y2Ba pgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba (gydF4y2Ba xgydF4y2Ba :gydF4y2Ba 一个gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba )gydF4y2Ba	λgydF4y2Ba xgydF4y2Ba 一个gydF4y2Ba 。gydF4y2Ba rgydF4y2Ba egydF4y2Ba lgydF4y2Ba pgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba (gydF4y2Ba xgydF4y2Ba :gydF4y2Ba 一个gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba )gydF4y2Ba
决议gydF4y2Ba	rgydF4y2Ba egydF4y2Ba lgydF4y2Ba _gydF4y2Ba pgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba (gydF4y2Ba pgydF4y2Ba lgydF4y2Ba 一个gydF4y2Ba ygydF4y2Ba egydF4y2Ba rgydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba )gydF4y2Ba	rgydF4y2Ba egydF4y2Ba lgydF4y2Ba pgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba (gydF4y2Ba tgydF4y2Ba 一个gydF4y2Ba bgydF4y2Ba lgydF4y2Ba egydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba )gydF4y2Ba
解释gydF4y2Ba	球员和它的位置gydF4y2Ba	表顺序和客户交谈gydF4y2Ba

在的情况下gydF4y2Ba 后一个人gydF4y2Ba任务,直到用户和地址的机器人已经失去了她或他,被解释为用户的响应和方向,它可以寻找它的用户;这是一个无约束的情况下电话的空间上下文是空的。没有上下文,机器人能够建立用户的相对位置。gydF4y2Ba

在的情况下gydF4y2Ba 将出席gydF4y2Ba任务,交互的协议很标准。机器人叫学生的名字,她或他必须应对这些调用。这样的反应是解释为学生的存在及其相对位置。在这里,我们可以限制的呼声在机器人的前面。gydF4y2Ba

在的情况下gydF4y2Ba 在马可波罗gydF4y2Ba任务,规则定义的上下文调用解释。这些规则指定,当机器人说gydF4y2Ba 马可gydF4y2Ba,用户必须应对gydF4y2Ba 马球gydF4y2Ba;此类反应的指数的相对位置可以解释为一个特定的球员,它可以直接机器人看起来在这个领域。这个任务也使用一个不受约束的调用。事实上,用户甚至不需要说gydF4y2Ba 马球gydF4y2Ba,因为这个游戏的目的是,机器人“捕获”的一个单独用户通过声音;因此,任何声音的DOA可能被视为一个索引;这个DOA指用户。gydF4y2Ba

在的情况下gydF4y2Ba 服务员gydF4y2Ba任务,定义的空间上下文是安排在餐厅的表。这个任务使用这个空间上下文来解释表要求机器人的注意。引发的约束DOA信息帮助识别调用表,并建立了其相对位置。任务使用简单版本和步行版本的DOA行为解决指标。此外,它使用问版本的DOA行为时的顺序。提供的信息要求机器人使用的版本是面对客户在把他们的订单和直接问的交互用户说话的时间。gydF4y2Ba

6.1。DOA行为任务的应用gydF4y2Ba

图gydF4y2Ba 11gydF4y2Ba显示摘录对话模型gydF4y2Ba 后一个人gydF4y2Ba,gydF4y2Ba 将出席gydF4y2Ba,gydF4y2Ba 在马可波罗gydF4y2Ba任务。鉴于DOA的行为,所提供的信息gydF4y2Ba 后一个人gydF4y2Ba和gydF4y2Ba 在马可波罗gydF4y2Ba不能识别用户的任务;就好像他或她只会说gydF4y2Ba 我在这里gydF4y2Ba。机器人这种交互的反应不是语言,而是行动;在这两种情况下,结果电话的方向。如果一个错误检测的DOA,机器人将尝试恢复。在gydF4y2Ba 后一个人gydF4y2Ba任务,跟踪的人会引发一个错误当没有人发现,它将为用户的电话又问。在gydF4y2Ba 在马可波罗gydF4y2Ba任务,机器人会重复gydF4y2Ba 马可gydF4y2Ba,等待答案,继续游戏。因为的性质gydF4y2Ba 点名gydF4y2Ba任务,指数信号的解释一个特定的学生即使在一个未指定的上下文,因为机器人知道学生的名字被称为,和响应是由于他或她。就好像他或她就会回应道gydF4y2Ba 我X,我在这里gydF4y2Ba。在这个任务中,机器人试图防止错误在DOA的位置和它检查如果有一个实际的人在那个方向,但它不是,它会叫学生的名字。gydF4y2Ba

图11gydF4y2Ba

在使用的DOA的行为gydF4y2Ba 后一个人gydF4y2Ba,gydF4y2Ba 将出席gydF4y2Ba,gydF4y2Ba 在马可波罗gydF4y2Ba。gydF4y2Ba

图gydF4y2Ba 12gydF4y2Ba显示了DOA的行为gydF4y2Ba 服务员gydF4y2Ba的任务。这个任务使用的三个行为基于DOA的技能。首先,它使用DOA行为但定义上下文。索引的解释取决于空间上下文和它将定义表调用机器人。在这种情况下,就好像客户会说gydF4y2Ba 表X需要的东西gydF4y2Ba。的任务,一个错误有较大的影响;如果机器人误方法表没有要求,它将提供的订单客户有可能拒绝或如果表是空的机器人将会离开。然而,真正想问订单的表可以叫机器人在步行,这样当机器人是完成了错误的表,它将正确的方法。在这些运动,行走任务使用DOA的行为。最后,当到达一个表问订单,任务使用问DOA的行为,如果一个以上的索引返回响应,它会让客户知道只有一个用户应该是一次谈话。如果DOAs的检测错误发生在这部分的任务,它将创建一个机器人的混乱局面将面临客户不存在;然而,如果没有客户的答案,机器人将假定“鬼”客户端不希望任何东西,并将继续与其他接受订单和交付。gydF4y2Ba

图12gydF4y2Ba

在使用的DOA的行为gydF4y2Ba 服务员gydF4y2Ba的任务。gydF4y2Ba

6.2。历史的演示和评估任务gydF4y2Ba

的gydF4y2Ba 后一个人gydF4y2Ba,gydF4y2Ba 马可波罗,gydF4y2Ba和gydF4y2Ba 服务员gydF4y2Ba任务已经在我们实验室重复证明了公众和RoboCup@Home竞争(gydF4y2Ba 45gydF4y2Ba,gydF4y2Ba 46gydF4y2Ba]。这些示威活动的经验在比赛中是积极的。在2012年,gydF4y2Ba 后一个人gydF4y2Ba任务是在德国公开竞争,演示允许团队获得第三名,并在墨西哥的比赛机器人国家竞争,机器人获得了第一名。在2013年,gydF4y2Ba 服务员gydF4y2Ba任务提出了世界杯赛的第一阶段比赛中,荣获创新奖的@联盟。此外,同年,示威的机器人和另一个机器人玩马可波罗未遂但技术问题阻碍了执行演示在竞争,但它成功地向公众进行。在所有这些情况下,我们观察到一个积极的集成声音定位在人类和机器人之间的交互。特别是,gydF4y2Ba 服务员gydF4y2Ba任务已经广泛评估(gydF4y2Ba 42gydF4y2Ba]。这个评价是与最终用户(30)被要求订货的机器人。gydF4y2Ba 60gydF4y2Ba %gydF4y2Ba 没有经验的用户与服务机器人。我们发现,当要求订单,客户反复称为距离(gydF4y2Ba One hundred.gydF4y2Ba %gydF4y2Ba )和完全完成任务(gydF4y2Ba 90年gydF4y2Ba %gydF4y2Ba )。尽管并不是常见的两个用户同时交谈(gydF4y2Ba 40gydF4y2Ba %gydF4y2Ba ),当他们做,机器人能够直接的交互。gydF4y2Ba

在的情况下gydF4y2Ba 将出席gydF4y2Ba为期三周的任务,这是编程的学生暑期实习。学生以前没有认识我们的开发框架。在实习期间,他们学会了框架,发展理念,实现机器人。其他四个小组的学生发展其他四个不同的任务。的技能作为一个元素的抽象SitLog语言使它相对容易直接实现任务和达到一个适当的性能在短时间跨度。gydF4y2Ba

7所示。讨论gydF4y2Ba

在这项工作中,我们提出了利用声源的方向到达指数。在许多人机交互任务,对象的位置是至关重要的执行任务,例如,失去一个人而他或她。在这个角度看,DOAs是二等公民,因为他们不提供一个位置,但方向。然而,治疗DOAs等指标允许机器人链接对象的方向在空间环境中导致的正确解释和延续的任务,猜测,失去的是一个方向。这种考虑允许建模要求在远处一个机器人是一个可取的方式与交互式代理进行交互。为了证明这个概念,我们实现的一组行为取决于DOAs被解释为指标和测试他们在四个任务:一个人后,类的出勤率,玩马可波罗,作为一个服务员在餐馆。gydF4y2Ba

空间上下文,或缺乏,定义方面的交互类型的任务。当没有可用空间上下文,例如当马可波罗,任何索引被机器人作为一种可能的参与者。然而,当一个空间上下文定义,例如,在一家餐馆参加表,可以跟踪多个用户。还可以有一个mixed-initiative互动的机器人等待电话,而不是访问每个表和问他们想要的任何东西。DOAs的indexicality允许机器人反应用户并继续交互的方向,不一定是在相同的模式:gydF4y2Ba 马可波罗,gydF4y2Ba机器人移动的方向指数;在gydF4y2Ba 将出席gydF4y2Ba和gydF4y2Ba 后一个人gydF4y2Ba任务,机器人通过视觉方法确认了用户的存在的方向指数;在gydF4y2Ba 服务员gydF4y2Ba任务,机器人面临对应索引的表。这些交互作用的三种可能的方面当使用索引的DOAs (mixed-initiative,多用户和多通道)的一个例子是丰富的使用电话在远处的交互。gydF4y2Ba

此外,我们表明,DOA补充言语互动行为。特别是,知道有不止一个人说当机器人听是一个好迹象,交互可能不是很好。索引的信息,机器人可以控制和直接的交互通过要求每个用户说一次,防止错误的沟通。gydF4y2Ba

以来我们能够实现这些任务multiple-DOA估计系统是光和强劲的四声音来源。然而,这个系统和其他机器人系统强加一些限制交互。对于一个人后,它只能跟一个人近距离(1米);在出席的情况下,学生必须一致;在我们的测试中,有三个学生;玩的马可波罗和等待表、用户、球员和表,必须在一个5米的比例。在所有这些情况下,扬声器的最大数量可能是四个。然而,在这种情况下,系统的性能是最贫穷和有影响的交互;我们的评估显示,一个用户对马可波罗和两个用户表在服务员的情况下实现良好的性能。在这一点上,另一个主要问题是劫持的可能性的关注机器人。 This is related to the fact that when the spatial context is not defined, the robot automatically interprets the DOA as its target. This is exemplified with the Marco-Polo game. At the moment, our implementation of the task takes advantage of this situation and an index is interpreted as a possible user which becomes the target to approach. However, this situation can provoke the fact that the robot switches targets constantly rather than targeting one which might be a better strategy to win the game. In order to account for this situation, we have identified that the DOA behaviour could be complemented with a speaker verification stage in which the identity of who is responding with 马球gydF4y2Ba将得到证实。这个补充持续我们的建议,因为它变成了一个额外的约束称为对象。其他任务也可以利用这一点,因此验证的一部分gydF4y2Ba 后一个人gydF4y2Ba,gydF4y2Ba 将出席gydF4y2Ba,gydF4y2Ba 服务员gydF4y2Ba任务。在未来,我们将探讨补充DOA与验证和其行为后果的交互。gydF4y2Ba

相互竞争的利益gydF4y2Ba

作者宣称没有利益冲突有关的出版。gydF4y2Ba

确认gydF4y2Ba

作者感谢CONACYT通过项目81965年和178673年的支持,通过项目IN107513 PAPIIT-UNAM,通过项目picco12 ICYTDF - 024。gydF4y2Ba

1gydF4y2Ba

皮尔斯gydF4y2Ba

C。gydF4y2Ba

豪斯gydF4y2Ba

N。gydF4y2Ba

KloeselgydF4y2Ba

C。gydF4y2Ba

基本皮尔斯:选择哲学著作gydF4y2Ba 1992年gydF4y2Ba 1gydF4y2Ba

印第安纳大学出版社gydF4y2Ba

必要的皮尔斯gydF4y2Ba

2gydF4y2Ba

皮尔斯gydF4y2Ba

C。gydF4y2Ba

豪斯gydF4y2Ba

N。gydF4y2Ba

KloeselgydF4y2Ba

C。gydF4y2Ba

项目gydF4y2Ba

p E。gydF4y2Ba

基本皮尔斯:选择哲学著作gydF4y2Ba 1998年gydF4y2Ba 2gydF4y2Ba

印第安纳大学出版社gydF4y2Ba

必要的皮尔斯gydF4y2Ba

3gydF4y2Ba

皮内gydF4y2Ba

l。gydF4y2Ba

萨利纳斯gydF4y2Ba

lgydF4y2Ba

面向社会gydF4y2Ba

i V。gydF4y2Ba

RascongydF4y2Ba

C。gydF4y2Ba

富恩特斯gydF4y2Ba

G。gydF4y2Ba

坐日志:服务机器人任务的编程语言gydF4y2Ba

国际先进的机器人系统杂志》上gydF4y2Ba 2013年gydF4y2Ba 10gydF4y2Ba 1gydF4y2Ba 12gydF4y2Ba

10.5772/56906gydF4y2Ba

2 - s2.0 - 84887842411gydF4y2Ba

4gydF4y2Ba

皮内gydF4y2Ba

lgydF4y2Ba

RodrguezgydF4y2Ba

一个。gydF4y2Ba

富恩特斯gydF4y2Ba

G。gydF4y2Ba

RascngydF4y2Ba

C。gydF4y2Ba

面向社会gydF4y2Ba

我。gydF4y2Ba

服务机器人的概念和功能结构gydF4y2Ba

国际先进的机器人系统杂志》上gydF4y2Ba 2015年gydF4y2Ba 6gydF4y2Ba 1gydF4y2Ba 15gydF4y2Ba

10.5772/60026gydF4y2Ba

5gydF4y2Ba

RascongydF4y2Ba

C。gydF4y2Ba

皮内gydF4y2Ba

lgydF4y2Ba

金gydF4y2Ba

h·K。gydF4y2Ba

AogydF4y2Ba

机票的。gydF4y2Ba

AmouzegargydF4y2Ba

m·A。gydF4y2Ba

RiegergydF4y2Ba

B . B。gydF4y2Ba

多个direction-of-arrival估计与小型移动机器人平台的硬件设置gydF4y2Ba

IAENG交易工程技术gydF4y2Ba 2014年gydF4y2Ba 247年gydF4y2Ba

荷兰阿姆斯特丹gydF4y2Ba

施普林格gydF4y2Ba

209年gydF4y2Ba 223年gydF4y2Ba 课堂讲稿电气工程gydF4y2Ba

10.1007 / 978 - 94 - 007 - 6818 - 5 - _16gydF4y2Ba

6gydF4y2Ba

ArgentierigydF4y2Ba

年代。gydF4y2Ba

PortellogydF4y2Ba

一个。gydF4y2Ba

伯纳德gydF4y2Ba

M。gydF4y2Ba

丹麦人gydF4y2Ba

P。gydF4y2Ba

气体gydF4y2Ba

B。gydF4y2Ba

双耳系统机器人gydF4y2Ba

双耳听力的技术gydF4y2Ba 2013年gydF4y2Ba

柏林,德国gydF4y2Ba

施普林格gydF4y2Ba

225年gydF4y2Ba 253年gydF4y2Ba

7gydF4y2Ba

OkunogydF4y2Ba

h·G。gydF4y2Ba

NakadaigydF4y2Ba

K。gydF4y2Ba

机器人听觉:中国的崛起和观点gydF4y2Ba

《IEEE国际会议音响、演讲和信号处理(ICASSP 15)gydF4y2Ba

2015年4月gydF4y2Ba

南布里斯班,澳大利亚gydF4y2Ba

5610年gydF4y2Ba 5614年gydF4y2Ba

10.1109 / ICASSP.2015.7179045gydF4y2Ba

8gydF4y2Ba

ArgentierigydF4y2Ba

年代。gydF4y2Ba

丹麦人gydF4y2Ba

P。gydF4y2Ba

SoueresgydF4y2Ba

P。gydF4y2Ba

一项调查在机器人声源定位:从双耳阵列处理方法gydF4y2Ba

电脑语音和语言gydF4y2Ba 2015年gydF4y2Ba 34gydF4y2Ba 1gydF4y2Ba 87年gydF4y2Ba 112年gydF4y2Ba

10.1016 / j.csl.2015.03.003gydF4y2Ba

2 - s2.0 - 84938092272gydF4y2Ba

9gydF4y2Ba

布鲁克斯gydF4y2Ba

r。gydF4y2Ba

BreazealgydF4y2Ba

C。gydF4y2Ba

MarjanovićgydF4y2Ba

M。gydF4y2Ba

ScassellatigydF4y2Ba

B。gydF4y2Ba

威廉姆森gydF4y2Ba

M . M。gydF4y2Ba

齿轮项目:建立一个人形机器人gydF4y2Ba

计算隐喻、类比和代理gydF4y2Ba 1999年gydF4y2Ba 1562年gydF4y2Ba

柏林,德国gydF4y2Ba

施普林格gydF4y2Ba

52gydF4y2Ba 87年gydF4y2Ba 在计算机科学的课堂讲稿gydF4y2Ba

10.1007 / 3 - 540 - 48834 - 0 - _5gydF4y2Ba

10gydF4y2Ba

北野gydF4y2Ba

H。gydF4y2Ba

OkunogydF4y2Ba

h·G。gydF4y2Ba

NakadaigydF4y2Ba

K。gydF4y2Ba

SabischgydF4y2Ba

T。gydF4y2Ba

松井秀喜gydF4y2Ba

T。gydF4y2Ba

设计和架构的团体人形:一个实验平台,综合感知机器人世界杯赛人形的挑战gydF4y2Ba

1gydF4y2Ba

《IEEE / RSJ智能机器人和系统国际会议(——' 00)gydF4y2Ba

2000年gydF4y2Ba

高松,日本gydF4y2Ba

IEEEgydF4y2Ba

181年gydF4y2Ba 190年gydF4y2Ba

10.1109 / IROS.2000.894602gydF4y2Ba

11gydF4y2Ba

米肖德gydF4y2Ba

F。gydF4y2Ba

象牙海岸gydF4y2Ba

C。gydF4y2Ba

一起时gydF4y2Ba

D。gydF4y2Ba

但是gydF4y2Ba

Y。gydF4y2Ba

华菱gydF4y2Ba

人类。gydF4y2Ba

德里gydF4y2Ba

E。gydF4y2Ba

RaievskygydF4y2Ba

C。gydF4y2Ba

PonchongydF4y2Ba

一个。gydF4y2Ba

MoisangydF4y2Ba

P。gydF4y2Ba

理gydF4y2Ba

P。gydF4y2Ba

莫林gydF4y2Ba

Y。gydF4y2Ba

盖格农gydF4y2Ba

F。gydF4y2Ba

GigueregydF4y2Ba

P。gydF4y2Ba

面粉糊gydF4y2Ba

M.-A。gydF4y2Ba

卡洛gydF4y2Ba

年代。gydF4y2Ba

FrenettegydF4y2Ba

P。gydF4y2Ba

KabanzagydF4y2Ba

F。gydF4y2Ba

斯巴达克斯党参加2005年AAAI会议gydF4y2Ba

自主机器人gydF4y2Ba 2007年gydF4y2Ba 22gydF4y2Ba 4gydF4y2Ba 369年gydF4y2Ba 383年gydF4y2Ba

10.1007 / s10514 - 006 - 9014 - 7gydF4y2Ba

2 - s2.0 - 33947509526gydF4y2Ba

12gydF4y2Ba

华菱gydF4y2Ba

人类。gydF4y2Ba

山本gydF4y2Ba

年代。gydF4y2Ba

RouatgydF4y2Ba

J。gydF4y2Ba

米肖德gydF4y2Ba

F。gydF4y2Ba

NakadaigydF4y2Ba

K。gydF4y2Ba

OkunogydF4y2Ba

h·G。gydF4y2Ba

健壮的移动机器人识别同步的语音gydF4y2Ba

IEEE机器人gydF4y2Ba 2007年gydF4y2Ba 23gydF4y2Ba 4gydF4y2Ba 742年gydF4y2Ba 752年gydF4y2Ba

10.1109 / TRO.2007.900612gydF4y2Ba

2 - s2.0 - 34548176123gydF4y2Ba

13gydF4y2Ba

HaragydF4y2Ba

我。gydF4y2Ba

浅野gydF4y2Ba

F。gydF4y2Ba

AsohgydF4y2Ba

H。gydF4y2Ba

OgatagydF4y2Ba

J。gydF4y2Ba

IchimuragydF4y2Ba

N。gydF4y2Ba

卡瓦依gydF4y2Ba

Y。gydF4y2Ba

KanehirogydF4y2Ba

F。gydF4y2Ba

HirukawagydF4y2Ba

H。gydF4y2Ba

山本gydF4y2Ba

K。gydF4y2Ba

强大的语音界面基于音频和视频信息为人形HRP-2融合gydF4y2Ba

3gydF4y2Ba

《IEEE / RSJ智能机器人和系统国际会议(——“04)gydF4y2Ba

2004年9 ~ 10月gydF4y2Ba

2404年gydF4y2Ba 2410年gydF4y2Ba

10.1109 / IROS.2004.1389768gydF4y2Ba

14gydF4y2Ba

穆雷gydF4y2Ba

j . C。gydF4y2Ba

欧文gydF4y2Ba

h·R。gydF4y2Ba

WermtergydF4y2Ba

年代。gydF4y2Ba

机器人声源定位架构使用互相关和复发性神经网络gydF4y2Ba

神经网络gydF4y2Ba 2009年gydF4y2Ba 22gydF4y2Ba 2gydF4y2Ba 173年gydF4y2Ba 189年gydF4y2Ba

10.1016 / j.neunet.2009.01.013gydF4y2Ba

2 - s2.0 - 61749088969gydF4y2Ba

15gydF4y2Ba

金gydF4y2Ba

》。gydF4y2Ba

崔gydF4y2Ba

js。gydF4y2Ba

金gydF4y2Ba

M。gydF4y2Ba

在真实环境中人机交互通过视听一体化gydF4y2Ba

国际期刊的控制、自动化和系统gydF4y2Ba 2007年gydF4y2Ba 5gydF4y2Ba 1gydF4y2Ba 61年gydF4y2Ba 69年gydF4y2Ba

2 - s2.0 - 33846702321gydF4y2Ba

16gydF4y2Ba

公园gydF4y2Ba

在公元前。gydF4y2Ba

禁止gydF4y2Ba

K.-D。gydF4y2Ba

夸克gydF4y2Ba

K.-C。gydF4y2Ba

尹gydF4y2Ba

H.-S。gydF4y2Ba

声源定位基于视听信息智能服务机器人gydF4y2Ba

学报》第八届国际研讨会上先进的智能系统(伊希斯' 07)gydF4y2Ba

2007年gydF4y2Ba

Sokcho、韩国gydF4y2Ba

364年gydF4y2Ba 367年gydF4y2Ba

17gydF4y2Ba

BadaligydF4y2Ba

一个。gydF4y2Ba

华菱gydF4y2Ba

人类。gydF4y2Ba

米肖德gydF4y2Ba

F。gydF4y2Ba

AarabigydF4y2Ba

P。gydF4y2Ba

评估实时音频定位算法在机器人人工试镜gydF4y2Ba

《IEEE / RSJ智能机器人和系统国际会议(——' 09)gydF4y2Ba

2009年10月gydF4y2Ba

美国圣路易斯,小姐gydF4y2Ba

2033年gydF4y2Ba 2038年gydF4y2Ba

10.1109 / iros.2009.5354308gydF4y2Ba

2 - s2.0 - 76249121092gydF4y2Ba

18gydF4y2Ba

BohusgydF4y2Ba

D。gydF4y2Ba

霍维茨gydF4y2Ba

E。gydF4y2Ba

促进多方对话框与目光、手势和演讲gydF4y2Ba

学报》国际会议多通道多通道交互的接口和车间的机器学习(ICMI-MLMI 10)gydF4y2Ba

2010年11月gydF4y2Ba

中国,北京gydF4y2Ba

5:1gydF4y2Ba 8gydF4y2Ba

10.1145/1891903.1891910gydF4y2Ba

19gydF4y2Ba

NakadaigydF4y2Ba

K。gydF4y2Ba

OkunogydF4y2Ba

h·G。gydF4y2Ba

北野gydF4y2Ba

H。gydF4y2Ba

实时对机器人声源定位和分离试镜gydF4y2Ba

《IEEE国际会议上口头语言处理(ICSLP ' 02)gydF4y2Ba

2002年9月gydF4y2Ba

美国科罗拉多州丹佛gydF4y2Ba

193年gydF4y2Ba 196年gydF4y2Ba

20.gydF4y2Ba

TrifagydF4y2Ba

诉M。gydF4y2Ba

KoenegydF4y2Ba

一个。gydF4y2Ba

MorengydF4y2Ba

J。gydF4y2Ba

程gydF4y2Ba

G。gydF4y2Ba

实时声音源定位在嘈杂的环境中机器人多通道交互gydF4y2Ba

学报》第16届IEEE国际会议上机器人和人类互动交流(RO-MAN ' 07)gydF4y2Ba

2007年8月gydF4y2Ba

393年gydF4y2Ba 398年gydF4y2Ba

10.1109 / roman.2007.4415116gydF4y2Ba

2 - s2.0 - 48749105042gydF4y2Ba

21gydF4y2Ba

TraftongydF4y2Ba

j·G。gydF4y2Ba

BugajskagydF4y2Ba

m D。gydF4y2Ba

FransengydF4y2Ba

b R。gydF4y2Ba

RatwanigydF4y2Ba

r·M。gydF4y2Ba

将视觉和听觉认知架构中跟踪谈话gydF4y2Ba

学报》第三届ACM和IEEE国际会议上人机交互(HRI ' 08)gydF4y2Ba

2008年3月gydF4y2Ba

ACMgydF4y2Ba

201年gydF4y2Ba 208年gydF4y2Ba

10.1145/1349822.1349849gydF4y2Ba

2 - s2.0 - 57749099744gydF4y2Ba

22gydF4y2Ba

TeachasrisaksakulgydF4y2Ba

K。gydF4y2Ba

Iemcha-OdgydF4y2Ba

N。gydF4y2Ba

ThiemjarusgydF4y2Ba

年代。gydF4y2Ba

PolprasertgydF4y2Ba

C。gydF4y2Ba

说话人跟踪模块室内机器人导航gydF4y2Ba

学报》第九届国际会议上电气工程/电子、计算机、通信和信息技术(ECTI-CON 12)gydF4y2Ba

2012年5月gydF4y2Ba

1gydF4y2Ba 4gydF4y2Ba

10.1109 / ecticon.2012.6254160gydF4y2Ba

2 - s2.0 - 84866749186gydF4y2Ba

23gydF4y2Ba

李gydF4y2Ba

X。gydF4y2Ba

盛ydF4y2Ba

M。gydF4y2Ba

王gydF4y2Ba

W。gydF4y2Ba

刘gydF4y2Ba

H。gydF4y2Ba

实时声源定位的移动机器人基于引导spectral-temporal位置的方法gydF4y2Ba

国际先进的机器人系统杂志》上gydF4y2Ba 2012年gydF4y2Ba 9日,第78条gydF4y2Ba

10.5772/51307gydF4y2Ba

2 - s2.0 - 84868128837gydF4y2Ba

24gydF4y2Ba

FransengydF4y2Ba

B。gydF4y2Ba

MorariugydF4y2Ba

V。gydF4y2Ba

马丁森gydF4y2Ba

E。gydF4y2Ba

BlisardgydF4y2Ba

年代。gydF4y2Ba

玛姬gydF4y2Ba

M。gydF4y2Ba

托马斯。gydF4y2Ba

年代。gydF4y2Ba

舒尔茨gydF4y2Ba

一个。gydF4y2Ba

PerzanowskigydF4y2Ba

D。gydF4y2Ba

使用视觉、声学和自然语言歧义gydF4y2Ba

ACM和IEEE国际会议的程序人机交互((HRI ' 07)gydF4y2Ba

2007年3月gydF4y2Ba

美国弗吉尼亚州阿灵顿gydF4y2Ba

73年gydF4y2Ba 80年gydF4y2Ba

10.1145/1228716.1228727gydF4y2Ba

25gydF4y2Ba

NakadaigydF4y2Ba

K。gydF4y2Ba

山本gydF4y2Ba

年代。gydF4y2Ba

OkunogydF4y2Ba

h·G。gydF4y2Ba

只是gydF4y2Ba

H。gydF4y2Ba

长谷川gydF4y2Ba

Y。gydF4y2Ba

TsujinogydF4y2Ba

H。gydF4y2Ba

一个机器人剪刀声音游戏的裁判gydF4y2Ba

诉讼的IEEE机器人与自动化国际会议上08年举行(“国际机器人与自动化会议”)gydF4y2Ba

2008年5月gydF4y2Ba

加利福尼亚州帕萨迪纳市,美国gydF4y2Ba

IEEEgydF4y2Ba

3469年gydF4y2Ba 3474年gydF4y2Ba

10.1109 / robot.2008.4543741gydF4y2Ba

2 - s2.0 - 51649115852gydF4y2Ba

26gydF4y2Ba

NishimutagydF4y2Ba

我。gydF4y2Ba

ItoyamagydF4y2Ba

K。gydF4y2Ba

吉井gydF4y2Ba

K。gydF4y2Ba

OkunogydF4y2Ba

h·G。gydF4y2Ba

向quizmaster机器人基于语音的多方互动gydF4y2Ba

先进的机器人gydF4y2Ba 2015年gydF4y2Ba 29日gydF4y2Ba 18gydF4y2Ba 1205年gydF4y2Ba 1219年gydF4y2Ba

10.1080 / 01691864.2015.1079504gydF4y2Ba

2 - s2.0 - 84942866828gydF4y2Ba

27gydF4y2Ba

做gydF4y2Ba

h . M。gydF4y2Ba

盛gydF4y2Ba

W。gydF4y2Ba

刘gydF4y2Ba

M。gydF4y2Ba

一个开放的平台的家庭服务机器人听觉感知gydF4y2Ba

《IEEE / RSJ智能机器人和系统国际会议(——“15)gydF4y2Ba

2015年9 ~ 10月gydF4y2Ba

德国汉堡gydF4y2Ba

IEEEgydF4y2Ba

6161年gydF4y2Ba 6166年gydF4y2Ba

10.1109 / iros.2015.7354255gydF4y2Ba

28gydF4y2Ba

布鲁克斯gydF4y2Ba

a·G。gydF4y2Ba

BreazealgydF4y2Ba

C。gydF4y2Ba

使用机器人和对象:回顾直证的参考实现空间的共同点gydF4y2Ba

学报第一ACM SIGCHI / SIGART人机交互会议(HRI 06年)gydF4y2Ba

2006年3月gydF4y2Ba

美国犹他盐湖城gydF4y2Ba

297年gydF4y2Ba 304年gydF4y2Ba

10.1145/1121241.1121292gydF4y2Ba

29日gydF4y2Ba

SugiyamagydF4y2Ba

O。gydF4y2Ba

神田gydF4y2Ba

T。gydF4y2Ba

ImaigydF4y2Ba

M。gydF4y2Ba

石黑浩gydF4y2Ba

H。gydF4y2Ba

HagitagydF4y2Ba

N。gydF4y2Ba

自然直证的交互模型gydF4y2Ba

在社会机器人人机交互gydF4y2Ba 2012年gydF4y2Ba 104年gydF4y2Ba

30.gydF4y2Ba

OkunogydF4y2Ba

h·G。gydF4y2Ba

NakadaigydF4y2Ba

K。gydF4y2Ba

HidaigydF4y2Ba

K.-I。gydF4y2Ba

沟口健二gydF4y2Ba

H。gydF4y2Ba

北野gydF4y2Ba

H。gydF4y2Ba

人机语言交互授权通过听觉和视觉multiple-talker实时跟踪gydF4y2Ba

先进的机器人gydF4y2Ba 2003年gydF4y2Ba 17gydF4y2Ba 2gydF4y2Ba 115年gydF4y2Ba 130年gydF4y2Ba

10.1163 / 156855303321165088gydF4y2Ba

2 - s2.0 - 0037219742gydF4y2Ba

31日gydF4y2Ba

特金gydF4y2Ba

一个。gydF4y2Ba

ZaltagydF4y2Ba

e . N。gydF4y2Ba

皮尔斯的符号理论gydF4y2Ba

斯坦福哲学百科全书gydF4y2Ba 2013年gydF4y2Ba

32gydF4y2Ba

卡普兰gydF4y2Ba

D。gydF4y2Ba

科尔gydF4y2Ba

P。gydF4y2Ba

DthatgydF4y2Ba

语法和语义gydF4y2Ba 1978年gydF4y2Ba 9gydF4y2Ba

纽约,纽约,美国gydF4y2Ba

学术出版社gydF4y2Ba

221年gydF4y2Ba 243年gydF4y2Ba

33gydF4y2Ba

皮内gydF4y2Ba

lgydF4y2Ba

加尔萨gydF4y2Ba

G。gydF4y2Ba

多通道引用解析模型gydF4y2Ba

计算语言学gydF4y2Ba 2000年gydF4y2Ba 26gydF4y2Ba 2gydF4y2Ba 139年gydF4y2Ba 193年gydF4y2Ba

10.1162 / 089120100561665gydF4y2Ba

2 - s2.0 - 0039847641gydF4y2Ba

34gydF4y2Ba

MitkovgydF4y2Ba

R。gydF4y2Ba

用来解决gydF4y2Ba 2002年gydF4y2Ba 134年gydF4y2Ba

英国伦敦gydF4y2Ba

朗文gydF4y2Ba

35gydF4y2Ba

TetreaultgydF4y2Ba

j . R。gydF4y2Ba

基于语料库的评价定心和代词的决议gydF4y2Ba

计算语言学gydF4y2Ba 2001年gydF4y2Ba 27gydF4y2Ba 4gydF4y2Ba 507年gydF4y2Ba 520年gydF4y2Ba

10.1162 / 089120101753342644gydF4y2Ba

2 - s2.0 - 0039299874gydF4y2Ba

36gydF4y2Ba

NggydF4y2Ba

V。gydF4y2Ba

羊毛衫,gydF4y2Ba

C。gydF4y2Ba

提高机器学习方法算法gydF4y2Ba

美国40对计算语言学协会年度会议gydF4y2Ba

2002年gydF4y2Ba

计算语言学协会gydF4y2Ba

104年gydF4y2Ba 111年gydF4y2Ba

37gydF4y2Ba

布鲁克斯gydF4y2Ba

r。gydF4y2Ba

VanLehngydF4y2Ba

K。gydF4y2Ba

如何构建完整的生物,而不是孤立的认知模拟器gydF4y2Ba

架构情报gydF4y2Ba 1991年gydF4y2Ba 225年gydF4y2Ba 239年gydF4y2Ba

38gydF4y2Ba

BonassogydF4y2Ba

r P。gydF4y2Ba

FirbygydF4y2Ba

r . J。gydF4y2Ba

手枪gydF4y2Ba

E。gydF4y2Ba

KortenkampgydF4y2Ba

D。gydF4y2Ba

米勒gydF4y2Ba

d . P。gydF4y2Ba

松弛gydF4y2Ba

m·G。gydF4y2Ba

经历一个智能架构,活性代理gydF4y2Ba

实验和理论人工智能杂志》上gydF4y2Ba 1997年gydF4y2Ba 9gydF4y2Ba 2 - 3gydF4y2Ba 237年gydF4y2Ba 256年gydF4y2Ba

10.1080 / 095281397147103gydF4y2Ba

2 - s2.0 - 0031524077gydF4y2Ba

39gydF4y2Ba

皮内gydF4y2Ba

l。gydF4y2Ba

面向社会gydF4y2Ba

我。gydF4y2Ba

铁砧gydF4y2Ba

H . H。gydF4y2Ba

GershensongydF4y2Ba

C。gydF4y2Ba

RascongydF4y2Ba

C。gydF4y2Ba

阿尔瓦拉多gydF4y2Ba

M。gydF4y2Ba

萨利纳斯gydF4y2Ba

lgydF4y2Ba

IOCA: interaction-oriented认知体系结构gydF4y2Ba

研究计算机科学gydF4y2Ba 2011年gydF4y2Ba 54gydF4y2Ba 273年gydF4y2Ba 284年gydF4y2Ba

40gydF4y2Ba

面向社会gydF4y2Ba

我。gydF4y2Ba

RascongydF4y2Ba

C。gydF4y2Ba

皮内gydF4y2Ba

l。gydF4y2Ba

实用语音识别更符合实际的服务机器人gydF4y2Ba

先进的软计算及其应用:12日墨西哥人工智能国际会议上,MICAI 2013年,墨西哥城,墨西哥,2013年11月能力,程序,第二部分gydF4y2Ba 2013年gydF4y2Ba 8266年gydF4y2Ba

柏林,德国gydF4y2Ba

施普林格gydF4y2Ba

423年gydF4y2Ba 434年gydF4y2Ba 在计算机科学的课堂讲稿gydF4y2Ba

10.1007 / 978 - 3 - 642 - 45111 - 9 - _37gydF4y2Ba

41gydF4y2Ba

皮内gydF4y2Ba

lgydF4y2Ba

GolmegydF4y2Ba

G。gydF4y2Ba

Grupo傀儡:robocup@homegydF4y2Ba

《机器人世界杯赛gydF4y2Ba

2013年6月gydF4y2Ba

荷兰埃因霍温gydF4y2Ba

“机器人足球世界杯”联盟gydF4y2Ba

8gydF4y2Ba

42gydF4y2Ba

RascongydF4y2Ba

C。gydF4y2Ba

面向社会gydF4y2Ba

我。gydF4y2Ba

富恩特斯gydF4y2Ba

G。gydF4y2Ba

萨利纳斯gydF4y2Ba

lgydF4y2Ba

皮内gydF4y2Ba

l。gydF4y2Ba

整合multi-doa估计人机交互功能gydF4y2Ba

国际先进的机器人系统杂志》上gydF4y2Ba 2015年gydF4y2Ba 12gydF4y2Ba 8gydF4y2Ba

10.5772/59993gydF4y2Ba

43gydF4y2Ba

RascongydF4y2Ba

C。gydF4y2Ba

富恩特斯gydF4y2Ba

G。gydF4y2Ba

面向社会gydF4y2Ba

我。gydF4y2Ba

轻量级multi-DOA跟踪移动语音来源gydF4y2Ba

EURASIP杂志在音频、语音和音乐的处理gydF4y2Ba 2015年gydF4y2Ba 2015年gydF4y2Ba 1gydF4y2Ba 1gydF4y2Ba 16gydF4y2Ba

10.1186 / s13636 - 015 - 0055 - 8gydF4y2Ba

2 - s2.0 - 84929193376gydF4y2Ba

44gydF4y2Ba

戴维斯gydF4y2Ba

P。gydF4y2Ba

杰克连接一个有声的世界,gydF4y2Ba http://jackaudio.orggydF4y2Ba

45gydF4y2Ba

van der ZantgydF4y2Ba

T。gydF4y2Ba

WisspeintnergydF4y2Ba

T。gydF4y2Ba

BredenfeldgydF4y2Ba

一个。gydF4y2Ba

JacoffgydF4y2Ba

一个。gydF4y2Ba

野田佳彦gydF4y2Ba

我。gydF4y2Ba

高桥gydF4y2Ba

Y。gydF4y2Ba

X:举办的新联盟的提议举办的现实世界gydF4y2Ba

“机器人足球世界杯”2005:第九机器人足球世界杯gydF4y2Ba 2006年gydF4y2Ba 4020年gydF4y2Ba 166年gydF4y2Ba 172年gydF4y2Ba 在计算机科学的课堂讲稿gydF4y2Ba

46gydF4y2Ba

WisspeintnergydF4y2Ba

T。gydF4y2Ba

van der ZantgydF4y2Ba

T。gydF4y2Ba

IocchigydF4y2Ba

lgydF4y2Ba

希弗gydF4y2Ba

年代。gydF4y2Ba

RoboCup@Home:科学竞争对国内服务机器人和基准测试gydF4y2Ba

相互作用研究gydF4y2Ba 2009年gydF4y2Ba 10gydF4y2Ba 3gydF4y2Ba 392年gydF4y2Ba 426年gydF4y2Ba

10.1075 / is.10.3.06wisgydF4y2Ba

2 - s2.0 - 72649101700gydF4y2Ba