小gydF4y2Ba
机器人杂志gydF4y2Ba
1687 - 9619gydF4y2Ba
1687 - 9600gydF4y2Ba
Hindawi出版公司gydF4y2Ba
10.1155 / 2016/3081048gydF4y2Ba
3081048gydF4y2Ba
研究文章gydF4y2Ba
Indexicality到来的声音来源的方向,和人机交互gydF4y2Ba
面向社会gydF4y2Ba
伊凡gydF4y2Ba
1gydF4y2Ba
RascongydF4y2Ba
迦勒gydF4y2Ba
1gydF4y2Ba
富恩特斯gydF4y2Ba
纪伯伦gydF4y2Ba
1gydF4y2Ba
皮内gydF4y2Ba
路易斯。gydF4y2Ba
1gydF4y2Ba
PennockgydF4y2Ba
戈登·R。gydF4y2Ba
皇家研究院Investigaciones en Matematicas Aplicadas y在系统gydF4y2Ba
大学根据墨西哥gydF4y2Ba
城市大学联盟gydF4y2Ba
CoyocangydF4y2Ba
04510年墨西哥城gydF4y2Ba
墨西哥人gydF4y2Ba
墨西哥gydF4y2Ba
2016年gydF4y2Ba
23gydF4y2Ba
5gydF4y2Ba
2016年gydF4y2Ba
2016年gydF4y2Ba
30.gydF4y2Ba
11gydF4y2Ba
2015年gydF4y2Ba
07年gydF4y2Ba
03gydF4y2Ba
2016年gydF4y2Ba
10gydF4y2Ba
04gydF4y2Ba
2016年gydF4y2Ba
23gydF4y2Ba
5gydF4y2Ba
2016年gydF4y2Ba
2016年gydF4y2Ba
版权©2016伊凡就等。gydF4y2Ba
这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。gydF4y2Ba
我们现在使用到达方向(DOA)的声音来源索引在人类之间的交互和服务机器人。这些指数遵循定义的概念的理论解释皮尔斯的迹象。这个概念建立了一个强大的物理信号(DOAs)和对象之间的关系在特定上下文中所指。记住这一点,我们建模在远处叫机器人作为索引的。这些指标可以稍后解释为用户和用户的位置他/她自己。之间的关系叫和发射器是形式化的框架的发展服务机器人基于SitLog编程语言。特别是,我们创建一组行为基于到达方向信息用于服务机器人的编程任务。基于这些行为,我们实现了四个任务,严重依赖他们:一个人后,将出席一个类,玩马可波罗,作为一个服务员在餐馆。gydF4y2Ba
1。介绍gydF4y2Ba
知道一个声源的起源是一个机器人的一个重要技能。通常,这个技能是与生存相关的行为,知识是用来应对天敌或杰出的危险。然而,这个技能也在互动的过程中起着关键作用,例如,在调用一个服务员过去。起初,知道到达方向(DOA)的声源似乎太基本元素的交互;然而,正如我们将显示,这些信息可以是有意义的,这样的机器人可以以适当的方式,提高交互反应。gydF4y2Ba
我们考虑的方向到达信息作为一个索引的皮尔斯的符号理论提出的gydF4y2Ba
1gydF4y2Ba ,gydF4y2Ba
2gydF4y2Ba ]。在这个理论中,考虑到他们的关系有三种类型的迹象表示对象。这些类型gydF4y2Ba
图标gydF4y2Ba ,gydF4y2Ba
指数,gydF4y2Ba 和gydF4y2Ba
象征gydF4y2Ba 。gydF4y2Ba
图标gydF4y2Ba 反映对象的定性特征,例如,对象的图片或图纸。gydF4y2Ba
指数gydF4y2Ba 有一个存在或与特定上下文中的对象物理连接;例如,一个乌云是下雨。另一方面,gydF4y2Ba
符号gydF4y2Ba 有一个稳定的解释基于公约,连接他们的对象,例如,一个产品的标志。这也适用于口语沟通;拟声词,例如,标志性的因为他们像他们代表什么(例如,gydF4y2Ba
切gydF4y2Ba ),代词是指数,因为他们“点”他们所代表的对象,和名词是象征性的,因为他们是传统和脱离他们所代表的对象。在这个分类的背景下,DOA信息有一个索引的质量;索引的对象的位置也发出声音和物体本身,因为它拥有一个强烈的声音发射器之间的联系(对象)和到达方向(迹象)。在这项工作中,我们利用这个索引的使用机器人之间的交互和用户的支持。gydF4y2Ba
目前工作的索引的新风是SitLog形式化和实现编程语言,我们开发并用于项目服务机器人(gydF4y2Ba
3gydF4y2Ba ,gydF4y2Ba
4gydF4y2Ba ]。SitLog定义了一组行为,从简单的(一个技能)组成(不止一个技能)行为。这些行为的基本块用于计划我们的机器人在一个更高的水平。简单的行为的例子gydF4y2Ba
走gydF4y2Ba ,机器人从当前位置到目的地,和gydF4y2Ba
问gydF4y2Ba ,提示用户并等待口语答案的问题。由行为的一个例子gydF4y2Ba
寻找一个对象gydF4y2Ba 在不同的位置,因为它依赖于其他基本行为等gydF4y2Ba
走gydF4y2Ba 和gydF4y2Ba
看到对象gydF4y2Ba 。从本质上讲,一个行为必须是(1)便携式,所以它可以用在不同的任务,(2)组成,所以通过耦合不同的行为我们可以创建更复杂的行为或程序任务,和(3)能够处理潜在故障(例如,不是到达目的地,从用户不听答案,或者找不到对象)。gydF4y2Ba
为了模型的indexicality DOAs并将其融入到交互功能的机器人,我们提出一个简单的行为来处理新风和解释这些指标。这支持的交互通过允许调用在远处。在这种情况下,用户或用户可以使机器人的注意到一个特定的区域中产生声音。这种行为也可以结合使用gydF4y2Ba
走gydF4y2Ba 行为允许中断期间行走如调用一个服务员过去。此外,还支持行为验证来源的数量在谈话。特别是,这可以结合使用gydF4y2Ba
问gydF4y2Ba 行为,以确保当机器人听答案,只有一个人说话。gydF4y2Ba
本文的组织结构如下:部分gydF4y2Ba
2gydF4y2Ba 了以前的工作声音信息服务机器人的任务的一部分。部分gydF4y2Ba
3gydF4y2Ba 评论indexicality为解释过程。部分gydF4y2Ba
4gydF4y2Ba 介绍了框架我们用来DOAs迹象解释为指标。部分gydF4y2Ba
5gydF4y2Ba 描述了DOA行为的方式解决了DOA指标。部分gydF4y2Ba
6gydF4y2Ba 显示的四个任务指标声音来源用于直接交互。部分gydF4y2Ba
7gydF4y2Ba 提供了一个讨论我们的建议和发现。gydF4y2Ba
2。以前的工作gydF4y2Ba
使用机器人声源定位(SSL)是一个盛开的领域;Okuno和Nakadai Argentieri et al .,现在评论的主要方法及其使用不同类型的机器人(gydF4y2Ba
6gydF4y2Ba - - - - - -gydF4y2Ba
8gydF4y2Ba ]。应用机器人技术以来,SSL被提拔为机器人的主要技能。布鲁克斯等人提出齿轮项目中作为交互的基本技能(gydF4y2Ba
9gydF4y2Ba ]。提出了机器人团体作为世界杯赛的实验设置竞争(gydF4y2Ba
10gydF4y2Ba ];和机器人斯巴达克斯党参加了2005年AAAI移动机器人挑战实现SSL作为它的一部分技能(gydF4y2Ba
11gydF4y2Ba ]。gydF4y2Ba
虽然互动的目标是一种动力,有一个努力开发一个健壮的SSL模块。记住这个目标,首选设置数组的使用麦克风上的机器人。many-microphone解决方案提供了不错的性能由于其冗余。在[gydF4y2Ba
12gydF4y2Ba )、华菱等人提出的gydF4y2Ba
8gydF4y2Ba
麦克风3 d数组来提高语音识别和DOA估计的序言。更多的可能是麦克风。Hara等人用两个数组gydF4y2Ba
8gydF4y2Ba
麦克风(总共16日)(gydF4y2Ba
13gydF4y2Ba ]。然而,最小的系统gydF4y2Ba
2gydF4y2Ba
麦克风也是有可能的,比如在[gydF4y2Ba
14gydF4y2Ba ]。一个常见的设置,我们遵循,是使用gydF4y2Ba
3gydF4y2Ba
麦克风(gydF4y2Ba
15gydF4y2Ba ,gydF4y2Ba
16gydF4y2Ba ]。最好的方法和配置仍然是一个悬而未决的问题。Badali等人提出了一个评估的主要方法gydF4y2Ba
8gydF4y2Ba
麦克风阵列的移动机器人(gydF4y2Ba
17gydF4y2Ba ]。gydF4y2Ba
源定位活性,可以作为互动的形态呈现在作品处理后的谈话(gydF4y2Ba
18gydF4y2Ba - - - - - -gydF4y2Ba
21gydF4y2Ba ];也可以是交互的一个重要组成部分,比如使用声音控制机器人的导航定位。特别是,Teachasrisaksakul等人提出一个系统,是一个人通过一个房间她或他的声音gydF4y2Ba
22gydF4y2Ba ]。另一方面,李等人证明了一个机器人gydF4y2Ba
捉迷藏gydF4y2Ba 使用视觉和听觉形式的交互(gydF4y2Ba
23gydF4y2Ba ]。这些作品遵循类似的方法对如何将声源位置作为交互的一部分我们的建议。然而,由于只有一个用户存在于他们的工作,其治疗指数是微不足道的。DOA标志直接解读为用户;没有冲突对于谁可以代表签字。gydF4y2Ba
考虑到该领域的进展,针对捕获一个更复杂的交互。例如,Fransen等人提出一个多通道的机器人它遵循两个用户之间的指令到达一个目标(gydF4y2Ba
24gydF4y2Ba ]。Nakadai等人提出一个机器人能够判断剪刀声音游戏(gydF4y2Ba
25gydF4y2Ba ]。Quizmaster机器人玩一个游戏,它要求一个问题4参与者和使用SSL和源分离决定谁先回答gydF4y2Ba
26gydF4y2Ba ]。做等人提出一个机器人一起照顾者日志和检测某些声音的来源gydF4y2Ba
27gydF4y2Ba ]。在这个水平的相互作用的复杂性,DOA的迹象正在间接用作指数:新风成为指数表示直接的用户和这些信息是用来消除歧义调用或赢。在[gydF4y2Ba
27gydF4y2Ba ),新风和相关类别表示类型的事件。在这个层次上,多个源使一个方法来分配必要的DOA的实体。我们会看到在这个工作,考虑DOA作为索引的好处在正确的上下文中允许我们使用索引的决议执行该消歧的情况下多个DOA竞争。在这项工作中,我们形式化这项决议同样对机器人其他引用解析机制,如直证的引用(gydF4y2Ba
28gydF4y2Ba ,gydF4y2Ba
29日gydF4y2Ba ]。这不同于其他方法的研究和多通道信息互补消歧gydF4y2Ba
30.gydF4y2Ba ]。gydF4y2Ba
3所示。索引的表达式gydF4y2Ba
交互式剂如机器人理解用户的意图或预期的事件可以发生在环境为了产生足够的反应。考虑皮尔斯的符号理论,我们可以制定“理解”的目标提供一个信号或一组符号识别所指对象或对象(gydF4y2Ba
1gydF4y2Ba ,gydF4y2Ba
2gydF4y2Ba ,gydF4y2Ba
31日gydF4y2Ba ]。为了表示的对象,它的机器人构建表示法。例如,如果用户命令gydF4y2Ba
机器人去厨房,gydF4y2Ba 符号的序列gydF4y2Ba
机器人gydF4y2Ba ,gydF4y2Ba
去gydF4y2Ba ,gydF4y2Ba
来gydF4y2Ba ,gydF4y2Ba
的,gydF4y2Ba 和gydF4y2Ba
厨房gydF4y2Ba 把翻译成表示gydF4y2Ba
ggydF4y2Ba
ogydF4y2Ba
(gydF4y2Ba
rgydF4y2Ba
ogydF4y2Ba
bgydF4y2Ba
ogydF4y2Ba
tgydF4y2Ba
,gydF4y2Ba
kgydF4y2Ba
我gydF4y2Ba
tgydF4y2Ba
cgydF4y2Ba
hgydF4y2Ba
egydF4y2Ba
ngydF4y2Ba
)gydF4y2Ba
,机器人可以建立所指对象(本身,厨房,和行动)并采取相应行动。一个类似的机制可以用于标志性符号的解释;例如,当机器人看到一个表,确定了一瓶果汁,它将生成表示gydF4y2Ba
ogydF4y2Ba
ngydF4y2Ba
(gydF4y2Ba
jgydF4y2Ba
ugydF4y2Ba
我gydF4y2Ba
cgydF4y2Ba
egydF4y2Ba
,gydF4y2Ba
tgydF4y2Ba
一个gydF4y2Ba
bgydF4y2Ba
lgydF4y2Ba
egydF4y2Ba
)gydF4y2Ba
,表示完全的对应汁对象。gydF4y2Ba
当一组交互的迹象包括索引的迹象,表示不完全指定的迹象以来该指数有关决议一个额外的步骤中表示对象。例如,如果用户状态的命令gydF4y2Ba
机器人来这里gydF4y2Ba ,这话语是不作为的表现gydF4y2Ba
λgydF4y2Ba
hgydF4y2Ba
。gydF4y2Ba
ggydF4y2Ba
ogydF4y2Ba
(gydF4y2Ba
rgydF4y2Ba
ogydF4y2Ba
bgydF4y2Ba
ogydF4y2Ba
tgydF4y2Ba
,gydF4y2Ba
hgydF4y2Ba
)gydF4y2Ba
。为了充分指定这个表达式,它必须是关于任务的背景下,分析中可以推断出用户的位置。例如,如果用户位于厨房,表情应该解决gydF4y2Ba
ggydF4y2Ba
ogydF4y2Ba
(gydF4y2Ba
rgydF4y2Ba
ogydF4y2Ba
bgydF4y2Ba
ogydF4y2Ba
tgydF4y2Ba
,gydF4y2Ba
kgydF4y2Ba
我gydF4y2Ba
tgydF4y2Ba
cgydF4y2Ba
hgydF4y2Ba
egydF4y2Ba
ngydF4y2Ba
)gydF4y2Ba
。gydF4y2Ba
在这个方案中,产生一个未指定索引的迹象表示在以后首先应解决的上下文信息。此外,指标提供额外的约束类型的对象可以解析表达式;例如,在前面的例子中,机器人的目的是解决有效的位置。为了解释这种现象,受到的治疗指数(gydF4y2Ba
32gydF4y2Ba ),我们建议以下公式演算的一个索引,我们使用符号”gydF4y2Ba
:gydF4y2Ba
“信号约束gydF4y2Ba
αgydF4y2Ba
在一个特定的变量gydF4y2Ba
xgydF4y2Ba
:gydF4y2Ba
(1)gydF4y2Ba
λgydF4y2Ba
αgydF4y2Ba
问gydF4y2Ba
xgydF4y2Ba
。gydF4y2Ba
问gydF4y2Ba
@gydF4y2Ba
xgydF4y2Ba
:gydF4y2Ba
αgydF4y2Ba
。gydF4y2Ba
指标定义这种形式接受作为参数约束gydF4y2Ba
αgydF4y2Ba
遗漏和谓词gydF4y2Ba
问gydF4y2Ba
;应用这些参数的影响是约束变量的绑定gydF4y2Ba
xgydF4y2Ba
:gydF4y2Ba
αgydF4y2Ba
到表达式gydF4y2Ba
问gydF4y2Ba
。在这种情况下,符号gydF4y2Ba
@gydF4y2Ba
象征功能的应用程序(例如,gydF4y2Ba
βgydF4y2Ba
减少演算)。如果我们在前一个例子应用指数gydF4y2Ba
问gydF4y2Ba
=gydF4y2Ba
λgydF4y2Ba
hgydF4y2Ba
。gydF4y2Ba
ggydF4y2Ba
ogydF4y2Ba
(gydF4y2Ba
rgydF4y2Ba
ogydF4y2Ba
bgydF4y2Ba
ogydF4y2Ba
tgydF4y2Ba
,gydF4y2Ba
hgydF4y2Ba
)gydF4y2Ba
和gydF4y2Ba
αgydF4y2Ba
=gydF4y2Ba
ugydF4y2Ba
年代gydF4y2Ba
egydF4y2Ba
rgydF4y2Ba
pgydF4y2Ba
ogydF4y2Ba
年代gydF4y2Ba
产生如下表示:gydF4y2Ba
λgydF4y2Ba
hgydF4y2Ba
。gydF4y2Ba
ggydF4y2Ba
ogydF4y2Ba
(gydF4y2Ba
rgydF4y2Ba
ogydF4y2Ba
bgydF4y2Ba
ogydF4y2Ba
tgydF4y2Ba
,gydF4y2Ba
hgydF4y2Ba
:gydF4y2Ba
ugydF4y2Ba
年代gydF4y2Ba
egydF4y2Ba
rgydF4y2Ba
pgydF4y2Ba
ogydF4y2Ba
年代gydF4y2Ba
)gydF4y2Ba
。还未指定,但限制了变量gydF4y2Ba
hgydF4y2Ba
用户的位置。第二个决议过程识别从上下文用户是在厨房里。gydF4y2Ba
表gydF4y2Ba
1gydF4y2Ba 索引的的两个例子显示使用该配方与一个机器人。对于这些例子,考虑以下背景:用户和机器人在桌子前有一个橙汁放在它。第一个插图示例是一个多通道表达式:用户说什么和指向一个对象。这个词gydF4y2Ba
这gydF4y2Ba 会同指向手势定义一个索引,对所指的对象空间约束。在这种情况下,约束对象的构成(从视觉系统提取的位置和姿态)。这个约束是用来识别场景中的对象,在这个例子中要解决的一瓶果汁。第二个例子展示了一个索引的引用这个词gydF4y2Ba
它gydF4y2Ba 也增加了约束(gydF4y2Ba
33gydF4y2Ba ]。在这种情况下,遗漏变量必须解决一个对象在现实世界中,一瓶果汁。请注意,我们调用一个空间和直证的分辨率;然而,我们没有指定一个特定的机制来执行这种类型的决议。有效的解决机制的主题索引的表情仍是研究在不同领域gydF4y2Ba
34gydF4y2Ba - - - - - -gydF4y2Ba
36gydF4y2Ba ),应用机制取决于类型的表达式和类型的任务得到解决。在这项工作中,我们定义索引的DOA的解析表达式和机制可以应用的条件。gydF4y2Ba
表1gydF4y2Ba
索引的表情和他们的决议的例子。gydF4y2Ba
标志gydF4y2Ba
表示gydF4y2Ba
约束gydF4y2Ba
解决gydF4y2Ba
这是果汁gydF4y2Ba +指向手势gydF4y2Ba
λgydF4y2Ba
xgydF4y2Ba
。gydF4y2Ba
ngydF4y2Ba
一个gydF4y2Ba
米gydF4y2Ba
egydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
:gydF4y2Ba
pgydF4y2Ba
ogydF4y2Ba
年代gydF4y2Ba
egydF4y2Ba
,gydF4y2Ba
jgydF4y2Ba
ugydF4y2Ba
我gydF4y2Ba
cgydF4y2Ba
egydF4y2Ba
)gydF4y2Ba
构成的对象gydF4y2Ba
ngydF4y2Ba
一个gydF4y2Ba
米gydF4y2Ba
egydF4y2Ba
(gydF4y2Ba
ogydF4y2Ba
bgydF4y2Ba
jgydF4y2Ba
egydF4y2Ba
cgydF4y2Ba
tgydF4y2Ba
,gydF4y2Ba
jgydF4y2Ba
ugydF4y2Ba
我gydF4y2Ba
cgydF4y2Ba
egydF4y2Ba
)gydF4y2Ba
把它gydF4y2Ba
λgydF4y2Ba
xgydF4y2Ba
。gydF4y2Ba
tgydF4y2Ba
一个gydF4y2Ba
kgydF4y2Ba
egydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
:gydF4y2Ba
ogydF4y2Ba
bgydF4y2Ba
jgydF4y2Ba
egydF4y2Ba
cgydF4y2Ba
tgydF4y2Ba
)gydF4y2Ba
对象gydF4y2Ba
tgydF4y2Ba
一个gydF4y2Ba
kgydF4y2Ba
egydF4y2Ba
(gydF4y2Ba
jgydF4y2Ba
ugydF4y2Ba
我gydF4y2Ba
cgydF4y2Ba
egydF4y2Ba
)gydF4y2Ba
4所示。对话模型和机器人gydF4y2Ba
在我们的机器人,模块之间的协调执行期间执行的任务是通过对话模型。这些对话模型使用SitLog编程语言编写服务机器人。模型由一组对话gydF4y2Ba
的情况下gydF4y2Ba 有一个相关的元组的gydF4y2Ba
预期gydF4y2Ba ,gydF4y2Ba
行动,gydF4y2Ba 和明年gydF4y2Ba
的情况下gydF4y2Ba 。在一个典型的互动循环,机器人是在一个给定的情况下,它有一定的期望;如果到达解释匹配一些期望,机器人继续执行相关的操作和移动到另一个的情况。在这个框架中,执行一个任务包含在遍历一个对话模型模块提供解释和执行的操作定义的对话模型。此外,在SitLog,可以动态的主要元素定义为函数,构建对话的结构模型。也可以调用另一个对话模型从一个特定的情况。图gydF4y2Ba
1gydF4y2Ba 描述了这些情况:gydF4y2Ba
(一)gydF4y2Ba
它显示了一个典型的SitLog弧的情况gydF4y2Ba
年代gydF4y2Ba
我gydF4y2Ba
有一个期望gydF4y2Ba
αgydF4y2Ba
;如果这是满意的,行为的集合gydF4y2Ba
βgydF4y2Ba
执行和电弧到达情况gydF4y2Ba
年代gydF4y2Ba
jgydF4y2Ba
。gydF4y2Ba
(b)gydF4y2Ba
这是定义的元素是函数和定义的期望将评价函数gydF4y2Ba
fgydF4y2Ba
,行动gydF4y2Ba
ggydF4y2Ba
,接下来的情况gydF4y2Ba
hgydF4y2Ba
。特别是,这些属性使它可能计划动态对话模型变化任务执行。gydF4y2Ba
(c)gydF4y2Ba
它显示的情况gydF4y2Ba
递归gydF4y2Ba 情况下,形势下整个对话模型执行,完成时,它使用过去情况的名字作为自己的期望。算法gydF4y2Ba
1gydF4y2Ba 介绍了为这些情况下SitLog代码。gydF4y2Ba
<大胆>算法1:< /大胆> SitLog代码的例子:(a)典型SitLog弧功能弧(b)和(c)递归情况。gydF4y2Ba
(gydF4y2Ba
idgydF4y2Ba
= = >gydF4y2Ba
s_i,gydF4y2Ba
弧gydF4y2Ba
= = >gydF4y2Ba
(gydF4y2Ba
αgydF4y2Ba
:gydF4y2Ba
bethagydF4y2Ba
= >gydF4y2Ba
s_jgydF4y2Ba
]gydF4y2Ba
]gydF4y2Ba
(gydF4y2Ba
idgydF4y2Ba
= = >gydF4y2Ba
s_i,gydF4y2Ba
弧gydF4y2Ba
= = >gydF4y2Ba
(gydF4y2Ba
f (x)gydF4y2Ba
:gydF4y2Ba
g (y)gydF4y2Ba
= >gydF4y2Ba
h (z)gydF4y2Ba
]gydF4y2Ba
]gydF4y2Ba
(gydF4y2Ba
idgydF4y2Ba
= = >gydF4y2Ba
s_i,gydF4y2Ba
embeded_dmgydF4y2Ba
= = >gydF4y2Ba
r (m)gydF4y2Ba
弧gydF4y2Ba
= = >gydF4y2Ba
(gydF4y2Ba
αgydF4y2Ba
:gydF4y2Ba
bethagydF4y2Ba
= >gydF4y2Ba
s_jgydF4y2Ba
]gydF4y2Ba
]gydF4y2Ba
图1gydF4y2Ba
例子的情况,期望和行动。(一)典型SitLog弧,功能弧(b)和(c)递归情况。gydF4y2Ba
(一)gydF4y2Ba
(b)gydF4y2Ba
(c)gydF4y2Ba
SitLog framework-agnostic的核心;一个可以实现不同的框架如包容(gydF4y2Ba
37gydF4y2Ba ),反应(gydF4y2Ba
38gydF4y2Ba ),或简单状态机架构。在我们目前的实验室,我们已经开发出一个完整的图书馆基于我们的交互行为和任务周期的这是一个高水平的认知体系结构(IOCA [gydF4y2Ba
4gydF4y2Ba ,gydF4y2Ba
39gydF4y2Ba ])。与体系结构相关,我们已经实现了一些技能如视觉、语言(gydF4y2Ba
40gydF4y2Ba )、声音(gydF4y2Ba
5gydF4y2Ba ),导航,操作,和运动。使用这个框架,我们编程Golem-II +机器人(如在图所示gydF4y2Ba
2gydF4y2Ba (gydF4y2Ba
41gydF4y2Ba ])。表gydF4y2Ba
2gydF4y2Ba 总结了主要功能模块和硬件组成的机器人。在这个框架和当前版本的硬件,我们实现了几个任务,比如一个人后,介绍自己,寻找对象,作为宴会或餐厅的服务员gydF4y2Ba
42gydF4y2Ba ),保护博物馆,玩游戏比赛的记忆(任务的例子,请访问gydF4y2Ba
http://golem.iimas.unam.mx/gydF4y2Ba )。gydF4y2Ba
表2gydF4y2Ba
功能、模块和硬件上使用Golem-II +机器人(IH:内部开发的)。gydF4y2Ba
模块gydF4y2Ba
硬件gydF4y2Ba
软件库gydF4y2Ba
对话管理gydF4y2Ba
对话管理器gydF4y2Ba
- - - - - -gydF4y2Ba
SitLoggydF4y2Ba
以知识为基础gydF4y2Ba
- - - - - -gydF4y2Ba
序言gydF4y2Ba
愿景gydF4y2Ba
对象识别gydF4y2Ba
跳蚤3相机gydF4y2Ba
机动脚踏两用车gydF4y2Ba
人识别gydF4y2Ba
网络摄像头gydF4y2Ba
OpenCVgydF4y2Ba
人跟踪gydF4y2Ba
KinectgydF4y2Ba
OpenNIgydF4y2Ba
手势识别gydF4y2Ba
KinectgydF4y2Ba
OpenNIgydF4y2Ba
语言gydF4y2Ba
语音识别gydF4y2Ba
定向麦克风gydF4y2Ba
PocketSphinxgydF4y2Ba
语音合成器gydF4y2Ba
演讲者gydF4y2Ba
节日TTSgydF4y2Ba
理解gydF4y2Ba
- - - - - -gydF4y2Ba
GF语法,IH解析器gydF4y2Ba
声音感知gydF4y2Ba
DOA系统gydF4y2Ba
3全向麦克风gydF4y2Ba
- - - - - -gydF4y2Ba
量监控gydF4y2Ba
定向麦克风gydF4y2Ba
杰克,IH图书馆gydF4y2Ba
量监控gydF4y2Ba
M-Audio快速通道接口gydF4y2Ba
杰克,IH图书馆gydF4y2Ba
导航、操纵和脖子gydF4y2Ba
导航gydF4y2Ba
机器人基地,激光gydF4y2Ba
球员gydF4y2Ba
操纵gydF4y2Ba
IH机械手臂gydF4y2Ba
Dynamixel RoboPlusgydF4y2Ba
颈部运动gydF4y2Ba
IH的脖子gydF4y2Ba
Dynamixel RoboPlusgydF4y2Ba
图2gydF4y2Ba
Golem-II +机器人。gydF4y2Ba
4.1。Multiple-DOA评估系统gydF4y2Ba
执行的DOA技能是multiple-DOA评估系统。这是基于以前的工作集中在一个小,轻量级的硬件设置,能够估计新风比的麦克风使用(gydF4y2Ba
5gydF4y2Ba ,gydF4y2Ba
43gydF4y2Ba ]。gydF4y2Ba
从硬件的角度来看(见表gydF4y2Ba
2gydF4y2Ba 、声音感知部分),系统使用一个二维数组3-microphone(见图gydF4y2Ba
4gydF4y2Ba )经历4-channel USB接口。从软件的角度来看,架构图中可以看到gydF4y2Ba
3gydF4y2Ba 。系统分为三个部分。gydF4y2Ba
图3gydF4y2Ba
multiple-DOA估计系统的体系结构。gydF4y2Ba
图4gydF4y2Ba
麦克风的音频定位系统在机器人Golem-II +。gydF4y2Ba
音频采集。gydF4y2Ba 这是底层模块为音频数据到另一个系统的一部分。它是基于杰克音频连接工具包(gydF4y2Ba
44gydF4y2Ba ),它提供了高分辨率数据(48 kHz,在我们的例子中)在实时速度非常高的公差在麦克风的数量管理和资源需求相对较小。这个捕获音频通过VAD激活本地化。gydF4y2Ba
初始Single-DOA估计。gydF4y2Ba 对于每一个时间窗口,每一对麦克风用于估计使用互相关信号延迟向量(闭路)方法(请参见图gydF4y2Ba
3gydF4y2Ba ,single-DOA估计块)。每个延迟是用来计算两个初步DOAs(考虑前后颠倒的镜像问题gydF4y2Ba
1gydF4y2Ba
维数组构成)。使用一个基本的搜索方法,最gydF4y2Ba
连贯的gydF4y2Ba 组gydF4y2Ba
3gydF4y2Ba
DOAs (gydF4y2Ba
1gydF4y2Ba
从每一对麦克风),使用提出的一致性指标(见图gydF4y2Ba
5gydF4y2Ba )。如果相干的组高于某个阈值,一双垂直向的DOA源提出了作为其DOA;这双是选择避免非线性延迟之间的关系和由此产生的DOA。图gydF4y2Ba
5gydF4y2Ba 说明了这个舞台。gydF4y2Ba
图5gydF4y2Ba
(一)不一致的措施。组(b)一致的措施(取自[gydF4y2Ba
5gydF4y2Ba ])。gydF4y2Ba
(一)gydF4y2Ba
(b)gydF4y2Ba
Multiple-DOA跟踪。gydF4y2Ba 因为前面的部分进行DOA估计接近实时的速度,它能够从一个源估计DOA小时间窗口,甚至在有两个或更多的实例同时声音来源(见图gydF4y2Ba
3gydF4y2Ba ,multi-DOA跟踪块)。不过,很幸运的发生时间窗口在这种情况下是随机源。这种效应,提出了一种DOA从之前的系统的一部分,采用了一种聚类方法来几个附近的DOAs分组到一个或多个估计声音来源的方向。gydF4y2Ba
图gydF4y2Ba
6gydF4y2Ba 显示三个扬声器的跟踪gydF4y2Ba
30.gydF4y2Ba
秒;每个演讲者是隔开的gydF4y2Ba
120年gydF4y2Ba
度。可以看到,这个跟踪是很有效的,因为它可以本地化的每个发现的来源。在这个例子中,系统精度69%和60%召回在帧级性能。表gydF4y2Ba
3gydF4y2Ba 提出了一种评估整个系统。虽然它可能会认为这对HRI交互性能是不够的,因为它是在帧标签(即。,One hundred. ms), in an interaction setting when turns are being taken, this performance is more than enough to catch the interaction of a user. An extensive evaluation of this module can be consulted in [
43gydF4y2Ba ]。gydF4y2Ba
表3gydF4y2Ba
Multiple-DOA估计系统性能。gydF4y2Ba
最小距离的演讲者gydF4y2Ba
30厘米gydF4y2Ba
最大距离的演讲者gydF4y2Ba
5米gydF4y2Ba
最大数量的同时扬声器gydF4y2Ba
4gydF4y2Ba
响应时间gydF4y2Ba
年代gydF4y2Ba
范围(最小夹角扬声器)gydF4y2Ba
10gydF4y2Ba
报道gydF4y2Ba
360年gydF4y2Ba
FgydF4y2Ba
1gydF4y2Ba
- - - - - -gydF4y2Ba
年代gydF4y2Ba
cgydF4y2Ba
ogydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
1人gydF4y2Ba
100.00%gydF4y2Ba
FgydF4y2Ba
1gydF4y2Ba
- - - - - -gydF4y2Ba
年代gydF4y2Ba
cgydF4y2Ba
ogydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
2人gydF4y2Ba
78.79%gydF4y2Ba
FgydF4y2Ba
1gydF4y2Ba
- - - - - -gydF4y2Ba
年代gydF4y2Ba
cgydF4y2Ba
ogydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
3人gydF4y2Ba
72.34%gydF4y2Ba
FgydF4y2Ba
1gydF4y2Ba
- - - - - -gydF4y2Ba
年代gydF4y2Ba
cgydF4y2Ba
ogydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
4人gydF4y2Ba
61.02%gydF4y2Ba
图6gydF4y2Ba
DOAs三扬声器gydF4y2Ba
90年gydF4y2Ba
,gydF4y2Ba
- - - - - -gydF4y2Ba
30.gydF4y2Ba
,gydF4y2Ba
- - - - - -gydF4y2Ba
150年gydF4y2Ba
度。gydF4y2Ba
5。DOA的行为gydF4y2Ba
DOA行为的目标是将DOA的测量转换为参考对象上下文中的任务。当DOA系统检测到一个源,这个标志与声音的发射器有很强的关系。这个强大的DOA行为利用关系来解决对象被征收“指向”空间限制可能的来源。空间约束的相对位置gydF4y2Ba
一个gydF4y2Ba
的源gydF4y2Ba
xgydF4y2Ba
鉴于目前机器人的位置(例如,gydF4y2Ba
λgydF4y2Ba
一个gydF4y2Ba
xgydF4y2Ba
。gydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
lgydF4y2Ba
_gydF4y2Ba
pgydF4y2Ba
ogydF4y2Ba
年代gydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
,gydF4y2Ba
一个gydF4y2Ba
)gydF4y2Ba
)。在这一点上,我们只有是在位置的信息gydF4y2Ba
一个gydF4y2Ba
;然而,由于我们考虑DOA索引,我们可以使用公式(gydF4y2Ba
1gydF4y2Ba 减少为指标),这样我们得到以下:gydF4y2Ba
(2)gydF4y2Ba
λgydF4y2Ba
xgydF4y2Ba
。gydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
lgydF4y2Ba
_gydF4y2Ba
pgydF4y2Ba
ogydF4y2Ba
年代gydF4y2Ba
xgydF4y2Ba
:gydF4y2Ba
一个gydF4y2Ba
,gydF4y2Ba
一个gydF4y2Ba
。gydF4y2Ba
尽管我们能够限制的对象,到目前为止,我们还没有解决了索引正确的指示物;为了达到这个目标,我们需要使用上下文信息。DOA的角度是用来识别潜在对象的上下文。算法gydF4y2Ba
2gydF4y2Ba 负责这项决议阶段通过分析哪些对象上下文约束满足DOA。gydF4y2Ba
<大胆>算法2:< /大胆> DOAS的解释指标的实现算法。gydF4y2Ba
需要gydF4y2Ba :DOAs Pred上下文gydF4y2Ba
确保gydF4y2Ba :gydF4y2Ba
PgydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
dgydF4y2Ba
(gydF4y2Ba
lgydF4y2Ba
我gydF4y2Ba
年代gydF4y2Ba
tgydF4y2Ba
OgydF4y2Ba
bgydF4y2Ba
jgydF4y2Ba
egydF4y2Ba
cgydF4y2Ba
tgydF4y2Ba
年代gydF4y2Ba
,gydF4y2Ba
lgydF4y2Ba
我gydF4y2Ba
年代gydF4y2Ba
tgydF4y2Ba
DgydF4y2Ba
OgydF4y2Ba
一个gydF4y2Ba
年代gydF4y2Ba
)gydF4y2Ba
lgydF4y2Ba
我gydF4y2Ba
年代gydF4y2Ba
tgydF4y2Ba
OgydF4y2Ba
bgydF4y2Ba
jgydF4y2Ba
egydF4y2Ba
cgydF4y2Ba
tgydF4y2Ba
年代gydF4y2Ba
←gydF4y2Ba
(gydF4y2Ba
]gydF4y2Ba
lgydF4y2Ba
我gydF4y2Ba
年代gydF4y2Ba
tgydF4y2Ba
DgydF4y2Ba
OgydF4y2Ba
一个gydF4y2Ba
年代gydF4y2Ba
←gydF4y2Ba
(gydF4y2Ba
]gydF4y2Ba
为gydF4y2Ba
dgydF4y2Ba
ogydF4y2Ba
一个gydF4y2Ba
←gydF4y2Ba
DgydF4y2Ba
OgydF4y2Ba
一个gydF4y2Ba
年代gydF4y2Ba
做gydF4y2Ba
为gydF4y2Ba
我gydF4y2Ba
dgydF4y2Ba
,gydF4y2Ba
αgydF4y2Ba
←gydF4y2Ba
CgydF4y2Ba
ogydF4y2Ba
ngydF4y2Ba
tgydF4y2Ba
egydF4y2Ba
xgydF4y2Ba
tgydF4y2Ba
做gydF4y2Ba
如果gydF4y2Ba
dgydF4y2Ba
ogydF4y2Ba
一个gydF4y2Ba
αgydF4y2Ba
然后gydF4y2Ba
lgydF4y2Ba
我gydF4y2Ba
年代gydF4y2Ba
tgydF4y2Ba
OgydF4y2Ba
bgydF4y2Ba
jgydF4y2Ba
egydF4y2Ba
cgydF4y2Ba
tgydF4y2Ba
年代gydF4y2Ba
。gydF4y2Ba
pgydF4y2Ba
ugydF4y2Ba
年代gydF4y2Ba
hgydF4y2Ba
(gydF4y2Ba
我gydF4y2Ba
dgydF4y2Ba
)gydF4y2Ba
lgydF4y2Ba
我gydF4y2Ba
年代gydF4y2Ba
tgydF4y2Ba
DgydF4y2Ba
OgydF4y2Ba
一个gydF4y2Ba
年代gydF4y2Ba
。gydF4y2Ba
pgydF4y2Ba
ugydF4y2Ba
年代gydF4y2Ba
hgydF4y2Ba
(gydF4y2Ba
dgydF4y2Ba
ogydF4y2Ba
一个gydF4y2Ba
)gydF4y2Ba
如果gydF4y2Ba
结束了gydF4y2Ba
结束了gydF4y2Ba
整个机制是封装在一个行为的编程模型(参见图作为一个简单的对话gydF4y2Ba
7gydF4y2Ba )。这个对话模型可以处理多个独立;对于每个人来说,这将试图解决被提到的对象。如果成功,它创建一个gydF4y2Ba
ogydF4y2Ba
kgydF4y2Ba
情况与所指对象的列表,否则,它达到gydF4y2Ba
错误gydF4y2Ba 的情况。拟议的DOA行为支持交互两个模式:gydF4y2Ba
(我)gydF4y2Ba
无限制的电话。gydF4y2Ba
(2)gydF4y2Ba
更符合实际的调用。gydF4y2Ba
图7gydF4y2Ba
对话模型简单的DOA的行为。gydF4y2Ba
第一种情况对应的场景,在该场景中,用户的位置不能期望/事先预测;在本例中,上下文的描述gydF4y2Ba
CgydF4y2Ba
是空的意思是只有一个用户存在(图gydF4y2Ba
8(一个)gydF4y2Ba 描述了机器人在这种情况下);即指标直接解释为用户机器人互动。在第二种情况下,机器人有一个期望的方向,它将调用使用这种期望确定调用者。例如,图gydF4y2Ba
8 (b)gydF4y2Ba 描述了机器人和两个用户对话;的信息的位置,它可以丢弃三分之一用户不是谈话的一部分。gydF4y2Ba
图8gydF4y2Ba
电话在远处的例子:无限制,一个用户不是在预测位置,和语境化多个用户在可预测的位置。gydF4y2Ba
(一)gydF4y2Ba
(b)gydF4y2Ba
到目前为止,我们已经假定机器人不动,但是用户应该能够调用机器人移动时。为了解决这种情况下,我们创建了一个由行为使机器人行走距离和监听可能调用。图gydF4y2Ba
9gydF4y2Ba 显示了这种行为的对话模型。要求这种行为gydF4y2Ba
wgydF4y2Ba
一个gydF4y2Ba
lgydF4y2Ba
kgydF4y2Ba
dgydF4y2Ba
ogydF4y2Ba
一个gydF4y2Ba
(gydF4y2Ba
DgydF4y2Ba
,gydF4y2Ba
CgydF4y2Ba
)gydF4y2Ba
;gydF4y2Ba
DgydF4y2Ba
代表了目的地,gydF4y2Ba
CgydF4y2Ba
空间环境的描述。首先,行为开始的行动gydF4y2Ba
走gydF4y2Ba 来gydF4y2Ba
DgydF4y2Ba
的机器人的民意调查,尽管这样做可能DOAs的来源gydF4y2Ba
CgydF4y2Ba
。如果没有,它继续走;否则,它结束了对话的情况gydF4y2Ba
我gydF4y2Ba
ngydF4y2Ba
tgydF4y2Ba
egydF4y2Ba
rgydF4y2Ba
rgydF4y2Ba
ugydF4y2Ba
pgydF4y2Ba
tgydF4y2Ba
egydF4y2Ba
dgydF4y2Ba
它包含相关的信息中断。空间上下文在每次调用更新当前位置的机器人。注意,这种行为重用简单DOA行为(情况gydF4y2Ba
RgydF4y2Ba
dgydF4y2Ba
ogydF4y2Ba
一个gydF4y2Ba
年代gydF4y2Ba
(gydF4y2Ba
CgydF4y2Ba
)gydF4y2Ba
)。gydF4y2Ba
图9gydF4y2Ba
对话模式走DOA的行为。gydF4y2Ba
对于另一种情况,当用户移动时,信号DOA强加了一个额外的约束指数。这个约束是相对位置的DOA之前来自同一声源DOA这额外的信息是由multiple-DOA估计系统的跟踪阶段。多亏了这个约束,我们可以使用相同的机制迄今概述来处理这种情况。结合散步和听的行为,他们可以蜡烛场景,在该场景中,用户和机器人移动。gydF4y2Ba
另外,我们还建议使用DOA行为来验证声音来源的数量在一个特定的时刻。特别是,我们已经创建了一个由行为之间的问和DOA行为,利用这种情况。图gydF4y2Ba
10gydF4y2Ba 这种行为显示了对话模型。后问一个问题gydF4y2Ba
PgydF4y2Ba
从用户和听答案,机器人检查有多少指数(即恢复。元素的个数gydF4y2Ba
ZgydF4y2Ba
):如果只有一个,它可以进行交互;如果不止一个,多个用户的机器人推断说话,所以它会产生一个错误必须由机器人处理。类似于行走行为,这种行为重用简单的DOA的行为。gydF4y2Ba
图10gydF4y2Ba
对话模式问DOA的行为。gydF4y2Ba
6。执行任务gydF4y2Ba
DOA行为被用来与我们的机器人程序以下任务Golem-II +(这些任务可以观看的视频gydF4y2Ba
https://youtube/Q6prwIjoDnE?list=PL4EiERt__u4faJoxHF1M5EMwhEoNH4NScgydF4y2Ba )。gydF4y2Ba
后一个人。gydF4y2Ba 在这个任务中,机器人是一个人通过视觉跟踪系统(基于kinect)。机器人试图保持1米的距离;在用户移动,机器人试图捕捉它在一个安全的速度。在机器人失去他,它要求用户称之为所以机器人可以推断出哪个方向去寻找。一旦放置在正确的方向上,它使用视觉继续跟踪使用。失去时,用户可以在任何方向和在一个5米的比例和机器人将确定它在哪里。如果用户没有找到,它会坚持被称为并再次尝试找到他(全系统的演示,请参阅补充视频gydF4y2Ba
person.mp4后gydF4y2Ba 在网上补充材料gydF4y2Ba
http://dx.doi.org/10.1155/2016/3081048gydF4y2Ba )。gydF4y2Ba
出席。gydF4y2Ba 在这个任务中,机器人将出席在类通过调用类的成员的名字和每个调用,预计听觉反应。确定反应的方向时,它面临着向那个方向,检查如果有一个人问波,并接近核实学生的身份。学生的数量是有限的视觉系统只可以看到多达四个不同的人。他们必须位于一条直线;目前,任务不考虑多个行。我们利用这个设置指定一个空间环境中,学生只有在前面的机器人(全系统的演示,请参阅补充视频gydF4y2Ba
采取class.mp4出席gydF4y2Ba )。gydF4y2Ba
在马可波罗。gydF4y2Ba 在这个任务中,机器人的角色寻找用户,适合gydF4y2Ba
马可gydF4y2Ba 和期待一个或多个gydF4y2Ba
马球gydF4y2Ba 响应。当确定响应的方向,它走向那个方向。当这个方向前进,如果前面的激光传感器承认有人近距离,它假定它赢得了比赛;否则,它继续打电话gydF4y2Ba
马可gydF4y2Ba 直到用户响应。机器人有gydF4y2Ba
ngydF4y2Ba
试图抓住用户;如果不是,它放弃和失去了比赛。激光假设有人在前面,如果它检测到一个不连续的阅读。在此设置中,玩家可以位于任何方向的比例5米(全系统的演示,请参阅补充视频gydF4y2Ba
玩Marco-Polo.mp4gydF4y2Ba )。gydF4y2Ba
服务员。gydF4y2Ba 在前面的例子中,DOA的行为依赖于机器人的倡议。这个任务将行为mixed-initiative策略。在这种情况下,机器人是一个服务员,它等待电话用户位于餐厅表。一次表调用在远处,机器人会走到表的订单客户。然而,尽管走,它会倾听其他调用不同的表;如果发生这种情况,它可以让用户在相应的表中知道它将尽快完成表目前步行。在接受订单时,机器人将交互如果多个客户端同时进行谈判。一旦订单,继续把它的饮料/食物从指定的传感器位置在厨房区域或直接问厨师。这个任务的最大数量是有限的资源,可以同时检测(gydF4y2Ba
4gydF4y2Ba
)。在这种情况下,表参加的最大数量gydF4y2Ba
4gydF4y2Ba
的最大数量gydF4y2Ba
4gydF4y2Ba
客户在每个表;这要比5米(整个系统的演示,看到补充视频gydF4y2Ba
服务员在restaurant.mp4gydF4y2Ba )。gydF4y2Ba
我们假设的成功交互的每个任务是有可能的,因为利用DOA信息索引完全解释每个任务的上下文中。这些上下文之间的物理关系符号(调用)和对象(用户或用户)明显。见表gydF4y2Ba
4gydF4y2Ba 总结的主要元素参与的分辨率DOA指标在每个任务和详细如下。gydF4y2Ba
表4gydF4y2Ba
使用DOA行为特征的任务。gydF4y2Ba
后一个人gydF4y2Ba
将出席gydF4y2Ba
代理gydF4y2Ba
人被跟踪gydF4y2Ba
学生gydF4y2Ba
机器人的目标gydF4y2Ba
跟踪一个人gydF4y2Ba
验证学生现在gydF4y2Ba
用户目标gydF4y2Ba
被跟踪gydF4y2Ba
是在课堂上gydF4y2Ba
DOA的行为gydF4y2Ba
在远处叫gydF4y2Ba
在远处叫gydF4y2Ba
情况gydF4y2Ba
用户丢失gydF4y2Ba
叫学生的名字gydF4y2Ba
标志gydF4y2Ba
在这里gydF4y2Ba
现在gydF4y2Ba
表达式gydF4y2Ba
λgydF4y2Ba
xgydF4y2Ba
。gydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
lgydF4y2Ba
_gydF4y2Ba
pgydF4y2Ba
ogydF4y2Ba
年代gydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
:gydF4y2Ba
一个gydF4y2Ba
,gydF4y2Ba
一个gydF4y2Ba
)gydF4y2Ba
λgydF4y2Ba
xgydF4y2Ba
。gydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
lgydF4y2Ba
pgydF4y2Ba
ogydF4y2Ba
年代gydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
:gydF4y2Ba
一个gydF4y2Ba
,gydF4y2Ba
一个gydF4y2Ba
)gydF4y2Ba
决议gydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
lgydF4y2Ba
pgydF4y2Ba
ogydF4y2Ba
年代gydF4y2Ba
(gydF4y2Ba
ugydF4y2Ba
年代gydF4y2Ba
egydF4y2Ba
rgydF4y2Ba
,gydF4y2Ba
一个gydF4y2Ba
)gydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
lgydF4y2Ba
pgydF4y2Ba
ogydF4y2Ba
年代gydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
一个gydF4y2Ba
米gydF4y2Ba
egydF4y2Ba
,gydF4y2Ba
一个gydF4y2Ba
)gydF4y2Ba
解释gydF4y2Ba
目标和它的位置gydF4y2Ba
学生和位置gydF4y2Ba
在马可波罗gydF4y2Ba
服务员gydF4y2Ba
代理gydF4y2Ba
球员gydF4y2Ba
客户gydF4y2Ba
机器人的目标gydF4y2Ba
抓住一个球员gydF4y2Ba
接受和交付订货gydF4y2Ba
用户目标gydF4y2Ba
不被抓住gydF4y2Ba
收到订单gydF4y2Ba
DOA的行为gydF4y2Ba
在远处叫gydF4y2Ba
在远处叫验证gydF4y2Ba
情况gydF4y2Ba
说gydF4y2Ba
马可gydF4y2Ba
机器人无所作为或要求秩序gydF4y2Ba
标志gydF4y2Ba
马球gydF4y2Ba
服务员gydF4y2Ba
表达式gydF4y2Ba
λgydF4y2Ba
xgydF4y2Ba
。gydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
lgydF4y2Ba
_gydF4y2Ba
pgydF4y2Ba
ogydF4y2Ba
年代gydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
:gydF4y2Ba
一个gydF4y2Ba
,gydF4y2Ba
一个gydF4y2Ba
)gydF4y2Ba
λgydF4y2Ba
xgydF4y2Ba
一个gydF4y2Ba
。gydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
lgydF4y2Ba
pgydF4y2Ba
ogydF4y2Ba
年代gydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
:gydF4y2Ba
一个gydF4y2Ba
,gydF4y2Ba
一个gydF4y2Ba
)gydF4y2Ba
决议gydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
lgydF4y2Ba
_gydF4y2Ba
pgydF4y2Ba
ogydF4y2Ba
年代gydF4y2Ba
(gydF4y2Ba
pgydF4y2Ba
lgydF4y2Ba
一个gydF4y2Ba
ygydF4y2Ba
egydF4y2Ba
rgydF4y2Ba
,gydF4y2Ba
一个gydF4y2Ba
)gydF4y2Ba
rgydF4y2Ba
egydF4y2Ba
lgydF4y2Ba
pgydF4y2Ba
ogydF4y2Ba
年代gydF4y2Ba
(gydF4y2Ba
tgydF4y2Ba
一个gydF4y2Ba
bgydF4y2Ba
lgydF4y2Ba
egydF4y2Ba
,gydF4y2Ba
一个gydF4y2Ba
)gydF4y2Ba
解释gydF4y2Ba
球员和它的位置gydF4y2Ba
表顺序和客户交谈gydF4y2Ba
在的情况下gydF4y2Ba
后一个人gydF4y2Ba 任务,直到用户和地址的机器人已经失去了她或他,被解释为用户的响应和方向,它可以寻找它的用户;这是一个无约束的情况下电话的空间上下文是空的。没有上下文,机器人能够建立用户的相对位置。gydF4y2Ba
在的情况下gydF4y2Ba
将出席gydF4y2Ba 任务,交互的协议很标准。机器人叫学生的名字,她或他必须应对这些调用。这样的反应是解释为学生的存在及其相对位置。在这里,我们可以限制的呼声在机器人的前面。gydF4y2Ba
在的情况下gydF4y2Ba
在马可波罗gydF4y2Ba 任务,规则定义的上下文调用解释。这些规则指定,当机器人说gydF4y2Ba
马可gydF4y2Ba ,用户必须应对gydF4y2Ba
马球gydF4y2Ba ;此类反应的指数的相对位置可以解释为一个特定的球员,它可以直接机器人看起来在这个领域。这个任务也使用一个不受约束的调用。事实上,用户甚至不需要说gydF4y2Ba
马球gydF4y2Ba ,因为这个游戏的目的是,机器人“捕获”的一个单独用户通过声音;因此,任何声音的DOA可能被视为一个索引;这个DOA指用户。gydF4y2Ba
在的情况下gydF4y2Ba
服务员gydF4y2Ba 任务,定义的空间上下文是安排在餐厅的表。这个任务使用这个空间上下文来解释表要求机器人的注意。引发的约束DOA信息帮助识别调用表,并建立了其相对位置。任务使用简单版本和步行版本的DOA行为解决指标。此外,它使用问版本的DOA行为时的顺序。提供的信息要求机器人使用的版本是面对客户在把他们的订单和直接问的交互用户说话的时间。gydF4y2Ba
6.1。DOA行为任务的应用gydF4y2Ba
图gydF4y2Ba
11gydF4y2Ba 显示摘录对话模型gydF4y2Ba
后一个人gydF4y2Ba ,gydF4y2Ba
将出席gydF4y2Ba ,gydF4y2Ba
在马可波罗gydF4y2Ba 任务。鉴于DOA的行为,所提供的信息gydF4y2Ba
后一个人gydF4y2Ba 和gydF4y2Ba
在马可波罗gydF4y2Ba 不能识别用户的任务;就好像他或她只会说gydF4y2Ba
我在这里gydF4y2Ba 。机器人这种交互的反应不是语言,而是行动;在这两种情况下,结果电话的方向。如果一个错误检测的DOA,机器人将尝试恢复。在gydF4y2Ba
后一个人gydF4y2Ba 任务,跟踪的人会引发一个错误当没有人发现,它将为用户的电话又问。在gydF4y2Ba
在马可波罗gydF4y2Ba 任务,机器人会重复gydF4y2Ba
马可gydF4y2Ba ,等待答案,继续游戏。因为的性质gydF4y2Ba
点名gydF4y2Ba 任务,指数信号的解释一个特定的学生即使在一个未指定的上下文,因为机器人知道学生的名字被称为,和响应是由于他或她。就好像他或她就会回应道gydF4y2Ba
我X,我在这里gydF4y2Ba 。在这个任务中,机器人试图防止错误在DOA的位置和它检查如果有一个实际的人在那个方向,但它不是,它会叫学生的名字。gydF4y2Ba
图11gydF4y2Ba
在使用的DOA的行为gydF4y2Ba
后一个人gydF4y2Ba ,gydF4y2Ba
将出席gydF4y2Ba ,gydF4y2Ba
在马可波罗gydF4y2Ba 。gydF4y2Ba
图gydF4y2Ba
12gydF4y2Ba 显示了DOA的行为gydF4y2Ba
服务员gydF4y2Ba 的任务。这个任务使用的三个行为基于DOA的技能。首先,它使用DOA行为但定义上下文。索引的解释取决于空间上下文和它将定义表调用机器人。在这种情况下,就好像客户会说gydF4y2Ba
表X需要的东西gydF4y2Ba 。的任务,一个错误有较大的影响;如果机器人误方法表没有要求,它将提供的订单客户有可能拒绝或如果表是空的机器人将会离开。然而,真正想问订单的表可以叫机器人在步行,这样当机器人是完成了错误的表,它将正确的方法。在这些运动,行走任务使用DOA的行为。最后,当到达一个表问订单,任务使用问DOA的行为,如果一个以上的索引返回响应,它会让客户知道只有一个用户应该是一次谈话。如果DOAs的检测错误发生在这部分的任务,它将创建一个机器人的混乱局面将面临客户不存在;然而,如果没有客户的答案,机器人将假定“鬼”客户端不希望任何东西,并将继续与其他接受订单和交付。gydF4y2Ba
图12gydF4y2Ba
在使用的DOA的行为gydF4y2Ba
服务员gydF4y2Ba 的任务。gydF4y2Ba
6.2。历史的演示和评估任务gydF4y2Ba
的gydF4y2Ba
后一个人gydF4y2Ba ,gydF4y2Ba
马可波罗,gydF4y2Ba 和gydF4y2Ba
服务员gydF4y2Ba 任务已经在我们实验室重复证明了公众和RoboCup@Home竞争(gydF4y2Ba
45gydF4y2Ba ,gydF4y2Ba
46gydF4y2Ba ]。这些示威活动的经验在比赛中是积极的。在2012年,gydF4y2Ba
后一个人gydF4y2Ba 任务是在德国公开竞争,演示允许团队获得第三名,并在墨西哥的比赛机器人国家竞争,机器人获得了第一名。在2013年,gydF4y2Ba
服务员gydF4y2Ba 任务提出了世界杯赛的第一阶段比赛中,荣获创新奖的@联盟。此外,同年,示威的机器人和另一个机器人玩马可波罗未遂但技术问题阻碍了执行演示在竞争,但它成功地向公众进行。在所有这些情况下,我们观察到一个积极的集成声音定位在人类和机器人之间的交互。特别是,gydF4y2Ba
服务员gydF4y2Ba 任务已经广泛评估(gydF4y2Ba
42gydF4y2Ba ]。这个评价是与最终用户(30)被要求订货的机器人。gydF4y2Ba
60gydF4y2Ba
%gydF4y2Ba
没有经验的用户与服务机器人。我们发现,当要求订单,客户反复称为距离(gydF4y2Ba
One hundred.gydF4y2Ba
%gydF4y2Ba
)和完全完成任务(gydF4y2Ba
90年gydF4y2Ba
%gydF4y2Ba
)。尽管并不是常见的两个用户同时交谈(gydF4y2Ba
40gydF4y2Ba
%gydF4y2Ba
),当他们做,机器人能够直接的交互。gydF4y2Ba
在的情况下gydF4y2Ba
将出席gydF4y2Ba 为期三周的任务,这是编程的学生暑期实习。学生以前没有认识我们的开发框架。在实习期间,他们学会了框架,发展理念,实现机器人。其他四个小组的学生发展其他四个不同的任务。的技能作为一个元素的抽象SitLog语言使它相对容易直接实现任务和达到一个适当的性能在短时间跨度。gydF4y2Ba
7所示。讨论gydF4y2Ba
在这项工作中,我们提出了利用声源的方向到达指数。在许多人机交互任务,对象的位置是至关重要的执行任务,例如,失去一个人而他或她。在这个角度看,DOAs是二等公民,因为他们不提供一个位置,但方向。然而,治疗DOAs等指标允许机器人链接对象的方向在空间环境中导致的正确解释和延续的任务,猜测,失去的是一个方向。这种考虑允许建模要求在远处一个机器人是一个可取的方式与交互式代理进行交互。为了证明这个概念,我们实现的一组行为取决于DOAs被解释为指标和测试他们在四个任务:一个人后,类的出勤率,玩马可波罗,作为一个服务员在餐馆。gydF4y2Ba
空间上下文,或缺乏,定义方面的交互类型的任务。当没有可用空间上下文,例如当马可波罗,任何索引被机器人作为一种可能的参与者。然而,当一个空间上下文定义,例如,在一家餐馆参加表,可以跟踪多个用户。还可以有一个mixed-initiative互动的机器人等待电话,而不是访问每个表和问他们想要的任何东西。DOAs的indexicality允许机器人反应用户并继续交互的方向,不一定是在相同的模式:gydF4y2Ba
马可波罗,gydF4y2Ba 机器人移动的方向指数;在gydF4y2Ba
将出席gydF4y2Ba 和gydF4y2Ba
后一个人gydF4y2Ba 任务,机器人通过视觉方法确认了用户的存在的方向指数;在gydF4y2Ba
服务员gydF4y2Ba 任务,机器人面临对应索引的表。这些交互作用的三种可能的方面当使用索引的DOAs (mixed-initiative,多用户和多通道)的一个例子是丰富的使用电话在远处的交互。gydF4y2Ba
此外,我们表明,DOA补充言语互动行为。特别是,知道有不止一个人说当机器人听是一个好迹象,交互可能不是很好。索引的信息,机器人可以控制和直接的交互通过要求每个用户说一次,防止错误的沟通。gydF4y2Ba
以来我们能够实现这些任务multiple-DOA估计系统是光和强劲的四声音来源。然而,这个系统和其他机器人系统强加一些限制交互。对于一个人后,它只能跟一个人近距离(1米);在出席的情况下,学生必须一致;在我们的测试中,有三个学生;玩的马可波罗和等待表、用户、球员和表,必须在一个5米的比例。在所有这些情况下,扬声器的最大数量可能是四个。然而,在这种情况下,系统的性能是最贫穷和有影响的交互;我们的评估显示,一个用户对马可波罗和两个用户表在服务员的情况下实现良好的性能。在这一点上,另一个主要问题是劫持的可能性的关注机器人。 This is related to the fact that when the spatial context is not defined, the robot automatically interprets the DOA as its target. This is exemplified with the Marco-Polo game. At the moment, our implementation of the task takes advantage of this situation and an index is interpreted as a possible user which becomes the target to approach. However, this situation can provoke the fact that the robot switches targets constantly rather than targeting one which might be a better strategy to win the game. In order to account for this situation, we have identified that the DOA behaviour could be complemented with a speaker verification stage in which the identity of who is responding with
马球gydF4y2Ba 将得到证实。这个补充持续我们的建议,因为它变成了一个额外的约束称为对象。其他任务也可以利用这一点,因此验证的一部分gydF4y2Ba
后一个人gydF4y2Ba ,gydF4y2Ba
将出席gydF4y2Ba ,gydF4y2Ba
服务员gydF4y2Ba 任务。在未来,我们将探讨补充DOA与验证和其行为后果的交互。gydF4y2Ba
相互竞争的利益gydF4y2Ba
作者宣称没有利益冲突有关的出版。gydF4y2Ba
确认gydF4y2Ba
作者感谢CONACYT通过项目81965年和178673年的支持,通过项目IN107513 PAPIIT-UNAM,通过项目picco12 ICYTDF - 024。gydF4y2Ba
[
]1gydF4y2Ba
皮尔斯gydF4y2Ba
C。gydF4y2Ba
豪斯gydF4y2Ba
N。gydF4y2Ba
KloeselgydF4y2Ba
C。gydF4y2Ba
基本皮尔斯:选择哲学著作gydF4y2Ba
1992年gydF4y2Ba
1gydF4y2Ba
印第安纳大学出版社gydF4y2Ba
必要的皮尔斯gydF4y2Ba
[
]2gydF4y2Ba
皮尔斯gydF4y2Ba
C。gydF4y2Ba
豪斯gydF4y2Ba
N。gydF4y2Ba
KloeselgydF4y2Ba
C。gydF4y2Ba
项目gydF4y2Ba
p E。gydF4y2Ba
基本皮尔斯:选择哲学著作gydF4y2Ba
1998年gydF4y2Ba
2gydF4y2Ba
印第安纳大学出版社gydF4y2Ba
必要的皮尔斯gydF4y2Ba
[
]3gydF4y2Ba
皮内gydF4y2Ba
l。gydF4y2Ba
萨利纳斯gydF4y2Ba
lgydF4y2Ba
面向社会gydF4y2Ba
i V。gydF4y2Ba
RascongydF4y2Ba
C。gydF4y2Ba
富恩特斯gydF4y2Ba
G。gydF4y2Ba
坐日志:服务机器人任务的编程语言gydF4y2Ba
国际先进的机器人系统杂志》上gydF4y2Ba
2013年gydF4y2Ba
10gydF4y2Ba
1gydF4y2Ba
12gydF4y2Ba
10.5772/56906gydF4y2Ba
2 - s2.0 - 84887842411gydF4y2Ba
[
]4gydF4y2Ba
皮内gydF4y2Ba
lgydF4y2Ba
RodrguezgydF4y2Ba
一个。gydF4y2Ba
富恩特斯gydF4y2Ba
G。gydF4y2Ba
RascngydF4y2Ba
C。gydF4y2Ba
面向社会gydF4y2Ba
我。gydF4y2Ba
服务机器人的概念和功能结构gydF4y2Ba
国际先进的机器人系统杂志》上gydF4y2Ba
2015年gydF4y2Ba
6gydF4y2Ba
1gydF4y2Ba
15gydF4y2Ba
10.5772/60026gydF4y2Ba
[
]5gydF4y2Ba
RascongydF4y2Ba
C。gydF4y2Ba
皮内gydF4y2Ba
lgydF4y2Ba
金gydF4y2Ba
h·K。gydF4y2Ba
AogydF4y2Ba
机票的。gydF4y2Ba
AmouzegargydF4y2Ba
m·A。gydF4y2Ba
RiegergydF4y2Ba
B . B。gydF4y2Ba
多个direction-of-arrival估计与小型移动机器人平台的硬件设置gydF4y2Ba
IAENG交易工程技术gydF4y2Ba
2014年gydF4y2Ba
247年gydF4y2Ba
荷兰阿姆斯特丹gydF4y2Ba
施普林格gydF4y2Ba
209年gydF4y2Ba
223年gydF4y2Ba
课堂讲稿电气工程gydF4y2Ba
10.1007 / 978 - 94 - 007 - 6818 - 5 - _16gydF4y2Ba
[
]6gydF4y2Ba
ArgentierigydF4y2Ba
年代。gydF4y2Ba
PortellogydF4y2Ba
一个。gydF4y2Ba
伯纳德gydF4y2Ba
M。gydF4y2Ba
丹麦人gydF4y2Ba
P。gydF4y2Ba
气体gydF4y2Ba
B。gydF4y2Ba
双耳系统机器人gydF4y2Ba
双耳听力的技术gydF4y2Ba
2013年gydF4y2Ba
柏林,德国gydF4y2Ba
施普林格gydF4y2Ba
225年gydF4y2Ba
253年gydF4y2Ba
[
]7gydF4y2Ba
OkunogydF4y2Ba
h·G。gydF4y2Ba
NakadaigydF4y2Ba
K。gydF4y2Ba
机器人听觉:中国的崛起和观点gydF4y2Ba
《IEEE国际会议音响、演讲和信号处理(ICASSP 15)gydF4y2Ba
2015年4月gydF4y2Ba
南布里斯班,澳大利亚gydF4y2Ba
5610年gydF4y2Ba
5614年gydF4y2Ba
10.1109 / ICASSP.2015.7179045gydF4y2Ba
[
]8gydF4y2Ba
ArgentierigydF4y2Ba
年代。gydF4y2Ba
丹麦人gydF4y2Ba
P。gydF4y2Ba
SoueresgydF4y2Ba
P。gydF4y2Ba
一项调查在机器人声源定位:从双耳阵列处理方法gydF4y2Ba
电脑语音和语言gydF4y2Ba
2015年gydF4y2Ba
34gydF4y2Ba
1gydF4y2Ba
87年gydF4y2Ba
112年gydF4y2Ba
10.1016 / j.csl.2015.03.003gydF4y2Ba
2 - s2.0 - 84938092272gydF4y2Ba
[
]9gydF4y2Ba
布鲁克斯gydF4y2Ba
r。gydF4y2Ba
BreazealgydF4y2Ba
C。gydF4y2Ba
MarjanovićgydF4y2Ba
M。gydF4y2Ba
ScassellatigydF4y2Ba
B。gydF4y2Ba
威廉姆森gydF4y2Ba
M . M。gydF4y2Ba
齿轮项目:建立一个人形机器人gydF4y2Ba
计算隐喻、类比和代理gydF4y2Ba
1999年gydF4y2Ba
1562年gydF4y2Ba
柏林,德国gydF4y2Ba
施普林格gydF4y2Ba
52gydF4y2Ba
87年gydF4y2Ba
在计算机科学的课堂讲稿gydF4y2Ba
10.1007 / 3 - 540 - 48834 - 0 - _5gydF4y2Ba
[
]10gydF4y2Ba
北野gydF4y2Ba
H。gydF4y2Ba
OkunogydF4y2Ba
h·G。gydF4y2Ba
NakadaigydF4y2Ba
K。gydF4y2Ba
SabischgydF4y2Ba
T。gydF4y2Ba
松井秀喜gydF4y2Ba
T。gydF4y2Ba
设计和架构的团体人形:一个实验平台,综合感知机器人世界杯赛人形的挑战gydF4y2Ba
1gydF4y2Ba
《IEEE / RSJ智能机器人和系统国际会议(——' 00)gydF4y2Ba
2000年gydF4y2Ba
高松,日本gydF4y2Ba
IEEEgydF4y2Ba
181年gydF4y2Ba
190年gydF4y2Ba
10.1109 / IROS.2000.894602gydF4y2Ba
[
]11gydF4y2Ba
米肖德gydF4y2Ba
F。gydF4y2Ba
象牙海岸gydF4y2Ba
C。gydF4y2Ba
一起时gydF4y2Ba
D。gydF4y2Ba
但是gydF4y2Ba
Y。gydF4y2Ba
华菱gydF4y2Ba
人类。gydF4y2Ba
德里gydF4y2Ba
E。gydF4y2Ba
RaievskygydF4y2Ba
C。gydF4y2Ba
PonchongydF4y2Ba
一个。gydF4y2Ba
MoisangydF4y2Ba
P。gydF4y2Ba
理gydF4y2Ba
P。gydF4y2Ba
莫林gydF4y2Ba
Y。gydF4y2Ba
盖格农gydF4y2Ba
F。gydF4y2Ba
GigueregydF4y2Ba
P。gydF4y2Ba
面粉糊gydF4y2Ba
M.-A。gydF4y2Ba
卡洛gydF4y2Ba
年代。gydF4y2Ba
FrenettegydF4y2Ba
P。gydF4y2Ba
KabanzagydF4y2Ba
F。gydF4y2Ba
斯巴达克斯党参加2005年AAAI会议gydF4y2Ba
自主机器人gydF4y2Ba
2007年gydF4y2Ba
22gydF4y2Ba
4gydF4y2Ba
369年gydF4y2Ba
383年gydF4y2Ba
10.1007 / s10514 - 006 - 9014 - 7gydF4y2Ba
2 - s2.0 - 33947509526gydF4y2Ba
[
]12gydF4y2Ba
华菱gydF4y2Ba
人类。gydF4y2Ba
山本gydF4y2Ba
年代。gydF4y2Ba
RouatgydF4y2Ba
J。gydF4y2Ba
米肖德gydF4y2Ba
F。gydF4y2Ba
NakadaigydF4y2Ba
K。gydF4y2Ba
OkunogydF4y2Ba
h·G。gydF4y2Ba
健壮的移动机器人识别同步的语音gydF4y2Ba
IEEE机器人gydF4y2Ba
2007年gydF4y2Ba
23gydF4y2Ba
4gydF4y2Ba
742年gydF4y2Ba
752年gydF4y2Ba
10.1109 / TRO.2007.900612gydF4y2Ba
2 - s2.0 - 34548176123gydF4y2Ba
[
]13gydF4y2Ba
HaragydF4y2Ba
我。gydF4y2Ba
浅野gydF4y2Ba
F。gydF4y2Ba
AsohgydF4y2Ba
H。gydF4y2Ba
OgatagydF4y2Ba
J。gydF4y2Ba
IchimuragydF4y2Ba
N。gydF4y2Ba
卡瓦依gydF4y2Ba
Y。gydF4y2Ba
KanehirogydF4y2Ba
F。gydF4y2Ba
HirukawagydF4y2Ba
H。gydF4y2Ba
山本gydF4y2Ba
K。gydF4y2Ba
强大的语音界面基于音频和视频信息为人形HRP-2融合gydF4y2Ba
3gydF4y2Ba
《IEEE / RSJ智能机器人和系统国际会议(——“04)gydF4y2Ba
2004年9 ~ 10月gydF4y2Ba
2404年gydF4y2Ba
2410年gydF4y2Ba
10.1109 / IROS.2004.1389768gydF4y2Ba
[
]14gydF4y2Ba
穆雷gydF4y2Ba
j . C。gydF4y2Ba
欧文gydF4y2Ba
h·R。gydF4y2Ba
WermtergydF4y2Ba
年代。gydF4y2Ba
机器人声源定位架构使用互相关和复发性神经网络gydF4y2Ba
神经网络gydF4y2Ba
2009年gydF4y2Ba
22gydF4y2Ba
2gydF4y2Ba
173年gydF4y2Ba
189年gydF4y2Ba
10.1016 / j.neunet.2009.01.013gydF4y2Ba
2 - s2.0 - 61749088969gydF4y2Ba
[
]15gydF4y2Ba
金gydF4y2Ba
》。gydF4y2Ba
崔gydF4y2Ba
js。gydF4y2Ba
金gydF4y2Ba
M。gydF4y2Ba
在真实环境中人机交互通过视听一体化gydF4y2Ba
国际期刊的控制、自动化和系统gydF4y2Ba
2007年gydF4y2Ba
5gydF4y2Ba
1gydF4y2Ba
61年gydF4y2Ba
69年gydF4y2Ba
2 - s2.0 - 33846702321gydF4y2Ba
[
]16gydF4y2Ba
公园gydF4y2Ba
在公元前。gydF4y2Ba
禁止gydF4y2Ba
K.-D。gydF4y2Ba
夸克gydF4y2Ba
K.-C。gydF4y2Ba
尹gydF4y2Ba
H.-S。gydF4y2Ba
声源定位基于视听信息智能服务机器人gydF4y2Ba
学报》第八届国际研讨会上先进的智能系统(伊希斯' 07)gydF4y2Ba
2007年gydF4y2Ba
Sokcho、韩国gydF4y2Ba
364年gydF4y2Ba
367年gydF4y2Ba
[
]17gydF4y2Ba
BadaligydF4y2Ba
一个。gydF4y2Ba
华菱gydF4y2Ba
人类。gydF4y2Ba
米肖德gydF4y2Ba
F。gydF4y2Ba
AarabigydF4y2Ba
P。gydF4y2Ba
评估实时音频定位算法在机器人人工试镜gydF4y2Ba
《IEEE / RSJ智能机器人和系统国际会议(——' 09)gydF4y2Ba
2009年10月gydF4y2Ba
美国圣路易斯,小姐gydF4y2Ba
2033年gydF4y2Ba
2038年gydF4y2Ba
10.1109 / iros.2009.5354308gydF4y2Ba
2 - s2.0 - 76249121092gydF4y2Ba
[
]18gydF4y2Ba
BohusgydF4y2Ba
D。gydF4y2Ba
霍维茨gydF4y2Ba
E。gydF4y2Ba
促进多方对话框与目光、手势和演讲gydF4y2Ba
学报》国际会议多通道多通道交互的接口和车间的机器学习(ICMI-MLMI 10)gydF4y2Ba
2010年11月gydF4y2Ba
中国,北京gydF4y2Ba
5:1gydF4y2Ba
8gydF4y2Ba
10.1145/1891903.1891910gydF4y2Ba
[
]19gydF4y2Ba
NakadaigydF4y2Ba
K。gydF4y2Ba
OkunogydF4y2Ba
h·G。gydF4y2Ba
北野gydF4y2Ba
H。gydF4y2Ba
实时对机器人声源定位和分离试镜gydF4y2Ba
《IEEE国际会议上口头语言处理(ICSLP ' 02)gydF4y2Ba
2002年9月gydF4y2Ba
美国科罗拉多州丹佛gydF4y2Ba
193年gydF4y2Ba
196年gydF4y2Ba
[
]20.gydF4y2Ba
TrifagydF4y2Ba
诉M。gydF4y2Ba
KoenegydF4y2Ba
一个。gydF4y2Ba
MorengydF4y2Ba
J。gydF4y2Ba
程gydF4y2Ba
G。gydF4y2Ba
实时声音源定位在嘈杂的环境中机器人多通道交互gydF4y2Ba
学报》第16届IEEE国际会议上机器人和人类互动交流(RO-MAN ' 07)gydF4y2Ba
2007年8月gydF4y2Ba
393年gydF4y2Ba
398年gydF4y2Ba
10.1109 / roman.2007.4415116gydF4y2Ba
2 - s2.0 - 48749105042gydF4y2Ba
[
]21gydF4y2Ba
TraftongydF4y2Ba
j·G。gydF4y2Ba
BugajskagydF4y2Ba
m D。gydF4y2Ba
FransengydF4y2Ba
b R。gydF4y2Ba
RatwanigydF4y2Ba
r·M。gydF4y2Ba
将视觉和听觉认知架构中跟踪谈话gydF4y2Ba
学报》第三届ACM和IEEE国际会议上人机交互(HRI ' 08)gydF4y2Ba
2008年3月gydF4y2Ba
ACMgydF4y2Ba
201年gydF4y2Ba
208年gydF4y2Ba
10.1145/1349822.1349849gydF4y2Ba
2 - s2.0 - 57749099744gydF4y2Ba
[
]22gydF4y2Ba
TeachasrisaksakulgydF4y2Ba
K。gydF4y2Ba
Iemcha-OdgydF4y2Ba
N。gydF4y2Ba
ThiemjarusgydF4y2Ba
年代。gydF4y2Ba
PolprasertgydF4y2Ba
C。gydF4y2Ba
说话人跟踪模块室内机器人导航gydF4y2Ba
学报》第九届国际会议上电气工程/电子、计算机、通信和信息技术(ECTI-CON 12)gydF4y2Ba
2012年5月gydF4y2Ba
1gydF4y2Ba
4gydF4y2Ba
10.1109 / ecticon.2012.6254160gydF4y2Ba
2 - s2.0 - 84866749186gydF4y2Ba
[
]23gydF4y2Ba
李gydF4y2Ba
X。gydF4y2Ba
盛ydF4y2Ba
M。gydF4y2Ba
王gydF4y2Ba
W。gydF4y2Ba
刘gydF4y2Ba
H。gydF4y2Ba
实时声源定位的移动机器人基于引导spectral-temporal位置的方法gydF4y2Ba
国际先进的机器人系统杂志》上gydF4y2Ba
2012年gydF4y2Ba
9日,第78条gydF4y2Ba
10.5772/51307gydF4y2Ba
2 - s2.0 - 84868128837gydF4y2Ba
[
]24gydF4y2Ba
FransengydF4y2Ba
B。gydF4y2Ba
MorariugydF4y2Ba
V。gydF4y2Ba
马丁森gydF4y2Ba
E。gydF4y2Ba
BlisardgydF4y2Ba
年代。gydF4y2Ba
玛姬gydF4y2Ba
M。gydF4y2Ba
托马斯。gydF4y2Ba
年代。gydF4y2Ba
舒尔茨gydF4y2Ba
一个。gydF4y2Ba
PerzanowskigydF4y2Ba
D。gydF4y2Ba
使用视觉、声学和自然语言歧义gydF4y2Ba
ACM和IEEE国际会议的程序人机交互((HRI ' 07)gydF4y2Ba
2007年3月gydF4y2Ba
美国弗吉尼亚州阿灵顿gydF4y2Ba
73年gydF4y2Ba
80年gydF4y2Ba
10.1145/1228716.1228727gydF4y2Ba
[
]25gydF4y2Ba
NakadaigydF4y2Ba
K。gydF4y2Ba
山本gydF4y2Ba
年代。gydF4y2Ba
OkunogydF4y2Ba
h·G。gydF4y2Ba
只是gydF4y2Ba
H。gydF4y2Ba
长谷川gydF4y2Ba
Y。gydF4y2Ba
TsujinogydF4y2Ba
H。gydF4y2Ba
一个机器人剪刀声音游戏的裁判gydF4y2Ba
诉讼的IEEE机器人与自动化国际会议上08年举行(“国际机器人与自动化会议”)gydF4y2Ba
2008年5月gydF4y2Ba
加利福尼亚州帕萨迪纳市,美国gydF4y2Ba
IEEEgydF4y2Ba
3469年gydF4y2Ba
3474年gydF4y2Ba
10.1109 / robot.2008.4543741gydF4y2Ba
2 - s2.0 - 51649115852gydF4y2Ba
[
]26gydF4y2Ba
NishimutagydF4y2Ba
我。gydF4y2Ba
ItoyamagydF4y2Ba
K。gydF4y2Ba
吉井gydF4y2Ba
K。gydF4y2Ba
OkunogydF4y2Ba
h·G。gydF4y2Ba
向quizmaster机器人基于语音的多方互动gydF4y2Ba
先进的机器人gydF4y2Ba
2015年gydF4y2Ba
29日gydF4y2Ba
18gydF4y2Ba
1205年gydF4y2Ba
1219年gydF4y2Ba
10.1080 / 01691864.2015.1079504gydF4y2Ba
2 - s2.0 - 84942866828gydF4y2Ba
[
]27gydF4y2Ba
做gydF4y2Ba
h . M。gydF4y2Ba
盛gydF4y2Ba
W。gydF4y2Ba
刘gydF4y2Ba
M。gydF4y2Ba
一个开放的平台的家庭服务机器人听觉感知gydF4y2Ba
《IEEE / RSJ智能机器人和系统国际会议(——“15)gydF4y2Ba
2015年9 ~ 10月gydF4y2Ba
德国汉堡gydF4y2Ba
IEEEgydF4y2Ba
6161年gydF4y2Ba
6166年gydF4y2Ba
10.1109 / iros.2015.7354255gydF4y2Ba
[
]28gydF4y2Ba
布鲁克斯gydF4y2Ba
a·G。gydF4y2Ba
BreazealgydF4y2Ba
C。gydF4y2Ba
使用机器人和对象:回顾直证的参考实现空间的共同点gydF4y2Ba
学报第一ACM SIGCHI / SIGART人机交互会议(HRI 06年)gydF4y2Ba
2006年3月gydF4y2Ba
美国犹他盐湖城gydF4y2Ba
297年gydF4y2Ba
304年gydF4y2Ba
10.1145/1121241.1121292gydF4y2Ba
[
]29日gydF4y2Ba
SugiyamagydF4y2Ba
O。gydF4y2Ba
神田gydF4y2Ba
T。gydF4y2Ba
ImaigydF4y2Ba
M。gydF4y2Ba
石黑浩gydF4y2Ba
H。gydF4y2Ba
HagitagydF4y2Ba
N。gydF4y2Ba
自然直证的交互模型gydF4y2Ba
在社会机器人人机交互gydF4y2Ba
2012年gydF4y2Ba
104年gydF4y2Ba
[
]30.gydF4y2Ba
OkunogydF4y2Ba
h·G。gydF4y2Ba
NakadaigydF4y2Ba
K。gydF4y2Ba
HidaigydF4y2Ba
K.-I。gydF4y2Ba
沟口健二gydF4y2Ba
H。gydF4y2Ba
北野gydF4y2Ba
H。gydF4y2Ba
人机语言交互授权通过听觉和视觉multiple-talker实时跟踪gydF4y2Ba
先进的机器人gydF4y2Ba
2003年gydF4y2Ba
17gydF4y2Ba
2gydF4y2Ba
115年gydF4y2Ba
130年gydF4y2Ba
10.1163 / 156855303321165088gydF4y2Ba
2 - s2.0 - 0037219742gydF4y2Ba
[
]31日gydF4y2Ba
特金gydF4y2Ba
一个。gydF4y2Ba
ZaltagydF4y2Ba
e . N。gydF4y2Ba
皮尔斯的符号理论gydF4y2Ba
斯坦福哲学百科全书gydF4y2Ba
2013年gydF4y2Ba
[
]32gydF4y2Ba
卡普兰gydF4y2Ba
D。gydF4y2Ba
科尔gydF4y2Ba
P。gydF4y2Ba
DthatgydF4y2Ba
语法和语义gydF4y2Ba
1978年gydF4y2Ba
9gydF4y2Ba
纽约,纽约,美国gydF4y2Ba
学术出版社gydF4y2Ba
221年gydF4y2Ba
243年gydF4y2Ba
[
]33gydF4y2Ba
皮内gydF4y2Ba
lgydF4y2Ba
加尔萨gydF4y2Ba
G。gydF4y2Ba
多通道引用解析模型gydF4y2Ba
计算语言学gydF4y2Ba
2000年gydF4y2Ba
26gydF4y2Ba
2gydF4y2Ba
139年gydF4y2Ba
193年gydF4y2Ba
10.1162 / 089120100561665gydF4y2Ba
2 - s2.0 - 0039847641gydF4y2Ba
[
]34gydF4y2Ba
MitkovgydF4y2Ba
R。gydF4y2Ba
用来解决gydF4y2Ba
2002年gydF4y2Ba
134年gydF4y2Ba
英国伦敦gydF4y2Ba
朗文gydF4y2Ba
[
]35gydF4y2Ba
TetreaultgydF4y2Ba
j . R。gydF4y2Ba
基于语料库的评价定心和代词的决议gydF4y2Ba
计算语言学gydF4y2Ba
2001年gydF4y2Ba
27gydF4y2Ba
4gydF4y2Ba
507年gydF4y2Ba
520年gydF4y2Ba
10.1162 / 089120101753342644gydF4y2Ba
2 - s2.0 - 0039299874gydF4y2Ba
[
]36gydF4y2Ba
NggydF4y2Ba
V。gydF4y2Ba
羊毛衫,gydF4y2Ba
C。gydF4y2Ba
提高机器学习方法算法gydF4y2Ba
美国40对计算语言学协会年度会议gydF4y2Ba
2002年gydF4y2Ba
计算语言学协会gydF4y2Ba
104年gydF4y2Ba
111年gydF4y2Ba
[
]37gydF4y2Ba
布鲁克斯gydF4y2Ba
r。gydF4y2Ba
VanLehngydF4y2Ba
K。gydF4y2Ba
如何构建完整的生物,而不是孤立的认知模拟器gydF4y2Ba
架构情报gydF4y2Ba
1991年gydF4y2Ba
225年gydF4y2Ba
239年gydF4y2Ba
[
]38gydF4y2Ba
BonassogydF4y2Ba
r P。gydF4y2Ba
FirbygydF4y2Ba
r . J。gydF4y2Ba
手枪gydF4y2Ba
E。gydF4y2Ba
KortenkampgydF4y2Ba
D。gydF4y2Ba
米勒gydF4y2Ba
d . P。gydF4y2Ba
松弛gydF4y2Ba
m·G。gydF4y2Ba
经历一个智能架构,活性代理gydF4y2Ba
实验和理论人工智能杂志》上gydF4y2Ba
1997年gydF4y2Ba
9gydF4y2Ba
2 - 3gydF4y2Ba
237年gydF4y2Ba
256年gydF4y2Ba
10.1080 / 095281397147103gydF4y2Ba
2 - s2.0 - 0031524077gydF4y2Ba
[
]39gydF4y2Ba
皮内gydF4y2Ba
l。gydF4y2Ba
面向社会gydF4y2Ba
我。gydF4y2Ba
铁砧gydF4y2Ba
H . H。gydF4y2Ba
GershensongydF4y2Ba
C。gydF4y2Ba
RascongydF4y2Ba
C。gydF4y2Ba
阿尔瓦拉多gydF4y2Ba
M。gydF4y2Ba
萨利纳斯gydF4y2Ba
lgydF4y2Ba
IOCA: interaction-oriented认知体系结构gydF4y2Ba
研究计算机科学gydF4y2Ba
2011年gydF4y2Ba
54gydF4y2Ba
273年gydF4y2Ba
284年gydF4y2Ba
[
]40gydF4y2Ba
面向社会gydF4y2Ba
我。gydF4y2Ba
RascongydF4y2Ba
C。gydF4y2Ba
皮内gydF4y2Ba
l。gydF4y2Ba
实用语音识别更符合实际的服务机器人gydF4y2Ba
先进的软计算及其应用:12日墨西哥人工智能国际会议上,MICAI 2013年,墨西哥城,墨西哥,2013年11月能力,程序,第二部分gydF4y2Ba
2013年gydF4y2Ba
8266年gydF4y2Ba
柏林,德国gydF4y2Ba
施普林格gydF4y2Ba
423年gydF4y2Ba
434年gydF4y2Ba
在计算机科学的课堂讲稿gydF4y2Ba
10.1007 / 978 - 3 - 642 - 45111 - 9 - _37gydF4y2Ba
[
]41gydF4y2Ba
皮内gydF4y2Ba
lgydF4y2Ba
GolmegydF4y2Ba
G。gydF4y2Ba
Grupo傀儡:robocup@homegydF4y2Ba
《机器人世界杯赛gydF4y2Ba
2013年6月gydF4y2Ba
荷兰埃因霍温gydF4y2Ba
“机器人足球世界杯”联盟gydF4y2Ba
8gydF4y2Ba
[
]42gydF4y2Ba
RascongydF4y2Ba
C。gydF4y2Ba
面向社会gydF4y2Ba
我。gydF4y2Ba
富恩特斯gydF4y2Ba
G。gydF4y2Ba
萨利纳斯gydF4y2Ba
lgydF4y2Ba
皮内gydF4y2Ba
l。gydF4y2Ba
整合multi-doa估计人机交互功能gydF4y2Ba
国际先进的机器人系统杂志》上gydF4y2Ba
2015年gydF4y2Ba
12gydF4y2Ba
8gydF4y2Ba
10.5772/59993gydF4y2Ba
[
]43gydF4y2Ba
RascongydF4y2Ba
C。gydF4y2Ba
富恩特斯gydF4y2Ba
G。gydF4y2Ba
面向社会gydF4y2Ba
我。gydF4y2Ba
轻量级multi-DOA跟踪移动语音来源gydF4y2Ba
EURASIP杂志在音频、语音和音乐的处理gydF4y2Ba
2015年gydF4y2Ba
2015年gydF4y2Ba
1gydF4y2Ba
1gydF4y2Ba
16gydF4y2Ba
10.1186 / s13636 - 015 - 0055 - 8gydF4y2Ba
2 - s2.0 - 84929193376gydF4y2Ba
[
]44gydF4y2Ba
戴维斯gydF4y2Ba
P。gydF4y2Ba
杰克连接一个有声的世界,gydF4y2Ba
http://jackaudio.orggydF4y2Ba
[
]45gydF4y2Ba
van der ZantgydF4y2Ba
T。gydF4y2Ba
WisspeintnergydF4y2Ba
T。gydF4y2Ba
BredenfeldgydF4y2Ba
一个。gydF4y2Ba
JacoffgydF4y2Ba
一个。gydF4y2Ba
野田佳彦gydF4y2Ba
我。gydF4y2Ba
高桥gydF4y2Ba
Y。gydF4y2Ba
X:举办的新联盟的提议举办的现实世界gydF4y2Ba
“机器人足球世界杯”2005:第九机器人足球世界杯gydF4y2Ba
2006年gydF4y2Ba
4020年gydF4y2Ba
166年gydF4y2Ba
172年gydF4y2Ba
在计算机科学的课堂讲稿gydF4y2Ba
[
]46gydF4y2Ba
WisspeintnergydF4y2Ba
T。gydF4y2Ba
van der ZantgydF4y2Ba
T。gydF4y2Ba
IocchigydF4y2Ba
lgydF4y2Ba
希弗gydF4y2Ba
年代。gydF4y2Ba
RoboCup@Home:科学竞争对国内服务机器人和基准测试gydF4y2Ba
相互作用研究gydF4y2Ba
2009年gydF4y2Ba
10gydF4y2Ba
3gydF4y2Ba
392年gydF4y2Ba
426年gydF4y2Ba
10.1075 / is.10.3.06wisgydF4y2Ba
2 - s2.0 - 72649101700gydF4y2Ba