文摘

的“情报”,“意识”是状态或感知的能力,感觉,或注意的事件,对象,或感官模式:换句话说,意识到周围的环境及其相互作用。灵感来自于早期人类技能发展,特别是早期意识成熟,本文的搭讪机器人智能从不同的偏导演注意结合“认知”和“知觉”的能力。在这样一个斜面,机(机器人)精明的基础上构建了一个多层次认知概念试图处理复杂的人工行为。复杂的行为意向对象的自主发现机器人探索一个未知的环境:换句话说,满嘴的机器人自主意识和对未知的背景。

1。介绍和问题陈述

“认知”一词指的是信息处理的应用知识的能力。如果“认知”这个词已经并将继续被使用在很多不同的语境下,在计算机科学领域,通常将人工智力活动和流程相关的知识的“机器学习”,成就“智能”人工功能。然而,“知识工程”的认知过程(在更一般的“智能”)需要对周围环境和“意识”,因此,感知信息的能力来与周围的环境进行交互。所以,如果“认知”和“知觉”仍然是分不开的成分对机器智能,从而对机器(机器人等)自治,“意识”技巧是一个关键在达到上述的自治权。

现代机器人技术涉及的大部分作品相关,特别是人形机器人,是相关的,他们要么担心控制器控制不同的这样的机器设备的设计(1,2]或集中导航方面的机器人(3- - - - - -5]。以同样的方式,主要的工作处理类似人类的一部分,或更普遍而言聪明,行为,已经连接抽象的任务,那些有关推理推理,交互式推理机制,等等。(6- - - - - -10]。灵感来自于早期人类技能发展(11- - - - - -15),尤其是人类早期走(16- - - - - -19),目前的工作的搭讪机器人智能从不同的偏指导注意“机器意识”的出现从“认知”和“知觉”特征。需要注意的是,无论是工作还是其相关问题(概念、体系结构、技术或算法)假装是“人造”的复杂的自然(如生物、心理等)发现的机制,指出,上述所提及或被作者和许多其他科学家在上述领域的作品并非本文中引用。在[20.安徒生写了关于人工神经网络:”它不是绝对必要相信神经网络模型与神经系统,但它有帮助。因为,如果他们这样做,我们能使用大量的想法,实验,从认知科学和神经科学和事实设计、构建和测试网络。否则,我们将不得不显示功能和智能行为的机制没有任何成功操作的例子”。同样,这些自然机制帮助我们寻找合理的类比的模型和复杂的认知机制。

结合认知和感知能力,机器(机器人)精明的基础上构造了两种功能:“无意识认知功能”(佛罗里达)和“有意识的认知功能”(ccf)。我们确定ucf的活动属于“本能”的认知水平处理反射能力。旁边这个,我们区分ccf功能属于“故意”认知水平处理熟虑的能力。两种以上的功能是作为一个多层次认知概念的基础上试图处理复杂的人工行为(21]。复杂的行为意向对象的自主发现机器人探索一个未知的环境。本文不会详细列出motion-related方面被广泛提出,分析,讨论和验证(在不同的例子)(21]。它将专注于知觉技能和意识出现。关于知觉技能,它是发达的基础上,人工视觉和“凸”对象检测。本文将中心这一最重要的技能和展示上述概念的故意认知水平可以用来提供一种人工感知技能。“运动知觉的概念已经应用在设计——“基于仿人机器人的控制体系结构。设计控制体系结构利用视觉意图让机器人人工意识对其周围环境。

纸被组织在五部分。下一节简要介绍了多层次认知概念。部分3描述了认知功能的总体结构,描述了建议运动知觉控制策略。部分4介绍了视觉集团意图。验证的结果,从实现真正的像人的机器人,在这一节中。最后,最后一部分总结了纸。

2。多层次认知概念的简要概述

这个概念的框架内,我们考虑一个过程(主要是一个复杂的过程)multimodel结构涉及组件(模型),构造由于机器学习(ML),处理两类操作水平:反射和故意的21]。这意味着毫升中发挥核心作用和相关技术这个概念和体系结构。根据所提到的介绍性的部分,两种功能,所谓的佛罗里达和ccf,建立功能元素的复杂任务或复杂的行为。图1说明了欧盟拟议的认知概念图。从这个图中,值得注意的是在整体架构提出的概念,是通过建立认知层(水平)对应于不同的技能加工复杂的任务。相关提醒,以及ucf ccf附上的“基本功能”(EFs)。在这样一个计划,一个认知层可以实现一种技能独立于其他层(通常,无意识的认知水平的情况下)或使用一个或多个人才开发的其他层(典型,有意识的认知水平)(21]。

概念化的第一个关键优势在这样一个倾斜的问题是分离机器人的造型复杂的人工行为类型的机器人。换句话说,模型建立在这样概念化可用于造型同样的复杂行为不同的机器人。类比的例子(相似性)与自然认知机制可以在早期发现人类行走的发展。事实上,在其全球成就,早期人类能力发展不依赖于“宝贝。“第二个这样一个概念的主要好处是,发布了人工结构是基于“机器学习”模式(人工神经网络、模糊逻辑、强化学习等),利用“学习”能力和“泛化”倾向的方法。这提供了一个宝贵的潜在解决维数高、非线性、本体或感受外界刺激的信息和经验(属于以非思辩)。

3所示。从认知功能、运动知觉的架构

因为它上面所提到的,认知功能(UCF或CCF)是由一系列EFs。EF是定义为一个函数(上优于或传统)实现一个操作能力组合(必要)的技能通过相关的认知功能。英孚是由“基本组件”(ECs)。EC是最低水平组件(模块,传递函数等)实现一些基本能力贡献在EF运营资质。可以定义两种类型的ECs(确认):第一个相应的基本动作,我们称之为“行动基本组件”(AEC)和相对应的第二个基本决策,我们称之为“决策基本组件”(12月)。一个英孚可能包括一个或两种上述定义EC。在相同的方式,认知功能可能包括一个或多个ECs。图2给出了总体结构的认知功能。然而,相关的注意到有任何限制,当它是必要的,一个电子商务可以扮演一个英孚。同样的,在必要的时候,一个认知功能可能包括只有一个英孚。

假设一个给定的认知功能包括(无论是有意识的还是无意识的) ( ,在那里 代表“自然数集合)初等函数,考虑到 th EF ( )构成的认知功能,我们定义以下符号。 是输入的 th EF: ,在那里 代表的输入组件 th EC英孚, , 这个英孚的总数基本组件构成。 的输出是 EF。 的输出是什么 th EC的 th英孚, , 的总数基本组件组成 EF。 执行的技能吗 EF。 是函数(转换等)由吗 原子能委员会。 是决定(匹配、规则等)由12月完成。

在上述定义符号的输出 th EF是形式化的所示(1), (2)。在一般情况下,输出的电子商务也取决于一些内部(特定的)参数特定EC (21]:

基于上述认知概念,机器人的控制方案可以考虑帧内的“运动知觉——”(MP)的基础架构。因此,以及机器人运动的感知环境结合UCF和CCF获得。机器人左右达到结合无意识和有意识的认知运动功能(UCMFs CCMFs, resp)。同样的,本质上是基于视觉、机器人感知能力是构建结合无意识和有意识的认知视觉功能(UCVFs CCVFs, resp)。图3显示了这样的一个机器人MP-based认知控制方案。是相关的注意,提出控制方案利用一些普遍性、概念化的累积和机器人运动知觉能力独立于类型的机器人。也强调提出相关链接建设知觉行为控制认知计划构建机器人的行动和感知数据和与环境的交互。这个斜看了机器人的方法(例如,机器人知识结构)对人类的学习方式和知识结构:人类或动物学习和构建知识与环境互动。换句话说,这些自然智能生物操作使用“意识”对他们周围的环境中生活。

如果人类如何学习的问题,表示和识别对象在各种各样的观看条件下仍然是一个巨大的挑战神经生理学和认知研究[22],许多作品相关的人类早期认知行走能力建设过程强调的关键机制。由[显示临床实验(如所示23),一个是强烈的视觉和运动之间的联系机制。这个观点认知MP-based方案的针对性建议。在这旁边,(24,25]表明,分开的塑造(例如,识别对象和关联的形状),我们(人类)看到世界通过把注意力转移到视觉重要的对象。这意味着视觉注意力机制中扮演的关键角色在人类婴儿学习遇到的对象。因此,它似乎适当汲取灵感从研究人类婴儿的视觉学习构建机器人感知的基础上学习的视觉启示。

做一个智能系统感知的环境演化和构造知识通过学习未知的对象出现在相关的环境使一个明确的需要出现的能力选择绝大流只感觉信息相关的。这个最重要的能力被称为“视觉特点,”有时被称为文献中“视觉注意力,”不可预测性,或惊喜。描述为一个感知质量,使图像的一部分相对于其它脱颖而出的形象和捕捉观察者的注意26]。它可能是广义是凸起(运动、颜色等),让“脱颖而出”从上下文相关的信息(27]。我们认为在这种情况下视觉特点可能有助于使无人监督的未知对象的提取和后续的学习机器,换句话说,满嘴的机器(机器人)意识对其环境。

指图的感知集团3视觉感知是由无意识的视觉层次包括包含CCVF UCVF和一个有意识的视觉层次。无意识的视觉水平处理反射性的视觉任务,即获得图像的预处理,突出物体检测,检测到显著的对象存储。如果预处理可以作为一个独立的UCVF出现,它也可能是一个英孚UCVFs组合之一的无意识的视觉层次。在这个第二种方式组织无意识的视觉层次,UCVF包括预处理任务将预处理的结果(与相关的图像分割,提取不同的特征,等等)以及其他UCVFs作曲无意识水平的意识水平的CCVFs需要上述结果,利用层间通道。有意识的视觉层次进行有意的视觉任务,即学习的对象(包括学习发现突出的对象),知识建设通过实施故意存储(在无意识的视觉层面)的新发现突出的对象,发现突出的对象识别机器人周围环境(那些已知(公认的突出对象)和视觉目标跟踪)允许机器人自我定位和运动所需的公认的突出对象。因此,意识水平通信(例如,提供有关CCVF)的输出与无意识的水平(例如,有关UCVF)以及无意识的运动和意识运动水平(例如,与欧盟MP-based机器人负责机器人运动的认知控制方案)。

4所示。从突出对象检测视觉意识

这部分是用来描述两个原则的认知视觉功能。第一小节将详细介绍主UCVF,叫做“突出的视觉,它允许机器人self-discover(自动检测)相关的对象在周围的环境中。,第二小节将拼出的核心CCVFs之一,被称为“视觉的意图,”提供了机器人人工视觉能力和允许其意图构造了解周围环境中机器人意识对于周边环境。

在描述上述函数之前,相关的注意,反复操作中提取视觉显著对象(图片)是图像分割。一般来说,人们可以使用任何可用的图像分割技术。然而,分割的质量可能是一个准确的提取中突出的物体图像。事实上,大多数常见的分割技术(使用在标准图像突出对象提取技术)使用手动或自动阈值仍然有限,因为他们不尊重原始图像特征。这就是为什么我们利用最近提出的算法(28]。它是基于K - means聚类的彩色空间的自适应选择K和空间滤波器去除无意义的片段。使用算法非常快(几十毫秒 像素图像标准PC)和结果宣称已经接近人类的感知。执行速度是一个主要的条件在机器人应用程序有效实施加固我们的选择可用的算法,使正直的执行速度和实现之间的分割质量。

4.1。突出视觉UCVF和突出的对象检测

欧盟图详细的结构“突出视觉”UCVF图给出4。从这个数字,因为它是可见的,“突出视觉”UCVF还包括预处理阶段(定义为它的一个构成EFs),这意味着这个UCVC处理图像分割和常见的图像特征的提取任务,交付结果发布其他UCVFs以及有意识的视觉层次。旁边这个英孚,它包括三个英孚:“视觉注意力参数估计量的EF (VAPE)的“特色建筑”(证监会)EF,和“突出对象提取”(SOE) EF。最后EF扮演的角色决定基本组件,实现为一个独立的EF。

以下4.4.1。视觉注意力参数估计初等函数

视觉注意力的参数估计(VAPE)初等函数决定了可以吸收某种“视觉注意力的程度。“预处理集团发行的基础上计算的结果和控制当地特色,视觉注意力参数 构造一个自上而下的控制注意力和在尺度空间特征的敏感性。高价值的 (导致一个大的滑动窗口大小)对图像尺寸会使当地的卓越特性对大对象更敏感。同样,低的值 允许视觉注意力集中在较小的对象和细节。视觉注意力参数的值 可以坚决的固定值基于启发式根据(29日]。然而,正如不同的图像通常呈现显著的对象在不同的尺度,这样做会限制系统的性能。因此,一个新的自动认知参数的估计 设计了。估计为基础,一方面,在计算(启发从工作了30.])段大小从输入图像的直方图,另一方面,使用人工神经网络(ANN)。安收到(输入)发出上述直方图特征向量并提供滑动窗口的值。神经网络的权重调整使用遗传算法在训练阶段。

获得上述柱状图,划分为输入图像 。发现的每一个部分 ( ),它的大小 (以像素)的数量除以整体形象的大小 一个绝对的直方图 段的大小是根据构造(2),避免导致过于稀疏的直方图。这可以确保第一个直方图本包含段的数量与面积大于图像大小的1/10,第二个包含段从1/10到1/100的图像大小,等等。出于实际的原因,我们使用4-bin直方图。然后,这绝对直方图导致相对直方图 计算根据关系(3):

提出了视觉注意力的核心参数估计量是一个完全连接的三层前馈MLP-like安,与一个s形的激活函数,包括4个输入节点,1 3隐藏神经元,神经元的输出。四个输入节点连接到各自的本的 直方图。输出节点的值,属于连续区间 可以解释为估计滑动窗口大小的比值 和图像的长边尺寸。安是利用遗传算法训练中描述(31日]。人口由一个基因组中每个生物代表数组长度对应的浮点数和权重的数量在中长期规划。计算每个生物的健康,向MLP权重设置根据其当前的基因组。一次视觉注意力参数 是可用的(根据延时输出)在图像上计算特点,提取显著对象。结果是与地面真理和精度相比,召回和F比率(表示提取的总体质量)计算(根据(32)和使用所提出的措施在同一工作定量评价突出对象提取)。的F然后使用比率作为衡量健康的标准。在每一代中,精英主义规则用于显式保存到目前为止发现的最佳解决方案。生物变异的5%的概率。作为学习的数据集,我们使用10%的MSRA-B数据集(中描述32])。剩余的90%的说明数据集已被用于验证。

4.1.2。特色建筑初等函数

特色建设(证监会)初等函数执行两种特性(包括用于突出对象检测)。第一种是全球卓越的特性和第二局部显著特征。全球卓越特性捕捉全球图像的颜色分布的性质。获得全球卓越结合强度特点”和“彩色凸起。“强度显著 由关系(4),被定义为欧氏距离的强度 的意思是整个图像。指数 代表图像的强度通道 平均强度的通道。同样,彩色凸起,由(6)关系,给出的定义是欧几里得距离方位和天顶组件的强度(例如,方位 和天顶 、职责)他们的手段( resp。)在整个图像。术语 表示给定像素的图像的坐标:

全球卓越的地图 由关系(5)是一个混合的结果结合地图导致(1根据物流乙状结肠混合函数)。混合的两个凸起的地图是由色彩饱和度的函数 每个像素。它从RGB颜色模型计算每个像素pseudonorm,给出的 。当 低,强度显著得到了重视。当 高,彩色特点是强调:

全球卓越(和相关功能)抓住了视觉显著的颜色。但是,在现实情况下,对象的视觉特点也可能由特定的形状或纹理,不同的环境,或者旁边而不是简单的颜色。捕捉这方面的视觉特点,当地的特性在图像确定。灵感来自一个类似的功能介绍(32),当地的特点被定义为一个centre-surround直方图的区别。相关的当地特点的想法是经过整个形象和比较一个滑动窗口的内容与其所处的环境来确定相似的两人。如果相似度很低,或许是一个滑动窗口内的凸区域的迹象。

形式化这个想法主要局部显著特征,让我们有一个滑动窗口 的大小 ,集中在像素 。定义一个直方图(中心) 像素的强度。然后,让我们定义一个直方图(周围) 在一个窗口强度的柱状图 周围 的方式的面积 。centre-surround特性 然后给出(6对所有直方图箱) :

结果的计算 在所有的 , , 频道,centre-surround凸起 在一个给定的位置 根据定义(7)。类似于(5),一个物流乙状结肠混合函数被用来结合色度和强度,以提高这一特性的性能与混合消色差和彩色图像的内容。然而,这里的色彩饱和度 是指平均饱和度的滑动窗口的内容 :

4.1.3。突出的对象提取初等函数

突出对象提取(SOE)初等函数作为最后一步的显著图的计算和突出的对象检测。提取的全球和本地特色(例如, 、职责)结合使用(8),导致最后的显著图 ,然后通过高斯滤波器平滑。上部的条件(8)描述一个特定的情况下,图像由一个颜色的一部分不被认为是凸(即。,像素较低 测量),但这是不同于环境由于其形状。最后显著地图样本的列d图所示5:

相应的分割和检测算法中描述(30.,33),上色的分割将图像分为一组连贯的地区。对象出现在现场是由一个或多个这样的片段。视觉显著对象,凸起的段形成他们应该覆盖地区地图整体高凸起,而视觉重要对象和背景应该有这个标准相对较低。顺从地(33),因此,输入图像划分为连接像素的子集或段 。发现的每一个部分 ( ),其平均凸起 和方差的显著值) 在最后计算显著地图吗 。所有的像素值 然后设置段后(9), 分别为平均特点及其方差阈值。结果是一个二进制映射包含一组连接组件 由相邻段 评价(9)作为二进制值“1”。去除噪声,对任何成员条件 它的面积大于给定的阈值。最后,原始图像的二进制映射投影导致的结果是(地区)的一部分包含其显著对象的原始图像。参考文献(33,34)给不同的上述参数的值和阈值:

5展示了全球和本地的例子从两幅图像中提取显著特性。第一形象全球显著特征(上图像列b)是足够的跟踪的对象,虽然第二,突出对象(豹)的部分可用,彩色特点提取对象是不够的。数据67显示的例子突出对象检测以及视觉注意力的影响参数 分别在提取显著区域。

4.2。视觉CCVF意图

此前一直表示,由有意识的认知视觉功能(CCVFs),有意识的视觉层次进行有意的视觉任务。这个层次的核心功能之一是“视觉意图”CCVF,满嘴的机器人的“人工视觉意图能力”,让机器构造首次了解周围的环境。图8给欧盟虚幻图CCVF意图。从这个图中,可以看到这个CCVF由四个基本功能:“短期凸物体视觉记忆”(SSVM) EF,“无监督学习模块”(乌尔姆)EF,“突出对象分类器”(SOC) EF,和“对象探测器”(OD) EF。

短期显著对象的主要任务视觉记忆(SSVM) EF是提供已知对象和存储目前公认或检测到显著对象。它也可以被视为第一个知识建筑周围的环境,因为它包含显著对象的集群产生的无监督学习。它的内容(例如,存储突出对象或凸组对象)可提供主要的知识库(长期记忆)。这就是为什么它的输出也是连接到层间通道。

无监督学习的角色(由乌尔姆EF)是集群检测(新)显著对象。学习过程进行。当一个代理(例如,机器人)图像虽然遇到一个新对象,如果对象是公认的突出(例如,提取)他们分组逐步而获得新的图像。学习过程的操作流程如下所示。在第一次,该算法将每个片段,发现,在第二次,学习过程是更新(网上学习)收购 法师提取 片段通过突出对象探测器 每个片段F如果(F是分为一组)填充group by F如果分为多个组(F)填充的F组通过欧式距离最近的特性如果(F不是任何群体分类)创建一个新组并将F选择 最密集的G组使用 片段G作为学习样本对象检测算法

突出对象分类器是四个弱分类器的组合 ,每一个片段分类属于或不属于某个类。 表示当前处理的片段 表示问题的一个实例。第一个分类器 ,定义为(10),分离碎片与不同区域。在实验中 。的 ,定义为(11),分离片段太不同的方面属于同一个对象。在实验中, 已经设置为0.3。分类器 ,定义为(12),分离碎片显然不同的色度。它工作在2 d的归一化直方图 组件用 分别与 垃圾箱,计算他们的交集。我们使用 避免过于稀疏的直方图, 等于0.35。最后, (定义为(13)分离片段的结构也不同。我们使用纹理均匀性的测量计算 通道的片段。 ,在那里 归一化的直方图 通道的片段 是直方图箱的数量。在实验中,32个直方图箱子被用来避免过于稀疏的直方图和价值 0.02。一个片段属于一个类 :

4.3。实现真正的机器人和实验验证

上述概念已经NAO机器人上实现的,其中包括视觉设备和机载preimplemented运动技能。它还包括一些基本没有使用标准函数。实验验证,该机器人在实际环境中引入了不同的共同对象(代表不同的表面,形状和属性)。几个对象暴露在机器人的视野,提出了许多环境中使用不同的学习阶段。获得的图像的数量为每个对象不同的100年和600年之间学习序列和测试序列,在50到300多个对象发生在相同的场景。在学习过程中,取得了96%的成功率有关相关的学习对象(例如,那些机器人确认凸然后学),也就是说,只有4%的图像碎片与错误的群体。在测试过程中,对象被正确地提取成功率达到82%。

为了演示系统的实时能力,NAO机器人需要在它的环境中找到一些学习对象,然后跟踪他们。强调,这些对象是相关已经学会了在不同的环境中。样品的实验结果如图912。数据910显示结果有关机器人的能力检测和提取显著对象从周围的环境。注意到多个突出的对象是相关的检测实施战略的能力代表不同的形状和不同的性质。图11显示预期的机器人能够检测并遵循一个简单的对象在现实环境中,验证正确的无意识的操作和故意认知水平转换完成所需的任务。最后,图12显示了机器人能力检测、隔离和遵循之前发现和学习突出的对象在一个复杂的周边环境。这个实验的视频可以看到使用链接在这个数字的传说。强调的是相关的对象(一个“书”在实验中显示的图12)已经被检测到,并学会了在不同条件(从说明可以看到这个视频)。因此,这个实验展示了一种机器人的出现“人工意识”对周围环境验证了认知多级概念和发行“perception-motion”架构。

5。结论

由取代机器人的建模复杂的行为从“控制理论”的背景下“认知机器学习”背景,提出machine-learning-based多层次认知运动知觉的概念试图提供一个统一的模型的机器人自主进化,插在两种认知水平:“无意识”和“意识”的认知水平,负责其反射和有意的视觉和运动技能,分别。

概念化的第一个关键优势在这些斜坡的问题是分离的累积机器人感知和运动类型的机器(机器人)。第二个概念的主要好处是,发行结构是“基于机器学习——“基金会利用从“学习”能力和“泛化”倾向的模型。

“视觉意图”内置CCVF提供了机器人人工视觉能力和意图使其构造了解周围的环境。这种故意认知功能机器人意识对于周边环境。提取的知识首先是存储在短期记忆(回忆)。它可以存储在长期记忆中机器人的一些学习知识发布之前(已经)探索环境或已知对象在一个新的环境。除这吸引人的能力,无意识的视觉层面实现凸物体检测中扮演着重要角色在所谓的“人工意识”出现。事实上,自动检测的能力相关的项目周边环境提供了机器人的“无意识意识”对潜在重大物体周围的环境。这个关键技能的重要性不仅出现在“故意意识”的出现也在建设新知识(与已经学会了项目)升级机器人(或机器)意识对其周围的环境。