1。介绍gydF4y2Ba
了解快速接触视觉刺激(脸,对象)影响分类决定皮质神经元网络是必不可少的理解之间的关系隐神经信息编码和明确的行为分析。定量心理物理和生理实验证据支持这个理论的视觉信息处理在皮层可以建模为一个层次结构的日益复杂,稀疏编码表示,在视觉通路(gydF4y2Ba
1gydF4y2Ba ),使用脉冲编码,作为信息传递的基本手段,是最优的信息传输。如此飙升层次结构应该有独特的能力的decorrelating传入的视觉信号,去除冗余信息,同时保留不变,为了最大化信息增益(gydF4y2Ba
2gydF4y2Ba ]。因此,沿着层次结构描述和建模功能,从外侧膝状体核等早期或中期(LGN),或'视觉皮层(V1),是更高层次的系统研究必要的步骤,更全面的目标识别等任务。然而,详细的功能分析仍然是不切实际的,由于小定量的工作已经完成探索建模整个视觉皮质系统有选择地放大重要功能促进歧视,无论从计算智能的角度还是从neuroinformatics角度判断,使认知的想法综合分析一个有吸引力的但难以达到的目标。gydF4y2Ba
传统方法解决这个问题通过创建一个计算网络类似的基本视觉系统信息处理层次结构模型。开创性的尝试包括Neocognitron由福岛(gydF4y2Ba
3gydF4y2Ba ),处理信息率神经单位处理变换不变的特性,紧随其后的是一群功能相似模型的出现,如勒存提出的分级机和Bengio [gydF4y2Ba
4gydF4y2Ba ,gydF4y2Ba
5gydF4y2Ba ),自底向上的模型机制Ullman et al。gydF4y2Ba
6gydF4y2Ba ,gydF4y2Ba
7gydF4y2Ba 由wers和Korner[],或模型gydF4y2Ba
8gydF4y2Ba ]。这一趋势后来跟着明显层次认知模型的方法在gydF4y2Ba
9gydF4y2Ba ),使用分级层类似于neocognition,处理单元根据softmax (MAX-like)操作。结合使模型适用于初始模拟cortex-like机制。这种生物动机层次方法进一步仔细分析了Serre等人在一些真实的数据集(gydF4y2Ba
10gydF4y2Ba ,gydF4y2Ba
11gydF4y2Ba ),产生类似的性能与基准算法。一起,可以得出一个结论,传统观点描述信息编码的组件,如频率、强度和方向,这是视觉信息的估计。这个角度看更侧重于性能和响应的皮质神经系统,而不是它的功能目的。因此,尽管出版物集中在这个方向是大型明快和读者被称为下一节详细调查这一趋势,然而,很少的工作试图探索认知机制使用生物启发计算单位。gydF4y2Ba
相比之下,最近从神经生物学证据使研究人员构建cortex-like方案建立模型与单神经元飙升作为计算单位(大多数皮质生理学家认为,大多数神经元皮层飙升),所谓的神经网络(SNNs)飙升。从第一个成功的飙升神经元模型,Hodgkin-Huxley的模型(gydF4y2Ba
12gydF4y2Ba ),随后几个原型已经被提出,如integrate-and-fire模型(如果模型)(gydF4y2Ba
13gydF4y2Ba ),一个最简单但最有效的模型描述神经元的动态,及其扩展,峰值响应模型(srm) [gydF4y2Ba
13gydF4y2Ba ),液体状态机(LSM) (gydF4y2Ba
13gydF4y2Ba ),和Izhikevich模型(gydF4y2Ba
14gydF4y2Ba ]。作为一个神经生物学的似是而非的框架,SNNs已显示出巨大的计算能力,在理论上和实验上都由几个值得注意的作品。索普等人提出了一个三层前馈网络(SpikeNet)使用一个快速如果神经元(gydF4y2Ba
15gydF4y2Ba ,gydF4y2Ba
16gydF4y2Ba ]。基于事件驱动的计算,SpikeNet报道成功的实时跟踪和识别人脸不增加计算负担。Wysoski et al。gydF4y2Ba
17gydF4y2Ba ,gydF4y2Ba
18gydF4y2Ba 激增)引入了一个神经网络框架,如果模型和Hebbian学习规则,这是一个四层前馈神经元组成的层次结构分为两个神经元的地图。整个系统已经成功地证实与VidTimit数据集使用面部识别个人信息。这些解决方案试图解决识别问题,代表复杂对象为简单关心取向或空间频率特性,为了确保不变性对规模和转换。然而,由于相关活动和稀疏编码原则皮质神经元组(经常省略了许多模型),动态的网络不能充分反映个人和孤立的神经元。理解和包含高阶相关性神经元群体的功能作用是必要的,但很少有作品集中具有挑战性的任务。gydF4y2Ba
出于SNN和层次模型的潜力,我们解决这个问题的神经编码和神经计算,这里我们提出一个多层前馈,integrate-and-fire神经元组成的层次网络模型,该模型能成功地探测、分析和识别感兴趣的对象。解码定位,定位位置,减少相关和推断类别的对象是由后续,日益复杂的网络水平。原理的证明,我们实现了一个原型模型和集中在作证时其性能在一个独特的类别objects-human面部expressions-a视觉表现人类情感的一种范式对于理解层次处理腹侧神经的次数。神经生物学基质的人类情感,如恐惧、愤怒或厌恶一直是一个有吸引力的目标,因为情绪是封装比其他的心理状态。面部表情,独特的人类情感的体现和表现,是最直接的方法之一,人们协调,沟通情感和其他心理,社会和生理信号。作为结果,他们往往认为是揭示心理后果的捷径和机制认知的情感调制(gydF4y2Ba
19gydF4y2Ba ]。因此,面部表情研究的进步直接反映了更广泛的进步情感分析。gydF4y2Ba
一般来说,这种层次结构应用到面部表情识别不是一个新奇的想法。Dailey等人已经提出了一个简单而精致的原型叫做EMPATH [gydF4y2Ba
20.gydF4y2Ba 十年前,EMPATH实际上是一个生物的神经网络分类模型的面部表情。作为一个标准的三层前馈网络由,EMPATH执行像伽柏在第一级过滤器,然后提取视觉信息表示送到第二层进行降维,和PCA应用网络图像压缩,最后,决策的输出层(完形层)分为六种基本情绪。作者展示了模型的潜在的数据集通过使用一个简单的面部表情,进一步分析后的模型已经应用(gydF4y2Ba
21gydF4y2Ba )与不同的面部表情JAFFE等数据集,产生令人满意的结果。然而,应该注意的是,传统的线性分析模型(如PCA)提出了人工,高斯像刺激可以完全被二阶相关性将遭受偏见的结果作为自然图像(或面临捕获变体照明或嵌入在复杂背景下外,如视频安全监控任务)统计数据往往是高度nonGaussian,这可能会限制其进一步的应用。因此,捕捉这些高阶统计技术,形成高效的视觉信息表示可能被视为一种自然的解决方案。gydF4y2Ba
虽然我们有着类似的动机之前作者(gydF4y2Ba
16gydF4y2Ba ,gydF4y2Ba
17gydF4y2Ba ),我们的方法是非常不同的。我们的论文是两个主要贡献。首先,我们开发一种新型的框架,生物模拟视觉通路的操作方案,强调视觉皮层的稀疏和效率,具体来说,高阶相关性处理行业。第二,我们展示了如何将系统应用于实际模式识别面部表情识别等任务。一些面部表情数据证明使用该方法,包括正面视图nonfrontal视图和视图照明变体。虽然充分意识到这种尝试是一个简单的近似的大脑如何真正的神经回路真正操作,我们仍然获得令人满意的结果。gydF4y2Ba
最初的框架和一些实证实验结果已经出现在会议论文(gydF4y2Ba
22gydF4y2Ba ),在这里,我们进行以下修改。gydF4y2Ba
(1)gydF4y2Ba
仔细审视整个框架和做出全面、明确的描述。gydF4y2Ba
(2)gydF4y2Ba
其他一些实验结果。gydF4y2Ba
(3)gydF4y2Ba
清单详细讨论模型的缺点和优势,并给出了未来可能的改进方向。gydF4y2Ba
本文的其余部分组织如下。部分gydF4y2Ba
2gydF4y2Ba 回顾了基本的视觉系统和当前状态的艺术的僧侣的cortex-like机制模型。部分gydF4y2Ba
3gydF4y2Ba 评论飙升神经元模型的基础,其次是我们的建议框架,动力学,结构和学习机制,讨论了细节。几个实验结果部分所示gydF4y2Ba
5gydF4y2Ba 。我们还提供了一些讨论和总结,部分gydF4y2Ba
6gydF4y2Ba 最后一部分总结道。gydF4y2Ba
2。视觉系统和皮层模型:当前状态的艺术gydF4y2Ba
本节的由两个大的部分,我们开始我们的故事简要回顾视觉系统的基本原理,然后探讨当前提出相应的方法和方法。详细的利弊进行了讨论。我们特别讨论了计算单元,用于后期。gydF4y2Ba
2.1。视觉系统:基础知识gydF4y2Ba
从视网膜到视觉皮层,大脑中的神经回路,构成我们的认知行为进化以惊人的效率,非常适合处理视觉信息的能力的计算,和沟通的奇迹gydF4y2Ba
1gydF4y2Ba ]。许多现有的方法在计算神经科学是基于生理观察认知任务执行从简单到复杂,层次结构。'视觉皮层的普遍接受的标准模型简要综述如下。gydF4y2Ba
(1)gydF4y2Ba
视觉处理是一个前馈,从低到高水平的层次结构。早期视觉系统创建表示连续的阶段在视觉通路,从视网膜、外侧膝状体核(LGN) V1,体贴的数据压缩率没有明显的信息损失(gydF4y2Ba
23gydF4y2Ba ]。gydF4y2Ba
(2)gydF4y2Ba
神经元在V1可以大致分为两类,简单的和复杂的,基于空间分离或重叠的光明与黑暗刺激的反应,以及酒吧和正弦光栅。面向简单细胞接受字段(RFs)包含的条件每一个专门应对光发作/黑暗抵消(条件)或黑暗的开始/光抵消(条件)。复杂的细胞反应主要面向边缘和光栅,像简单的细胞,然而,他们有一个空间不变性程度(gydF4y2Ba
17gydF4y2Ba ]。gydF4y2Ba
(3)gydF4y2Ba
视觉皮层主要由两种途径(gydF4y2Ba
11gydF4y2Ba ,gydF4y2Ba
12gydF4y2Ba ,gydF4y2Ba
23gydF4y2Ba ,gydF4y2Ba
24gydF4y2Ba ]:腹侧流和背流,前者是主要参与对象的识别和发现后/下大脑的一部分,而后者与对象的定位和主要发现后/优越的大脑的一部分。gydF4y2Ba
(4)gydF4y2Ba
从neurocomputing角度来看,神经元相互沟通通过发送电子脉冲编码称为动作电位或峰值。巴洛(gydF4y2Ba
2gydF4y2Ba )认可的重要性信息理论在这种情况下,假设的有效编码视觉信息可以作为一个基本约束神经处理。这一假设认为,一群神经元编码信息应该尽可能的简洁,以最有效地利用可用的计算资源。gydF4y2Ba
(5)gydF4y2Ba
有效编码假设将自然成两个不同但是相关的语句。一个关于个人神经反应的统计数据和第二关于稀疏的神经反应。不同神经元的反应自然环境应该是相互统计独立的,因此,每个神经元不应该携带的信息冗余,由他人。这也符合这个概念视觉系统力求一个场景分解为统计独立选民。成功的理论模型包括独立分量分析(ICA) [gydF4y2Ba
25gydF4y2Ba )和稀疏编码(gydF4y2Ba
9gydF4y2Ba ,gydF4y2Ba
26gydF4y2Ba ,gydF4y2Ba
27gydF4y2Ba ]。gydF4y2Ba
2.2。视觉层次模型:状态的艺术gydF4y2Ba
有上述的理论组件带来了什么类人脑过程的仿真领域的模式识别和分类决策为目的的吗?许多模型的后果是新兴的信息处理几个方面类似的视觉系统。先锋生物尝试包括著名的neocognitron的启发,提出了福岛和宅一生gydF4y2Ba
3gydF4y2Ba ),处理信息率神经单元,和勒存et al。gydF4y2Ba
4gydF4y2Ba ,gydF4y2Ba
5gydF4y2Ba ),Ullman et al。gydF4y2Ba
6gydF4y2Ba ,gydF4y2Ba
7gydF4y2Ba ),韦斯和刚gydF4y2Ba
8gydF4y2Ba ),所有这些模型已被证明后定性约束的解剖学和生理学的视觉皮层,实际上可能不适合实际的计算机视觉系统。因此,更全面的,通用的,高级计算框架是必需的,这样可以实现快速、准确的对象识别通过总结和整合大量的数据从不同层次的理解,同时保持稀疏和discriminativeness之间的权衡,以及获得足够的不变性健壮的性能。gydF4y2Ba
最近,一个认知模型初始化Riesenhuber et al。gydF4y2Ba
9gydF4y2Ba ,gydF4y2Ba
10gydF4y2Ba ),使用分级层类似于neocognition,并根据MAX-like处理单元操作,收到相当大的浓度。模型的核心是腹侧的主要功能流的假设可以被视为一种机制进化实现选择性之间的权衡和不变性的快速和准确的对象感兴趣的识别任务,是通过一个基础层次结构不变性增加(从视网膜到)对象的表象(旋转、尺度、位置等)gydF4y2Ba
1gydF4y2Ba
。模型产生的相对位置和规模不变的对象识别的功能。gydF4y2Ba
生物动力层次方法进一步仔细分析了Serre等人在几个真实的数据集(gydF4y2Ba
10gydF4y2Ba ),通过提取形状和纹理属性。分析包含不变性在求解多个对象的识别和识别复杂的视觉场景(如树叶、汽车、脸、飞机、摩托车)。方法比较性能与基准算法。有许多伟大的出版物集中在这个方向。详细调查报告我们参考读者小山和Serre最近的工作模型的视觉皮层(gydF4y2Ba
28gydF4y2Ba ]。gydF4y2Ba
2.3。讨论gydF4y2Ba
分层表示开始主宰认知心理学和神经科学在1960年代。然而,从计算的观点来看,层次模型可以被视为概念工具,而不是计算的意思。尽管共享逻辑结构的固有价值,缺乏计算单元的通信支持有时脆弱的系统的性能。如何结合的逻辑结构层次与计算单元体内应该考虑一个伟大的关注。这是我们的目标,因此,通过将人工神经元模型(计算单位)飙升到僧侣的模型,我们提出了一个新颖的认知框架,它可以应用到一些实践模式识别问题。飙升的基本原则提出了神经网络在接下来的部分。gydF4y2Ba
4所示。网络拓扑结构gydF4y2Ba
标准模型的视觉皮层(gydF4y2Ba
23gydF4y2Ba ),从感官/输入层到最后分类层,整个系统包括三个主要模块:gydF4y2Ba
(gydF4y2Ba
1gydF4y2Ba
)gydF4y2Ba
感觉/接受层,它由简单的细胞行为模拟器和复杂的细胞行为模拟,发现感觉输入和数据预处理,包括特征提取部分所有情况;所有这些子层包括兴奋性和抑制性神经元;gydF4y2Ba
(gydF4y2Ba
2gydF4y2Ba
)gydF4y2Ba
学习层,包括兴奋性神经元;gydF4y2Ba
(gydF4y2Ba
3gydF4y2Ba
)gydF4y2Ba
分类后,积累学习的所有输出层,整个系统见图gydF4y2Ba
1gydF4y2Ba 。整个系统见图gydF4y2Ba
2gydF4y2Ba 。注意,演示系统已经报道了好几会议论文等(gydF4y2Ba
22gydF4y2Ba ),因此我们只简要回顾如下为了保持结构的完整性。gydF4y2Ba
图1gydF4y2Ba
整个面部表情识别系统框架。从原始输入到最终的输出,包括每一层的插图,这表明,精挑细选的组合,determinativeness和不变性逐渐建立了几个阶段的面部信息处理。预处理部分包括面部区域的检测(眼、嘴等),光照归一化,视网膜水平还负责边缘检测器的高对比度增强图像。第二层次的功能像伽柏过滤器,将输出发送到知觉水平健壮的选择性和不变性特征提取,然后在分组和分类,类别水平给出了输出结果(颜色)最好的观点gydF4y2Ba
22gydF4y2Ba ]。gydF4y2Ba
图2gydF4y2Ba
两个行业的水平方案。第一级是典型的ICA提取过程,从底部到顶部,提取的成分逐渐汇集成小邻居,增加彼此间的交流(gydF4y2Ba
22gydF4y2Ba ]。gydF4y2Ba
4.1。预处理gydF4y2Ba
输入图像的预处理过程分为三个步骤:(1)人脸检测、眼睛和嘴的位置,(2)屏蔽,(3)照明正常化。前两个步骤提供规范化的人脸区域进行进一步的处理,和去除无关信息,如背景和头发,以及一些不必要的配件的一个主题。光照归一化是至关重要的,尽管人类视觉系统可以处理情感感觉极其复杂的环境,如光照变化几乎毫不费力,光照不变量处理,一般来说,通常是更加困难比前两个步骤。我们假设照明的效果gydF4y2Ba
2gydF4y2Ba
处理分别沿两条途径,一种方法是按照主腹路线(gydF4y2Ba
30.gydF4y2Ba ],照明效果将贴现在视网膜上,通常被视为预处理部分,以方便进一步的处理,另一种方式是照明和阴影信息的旁路途径是直接从视网膜到区域,它有助于认知场景的三维信息gydF4y2Ba
3gydF4y2Ba
。在我们的框架中,只考虑预处理的最主要途径。将讨论和解决照明问题的实验部分。gydF4y2Ba
4.2。从视网膜到V1gydF4y2Ba
第一层的神经元代表了视网膜细胞,作为边缘检测器,旨在提高给定图像的高对比度部分(高通滤波器),并且通常可以使用二维高斯函数的差异实现(狗),频率尺度在哪里选择不同的标准差gydF4y2Ba
σgydF4y2Ba
高斯曲线:gydF4y2Ba
(3)gydF4y2Ba
∇gydF4y2Ba
2gydF4y2Ba
GgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
,gydF4y2Ba
ygydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
ggydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
2gydF4y2Ba
+gydF4y2Ba
ygydF4y2Ba
2gydF4y2Ba
- - - - - -gydF4y2Ba
σgydF4y2Ba
2gydF4y2Ba
σgydF4y2Ba
4gydF4y2Ba
)gydF4y2Ba
egydF4y2Ba
- - - - - -gydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
2gydF4y2Ba
+gydF4y2Ba
ygydF4y2Ba
2gydF4y2Ba
/gydF4y2Ba
2gydF4y2Ba
σgydF4y2Ba
2gydF4y2Ba
)gydF4y2Ba
。gydF4y2Ba
在第二层模拟神经元接受字段(RFs) V1的简单细胞和复杂的细胞,可以被解释为伽柏小波函数。尤其是层是由八个为每个频率刻度定位地图,每一个被选择不同的方向(gydF4y2Ba
0gydF4y2Ba
°gydF4y2Ba
- - - - - -gydF4y2Ba
,gydF4y2Ba
45gydF4y2Ba
°gydF4y2Ba
- - - - - -gydF4y2Ba
,gydF4y2Ba
90年gydF4y2Ba
°gydF4y2Ba
,gydF4y2Ba
135年gydF4y2Ba
°gydF4y2Ba
,gydF4y2Ba
180年gydF4y2Ba
°gydF4y2Ba
,gydF4y2Ba
225年gydF4y2Ba
°gydF4y2Ba
- - - - - -gydF4y2Ba
,gydF4y2Ba
27gydF4y2Ba
°gydF4y2Ba
,gydF4y2Ba
315年gydF4y2Ba
°gydF4y2Ba
)[gydF4y2Ba
17gydF4y2Ba ]:gydF4y2Ba
(4)gydF4y2Ba
ψgydF4y2Ba
μgydF4y2Ba
,gydF4y2Ba
νgydF4y2Ba
(gydF4y2Ba
zgydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
∥gydF4y2Ba
kgydF4y2Ba
(gydF4y2Ba
μgydF4y2Ba
,gydF4y2Ba
νgydF4y2Ba
)gydF4y2Ba
∥gydF4y2Ba
2gydF4y2Ba
σgydF4y2Ba
2gydF4y2Ba
egydF4y2Ba
- - - - - -gydF4y2Ba
∥gydF4y2Ba
kgydF4y2Ba
μgydF4y2Ba
,gydF4y2Ba
νgydF4y2Ba
∥gydF4y2Ba
2gydF4y2Ba
∥gydF4y2Ba
zgydF4y2Ba
∥gydF4y2Ba
2gydF4y2Ba
/gydF4y2Ba
2gydF4y2Ba
σgydF4y2Ba
2gydF4y2Ba
(gydF4y2Ba
egydF4y2Ba
我gydF4y2Ba
kgydF4y2Ba
μgydF4y2Ba
,gydF4y2Ba
νgydF4y2Ba
zgydF4y2Ba
- - - - - -gydF4y2Ba
egydF4y2Ba
- - - - - -gydF4y2Ba
σgydF4y2Ba
2gydF4y2Ba
/gydF4y2Ba
2gydF4y2Ba
]gydF4y2Ba
,gydF4y2Ba
在哪里gydF4y2Ba
μgydF4y2Ba
,gydF4y2Ba
νgydF4y2Ba
定义伽柏内核的方向和规模,gydF4y2Ba
zgydF4y2Ba
=gydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
,gydF4y2Ba
ygydF4y2Ba
)gydF4y2Ba
,我们有gydF4y2Ba
kgydF4y2Ba
μgydF4y2Ba
,gydF4y2Ba
νgydF4y2Ba
=gydF4y2Ba
kgydF4y2Ba
vgydF4y2Ba
egydF4y2Ba
jgydF4y2Ba
ψgydF4y2Ba
ugydF4y2Ba
,在那里gydF4y2Ba
kgydF4y2Ba
vgydF4y2Ba
=gydF4y2Ba
kgydF4y2Ba
马克斯gydF4y2Ba
/gydF4y2Ba
fgydF4y2Ba
′′gydF4y2Ba
和gydF4y2Ba
ψgydF4y2Ba
ugydF4y2Ba
=gydF4y2Ba
πgydF4y2Ba
ugydF4y2Ba
/gydF4y2Ba
8gydF4y2Ba
。gydF4y2Ba
fgydF4y2Ba
是内核在频域之间的间距的因素。gydF4y2Ba
4.3。它从V1gydF4y2Ba
学习动力发生在更高的水平,伽柏高维度的特性使得降维技术(如PCA)需要得到一个更加稀疏的特征子集。最近的理论研究表明,接受类似细胞V1的字段可以学习(通过生物优化技术)基于几个复杂的学习原则,例如,效率和稀疏(gydF4y2Ba
22gydF4y2Ba ,gydF4y2Ba
24gydF4y2Ba ,gydF4y2Ba
26gydF4y2Ba )(减少的数量单位积极对任何输入),统计独立(gydF4y2Ba
31日gydF4y2Ba ]。ICA可以被视为一个合理的选择捕捉这些数据形成有效的自然图像表征,研究表明ICA可以帮助解释相关现象在皮层神经元,如反应抑制、对比增益控制和调优属性变更。在我们的框架中,地形ICAgydF4y2Ba
4gydF4y2Ba
应用于模仿这样的学习机制,为代表的优点的地形复杂的神经元的行为和解释复杂的细胞(gydF4y2Ba
25gydF4y2Ba ,gydF4y2Ba
32gydF4y2Ba ]。gydF4y2Ba
行业模型的计划中说明了整个系统的框架(见图gydF4y2Ba
2gydF4y2Ba ),它可以被视为一个生成模型和两个水平。经典的ICA模型用于第一级作为简单的特征提取器细胞V1,二级(复杂的细胞),2 d地形结构定义来描述组件之间的相关性在一个小社区。这可以通过一个社区功能gydF4y2Ba
hgydF4y2Ba
(gydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
jgydF4y2Ba
)gydF4y2Ba
表达之间的距离gydF4y2Ba
我gydF4y2Ba
th和gydF4y2Ba
jgydF4y2Ba
组件。一个简单的例子可以被定义为gydF4y2Ba
(5)gydF4y2Ba
hgydF4y2Ba
(gydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
jgydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
{gydF4y2Ba
1gydF4y2Ba
,gydF4y2Ba
(gydF4y2Ba
|gydF4y2Ba
dgydF4y2Ba
(gydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
- - - - - -gydF4y2Ba
dgydF4y2Ba
(gydF4y2Ba
jgydF4y2Ba
)gydF4y2Ba
|gydF4y2Ba
≤gydF4y2Ba
米gydF4y2Ba
)gydF4y2Ba
0gydF4y2Ba
,gydF4y2Ba
其他人gydF4y2Ba
。gydF4y2Ba
常数gydF4y2Ba
米gydF4y2Ba
这里定义了邻域的宽度,组件的社区与索引gydF4y2Ba
我gydF4y2Ba
由这些组件的指标范围gydF4y2Ba
我gydF4y2Ba
- - - - - -gydF4y2Ba
米gydF4y2Ba
,gydF4y2Ba
…gydF4y2Ba
,gydF4y2Ba
我gydF4y2Ba
+gydF4y2Ba
米gydF4y2Ba
。如果神经元之间的距离gydF4y2Ba
我gydF4y2Ba
和gydF4y2Ba
jgydF4y2Ba
小于一个预定义常量gydF4y2Ba
米gydF4y2Ba
,那么这两个神经元被定义为邻居,因此非线性相关。社区功能gydF4y2Ba
hgydF4y2Ba
(gydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
jgydF4y2Ba
)gydF4y2Ba
因此hyperparameters的矩阵。在本文中,我们认为它是已知的和固定。集gydF4y2Ba
GgydF4y2Ba
jgydF4y2Ba
(gydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
小邻居的价值gydF4y2Ba
jgydF4y2Ba
,我们有gydF4y2Ba
(6)gydF4y2Ba
GgydF4y2Ba
jgydF4y2Ba
(gydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
∑gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
ngydF4y2Ba
hgydF4y2Ba
(gydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
jgydF4y2Ba
)gydF4y2Ba
(gydF4y2Ba
wgydF4y2Ba
我gydF4y2Ba
TgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
2gydF4y2Ba
,gydF4y2Ba
在哪里gydF4y2Ba
我gydF4y2Ba
是图片,gydF4y2Ba
wgydF4y2Ba
我gydF4y2Ba
是混合系数矩阵的逆。gydF4y2Ba
使用毫升(最大似然)方法,我们可以获得的似然函数gydF4y2Ba
(7)gydF4y2Ba
lgydF4y2Ba
(gydF4y2Ba
WgydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
EgydF4y2Ba
(gydF4y2Ba
∑gydF4y2Ba
jgydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
JgydF4y2Ba
(gydF4y2Ba
∑gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
ngydF4y2Ba
hgydF4y2Ba
(gydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
jgydF4y2Ba
)gydF4y2Ba
(gydF4y2Ba
wgydF4y2Ba
我gydF4y2Ba
tgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
2gydF4y2Ba
)gydF4y2Ba
]gydF4y2Ba
+gydF4y2Ba
TgydF4y2Ba
lggydF4y2Ba
|gydF4y2Ba
WgydF4y2Ba
|gydF4y2Ba
。gydF4y2Ba
请注意,gydF4y2Ba
∑gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
ngydF4y2Ba
hgydF4y2Ba
(gydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
jgydF4y2Ba
)gydF4y2Ba
(gydF4y2Ba
wgydF4y2Ba
我gydF4y2Ba
tgydF4y2Ba
我gydF4y2Ba
)gydF4y2Ba
2gydF4y2Ba
可以被认为是一个社区的能量,可能与高阶神经元的输出在视觉复杂的细胞模型。gydF4y2Ba
一个简单的梯度算法可以用于执行的最大化似然函数的近似。权重向量gydF4y2Ba
wgydF4y2Ba
我gydF4y2Ba
被更新为gydF4y2Ba
(8)gydF4y2Ba
ΔgydF4y2Ba
wgydF4y2Ba
我gydF4y2Ba
∝gydF4y2Ba
EgydF4y2Ba
zgydF4y2Ba
(gydF4y2Ba
wgydF4y2Ba
我gydF4y2Ba
TgydF4y2Ba
zgydF4y2Ba
)gydF4y2Ba
rgydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
在哪里gydF4y2Ba
zgydF4y2Ba
=gydF4y2Ba
VgydF4y2Ba
xgydF4y2Ba
=gydF4y2Ba
VgydF4y2Ba
一个gydF4y2Ba
年代gydF4y2Ba
是数据prewhitening过程。gydF4y2Ba
VgydF4y2Ba
=gydF4y2Ba
EgydF4y2Ba
(gydF4y2Ba
xgydF4y2Ba
xgydF4y2Ba
TgydF4y2Ba
)gydF4y2Ba
- - - - - -gydF4y2Ba
1gydF4y2Ba
/gydF4y2Ba
2gydF4y2Ba
是美白的矩阵。我们有gydF4y2Ba
(9)gydF4y2Ba
rgydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
∑gydF4y2Ba
kgydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
ngydF4y2Ba
hgydF4y2Ba
(gydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
kgydF4y2Ba
)gydF4y2Ba
pgydF4y2Ba
(gydF4y2Ba
∑gydF4y2Ba
jgydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
ngydF4y2Ba
(gydF4y2Ba
wgydF4y2Ba
jgydF4y2Ba
TgydF4y2Ba
zgydF4y2Ba
)gydF4y2Ba
2gydF4y2Ba
)gydF4y2Ba
。gydF4y2Ba
这个函数gydF4y2Ba
pgydF4y2Ba
的导数是gydF4y2Ba
PgydF4y2Ba
在这里,我们定义一个指数分布gydF4y2Ba
PgydF4y2Ba
(gydF4y2Ba
ygydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
αgydF4y2Ba
YgydF4y2Ba
+gydF4y2Ba
βgydF4y2Ba
,在那里gydF4y2Ba
αgydF4y2Ba
是比例常数gydF4y2Ba
βgydF4y2Ba
定义了正常化。的正交化和归一化权重矩阵gydF4y2Ba
WgydF4y2Ba
可以通过让完成的gydF4y2Ba
(10)gydF4y2Ba
WgydF4y2Ba
⟵gydF4y2Ba
(gydF4y2Ba
WgydF4y2Ba
WgydF4y2Ba
TgydF4y2Ba
)gydF4y2Ba
- - - - - -gydF4y2Ba
1gydF4y2Ba
/gydF4y2Ba
2gydF4y2Ba
WgydF4y2Ba
。gydF4y2Ba
最后,在学习结束后,原来的混合矩阵gydF4y2Ba
一个gydF4y2Ba
可以通过反相计算美白的过程吗gydF4y2Ba
(11)gydF4y2Ba
一个gydF4y2Ba
=gydF4y2Ba
(gydF4y2Ba
WgydF4y2Ba
VgydF4y2Ba
)gydF4y2Ba
- - - - - -gydF4y2Ba
1gydF4y2Ba
=gydF4y2Ba
VgydF4y2Ba
- - - - - -gydF4y2Ba
1gydF4y2Ba
WgydF4y2Ba
- - - - - -gydF4y2Ba
1gydF4y2Ba
。gydF4y2Ba
详情,请参阅[gydF4y2Ba
25gydF4y2Ba ]。gydF4y2Ba
4.4。学习和神经计算输出gydF4y2Ba
监督式学习过程中,模型试图通过修改更新重量与输出神经元映射神经元之间的突触权重的平均值兴奋gydF4y2Ba
我gydF4y2Ba
和预选的神经元gydF4y2Ba
jgydF4y2Ba
,因此,gydF4y2Ba
ΔgydF4y2Ba
wgydF4y2Ba
jgydF4y2Ba
,gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
国防部gydF4y2Ba
订单gydF4y2Ba
(gydF4y2Ba
一个gydF4y2Ba
jgydF4y2Ba
)gydF4y2Ba
/gydF4y2Ba
NgydF4y2Ba
。注意,神经元的输出地图共享相同的突触权重。结果是神经元的输出映射将响应的平均模式训练样本,采取强劲的度量的空间位置检测到面部或面部表情和计算方便,同时对此案的模式是高方差已知,如识别面部表情的主题变体规模和照明在复杂的场景。gydF4y2Ba
最后一层创建相应的神经元数量地图模式类的数量呈现给网络。神经元训练反应选择性的一个给定的输入(脸,面部表情等)在他们的接受域的中心。侧抑制理论后,每当一个预定义的类别飙升的神经元,其他所有的神经元,神经元地图(代表其他类别)的区域集中在神经元的位置将得到抑制脉冲(高斯曲线拟合理论),形成一个歧视的分类器。gydF4y2Ba
5。实证评估gydF4y2Ba
在本节中,我们评估我们的框架在几个数据集、公平的评价和整体性能的目的,我们试图评价方法从不同的方面,如额面部表情识别和面部表情识别的约束下光照变化。为了做个比较,我们还提供其他几台系统和测试评价方法。gydF4y2Ba
5.1。JAFFE数据库实验结果gydF4y2Ba
第一个实验是测试在日本女性面部表情(JAFFE)数据集gydF4y2Ba
33gydF4y2Ba ]。JAFFE数据集包含213张图片七面部表情包括六种基本的面部表情和十个日本模型构成的一个中立的表达式。JAFFE用作基准数据库几个方法。也,以其纯粹的日本特色,有时也用于跨文化的比较研究探索如Dailey等的工作gydF4y2Ba
20.gydF4y2Ba ,gydF4y2Ba
21gydF4y2Ba ]。JAFFE也突出的心理认为,女人倾向于认知和显示比男人更明确的情绪面部表情。因此,它是合理的,开始从这个数据库实验评价。gydF4y2Ba
表gydF4y2Ba
1gydF4y2Ba 总结了该方法的性能和其他出版基准系统的结果gydF4y2Ba
5gydF4y2Ba
,请注意,我们的结果优于其他方法gydF4y2Ba
34gydF4y2Ba ,gydF4y2Ba
35gydF4y2Ba ),产生令人满意的结果。gydF4y2Ba
表1gydF4y2Ba
为JAFFE数据集分类的结果与我们的方法和与其他方法进行比较。gydF4y2Ba
特征提取方法gydF4y2Ba
识别率(%)gydF4y2Ba
PCA +支持向量机gydF4y2Ba
93.43gydF4y2Ba
ICA +支持向量机gydF4y2Ba
93.35gydF4y2Ba
LDA +支持向量机gydF4y2Ba
91.27gydF4y2Ba
2 d-lda +支持向量机gydF4y2Ba
94.13gydF4y2Ba
我们的gydF4y2Ba
97.35gydF4y2Ba
5.2。坎昆额面部信息数据库的实验结果gydF4y2Ba
介绍的第二个实验是评价方法的新创建的数据库面临的民族大学中国设计和建造,即大规模种族多样化的脸数据库,坎昆的脸数据库gydF4y2Ba
6gydF4y2Ba
涵盖不同来源的变化,特别是在种族、面部表情,照明,背景,姿势,配件,目前等等,它包含了112000 1120人的图像(560男性和560女性)中国56个民族或族群。数据集的目标列出如下(gydF4y2Ba
36gydF4y2Ba ]。gydF4y2Ba
(1)gydF4y2Ba
提供世界各地学者的人脸识别不管是面对真实详尽的信息数据库。虽然大多数当前的数据库主要由高加索人,我们主要集中在实验期间“不管是效应”。gydF4y2Ba
(2)gydF4y2Ba
理解文化特定的面部表情的不同生产和解释,长期被视为一个关键连接个人与社会之间的沟通。gydF4y2Ba
(3)gydF4y2Ba
提供面部数据对于脑-机接口(BCI)系统项目,目标是收集脑电图和面部表情,自愿或控制,选择受试者兴奋的视听刺激,与头皮EEG设备记录,分析和确定之间的非线性相关唤起情感和对面部表情的表现。图gydF4y2Ba
3gydF4y2Ba 显示了摄影室的配置,包括灯具、摄像系统,等等,和一些典型图像的主题。gydF4y2Ba
图3gydF4y2Ba
图显示整个村的脸数据库的配置。捕获的脸图像不同姿势,表情,配件,和照明条件下,一个特殊的摄影室的尺寸8.0米长、8.0米宽、3.5米高度设置在我们的实验室,和房间里的配置必要的设备包括一个摄像机系统,照明系统和控制设备,配件和各种背景。注意,为了模拟环境照明,两种摄影日光灯的高功率覆盖着磨砂玻璃用于照射到粗糙的白色天花板,可以获得更均匀的照明和模拟正常的户外照明环境照明源(开销)。生成各种定向照明条件需要,我们建立了一个15荧光灯照明系统在摄影室使用多个灯和灯地狱,在一个半圆的配置(gydF4y2Ba
22gydF4y2Ba ]。gydF4y2Ba
我们进行的第一个实验是在七额数据集的一个子集(六个典型的面部表情+一个中立的表达式),在一些最常用的基线的人脸识别算法和我们建议的方法进行评估。300名受试者,每一个都包含超过14额面部表情图像,使用。注意,一些主题分享相似的面部表情,但他们中的大多数种族多元化和变量表达式强度(图gydF4y2Ba
4gydF4y2Ba )。我们使用gydF4y2Ba
70年gydF4y2Ba
%gydF4y2Ba
(10/14)的图像的每个类培训和不同比例的其余图像进行测试。实验结果的某些部分,介绍面对数据库已经出现在会议论文(gydF4y2Ba
22gydF4y2Ba ,gydF4y2Ba
36gydF4y2Ba )和我们的方法取得了可喜的成果与最高的表演等最先进的方法(gydF4y2Ba
31日gydF4y2Ba ,gydF4y2Ba
37gydF4y2Ba ,gydF4y2Ba
38gydF4y2Ba ]。gydF4y2Ba
图4gydF4y2Ba
种族不同面部表情暗示复杂的神经动力学和内隐文化影响(原始照片)gydF4y2Ba
22gydF4y2Ba ]。gydF4y2Ba
在实验中,我们发现所有的六个面部表情,表达快乐和惊喜的表情表情越容易被认出而恐惧的表情是最困难的表达式被认可,这是符合心理结果如(gydF4y2Ba
39gydF4y2Ba ]。另一个值得注意的事实对特定类别的识别率,恐惧,厌恶,和意外信息相对低于其他一些西方面部表情等数据集Cohn-Kanade AU-Coded面部表情数据库(gydF4y2Ba
40gydF4y2Ba ),我们有一些经验的实验结果。再次,情况可以通过文化占据特定的解释是比较容易分析的显式或西方程式化的消极的面部表情。此外,一些行为和与事件相关的潜在的实验结果gydF4y2Ba
41gydF4y2Ba ,gydF4y2Ba
42gydF4y2Ba )支持这一结论情绪面孔识别的困惑,也就是说,东亚人往往有困难种差恐惧和厌恶情绪表达,而西方的人没有这个问题。所有在一起,结果表明该方法的潜在有用的处理这样的问题。然而,我们的方法仍然显示平均令人满意的结果gydF4y2Ba
7gydF4y2Ba
。gydF4y2Ba
5.3。光照变化的面部表情识别的实验gydF4y2Ba
第二个实验我们考虑为坎昆数据集提出的评价方法在光照变化下的面部表情识别。而最新研究限制额视图与正常照明条件下,面部表情识别与变体照明条件是一个富有挑战性的研究课题,最近开始吸引研究团体的注意。然而,一些工作在这个问题上已经完成在过去的几年里,因为它的技术挑战和缺乏适当的数据库。我们选择子集村照明变化、30例5构成角度(我们也考虑构成变化)造成的阴影效果,3灯饰和随机选择6面部表情为通用培训和其余的用于测试。我们考虑以下实验程序:gydF4y2Ba
(gydF4y2Ba
1gydF4y2Ba
)gydF4y2Ba
同样的照明,同样的姿势,代表了传统的固定场景,gydF4y2Ba
(gydF4y2Ba
2gydF4y2Ba
)gydF4y2Ba
不同的照明,同样的姿势,主题的面部表情应该认识到相同的姿势(说,额,从而意味着0°),而照明变化从一边到中央)。实验结果表中列出gydF4y2Ba
2gydF4y2Ba (%,省略小数点)。gydF4y2Ba
表2gydF4y2Ba
识别的准确性照明变体面部表情(有或没有正常化)数据集的结果。gydF4y2Ba
的名字gydF4y2Ba
坎昆面部gydF4y2Ba
表达子集gydF4y2Ba
未规范化gydF4y2Ba
归一化gydF4y2Ba
照明角度gydF4y2Ba
照明角度gydF4y2Ba
大街gydF4y2Ba
学位gydF4y2Ba
0gydF4y2Ba
∘gydF4y2Ba
4gydF4y2Ba
5gydF4y2Ba
∘gydF4y2Ba
9gydF4y2Ba
0gydF4y2Ba
∘gydF4y2Ba
0gydF4y2Ba
∘gydF4y2Ba
4gydF4y2Ba
5gydF4y2Ba
∘gydF4y2Ba
9gydF4y2Ba
0gydF4y2Ba
∘gydF4y2Ba
构成gydF4y2Ba
H / Sa /苏/ D / F / AgydF4y2Ba
H / Sa /苏/ D / F / AgydF4y2Ba
H / Sa /苏/ D / F / AgydF4y2Ba
H / Sa /苏/ D / F / AgydF4y2Ba
H / Sa /苏/ D / F / AgydF4y2Ba
H / Sa /苏/ D / F / AgydF4y2Ba
(%)gydF4y2Ba
0gydF4y2Ba
∘gydF4y2Ba
85/76/79/67/65/82gydF4y2Ba
57/53/55/55/48/63gydF4y2Ba
66/57/58/62/51/59gydF4y2Ba
85/76/79/67/65/82gydF4y2Ba
66/52/65/59/47/66gydF4y2Ba
67/55/61/56/47/62gydF4y2Ba
63/64gydF4y2Ba
3gydF4y2Ba
0gydF4y2Ba
∘gydF4y2Ba
67/65/61/53/42/57gydF4y2Ba
53/51/50/51/43/55gydF4y2Ba
51/55/58/55/50/48gydF4y2Ba
66/59/60/72/48/62gydF4y2Ba
60/65/59/52/45/56gydF4y2Ba
46/45/40/45/32/42gydF4y2Ba
53/53gydF4y2Ba
4gydF4y2Ba
5gydF4y2Ba
∘gydF4y2Ba
63/56/52/55/35/51gydF4y2Ba
45/55/47/45/43/50gydF4y2Ba
44/42/42/45/43/40gydF4y2Ba
66/43/50/51/52/55gydF4y2Ba
58/53/57/51/42/55gydF4y2Ba
48/44/39/40/38/43gydF4y2Ba
47/49gydF4y2Ba
6gydF4y2Ba
0gydF4y2Ba
∘gydF4y2Ba
48/46/44/47/38/45gydF4y2Ba
42/45/45/45/32/41gydF4y2Ba
36/36/33/35/35/39gydF4y2Ba
57/52/45/49/59/61gydF4y2Ba
50/45/44/49/40/51gydF4y2Ba
41/40/36/35/22/32gydF4y2Ba
40/45gydF4y2Ba
9gydF4y2Ba
0gydF4y2Ba
∘gydF4y2Ba
33/33/33/33/17/33gydF4y2Ba
33/37/31/35/25/33gydF4y2Ba
37/30/31/25/18/32gydF4y2Ba
38/39/37/33/40/42gydF4y2Ba
36/33/40/33/38/33gydF4y2Ba
35/37/35/35/31/33gydF4y2Ba
31/36gydF4y2Ba
平均gydF4y2Ba (%)gydF4y2Ba
59/55/54/51/40/54gydF4y2Ba
46/48/46/46/38/48gydF4y2Ba
47/44/45/44/39/44gydF4y2Ba
62/54/54/54/53/60gydF4y2Ba
54/50/53/49/42/52gydF4y2Ba
47/44/42/42/34/42gydF4y2Ba
47/49gydF4y2Ba
笔记gydF4y2Ba
h幸福观gydF4y2Ba
Sa-SadnessgydF4y2Ba
Su-SurprisegydF4y2Ba
D-DisgustgydF4y2Ba
F-FeargydF4y2Ba
A-AngergydF4y2Ba
从表中我们可以看到,这对两个数据库确实是非常具有挑战性的任务,如果姿势和照明条件都是极端,然后几乎没有面对将是可见的,更不用说面部表情。如果主题的姿势gydF4y2Ba
0gydF4y2Ba
∘gydF4y2Ba
,照明角度不同gydF4y2Ba
0gydF4y2Ba
°gydF4y2Ba
来gydF4y2Ba
9gydF4y2Ba
0gydF4y2Ba
°gydF4y2Ba
,那么问题变成简单的额面部表情识别在不同照明角度,我们获得可接受的结果gydF4y2Ba
8gydF4y2Ba
,即使在极端照明角度90°,这是因为脸图像通常是对称的,因此比较容易辨别,甚至对面部表情(通常这个观点认为,当一个主题在他的脸上的表情不是对称的,有可能是他/她试图假装隐藏内心的情感状态,或表达不自然。)。但是,当主体的构成比gydF4y2Ba
3gydF4y2Ba
0gydF4y2Ba
°gydF4y2Ba
,对称性遭到破坏,结构信息的缺乏使得算法难以提取可靠的信息,与此同时,铸出阴影效果和附加的影子会使识别更糟糕的是,即使在退化图像部分恢复了归一化预处理算法gydF4y2Ba
9gydF4y2Ba
。在实验中,我们的方法执行令人满意的只有当测试图像相对集成,这意味着图像阴影效果影响并不太多gydF4y2Ba
10gydF4y2Ba
这也表明,所谓的“直接的视觉”(即快速分类没有眼球运动和关注)处理照明变体问题有其局限性,这可能被发送到认知越高,注意要求区域进行处理。然而,它还应该注意与非规范形象相比,该方法的识别结果并没有降低,表明系统性能的鲁棒性(光照变化不变性)。gydF4y2Ba
6。讨论、总结和未来的发展方向gydF4y2Ba
6.1。摘要gydF4y2Ba
在本文中,我们专注于一种潜在的皮层像框架面部表情识别的快速分类决策。我们的假设是快速决策是V1,前馈和神经编码的天生的生理行为将减少冗余信息,提高选择性,同时保持不变,因此,在某种程度上是一致的感知性能,因此,这项工作中所描述的系统是基于一个共识神经学家,心理学家和拟合实验数据。它属于一个家庭的前馈模型对象承认试图复制在几个视觉皮质神经元的调谐特性。模型由若干层次,每一层的函数的类型分别总结如下。gydF4y2Ba
第一层模拟了视网膜的细胞的生物学特性,增强的高对比度部分给定的图像,采用二维高斯函数的差异,执行高通滤波器的作用。gydF4y2Ba
第二层由应用伽柏过滤器从第一个输入,模拟处理初级视觉皮层简单细胞。Olshausen和现场证明,优化一个简单的稀疏编码方案在一组自然图像边缘产生一组过滤器类似于伽柏过滤器(gydF4y2Ba
26gydF4y2Ba ,gydF4y2Ba
43gydF4y2Ba ]。因此,伽柏过滤器的输出对输入图像应该有可取的稀疏性质。gydF4y2Ba
第三层次做了一些非正统的传统计算机视觉模型,它试图删除多余的表示,同时保留互信息最大化的信息,揭示了潜在的独立组件的输入,一个典型的高效的编码方法。因此,生成统计模型等行业将是显而易见的选择。小世界的动机是三角连接(稀疏分布,局部刺激计算现象成立于大脑皮层)和高效编码假设(即早期的视觉流程应该利用统计规律或冗余的输入来表示尽可能多的信息给神经资源有限)表明,能源效率可以用来解释稀疏编码理论(gydF4y2Ba
1gydF4y2Ba ,gydF4y2Ba
2gydF4y2Ba ,gydF4y2Ba
26gydF4y2Ba ,gydF4y2Ba
43gydF4y2Ba ]。已经注意到的,强烈刺激活性神经元相对较小,所谓的稀疏编码理论表明,初级视觉皮层的神经元形成稀疏表示的自然场景统计的观点。温吉格兰特等广受好评,神经元的早期视觉系统应该有独特的能力decorrelating传入的视觉信号,去除冗余信息,为了最大化信息传输(gydF4y2Ba
27gydF4y2Ba ]。尽管还不清楚如何建模整个视觉皮质系统有选择地放大重要功能促进歧视,已经被广泛接受,sparse-coding-based神经元系统改善神经信息处理和皮层感知。gydF4y2Ba
最后阶段,我们的系统是一个标准的信息积累和决策部分原始SpikeNet模型后,对应V4-IT,神经元被训练要选择性预定义类别(一个神经元为每个单独的地图)。gydF4y2Ba
6.2。讨论gydF4y2Ba
持续努力在认知神经科学中,模式识别,和先进的人机系统针对计算智能模型的建立使用模拟神经元单位作为基本构建块。这样的努力,灵感来自cortex-like机制的标准设计和传统的人工神经网络,是有限的单一功能性能和大规模计算不便带来的困难,尤其是在处理大型、复杂的模式识别问题。我们建议的模型,另一方面,表明,结合模型和任务的认知与现代neurocomputational方法,neurosystematic方法研究cortex-like机制有可能克服上述困难,来扩展我们的知识的大脑机制的认知分析,并推进我们如何识别面临的理论模型,例如,感知他人的情绪在一个富有的、动态的和复杂的环境中,提供了一个新的起点改进模型的视觉cortex-like机制,正式通知的神经元模型的数学方法,受到视觉腹侧通路模型。已经开始研究说明这种组合可以直接作用在几个特定的应用程序的任务。gydF4y2Ba
6.3。未来的发展方向gydF4y2Ba
似乎有至少四个方向,可以跟着进一步提高cortex-like机制的性能。gydF4y2Ba
首先,作为未来的方向,为了提高生物的使用合理的现实的神经网络进行模式分析,适应是非常必要的。实验结果表明,自适应地改变接受域V1输入刺激,增加过滤的信息由神经响应刺激(gydF4y2Ba
44gydF4y2Ba ),这意味着神经编码自适应,自适应滤波过程实际上影响的空间频率成分神经滤波器,从而增强了视觉皮层的信息传输,与最优神经编码协议。很方便如果这适应过滤机制可以被集成到系统中,由于缺乏适应当前的模型,一种方法是使用自适应伽柏过滤器,或应用本地适应性、全球稳定的内核的方法。gydF4y2Ba
第二,最近从神经科学发现曹,Freiwald等人表明,连续的阶段,面对网络可能会执行一个逐步转换:从选择性的观点,不管身份,选择性的身份,无论观点(gydF4y2Ba
45gydF4y2Ba - - - - - -gydF4y2Ba
47gydF4y2Ba ]。一般的含义是腹侧通路中的前处理阶段带泛型类别信息(例如,脸和nonface,典型的快速分类决策任务,也按照当前的理论模型和实验建立)和观点,而后来处理阶段进行个人信息(例如,罗杰和迈克尔)范本,消除观点信息实现不变识别,表明不变的规模和位置特征描述符(例如,运营商像筛)可能需要引入附加层。相同的概念无疑将适合的面部表情识别。gydF4y2Ba
第三,当前神经元模型确定的飙升,限制他们描述和建模大规模、动态、随机过程,而作为飙升过程中生物神经元随机天生(神经元飙升,突触连接,传输通道开放与否,等等),这将是适当的去寻找新的灵感来提高当前SNN模型与概率参数,形成概率神经网络(pSNNs)飙升。例如,将概率参数添加到飙升神经元模型(如Izhivich SNN模型)模拟体内皮质神经元的行为,在参数用于控制突触建立在飙升生成和传输。和Hebbian学习规则可以使用概率参数自适应控制和连接权值与突触建立使用索普的规则在网络学习过程中。这样一个pSNN模型将表现出更明确的行为和健壮的性能比原来的模型和确定性的网络组织。一些实验结果已经为它的效率提出了执行功能难以实现使用传统模型(gydF4y2Ba
48gydF4y2Ba ]。gydF4y2Ba
最后,另一个有前途的方向是修改SNN架构。所有现有的neuromodels将强调多层前馈转换、层次布局结构,是基于传统的生理实验。然而,最近的实验发现,处理在视觉功能补丁和额外的反复处理各级补丁之间的处理层次结构(并行)很可能进一步的机制,可能导致更复杂的表征(gydF4y2Ba
46gydF4y2Ba ]。这将是重要的和必要的使用激增复发性神经网络描述的动态过程。然而,这意味着我们需要丢弃原来的架构,因为高峰传播SpikeNet等这些直接模型采用前馈和迭代过程不能发生的,即使横向交互存在在过去处理阶段,每个神经元只能发射一次。为了解决更复杂的、动态的面部信息分析问题,神经元的基本设计模型(gydF4y2Ba
49gydF4y2Ba )是由所有重要和必要的。gydF4y2Ba