应用计算智能和软计算

在这一页上

文摘介绍应用程序结论引用版权相关文章

特殊的问题

机器学习和视觉计算

把这个特殊的问题

评论文章|开放获取

体积2017年| 文章的ID1320780| https://doi.org/10.1155/2017/1320780

深度学习在视觉计算和信号处理

Danfeng谢 ,¹ Lei张 ,¹ 和李白¹

学术编辑器: 经纪人莫拉比托弗朗西斯科·卡洛

收到了 2016年10月21日

修改后的 2016年12月15日

接受 2017年1月15日

发表 2017年2月19日

文摘

深入学习是机器学习的一个分支,它旨在学习从输入数据的层次结构特征。如今,研究人员集中研究了深度学习算法解决具有挑战性的问题在许多领域,如图像分类、语音识别、信号处理、自然语言处理。在这项研究中,我们不仅回顾典型深学习算法在计算机视觉和信号处理还提供详细信息如何应用等具体领域深度学习道路裂缝检测、故障诊断和人类活动检测。此外,本研究还讨论了设计的挑战和训练神经网络。

1。介绍

深入学习方法是一组机器学习的方法,可以学习特性等级从低到高水平通过构建一个架构。深度学习的方法可以自动学习功能在多个水平,使系统能够学习复杂的映射函数直接从数据,没有帮助human-crafted特性。这种能力是至关重要的高级特性抽象自高级特性很难直接从原始训练数据被描述。此外,随着数据的急剧增长,学习能力高级功能会自动将更加重要。

最深刻的学习方法的特色之一是,他们的模型都有很深的架构。深架构意味着它有多个网络中隐藏层。相比之下,一个浅架构只有几个隐藏层(1 - 2层)。深架构松散灵感来自哺乳动物大脑。当给定一个输入认知,哺乳动物的大脑处理它使用不同皮层区域抽象不同级别的功能。研究人员通常描述这些概念层次方面,许多的抽象级别。此外,通过许多哺乳动物的大脑似乎也处理信息阶段的转换和代表性。一个非常明显的例子是,灵长类动物的视觉系统中的信息处理在一系列阶段:边缘检测,原始形状,和更复杂的视觉形状。

灵感来自哺乳动物大脑的深层结构,研究人员调查了深层神经网络二十年,但在2006年之前没有发现有效的训练方法:研究人员只有获得良好的实验结果的神经网络与一个或两个隐藏层但不能得到好的结果的神经网络有更多的隐藏层。2006年,辛顿等人提出了深刻的信念网络(DBNs) [1),使用无监督学习算法的学习算法,贪婪地训练神经网络深一层一层地。这个训练方法,被称为深度学习,结果是非常有效的和有效的在训练神经网络。

许多其他深架构,autoencoder,深度卷积神经网络和递归神经网络,成功地应用于各个领域。回归(2)、分类(3- - - - - -9,降维10,11),建模运动(12,13],纹理建模[14)、信息检索(15- - - - - -17),自然语言处理(18- - - - - -20.,机器人21),故障诊断22),和道路裂缝检测(23)已经看到增加深入学习相关的研究。主要有三个重要原因的快速发展深度学习应用程序现在:深入学习算法的大飞跃,显著增加计算能力,硬件价格的大幅下降。

本调查概述几种深度学习算法和新兴应用在一些特定领域,人脸识别、道路裂缝检测、故障诊断和检测。补充现有的评论论文(24,25),我们不仅审查最先进的深度学习的方法,还提供了详细的信息关于如何深度学习应用于具体问题。本文的组织结构如下的提示。节2深度学习的两类算法介绍:限制玻耳兹曼机(元)和卷积神经网络(cnn)。节中讨论的培训策略3。节4,我们描述几个特定深度学习应用程序,也就是说,人脸识别,道路裂缝检测、故障诊断和人类活动检测。节5,我们将讨论几个挑战的训练和使用深层神经网络。节6,我们的结论。

2。深入学习算法

深入学习算法近年来被广泛研究。因此,有很多相关的方法。一般来说,这些算法可以分为两类基于他们的架构:限制玻耳兹曼机(元)和卷积神经网络(cnn)。在下面几节中,我们将简要地回顾这些深学习方法及其发展。

2.1。深层神经网络

本节介绍了如何构建和训练RBM-based深层神经网络(款)。款的构建和训练过程包含两个步骤。首先,建立一个深层信念网络(DBN)叠加限制玻耳兹曼机(元)和饲料无标号数据pretrain DBN。的pretrained DBN提供了深层神经网络初始参数。在第二步中,标记的数据是美联储使用反向传播训练款。两个步骤的训练,训练后款。这部分组织如下。部分2.1。1介绍了遏制,DBN的基本组成部分。节2.1。2RBM-based介绍款。

2.1.1。限制了玻耳兹曼机

疟疾是一种能源概率生成模型(26- - - - - -29日]。它由一层可见单元和一层隐藏的单位。可见单位代表一个数据样本的输入向量和隐藏的单位代表抽象的可见的功能单位。每一个可见的单元连接到隐藏的单位,而不存在连接在可见层或隐藏层。图1说明了玻耳兹曼机图形模型的限制。

由于缺乏hidden-hidden和input-input交互,遏制的能量函数在哪里是遏制他们的参数需要学习在培训过程;表示可见层和隐层之间的权值;和的偏见是可见的层和隐层,分别;这种模式称为二进制元,因为向量和只包含二进制值(0或1)。

我们可以获得一个容易处理的条件概率的表达式(30.]:

二进制元,,一个隐藏的单元的方程的输出给定输入

因为和发挥的作用在能量函数,下面的方程可以推导出: 和可见的单元,我们有在哪里是th列。

尽管二进制元可以实现良好的性能在处理离散输入时,他们有处理连续值的输入限制由于它们的结构。因此,为了达到更好的性能在连续值的输入,利用高斯遏制可见层(4,31日]。作为遏制疟疾是高斯的能量函数在哪里和是可见的均值和标准差单位。注意,只有可见的层是连续值和隐藏层仍然是二进制。在实际情况下,输入数据规范化,使和。因此,(6)成为

2.1.2。深层神经网络

辛顿et al。1)表明,疟疾可以堆叠和贪婪的方式训练形成所谓的深层信念网络(DBNs) [32]。DBNs图形模型学习提取训练数据的深层次化表示。DBN模型与层模型观察向量之间的联合分布和隐藏层如下(30.]: 在哪里的条件分布可见单位条件的隐藏的单位元水平和在顶级遏制visible-hidden联合分布。这是见图2。

如图2显示,隐藏层的低级遏制是可见层高层遏制,这意味着低级遏制的输出是输入的高层组织遏制。通过使用这种结构,高级元能够学习高层特征从低级特征产生的低级遏制。因此,DBN允许潜变量空间隐藏层。为了有效地训练DBN,我们需要训练其遏制从低级别到高级别先后。

无监督DBN pretraining一步后,下一步就是利用DBN的参数初始化,做款监督培训款使用反向传播。的参数层款如下:初始化参数除了顶层设置参数一样的DBN,和上面层权重初始化随机。之后,整个网络可以被反向传播调整监管方式使用带安全标签的数据。

2.2。卷积神经网络

卷积神经网络是其中一个最强大的类的神经网络在图像处理任务。它是高度有效的和常用的计算机视觉应用中33]。卷积神经网络包含三种类型的层:卷积层,二次抽样层、连接层。卷积神经网络的整体架构图所示3。简要介绍每种类型的层中提供以下段落。

2.2.1。褶积层

如图4显示,在卷积层,左边矩阵输入,这是一个数字图像,是一个卷积矩阵和矩阵。卷积层需要输入图像的卷积,卷积矩阵并生成输出图像。通常卷积矩阵称为滤波器和输出图像称为滤波器响应或过滤地图。卷积计算的一个例子是显示在图5。每一次,一块像素是复杂的过滤和生成一个像素在一个新的形象。

2.2.2。二次抽样层

二次抽样层是一个重要的层卷积神经网络。这一层主要是减少输入图像大小为了给神经网络更多的不变性和鲁棒性。二次抽样层的最常用方法是马克斯池图像处理任务。所以二次抽样层经常被称为最大池层。最大池方法如图6。图像分为块和每个块的最大值对应的输出图像的像素值。使用二次抽样层的原因如下。第一,二次抽样层更少的参数和速度训练。第二,二次抽样层使得卷积层容忍输入模式之间的平移和旋转。

2.2.3。完整的连接层

完整的连接层类似传统前馈神经层。他们使神经网络提出输入向量与一个预定义的长度。我们可以适应向量为特定类别或把它作为一个表示向量进行进一步处理。

3所示。培训策略

相比,传统的机器学习方法,深度学习的优点是,它可以构建深架构抽象学习更多的多尺度特性。不幸的是,大量的深层结构的参数可能导致过度拟合问题。

3.1。数据增加

增加数据的关键思想是生成额外的数据不引入额外的标签成本。一般来说,现有的增加是通过变形的数据。镜像,缩放和旋转是最常见的方法对数据增加(34- - - - - -36]。吴等人扩展变形主意的颜色空间,提供颜色铸造、渐晕,透镜畸变技术工作,显著扩大了训练集(37]。

3.2。Pretraining和微调

培训深入学习架构是一个耗时的和重要的任务。一方面,很难获得足够的已标示数据训练深度学习架构在实际应用程序中,虽然增加的数据可以帮助我们获得更多的培训数据。

对于视觉任务,很难获得足够的数据时,一个值得推荐的方法是调整pretrained CNN的自然图像(例如,ImageNet),然后使用特定的数据集来调整CNN (36,38,39]。Tajbakhsh等人表明,对于医疗应用程序,使用pretrained CNN与适当的微调表现或,在最坏的情况下,执行以及CNN从头训练(38]。

另一方面,深度学习架构包含成千上万的参数初始化甚至有足够的数据。Erhan等人提供的证据来解释pretraining一步帮助培训架构如深深信仰网络和堆叠autoencoders [40]。他们的实验支持正则化解释pretraining的影响,这有助于获得更好的泛化的deep-learned模型训练数据集。

4所示。应用程序

深度学习被广泛应用在各个领域,如计算机视觉(25),信号处理(24),和语音识别41]。在本节中,我们将简要地回顾一些最近开发的应用深度学习(所有的结果都是被从原来的论文)。

4.1。CNN-Based应用在视觉计算

正如我们所知,卷积神经网络是非常强大的工具,用于图像识别和分类。这些不同类型的cnn通常测试知名ImageNet大规模视觉识别的挑战(ILSVRC)数据集和近年来达到最先进的性能42- - - - - -44]。2012年赢得ImageNet竞争后(42),CNN-based方法在计算机视觉带来了一场革命。cnn已经取得了巨大的成功应用于目标检测(35,45,46,对象分割47,48),和图像识别的对象和地区49- - - - - -54]。与手工的特性,例如,局部二值模式(LBP) [55]和尺度不变特征变换(SIFT) [56),需要其他分类器来解决视力问题(57- - - - - -59],cnn可以学习的特征和分类器联合并提供性能优越。在下一小节,我们回顾最近deep-learned CNN是如何应用于人脸识别和道路裂缝检测问题提供一个概述为CNN应用到特定的问题。

以下4.4.1。CNN的人脸识别

人脸识别是自1970年代以来最重要的计算机视觉任务(60]。人脸识别系统通常由四个步骤组成。首先,给定一个输入图像与一个或多个面孔,一张脸探测器定位和隔离的面孔。然后,每个面预处理对齐使用2 d或3 d建模方法。接下来,一个特征提取器提取特征从一个对齐的脸(或嵌入)获得一个低维表示。最后,一个分类器预测基于低维表示。取得好表现为人脸识别系统的关键是获得一个有效的低维表示。人脸识别系统是用手工功能包括(61年- - - - - -64年]。劳伦斯et al。65年首次提出使用cnn进行人脸识别。目前,先进的人脸识别系统的性能,也就是说,Facebook的DeepFace [66年和谷歌FaceNet67年),是基于cnn。其他值得注意的CNN-based人脸识别系统是减轻卷积神经网络(68年)和视觉几何组(VGG)面对描述符(69年]。

图7显示CNN-based人脸识别系统的逻辑流程。cnn使用手工制作的特性,而是直接应用于RGB像素值和用作功能器提供一个低维表示,描述一个人的脸。为了规范化输入图像不同角度面临强劲,DeepFace [66年面临的3 d模型和将它出现正面的脸。然后,美联储规范化输入到一个convolution-pooling-convolution过滤器。接下来,3本地连接层和2完全连接层是用来做最后的预测。DeepFace如图的架构8。虽然DeepFace达到最佳性能在人脸识别,其表示很难理解和使用,因为同一个人的面孔不是集群必然在训练过程中。相比之下,FaceNet定义了一个三联体直接损失函数表示法,使培训过程学会集群的脸表示同一个人(70年]。还应该指出,OpenFace使用一个简单的二维仿射变换来调整输入。

如今,人脸识别在移动计算是一个非常有吸引力的话题71年,72年]。而DeepFace和FaceNet保持私有和大尺寸,OpenFace [70年]提供了一个轻量级、实时和开源人脸识别系统与竞争的准确性,适用于移动计算。OpenFace实现FaceNet架构但是比DeepFace小一个数量级,比FaceNet小两个数量级。他们的表演比较标记脸上在野外数据集[伦敦时装周开幕73年),在人脸识别是一个标准的基准。实验结果显示在表1。尽管OpenFace的准确性略低于国家的艺术,其规模较小的规模和快速执行时间在移动人脸识别场景方面显示了很大的潜力。

4.1.2。CNN道路裂纹检测

路面裂缝的自动检测是一个重要的任务在交通维护行车安全保证。灵感来自最近的成功应用深度学习计算机视觉和医学问题,提出了一种基于深度学习的裂缝检测方法(23]。

数据准备。一个数据集有超过500路面大小的照片收集在天普大学校园通过使用智能手机的传感器数据。每个图像的多个注释的注释。补丁的大小该方法用于训练和测试。640000块,160000块,200000块被选中作为训练集,验证集和测试集,分别。

设计和训练CNN。深度学习架构设计,见图9和conv,国会议员,足球俱乐部代表卷积,马克斯池,分别和完全连接层。cnn被训练使用随机梯度下降法(SGD)方法在GPU上一批的大小48例子,势头0.9和0.0005的重量衰变。不到20时代需要达到一个最低的验证集。辍学方法之间使用两个完全连接层的概率0.5和修正的线性单元(ReLU)激活函数。

CNN的性能进行评估。比较该方法和支持向量机(SVM)和提高的方法。训练支持向量机的特性和增强方法是基于颜色和纹理与二进制相关联的每个补丁标签指示碎裂的存在与否。93 -维特征向量,由颜色元素,textons直方图,枸杞多糖描述符在补丁。

接受者操作特征(ROC)曲线的方法,支持向量机,提高方法如图10。ROC曲线和曲线下面积(AUC)该方法表明,提出的基于深度学习的方法可以超越肤浅的结构从手工制作的特点。此外,更全面的实验正在进行场景如图11。

(一)场景1

(b)场景2

(c)场景3

对于每一个场景,每一行显示了原始图像与裂缝、地面真理,SVM和概率地图生成的事先和提高方法。像素在绿色和蓝色表示裂纹和noncrack,分别和更高的亮度就意味着更高的信心。SVM无法区分裂缝和背景,和一些裂缝已经更进一步。与支持向量机相比,提高方法可以检测出裂缝,准确率更高。然而,一些背景的补丁被归类为裂缝,导致孤立图中绿色的部分11。这两种方法相比,该方法提供了优越的性能在正确分类从背景的破解补丁。

4.2。DBN-Based在信号处理中的应用

4.2.1。准备款为故障诊断

工厂错误可能导致异常的操作,紧急关闭,设备损坏,甚至人员伤亡。日益复杂的现代植物,即便是有经验的经营者很难诊断故障快速、准确。因此,设计一个智能故障检测和诊断系统来帮助操作员在过程工程是一个重要的任务。数据驱动的故障诊断方法是近年来越来越流行,因为他们利用强大的机器学习算法。传统的监督学习算法用于故障诊断的人工神经网络(76年- - - - - -81年)和支持向量机(82年- - - - - -84年]。作为一种新兴的机器学习技术,深度学习的故障诊断技术研究了一些当前研究[22,85年- - - - - -88年]。本节审查一项研究使用层次深神经网络(HDNN) [22)在一个众所周知的诊断故障数据集称为田纳西伊士曼流程(TEP)。

TEP中的仿真模型,模拟一个真正的产业的过程。模型最初由伊士曼化学公司(75年]。它由五个单元:冷凝器、压缩机、反应器、分离器和汽提塔。G和H两个液体产品生产过程中气体输入,C, D, E和惰性组件b TEP如图的工艺流程图12。

数据准备。TEP使用由网络监控传感器,收集测量在同一采样时间。在th样品的状态传感器由一个标量表示。通过结合所有传感器,整个过程的状态采样间隔表示为行向量。故障的发生采样间隔与类标签指示,价值来代表之一故障类型。有总历史观察收集的传感器组成一个数据集。故障诊断的目的是训练一个分类给定数据集。

对于每一个模拟运行,介绍了仿真开始没有缺点和错误示例1。每次运行总共收集1000件样本数据。每一个故障类型有5个独立的模拟运行。田纳西伊士曼过程有20种不同的预定义的缺点但是缺点3、9、15是故障诊断排除由于没有影响或对所有传感器(微妙的影响82年,84年]。因此,训练数据集共有数据样本;也就是说,,,。然后,使用同样的方法生成测试数据。因为只有故障诊断方法进行这项工作,正常运行数据没有考虑。数据规范化和数据增强技术用于实现更好的性能。

设计和训练HDNN。的一般诊断方案HDNN [22)如下。症状由模拟生成的数据传输到监控款。监督款然后将症状数据分为不同群体和触发器的这款是受过专门训练的组做进一步的故障诊断。图13说明了HDNN的故障诊断方案,每个代理代表一个款。

款的性能进行评估。HDNN的实验结果相比单一神经网络和Duty-Oriented分层人工神经网络(DOHANN) [76年),如图14。7 17故障诊断准确率达到了90%。最高的正确分类率从故障4 (CCR)是99.6%,而最低的CCR是50.4%的错13。CCR的平均方法是80.5%,而平均的CCR自己SNN DOHANN是49.7%和70.7%,分别。它表明DNN-based算法优于其他传统NN-based算法。

4.2.2。款为人类活动检测

检测人类活动引起了科研人员由于高要求的重视安全,执法,和医疗保健90年- - - - - -93年]。使用相机来检测人类活动相比,传感器,如穿加速器或家庭雷达使用信号来检测人类活动是健壮的天气和光线等环境条件的变化(94年- - - - - -99年]。现在,有一些新兴的研究工作,重点使用深度学习技术来检测人类活动基于信号(89年,92年,One hundred.]。

秋天检测是非常重要的人类活动之一检测场景对于研究人员,由于下降是主要原因为老年人致命和非致命的伤害。汗和TaatiOne hundred.)提出了一种深度学习跌倒检测方法基于可穿戴设备采集的信号。他们提出一个autoencoders从每个通道遥感数据中提取特征。与可穿戴设备侵入和容易破碎,必须进行,家庭雷达是安全的,不干扰,健壮的秋季检测照明条件展示他们的优势。Jokanovic et al。89年)提出了一个方法,使用深度学习通过家庭雷达探测下降运动。展示在图的过程15。他们第一次降噪和规范化的声谱图作为输入。然后,堆放autoencoders执行器作为一个特性。在堆叠autoencoders, softmax回归分类器是用来进行预测。整个模型相比,支持向量机模型。实验结果表明,深度学习方法的正确分类率为87%,而支持向量机的正确分类率是78%。

5。挑战

尽管深度学习技术在多个领域实现承诺的性能,仍有几大挑战,表明研究文章。这些挑战描述如下。

5.1。有限的训练数据

深层神经网络训练通常需要大量的数据作为更大的训练数据集可以防止深学习模型过度拟合。有限的训练数据可能严重影响深层神经网络的学习能力。不幸的是,有许多应用程序缺乏足够的数据来训练一个款的标签。因此,如何培养款限制数据有效地成为一个热门话题。

最近,两种可能的解决方案吸引研究人员的注意。解决方案之一是推广新的培训数据从原始数据使用多个数据扩增方法。传统方法包括旋转、缩放和裁剪。除了这些,吴et al。37]采用光、颜色铸造和透镜畸变技术。这些技术可以进一步产生更多不同的训练例子。另一个解决方案是使用弱学习算法来获得更多的培训数据。歌等。101年提出了弱监督方法,可以标签映像级别object-presence。这种方法有助于减少费力边界框注释成本,生成训练数据。

5.2。时间复杂度

培训深层神经网络在早期是非常耗时的。它需要大量的计算资源和不适合实时应用程序。默认情况下,使用gpu加速训练的大型款的帮助下并行计算技术。因此,重要的是要充分利用GPU的计算能力培训款。他和太阳102年]调查培训CNN在时间成本约束下,提出了实际应用快速训练方法同时作为现有的CNN模型类似的性能。李等人。103年]删除所有多余的计算期间培训cnn像素明智的分类,从而导致加速1500倍。

5.3。理论的理解

虽然深学习算法实现有前景的结果在许多任务,基础理论还不是很清楚。有很多问题需要回答。例如,结构比其他体系结构在某些任务?多少层,每一层有多少节点应选择一款吗?除此之外,有一些hyperparameters如学习速率、辍学率,需要调整和规范的力量与特定的知识。

几种方法开发款帮助研究人员更好地理解。Zeiler,费格斯(43)提出了一个可视化的方法,说明了特征过渡层。它显示中间特性可翻译的模式,这可能有助于设计更好的架构未来款。除了可视化功能,Girshick et al。49]试图发现CNN的学习模式,测试性能一层一层地在训练过程中。它表明卷积层可以学习更通用的特性。

虽然有进步在理解深度学习理论,仍有很大提升空间的深度学习理论方面。

6。结论

本文概述的学习算法及其应用。等经典深学习算法限制玻耳兹曼机、深层信念网络,介绍了卷积神经网络。除了深学习算法,他们的应用程序与其他机器学习方法进行了综述和比较。虽然深层神经网络实现良好的性能在许多任务,他们仍然有许多属性,需要调查和合理的。我们讨论了这些挑战并指出一些新的理解和深层神经网络发展的趋势。

相互竞争的利益

作者宣称没有利益冲突有关的出版。

引用

g·e·辛顿美国Osindero, Y.-W。格兰”,快速学习算法深度信念网”,神经计算,18卷,不。7,1527 - 1554年,2006页。
视图: 出版商的网站 | 谷歌学术搜索 | Zentralblatt数学 | MathSciNet
r . Salakhutdinov和g·e·辛顿”,使用深度信念网学习协方差高斯过程的内核,”诉讼21年度会议上的神经信息处理系统(捏' 07)2007年12月,Vcancouver,加拿大,。
视图: 谷歌学术搜索
w·a·艾哈迈德k . Yu, y锣,和大肠,“培训层次视觉识别前馈模型使用从pseudo-tasks转移学习,”美国在欧洲计算机视觉施普林格,页69 - 82年,马赛,法国,2008年10月。
视图: 谷歌学术搜索
y Bengio, p . Lamblin、d . Popovici和h . Larochelle“贪婪layer-wise培训深度网络”先进的神经信息处理系统(捏06年19日),页153 - 160年,麻省理工学院出版社,2007年。
视图: 谷歌学术搜索
h . Larochelle d . Erhan考维尔,a . j . Bergstra y Bengio,“实证评价深架构问题与许多因素的变异,”24日国际会议的程序机器学习(ICML ' 07)ACM,页473 - 480年,Corvalis,矿石,美国,2007年6月。
视图: 出版商的网站 | 谷歌学术搜索
h·李,r . Grosse r . Ranganath, a . y . Ng”卷积深层信念网络分层表示的可伸缩的无监督学习”学报》第26届国际会议上机器学习(ICML ' 09)ACM,页609 - 616年,魁北克,加拿大,2009年6月。
视图: 谷歌学术搜索
m . Ranzato杨绍明。关铭Boureau, y LeCun(“稀疏特性为深层信念网络学习,”先进的神经信息处理系统,第1192 - 1185页,2008年。
视图: 谷歌学术搜索
m . Ranzato c . Poultney s Chopra, y LeCun(“高效学习的稀疏表示能源模型,”诉讼第20届年度会议上的神经信息处理系统(捏06年)加拿大温哥华,页1137 - 1144,2006年12月。
视图: 谷歌学术搜索
p•文森特·h·Larochelle y Bengio和中国。Manzagol”,与去噪autoencoders提取和编写健壮的特性,”美国25日机器学习国际会议ACM,页1096 - 1103年,赫尔辛基芬兰,2008年7月。
视图: 谷歌学术搜索
g·e·辛顿和r . r . Salakhutdinov”,与神经网络,降低数据的维数”科学,卷313,不。5786年,第507 - 504页,2006年。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
r . Salakhutdinov g·e·辛顿,“学习保护类社区结构的非线性嵌入,”学报》第八届国际会议上人工智能和统计(AISTATS ' 07)圣胡安,页412 - 419年,波多黎各,2007年3月。
视图: 谷歌学术搜索
g·w·泰勒和g·e·辛顿,”分解条件限制玻耳兹曼机建模运动风格,”学报》第26届国际会议上机器学习(ICML ' 09)ACM,页1025 - 1032年,魁北克,加拿大,2009年6月。
视图: 谷歌学术搜索
g·w·泰勒·g·e·辛顿,s . t . Roweis“人类运动使用二进制潜变量建模,”先进的神经信息处理系统,第1352 - 1345页,2006年。
视图: 谷歌学术搜索
美国Osindero g·e·辛顿,“建模图像补丁导演马尔可夫随机域的层次结构,”先进的神经信息处理系统,第1128 - 1121页,2008年。
视图: 谷歌学术搜索
m . Ranzato和m . Szummer Semi-supervised紧凑的学习与深层网络文档表示,”美国25日机器学习国际会议ACM,页792 - 799年,赫尔辛基芬兰,2008年7月。
视图: 谷歌学术搜索
r . Salakhutdinov g·辛顿,“语义哈希,”国际期刊的近似推理,50卷,不。7,969 - 978年,2009页。
视图: 出版商的网站 | 谷歌学术搜索
p . e . Utgoff和d . j . Stracuzzi“多层学习,”神经计算,14卷,不。10日,2497 - 2529年,2002页。
视图: 出版商的网站 | 谷歌学术搜索 | Zentralblatt数学
r . Collobert和j·韦斯顿”,自然语言处理的一个统一的体系结构:深层神经网络与多任务学习,”美国25日机器学习国际会议ACM,页160 - 167年,赫尔辛基芬兰,2008年7月。
视图: 谷歌学术搜索
A . Mnih g·辛顿,“一个可伸缩的分层分布式语言模型,”《22日年会在神经信息处理系统(捏' 08),页1081 - 1088,不列颠哥伦比亚,加拿大,2008年12月。
视图: 谷歌学术搜索
j·韦斯顿,f . Ratle h . Mobahi, r . Collobert“通过semi-supervised嵌入深度学习,”神经网络:做生意的诀窍施普林格,页639 - 655年,柏林,德国,2012年。
视图: 谷歌学术搜索
r·哈德a . Erkan p . Sermanet m . Scoffier穆勒,和y LeCun(“深度信念网学习在远程视觉系统自治越野驾驶”《IEEE / RSJ智能机器人和系统国际会议(——08年)不错,页628 - 633年,法国,2008年9月。
视图: 出版商的网站 | 谷歌学术搜索
谢d和l .呗,”层次深通过神经网络进行故障诊断的过程,”学报IEEE 14日机器学习和应用国际会议(ICMLA 15)IEEE,页745 - 748年,迈阿密,佛罗里达州,美国,2015年12月。
视图: 出版商的网站 | 谷歌学术搜索
张勇l . Zhang f·杨,y, y . j .朱”道路裂缝检测使用深卷积神经网络,”《IEEE国际会议上图像处理(ICIP 16),页3708 - 3712年,凤凰城,亚利桑那州,美国,2016年9月。
视图: 出版商的网站 | 谷歌学术搜索
d . Yu和l .邓小平“深度学习和信号与信息处理的应用程序,“IEEE信号处理杂志,28卷,不。1,第154 - 145页,2011。
视图: 出版商的网站 | 谷歌学术搜索
郭y, y, a . Oerlemans老挝,s .吴和m . s . Lew,“深度学习视觉理解:一个评论,”Neurocomputing卷。187年,27-48,2016页。
视图: 出版商的网站 | 谷歌学术搜索
p . Smolensky”,在动力系统信息处理:和谐的基础理论,“技术。众议员DTIC文档,1986。
视图: 谷歌学术搜索
d·h·Ackley, g·e·辛顿,t . j . Sejnowski“玻耳兹曼的机器学习算法,”认知科学,9卷,不。1,第169 - 147页,1985。
视图: 出版商的网站 | 谷歌学术搜索
y LeCun (s . Chopra, r·哈德·m·Ranzato f .黄,“关于能源为基础的教程学习,”预测结构化数据,1卷,麻省理工学院出版社,2006年。
视图: 谷歌学术搜索
勒存y和f·j·黄”,损失函数区别的能源模型、训练”学报第十届国际研讨会在人工智能和统计(AISTATS ' 05),2005年1月。
视图: 谷歌学术搜索
y Bengio”,学习深度为人工智能架构,”基金会和机器学习的趋势,卷2,不。1,1-27,2009页。
视图: 出版商的网站 | 谷歌学术搜索 | Zentralblatt数学
m·威灵电机m . Rosen-Zvi g·e·辛顿,“指数家族人哈摩里斯信息检索应用程序,”先进的神经信息处理系统,第1488 - 1481页,2004年。
视图: 谷歌学术搜索
g .辛顿“深度信念网络,”Scholarpedia,4卷,不。5,货号。5947年,2009年。
视图: 出版商的网站 | 谷歌学术搜索
勒存y和y Bengio”卷积网络图片,语音,和时间系列中,“大脑理论和神经网络的手册,卷3361,不。10,1995年,页1995。
视图: 谷歌学术搜索
d . c . Cireşan a Giusti l . m . Gambardella,的和j。施密德胡贝尔表示“深层神经网络神经元膜段电子显微镜图像,”学报》第26届年会在神经信息处理系统(捏12)2012年12月,页2843 - 2851。
视图: 谷歌学术搜索
j·h·r·罗斯l . Lu刘et al .,“提高计算机辅助检测使用卷积神经网络和随机查看聚合,”IEEE医学成像,35卷,不。5,1170 - 1181年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
谢和z,“Holistically-nested边缘检测,”学报》第15届IEEE计算机视觉国际会议(ICCV 15)IEEE,页1395 - 1403年,圣地亚哥,智利,2015年12月。
视图: 出版商的网站 | 谷歌学术搜索
s . r . Wu, y,问:见鬼,g .太阳,“深空图像:扩大图像识别,”https://arxiv.org/abs/1501.02876。
视图: 谷歌学术搜索
s . r . n . Tajbakhsh j.y. Shin Gurudu et al .,“卷积神经网络用于医学图像分析:完整的培训或微调吗?”IEEE医学成像,35卷,不。5,1299 - 1312年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
H.-C。Shin h·r·罗斯·m·高et al .,“深卷积神经网络计算机辅助检测:CNN架构,数据集特征和转移学习,”IEEE医学成像,35卷,不。5,1285 - 1298年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
d . Erhan y Bengio, a .考维尔中国。Manzagol、p·文森特和s . Bengio“为什么帮助深学习未受训的?”机器学习研究杂志》上11卷,第660 - 625页,2010年。
视图: 谷歌学术搜索 | MathSciNet
o . Abdel-Hamid联合。穆罕默德,江h和g·佩恩,“卷积神经网络概念应用到混合语音识别NN-HMM模型,”IEEE国际会议上声学学报》,演讲,和信号处理(ICASSP 12)IEEE,页4277 - 4280年,京都,日本,2012年3月。
视图: 出版商的网站 | 谷歌学术搜索
a . Krizhevsky i Sutskever, g·e·辛顿“ImageNet分类与深卷积神经网络,”学报》第26届年会在神经信息处理系统(捏12)2012年12月,页1097 - 1105。
视图: 谷歌学术搜索
m . d . Zeiler和r·费格斯“可视化和理解卷积网络”电脑Vision-ECCV 2014: 13日,瑞士苏黎世欧洲会议9月6 - 12,2014年,诉讼,我一部分卷,8689在计算机科学的课堂讲稿施普林格,页818 - 833年,2014年。
视图: 出版商的网站 | 谷歌学术搜索
p . Sermanet d特征,x, m·马蒂厄·r·费格斯,和y LeCun (“Overfeat:综合识别、定位和检测使用卷积网络,”https://arxiv.org/abs/1312.6229。
视图: 谷歌学术搜索
l .张x Wang l .林z梁,和w·左,“深联合任务学习通用对象提取,”学报》第27届国际会议上神经信息处理系统(少量的14)ACM,页523 - 531年,蒙特利尔,加拿大,2014年12月。
视图: 谷歌学术搜索
n . j . Liu躺,z魏et al .,“结肠炎检测腹部CT扫描的功能层次丰富,”2016年医学成像:计算机辅助诊断卷,9785学报学报2016年2月,圣地亚哥,加利福尼亚州,美国。
视图: 出版商的网站 | 谷歌学术搜索
g·罗,r、k .王董,和h·张,“深入学习网络为右心室在震区mri分割,”程序的计算在心脏病学会议(CinC 16)加拿大温哥华,页224 - 227,2016年9月。
视图: 谷歌学术搜索
h·r·罗斯l ., a .法拉克a .孙和r·m·萨默斯(lawrence Summers)”的空间聚合胰腺holistically-nested网络自动分割,“https://arxiv.org/abs/1606.07830。
视图: 谷歌学术搜索
r . Girshick j·多纳休、t·达雷尔和j·马利克,“丰富的特性准确的对象层次结构检测和语义分割”美国27日IEEE计算机视觉与模式识别会议(CVPR 14)IEEE,页580 - 587年,哥伦布,俄亥俄州,美国,2014年6月。
视图: 出版商的网站 | 谷歌学术搜索
在r . Girshick“快速R-CNN。学报》第15届IEEE计算机视觉国际会议(ICCV 15)2015年12月,页1440 - 1448。
视图: 出版商的网站 | 谷歌学术搜索
j .刘高c、d .孟和w·左“CNN对细粒度图像分类,二束语境化”30 AAAI学报》关于人工智能的会议,页4232 - 4233年,凤凰城,亚利桑那州,美国,2016年2月。
视图: 谷歌学术搜索
l . k . Wang Lin w·左顾,l·张,“字典对分类器驱动的卷积神经网络对目标检测,”《IEEE计算机视觉与模式识别会议(CVPR 16)2146年,页2138 -拉斯维加斯,内华达州,美国,2016年6月。
视图: 出版商的网站 | 谷歌学术搜索
w·l·林k . Wang左,m . Wang j .罗和l .张“深结构化模型与radius-margin开往3 d人体活动识别,”国际计算机视觉杂志》上,卷118,不。2、256 - 273年,2016页。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
k . x张,他任美国,j .太阳”深入深入整流器:超越人类imagenet分类、性能”学报》第15届IEEE计算机视觉国际会议(ICCV 15)IEEE,页1026 - 1034年,圣地亚哥,智利,2015年12月。
视图: 出版商的网站 | 谷歌学术搜索
t . Ojala m . Pietikainen, t . Maenpaa”多分辨率灰度和旋转不变的纹理分类与局部二进制模式,”IEEE模式分析与机器智能,24卷,不。7,971 - 987年,2002页。
视图: 出版商的网站 | 谷歌学术搜索
d·g·劳”独特的形象特征尺度不变的要点,国际计算机视觉杂志》上,60卷,不。2、91 - 110年,2004页。
视图: 出版商的网站 | 谷歌学术搜索
m . w . Lu李和张l .,“手掌静脉识别使用定向特性源于局部二进制模式,”国际期刊的信号处理、图像处理和模式识别,9卷,不。5,87 - 98年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
d·谢黄z s . Wang和h·刘,“移动物体分割基于运动估计的压缩监控录像,”21国际会议的程序模式识别(ICPR 12)IEEE,页3132 - 3135年,筑波,日本,2012年11月。
视图: 谷歌学术搜索
d·h·s . Wang Liu谢,b .曾“小说计划为视频大纲代码对象的旗帜,”《IEEE视觉通讯和图像处理(VCIP 12)2012年11月,页1 - 5,。
视图: 出版商的网站 | 谷歌学术搜索
t·金系统由计算机复杂的图像处理和识别人脸的博士。论文)京都大学,3952年,1973年。
d . Chen x曹,f·温,j .太阳”维度的祝福:高维特征及其有效的压缩面对验证,”学报》第26届IEEE计算机视觉与模式识别会议(CVPR 13)2013年6月,页3025 - 3032。
视图: 出版商的网站 | 谷歌学术搜索
x曹,d . Wipf f, g .段和j .太阳,“面对验证,实际转移学习算法”学报14 IEEE计算机视觉国际会议(ICCV 13)2013年12月,页3208 - 3215。
视图: 出版商的网站 | 谷歌学术搜索
t·伯格和p . n . Belhumeur Tom-vs-Pete分类器和identity-preserving对齐的脸,验证”第23届英国机器视觉研讨会论文集(BMVC 12)2012年9月,BMVA出版社,。
视图: 出版商的网站 | 谷歌学术搜索
f . d . Chen x曹,l . Wang, j .太阳,“贝叶斯面临重新审视:联合制定,”电脑Vision-ECCV 2012: 12日欧洲计算机视觉,佛罗伦萨,意大利,7 - 10月,2012年,诉讼,第三部分卷,7574在计算机科学的课堂讲稿施普林格,页566 - 579年,柏林,德国,2012年。
视图: 出版商的网站 | 谷歌学术搜索
美国劳伦斯c·l·贾尔斯a·c·Tsoi和公元后,“人脸识别:卷积神经网络的方法,”IEEE神经网络,8卷,不。1,第113 - 98页,1997。
视图: 出版商的网站 | 谷歌学术搜索
y Taigman, m·杨,m . Ranzato和l .狼”DeepFace:缩小差距以人类性能验证,”美国27日IEEE计算机视觉与模式识别会议(CVPR 14)2014年6月,页1701 - 1708。
视图: 出版商的网站 | 谷歌学术搜索
f·斯沃夫,d . Kalenichenko和j . Philbin”FaceNet:统一嵌入人脸识别和聚类”《IEEE计算机视觉与模式识别会议(CVPR 15)IEEE,页815 - 823年,波士顿,质量,美国,2015年6月。
视图: 出版商的网站 | 谷歌学术搜索
吴x r .他z,太阳,和t . Tan“光CNN深面对嘈杂的标签表示,“https://arxiv.org/abs/1511.02683。
视图: 谷歌学术搜索
o . m . Parkhi a Vedaldi, a . Zisserman“深人脸识别,”《英国机器视觉会议,卷1,p . 2015。
视图: 谷歌学术搜索
b·阿莫斯,b . Ludwiczuk和m . Satyanarayanan”Openface:通用人脸识别与移动应用程序库,“技术。众议员CMU - cs - 16 - 118,卡耐基-梅隆学院的计算机科学,2016。
视图: 谷歌学术搜索
t . Soyata r . Muraleedharan c Funai m . Kwon和w·Heinzelman”Cloud-vision:实时人脸识别使用mobile-cloudlet-cloud加速架构,”学报17 IEEE计算机和通信(ISCC研讨会上的12)2012年7月,页59 - 66。
视图: 出版商的网站 | 谷歌学术搜索
周宏儒。许和K.-T。陈,“人脸识别在无人机:问题和局限性,”学报第一车间在微型飞行器网络、系统和民用应用程序(DroNet 15)页39-44 ACM,佛罗伦萨,意大利,2015年。
视图: 出版商的网站 | 谷歌学术搜索
黄g·b·m·拉梅什t·伯格和e . Learned-Miller”标签面临在野外:数据库为研究人脸识别在不受约束的环境中,“技术。众议员07-49马萨诸塞大学阿默斯特,质量,美国,2007年。
视图: 谷歌学术搜索
n·库马尔,a·c·伯格,p . n . Belhumeur和s·k·纳亚尔,属性和比喻为脸验证分类器,”学报》第12届国际会议上计算机视觉(ICCV ' 09)IEEE,页365 - 372年,京都,日本,2009年10月。
视图: 出版商的网站 | 谷歌学术搜索
j·j·e·f·沃格尔起伏,“整厂工业过程控制问题,”计算机与化学工程,17卷,不。3、245 - 255年,1993页。
视图: 出版商的网站 | 谷歌学术搜索
r . Eslamloueyan”设计一个分层的基于模糊聚类的神经网络通过故障诊断的过程中,“应用软计算杂志,11卷,不。1,第1415 - 1407页,2011。
视图: 出版商的网站 | 谷歌学术搜索
文卡塔萨布拉曼尼亚和k . Chan“过程故障诊断的神经网络方法。”AIChE杂志,35卷,不。12日,第2002 - 1993页,1989年。
视图: 出版商的网站 | 谷歌学术搜索
k .渡边松,m·安·m·日本久保田公司和d·m·库普”初期通过人工神经网络故障诊断的化学过程,”AIChE杂志,35卷,不。11日,第1812 - 1803页,1989年。
视图: 出版商的网站 | 谷歌学术搜索
j.y.风扇、m . Nikolaou和r . e .白色,“化学过程的故障诊断方法,通过神经网络”AIChE杂志,39卷,不。1,第88 - 82页,1993。
视图: 出版商的网站 | 谷歌学术搜索
渡边k . s .大臣、l .侯和d·m·库普”多个同时通过分层人工神经网络故障诊断,”AIChE杂志,40卷,不。5,839 - 848年,1994页。
视图: 出版商的网站 | 谷歌学术搜索
r . Eslamloueyan,主席m·沙赫鲁希表示和r . Bozorgmehri“多重并发故障诊断通过分层和单一的人工神经网络,”Scientia Iranica,10卷,不。3、300 - 310年,2003页。
视图: 谷歌学术搜索
l . h .蒋介石m . e . Kotanchek, a . k . Kordon”故障诊断基于Fisher判别分析和支持向量机,”电脑和化学工程,28卷,不。8,1389 - 1401年,2004页。
视图: 出版商的网站 | 谷歌学术搜索
m . Ge r·杜·g·张,y,“使用支持向量机故障诊断与应用程序在钣金冲压操作中,“机械系统和信号处理,18卷,不。1,第159 - 143页,2004。
视图: 出版商的网站 | 谷歌学术搜索
p . m . Grbovic w . Li, a . k . Usadi l .歌曲和s . Vucetic”通过稀疏分散的故障检测和诊断基于PCA分解和最大熵决策融合,“《过程控制,22卷,不。4、738 - 750年,2012页。
视图: 出版商的网站 | 谷歌学术搜索
w .太阳,邵,r·赵r .严张x, x陈,“稀疏auto-encoder-based深感应电动机故障分类的神经网络方法,”测量卷,89年,第178 - 171页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
m·甘朱和c, c . Wang”建设层次诊断网络基于深度学习及其应用在滚动轴承的故障模式识别,”机械系统和信号处理卷,72 - 73,92 - 104年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
s p .江z, j . Liu Yu和f . Wu”故障诊断基于化学传感器数据与一个活跃的深层神经网络,”传感器,16卷,不。10,1695年,页2016。
视图: 出版商的网站 | 谷歌学术搜索
h . j . Steinhauer a . Karlsson g . Mathiason和t . Helldin“根源定位使用限制玻耳兹曼机,”19国际会议的程序信息融合(融合16)ISIF, 255,页248 - 2016。
视图: 谷歌学术搜索
b . Jokanovic m·阿明,f·艾哈迈德,“雷达使用深度学习下降运动检测,”IEEE雷达研讨会论文集(RadarConf 16)IEEE,费城,宾夕法尼亚州,美国,2016年5月。
视图: 出版商的网站 | 谷歌学术搜索
l·m·弗雷泽”MDR执法。”IEEE势,16卷,不。5日,23日,1997页。
视图: 出版商的网站 | 谷歌学术搜索
e . f . Greneker”雷达手电筒的墙检测人类”学报的诉讼目标和背景:第四特征和代表性方法相比,页280 - 285年,奥兰多,佛罗里达州,美国,1998年4月。
视图: 出版商的网站 | 谷歌学术搜索
j .公园,r·哈维尔·t .月亮,y金,“基于微多分类的人工水生活动通过转移卷积神经网络的学习,“传感器,16卷,不。12,1990页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
j .唱c·庞塞b·塞尔曼,a . Saxena“非结构化的人类活动从RGBD图像,检测”诉讼的IEEE机器人与自动化国际会议的举行(“国际机器人与自动化会议”12),页842 - 849,圣保罗,明尼苏达州,美国,2012年5月。
视图: 出版商的网站 | 谷歌学术搜索
江j . r .史密斯,k . p . Fishkin b . et al .,“人类活动检测,基于rfid技术”ACM的通信,48卷,不。9日,39-44,2005页。
视图: 出版商的网站 | 谷歌学术搜索
p . Van村落和f·c·a . Groen“人类行走与雷达估计,”IEE诉讼:雷达、声纳和导航,卷150,不。5,356 - 366年,2003页。
视图: 出版商的网站 | 谷歌学术搜索
r·j·哈维尔和y金”,应用线性预测编码的人类活动分类基于微多普勒特征,“IEEE地球科学和遥感信,11卷,不。10日,1831 - 1834年,2014页。
视图: 出版商的网站 | 谷歌学术搜索
y金姆和h .凌,“人类活动分类使用支持向量机基于微多普勒特征,“IEEE地球科学和遥感卷,47号5,1328 - 1337年,2009页。
视图: 出版商的网站 | 谷歌学术搜索
r . Igual c Medrano,广场,“挑战、问题和趋势在跌倒检测系统中,“生物医学工程在线,12卷,不。1,第66条,2013。
视图: 出版商的网站 | 谷歌学术搜索
p . Rashidi和A . Mihailidis”调查ambient-assisted老年人生活的工具,”IEEE生物医学和卫生信息学杂志》上,17卷,不。3、579 - 590年,2013页。
视图: 出版商的网站 | 谷歌学术搜索
汗和b . Taati”检测看不见的瀑布从可穿戴设备使用channel-wise autoencoders合奏,”https://arxiv.org/abs/1610.03761。
视图: 谷歌学术搜索
h . o .歌曲,s . Jegelka y . j . Lee和t·达雷尔“Weakly-supervised发现视觉模式配置,”学报》第28届年会在神经信息处理系统(少量的14),页1637 - 1645,魁北克,加拿大,2014年12月。
视图: 谷歌学术搜索
k和j .太阳,“卷积神经网络在限制时间成本,”《IEEE计算机视觉与模式识别会议(CVPR 15),页5353 - 5360,波士顿,质量,美国,2015年6月。
视图: 出版商的网站 | 谷歌学术搜索
r·h . Li赵、王x”高效向前和向后传播pixelwise卷积神经网络的分类,“https://arxiv.org/abs/1412.4526。
视图: 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

10677年

下载

5364年

引用