复杂性gydF4y2Ba 复杂性gydF4y2Ba 1099 - 0526gydF4y2Ba 1076 - 2787gydF4y2Ba HindawigydF4y2Ba 10.1155 / 2019/4042624gydF4y2Ba 4042624gydF4y2Ba 研究文章gydF4y2Ba 一块基于特征融合的目标检测方法网络自主车辆gydF4y2Ba http://orcid.org/0000 - 0002 - 0864 - 8915gydF4y2Ba 孟gydF4y2Ba 乔gydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba http://orcid.org/0000 - 0002 - 8590 - 0061gydF4y2Ba 首歌gydF4y2Ba 环生gydF4y2Ba 1gydF4y2Ba http://orcid.org/0000 - 0001 - 7436 - 1595gydF4y2Ba 李gydF4y2Ba 帮派gydF4y2Ba 1gydF4y2Ba 张gydF4y2Ba 于安gydF4y2Ba 2gydF4y2Ba 张gydF4y2Ba XiangqinggydF4y2Ba 1gydF4y2Ba 邓gydF4y2Ba 柯gydF4y2Ba 1gydF4y2Ba 信息工程学院gydF4y2Ba 长安大学gydF4y2Ba 西安gydF4y2Ba 陕西710064年gydF4y2Ba 中国gydF4y2Ba chd.edu.cngydF4y2Ba 2gydF4y2Ba 计算机技术和应用部门gydF4y2Ba 青海大学gydF4y2Ba 西宁810016gydF4y2Ba 中国gydF4y2Ba qhu.edu.cngydF4y2Ba 2019年gydF4y2Ba 6gydF4y2Ba 2gydF4y2Ba 2019年gydF4y2Ba 2019年gydF4y2Ba 24gydF4y2Ba 11gydF4y2Ba 2018年gydF4y2Ba 21gydF4y2Ba 01gydF4y2Ba 2019年gydF4y2Ba 6gydF4y2Ba 2gydF4y2Ba 2019年gydF4y2Ba 2019年gydF4y2Ba 版权©2019乔孟et al。gydF4y2Ba 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。gydF4y2Ba

现在,自动多目标检测自主车辆技术仍然是一个具有挑战性的问题。在过去的几十年中,深度学习已被证明成功的多目标检测,如单发射击Multibox检测器(SSD)模型。当前的趋势是让火车深卷积神经网络(cnn)和在线自主车辆的数据集。然而,当检测到小物体通常网络性能降低。此外,现有的自主车辆数据集不能满足国内交通环境的必要性。改善小物体的检测性能和确保数据的有效性,我们提出一种新的方法。具体来说,分为原始图像块作为输入到VGG-16地图融合在cnn网络添加特性。此外,构建图像金字塔项目检测结果的所有数据块大小尽可能多的原始对象。除了改进检测方法,创建一个新的数据集自主驾驶车辆,对象分类和标签的标准定义,并提出一种数据扩增方法。新的数据集上的实验结果表明,该方法的性能大大提高,特别是对于小物体检测在大图像。 Moreover, the proposed method is adaptive to complex climatic conditions and contributes a lot for autonomous vehicle perception and planning.

中国国家自然科学基金gydF4y2Ba 61572083gydF4y2Ba 陕西省科技计划项目gydF4y2Ba 2014年jm8351gydF4y2Ba 在青海省科技项目gydF4y2Ba 2017 - zj - 717gydF4y2Ba
1。介绍gydF4y2Ba

环境感知是一个重要的自主驾驶系统的一部分,和传感器用于检测包括超声波雷达、毫米波雷达,激光雷达(光探测和测距),和照相机。通过激光雷达的融合、毫米波雷达和摄像机,对象可以被探测到,物体空间范围和识别可以实现。特别,相机和激光雷达的融合不仅可以实现高精度定位的对象还可以实现多种类型的对象的检测。然而,由于激光的高成本,这种传感器融合不能在未来成为一个受欢迎的方法。相比之下,低成本的相机将应用于自主车辆感知系统,如目标检测和分类。gydF4y2Ba

目前,有两个目标检测算法,即传统的图像处理和深度学习分类。通过图像的分析和处理,这两种方法可以返回对象的位置和分类信息,为规划和决策提供有效的信息系统。然而,由于极其丰富的图像信息和困难的手工造型,传统的图像处理方法的准确性比深度学习的方法。因此,越来越多的基于成像深度学习algorithmscan让自主车辆的感知更加准确、快速和全面的。目前,现有的深度学习系统可以分为两类。一个是该地区的建议方法,比如R-CNN [gydF4y2Ba 1gydF4y2Ba),快R-CNN [gydF4y2Ba 2gydF4y2Ba]和更快的R-CNN [gydF4y2Ba 3gydF4y2Ba]。另一个是proposal-free方法,比如你只看一次(YOLO)的意思gydF4y2Ba 4gydF4y2Ba)和单镜头多箱式检测器(SSD) (gydF4y2Ba 5gydF4y2Ba]。近年来,SSD模型具有明显的优势为视频对象检测的检测速度和精度。然而,一些问题仍然存在于SSD模型。第一个问题是数据集。一个丰富的数据集对目标检测是至关重要的。目前,自主驾驶的当前数据集是基于外国交通场景,如KITTI、城市等。第二个问题在于分类精度。SSD模型的检测精度低于R-CNN更快。特别,随着网络的深化,小物体的卷积过程中逐渐失去了SSD模型。gydF4y2Ba

在这项研究中,我们提出一个新颖的方法来检测对象为自动驾驶。本文的贡献包括4分。首先,我们把原始图像划分成块(块大小为400×400),它可以检测小物体的图像,然后我们调整每一块一个固定大小(512×512)进行训练。第二,原始图像是down-sampled 1/2倍的倍数,直到图像大小接近的块大小,确保大型对象可以完全覆盖在一个单一的图像块。第三,SSD的特征映射模型逐渐收缩,小物体的特征信息消失或变得不显眼的。因此,SSD模型中添加一个特征融合方法,以确保小物体的检测精度在大图像。第四,样品收集和自己贴上标签,我们设计了对象类别和注释的方法。gydF4y2Ba

本文将描述如下:部分gydF4y2Ba 2gydF4y2Ba详细介绍我们的方法。部分gydF4y2Ba 3gydF4y2Ba描述了实验的方法。部分gydF4y2Ba 4gydF4y2Ba显示了实验结果和分析实验结果。部分gydF4y2Ba 5gydF4y2Ba本文提供了一个讨论和未来的工作。gydF4y2Ba

2。方法gydF4y2Ba

在本节中,我们描述的细节改进的SSD模型使用特征融合和图像块分割的方法,并介绍了创建一个自主驾驶数据集的方法。gydF4y2Ba

2.1。特征融合网络gydF4y2Ba

SSD模型直接提取不同尺度不同特性cnn的地图层,如图gydF4y2Ba 1(一)gydF4y2Ba。这种方法不能融合特征图谱的不同尺度,不同尺度的特征图是相互独立的。因此,基于SSD模型,我们提出一种新的图像特征融合算法,通常需要多个功能合并进程和消耗很多时间。gydF4y2Ba

我们SSD512框架。红盒子的标签如图(一)是SSD框架提出了gydF4y2Ba 5gydF4y2Ba),红框标记在图的一部分(b)是我们SSD512框架。图(b)使用一个金字塔特征融合方法的融合特征图2倍关系以递归的方式。gydF4y2Ba

如图gydF4y2Ba 1 (b)gydF4y2Ba卷积VGG16网络后,七层添加了提取特征,包括conv6_1 conv6_2, conv7_2, conv8_2 conv10_2, conv11_2。卷积这七层的特性图尺寸是32×32岁的32×32岁8×8,16×16日4×4,2×2,1×1。通过分析,当特征地图大小小于16×16,对象继续萎缩,及其特征逐渐消失,所以功能融合无法实施。摘要双线性函数是用来融合特性不同大小的地图。特征映射upsampled从conv7_2及其大小不小于16×16。由于双线性函数将一个像素转换成4个像素,也就是说,当前图像是翻了一倍,因此,conv7_2, conv6_2, conv4_3满足upsampling选择患病率的关系。在双线性操作之前,conv 1×1在图像上执行操作,减少晕菜featureand加快计算的维数(gydF4y2Ba 6gydF4y2Ba]。具体计算方法如下:gydF4y2Ba (1)gydF4y2Ba YgydF4y2Ba 我gydF4y2Ba =gydF4y2Ba BgydF4y2Ba 我gydF4y2Ba lgydF4y2Ba 我gydF4y2Ba ngydF4y2Ba egydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba ygydF4y2Ba 我gydF4y2Ba 在哪里gydF4y2Ba ygydF4y2Ba 我gydF4y2Ba 意味着一个特性映射需要合并,gydF4y2Ba BgydF4y2Ba 我gydF4y2Ba lgydF4y2Ba 我gydF4y2Ba ngydF4y2Ba egydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba 是线性插值函数,gydF4y2Ba YgydF4y2Ba 我gydF4y2Ba 地图是一个功能是放大一倍。通过这个方程的计算,融合特征图调整到相同的大小。此外,功能相同大小的地图使用element-wise-max融合方法,保留了最大值的对应位置像素值的两个特征图。具体计算方法如下:gydF4y2Ba (2)gydF4y2Ba egydF4y2Ba lgydF4y2Ba egydF4y2Ba 米gydF4y2Ba egydF4y2Ba ngydF4y2Ba tgydF4y2Ba - - - - - -gydF4y2Ba wgydF4y2Ba 我gydF4y2Ba 年代gydF4y2Ba egydF4y2Ba - - - - - -gydF4y2Ba 马克斯gydF4y2Ba ⁡gydF4y2Ba YgydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba YgydF4y2Ba jgydF4y2Ba =gydF4y2Ba TgydF4y2Ba 马克斯gydF4y2Ba ⁡gydF4y2Ba XgydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba jgydF4y2Ba ,gydF4y2Ba YgydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba jgydF4y2Ba 在哪里gydF4y2Ba YgydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba YgydF4y2Ba jgydF4y2Ba 代表特征图具有相同的大小,gydF4y2Ba TgydF4y2Ba 代表了一个新特性映射矩阵融合后生成,和gydF4y2Ba XgydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba jgydF4y2Ba ,gydF4y2Ba YgydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba jgydF4y2Ba 分别代表合并后的像素值映射矩阵的特性。通过特征融合element-wise-max函数,生成像素层,和像素层不断采样生成一个金字塔特征映射,这是本文的特征融合方法。表gydF4y2Ba 1gydF4y2Ba比较平均的平均精度(地图)和帧率(fps)不同的SSD模型。gydF4y2Ba

比较不同SSD512模型的性能KITTI数据集上测试过。gydF4y2Ba

结构gydF4y2Ba 类型gydF4y2Ba KITTI测试(图)gydF4y2Ba KITTI测试(fps)gydF4y2Ba
SSD512gydF4y2Ba 没有地图功能融合gydF4y2Ba 75.6gydF4y2Ba 42gydF4y2Ba

DSSD512gydF4y2Ba 合并功能地图包括提取不同尺度gydF4y2Ba 76.8gydF4y2Ba 31日gydF4y2Ba

我们SSD512gydF4y2Ba 合并功能映射之前提取不同尺度gydF4y2Ba 77.4gydF4y2Ba 35gydF4y2Ba
2.2。数据集gydF4y2Ba

深度学习的数据集的重要性是毋庸置疑的。一个丰富的数据集对目标检测是至关重要的。目前,计算机视觉领域的数据集包括ImageNet [gydF4y2Ba 7gydF4y2Ba],可可[gydF4y2Ba 8gydF4y2Ba]和帕斯卡VOC [gydF4y2Ba 9gydF4y2Ba)等。此外,自主驾驶主要使用的数据集KITTI [gydF4y2Ba 10gydF4y2Ba]数据集或城市风光gydF4y2Ba 11gydF4y2Ba数据集。表gydF4y2Ba 2gydF4y2Ba比较这两个数据集。gydF4y2Ba

比较不同的数据集。gydF4y2Ba

数据集gydF4y2Ba 类别gydF4y2Ba 函数gydF4y2Ba 时间gydF4y2Ba
KITTIgydF4y2Ba 汽车、货车、卡车、行人、骑自行车的有轨电车gydF4y2Ba 评价的计算机视觉算法在自动驾驶的场景gydF4y2Ba 2012年gydF4y2Ba

城市风光gydF4y2Ba 平,自然,车辆,天空,对象,人类、建筑gydF4y2Ba 城市场景语义的理解gydF4y2Ba 2016年gydF4y2Ba

自从KITTI或城市数据集自动驾驶计算机视觉的满足需求,角度和类别的样本和国内需求不匹配得很好。因此,有必要建立一个新的数据集,不仅满足角度要求,也符合当前国内交通环境。gydF4y2Ba

2.2.1。样品收集gydF4y2Ba

(gydF4y2Ba 1)样品采集平台gydF4y2Ba。为了创建一个新的数据集符合我们的要求,我们应用数据采集平台自主车辆收集样本真实交通环境。数据采集平台配备了高动态摄像机(acA1920),调速发电机64 - e激光雷达和差分GNSS接收机(Simpeak 982)。我们收集的数据集包含真实图像数据从城市,农村,高速公路场景,等。此外,每个图像包含至少一个车辆或行人。整个系统和同步采样10赫兹的频率。在图像采集系统中,摄像机拍摄距离我们的自主汽车是13米,和捕获的图像的分辨率是1920×1200。此外,他指的是中国现状的交通道路,我们分类标签分为七类,包括汽车,卡车,公共汽车,小型汽车,自行车,摩托车。gydF4y2Ba

(gydF4y2Ba 2)样本增大。gydF4y2Ba交通场景捕捉到图像采集平台包括城市道路、高速公路、隧道和弯曲的道路。此外,一些样本收集复杂气候条件下,如雨天和雾天里。自深学习需要大量的训练样本学习对象特性,我们使用样本扩充方法扩展数据集。如图gydF4y2Ba 2gydF4y2Ba,具体过程如下。gydF4y2Ba

图像是如何增强方法的例子“看到”对象。(一)转变形象根据坐标系统。(b)在不同角度旋转图像。gydF4y2Ba

步骤1。gydF4y2Ba

从所有的随机选择一个映像pre-trained图像。gydF4y2Ba

步骤2。gydF4y2Ba

对于每一个形象,一个小块随机取样,小块的比例设置gydF4y2Ba 1gydF4y2Ba /gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 2gydF4y2Ba 与对象,重叠率是0.1,0.3,0.5,0.7和0.9。gydF4y2Ba

步骤3。gydF4y2Ba

如果中央点采样块的边界框,重叠部分保留。gydF4y2Ba

步骤4。gydF4y2Ba

本文使用一个固定的大小为512×512。调整每个样本固定大小,然后转移或旋转固定块在一个随机的概率为0.5的水平上。gydF4y2Ba

2.2.2。注释gydF4y2Ba

样品的多样性是至关重要的,确保检测的准确性(gydF4y2Ba 12gydF4y2Ba]。因此,样本的选择应考虑多个角度,复杂的气候条件,阻塞比和截断比。图像注释的原则我们建议如下。gydF4y2Ba

(gydF4y2Ba 1)从多个角度选择样本gydF4y2Ba。有轻微的差异样本的特征从不同角度(gydF4y2Ba 13gydF4y2Ba]。因此,图像角度是至关重要的。从积极的角度我们标签样品,扭转角和侧角,确保样本的全面性。表gydF4y2Ba 3gydF4y2Ba显示了七种类型的数量的统计样本从不同的角度。gydF4y2Ba

从不同的角度SSMCAR数据集的样本统计量。gydF4y2Ba

积极的角度gydF4y2Ba 扭转角gydF4y2Ba 侧角gydF4y2Ba
雾gydF4y2Ba 雨gydF4y2Ba 阳光明媚的gydF4y2Ba 多云的gydF4y2Ba 雾gydF4y2Ba 雨gydF4y2Ba 阳光明媚的gydF4y2Ba 多云的gydF4y2Ba 雾gydF4y2Ba 雨gydF4y2Ba 阳光明媚的gydF4y2Ba 多云的gydF4y2Ba
人gydF4y2Ba 187年gydF4y2Ba 94年gydF4y2Ba 385年gydF4y2Ba 201年gydF4y2Ba 109年gydF4y2Ba 81年gydF4y2Ba 175年gydF4y2Ba 184年gydF4y2Ba 176年gydF4y2Ba 79年gydF4y2Ba 293年gydF4y2Ba 183年gydF4y2Ba
骑自行车的人gydF4y2Ba 133年gydF4y2Ba 35gydF4y2Ba 257年gydF4y2Ba 123年gydF4y2Ba 36gydF4y2Ba 47gydF4y2Ba 214年gydF4y2Ba 169年gydF4y2Ba 73年gydF4y2Ba 41gydF4y2Ba 121年gydF4y2Ba 144年gydF4y2Ba
摩托车gydF4y2Ba 89年gydF4y2Ba 47gydF4y2Ba 101年gydF4y2Ba 82年gydF4y2Ba 59gydF4y2Ba 42gydF4y2Ba 97年gydF4y2Ba 59gydF4y2Ba 33gydF4y2Ba 29日gydF4y2Ba 61年gydF4y2Ba 64年gydF4y2Ba
车gydF4y2Ba 198年gydF4y2Ba 241年gydF4y2Ba 278年gydF4y2Ba 261年gydF4y2Ba 142年gydF4y2Ba 169年gydF4y2Ba 205年gydF4y2Ba 193年gydF4y2Ba 192年gydF4y2Ba 105年gydF4y2Ba 217年gydF4y2Ba 254年gydF4y2Ba
总线(小巴)gydF4y2Ba 106年gydF4y2Ba 166年gydF4y2Ba 183年gydF4y2Ba 201年gydF4y2Ba 137年gydF4y2Ba 121年gydF4y2Ba 156年gydF4y2Ba 75年gydF4y2Ba 143年gydF4y2Ba 152年gydF4y2Ba 224年gydF4y2Ba 104年gydF4y2Ba
公共汽车gydF4y2Ba 99年gydF4y2Ba 102年gydF4y2Ba 129年gydF4y2Ba 79年gydF4y2Ba 101年gydF4y2Ba 66年gydF4y2Ba 98年gydF4y2Ba 106年gydF4y2Ba 136年gydF4y2Ba 97年gydF4y2Ba 165年gydF4y2Ba 144年gydF4y2Ba
卡车gydF4y2Ba 129年gydF4y2Ba 89年gydF4y2Ba 153年gydF4y2Ba 128年gydF4y2Ba 96年gydF4y2Ba 108年gydF4y2Ba 124年gydF4y2Ba 152年gydF4y2Ba 185年gydF4y2Ba 123年gydF4y2Ba 148年gydF4y2Ba 267年gydF4y2Ba

(gydF4y2Ba 2)选择复杂的气候条件gydF4y2Ba。在恶劣天气条件下,该模型极大地影响能见度。在分析此次收购高度和清晰的摄像头,我们把坏天气分为雾,下雨,晴朗,多云。此外,我们的标签样品在不同的气候条件,以确保样本特征对环境的适应性。gydF4y2Ba

(gydF4y2Ba 3)设置闭塞率gydF4y2Ba。人眼可以很容易地遵循一个特定的对象在一段时间(gydF4y2Ba 14gydF4y2Ba]。然而,对于这台机器来说,这个任务并不简单。一般来说,对象跟踪过程中有各种复杂的情况,比如闭塞率是一个重要的问题。调查后,我们定义一个分数的遮挡边界框。具体定义方法分为三种情况:遮挡、部分遮挡和闭塞。在这篇文章中,如果车辆的遮挡率大于40%,我们定义它为沉重的闭塞。同样的,当车辆的遮挡率在1%和40%之间,我们认为这是部分阻塞。为了确保检测的准确性,我们规定,只有部分闭塞和没有贴上闭塞,严重阻塞并不是标签。gydF4y2Ba

(gydF4y2Ba 4)设置截断比率gydF4y2Ba。并不是所有的图像中对象的标签。根据网络训练的要求,截断比设置为1/3。换句话说,如果对象超出图像边界的面积大于1/3的对象区域,然后我们不标签对象。gydF4y2Ba

根据定义的标签原理,具体标签过程包括三个步骤。第一步是确定标记文件的存储位置和新创建的数据集的存储位置,并得出样本中的每个对象的边界框。第二步是将标签类别分配给每个对象的边界框。第三步是确定样品中的对象是否堵塞或截断,如果存在,描述对象的字段需要添加标签。gydF4y2Ba

在这个工作中,共有11550个图像标签,其中包括10394 1156训练集和测试集。此外,新的数据集SSMCAR命名。图gydF4y2Ba 3gydF4y2Ba是SSMCAR的快照数据集注释。gydF4y2Ba

快照的七大类对象及其符号由自己。其中,图中的总线范畴代表公共汽车和小型公共汽车。此外,该数据集将用于进一步的实验。gydF4y2Ba

2.3。图像块的架构gydF4y2Ba

从当前gpu的有限的可用内存,这不是可行的深卷积网络接受大图像作为输入,尤其是对图像大小大于2000×2000gydF4y2Ba 14gydF4y2Ba]。在SSD检测模型中,一个固定大小的缩放整个图像。如图gydF4y2Ba 1(一)gydF4y2Ba调整图像的大小512×512。这种方法的缺点是,它直接固定大小调整图像的大小,这不仅会降低图像的分辨率本身,还影响了学习的有效性对象特征,特别是对大图像。因此,一个物体检测方法,提出了基于图像块。如图gydF4y2Ba 1 (b)gydF4y2Ba,输入图像分为块根据一定的策略gydF4y2Ba 15gydF4y2Ba),然后每一块是根据我们的SSD训练方法。gydF4y2Ba

在我们SSD512框架,为了不改变图像本身的质量在最大的程度上,我们提出一个策略将原始图像划分为块大小不同。自从SSD模式需要调整提前一个固定大小的图片,如调整图像大小为300×300或512×512。同时,卷积神经网络的特征表明,原始图像的最小的调整有一个小的影响最终的检测结果。因此,我们使用枚举方法将原始图像划分为块的大小为300×300或512×512,然后选择最好的方框图。图像块完成后,每一块将被调整到300×300或512×512输入到我们的SSD模型。这种方法有两个优点。一方面,它减少了损失小物体的过程中网络学习,另一方面,它减少了SSD图像质量退化的方法问题。诚然,图像的大小越大,该方法的检测结果越好。在本文中,我们研究的主要目的是多目标检测自动驾驶。因此,我们使用我们自己的数据集作为一个例子来说明物体的具体策略。gydF4y2Ba

在本文中,样本的大小是1920×1200。我们假设输入的固定大小的网络是512×512,和使用枚举方法选择不同大小接近512×512段原始图像。计算公式如下所示:gydF4y2Ba (3)gydF4y2Ba xgydF4y2Ba ,gydF4y2Ba ygydF4y2Ba =gydF4y2Ba 300300年gydF4y2Ba ,gydF4y2Ba 400400年gydF4y2Ba ,gydF4y2Ba 500500年gydF4y2Ba ,gydF4y2Ba 600600年gydF4y2Ba xgydF4y2Ba ,gydF4y2Ba ygydF4y2Ba ∈gydF4y2Ba 300700年gydF4y2Ba 在哪里gydF4y2Ba xgydF4y2Ba ,gydF4y2Ba ygydF4y2Ba 代表了横向和纵向的块大小。如图gydF4y2Ba 4gydF4y2Ba使用自上而下,从左到右的方法,把图像在水平和垂直方向。gydF4y2Ba

不同的阻断策略为1920×1200的图片。代表相同大小的块,同样的颜色,不同的颜色代表不同的块大小。300×300块策略收益两种不同大小的300×300、120×300块,包括24块300×300和4块120×300,(a)中描述。同样,400×400块策略收益两种不同大小的400×400、320×400块,包括12块400×400和3块320×400 (b)中描述。此外,块的策略500×500、600×600的相同数据(a)和(b)所示(c)和(d)。gydF4y2Ba

因为我们使用的网络模型图gydF4y2Ba 1 (b)gydF4y2Ba是一个512×512模型,我们需要调整大小的块大小为512×512,然后再把它传递给网络。我们定义两个标准来选择最好的方框图。一个是块的大小最接近512×512;其二,块与块之间的差异最小,每一块的比例是最大的。在图gydF4y2Ba 4 (b)gydF4y2Ba,400×400块策略收益两种不同大小的400×400、320×400块,包括12块400×400和3块320×400,基于我们定义屏蔽方案,我们发现图gydF4y2Ba 4 (b)gydF4y2Ba是最好的阻断策略将产生最佳的学习效果,为我们的SSD模型误差最小。因此本文使用这种阻塞方法,该方法将图像划分为400×400块。gydF4y2Ba

3所示。实验gydF4y2Ba 3.1。训练我们的SSD模型gydF4y2Ba

我们的SSD模型有一个很大的训练参数。如果我们从头训练所有网络的特点,不仅费时而且容易过度拟合数据和梯度non-convergence [gydF4y2Ba 15gydF4y2Ba]。本文将学习(gydF4y2Ba 16gydF4y2Ba方法应用。基于pre-trained模型,模型的训练精度和损失函数比较使用不同的数据集和不同的网络。gydF4y2Ba

在培训过程中,我们的SSD模型需要每个块中的所有锚在一个图形窗口来确定是否存在一个对象的窗口。如果有一个对象,它预测对象的类别和位置信息,否则,它定义了锚为背景。如图gydF4y2Ba 5gydF4y2Ba,削减我们的SSD模型图的每一块到8732锚的大小不同,每一个都有一个感兴趣的区域(ROI) (gydF4y2Ba 17gydF4y2Ba]。我们使用这8732锚作为一批培训,因此,我们定义ROI和对象,如果满足条件,重叠率大于0.7,标签设置的对象和抵消地区预计从相应的锚,否则,标签设置为背景。gydF4y2Ba

我们的SSD模型的训练方法。左:一个400×400块,大小为512×512。中间:将图像分为大小不同的锚。正确的:我们的SSD模型火车这些锚预测对象的类别和位置。gydF4y2Ba

3.2。SSD的损失函数模型gydF4y2Ba

损失函数应用于评估网络性能的固态硬盘模式gydF4y2Ba 18gydF4y2Ba]。损失函数分为本地化损失(loc)和分类损失(配置)gydF4y2Ba 19gydF4y2Ba,gydF4y2Ba 20.gydF4y2Ba),定义如下:gydF4y2Ba (4)gydF4y2Ba lgydF4y2Ba xgydF4y2Ba ,gydF4y2Ba cgydF4y2Ba ,gydF4y2Ba lgydF4y2Ba ,gydF4y2Ba ggydF4y2Ba =gydF4y2Ba 1gydF4y2Ba NgydF4y2Ba lgydF4y2Ba cgydF4y2Ba ogydF4y2Ba ngydF4y2Ba fgydF4y2Ba xgydF4y2Ba ,gydF4y2Ba cgydF4y2Ba +gydF4y2Ba αgydF4y2Ba lgydF4y2Ba lgydF4y2Ba ogydF4y2Ba cgydF4y2Ba xgydF4y2Ba ,gydF4y2Ba lgydF4y2Ba ,gydF4y2Ba ggydF4y2Ba 在哪里gydF4y2Ba xgydF4y2Ba 是一个默认匹配箱;gydF4y2Ba NgydF4y2Ba 是所有匹配的默认框,如果gydF4y2Ba NgydF4y2Ba =gydF4y2Ba 0gydF4y2Ba ,然后gydF4y2Ba lgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba 年代gydF4y2Ba =gydF4y2Ba 0gydF4y2Ba 。gydF4y2Ba lgydF4y2Ba cgydF4y2Ba ogydF4y2Ba ngydF4y2Ba fgydF4y2Ba 是将softmax损失在对象类实际上是[丧失信心gydF4y2Ba 5gydF4y2Ba];gydF4y2Ba lgydF4y2Ba lgydF4y2Ba ogydF4y2Ba cgydF4y2Ba 是gydF4y2Ba 年代gydF4y2Ba 米gydF4y2Ba ogydF4y2Ba ogydF4y2Ba tgydF4y2Ba hgydF4y2Ba lgydF4y2Ba 1gydF4y2Ba 损失(gydF4y2Ba 5gydF4y2Ba根据预测框);gydF4y2Ba αgydF4y2Ba 通过交叉验证设置为1。gydF4y2Ba

3.3。测试我们的SSD模型gydF4y2Ba 3.3.1。图像金字塔结构gydF4y2Ba

作为我们的SSD模型被设计成敏感小对象,一些大型对象分为不同的模块,这可能会导致损失的原始分辨率大对象的特性。创建一个图像金字塔来解决这个问题。具体地说,一个图像金字塔规则提出了构建图像金字塔,在低分辨率图像的大小比高分辨率图像大小的0.5倍。此外,由于我们的网络模型是512×512,见图gydF4y2Ba 1 (b)gydF4y2Ba,如果图像大小小于512×512太多,这将不利于学习的对象特征。如图gydF4y2Ba 6gydF4y2Ba,数据集图像的分辨率为1920×1200,第三层的图像尺寸图像的金字塔是480×300。根据我们的金字塔施工方法,第四层的图像大小为240×150没有价值的学习对象的特性,所以三层图像金字塔结构构造。gydF4y2Ba

说明提出的图像金字塔结构。作为输入的原始图像分为块SSD模型生产对象检测结果。此外,建立一个图像金字塔。每一层的图像可以预测对象的检测结果。因此,采用非最大抑制生成最终的检测结果。gydF4y2Ba

3.3.2。Non-Maximum抑制方法gydF4y2Ba

我们注意到SSD模型预测结果对每一层的图像。如图gydF4y2Ba 6gydF4y2Ba,我们可以看到有三个边界框在相同的位置在图像金字塔结构中,可以产生性的检测。因此,NMS (gydF4y2Ba 21gydF4y2Ba,gydF4y2Ba 22gydF4y2Ba)算法可以用来消除冗余(cross-repeat) windows和找到最好的对象检测位置。gydF4y2Ba

4所示。结果和分析gydF4y2Ba

有三个参数为评价目标检测性能,包括精度、损失,和检出率(gydF4y2Ba 23gydF4y2Ba- - - - - -gydF4y2Ba 26gydF4y2Ba]。具体来说,参数映射的平均分类精度的七个对象,并将其值在0和1之间。地图的价值越大,分类精度越高。另外,帧率(fps)是用来评估检测速度。gydF4y2Ba

4.1。精度gydF4y2Ba

在本文中,我们使用SSD模型和SSD模型训练数据集和测试VOC, KITTI数据集,数据集(SSMCAR)。在这个过程中,单一英伟达1080 ti GPU应用服务器,初始学习速率设置为0.01,迭代次数设置为100000和120000倍。gydF4y2Ba

如左边的图所示gydF4y2Ba 7gydF4y2Ba,SSMCAR数据集的精度远高于VOC2007数据集或KITTI数据集。自决议VOC2007数据集和KITTI数据集是500×375、1242×375,相应地,SSMCAR数据集是1920×1200的分辨率,SSMCAR数据集的图像质量高于VOC2007数据集和KITTI数据集。此外,收集的角度和SSMCAR数据集的标签原则不同于VOC2007数据集和KITTI数据集。进一步的实验后,这表明增加样本的数量对提高精度没有影响。此外,从数据gydF4y2Ba 7(一)gydF4y2Ba和gydF4y2Ba 7 (b)gydF4y2Ba可以看出,最优解的迭代次数时VOC数据集和KITTI数据集达到100000次,最高的精度。如图gydF4y2Ba 7 (c)gydF4y2Ba我们创建为SSMCAR数据集,优化解决方案出现在100000年和120000年之间迭代。gydF4y2Ba

说明的准确性曲线在训练和测试阶段。横坐标表示的值精度(%),纵坐标表示迭代次数(次)。左:SSD的精度曲线模型VOC2007数据集,KITTI数据集,SSMCAR数据集。右:SSD的精度曲线模型VOC2007数据集,KITTI数据集,SSMCAR数据集。gydF4y2Ba

如右边所示图gydF4y2Ba 7gydF4y2Ba,我们的SSD模型的精度高于SSD模型。与SSD模型直接调整图像512×512,我们的SSD模型使用的图像块,图像金字塔,和特征融合方法保护原始图像的特征。gydF4y2Ba

4.2。损失gydF4y2Ba

每次完成培训过程后,一个合适的学习速率可以保证损失减少到一段时间后(一个较小的值gydF4y2Ba 27gydF4y2Ba,gydF4y2Ba 28gydF4y2Ba]。学习速率太小往往使损失减少非常缓慢。相反,如果设置了学习速率过大,最初的损失可以减少非常快,然后重复在一定的距离最小损失值没有下降(gydF4y2Ba 29日gydF4y2Ba]。因此,初始学习速率设置为0.01,每一次迭代的学习速率降低。此外,损失是全损;它包括分类损失、定位和目标检测损失损失。摘要随着训练时间的增加,总损失逐渐减小,直到它变得稳定和培训达到收敛;否则,如果继续培训培训达到收敛时,就会发生过度拟合。gydF4y2Ba

如图gydF4y2Ba 8gydF4y2Ba,我们的SSD模型比SSD较长的训练时间模型,但其总损失值是最小的。此外,损失的综合性能和时间我们的数据集是优于VOC2007数据集和KITTI数据集。gydF4y2Ba

说明总损失曲线的变化与训练时间在训练阶段。横坐标表示全损的值,纵坐标表示时间的价值。左:SSD的总损失曲线模型VOC2007, KITTI, SSMCAR数据集。右:SSD的总损失曲线模型VOC2007, KITTI, SSMCAR数据集。gydF4y2Ba

4.3。检出率gydF4y2Ba

随机获取自主驾驶视频不同的交通场景测试对象检测的结果。如图gydF4y2Ba 9gydF4y2Ba在同等检测模型中,数据集的性能优于KITTI数据集。与此同时,在相同的数据集,我们的检测结果SSD模型远优于SSD模型。特别是对象是否小型或者大型的,我们的方法可以有效地检测和分类对象。此外,我们的方法是适应环境和气候变化。与此同时,统计数据表gydF4y2Ba 4gydF4y2Ba显示了分类检测精度,平均检测精度,不同方法的检出率。gydF4y2Ba

比较的对象检测对不同模型的影响。gydF4y2Ba

检测模型gydF4y2Ba 数据集gydF4y2Ba 数量的类别gydF4y2Ba 总数gydF4y2Ba 的数量gydF4y2Ba 数量的测试集gydF4y2Ba 每个类别的检测精度gydF4y2Ba 总精度gydF4y2Ba 检出率gydF4y2Ba
的训练样本gydF4y2Ba 验证样品gydF4y2Ba 人gydF4y2Ba 骑自行车的人gydF4y2Ba 确定gydF4y2Ba 车gydF4y2Ba 小型公共汽车gydF4y2Ba 公共汽车gydF4y2Ba 卡车gydF4y2Ba
固态硬盘gydF4y2Ba 挥发性有机化合物- 2007gydF4y2Ba 20.gydF4y2Ba 9963年gydF4y2Ba 5011年gydF4y2Ba 4952年gydF4y2Ba 0.5145gydF4y2Ba 0.5379gydF4y2Ba 0.5701gydF4y2Ba 0.5883gydF4y2Ba 0.5534gydF4y2Ba 0.5499gydF4y2Ba 0.5407gydF4y2Ba 0.5507gydF4y2Ba 28 fpsgydF4y2Ba
KITTIgydF4y2Ba 5gydF4y2Ba 7982年gydF4y2Ba 7183年gydF4y2Ba 799年gydF4y2Ba 0.6145gydF4y2Ba 0.6379gydF4y2Ba 0.6701gydF4y2Ba 0.6883gydF4y2Ba 0.6534gydF4y2Ba 0.6499gydF4y2Ba 0.6407gydF4y2Ba 0.6507gydF4y2Ba 24帧/秒gydF4y2Ba
SSM-CARgydF4y2Ba 7gydF4y2Ba 11550年gydF4y2Ba 10394年gydF4y2Ba 1156年gydF4y2Ba 0.7903gydF4y2Ba 0.8057gydF4y2Ba 0.8109gydF4y2Ba 0.8044gydF4y2Ba 0.8170gydF4y2Ba 0.7968gydF4y2Ba 0.8102gydF4y2Ba 0.8050gydF4y2Ba 27帧gydF4y2Ba

我们的固态硬盘gydF4y2Ba 挥发性有机化合物- 2007gydF4y2Ba 20.gydF4y2Ba 9963年gydF4y2Ba 5011年gydF4y2Ba 4952年gydF4y2Ba 0.7741gydF4y2Ba 0.7856gydF4y2Ba 0.7812gydF4y2Ba 0.7821gydF4y2Ba 0.7830gydF4y2Ba 0.7904gydF4y2Ba 0.7923gydF4y2Ba 0.7841gydF4y2Ba 31日fpsgydF4y2Ba
KITTIgydF4y2Ba 5gydF4y2Ba 7982年gydF4y2Ba 7183年gydF4y2Ba 799年gydF4y2Ba 0.8145gydF4y2Ba 0.8279gydF4y2Ba 0.8001gydF4y2Ba 0.8083gydF4y2Ba 0.8234gydF4y2Ba 0.8499gydF4y2Ba 0.8407gydF4y2Ba 0.8107gydF4y2Ba 29 fpsgydF4y2Ba
SSM-CARgydF4y2Ba 7gydF4y2Ba 11550年gydF4y2Ba 10394年gydF4y2Ba 1156年gydF4y2Ba 0.9805gydF4y2Ba 0.8972gydF4y2Ba 0.9196gydF4y2Ba 0.9585gydF4y2Ba 0.9043gydF4y2Ba 0.8807gydF4y2Ba 0.8984gydF4y2Ba 0.9085gydF4y2Ba 33 fpsgydF4y2Ba

自动驾驶的检测的结果对象。左:SSD + KITTI的检测结果。中间:SSD的检测结果+ SSMCAR。右:这是我们SSD + SSMCAR的检测结果。(一)市区道路的检测结果。(b)是十字路口的检测结果。(c)是高速公路的检测结果。gydF4y2Ba

5。结论和未来的工作gydF4y2Ba

在这项研究中,我们提出一个物体检测算法基于固态硬盘的自动驾驶模式。通过卷积的特性融合层,有效保证传输对象的特性。在培训的过程中,增加了图像块方法的策略来提高检测性能的小对象。此外,我们提出一个图像金字塔大对象,有效地解决了大型对象的问题特征图像分割所造成的损失。然而,在这篇文章中,我们定义标签标准及对象类别来创建一个新的数据集自主车辆的技术。我们的实验结果表明,该自动驾驶的检测算法具有良好的检测性能。gydF4y2Ba

在未来的工作中,我们将根据结果跟踪对象已被检测到,然后分析物体的运动趋势,为决策提供有效的支持和自主车辆的路径规划gydF4y2Ba 30.gydF4y2Ba]。gydF4y2Ba

数据可用性gydF4y2Ba

本文数据可用性是真实和可靠的。gydF4y2Ba

的利益冲突gydF4y2Ba

没有利益冲突有关的出版。gydF4y2Ba

确认gydF4y2Ba

这项工作是由中国国家自然科学基金资助(批准号61572083),陕西省科技计划的项目(批准号2014 jm8351),在青海省科技项目(没有。2017 - zj - 717)。gydF4y2Ba

罗斯gydF4y2Ba G。gydF4y2Ba 杰夫gydF4y2Ba D。gydF4y2Ba 特雷弗gydF4y2Ba D。gydF4y2Ba JitendragydF4y2Ba M。gydF4y2Ba 丰富的特性准确的对象层次结构和语义分割检测gydF4y2Ba 计算机视觉和模式识别gydF4y2Ba 2014年gydF4y2Ba 1gydF4y2Ba GirshickgydF4y2Ba R。gydF4y2Ba 快R-CNNgydF4y2Ba 学报》第15届IEEE计算机视觉国际会议(ICCV 15)gydF4y2Ba 2015年12月gydF4y2Ba 1440年gydF4y2Ba 1448年gydF4y2Ba 10.1109 / iccv.2015.169gydF4y2Ba 2 - s2.0 - 84964588182gydF4y2Ba 任gydF4y2Ba 年代。gydF4y2Ba 他gydF4y2Ba K。gydF4y2Ba GirshickgydF4y2Ba R。gydF4y2Ba 太阳gydF4y2Ba J。gydF4y2Ba 更快的R-CNN:对实时检测与地区建议网络gydF4y2Ba 少量的酒gydF4y2Ba 2015年gydF4y2Ba RedmongydF4y2Ba J。gydF4y2Ba DivvalagydF4y2Ba 年代。gydF4y2Ba GirshickgydF4y2Ba R。gydF4y2Ba 哈蒂gydF4y2Ba 一个。gydF4y2Ba 你只看一次:统一、实时检测gydF4y2Ba 学报2016年IEEE计算机视觉与模式识别会议,CVPR 2016gydF4y2Ba 2016年7月gydF4y2Ba 779年gydF4y2Ba 788年gydF4y2Ba 2 - s2.0 - 84986308404gydF4y2Ba 刘gydF4y2Ba W。gydF4y2Ba AnguelovgydF4y2Ba D。gydF4y2Ba ErhangydF4y2Ba D。gydF4y2Ba SzegedygydF4y2Ba C。gydF4y2Ba 里德gydF4y2Ba 年代。gydF4y2Ba 傅gydF4y2Ba 彭译葶。gydF4y2Ba 伯格gydF4y2Ba a . C。gydF4y2Ba SSD:单发射击multibox探测器gydF4y2Ba 课堂讲稿在计算机科学(包括子系列讲义在人工智能和课堂讲稿在生物信息学):前言gydF4y2Ba 2016年gydF4y2Ba 9905年gydF4y2Ba 21gydF4y2Ba 37gydF4y2Ba 10.1007 / 978 - 3 - 319 - 46448 - 0 - _2gydF4y2Ba 2 - s2.0 - 84990068627gydF4y2Ba 邓gydF4y2Ba K。gydF4y2Ba 李gydF4y2Ba j . X。gydF4y2Ba 李gydF4y2Ba j . Y。gydF4y2Ba 庞gydF4y2Ba c . Y。gydF4y2Ba 周gydF4y2Ba x F。gydF4y2Ba 访问时间甲骨文加权平面图gydF4y2Ba IEEE工程TKDE知识和数据gydF4y2Ba 2016年gydF4y2Ba 28gydF4y2Ba 8gydF4y2Ba 1959年gydF4y2Ba 1970年gydF4y2Ba SermanetgydF4y2Ba P。gydF4y2Ba 特征gydF4y2Ba D。gydF4y2Ba 张gydF4y2Ba X。gydF4y2Ba 马修gydF4y2Ba M。gydF4y2Ba 费格斯gydF4y2Ba R。gydF4y2Ba 勒存gydF4y2Ba Y。gydF4y2Ba Overfeat:综合识别、定位和检测使用卷积网络gydF4y2Ba ICLRgydF4y2Ba 2014年gydF4y2Ba HosanggydF4y2Ba J。gydF4y2Ba 贝gydF4y2Ba R。gydF4y2Ba 美元gydF4y2Ba P。gydF4y2Ba SchielegydF4y2Ba B。gydF4y2Ba 怎样才能有效的检测方案?gydF4y2Ba IEEE模式分析与机器智能gydF4y2Ba 2016年gydF4y2Ba 38gydF4y2Ba 4gydF4y2Ba 814年gydF4y2Ba 830年gydF4y2Ba 10.1109 / TPAMI.2015.2465908gydF4y2Ba 2 - s2.0 - 84963773434gydF4y2Ba 他gydF4y2Ba K。gydF4y2Ba 张gydF4y2Ba X。gydF4y2Ba 任gydF4y2Ba 年代。gydF4y2Ba 太阳gydF4y2Ba J。gydF4y2Ba 空间金字塔池深卷积网络视觉识别gydF4y2Ba IEEE模式分析与机器智能gydF4y2Ba 2015年gydF4y2Ba 37gydF4y2Ba 9gydF4y2Ba 1904年gydF4y2Ba 1916年gydF4y2Ba 10.1109 / TPAMI.2015.2389824gydF4y2Ba 2 - s2.0 - 84939247735gydF4y2Ba 王gydF4y2Ba G。gydF4y2Ba 王gydF4y2Ba X。gydF4y2Ba 风扇gydF4y2Ba B。gydF4y2Ba 庞ydF4y2Ba C。gydF4y2Ba 通过旋转不变特征提取矩阵表示的对象检测天线的形象gydF4y2Ba IEEE地球科学和遥感信gydF4y2Ba 2017年gydF4y2Ba 14gydF4y2Ba 6gydF4y2Ba 851年gydF4y2Ba 855年gydF4y2Ba 10.1109 / LGRS.2017.2683495gydF4y2Ba 2 - s2.0 - 85018491844gydF4y2Ba 贾gydF4y2Ba Y。gydF4y2Ba ShelhamergydF4y2Ba E。gydF4y2Ba 多纳休gydF4y2Ba J。gydF4y2Ba KarayevgydF4y2Ba 年代。gydF4y2Ba 长gydF4y2Ba J。gydF4y2Ba GirshickgydF4y2Ba R。gydF4y2Ba GuadarramagydF4y2Ba 年代。gydF4y2Ba 达雷尔gydF4y2Ba T。gydF4y2Ba 咖啡:快速卷积架构功能嵌入gydF4y2Ba 诉讼ACM多媒体会议(MM的14)gydF4y2Ba 2014年11月gydF4y2Ba 美国佛罗里达州奥兰多gydF4y2Ba ACMgydF4y2Ba 675年gydF4y2Ba 678年gydF4y2Ba 10.1145/2647868.2654889gydF4y2Ba 2 - s2.0 - 84913580146gydF4y2Ba EveringhamgydF4y2Ba M。gydF4y2Ba 范干傻事gydF4y2Ba lgydF4y2Ba 威廉姆斯gydF4y2Ba c . k . I。gydF4y2Ba 韦恩gydF4y2Ba J。gydF4y2Ba ZissermangydF4y2Ba 一个。gydF4y2Ba 帕斯卡的视觉对象类(VOC)的挑战gydF4y2Ba 国际计算机视觉杂志》上gydF4y2Ba 2010年gydF4y2Ba 88年gydF4y2Ba 2gydF4y2Ba 303年gydF4y2Ba 338年gydF4y2Ba 10.1007 / s11263 - 009 - 0275 - 4gydF4y2Ba 2 - s2.0 - 77951298115gydF4y2Ba 李gydF4y2Ba J。gydF4y2Ba 刘gydF4y2Ba C。gydF4y2Ba 余gydF4y2Ba j . X。gydF4y2Ba 基于上下文的XML关键字查询多样化gydF4y2Ba IEEE工程知识和数据gydF4y2Ba 2015年gydF4y2Ba 27gydF4y2Ba 3gydF4y2Ba 660年gydF4y2Ba 672年gydF4y2Ba 10.1109 / TKDE.2014.2334297gydF4y2Ba 2 - s2.0 - 84922921706gydF4y2Ba 陆gydF4y2Ba Y。gydF4y2Ba 王gydF4y2Ba W。gydF4y2Ba 李gydF4y2Ba J。gydF4y2Ba 刘gydF4y2Ba C。gydF4y2Ba XClean: XML关键字查询提供正确的拼写建议gydF4y2Ba 学报2011年IEEE 27日国际会议数据工程,ICDE 2011gydF4y2Ba 2011年4月gydF4y2Ba 德国gydF4y2Ba 661年gydF4y2Ba 672年gydF4y2Ba 2 - s2.0 - 79957835960gydF4y2Ba AlduaijigydF4y2Ba N。gydF4y2Ba 达塔gydF4y2Ba 一个。gydF4y2Ba 李gydF4y2Ba J。gydF4y2Ba 影响力传播模型clique-based社交网络社区检测gydF4y2Ba IEEE计算社会系统gydF4y2Ba 2018年gydF4y2Ba 5gydF4y2Ba 2gydF4y2Ba 563年gydF4y2Ba 575年gydF4y2Ba 10.1109 / TCSS.2018.2831694gydF4y2Ba 朱gydF4y2Ba Y。gydF4y2Ba MottaghigydF4y2Ba R。gydF4y2Ba KolvegydF4y2Ba E。gydF4y2Ba LimgydF4y2Ba J·J。gydF4y2Ba 古普塔gydF4y2Ba 一个。gydF4y2Ba 菲菲gydF4y2Ba lgydF4y2Ba 哈蒂gydF4y2Ba 一个。gydF4y2Ba 目标导向的视觉导航在室内场景使用强化学习gydF4y2Ba 《2017年IEEE机器人与自动化国际会议上,ICRA 2017gydF4y2Ba 2017年6月gydF4y2Ba 新加坡gydF4y2Ba 3357年gydF4y2Ba 3364年gydF4y2Ba 2 - s2.0 - 85028006260gydF4y2Ba 10.1109 / ICRA.2017.7989381gydF4y2Ba 陈gydF4y2Ba C。gydF4y2Ba SeffgydF4y2Ba 一个。gydF4y2Ba KornhausergydF4y2Ba 一个。gydF4y2Ba 肖gydF4y2Ba J。gydF4y2Ba DeepDriving:学习给养自主驾驶直接感知gydF4y2Ba 第十五届IEEE国际研讨会论文集在计算机视觉,ICCV 2015gydF4y2Ba 2015年12月gydF4y2Ba 智利gydF4y2Ba 2722年gydF4y2Ba 2730年gydF4y2Ba 2 - s2.0 - 84973888858gydF4y2Ba JackelgydF4y2Ba l D。gydF4y2Ba 沙曼gydF4y2Ba D。gydF4y2Ba StenardgydF4y2Ba c, E。gydF4y2Ba 斯特罗姆gydF4y2Ba 我。gydF4y2Ba ZuckertgydF4y2Ba D。gydF4y2Ba 光学字符识别为自我服务的银行gydF4y2Ba 美国电话电报公司(AT&T)技术杂志gydF4y2Ba 1995年gydF4y2Ba 74年gydF4y2Ba 4gydF4y2Ba 16gydF4y2Ba 24gydF4y2Ba 2 - s2.0 - 0029341608gydF4y2Ba 中文gydF4y2Ba W。gydF4y2Ba 冯gydF4y2Ba Q。gydF4y2Ba four-wheel-steering车辆的轨迹规划gydF4y2Ba 《2001年IEEE机器人与自动化国际会议上gydF4y2Ba 2001年gydF4y2Ba 21gydF4y2Ba 26gydF4y2Ba FelzenszwalbgydF4y2Ba p F。gydF4y2Ba GirshickgydF4y2Ba r B。gydF4y2Ba McAllestergydF4y2Ba D。gydF4y2Ba RamanangydF4y2Ba D。gydF4y2Ba 对象检测与区别式模型部分原因gydF4y2Ba IEEE模式分析与机器智能gydF4y2Ba 2010年gydF4y2Ba 32gydF4y2Ba 9gydF4y2Ba 1627年gydF4y2Ba 1645年gydF4y2Ba 2 - s2.0 - 77955422240gydF4y2Ba 10.1109 / TPAMI.2009.167gydF4y2Ba 茨威格gydF4y2Ba 一个。gydF4y2Ba WeinshallgydF4y2Ba D。gydF4y2Ba 利用对象层次结构:结合模型从不同类别的水平gydF4y2Ba 学报2007年IEEE 11计算机视觉国际会议gydF4y2Ba 2007年10月gydF4y2Ba 巴西里约热内卢gydF4y2Ba 1gydF4y2Ba 8gydF4y2Ba 10.1109 / ICCV.2007.4409064gydF4y2Ba BrostowgydF4y2Ba g . J。gydF4y2Ba FauqueurgydF4y2Ba J。gydF4y2Ba CipollagydF4y2Ba R。gydF4y2Ba 在视频语义对象类:高清地面实况数据库gydF4y2Ba 模式识别的字母gydF4y2Ba 2009年gydF4y2Ba 30.gydF4y2Ba 2gydF4y2Ba 88年gydF4y2Ba 97年gydF4y2Ba 2 - s2.0 - 56049086147gydF4y2Ba 10.1016 / j.patrec.2008.04.005gydF4y2Ba 兰伯特gydF4y2Ba c . H。gydF4y2Ba NickischgydF4y2Ba H。gydF4y2Ba 马克的gydF4y2Ba 年代。gydF4y2Ba 学习检测看不见的对象类,类间属性转移gydF4y2Ba 2009年IEEE计算机学会学报计算机视觉与模式识别会议gydF4y2Ba 2009年6月gydF4y2Ba 美国gydF4y2Ba 951年gydF4y2Ba 958年gydF4y2Ba 2 - s2.0 - 70450172710gydF4y2Ba 安瓦尔gydF4y2Ba M . M。gydF4y2Ba 刘gydF4y2Ba C。gydF4y2Ba 李gydF4y2Ba J。gydF4y2Ba 发现和跟踪查询的活跃的社会群体在网上动态信息网络gydF4y2Ba 万维网gydF4y2Ba 2018年gydF4y2Ba 2 - s2.0 - 85051696864gydF4y2Ba SzegedygydF4y2Ba C。gydF4y2Ba ToshevgydF4y2Ba 一个。gydF4y2Ba ErhangydF4y2Ba D。gydF4y2Ba 深层神经网络目标检测gydF4y2Ba 先进的神经信息处理系统gydF4y2Ba 2013年gydF4y2Ba 26gydF4y2Ba 少量的酒gydF4y2Ba 勒存gydF4y2Ba Y。gydF4y2Ba BengiogydF4y2Ba Y。gydF4y2Ba 阿尔贝勃gydF4y2Ba m·A。gydF4y2Ba 卷积网络图片,语音,和时间序列gydF4y2Ba 大脑理论和神经网络的手册gydF4y2Ba 1995年gydF4y2Ba 麻省理工学院出版社gydF4y2Ba 科茨gydF4y2Ba 一个。gydF4y2Ba HuvalgydF4y2Ba B。gydF4y2Ba 王gydF4y2Ba T。gydF4y2Ba 吴gydF4y2Ba d . J。gydF4y2Ba NggydF4y2Ba a . Y。gydF4y2Ba 与COTS HPC系统深度学习gydF4y2Ba 28gydF4y2Ba 30学报》国际会议上机器学习(ICML 13)gydF4y2Ba 2013年gydF4y2Ba 亚特兰大,乔治亚州,美国gydF4y2Ba JMLR: W&CPgydF4y2Ba 1337年gydF4y2Ba 1345年gydF4y2Ba SzegedygydF4y2Ba C。gydF4y2Ba 刘gydF4y2Ba W。gydF4y2Ba 贾gydF4y2Ba Y。gydF4y2Ba SermanetgydF4y2Ba P。gydF4y2Ba 里德gydF4y2Ba 年代。gydF4y2Ba AnguelovgydF4y2Ba D。gydF4y2Ba ErhangydF4y2Ba D。gydF4y2Ba VanhouckegydF4y2Ba V。gydF4y2Ba 拉比诺维奇gydF4y2Ba 一个。gydF4y2Ba 与旋转会更深gydF4y2Ba 《IEEE计算机视觉与模式识别会议(CVPR 15)gydF4y2Ba 2015年6月gydF4y2Ba 波士顿,美国质量gydF4y2Ba 1gydF4y2Ba 9gydF4y2Ba 10.1109 / cvpr.2015.7298594gydF4y2Ba MottaghigydF4y2Ba R。gydF4y2Ba 陈gydF4y2Ba X。gydF4y2Ba 刘gydF4y2Ba X。gydF4y2Ba 赵gydF4y2Ba N.-G。gydF4y2Ba 李gydF4y2Ba S.-W。gydF4y2Ba 费德勒gydF4y2Ba 年代。gydF4y2Ba UrtasungydF4y2Ba R。gydF4y2Ba YuillegydF4y2Ba 一个。gydF4y2Ba 上下文对象的角色在野外探测和语义分割gydF4y2Ba 美国27日IEEE计算机视觉与模式识别会议,CVPR 2014gydF4y2Ba 2014年6月gydF4y2Ba 美国gydF4y2Ba 891年gydF4y2Ba 898年gydF4y2Ba 2 - s2.0 - 84911444024gydF4y2Ba 夏gydF4y2Ba F。gydF4y2Ba 王gydF4y2Ba J。gydF4y2Ba 香港gydF4y2Ba X。gydF4y2Ba 王gydF4y2Ba Z。gydF4y2Ba 李gydF4y2Ba J。gydF4y2Ba 刘gydF4y2Ba C。gydF4y2Ba 探索人类移动模式在城市场景:一个轨迹数据透视图gydF4y2Ba IEEE通讯杂志gydF4y2Ba 2018年gydF4y2Ba 56gydF4y2Ba 3gydF4y2Ba 142年gydF4y2Ba 149年gydF4y2Ba 2 - s2.0 - 85044078797gydF4y2Ba