Pretraining卷积神经网络用于基于图像的车辆分类

文摘

车辆检测与分类是非常重要的在智能交通系统中,车辆行为分析城市计算,等。本文的方法基于卷积神经网络(cnn)申请车辆分类。为了达到更准确的分类,我们把不相关的背景尽可能根据培训对象检测模型。此外,一个无监督pretraining方法引入了更好的初始化cnn参数来提高分类性能。通过增强的数据手动标记图像,我们有2000标记图像在每个类别的摩托车,运输车,乘客,和其他人,1400个样本进行训练和600个样本进行测试。然后,我们有17395标记图像layer-wise无监督pretraining卷积层。非凡的准确性为93.50%,证明我们的方法的分类潜力高。

1。介绍

汽车是人类历史上最伟大的发明之一。汽车已经成为现代人们生活不可或缺的一部分。使用一个巨大的大量的车辆可以反映人口的流动性,亲密、经济等等,与车辆行为的分析是很有意义的城市发展和政府决策。为了收集加油的车辆信息,如车牌,照片,时间,地点,数量,类型,等等,我们有部署数据采集设备在许多充气站在新疆,主要负责安全监督和分析加油的行为。直到现在,许多车辆配置文件信息,如车辆颜色和车辆类型是手动输入到系统中;这是低效的,不统一的。准确,不同的数据量是关键挖加油数据的价值。因此,它已成为摆在我们面前亟待解决的一个问题,如何获得车辆通过车辆图片自动配置信息。在本文中,我们专注于如何获得车辆类型的照片。这个问题被认为是图像分类,这意味着我们应该分类包含车辆的图像图像处理的正确的类型。 Due to the environment in which images are taken is quite varied and complex and the impact of irrelevant background, the vehicles in images are very difficult to recognize.

由于深度学习的成功,我们现在的车辆检测方法和基于卷积神经网络分类。更有效地检测图像中的车辆,一个成功的目标检测方法是用来检测对象在一个图像,然后目标车辆等待进入加油站过滤掉。接下来,我们设计了一个卷积神经网络包含4卷积层,3马克斯•池层和2完整的连接层车辆分类。我们训练我们的模型在车辆图像数据集的标签。比较它和其他五个最先进的方法验证我们的方法达到最高的精度。为了追求更好的分类性能,我们利用非监督pretraining更好的分类模型参数初始化的情况下缺少标记图像。无监督pretraining方法实现基于反褶积。pretraining之后,卷积层被pretrained参数初始化和训练模型标记图像数据集;因此,我们得到了一个没有pretraining比以前更好的分类性能。

本文组织如下。介绍了相关的工作部分2。车辆检测和分类基于cnn和pretraining部分中描述的方法3。节4提出了车辆的数据集,我们评估了提出的方法在我们的数据,并给出了实验结果和性能评价。最后,部分5总结了纸。

现有的方法使用各种类型的车辆信号检测和分类,包括声学信号(2- - - - - -5),雷达信号(6,7),超声波信号(8),红外热信号(9),磁信号(10),3 d激光雷达信号(11和图像/视频信号12- - - - - -16]。此外,一些方法可以结合多种信号,如radar&vision信号(7)和影音同步信号(17]。通常,这些方法的检测和分类性能很好,因为精确的信号数据,但有很多硬件设备参与这些方法,导致更大的部署成本和更高的失败率。

图像处理技术的发展和广泛部署的监控摄像头,促进基于图像的车辆检测和分类。各种方法提出了基于图像的车辆检测和分类在过去的几年里。齐米等。13)使用三种不同类型的特征提取器,傅里叶变换、小波变换、曲波变换,识别和分类5模型的车辆;再作为分类器。他们比较3提出了方法和发现曲波变换可以提取更好的特性。陈等人。18)提出了一个系统车辆检测、跟踪和分类从路边闭路电视(CCTV)。首先,卡尔曼滤波跟踪车辆,使分类多数投票连续几帧,然后他们训练支持向量机(SVM)通过结合面向金字塔车辆轮廓和灰度直方图的梯度(猪)特征提取后背景减法,分类前景blob多数表决。温家宝et al。(1932]Haar-like功能池32个灰度图像补丁代表车辆的外观,然后提出了一种快速增量学习算法的演算法来提高演算法的性能。Arrospide和萨尔加多(16]分析了流行的个人表现汽车的技术验证和发现,分类器基于伽柏和猪的特性实现最好的结果,优于主成分分析(PCA)和其他分类器基于对称特性和梯度。Mishra和巴纳吉20.)检测到车辆使用背景,提取哈雾,锥体的梯度直方图,形状和尺度不变特征变换特性,设计了一种多个内核分类器的基础上再把车辆分成4类。Tourani和Shahbahrami21)结合不同的图像/视频处理方法包括对象检测、边缘检测、框架分化,和卡尔曼滤波方法提出导致约95%的准确率分类和车辆检测误差约4%的目标。在这些方法中,分类结果非常好;然而,仍然有一些问题。首先,图像特征由手工有限特征算法代表了丰富的信息。第二,手工功能算法需要大量的计算,所以他们不适合实时应用程序,尤其是对嵌入在前端摄像头设备。第三,它们中的大多数都是用于固定场景和背景环境;对他们来说很难应对复杂环境。

最近,深度学习已成为一个热点话题检测和对象分类区域。王等人。22)提出了一个新颖的基于深度学习的车辆检测算法和二维深度信念网络;2 d-dbn架构使用二阶的飞机而不是一阶向量作为输入,并使用双线性投影保留的大小区别的信息,以确定深架构提高了车辆检测的成功率。他们的算法预先形成很好的数据集。他等。1)提出了一种新的有效的车辆检测和基于卷积神经网络分类方法,该方法提取的特性优于传统方法生成的。易et al。23)提出了一种深卷积网络基于pretrained AlexNet模型决定是否一定图像补丁包含车辆在广阔的区域内运动图像(WAMI)图像分析。李等人。24]介绍了3 d扫描数据范围在2 d点地图,使用一个2 d端到端完全卷积网络预测车辆同时信心和边界框,他们有最先进的KITTI数据集上的性能。

同时,目标检测和分类基于卷积神经网络(cnn) [25- - - - - -27)最近在计算机视觉领域非常成功。第一个工作目标检测和分类的基础上深度学习在2013年已经完成;Sermanet et al。28)提供了一个完整的框架,使用深度学习的对象检测、定位、分类;这个框架获得极具竞争力的结果检测和分类任务。到目前为止,基于深度学习优秀的目标检测和分类模型包括R-CNN [29日),快R-CNN [30.有人知道由罗[],31日),快R-CNN [32],SSD [33],R-FCN [34];这些模型取得的成果在几个数据集。前YOLO,意思很多方法在目标检测,例如,R-CNN R-CNN更快,重新分类器进行检测。相反,YOLO帧对象检测是一个回归的问题意思分离边界框和相关类的概率。YOLO框架使用一个定制的意思网络基于Googlenet架构,使用85.2亿业务前进传球。然而,最近的一个改进的模型称为YOLOv2 [35]达到类似的结果在标准PASCAL VOC和可可等任务。在YOLOv2网络,它使用一个新的模型,称为Darknet-19,和19卷积层和5 maxpooling层;模型只需要55.8亿个手术。总之,YOLOv2是最先进的检测系统,比其他人更好,更快,更强和申请对象检测任务在这工作。

最后,无监督pretraining初始化模型参数空间中的一个点,使优化过程更加有效,在某种意义上实现较低的最小的经验损失函数36]。许多最近的研究一直致力于学习算法架构如深深信仰网络(37,38)和成堆的autoencoder变体(39]。车辆检测后,我们可以很容易地得到一个很多标记图像的车辆和无监督pretraining优化分类模型参数初始化。

3所示。方法

在本节中,我们将基于cnn的细节方法为基于图像的车辆检测和车辆分类。此部分包含三个部分:车辆检测、车辆分类,和pretraining方法。每个部分之间的关系和整体框架的整个想法如图1。

3.1。车辆检测

我们从静态摄像机拍摄的图像在不同燃料补给站包含前面的车辆或车辆在任意点的观点。车辆图像非常不确定性;这使得车辆检测更加困难传统方法基于手工的特性。

YOLOv2模型是可可训练数据集,它可以检测80生活中常见的对象,如人,自行车,汽车,公共汽车,火车,卡车,船,鸟,猫,等等,因此我们可以执行基于YOLOv2车辆检测。在一幅等待进入的车辆加油站如图2YOLOv2可以检测很多对象,例如,保安、司机、车辆、车辆排队,甚至车辆的道路。在这里,我们的目标是拿起车辆等待进入的画面。

尽管训练YOLOv2可以探测到车辆和分成自行车,汽车,摩托车,汽车,卡车,它不符合我们的分类类别。为了解决这个问题,来调整YOLOv2数据可能是一个解决方案,但这种方法需要大量的手工标记数据和大量的计算,它不是一个可取的方法,然后,我们提出了一个基于规则的方法来更准确地检测四类车辆。首先,从YOLOv2检测结果,我们选择的对象非常类似于我们的目标,如汽车,公共汽车,卡车,摩托车;其次,根据车辆和相机之间的距离,近的车辆,更大的目标是,我们选择最相似的车辆图片作为目标车辆进入加油站进行进一步的车辆行为分析。

3.2。车辆分类

根据功能和大小车辆,车辆将分为四个类别的摩托车、运输、客运等。摩托车包括摩托车和三轮摩托车;运输包括卡车和集装箱车;乘客包括轿车,掀背车,轿车,面包车,SUV、MPV;其他包括车辆用于农业生产和基础设施,如拖拉机和起重机,和其他类型的车辆。图3显示了剪样本在每一列的四类。我们可以看到,样品图片是不同的形状,颜色,大小,和相机角度,甚至在同一类别的样品图片。和图3 (b)底部和图3 (c)不在同一类别,但是他们非常相似,尤其是在正面,形状和颜色,使运输车和乘客之间的分类更加困难。

(一)

(b)

(c)

(d)

为了解决这个困难的问题,我们提出了一个回旋的分类模型,该模型是有效的和需要少量的操作。我们的模型,称为C4M3F2,有4个卷积层,3马克斯•池层和2完全连接层。

每个卷积层包含多个(32或64)33内核,每个内核代表一个过滤器连接到前一层的输出。每个马克斯池层包含多个马克斯池2×2过滤器和步幅2;它有效地降低了特征维度和避免过度拟合。完全连接层,每一层都包含1024个神经元,每个神经元使预测的所有输入,它连接到所有的神经元在之前的层。为每个剪切从YOLOv2车辆图像检测,已经调整至48×48,然后传递给C4M3F2。最终,所有传递给softmax层的特性,我们需要做的只是最小化之间的交叉熵损失softmax输出和输入的标签。表1显示了我们的模型C4M3F2结构。


层类型/激活	尺寸/大步	过滤器

卷积/ ReLU	3×3/1	32
马克斯池	2×2/2
卷积/ ReLU	3×3/1	64年
卷积/ ReLU	3×3/1	64年
马克斯池	2×2/2
卷积/ ReLU	3×3/1	64年
马克斯池	2×2/2
完全连接/ ReLU	1024年
完全连接	1024年
Softmax	4

3.3。Pretraining方法

达到一个令人满意的分类结果的目的,我们需要更多标记图像训练我们的模型,但是有一个短缺的标记图像;然而,有大量的图像很容易收集,以及如何使用大量的标记图像分类模型的优化已成为本节的主要内容。

这种无监督的动机pretraining方法是卷积内核参数的优化参数。内核C4M3F2培训从一个随机初始化,和我们希望内核训练过程可以优化和加速使用无监督pretraining获得的初始值。此外,pretraining初始化模型参数空间中的一个点,使优化过程更加有效,在某种意义上实现较低的最小的损失函数36]。接下来,我们将解释如何贪婪layer-wise pretrain卷积层和C4M3F2完全连接层模型。马克斯池层函数是二次抽样;它不包括在layer-wise pretraining过程。

一个autoencoder [40)神经网络是一种无监督学习算法,应用反向传播,设置目标值等于输入。它使用一组识别权重将输入转换成代码,然后使用一组权重生成代码转化为一个近似重建的输入。Autoencoder必须努力重建输入,旨在最小化重建误差如图4。

根据autoencoder的目的,我们的方法对无监督pretraining解释道。在每一个卷积层,卷积可以被视为编码器,和反褶积41)作为译码器,这是一个非常不幸的名称,也叫做转置卷积。一个输入图像传递到编码器,然后从编码器输出代码传递到译码器输入图像重建。这里,欧几里得距离,这意味着重建误差,是用来测量输入图像和重构图像之间的相似性,因此我们的方法的目的是最小化欧几里得范式。pretraining下一层,首先,我们应该把解码器和编码器的冻结权重前一层,然后取前一层的输出代码作为输入层和做同样的事情在以前的层。下如何使用转置卷积来构造和最小化损失函数在一个回旋的层将详细描述如下。

的卷积功能地图和图像可以被定义为在哪里表示二维卷积, 卷积结果和填充设置输入和输出尺寸一致。是th内核, 表示训练图像。

然后,基于循环矩阵在线性变换卷积系统。循环矩阵是一种特殊的托普利兹矩阵每一行向量向右旋转一个元素相对于前面的行向量。一个循环矩阵C需要的形式

让的扩展 ,在那里。和方法如下(3)和(4),是零矩阵:

让是以矢量形式,是一个行 ,和。建立循环矩阵通过这些循环矩阵,一块循环矩阵定义如公式(所示5)。

在这里,我们可以将卷积转换为(6)。

是向量形式的卷积计算的结果然后重塑成。在这个卷积过程中,填充处理填0,但是在实际实现的方法中,我们把卷积输入和输出尺寸一致。所以我们需要修剪多余的价值观保持一致的输入和输出维度。所以我们拦截矩阵 ,然后。

为了简化计算,我们提取的有效行根据显示的行索引有效的元素的位置在和表示这些行。

现在, 是向量的形式 ,所以卷积可以写成

有培训车辆图像和内核。让 , 。

卷积可以计算的

与反褶积计算

所以是X重建。然后基于欧几里得损失函数范式定义公式(10),被

然后,我们使用亚当优化器,这是一个基于一阶梯度优化算法基于自适应的随机目标函数的估计低阶的时刻,解决最小优化问题在公式(10)。

贪婪的layer-wise无监督pretraining之后,我们开始pretrained值的参数在每一个卷积层和运行监督培训分类根据先前的分段的方法。

4所示。实验和讨论

我们评估了算法在数据和比较它与其他四个最先进的方法。

4.1。数据集和实验环境

车辆图像的静态摄像机在不同加油站;被压缩后,他们被发送到服务器。服务器上的图像的质量低于被随机分为四个类别的摩托车,运输车,乘客,和其他人。我们有498摩托车图片,1109运输机图片,1238乘客的图片,和328其他图像。由于耗费时间和劳动密集型手工标记,标记图像的短缺。图像增强被用来丰富的数据。Keras,优秀的高水平的神经网络API,提供了图像数据的ImageDataGenerator准备和扩充。剪切范围设置为-0.2到0.2,变焦范围设置为-0.2到0.2,旋转范围设置为7到7,大小设置为256×256,边界外的点都是根据最近的模式。配置和考虑后的平衡数据,我们安装在我们的数据和有1400个样本训练集上的每个类别和600年样本上每类别测试集来评估我们的分类模型。

车辆分类,cnn Tensorflow框架下,筛选在OpenCV (https://opencv.org/),和其他功能嵌入方法scikit-image (http://scikit-image.org/)。所有的实验在常规笔记本电脑(2.5 - ghz 8核的CPU, RAM 12克,和Ubuntu 64位操作系统)。

4.2。车辆检测与YOLOv2实验

实验使用原始图像的原始训练集和测试集用于训练和测试,实验使用剪切图像,我们使用的方法基于训练YOLOv2检测原始训练集和测试集的训练集剪和剪切测试集进行训练和测试。

验证车辆检测车辆分类的重要性,我们设计了两组车辆分类实验中,使用原始图像,另一个使用剪切图像后车辆检测,然后,C4M3F2模型用于车辆分类实验。

我们初始化C4M3F2截断正态分布模型,拟合模型对原始训练集和剪切训练集2000时代,分别和记录的准确性C4M3F2模型在不同的测试集;结果如图所示5。正如我们所料,车辆的剪切图像更准确地代表车辆的特点,而修剪更无用的信息,促进车辆特征提取和分类。我们可以看到在图5,使用剪切C4M3F2模型的精度数据集比使用原始数据集;在前面的训练,更准确地提取车辆的特点,因此,该模型快速取得了更好的分类结果和一个稳定的状态。

最后,C4M3F2使用剪切数据集的准确性为91.42%,高于86.89%的4.53% C4M3F2使用原始数据集。它可以得出的结论是,车辆分类的结果使用剪切数据集后车辆检测基于YOLOv2可以有效地改进。

4.3。我们的方法与他人进行比较

还有许多其他的图像分类方法。评估我们的分类模型,与其他五个方法相比,我们的方法。

五个方法都是基于图像特征定义的学者在计算机图像处理。考虑综合因素,四种图像特征选择和卷积的方法,他们是面向梯度的直方图(猪)42),黛西(43),面向快,旋转短暂(ORB) [44)、尺度不变特征变换(SIFT) [45),和脱咖啡因的咖啡1分别)。这些方法都是很好的目标对象检测(1,42- - - - - -45]。猪是基于计算和计算当地区域的梯度方向直方图。黛西是一个快速计算局部图像特征描述符密集的特征提取,并基于梯度方向直方图相似筛选描述符。ORB使用一种面向快速检测方法和旋转简短描述符;与短暂,ORB相对规模和旋转不变的同时仍然使用匹配的非常有效的汉明距离度量。筛选的关键是应用最广泛的算法检测和描述。它充分利用图像的局部信息。筛选功能在旋转,有很好的效果,和翻译,是健壮的视角和光照的变化;这些功能有利于目标的有效表达信息。猪和黛西、图像特征区域的设计; features are computed and sent into SVM classifier to be classified. For ORB and SIFT, they do not have acquisition features regions and specified number of features; we get the image features based on Bag-of-Words (BoW) model by treating image features as words. In the first instance, all features points of all training build the visual vocabulary; in the next place, a feature vector of occurrence counts of the vocabulary is constructed from an image; in the end, the feature vector is sent into SVM classifier to be classified. DeCAF uses five convolutional layers and two fully connected layers to extract features and a SVM to classify the image into the right group [1]。

在这里,我们执行车辆分类剪切实验数据集。表2显示的准确性和FPS cnn和其它先进的测试方法;其他方法非常缓慢,因为他们花费很多时间来提取特征。它可以观察到,结果显示cnn车辆分类问题的有效性。


方法	精度	帧/秒

猪+支持向量机	60.12%	4
黛西+支持向量机	69.04%	2
ORB +蝴蝶结+ SVM	64.07%	7
筛选+蝴蝶结+ SVM	74.49%	5
脱咖啡因(1]	66.20%	13
美国有线电视新闻网	91.42%	800年

从另一个角度来看,我们演示了每个方法的分类能力的混淆矩阵分类过程的五个方法图6。主对角线显示了较高的识别精度。如图6,前五名比较方法的摩托车比另一个类别去了。一般来说,ORB或筛选结合弓和支持向量机方法是一个小比其他两种方法。我们考虑,cnn是最好的方法。但是,cnn的性能结果不太令人满意的观点比运输车和乘客的混乱。

接下来,我们将集中在cnn混乱的原因。根据精密、召回和f1-score分类表3的识别,它表明摩托车非常好,和转运体的识别和乘客是相对贫穷。


类型	精度	回忆	F1-score

摩托车	0.97	0.95	0.96
转运体	0.87	0.85	0.86
乘客	0.90	0.91	0.90
其他	0.93	0.93	0.93

如示例如图所示7,可以看出错误地认识运输车和乘客信息主要包括车辆外观图像,车身信息很少,主要的车辆的脸而言;这些车辆图像相似的配置文件,它仍然是一个挑战来识别相同的图像,如图7手动。

4.4。Pretraining方法实验

我们渴望更好的性能的C4M3F2分类模型。这里,非监督pretraining已被用于优化我们的分类模型。17395辆剪切图像是通过剪切标记车辆图像。

我们pretrained每个卷积层2000时代的参数,然后监督培训我们剪切模型训练集和测试它在我们的剪切测试组;结果如图8。在培训的过程中,效果更明显的结论是,前面的时代,和整个培训过程相对稳定。最终的准确性pretrained cnn是93.50%,高于91.42%的2.08%没有pretraining cnn。

通过分析的分类性能pretrained cnn,表所示4,我们可以得出一个结论,它的性能比的cnn没有pretraining表所示3,尤其是对运输的分类和乘客。总之,pretrained CNN更有效地识别车辆分类,这是一个最先进的车辆分类方法。


类型	精度	回忆	F1-score

摩托车	0.99	0.99	0.99
转运体	0.90	0.99	0.99
乘客	0.91	0.92	0.92
其他	0.95	0.96	0.95

最后,验证检测整个系统的影响,我们进行了烧蚀研究pretraining和测试我们的模型对原始数据集没有被YOLOv2剪切,包含大量的不相关的背景。最终的准确性pretrained cnn对原始数据集是88.29%,低于93.5%的5.21% pretrained cnn在剪切数据集,甚至低于91.42%的cnn没有pretraining剪切数据集;分类性能如表所示5。根据表的分类精度6,我们可以得出这样的结论:这个消融研究证实了检测的重要性几乎在整个车辆分类系统。


类型	精度	回忆	F1-score

摩托车	0.99	0.99	0.99
转运体	0.79	0.82	0.81
乘客	0.84	0.79	0.81
其他	0.90	0.94	0.92


	原始	剪

cnn没有训练的	86.89%	91.42%
cnn与训练的	88.29%	93.5%

5。结论

基于cnn已经详细的分类方法。提高准确性,我们使用车辆检测移除不相关的背景促进车辆特征提取和分类。然后,autoencoder-based layer-wise无监督pretraining介绍提高cnn模型,提高分类性能。几种先进的方法一直在评估我们的标签数据集包含四个类别的摩托车,运输,客运等。实验结果表明,该pretrained cnn方法基于车辆检测是最有效的车辆分类。

此外,车辆分类的成功使得车辆颜色和标志识别系统可能在我们加油行为分析;与此同时,它是一个伟大的帮助城市计算、智能交通系统等。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究支持青年创新促进会CAS (2015355)。作者欣然承认Yupeng Ma的宝贵的贡献和他的实验室的成员在此合作。

引用

d .他c . Lang s .冯x杜,和c,“车辆检测和基于卷积神经网络分类,”学报》第七届国际会议上互联网多媒体计算和服务,2015年。视图:出版商的网站|谷歌学术搜索
j . f . Forren和d . Jaarsma轮胎噪音、交通监视”计算机标准和接口,20卷,第467 - 466页,1999年。视图:谷歌学术搜索
j .乔治·a·西里尔调查局Koshy,和l .玛丽,“探索声音签名车辆检测和分类使用安,”国际期刊上软计算,4卷,不。2,29-36,2013页。视图:出版商的网站|谷歌学术搜索
j .乔治·l·玛丽,k . s . Riyas“车辆检测和分类使用安和资讯,从声信号”《2013年国际会议上控制通信和计算,(ICCC 13)特里凡得琅,页436 - 439年,印度,2013。视图:谷歌学术搜索
y . r . k . Wang Wang Feng et al .,“车辆识别的声学传感器网络通过稀疏表示,”学报2014年IEEE国际多媒体与世博会研讨会、会议(ICMEW 14),页1 - 4,成都,中国,2014。视图:谷歌学术搜索
a . Duzdar和g .孔帕”应用程序使用一个低成本的基带脉冲微波雷达传感器,”18 IEEE仪器和测量技术研讨会论文集,(IMTC ' 01)的第1卷重新发现时代的测量信息IEEE,页239 - 243年,布达佩斯,匈牙利,2001。视图:出版商的网站|谷歌学术搜索
H.-T。金姆和b的歌,“车辆识别基于雷达和视觉传感器融合自动紧急制动,”学报》第13次国际会议控制、自动化和系统(ICCAS 13)光州,页1342 - 1346年,韩国,2013年。视图:谷歌学术搜索
y乔和荣格,“分析wsn-based超声波传感器的车辆检测”,传感器,14卷,不。8,14050 - 14069年,2014页。视图:出版商的网站|谷歌学术搜索
y Iwasaki、m .三角和t . Nakamiya”强大的车辆检测在不同环境中实现道路交通流监测使用红外热成像系统,”科学世界日报文章ID 947272卷,2015年,2015年。视图:谷歌学术搜索
j .局域网,y, l . Wang和y .史,“车辆检测和分类通过测量和处理磁信号,”测量,44卷,不。1,第180 - 174页,2011。视图:出版商的网站|谷歌学术搜索
b·李,张t, t·夏”车辆检测使用完全卷积网络,从3 d激光雷达”https://arxiv.org/abs/1608.07916,2016年。视图:谷歌学术搜索
诉Kastrinaki、m . Zervakis和k . Kalaitzakis”交通应用中,视频处理技术的调查”图像和视觉计算,21卷,不。4、359 - 381年,2003页。视图:出版商的网站|谷歌学术搜索
f·m·齐米。s . Samadi h·r·Poorreza M.-R。Akbarzadeh-T”,车辆识别基于傅里叶,小波和曲波变换——比较研究,”诉讼的第四届国际会议信息技术新一代又一代,ITNG ' 07,页939 - 940,拉斯维加斯,内华达州,美国,2007年。视图:谷歌学术搜索
j.y. Ng黄懿慧茶,“基于图像的车辆分类系统,”https://arxiv.org/abs/1204.2114,2012年。视图:谷歌学术搜索
r·A·哈迪·g·Sulong, l·e·乔治,“车辆检测和跟踪技术:一个简洁的评论,“信号与图像处理:国际期刊,5卷,不。1、1 - 12,2014页。视图:出版商的网站|谷歌学术搜索
j . Arrospide和l·萨尔加多”的研究基于图像处理的车辆检测功能组合,”科学世界日报文章ID 196251卷,2014年,13页,2014。视图:出版商的网站|谷歌学术搜索
p .总裁r . Rajan l .玛丽和调查局Koshy,“车辆使用视听信号检测和分类,”学报》第三届国际会议上信号处理和集成网络,(自旋的16)诺伊达,页726 - 730年,印度,2016。视图:谷歌学术搜索
z陈、t·埃利斯和s . a . Velastin“车辆检测、跟踪和分类在城市交通中,”学报》国际IEEE会议15日在智能交通系统中,ITSC”12安克雷奇,页951 - 956年,阿拉斯加,美国,2012年。视图:谷歌学术搜索
x, l .邵y雪,w .方舟子,“车辆快速学习算法分类,”信息科学卷,295年,第406 - 395页,2015年。视图:出版商的网站|谷歌学术搜索
p . Mishra和b·巴纳吉”多个车辆基于内核的资讯分类器分类,”国际期刊的计算机应用程序,卷71,不。6、1 - 7,2013页。视图:出版商的网站|谷歌学术搜索
a . Tourani和a . Shahbahrami”车辆基于数字图像处理算法,计算方法”第二届国际会议在模式识别和图像分析,IPRIA 15,页1 - 6,拉什特,伊朗,2015年。视图:谷歌学术搜索
y . h . Wang Cai, l·陈,“车辆检测算法基于深层信念网络,”科学世界日报ID 647380条,卷。2014年,7页,2014。视图:出版商的网站|谷歌学术搜索
m .咦,f·杨,大肠Blashch et al .,“车辆分类WAMI意象使用深层网络”学报学报9838:传感器和系统Applicatioins IX空间,2016年。视图:谷歌学术搜索
b·李,张t, t·夏”车辆检测使用完全卷积网络,从3 d激光雷达”机器人的程序:科学和系统,2016年。视图:出版商的网站|谷歌学术搜索
y Lecun (b .波沙,j·s·德克et al .,“反向传播应用于手写邮政编码识别,”神经计算,1卷,不。4、541 - 551年,1989页。视图:出版商的网站|谷歌学术搜索
y Lecun (l . Bottou y Bengio, p . Haffner“Gradient-based学习应用于文档识别,”IEEE学报》,卷86,不。11日,第2323 - 2278页,1998年。视图:出版商的网站|谷歌学术搜索
a . Krizhevsky i Sutskever, g·e·辛顿“ImageNet分类与深卷积神经网络,”神经信息处理系统,第1105 - 1097页,2012年。视图:谷歌学术搜索
p . Sermanet d特征,x, m·马蒂厄·r·费格斯,和y Lecun (“OverFeat:综合识别、定位和检测使用卷积网络,”https://arxiv.org/abs/1312.6229,2013年。视图:谷歌学术搜索
r . Girshick j·多纳休、t·达雷尔和j·马利克,“丰富的特性准确的对象层次结构检测和语义分割”美国27日IEEE计算机视觉与模式识别会议(CVPR 14)俄亥俄州哥伦布市,页580 - 587,美国2014年。视图:出版商的网站|谷歌学术搜索
在r . Girshick“快速R-CNN。学报》第15届IEEE计算机视觉国际会议(ICCV 15),页1440 - 1448,圣地亚哥,智利,2015。视图:出版商的网站|谷歌学术搜索
j . Redmon s Divvala r . Girshick,哈蒂,“你只看一次:统一、实时检测,”学报2016年IEEE计算机视觉与模式识别、会议(CVPR 16),页779 - 788,拉斯维加斯,内华达州,美国,2016年。视图:谷歌学术搜索
任,k .他、r . Girshick和j .太阳,“快R-CNN:对与地区建议网络实时目标检测,”IEEE模式分析与机器智能,39卷,不。6,1137 - 1149年,2017页。视图:出版商的网站|谷歌学术搜索
d . w . Liu Anguelov, d . Erhan et al .,“SSD:单身multibox探测器拍摄,”《计算机视觉-大会2016卷,9905在计算机科学的课堂讲稿,21-37,2016页。视图:出版商的网站|谷歌学术搜索
李y, j·戴,k .他和j .太阳”R-FCN:对象检测通过提出完全卷积网络,”https://arxiv.org/abs/1605.06409,2016年。视图:谷歌学术搜索
j . Redmon和a·哈蒂”YOLO9000:更好,更快,更强”学报30 IEEE计算机视觉与模式识别、会议(CVPR 17),页6517 - 6525,檀香山,夏威夷,美国,2017年。视图:谷歌学术搜索
d . Erhan y Bengio, a .考维尔中国。Manzagol、p·文森特和s . Bengio“为什么帮助深学习未受训的?”机器学习研究杂志》上11卷,第660 - 625页,2010年。视图:谷歌学术搜索|MathSciNet
g·e·辛顿、美国Osindero和y格兰,“快速学习算法深度信念网”,神经计算,18卷,不。7,1527 - 1554年,2006页。视图:出版商的网站|谷歌学术搜索|MathSciNet
y Bengio, p . Lamblin、d . Popovici和h . Larochelle“贪婪layer-wise培训深度网络”神经信息处理系统,第160 - 153页,2007年。视图:谷歌学术搜索
d . Cireşan j .∙马希,迈耶,,的j。施密德胡贝尔表示“堆叠卷积Auto-Encoders层次特征提取,”《人工神经网络和机器学习- ICANN 2011卷,6791在计算机科学的课堂讲稿页52-59 Springer,柏林,德国海德堡2011。视图:出版商的网站|谷歌学术搜索
g·e·辛顿和r·s·泽梅尔Autoencoders、最小描述长度和亥姆霍兹自由能,”神经信息处理系统,1994年,页3 - 10。视图:谷歌学术搜索
m·d·Zeiler d·克里·g·w·泰勒,和r·费格斯“Deconvolutional网络”《IEEE计算机学会学报计算机视觉与模式识别会议(CVPR 10),页2528 - 2535年,旧金山,加州,美国,2010年。视图:出版商的网站|谷歌学术搜索
n .中间人和b区格”的梯度直方图的人体检测,”《IEEE计算机学会学报计算机视觉与模式识别会议(CVPR ' 05)1卷,第893 - 886页,2005年。视图:出版商的网站|谷歌学术搜索
e .拖拉、诉Lepetit和p . Fua”黛西:一个高效密集的描述符应用于wide-baseline立体声,”IEEE模式分析与机器智能,32卷,不。5,815 - 830年,2010页。视图:出版商的网站|谷歌学术搜索
e . Rublee诉Rabaud、k . Konolige和g . Bradski”ORB:一个有效的替代筛选或冲浪,”《IEEE计算机视觉国际会议(ICCV 11)西班牙巴塞罗那,页2564 - 2571,,2011。视图:出版商的网站|谷歌学术搜索
d·g·劳”,从当地的扇区特征对象识别,”学报》第七届IEEE计算机视觉国际会议(99年ICCV”),卷2,页1150 - 1157,克基拉岛,希腊,1999。视图:出版商的网站|谷歌学术搜索

多媒体的发展