文摘

近年来,辅助驾驶和自动驾驶技术一直被公众更加关注。路标识别具有十分重要的现实意义的自驾的实现技术。在实际交通环境、交通标志检测容量小的问题,低分辨率,不清楚的特点,容易被打扰的环境。为了更好地实现道路交通标志识别,本文改进和优化YOLO v3网络来源于YOLO v3意思意思结构算法,增强了数据的交通标志使用色彩增强和其他技术,并改善了原YOLO v3意思网络算法的红外系统结构52×52。然后,二次采样输出特性图108年YOLO v3意思网络使用×108解决方案来解决这些困难的图片大小和图像失真。使用5、9和13个固定大小的线程池的控制体系结构的表面,然后输出特性与图片的原始特征,以便输入不同的大小可以获得相同的输出。最后,我们使用中间类K算法组TT100K里程碑式的数据集,考虑原来的网络参数,并比较TT100K数据集与小的目标确定算法,如YOLO v3网络模型和改进YOLO v3意思意思网络模型。结果表明,与传统YOLO v3意思算法相比,优化YOLO v3意思路标识别算法有明显改善迹象识别准确性,信号识别速度和学习成本。当FPS的变化很小,召回率和精度将大大提高。同时,与其他小目标检测算法相比,改进的YOLO v3意思算法更准确和更快的检测精度。

1。介绍

道路交通标志在交通秩序和安全发挥着不可替代的作用。他们收集道路信息、警告、禁令和其他信息到一个简单的标志指导和限制司机安全驾驶。交通标志的设置维护道路交通的安全性和平滑度在很大程度上。协助道路安全标志,交通标志也提供了一个简单而明确的突破为智能交通的发展。道路交通标志通常是由一些简单的文字或符号和颜色特征,与周围的环境形成鲜明的对比,道路交通标志可以更好的吸引司机的注意力。交通标志有不同的符号和颜色代表不同的交通信息1]。

目前,无人驾驶技术得到了广泛的关注。希望提高无人驾驶车辆的安全系数在路上,它需要改善汽车的感知周围的事情,实时、准确检测路面上的所有目标环境知觉的一个重要组成部分2]。如今,交通标志识别系统主要样本道路交通标志,进一步的检测和识别收集到的样本信息,输出识别结果,比较原始图像与交通标志数据库给结果,最后,通过控制中心发出警告和其他信息。因为交通标志识别系统通常是用于高速机动车辆、输入信号需要处理的嵌入式设备机动车辆(3]。面对这样复杂的步骤,如何使交通标志识别系统的嵌入式设备,高实时精度的常见困难,我们的脸。同时,无人驾驶驾驶已经吸引了越来越多的全球关注。是非常重要的,以确保安全的无人驾驶车辆的情况下,有必要对感知周围环境信息。其中,实时、准确检测路面上的所有目标环境知觉的一个重要组成部分。通过识别远程目标,更多的时间可以提供车辆的决策和控制。通常,远距离目标(如交通标志)规模较小,占领几个像素,图像中没有明显的特征,这使得它难以实时检测和识别它们[4]。因此,如何准确地识别交通标志,同时确保实时性能,是需要解决的关键问题。到目前为止,交通标志的识别主要分为两个方向:传统的特征提取和深入学习。

1.1。基础交通标准识别的特征提取方法

通常有三个传统交通标志识别方案:基于颜色的交通标志识别方法,shape-based交通标志识别方法和基于机器学习的交通标志识别方法。参见图1传统的交通标志识别的过程。

1.1.1。基于颜色的交通标志识别方法

路标通常包含红、黄、蓝颜色。这种明亮的颜色会导致强烈的图像中特征信息,可分性和颜色空间阈值分割是相对容易的。到目前为止,许多学者已经达到了基于颜色的交通标志识别方法。基于路标的颜色识别方法采用的方法划分道路标志的颜色空间分布,实现道路标志的检测和识别,然后提取分割图像的特征信息,最后,通过支持向量机分类器分类提取的特征信息。RGB颜色空间模型提出了一种图像分割算法,该改进算法的运算速度(5]。杨和吴6)提出了一种两阶段算法道路交通标志检测。该算法首先计算颜色概率,然后将图像转换为特征提取的概率模型。提取的特征信息是通过积分频道来减少错误。元等。7)利用边缘信息来检测交通标志的颜色变化在当地地区。

1.1.2。使用路标的形状识别检测方案

因为路标的形状不同的含义千差万别,我们可以识别交通标志的识别他们的形状。我们称之为基于交通标志的形状识别算法。这种算法首先提取交通标志形状的特征信息,然后通过不同形状分类提取的特征信息。莫雷诺et al。8)和其他限制霍夫变换检测交通标志的几何在一定区域,提高检测系统的鲁棒性。各州et al。9)提出了一种编码梯度检测方案路标损伤和阻塞,改善了交通标志的检测效果差,检测损伤和闭塞。裴et al。10)提出了一种低秩矩阵恢复架构与检测模型来解决这个问题,在交通标志的相对性特征信息很容易被忽略,从而更好地利用交通标志识别路标的相对性。

1.1.3。基于路标的形状识别方案

路标检测方案基于机器学习通常采用移动窗口法来检测给定的交通标志图像,研究人员手动选择和提取图像特征信息。在研究基于机器学习的目标探测,中间人(11)在2005年提出了猪算法。算法的工作原理是利用图像的梯度方向直方图分布来描述图像中的地址数据的特征信息和规范化。该算法可以有效地检测图像中目标特征的本地数据,然后猪+支持向量机(12)结构一直在持续,这也对路标识别有很大的不利影响。因为交通标志有不同的颜色信息,桓et al。13)颜色信息添加到猪算法扩大,取得了良好的效果在交通标志的区别。根据勒存et al。14),研究发现不同梯度方向直方图特征基于猪算法,和训练一个分类器来检测交通标志通过限制学习机器,这提高了检测效率没有降低检测精度。

1.2。基于深度学习的路标识别算法

路标检测方案使用的计算机技术研究深度学习识别方法也逐渐成熟。卷积神经网络的兴起使得深学习方法使用深层神经网络结合不同训练方法在计算机视觉领域。自从杰弗里•辛顿(15)在2006年提出了人工智能的研究,深度学习迅速席卷了所有的计算机技术研究领域,其中最具代表性的算法是一种卷积神经网络(CNN)。在计算机视觉中,卷积神经网络解决不同的问题在当前阶段识别的准确性和识别速度慢,能更有效地提取图像中的特征信息和准确。与CNN的发展,两级网络结构如RCNN [16],VGG [17],AlexNet [18)图像分类和基于SSD(单程网络结构19有人知道由罗[]和20.)系列的目标检测算法已经先后扩展。该算法首先提取目标图像的特征,然后通过提取的特征信息生成候选区域,最后,利用卷积神经网络分类。与传统的目标检测算法相比,两级算法解决了更多的特征信息的缺点,大量数据,缓慢的检出率,泛化能力差,等等。单相体系结构也被称为应用程序的识别框架回归。它主要使用回归理论给该地区的想法,直接通过骨干网络的信息,和丢弃候选区域和RPN网络,分别。与两阶段算法相比,该算法可以识别更快,但识别精度不如两阶段算法。与深度学习算法研究的深入,越来越多的学者研究的深度学习算法来识别路标。左et al。21)提出了级联RCNN算法,检测精度99% CCTSDB数据集,但检出率相对缓慢。Jianming et al。22)使用更快的CNN来检测交通标志和优化检测性能。Jianming et al。22]减少了算法的计算和参数的剪裁网络YOLO v2(意思的基础上23)和增强小目标的检测性能交通标志的啮合输入图像特征。

2。传统的交通标志检测算法存在的主要问题

2.1。基于颜色的交通编译检测算法存在的主要问题

不同类型的交通标志有不同的颜色。例如,红色交通标志一般表示禁止的行为。不同颜色的组合交通标志也传达不同的信息。交通标志的识别可以有效地阅读交通标志的含义。的深化研究道路标志的颜色,颜色的路标检测结构大大提高了检测速度和精度。然而,交通标志通常是开放和暴露的道路上,有时面对照明的影响,褪色,闭塞,和恶劣的天气,这使得基于颜色的检测算法获得的结果的不稳定,导致错误的检测结果和错过的检测。

2.2。路标的形状识别体系结构的主要问题

交通标志的形状是一个重要的交通标志信息的功能。例如,三角形经常显示提醒,圆圈表示禁止或发布禁令。有效的识别交通标志的形状可以解决最初的交通标志信息的阅读。检测算法的路标的形状,尽管交通标志的识别精度大大提高持续改进研究后,由于道路环境的复杂性,检测结果交通标志的脸阻塞时,变形和其他情况下是令人不满意的24]。此外,所需的计算提取交通标志的形状特征信息很大,它增加了模型的计算时间,需要更高的机器的计算能力。虽然许多学者也研究了检测算法的统一道路标志的颜色和形状,它也减少模型大小和提高算法的实时性能,但是这种传统的可靠性和实时性能的交通标志检测算法仍难以满足人们的要求,安全驾驶(25]。

2.3。存在主要问题在交通标志识别使用机器学习算法

虽然交通标志检测框架基于机器学习有很大提高检测准确性与交通标志检测算法相比,基于颜色和形状,这种检测算法具有较高的特征提取的要求。此外,基于机器学习的检测算法通常需要手动选择区域的特征信息,这使得这种算法有很高的工作负载和可怜的实时性能。交通标志检测,基于机器学习的目标检测算法仍有一些局限性。

3所示。YOLO v3意思算法的基本原理

YOLO v3意思是探测器目标。其骨干架构使用Darknet-53代替Darknet-19。总共有53个卷积层。网络结构如图2

Darknet-53使用RESNET残余的想法供参考形成残余结构,可以控制渐变的传播,避免不利于训练的情况下,如梯度消失或爆炸,大大减少训练的难度深的网络。网络的主要部分是由五个碎片。多残留单元形成一个残块,每个残单位构成的两个双模块和快速链接。深可分离卷积模型如图3

Darknet-53最低重量双模块由卷积,包标准化、和泄漏恢复射击。YOLO v3意思预测分为13×13日26日×26岁和52×52。这三个参数推测试水平的三个性能图表。特别是底层映射的特点有一个小敏感字段和小目标探测能力强,而深度映射的特性有很大的感应范围,提高检测的性能大目标(26]。因此,YOLO v3意思有明显的优势在确定检测目标的大小。因为YOLO v3意思网络学习效率高,适应性强,不同的任务尺度在复杂交通场景,TT100K [18信号数据集是用来改善、培训和测试YOLO v3意思网络。

4所示。4 YOLO v3意思算法的改进

针对低精度的神经网络识别原始YOLO v3意思的长途降低目标对象,本文改进了算法组成,K——网络结构和损失函数。

4.1。改善网络结构

从最初的深层结构的深层网络YOLO v3意思有利于大型目标的检测,和浅结构方便小目标的检测,因为浅卷积算法结构通过小层(27],它缺乏深层的语义特征,包含语义信息更少,并且特征表征能力较差,这些特性影响小目标的检测,这取决于浅算法结构。为了提高特征提取的能力检测算法结构,本文采用《盗梦空间》架构,可以丰富的特点浅网络供参考。

如图4,初始神经网络操作和池操作上执行所确定的形象,和输出结果的深度标记特征图像拼接等不同的卷积核大小1×3×3,3×3或5×5。不同认知域的信息可以从输入图像数据获得,这些操作可以组合,可以组合结构来改善图像质量表示。灵感来自于概念架构,提出概念重新定义模块结构和应用于浅层YOLO v3意思网络。有人知道由罗v3与传统网络相比,浅层网络的识别算法有更强的能力来提取的具体表现,以及信息提取大量的识别系统是改善。改进的YOLO v3意思算法也更密切结合神经网络的特征点,图像的识别和感知效率较高,和小交通标志的识别能力提高。

5显示了初始的结构重新定义模块。的两端结构浅网络层和网络层,分别用于连接到网络YOLO v3意思。的结构由四个子结构:第一个子结构是1×1卷积累;第二个分支是由1×1的卷积,然后3×3的卷积,第三部门由一个1×1的卷积紧随其后的卷积三个3×3;第四个分支包括最大池层。7×7卷积有效地提取基本信息从不同的小图片。本文使用三个3×3的卷积运算,而不是一个7×7可以节省7×7(3×3×3)= 1.81倍计算量,提高计算速度。前面3×3卷积是1×1。卷积层可以减少输入通道的数量,有效减少输入参数的数量,增加并行体系结构的能力。 Benefit from 1 × 1 convolution passes through the ReLU activation function [28),因此可以提高神经网络的泛化性能通过引入非线性数据池提取图像特征。四个分支提取不同尺度的特性,增加网络的适应性不同尺度和获得信息从多个尺度,分别,29日]。然后四个分支下的特征图融合,最后,通过输出访问的数量减少1×1卷积层。特征图像输出的通道比左1×1卷积右3×3卷积会影响终端识别精度。摘要不同比例进行了测试,数量比1:1终于选择最高的精度。表1显示了不同比例映射值。

concept-redefined模块结构引入到输出64图1,64×64(32×32)之间的特征关系图和连接形成YOLO v3意思改进网络。介绍方法如图4。通过连接deep-network层浅网层,结合深度信息和浅信息更有利于小目标的预测。输出64×64的特征图,深的通道流量容量和规模网络图特点是64×64×128。尺寸和表面渠道网络特征映射是64×64×256,然后融合特征映射是64×64×384。

如图6,本文试图运用几个发行版《盗梦空间》重新定义模块的结构。最后,本文选择最好的分布结果。与浅信息相比,深度信息可以提供更多的图像特征。的多维和多级卷积内核改进YOLO v3意思算法还提供了方便的感觉视野信息在不同的范围,和句子信息丰度提高了感知能力的小目标。

为了提高交通标志识别的准确性比例图像识别的算法,本文改进了原Yolo v3和意思的缺点K——缺乏过滤函数,提出了一种改进的聚类算法k——聚类算法。在此基础上,本文提出了一种改进的K则算法。首先,无效数据的数据集是由计算width-height消除比对象的坐标,并保留有效数据。下一步,使用k——建筑操作对获得的数据进行分类。母亲是获取大小和比例的锚。最后,分类结果添加到YOLO层意思进行训练和识别。改进的执行顺序k则算法如下:输入:尺寸文件数据集。输出:宽度、高度和锚箱的比例。我是标志着目标。(1)消除数据注释数据集的意义。(1)= 1总做(2)编写协调维度的数据文件的数据集。(3)马克根据以下规则。在左上角的注释框,标准x设在是X最小值的坐标上的注释框的左下角x设在是X最小值,小左角落的坐标y设在是Y最小值,x设在坐标轴的右下角被标记为X马克斯的右上角y设在被标记为Y马克斯(4)Dx=X马克斯X最小值dy=Y马克斯Y最小值如果Dxd = 0或yD = 0,马克数据通信x和Dy是没有意义的。(5)= Dx−Dy,如果0.3 << 1,接下来,让注释的数据相比,DX和Dy是有效的和其他注释数据无效。(6)过滤信息集合中所有有意义的评论。(7)结束了(2)有效的注释数据集群(1)选择k集群故意,选择中央的初始集群k漫无目的。(2)(3)计算所有有效的借据价值和群集中心注释数据。(4)数据点与大型借据值将被分为集群集群中心的位置。(5)生成新的家庭中心点从中央组每个集群的数据点。(6)而(集群中心移动)。

优化K——聚类算法可以有效地忽略无效的注释的不利影响聚类中心,显著提高锚箱之间的配合和交通标志,并显著改善YOLO v3意思网络模型的识别精度。

4.2。优化算法损失

数据迷失在YOLO v3意思算法主要分为协调回归损失,信心丧失,集群的损失。协调的损失函数回归计算均方误差,目标的大小可以直接导致减少协调回归精度,使用借据作为目标规模YOLO v3意思会带来两个问题:第一,当借据(一个,B)= 0 (一个,B是预测边界框和真正的边界框,分别),也就是说,什么时候一个B不重叠,是不可能的知道吗一个B彼此相邻或很远的地方,也就是说,它不能反映它们之间的距离,及其梯度为零,所以它不能优化;第二,借据(一个,B)不是0,即当一个B重叠,不能反映特定重叠的两个,在不同距离的情况下,不同的比例,比率和不同方面,使用借据作为损失,回归的情况通常是不完整的。与借据相比,它只关注集群重叠的领域,不像借据,这只关注重叠区域,GIOU不仅注重叠加的特定重叠区域也在同一时间,有足够的计算能力来匹配其他不重叠的区域,它可以更好的反馈对象之间的匹配程度。如图5借据的值都是0.33,但有三个不同的重叠,也就是说,GIOU值是0.33,0.24,和0.1从左到右,分别。GIOU定义如下:

在这个公式,C的最低叠加区域是一个B。借据的值范围是[0,1],和值范围GIOU (−1,1)。GIOU,当预报值与实际值完全一致,该值为1。当两个不重叠和方法无穷,GIOU最小值1。GIOU是表达量测精度的准备,可以准确反映预测值和真实值之间的差异。因此,本文选择GIOU取代协调回归损失,并给出的公式如下:

信心损失函数给出如下:

第一项在这个公式是错误的预测帧包含目标的信心。第二项是没有目标的信心误差预测框架。年代2是网格的数量输入图像的标记; 指示是否j锚箱的th网格捕获目标,这是1或0;C是真正的盒子的信心得分; 是预测的信心得分盒子。

当第一个锚箱第i个网格捕捉目标,生成的边界框锚箱将计算分类损失函数。在方程(4),C代表检测目标类别, 表达真正的盒子的概率和预测框属于一类C在网格,分别。最后给出了改进的损失函数如下:

5。识别算法的实验结果和分析

为了测试优化的准确性YOLO v3意思算法在本文识别交通标志设计,本文进行两次检查,这是不同的改进YOLO v3意思算法的比较实验和使用三个图像输入大小(416×416、608×608、1024×1024),并验证这两个测试方面的平均检测精度(地图),每秒检测图片数(FPS)和准确性召回(P-R)曲线。

5.1。路标样本收集和实验平台

在这个实验中,交通标志使用数据集tt100,提供100000 2048×2048的图片,其中30000个交通标志实例是小目标。有45的对象类型的数据集,代表相应的交通标志,分别为:2,4,5,伊尔One hundred.伊尔60岁,伊尔80年,io,知识产权,p10日,p11日,p12日,p19日,p23日,p26日,p27日,p3,p5,p6, ,ph值4,ph值4.5,ph值5,plOne hundred.pl120年,pL20.pl30.pl40岁,pl5,pl50岁,pl60岁,pl70年,pl80年,20.30.55岁,pn,阿宝pne pr40,确实,w32, w55, w57, w59和我们。首先,我们应该提出交通标志的图片没有地标文件数据集,选择6105张照片算法练习,3070张照片的准确度和速度检测。

ubuntu22.04实验硬件:软件系统,d神经网络学习框架pytorch1.4、CPU AMD-r5 5600克,32 GB内存,NvidiageForceRTX3080Ti 2 GPU, 24 GB的视频内存。

5.2。算法训练和检测

在这个实验中,我们训练YOLO v3架构和改进YOLO v3架构和意思意思YOLO v3意思的常规参数优化方法用于优化参数。最初的学习速率是0.001,最大迭代300次。培训将衰变速率的10倍,当迭代次数是75时代,150时代,和250时代,分别。数据集被翻转,增强翻译转换,和其他方法。同时,采用多尺度培训使规模上下浮动的范围,从而达到更好的训练效果。首先,测试后的两个模型训练和计算精度和召回。公式计算精度和召回给出如下:

公式,议员是积极类预测的积极类的数量,OP是负类预测的积极类的数量,并在积极类消极预测的类的数量。通过设置一个固定的阈值,预测结果探测器按降序排列的信心,和积极的预测样本各自的生成,P和R值可以计算和P-R曲线可以得出。

5.3。比较结果和分析
5.3.1。改进的对比实验

YOLO v3意思是基于交通标志(名为YOLO v3-A意思),改善YOLO v3网络检测层意思和红外系统结构(YOLO v3-B意思),添加空间金字塔模块(YOLO v3-C意思),并将其添加到上述三个改进YOLO v3-D意思网络。输入图像的大小是608×608。这四个优化模型测试TT100K照片采集和传统YOLO v3意思网络。实验结果如图所示7

7显示,检测速度和精度的优化YOLO v3架构意思TT100K交通标志的数据集是高于传统YOLO v3架构意思。在四个优化YOLO v3模型,意思YOLO v3-D意思的映射模型达到75.2%,效果是最好的在四个网络。尽管它的FPS已经减少到31.3 f / s,它仍然可以满足实现交通标志的检测与识别。

5.3.2。改善YOLO v3意思尝试不同的图片大小

此外,测试优化YOLO v3意思算法的有效性,并进行比较分析实验优化YOLO v3意思神经网络算法(YOLO v3-D意思)和原始YOLO v3意思算法图像输入大小416时,608年和1024年,分别。当输入大小是416、608和1024年,分别P-R曲线比较图YOLO v3网络和改进YOLO v3意思意思的网络模型图所示8- - - - - -10。优化YOLO v3意思算法模型的精度和召回率都高于YOLO v3意思网络在一定程度上。

有3070张照片和7700测试集的目标。两个网络模型进行测试,分别。他们的地图和FPs如表所示1

输入尺寸是416×416,608×608、1024×1024,YOLO v3意思优化算法的映射模型增加了8.3%,6.1%,和4.3%,分别在FPS没有显著减少;大小416×416、608×608,快速检测的特点,能够满足道路标准识别现实的需要。

5.3.3。比较分析优化的算法和原算法

为了进一步测试优化算法的识别效果,输入图像的大小是608×608。改进YOLO v3意思算法与RetinaNet相比,外交部,CornerNet和其他先进的小目标检测算法。最后比较分析如图11

可以看出(图10)只有外交部算法高,比优化YOLO v3意思框架识别精度。然而,它的FPS远远低于优化YOLO v3架构意思;CornerNet算法的检测速度改进YOLO v3意思算法类似,但其地图是2.7%低于YOLO v3意思改进算法。实验表明,优化的YOLO v3意思算法提出了可以在交通标志识别取得了不错的效果。当识别小交通标志TT100K交通标志大数据集和交通标志小范围闭塞和长途,改进YOLO v3意思算法也大大提高了识别效率和实验结果的准确性。

6。结论

本文介绍了一种优化模型利用YOLO v3,意思旨在解决e道路交通标志识别精度低的问题,在任务的路标识别,检测模式需要处理许多参数和速度慢。针对YOLO v3意思的缺点,该算法架构,K——聚类算法,和损失函数进行优化,从而大大提高了检测的准确性和速度的框架。仿真结果表明,优化YOLO v3意思为小型交通标准识别框架更有优势。检测实验三种不同分辨率的照片显示,相比之下,传统YOLO v3意思算法,识别精度提高优化算法的8.1%,5.9%,和4.6%,分别。的前提下确保FPS之间的差距很小,召回率和准确率已经大大改善了。一般来说,YOLO v3意思优化算法的主要优势在路标检测和识别是提高识别效率和识别精度较高。特别是,识别率更高小和遥远的交通标志和交通标志被异物覆盖在一个小范围内。可以看出,改进的YOLO v3意思具有更高的可用性在实际道路交通。

数据可用性

数据用于支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。