文摘
在高速度和高效率的生活和工作,疲劳是导致事故的重要因素之一,如交通和医疗事故。本研究设计一个功能使用地图的剪枝策略(PFM),从而有效地减少冗余参数,减少了时间和空间的复杂性并行深卷积神经网络(DCNN)培训;提出了一种校正在映射阶段。sec共轭梯度方法(CGMSE)实现共轭梯度方法的快速收敛性,提高了网络的收敛速度;在降低阶段,负载平衡策略来控制负载率(LBRLA)提出了实现快速、统一的数据分组以确保并行系统的并行性能。最后,疲劳的相关算法的研究与仿真基于人眼在电脑上进行。检测到人脸和眼睛区域使用USB摄像头,从采集到的视频图像帧差分法和人眼的位置信息在脸上。跟踪人眼区域,提取相关的人眼疲劳特征,结合眨眼频率,闭上眼睛持续时间、PERCLOS,和其他人眼疲劳测定机制来确定疲劳状态,和测试,通过实验验证平台和算法设计。这个系统的目的是让人打瞌睡,如司机,及时发现他们的国家通过系统由于疲劳和降低事故的可能性。
1。介绍
随着社会经济的快速发展,在今天的快节奏,高效率的生活和工作,致命的事故经常发生。特别是在道路交通领域,经过一段时间的开车,司机将经历疲劳状态,如注意力不集中,闭上眼睛很长一段时间,和打瞌睡,导致减少驾驶员的感知和判断的周边环境1]。反应变得缓慢和交通事故很容易发生。此外,高速交通事故往往是致命的和毁灭性的。根据交通事故统计年鉴》,今年大约有30%的道路交通事故相关疲劳驾驶,和疲劳驾驶造成的死亡人数占总数的10%以上的交通事故死亡人数(2]。如何防止疲劳和减少事故造成的疲劳,尤其是道路交通事故的发生,已成为社会公共安全的一个主要问题。如果一个实时检测系统可以提供在车里,警报被触发时,司机可以出现疲劳,以便司机可以慢下来或者停下来休息,和事故是可以避免的。在这种情况下,开发一个高性能疲劳预警系统在当今社会已经成为一个热点,吸引了越来越多的关注。
互联网技术的快速发展和大数据时代的到来,与传统的数据相比,大数据4 V特性,即大规模的(体积),快速变化(速度)、多峰性(品种)和价值(3]。4 V特性很难对传统分类算法和处理大数据处理平台。近年来,并行化技术的发展和分类特征选择算法提供了一个新的视角对大数据处理。DCNN是分类算法(4]。算法的一个重要类型,它强大的功能选择能力、泛化能力,和函数逼近能力,被广泛应用于图像分析、语音识别、目标检测、语义分割、人脸识别、自动驾驶、和其他领域。因此,基于大数据,DCNN分类算法的研究已成为一个研究热点。尽管深度学习技术由DCNN取得了许多重要进展在大数据领域近年来分类,如何减少网络的训练时间和空间复杂性仍然是一个重要的问题。为了克服在DCNN训练中遇到的困难,研究人员设计了许多框架处理数以百万计的数据,如AlexNet VGG ResNet,《盗梦空间》系列。其中,AlexNet 6100万参数和VGG16有1.38亿个参数;ResNet参数和初始V2包含170万和1126万参数,分别为(5]。这样大量的参数需要巨大的时间成本和硬件资源,而这些问题通常是由于在DCNN冗余参数;参数修剪是一种有效的方法来减少冗余参数。不仅容易平衡压缩率和性能损失和其他类型的压缩方法是兼容的,但也有可能防止过度拟合,因此得到了广泛的关注。
本文设计一个功能使用地图的剪枝策略(PFM),从而有效地减少冗余参数,减少了时间和空间的复杂性DCNN培训;在映射阶段中,共轭梯度法(CGMSE)与sec行提出修改。共轭梯度方法的快速收敛性可以提高网络的收敛速度;在降低阶段,提出了一种负载平衡策略(LBRLA)控制负荷率,实现快速和统一的数据分组,从而确保并行系统的并行性能。最后,疲劳的相关算法的研究与仿真基于人眼在电脑上进行。检测到人脸和眼睛区域从USB摄像头采集的视频图像帧差分法和人眼的位置信息在脸上。跟踪人眼区域,提取相关的人眼疲劳特征,结合眨眼频率,闭上眼睛持续时间、PERCLOS,和其他人眼疲劳测定机制来确定疲劳状态,和测试,通过实验验证平台和算法设计。
2。相关的工作
Hammou et al。6]利用互补的DCNN修剪和量化,减少了冗余参数在一定程度上通过平行的压缩学习种植和量化,但这种方法不考虑DCNN层之间的区别。因此,姚明et al。7)整合两种不同的结构化稀疏合法化到原始的过滤和修剪目标函数,可看似进行修剪。然而,这个算法的修剪效率很低。总之,如何设计一个合理有效的冗余参数修剪策略仍DCNN社区中的一个热点问题。
从历史的角度来看,疲劳预警在许多方面得到了广泛的应用,如汽车驾驶。事实上,疲劳驾驶引起了科学家的极大兴趣很久以前,许多学者从不同的角度提出并设计相应的解决方案,例如,从医学的角度,机械,计算机视觉。然而,截至今天,由于各种限制,一个完美的解决方案,防止疲劳尚未出现在所有方面。目前,它是一个更加成熟和可靠的解决方案使用生理信号测量和分析来确定司机的心理疲劳,使实时警告(8]。然而,这种方法的局限性也很明显;即主题需要穿有关生理检测传感设备长期开车或工作,将引起的不适,并进一步影响其正常运行。因此,疲劳检测和预警通过排除生理测量是当前研究的重点。
至于外围的安全警报,它主要是通过智能实现实时视频监控,和移动目标的检测和识别主要涉及。目前,研究主题包括在计算机视觉、数字图像处理和模式识别,最受欢迎的是移动目标的检测和识别。主要的思想是在视频通过计算机视觉技术对移动目标进行分类,同时在内容和状态的运动描述和识别。从目前看来,这个话题在人机交互领域具有良好的应用前景,智能监控,和行为识别和分析(9]。因为目标的形状发生变化的检测,其检测精度不高,这是一个大困难这个问题,因为,在视频拍摄的过程中,他们非常容易受到外部照明和部分遮挡等客观因素。此外,可能会有情况类似的目标对象的形状有很大不同,而不同类型的目标对象是非常接近的形状,所有这些造成巨大困难移动目标的检测和识别。虽然减少冗余参数可以降低算法的时间复杂度在某种程度上,收敛速度的影响参数更新算法的DCNN训练时间是不容忽视的。因为随机梯度下降法的收敛速度太慢在大数据环境中,有一些算法加速收敛。学者们提出了更新使用共轭梯度方法的参数。Sohrabi et al。10)提出了共轭梯度法的非线性重心,满足充分下降条件,但只有在沃尔夫标准才能保证全局收敛性。因此,王et al。11)提出了一个无约束谱共轭梯度方法,提高了算法的搜索效率在一定程度上通过修改的学习步长和共轭方向共轭梯度方法。此外,周et al。12)提高了sec条件和共轭梯度法的收敛速度加快,但谱共轭梯度法和sec公式改进共轭梯度法不能保证下行方向的生成。有必要进行分析和实现。重启,确保收敛,所以算法的时间复杂度非常高。因此,寻找一种共轭梯度方法,可以快速收敛是当前研究的一个重要问题。
影响的训练效率的因素大数据环境中并行DCNN算法是梯度下降法的收敛速度和并行模型的性能。近年来,研究人员提出了许多大数据处理方法,可以有效地提高算法的效率。其中,MapReduce平行由谷歌开发的学者和企业由于其操作简单,自动容错、负载平衡、和强大的可伸缩性。目前,许多基于MapReduce计算模型的神经网络算法已经成功地应用到大数据领域的分析和处理。阿迪尔et al。13]提出了CNN-MR(基于卷积神经网络的MapReduce)算法,它使用一个数据并行策略,将训练样本划分为每个计算节点的平台,使算法训练的效率。郝et al。14]提出DCNN并行算法MR-DCNN) (MapReduce基于卷积神经网络算法,减少了计算复杂度的DCNN,但算法的准确性仍是不够的。Bhardwaj et al。15]提出了PPNN(多态并行卷积神经网络)算法,引入了反褶积层,提高了算法的精度在一定程度上通过当地多态并行网络和多对多的联系。Lakshmanaprabu et al。16]提出了DCNN-ABC(深基于卷积神经网络的并行人工蜂群)算法,它结合了蜜蜂并行蚁群算法找到最优参数,并进一步提高了算法的精度。然而,上述算法的并行策略不考虑服务器的负载能力,导致系统运行效率低,资源利用率低。因此,如何设计和实现一个高效的并行DCNN仍然是一个需要解决的问题。
3所示。基于大数据的神经网络并行优化算法
本文主要研究理想的疲劳驾驶预警系统的设计,需要实时性能好、成本低、可靠性高、全天候、和智慧。系统主要收集司机通过摄像机的视频图像,并使用机器视觉技术、图像处理技术、脸部和眼部识别技术,以及相关的疲劳测定算法来检测疲劳状态,给早期预警:(1)摄像机获取图像它主要使用一个合适的相机实时收集驾驶员的面部图像,主要包括人脸和背景图像。为了使疲劳警告晚上正常工作,你可以选择一个摄像头和红外功能(17]。(2)图像数据处理视频图像采集的过程中,它可能会影响到外部环境噪声和不均匀光照的干扰,导致图像质量的退化。为了不影响后续疲劳特征提取,有必要进行光照补偿和图像增强原始图像以改善图像质量。然后,使用相关的图像处理算法,我们获得感兴趣的目标区域,人眼区域,为后续疲劳特征提取提供了基础。(3)特征提取的疲劳状态它主要使用疲劳测定算法从视频图像中提取相关的疲劳特性。本文使用眼睛的特征反映了驾驶员的疲劳状态。有必要根据获得的图像处理的脸和眼睛得到眼睛的疲劳特性,如闪烁的频率,眼睛是关闭的时间,眼睛打开和关闭的程度。(4)疲劳的判断眼睛的状态可以最直接的反映当前的驾驶疲劳状态。常用的眼睛状态包括闪烁频率,眼睛转动频率,eye-closing持续时间。其中,过低的眼球转动频率,过低的眼睛闪烁的频率,可以视为疲劳和长期的闭上眼睛。(5)早期预警也就是说,当系统决定了处于疲劳状态,蜂鸣器的声音,或系统播放一段音乐给早期预警。
3.1。DCNN
DCNN如图的基本框架1。它使用多层卷积和池来提取图像的高层语义特征。同时确保图像旋转不变性、平移不变性,它减少了维度的特征映射和保留的重要训练过程分为两个阶段:正向传播和反向传播(18]:(1)前方传播阶段。计算每一层的功能映射输入的过程 在这里,代表卷积操作,代表的输出r -th回旋的层,的输入向量r -th层,偏见的吗r -th层;我输入特征图;的重量吗r -卷积的内核r -th层;和代表了激活函数。(2)反向传播阶段。假设数据集米样品的前方传播阶段网络将为每个类输出预测结果,和权重可以通过比较预期的产出和调整网络的预测结果(19]。网络的最终目标函数定义为
在这里,损失函数,通过迭代训练,以减少网络的损失函数来减少分类错误;在公式(最后一层的输出1),在这里代表反向传播的输入;正则变换函数;和代表了网络中的重量。
3.2。神经网络的并行优化(NNPO)算法
NNPO算法主要包括三个阶段:模型压缩,收购当地的分类结果,并收购全球分类结果。(a)在模型中压缩阶段,功能使用地图的剪枝策略(PFM)提出了计算地图的功能。规范得到的平均值卷积的瓦特标准内核实现冗余参数的修剪,pretrain网络,并获得压缩模型。(b)在获得当地分类结果的阶段,首先结合MapReduce并行模型和使用分裂。函数将整个数据集划分为文件相同大小的块,将它们存储在每个节点上,然后使用Map函数训练网络在每个节点上并行并提出了共轭梯度法(CGMSE)修改割线更新参数,提高了网络收敛速度得到当地分类结果(20.,21]。获得全球舞台的分类结果,提出了一种负载平衡策略(LBRLA)控制负荷率提高并行系统的并行性能。Reduce函数用于获取的最终重量DCNN每个节点获得全球分类结果。
3.3。模型的压缩
DCNN通常包含很多层,每一层都包含了许多卷积内核。然而,每个卷积中的权重内核并不是有利于网络预测,所以网络包含很多冗余参数。通常的修剪方法计算冗余参数规范每个卷积的内核。在此基础上,认为卷积内核比规范是很重要的,和卷积核小于规范并不重要。然而,每个模板卷积内核实际上代表一个功能在一个特定的水平。对于一个浅卷积层,如图2,第一个卷积层VGG16只能提取简单的边缘(22]。颜色块,一个更深的卷积层,如图所示2;第八conv4-VGG16可以专注于提取图像特征的高度抽象。简单的考虑l,规范可能是错的。删除重要的卷积核,所以本文提出了一种特征地图应用剪枝策略(PFM) pretrain DCNN之前使用的所有数据进行训练。
烤瓷策略首先随机选择训练数据的一部分pretrain DCNN并使用平均水平规范的输出特性图卷积的内核对卷积核的重要性进行评估。对每个输入样本x在训练数据集规范的功能映射F输出卷积可以计算内核,紧随其后的是所有的训练样本。标准的平均值是分配给内核,内核和卷积是排序的平均值规范相应的输出特性图和卷积内核的平均值删除标准小于预设阈值压缩模型。这种修剪策略可以递归地重复压缩模型,提高计算速度。的计算公式规范是
在这里,代表了规范的功能映射对应的输出j -卷积时内核我- - - - - -th样本输入网络;和米代表的数量从训练数据集随机选择样本。
3.4。获得当地的分类
收购本地分类结果包括分裂和映射阶段。分裂阶段,Hadoop默认文件块的策略是用于把原始数据划分成大小相同的块;在映射阶段,Map函数用于计算每个网络权重参数的局部变化,更新权重,获得部分分类结果。自更新权重随机梯度下降法在映射阶段收敛非常缓慢地在大数据环境中,基于二次共轭梯度法的收敛性,提出了一种改进共轭梯度方法的割线(CGMSE)寻找最优参数,加快网络收敛(23,24]。
3.5。获得全球分类结果
每个节点是训练来获得当地的DCNN的重量,和MapReduce发送输出每个地图节点的键-值对函数来完成最终的合并任务来获得最终的网络重量,是重量,(一个,b)表明,体重bth的重量a -卷积核。考虑到影响负载平衡的并行算法的效率,提出了一种负载平衡策略(LBRLA)来控制负载率。它可以保持负载平衡的并行系统通过负载分配规则和负载阈值和提高系统资源的利用率。
3.6。NNPO算法步骤
NNPO算法的具体实现步骤如图所示3:(一)模型中压缩阶段,根据输入的原始数据集,通过调用烤瓷pretrain网络策略的执行模型压缩算法。(b)在获得当地分类结果的阶段,首先结合MapReduce框架,调用split函数把数据集,将其存储在每个节点上,然后调用Map函数训练网络的每个节点上并行,并调用算法进行参数更新获得部分分类结果。(c)获得全球阶段的分类结果,算法的LBRLA战略被称为控制并行系统的负载平衡,Reduce函数叫做找到网络的最终的重量,获得最终的分类结果25]。
4所示。算法实验结果和比较
4.1。实验数据
目前,因为疲劳检测和预警的研究工作主要是汽车驾驶,就保持在这一高度相对较少用于国家安全,但在功能上都有极高的通用性,适用对象和适用环境,所以疲劳的研究成果和现状检测和预警的司机在很大程度上代表疲劳的研究成果和现状检测和预警技术在国家安全领域的26]。在本文中使用的实验数据是三个真实的数据集,这是来自谷歌数据,即SV, E-digit和ISL。为了验证不同的算法的时间和空间复杂性,本文基于SV的三个数据集进行实验,E-digit, ISL和综合比较的基础上,运行时间和内存使用。SV数据集包含了从现实世界中,彩色数字图像的大小是32×32岁,在训练集有73231。有26022张图片和531312张照片测试集的额外培训。这次没有使用额外的数据。相反,6000年从训练集图像分割作为验证集,和像素值除以255,所以它们的大小是在[0,1);E-digits数据集都是32×32像素黑白图像。这个数据集提供了一个平衡的手写数字直接兼容原始数据集的数据集。训练集是240000。ISL数据集包含1000个类别,1281198训练图像,50000年验证图片,和100000个测试图像,每个拥有超过280000张图片在测试集。两个边界框和相应的类标签,整个数据集是150 GB,因为图像大小不均匀,因此,图像数据集的裁剪和缩放到224×224,和500个随机选择的实验。
4.2。评价指标
本文使用加速作为一个指标来评估算法的性能。一个算法的加速通过并行化是指获得的性能提升。它通常是用作测试并行算法性能的一个重要指标。加速越大,算法的并行化程度越好。它被定义为
在这里,代表了串行算法的执行时间代表了并行算法的执行时间。
4.3。算法性能的比较分析
为了验证NNPO算法的时间和空间复杂性,本文基于SV的三个数据集进行实验,E-digit和ISL。根据运行时间和内存使用,相比DCNN和NNPO变异没有网络压缩(以下P-DCNN)综合比较。数据4和5的执行时间和内存使用NNPO, MR-DCNN, P-DCNN。
SV数据集,NNPO的性能略优于MR-DCNN P-DCNN。MR-DCNN的执行时间和P-DCNN分别为33.15%和21.24%,分别。的内存用法MR-DCNN P-DCNN,分别是55.71%和56.16%;执行时间更少的减少是因为NNPO pretrains网络在分类之前,影响整个算法的执行速度,并减少了内存的使用更多的修剪后的网络。这是由于减少冗余参数的数量。在两个大的数据集E-digit和ISL NNPO算法的执行时间和内存使用比MR-DCNN和P-DCNN要低得多。NNPO是26.19%的运行时间的MR-DCNN P-DCNN,分别。在数据集E-digit ISL, MR-DCNN的内存使用和P-DCNN是28.01%,17.29%,31.19%,和17.92%,分别。这个结果的原因有三:(a)因为pretraining时间远小于算法的执行时间,它几乎没有影响的总体性能NNPO算法。(b)使用修改后的割线的共轭梯度法提高了网络收敛速度,从而减少了执行时间。 (c) After the redundant parameters are pruned through the PFM strategy, the number of parameters is greatly reduced, and the program execution time and memory usage are also greatly reduced. On the whole, compare the running time and memory usage trend of NNPO, MR-DCNN, and P-DCNN on the three data sets. On the one hand, as the amount of data increases, the running time of NNPO increases less, while the running time of MR-DCNN increases more. The running times of P-DCNN and P-DCNN increase exponentially; on the other hand, the memory footprint of NNPO changes very little, while the memory footprints of MR-DCNN and P-DCNN increase sharply as the data set increases. Therefore, it can be concluded that NNPO is better than MR-DCNN and P-DCNN and can effectively improve the training efficiency of DCNN in a big data environment.
本文算法后NNPO修剪冗余参数通过PFM策略、参数的数量大大减少,对参数的敏感性降低,项目执行时间和内存使用量也大大降低。
5。应用程序的算法运动疲劳的警告
系统的测试是在实验室进行模拟值班值班人员在真实条件下的环境。根据实际使用情况,我们限制人的视线上下30度来进行检测,在30度左右,和相机放置在约0.5米的距离要监视的人面前。相机设置的相关参数如下:640×480每秒24帧,以1分钟为一个测试单元,和收集到的图像帧1440帧。显示窗口的定位结果,用红线画出人眼定位结果的实时视频图像帧;显示窗口的实时监控和预警信息,用波形图来记录人类的眼睛打开和关闭随着时间的推移,半开半关闭状态值;在二值化窗口中显示的是图像二值化后的结果和其定位结果;在垂直投影窗口中显示的是人眼区域的垂直投影的结果曲线。对于一个测试时间,计算PERCLOS值通过帧的数量与人类闭上眼睛和帧的总数。如果超过80%,将发布警报。测试结果及其成功率分析数据所示6和7。
这种自动疲劳预警系统使用一个基于大数据的神经网络并行优化算法实现人眼定位。在确定人眼区域,执行垂直积分投影操作,并确定人眼状态通过计算其投影曲线的特征参数值;然后计算PERCLOS价值的人在一段时间达到测试的目的判断疲劳状态。PERCLOS值和疲劳之间的关系如图8。
该方法具有以下优点:(1)人眼定位是快速和准确,错误检测率低。人眼定位,该算法实现了人眼定位的指导下“人脸检测的主要思想,然后检测人眼。“这不仅继承了脸分类器的检测成功率高的特点,而且花费更少的时间相对。人眼定位的搜索范围缩小,和准确性也就相应地提高。同时,它大大降低了误警率人眼的分类器算法通过消除假警报。(2)人眼状态的判断是准确的,有精度高、简单的过程。与传统算法相比确定人眼的状态,如水平投影算法,该算法用于该系统精度有很大提高。主要的区别在于,它解决了定位的精度问题时眼睑眼状态通过计算判断距离的眼睑在传统算法。传统的人眼状态判断算法经常产生错误的判断结果由于眼睑定位的准确性,有时甚至无法使用的情况,但是,在这个系统的测试过程,这种情况并没有出现。实际情况基本上是相同的。与此同时,它也显示这个系统在某些方面的一些缺陷,在未来需要改进。(3)一些外部障碍的干扰目标探测的可能性不能排除。当要监视的人戴着帽子,眼镜,刘海,面具,等等,这模糊的面部特征,系统的眼睛定位成功率将会大大减少。这是因为当面部特征受阻,系统不能获得全面和有效的信息。人眼定位算法的第一步将大大降低人脸检测的成功率。如果人脸检测是不成功的,下面的人眼定位将自然不可能。(4)有一些环境光源的要求。这个系统有一定的环境要求光源,光源和环境必须在一定的范围内直接在镜头面前。如果环境光源超过这个范围,超过补偿能力的光照补偿图像预处理,它将导致一个完全的形成黑色的脸在二值化后,使人眼无法定位。
累的工作是恶性事故的重要原因之一,如交通事故。由于工作人员的疲劳很长一段时间,如注意力不集中,频繁的眨眼,闭上眼睛,太长时间,员工的反应是缓慢的,和事故很容易引起。如果一个实时检测系统可以提供给一个警报当人们第一次疲劳,可以减少交通事故和安全可以有效地改善。
6。结论
功能使用地图的修剪策略(PFM)本文设计可以有效的减少冗余参数和降低时间和空间复杂度的DCNN培训;地图,在随后的阶段,实现共轭梯度方法的快速收敛性,提高了网络的收敛速度。为了弥补传统DCNN大数据环境的缺点,本文提出了一个新的DCNN NNPO分类算法。首先,pretraining随机选择部分数据,设计一个功能使用地图的剪枝策略(PFM),这样可以减少大量冗余参数DCNN通过比较平均的价值l我规范的卷积核,从而减少算法的时间和空间复杂性;第二,使用MapReduce DCNN进行平行的培训,并且提出一个修改割线共轭梯度法(CGMSE)在地图参数更新过程的阶段,这是适用于一般情况,提高了优化的搜索方向。提高优化效率;最后,负载均衡策略(LBRLA)来控制负载率在降低阶段,提出了解决问题的并行系统中的每个节点不平衡负荷,提高了并行算法的性能。与CNN-MR五项算法比较,实验结果表明,NNPO算法的加速比明显高于其他算法在大数据环境。最后,该算法应用于疲劳检测的早期预警系统。方面的疲劳检测,系统使用相机的形象面对值班的人。然后,根据人眼定位的结果,人类的眼睛区域的垂直积分投影操作执行计算投影曲线。特征参数值用于确定人眼的状态。最后,根据PERCLOS值要监视的人一段时间,它是判断是否处于疲劳状态,如果他们是疲劳,给出预警信息。
疲劳特征提取和疲劳的决心是本文的核心内容,但实时疲劳预警是一个非常复杂和具有挑战性的领域。疲劳预警系统研究了实现在理想的实验室环境中,但仍有许多限制在实际使用。例如,在复杂的背景如疲劳预警高速机车,面对快速变化和背景,用户是否戴眼镜或疲劳警告晚上,等等都是测试系统的实时处理能力。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作是由阜阳师范大学。