文摘
尽管交通事故的统计数据显示缓慢下降在许多国家在过去的几年里,醉酒或drug-influenced开车仍然造成足够的这些记录的股票采取行动。如今,呼吸分析器用于估计呼吸酒精含量由酒精(BAC)执法作为一个初步的筛选在许多国家。因此,因为呼吸分析器或现场酒精测试人员不能准确衡量BAC,分析血液样本的个体需要进一步的行动。许多研究者提出了各种方法来检测酒后驾车,例如,使用传感器,人脸识别,司机的行为混淆使用呼吸分析器由来已久的方法的缺点。但每一个都有一定的局限性。本研究提出了一个计划来区分司机的状态,也就是说,是清醒还是糊涂,通过使用转移学习卷积神经网络(CNN)特性的随机森林(RF)特性的准确性高达93%,高于现有的模型。使用相同的数据集,来验证我们的研究,比较分析了与其他现有的模型分类器等简单向量机(SVM)的准确性达65%,再邻居(资讯)的准确性达62%,这是表明我们的方法是一种优化的方法在准确性方面,精度,记得,F1-score、AUC-ROC曲线和马修与混淆矩阵的相关系数(MCC)。
1。介绍
按道路运输和公路、印度、交通碰撞导致的伤亡大约四个十万的个人和留给将近五万人每年全国非致命的伤害(1]。在简单的词语,如果观众去看比赛在体育场的能力一个十万的,其中,接近体育场时发生交通事故,有一个机会,至少一人死亡,30人持有非致命的伤害。这种事故的受害者和致命和nondeadly伤口包括弱街客户,如行人、骑自行车的人,骑摩托车的人,和其他旅客。除了公民的存在失去了不幸,他们也对他们的家庭造成沉重的货币重量,如治疗和临终祈祷成本。同样,汽车事故动摇公众经济体,花费国家每年几乎百分之二的国内生产的增长。司机麻醉品影响交通事故的重要危险因素。酒后驾车显著增加道路交通伤害风险随着司机的血液酒精浓度的增加。酒后驾车会增加道路交通伤害的风险在不同程度上取决于精神药物滥用。业内有许多解决方案,以防止交通事故。然而,他们要么是昂贵的,就像自动驾驶汽车,或nonscalable,难以实现,如执法人员使用呼吸分析仪检查驾驶员呼出空气中酒精(2]。
然而,世界是一个旁观者,严重的交通事故和人员伤亡。让我们开车到一个相当大的努力由研究人员控制由于酒后驾车交通事故发生在过去二十年里,受现代科技的年龄范畴的方式。
问题陈述是找到一种有效的系统检测出准确的结果,以防止酒后驾车交通事故或伤害在所有约束。因为车祸严重影响公共经济,花费国家接近其年度国内生产总值(GDP)的2%。受酒精影响的状态下开车增加车祸的一个严重的风险因素。
酒后驾车检测使用伽柏过滤器和虹膜识别:酒精检测系统主要集中在“新居”的三个关键目标使用虹膜识别和伽柏过滤器。第一步是获得虹膜图像。后,图像必须编码的响应格式计算和计算。最后,从开源信号识别系统将控制汽车/车辆通过微控制器和继电器电路连接到汽车/车辆点火系统。
神经网络对酒后驾车检测:研究人员使用脸照片,如脸颊、下巴,脖子,耳朵,手,收集的相机和分析他们通过使用3 - layer神经网络判断司机是否醉酒。然而,只有少数人的脸颜色不影响他们在喝酒。
基于语音的酒后驾车检测:低级的提取和听觉特征n方法直接使用最大边缘分类器分类或回归两种状态在一个典型的议长状态检测方法。韵律轮廓可能使用不同的,一个醉酒的人比一个清醒的演讲者。
酒后驾车检测通过使用非侵入式生物传感器系统:air-pack传感器监测AP-PW安置在一个座位。AP-PW用于数字脉冲测量体积和酒精呼吸浓度同时,利用手指夹photoplethysmography。
酒后驾车的检测模式:酒后驾车检测基于驾驶模式利用手机作为一个平台,因为他们结合检测和通信功能。
基于引擎锁系统的酒后驾车检测:酒精传感器(MQ-3)检测到车辆的速度零当司机启动车辆。如果司机发现醉酒,点火系统将立即关闭,以及一个警察局报警和通信。
基于传感器检测酒后驾车酒精:水束滴蒸汽紧张的47毫米汞柱和大约98.6华氏度的温度可以分为积极的和消极的征收吹水束组成的平行板电极对电极之间的电压,和一个检测电极连接到一个由人类picoampmeter呼出气体。这有助于确定呼出气体是真正从一个人的呼吸。
各种策略和算法分类陶醉和清醒的人记录日期。尽管汽车碰撞由于酒后驾车负责大量的致命的和非致命的伤害,同样的的主要原因是所使用的算法的表现不佳,笨拙的集成过程,训练数据集的不足,减少响应系统。这项工作倡导一个简单、易于实现、可伸缩、经济解决方案配备现代技术和未来的模型。
研究分为不同的部分:首先是引言部分的一部分1,地址现在酒后驾车的问题存在,和最新的前沿研究领域的部分中概述的酒后驾车检测系统2。节3,提出材料和方法描述部分4描述了性能分析的结果与讨论拟议的技术。最后,给出了结论和未来的范围的部分5和6,分别。
2。相关工作
Harkous et al。3)解决给定问题使用二段式机器学习系统。在第一阶段,汽车模拟器提供了时间序列的传感器数据。传感器数据然后选择基于优先级,之后隐藏的马尔可夫模型(HMM)应用于传感器数据,这些传感器收集数据从方向盘,油门,车辆的重心、侧向加速度、速度、纵向加速度、速度、垂直加速度、速度、速度,角速度,滚转率。隐马尔可夫模型预测精度为79%,这是最高的纵向加速度。在第二阶段,研究人员优先列表的传感器高于给定阈值,和递归神经网络(RNN)机器学习算法应用于传感器数据的子组。RNN显示95%的预测精度与给定组传感器数据,将数据划分为醉酒或清醒的行为。研究人员还分享实验结果RNN-HMM RNN孤单,同时指出应用机器学习算法会导致更好的结果。
Chang et al。4)提出了一个模式,取代的breath-type比例解决昂贵的设备和卫生问题。两阶段机器学习系统区分酒后清醒开车。第一阶段是确定司机的年龄范围使用简化VGG网络。数据隔离年龄18 - 30,31-50,≥51年训练模型,获得的预测精度为89.62%。第二阶段是确定影响司机的面部特征使用简化DenseNet。这个阶段,收集的数据被分为四类:危险,喝酒在酒吧内,超过了酒吧,和酗酒,在这里获得的预测精度为87.44%。这个实验也表明,年龄因素显著影响的预测。
李等人。5)建议酒后驾车检测技术基于随机森林算法使用特征选择。驾驶模拟器可以帮助收集司机的行为数据,然后选择特性的功能意义提到的算法。接下来,哑变量模拟真实的环境,如几何外来道路的标志。最后,不同的分类器选择特性应用于获得一个整体的性能比较。线性判别分析、支持向量机、演算法,随机森林分类器使用。性能参数预测精度,F1-score、接受者操作特征曲线和曲线下的面积值。实验结果表明,油门深度、速度、距离中心的车道,加速度,引擎革命,刹车深度,和转向角是用来分类司机的状态。演算法和RF分类器的精度81.48%。
梅塔等。6)创建了一个新的数据集命名为“数据集被陶醉的面孔”,其中包含视听收集的数据通过semisupervised努力。数据收集的持续时间是10秒。深入学习算法如卷积神经网络(CNN),复发性神经网络(RNN), 3 d CNN,以听力LSTM,和深层神经网络(款)应用于他们的实验。Behaviour-based检测如行话、步态或面部面容和biosignal-based检测等面部热图像显示有前景的结果在检测陶醉面临的准确性达88.39%。未来的范围是眼睛的目光和头部姿势信息添加到网络探索音频和视觉融合策略二进制分类。此外,有余地将学习从一个网络建立一个以听力网络。
Bhuyan et al。7)提出了一个方法来分类喝醉了,清醒的人用他们的热图像和步行模式。曲波变换用于抓脸的边缘识别放纵的人,和冲浪(加速强劲功能)检测温度变化虹膜和巩膜(更巨大的醉酒的人)。光流是用来限定陶醉或平均人的运动课程。这项工作使用射频和SVM算法进行分类。
Joshi et al。8]提出了一种方法使用一个嵌入式系统分类喝醉了,清醒的人通过扫描他们的脸使用反向传播算法和反应结果显示处理。本工作采用神经网络算法分类,执行和停止或减缓汽车嵌入式系统中通过使用其他工具。该系统进一步扩展到自动驾驶模式,可以很容易地集成和自行车。
高桥et al。9)试验检测酒精的存在在人类使用的面部和身体的其他细节被一个高清摄像头。他们注册一个三层神经网络见证酒精在人类和划分成三个阶段:冷静、温和,和巨额喝酒。他们获得77.3%的准确性通过组合的脸颊,脖子,手;他们还创建了一个决策树来区分他们。然而,一些个人的身体颜色不改变后消费酒。如前所述,未来的范围是提高检测准确性的醉酒人通过喂养眼睛神经网络。
李等人。10)设计了一种陶醉的分类方法,人们使用信息来自智能手机的加速度计和陀螺仪。个人中毒程度的可靠指标是酒鬼的行走。本研究使用双向长期短期记忆(biLSTM)卷积神经网络(CNN),随机森林,多层感知器和梯度提升架构对传感器数据进行回归分析。随后的实验表明,相比其他架构,biLSTM和CNN均方根误差值最低的0.0167和0.0168,分别。此外,研究人员想在该作品上进行创作,包括动态分割加强biLSTM网络的算法和雇佣一个减少偏见和噪音,避免过度拟合的未来的工作。
Bekkanti et al。11)编造了一个基于计算机的探测器区分醉酒和清醒的个人使用人类的情感。对收集的数据进行回归计算,从人类的观点,本研究使用了一个多层perceptron-based反向传播神经网络(MLP-BBN)卷积神经网络(CNN),一个自适应神经模糊推理系统(简称ANFIS),一个简单的向量机,和概率神经网络。随后的实验表明MLP-BBN精度最高,敏感性,特异性为92.01%,93.90%,和93.98%,分别,其次是CNN,简称ANFIS分别增加了91.9%和91%。
Soltuz et al。12]使用深卷积神经网络(DCNNs)来评估热脸照片为subject-dependent中毒检测提供了一种新方法。分析了3特定的DCNN架构与十五,7岁和二十层(GoogLeNet)。架构通过转移培训学习,使用一个相当大的数据集,包括热红外拍摄的41名参与者的面孔。每个主题有一百数据集热拍。中包含的数据集同样主题的清醒和陶醉。样品是之前和之后的一个小时的酒精消费。DCNNs面部热图像时产生的结果在93.17%和98.54%之间。
Iamudomchai et al。13)旨在开发一种创新的酒精检测系统使用深度学习和红外(IR)相机。初始组件是一个红外摄像机(FLIR)可以捕获红外和标准拍摄的个人的脸。以下组件处理快照酒精检测基于深度学习技术与iPhone智能手机操作系统。分类精度为85.10%(135人口)和四个水平的清醒和二进制分类精度为74.07%。
伯恩斯坦et al。14)使用心率使用传感器收集的数据来自多个参与者喝酒,我们从一维波形变成一组谱图。CaffeNet和AlexNet pretrained cnn,美联储谱图识别给定的谱图是否饮酒的实例。使用80训练图像(40阳性和40阴性)和20个测试图像(10阳性和阴性),我们实现了测试精度为72% (n= 20,调整学习速率5试验)后,迭代的数量,梯度下降算法,以及时间窗口,谱图的着色。
威洛比et al。15)检查的样本53人的脸就喝三杯酒之后,从图像中提取特征,用毫升确定参与者清醒或陶醉。据研究人员介绍,面部消费酒之后行发生了实质性的变化,和面部地标向量显示最健壮的预测功能。使用gradient-boosted机器分类科目清醒或陶醉,回归模型的分类精度达到81%。捕捉更现实的党/酒吧场景,辅以模糊的原始数据集,旋转,调整照明,提高分类精度。
Sajid et al。16)旨在设计一个模型检测驾驶员分心的使用公开数据集,数据集是分布在八类:使用手机,智能手机,聊天驾驶,操作收音机、疲劳、闲谈和乘客,窥视,饮酒。拟议的方法模型,使用一个开门EfficientNet。这个实验实现了五个变种EfficientNet, EfficientDet-D3是最可接受的模型检测驾驶员分心的平均平均精度(地图)的99.16%。
3所示。材料和方法
本节描述的一些理论基础进行实验涉及的方法。
3.1。卷积神经网络(cnn /回旋网)
CNN架构由一个输入层、隐藏层和输出层。激活函数卷积和最终面具隐藏层的输入和输出。CNN包括一层执行卷积核的点积层的输入矩阵,俗称ReLU和激活函数。最初的卷积操作生成一个功能的输入图像地图,导致下一层的输入。CNN的隐藏层还包含池、密度和归一化层(17]。图1给出详细的CNN的架构来解释隆起和二次抽样生成输出。CNN的架构的两个主要部分:特征提取是一个卷积过程所使用的工具来分离和识别图片的明显特征进行分析。有许多对卷积或汇聚层网络特征提取。一个完全连接层,利用卷积过程的输出,并确定图像的类使用以前的特征提取。CNN特征提取模型试图最小化功能在一个数据集的数量。它生成新特性,现有功能编译到一个原始的特性。
3.2。卷积的层
输入图像卷积层全神贯注于一个功能图,也称为激活地图。卷积层缠绕的输入,并将其结果传递给下一层。每个神经元卷积过程数据只接受域。完全连接为更重要的输入前馈神经网络是不切实际的。俱乐部需要一个非常高的神经元的数量,即使是在一个浅的架构。卷积减少自由参数的数量,使网络更深刻。最终,CNN是完美的为数据的网状拓扑图像卷积或池考虑空间特性之间的关系17]。
3.3。汇聚层
池层抽样特征图谱的区段,它合并神经元塔夫茨到单个神经元的结果。有两种类型的汇聚层的神经元簇特性图所示(17]。(1)马克斯池使用最大的值每簇神经元以同样的方式,如图2。(2)池使用中值平均每簇神经元。
平均池中使用我们的模型通过使用一个温和的价值每簇神经元。
3.4。完全连接层或致密层
图3表明完全连接层应用于一个扁平的输入,所有的摄入量与从下一层神经元相连。通常,架构包含完全连接层,它们用于优化目标如类分数(18]。
3.5。辍学
辍学层缺乏系统性暴跌单位及其关联神经网络在训练,从co-adapting过于沮丧的单位。这也被称为过度拟合,如图4(19]。
3.6。早期停止
早期停止是正则化模型的技术培训和用来避开过度拟合迭代方法,如梯度下降法。其规则直接多少时代应该执行模型开始overfit之前,如图5(20.]。
3.7。随机森林分类器(RF)
图6显示了随机森林分类器,它属于域的监督机器学习算法主要用于分类和恶化问题[21]。RF分类器构造不同决策树从一个潦草的训练数据的子集,它编译的投票决策树解决最后的预后(22]。
3.8。性能指标
现在,让我们研究性能指标的基本术语。
3.8.1。混淆矩阵
设想一个分类算法的性能在一个矩阵安排有效的标签与模型的预示着,在标本行预测类和列标本是一个实际的类。混淆矩阵提供了基础的指标,其他指标可以评估结果(23,24]。这个指标如下:(1)真阳性(TP)是正确预示着积极类的统计数据集。(2)假阳性(FP)错误地预示着积极类的统计数据集,也称为第一类误差。(3)假阴性(FN)错误地预示着负类的统计数据集,也称为二型错误。(4)真阴性(TN)是正确预示着负类的统计数据集。
考虑,α真阳性,那么(1)β:真阴性,(2)γ:假阳性,(3)δ:假阴性。
3.8.2。精度
的分数准确预测数的输入数据集(25]。
3.8.3。精度
它是精确分类的一小部分积极类预测积极类的计数(25]。
3.8.4。回忆
它是精确分类的一小部分积极类计数的实际积极类(25]。
3.8.5。的F1-Score
的F1-score州平衡精度和召回,从0到1。这个指标通常告诉我们关于分类器精度和鲁棒性25]。
3.8.6。马修的相关系数(MCC)
这是一个观察到的和预期的二进制类之间的相关系数;它返回一个从消极到积极的价值。积极的传达了一个完美的预测系数,零比任意的预言,- 1意味着一个虚假的投影。
4所示。结果与讨论
本节描述机器学习分类器的性能指标,收集在实验。性能指标的准确性、精密,回忆,F1、AUC和MCC。随机森林,简单的向量机,再邻居在功能应用使用CNN从图像中提取过程。这里,射频具有超越所有其他分类器性能指标。射频的AUC是0.95,MCC为0.8783,导致精度最高的0.9375,如表所示1。
4.1。数据集
数据集(26)包含人体的面部照片之前和之后他们饮酒,来自53个参与者。每张图片描述了一个人在四个州:冷静、低喝,轻度醉酒,和沉重的醉27]。最后,我们有212(53×4)集图像低计数的使用机器学习算法训练模型。从那里,我们求助于形象增加实验,基于我们Keras api用于增加多倍的给定数据集。给出了一个示例数据集的预览图7。
这种技术的图像增强允许2120年一代的样品池,这是进一步分成80%的训练,20%用于测试。实验提供一千时代一直局限于12世纪,防止过度拟合模型。
执行的实验是在谷歌collab图形处理单元(GPU),使更快的python代码的处理。的数据驻留在谷歌驱动安装开发环境。应用图像增强而获取图像文件的目录。之后,增广数据分成百分之八十的训练,百分之二十的测试。我们准备CNN模型按给定的图8框图,除了随机森林分类器。CNN模型符合亚当优化器和二进制叉损失。提取特征从CNN模型发送随机森林等各种分类器的输入,再邻居,和支持向量机。结果部分包含在表计算问题1。
4.2。观察使用CNN单独训练模型
学习曲线的阴谋和机器学习模型的精度损失的表现了一个时代。在这里,我们可以画出损失和卷积神经网络模型的精度曲线的帮助下sklearn度量库。
在图9,黄线显示了曲线的训练失去整个时代,同样的,红线显示验证损失超过时代。这里,培训损失和验证点的稳定性下降,损失和验证损失有小缺陷区域培训损失相比,推导出CNN模型是一个不错的选择。以来的持续培训一个不错的选择可能会导致overfit,早期停止回电话帮助抑制相同的。
(一)
(b)
在图10,黄线显示了曲线的训练精度在整个时代,同样的,在时代红线显示验证精度。训练精度显示力量几过后,仍然保持在100%在剩下的时代过去了。然而,验证精度从60%以上但幻灯片在随后将不到40%。十过后,验证准确性向上移动到60%,保持不变,直到结束的循环。
(一)
(b)
图11显示的混乱度规卷积神经网络模型。在这里,我们看到,真阴性是2,假阳性是32,假阴性是3,真阳性31。使用这些值,其他性能指标计算的结果部分。
曲线下的面积(AUC)或接受者操作特征曲线(ROC)情节设想一个分类模型的性能基于准确和不准确的分类。ROC曲线情节的真阳性和假阳性率在不同分类路边。曲线下的面积(AUC)提供了一个模型的能力分类器来区分实际或预计类和ROC曲线的摘要(28]。据估计,AUC分数在0和1之间。AUC得分值接近于零代表了分类器模型的不令人满意的版本和分数值附近一个代表的优秀版本分类器模型。
图12显示了AUC-ROC卷积神经网络模型的性能曲线。在这里,我们可以看到AUC-ROC曲线与平均曲线向下移动;因此,我们得出这样的结论:提到模型性能低于平均水平。AUC分数是0.5441。
在随后的观察,从CNN模型特征提取是传递给其他分类器(29日]。
4.3。观察训练模型的使用与射频CNN
图13显示的混乱度规卷积神经网络与随机森林模型。在这里,我们看到,真阴性是12,假阳性是0,真阳性和假阴性是2,是18岁。使用这些值,其他性能指标计算的结果部分。
图14显示了AUC-ROC曲线卷积神经网络的随机森林模型的性能。在这里,我们可以看到AUC-ROC曲线呆在左上角的情节;因此,我们得出这样的结论:提到的模型具有更好的性能。AUC得分为0.95,接近1。
4.4。观察训练模型的使用CNN和资讯
图15显示的混乱度规与再邻国卷积神经网络模型。在这里,我们看到,真阴性是3,假阳性是9,假阴性是3,真阳性是17。使用这些值,其他性能指标计算的结果部分。
图16显示了AUC-ROC曲线与再邻国卷积神经网络模型的性能。在这里,我们可以看到AUC-ROC曲线与平均曲线向上移动;因此,我们得出这样的结论:提到模型具有高于平均水平的性能。AUC分数是0.55。
4.5。观察模型使用CNN和SVM的训练
图17显示的混乱度规卷积神经网络简单的向量分类器模型。在这里,真阴性是9,假阳性是3,假阴性是8,真阳性是12。使用这些值,其他性能指标计算的结果部分。
图18显示了AUC-ROC曲线的卷积神经网络简单的向量分类器模型的性能。在这里,我们可以看到AUC-ROC曲线与平均曲线向上移动;因此,我们得出这样的结论:上述模型比平均表现。AUC分数是0.675。
4.6。验证
由于验证是至关重要的一步估计算法的正确性,我们验证相同的数据在两个机器学习模型:CNN和CNN +射频。图像输入到CNN模型错误预测的图像一个醉酒的人,当相同的图像输入到CNN +射频模式,它预测图像准确地作为一个冷静的人,如图19。
5。结论
这项工作已经记录了各种技术和算法分类喝醉了,清醒的人不管车辆碰撞,占许多致命的和非致命的伤害。算法性能较低,笨拙的集成技术,可怜的训练数据集,碰撞和减少响应系统是根本原因。在这里,我们提出一个机器学习算法具有高精度、精确,回忆,F1-score,可以很容易地集成移动生态系统的最低硬件结构的复杂性。最重要的是,它侧重于一种非侵入性和可移植的方法。拟议的技术应该减少碰撞结果的数量,降低交通警察的负担,医院,和其他安全人员。这种技术仅限于特定的年龄段的人(18岁以上)。尚未发现是否适用于年龄低于18岁的人。)30.,31日]。
6。未来的范围
未来的范围从类别司机基于多种因素如年龄、性别、地理、经验,致力于传感器,如加速或刹车可能影响系统决策。最重要的是,应该使用适当的机器学习模型训练和验证数据集。之后,这些机器学习模型可以结合其他非侵入式传感器读数达到更好的结果和可靠性。我们的算法是用高性能的速度足够快承认陶醉的脸。
数据可用性
使用的数据来支持本研究的结果包括在本文中。
的利益冲突
作者宣称没有利益冲突。