面部表情识别计算机技术可以获得通过的表达人的情感信息来判断状态和意图的人的人。文章提出了一种混合模型,结合了卷积神经网络(CNN)和密集的筛选功能。该模型用于面部表情识别。首先,本文构建了一个CNN模型和学习的地方特色的眼睛,眉毛,嘴巴。然后,本文特征被发送到支持向量机(SVM) multiclassifier获得后验概率的各种特性。最后,模型的输出结果是决定和融合得到最终的识别结果。实验结果表明,改进的卷积神经网络结构ER2013和CK +数据集的面部表情识别率提高了0.06%和2.25%,分别。gydF4y2Ba
面部表情识别计算机技术可以获得通过的表达人的情感信息来判断状态和意图的人的人。具有重要意义在人机交互、安全驾驶、智能广告系统。CK +数据集是一个典型的面部表情库,其中包含表达图像的愤怒,厌恶,恐惧,快乐,悲伤,惊讶的是,和轻视。表达式是视频序列(gydF4y2Ba
受到距离等因素的影响,图像会有模糊的面孔和更少的脸像素的问题。low-pixel人脸图像的表情识别是识别面部图像质量较低和不显眼的面部特征(gydF4y2Ba
一般表达式识别方法包括图像后处理,面部特征提取、识别和表达。图像表情识别的后处理阶段执行人脸检测获取面部区域图像(gydF4y2Ba
该方法的图像后处理包括人脸检测和裁剪,灰色处理,将采样数据增强和图像增强。人脸检测的目的是精确校准的位置和大小的脸的图像。我们使用人脸检测的D-lib模型。D-lib模型可以自动估计图像的面部特征点的坐标和过程OpenCV库中的数据。我们使用这种作物图像,图像的特征集中在脸上。灰度处理的过程中,将彩色图像转换为灰度图像。将采样的图像大小是标准化输入CNN模型。我们使用双线性插值,以确保面临重新取样的位置图像与原始图像相同。我们使用图像识别的CNN。训练数据的数量直接影响最终的识别效果。 The larger the amount of data, the better the effect [
面部表情加工的过程。gydF4y2Ba
随着计算机处理能力的发展,CNN在图像识别取得了惊人的成果。CNN-based图像识别方法的效率也在不断提高,已逐渐取代了传统的面部表情图像识别方法。在2012 ImageNet面向对象识别的挑战(ILSVRC),一些学者利用CNN模型Alex净赢得冠军。在2014年ILSVRC竞争,CNN模型谷歌网络架构分类中赢得第一名。一些学者提出CNN-VGG网。分类组的第二名和第一名项目组定位。VGG-Net深化网络层的数量,同时避免太多的参数,所有层使用gydF4y2Ba
输入的图像大小CNN模型gydF4y2Ba
CNN模型。gydF4y2Ba
我们输入的大小特征地图,内核的卷积和的大小池操作,步长,输出特性图的大小在卷积运算和池操作。它的数学关系gydF4y2Ba
在哪里gydF4y2Ba
卷积网络参数。gydF4y2Ba
| 层gydF4y2Ba | 类型gydF4y2Ba | 内核大小(gydF4y2Ba |
步gydF4y2Ba | 输出数量gydF4y2Ba | 输出的大小(gydF4y2Ba |
|---|---|---|---|---|---|
| Layer1gydF4y2Ba | 卷积gydF4y2Ba |
|
1gydF4y2Ba | 64年gydF4y2Ba |
|
| Layer2gydF4y2Ba | 卷积gydF4y2Ba |
|
1gydF4y2Ba | 128年gydF4y2Ba |
|
| Layer3gydF4y2Ba | 马克斯池gydF4y2Ba |
|
2gydF4y2Ba | 128年gydF4y2Ba |
|
| Layer4gydF4y2Ba | 卷积gydF4y2Ba |
|
1gydF4y2Ba | 128年gydF4y2Ba |
|
| Layer5gydF4y2Ba | 卷积gydF4y2Ba |
|
1gydF4y2Ba | 128年gydF4y2Ba |
|
| Layer6gydF4y2Ba | 卷积gydF4y2Ba |
|
1gydF4y2Ba | 256年gydF4y2Ba |
|
| Layer7gydF4y2Ba | 马克斯池gydF4y2Ba |
|
2gydF4y2Ba | 256年gydF4y2Ba |
|
| Layer8gydF4y2Ba | 卷积gydF4y2Ba |
|
1gydF4y2Ba | 256年gydF4y2Ba |
|
| Layer9gydF4y2Ba | 卷积gydF4y2Ba |
|
1gydF4y2Ba | 256年gydF4y2Ba |
|
| Layer10gydF4y2Ba | 平均分担gydF4y2Ba |
|
3gydF4y2Ba | 256年gydF4y2Ba |
|
| Layer11gydF4y2Ba | 卷积gydF4y2Ba |
|
1gydF4y2Ba | 512年gydF4y2Ba |
|
| Layer12gydF4y2Ba | 完全连接gydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba |
|
| 输出gydF4y2Ba | SoftMaxgydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba | - - - - - -gydF4y2Ba |
|
我们池矩阵gydF4y2Ba
在哪里gydF4y2Ba
平均池被定义为gydF4y2Ba
我们使用重叠块的大小gydF4y2Ba
每个输出gydF4y2Ba
的公式,gydF4y2Ba
实验使用CK +数据集,这些数据集是用来评估面部表情识别系统(带),也是一个相对常见的面部表情识别的数据集。从123年主题内容包含593个视频序列。时间范围从10到60帧(gydF4y2Ba
本文将数据添加到训练集,我们将测试数据获得和ungained测试集相同的训练模式。由于研究发现,识别精度的差异很小,没有数据获取处理在测试集上。最终的图像训练集的大小是71370,和测试集的图像大小是137。我们执行在所有图像直方图均衡化和局部二进制模式获得三个相同大小的数据集,包括原始图像(gydF4y2Ba
面部表情数据库。gydF4y2Ba
| 类别gydF4y2Ba | 培训数据库gydF4y2Ba | 测试数据库gydF4y2Ba |
|---|---|---|
| 愤怒的gydF4y2Ba | 14040年gydF4y2Ba | 27gydF4y2Ba |
| 厌恶gydF4y2Ba | 12220年gydF4y2Ba | 24gydF4y2Ba |
| 可怕的gydF4y2Ba | 7800年gydF4y2Ba | 15gydF4y2Ba |
| 快乐gydF4y2Ba | 14300年gydF4y2Ba | 28gydF4y2Ba |
| 悲伤的gydF4y2Ba | 8970年gydF4y2Ba | 15gydF4y2Ba |
| 惊讶gydF4y2Ba | 8580年gydF4y2Ba | 16gydF4y2Ba |
| 嘲笑gydF4y2Ba | 5460年gydF4y2Ba | 12gydF4y2Ba |
| 中性gydF4y2Ba | 8970年gydF4y2Ba | 15gydF4y2Ba |
示例8表情符号的图像。gydF4y2Ba
面部表情识别的主要评估标准方法识别的准确性和识别速度。正确识别准确率的比例是公认的表达式在测试集样本在所有测试集样本的数量。识别速度后,需要认识到每一个测试集样本建立了识别模型。的时间所花费的时间的比率确定测试组测试集样本的数量。gydF4y2Ba
在哪里gydF4y2Ba
因为输入CNN图像像素很低,输出识别效果略有波动,所以我们引入了决策融合和最终的图像识别。在测试阶段,我们使用五个训练网络模型来判断测试集数据,分别。然后,我们使用将SoftMax平均投票(干腊肠)方法融合判决这5个模型的结果。最后,我们得到最终结果,提高识别效果。测试步骤如图gydF4y2Ba
原理图SoftMax平均投票。gydF4y2Ba
它可以看到从一节gydF4y2Ba
我们选择性地添加L2正规化和辍学缓解过度拟合。采用学习速率衰减策略。我们选择一个更大的值开始学习速率。后gydF4y2Ba
根据测试的准确性,我们首先确定我们是否需要添加的L2正规化和辍学一层一层,然后确定哪些地方。我们确定学习速率的近似范围根据损失在训练,训练,和测试精度。两个二分法获得学习速率。gydF4y2Ba
找到最优的面部表情识别系统,我们输入的原始图像数据集,本地二进制模式特征映射的数据集,CNN的直方图均衡数据集模型。平均识别精度和速度得到结果如表所示gydF4y2Ba
比较识别精度和时间。gydF4y2Ba
| 模型gydF4y2Ba | 原始数据库gydF4y2Ba | 本地二进制模式数据库gydF4y2Ba | 直方图均衡化的数据库gydF4y2Ba |
|---|---|---|---|
| 精度(%)gydF4y2Ba | 89.5gydF4y2Ba | 86.9gydF4y2Ba | 90.5gydF4y2Ba |
| 时间(年代)gydF4y2Ba | 1.54gydF4y2Ba | 1.27gydF4y2Ba | 1.56gydF4y2Ba |
它可以发现,直方图均衡化后的输入数据集的准确性比原始图像的数据集。数据输入的准确性作为局部二进制模式特性映射是最差的。有三个之间的速度差异不明显。数据的识别速度设置输入本地二进制模式特征映射稍快,但是0.29秒的速度有一个小的优点相比,3.6%的准确性。分析不同的数据集在图gydF4y2Ba
改进的CNN模型的识别精度。gydF4y2Ba
| 分类精度gydF4y2Ba | 第一个实验gydF4y2Ba | 第二个实验gydF4y2Ba | 第三个实验gydF4y2Ba | 总gydF4y2Ba |
|---|---|---|---|---|
| 愤怒的gydF4y2Ba | 96.3gydF4y2Ba | 88.9gydF4y2Ba | 96.3gydF4y2Ba | 93.8gydF4y2Ba |
| 厌恶gydF4y2Ba | 91.7gydF4y2Ba | 91.7gydF4y2Ba | 95.8gydF4y2Ba | 93.1gydF4y2Ba |
| 可怕的gydF4y2Ba | 60gydF4y2Ba | 86.7gydF4y2Ba | 60gydF4y2Ba | 68.9gydF4y2Ba |
| 快乐gydF4y2Ba | One hundred.gydF4y2Ba | One hundred.gydF4y2Ba | One hundred.gydF4y2Ba | One hundred.gydF4y2Ba |
| 悲伤的gydF4y2Ba | 86.7gydF4y2Ba | 80年gydF4y2Ba | 86.7gydF4y2Ba | 84.5gydF4y2Ba |
| 惊讶gydF4y2Ba | One hundred.gydF4y2Ba | One hundred.gydF4y2Ba | 93.8gydF4y2Ba | 97.9gydF4y2Ba |
| 嘲笑gydF4y2Ba | 83.3gydF4y2Ba | 83.3gydF4y2Ba | 75年gydF4y2Ba | 80.5gydF4y2Ba |
| 中性gydF4y2Ba | 93.3gydF4y2Ba | 93.3gydF4y2Ba | 93.3gydF4y2Ba | 93.3gydF4y2Ba |
| 总gydF4y2Ba | 90.5gydF4y2Ba | 91.2gydF4y2Ba | 89.8gydF4y2Ba | 90.5gydF4y2Ba |
从表可以看出gydF4y2Ba
证明该方法和决策融合方法相关low-pixel面部表情识别的图片,我们在两种情况下进行实验,分别为(gydF4y2Ba
比较两个模型之间的识别精度和时间。gydF4y2Ba
| 模型gydF4y2Ba | LeNet-5gydF4y2Ba | 没有决策水平gydF4y2Ba |
|---|---|---|
| 精度(%)gydF4y2Ba | 74.6gydF4y2Ba | 87.9gydF4y2Ba |
| 时间(年代)gydF4y2Ba | 0.59gydF4y2Ba | 0.31gydF4y2Ba |
从表可以看出gydF4y2Ba
近年来,面部表情识别的方法面对图像的大小gydF4y2Ba
针对low-pixel脸上的表情识别图像,提出了一种改进的CNN表情识别方法。这篇文章增加网络的非线性模型通过添加一个回旋的层。我们可以学习更层和反映图像信息提取图像特征。gydF4y2Ba
使用的数据来支持本研究的发现可以从相应的作者。gydF4y2Ba
作者宣称没有利益冲突。gydF4y2Ba
这项工作是由重庆大学教育的科学研究平台,大数据体育与健康实践平台基于校园物联网,2017号xjpt07;未来的学校(幼儿教育)的国家教育中心中国发展计划,研究基于物联网智能幼儿园的建设,没有。CSDP18FC3204;和重庆人文社会科学重点研究基地“重庆城乡教师教育研究中心整体发展,“18 jdzdwt04。gydF4y2Ba