基于学习的移动设备有害数据检测

抽象的

互联网的便利使各种多媒体内容在智能手机和平板电脑上自由流动。然而，对儿童有害的多媒体内容也容易传播，造成许多社会问题。本文提出了一种基于人工神经网络的输入图像危害性自动评估方法。该方法首先根据输入图像的MCT特征检测人脸区域。接下来，基于颜色特征，本研究识别了人体皮肤颜色区域和乳头候选区域，乳头是人体的有害部位之一。最后，利用人工神经网络去除候选区域中的非乳头区域。实验结果表明，所提出的基于神经网络学习的方法能够从输入图像中鲁棒地检测出乳头区域，从而更有效地判断不同类型图像的危害性。

1.介绍

近年来，随着高速有线和无线通信技术、大规模存储设备、轻便便携式移动设备的发展，图形用户界面的数字媒体播放器迅速发展。因此，照片、动画、高清晰视频等多种多媒体内容得以自由传播。1- - - - - -3.］．由于包括智能手机或互联网的移动设备的计算和网络技术的显着增长，包括与现有的典型个人计算机相当，基于移动设备的多媒体内容已被广泛使用[4- - - - - -7］．

在任何人都可以通过连接互联网的高速有线和无线移动设备获取和回放多媒体数据的同时，色情视频、裸照或其他成人内容也很容易传播给青少年和儿童，造成巨大的社会问题[8］．在这种情况下，在图像安全区域，对成人图像自动评估和过滤的需求越来越大，有意或无意地通过各种途径流入[9］．

最近关于图像处理和模式识别的文献描述了现有的评估图像危害性的技术。Shih等人从成人和非成人图像数据库中搜索查询图像[10］．在相似的搜索结果中，如果成人图片超过一定的数量，就会被判定为有害图片。Zheng等使用多贝叶斯分类器识别皮肤区域，获得提取的皮肤区域的形状特征[11］．接下来，这些研究人员将识别出的形状特征应用到增强分类器中，以评估图像的危害性。Park等人利用灰度图像中的Hough变换来评估图像的危害性，检测乳房，包括乳头区域[12］．Lee等人预先定义了人类肤色模型，并利用该模型从输入图像中提取皮肤区域[13］．然后，基于所提取的皮肤区域的形状特征，他们评估图像危害性。除了这些方法，新技术正在不断地试图自动评估图像危害性[14］．

这些方法在某些图像数据库中可以保证一定的准确性。然而，这些方法的精度还不够高，无法拍摄到不同环境下的所有不同类型的图像。在这种情况下，我们提出了一种利用层次人工神经网络检测人乳头区域的方法来鲁棒地评估图像的危害性。在本文中，如果一个裸体女人的乳头被检测到，图像被认为是有害的。数字1给出了本文提出的危害性评估算法的总体轮廓。

如图所示1该算法首先通过改进的人口普查变换(MCT)方法从输入图像中检测出人脸区域。该算法基于颜色特征识别人体皮肤颜色区域，提取人体元素之一乳头的候选区域。最后，该算法利用分层人工神经网络将候选乳头区域中的非乳头区域去除，保持实际乳头区域，并评估图像的危害性。

本文的其余部分组织如下。部分2描述了现有的成人内容检测研究和多媒体区域的研究。部分3.解释了一种基于MCT特征从输入图像中提取面部元素的方法。部分4说明通过利用色彩信息从图像的技术，筛选出候选乳头区。部分5描述了一种通过神经网络验证候选乳头区域来评估图像危害性的技术。部分6显示进行的实验结果，以比较和评估所提出的方法的性能。部分7提出本研究的结论和未来的研究展望。

随着智能手机、上网平板电脑等移动设备的计算性能和网络功能的发展，裸照、成人视频等成人多媒体内容也在自由传播。在这种情况下，对自动屏蔽此类成人内容的技术的需求正在增加。相关文献介绍了成人内容自动检测的相关方法。

基于内容的图像检索方法[10通过利用肤色分布，首先从图像中删除背景区域并以方形形式获取感兴趣的区域。接下来，该方法从每个图像中提取颜色，纹理和形状特征，并从由成人和非向图像组成的图像数据库中搜索到输入图像的100个最相似的图像。如果搜索的图像包括多于成人图像，将给定的图像视为成人图像。如果不是，则将给定的图像视为非成人图像。是预定义的阈值。也就是说，基于图像检索的方法通过图像分类解决了成人图像的筛选问题。数字2展示了基于图像检索方法的总体结构。

基于形状特征的方法[11]利用多贝叶斯分类[15，16，以更精确地检测人类肤色分布区域。对于精确的皮肤检测，人体皮肤颜色检测过程包括两个阶段:皮肤像素检测阶段和皮肤面积细化阶段。从检测到的皮肤区域中提取形状特征并输入到增强分类器中，以评估输入的皮肤区域是否为裸照。利用偏心度、紧致度和矩形度这三种简单的形状描述符，分析了形状特征;Hu提出的七个常矩不变量[17];和Zernike时刻[18，19］．该方法利用不同的增强分类器和形状特征来比较和测试成人图像检测算法的性能。

基于乳房面积检测的新方法[12]采用均值强度滤波和Hough变换[20.，21从图像中识别乳腺区域，筛选出成人图像。本文提出的成人图像识别方法主要由学习阶段、识别阶段和测试阶段组成。在学习阶段，通过学习乳头部分图像，系统形成一个乳头强度滤波器用于识别阶段。在识别阶段，对输入图像进行边缘提取，利用边缘密度提取连接元素。然后，通过考虑连接元件的长宽比，系统确定候选乳头区域。系统测量学习后的乳头强度滤波器与输入图像中候选乳头区域之间的相似度，以相似度最高的作为最终候选乳头区域。利用Hough变换检测图像中的胸线。在测试阶段，考虑在识别阶段学习到的乳房线和候选乳头区域的位置，以评估相应图像的最终危害性。

基于人类肤色模型的方法[13]采用自适应和可扩展的肤色分布模型，能够承受特殊照明效果造成的颜色投射空间 [22来分割人类肤色区域。该模型不使用预定义的肤色模型，而是从输入图像本身获取人的肤色，以更自适应地更新模型。然后利用多个特征来评估分割后的皮肤区域是否真实，以及输入图像是否为成人图像。在提取的肤色区域特别考虑纹理平滑。为了有效地学习肤色分布，该算法多层前馈神经网络[23，24是就业。

除上述方法外，还开发了许多其他有关成人内容检测的技术[14］．尽管这些方法在某些数据库中可以确保一定的准确性，但它们不够精确，无法处理在不同环境中拍摄的每一张动态图像。

3.使用MCT面孔区域的检测

本文采用MCT特征从输入图像中检测人脸区域[25，26］．MCT特征是基于区域的特征，使用(0,1)二进制信息核心。换句话说，在内核，平均被计算，并且如果内核值比平均大时，为1的值被分配;如果是比平均更小，0值被分配。因此，在内核，共或可生成511 MCT特征。总的来说，MCT特性利用了对光照变化不敏感的区域信息，并确保了简单的计算过程。因此，在多媒体区域的人脸检测中具有较高的检测率和快速的处理时间。

通常，MCT功能使用内核可以使用

在(1)，表示亮度和在内核的像素的平均亮度。表示核和相邻像素的中心。是一个比较函数。如果比平均亮度大值为1;如果不是这样,值为0。是一个十进制的转换运算符。它改变从得到的9位二进制数进入十进制数。因此，本文中使用的MCT功能范围为0至510.图3.显示了MCT转换的示例。

将输入图像中识别出的MCT特征应用于Adaboost learner生成的人脸检测分类器[27]以主要筛选出面部区域。内检测的脸部区域中，眼睛和嘴唇区域然后与眼部图和LipMap [提取28，29］．基于eyemap的方法是一种可使用的方法色彩空间。它使用了信道为基础的EyeMapL和基于通道的EyeMapC执行AND计算并生成EyeMap。基于lipmap的方法是根据整个皮肤区域的颜色来估计嘴唇区域的颜色。它计算，整个皮肤区域颜色的变化，并使用这个生成LipMap。

数字4显示了将EypMap和LipMap应用于使用MCT特征检测的面部区域的眼睛和嘴唇区域检测结果。数字4(一)是眼部区域检测的一个例子，Figure4 (b)是唇形区域检测的一个例子。

(a)眼睛区域检测

(b)唇区检测

最后选取包含检测到的眼睛和嘴唇区域的最小外接矩形作为最终的人脸区域。在本文中，利用面部区域，包括提取的眼睛和嘴唇区域，有效地过滤出候选乳头区域，待后续阶段提取。换句话说，由于候选乳头区域不可能存在于人脸区域内部，如果在人脸区域中存在候选乳头区域，则系统将其视为非乳头区域并将其移除。

4.提取乳头区

本文为了评估不同输入图像的危害性，确定这些图像中是否存在女性乳头区域。为此，首先使用预定义的椭圆形人体皮肤颜色分布模型检测人体皮肤区域[28］．

然后，如（2)，利用定义的乳头映射从皮肤区域中提取候选乳头区域颜色模型。在(2)，，,代表，,颜色值对应坐标。乳头地图的定义是利用所有的颜色元素颜色模型。(2)在0到255之间标准化:

正常情况下，人类乳头区域有红色的颜色值和相对较暗的亮度值。基于这个事实，乳头图的定义，,。在(2)，用红色和较低的亮度强调像素。强调乳头区域相对于皮肤区域。

桌子1的平均值和标准差的定量比较皮肤及乳头区域颜色分布。如表所示1，皮肤面积，相比乳头面积，有更低平均值和更高的值值。


颜色	地区
	乳头		皮肤
	意思	方差^1／2	意思	方差^1／2

	116	6.84	187	12.40
	119	2.96	103	2.21
	140	3.87	156	6.65

在本文中，将乳头图应用于皮肤区域所提取的乳头图图像，如果它们是乳头区域的可能性较高，则标记为更亮。出现乳头区域的概率越低，标记的颜色就越深。接下来，对提取的乳头图图像进行二值化和标记，提取候选乳头区域。使用Otsu方法对乳头地图图像进行二值化[30.，31］．当亮度直方图具有两种类型的概率密度函数时，这种方法可以提供最好的性能。Otsu二值化方法是在不具备先验知识的情况下，基于统计信息找到亮度直方图二值化的最佳临界值。它是图像处理和计算机视觉领域最常用的二值化算法之一。

通过二值化乳头地图图像检测出候选乳头区域后，采用形态学操作去除相对较小的区域，如噪声区域[32，33］．形态图像处理是与图像中特征的形状或形态相关的非线性操作的集合。形态运算只依赖于像素值的相对排序，而不依赖于像素值的数值，因此特别适合于二值图像的处理。一般来说，开放形态操作在侵蚀过程后进行膨胀过程。它删除了小于一定大小的区域，并留下与原来大小相似的其他区域。其余区域的边界变得更软。

5.用神经网络确定危害性

在前一阶段提取候选乳头区域后，利用MCT特征和人工神经网络去除非乳头区域，得到真实的乳头区域。

也就是说，本文建立了一个乳头图像归一化的学习数据库像素大小学习乳头区域。接下来，从每个乳头区域提取MCT特征，并且通过人工神经网络学习该组提取的MCT特征以产生乳头分类器。尽管MCT对旋转敏感，但是这种限制可以最小化，因为乳头是圆形的。最后，通过使用生成的乳头区域学习分类器，验证候选乳头区域以对图像危害进行最终评估。也就是说，如（3.)，如果认为女性乳头区域暴露，系统认为输入图像有害;如果不是，它认为输入的图像是无害的:

在(3.)，代表了乳头区域包括在一个图像和表示当时的输入图像．

本文提出了一种通过使用分层分层人工神经网络学习后识别乳头区域的算法。人工神经网络的学习功能是错误反向验证算法[34］．也使用一个隐藏层。激活功能是二进制双曲线函数。分层人工网络由511个输入节点，128个隐藏节点，和1个输出节点。

本文使用的层次人工神经网络通过一个阈值输入和重新学习检测到的样本，产生99%的检出率和50%的误检率。它在6层重复这个过程。候选乳头区域归一化为并利用层次人工神经网络对其进行了测试。数字5概述层次人工神经网络的分类过程。

在这个过程中抽出的候补乳头区域可能包括多个乳头区。因此，如果定义为在候选乳头区域的大小（4)相对于整体图像的大小，我们的实验在候选区域内再次尝试乳头检测，将对应的候选区域划分得较小:

6.实验结果

本文中使用的计算机具有英特尔核心™i7 2.93 Ghz CPU, 8gb内存。操作系统为Microsoft windows 7。实现所提出的危害检测方法的编程工具是Microsoft Visual c++和OpenCV。为了比较和评价所提算法的性能，我们采集了不同类型的成人图像和非成人图像，这些图像都是在正常的室外和室内环境下采集的，没有特定的约束条件。

数字6(一)显示一个成人图像和图形6 (b)显示从输入图像中估计乳头映射的结果。

(一)输入图像

(b)乳头地图

数据7(一)和7 (b)展示了基于该方法的最终乳头区域检测实例。

(a)乳头检测

（b）乳头检测2

为了定性评价所提出的图像危害性评价方法的性能，采用了精度标准，定义为(5)．在这些公式中，表示精确检测到的乳头区域的数量。指的是被误诊的乳头区域实际上是非乳头区域的数量。是未被检测到的乳头区域的数量。表示在输入图像中所有检测到的乳头区域中准确检测到的乳头区域的相对比例。表示准确地检测乳头区域中实际存在的给定图像中的整个乳头区域的相对比例。在模式识别和与二元分类信息检索，精度（也称为阳性预测值）获取的实例是相关的分数，而召回（也称为灵敏度）是被检索相关实例的分数。因此，这两个精确度和召回是基于相关性的理解和度量[35]：

在本文中，所提出的方法与现有的强度基于过滤器的方法和几何基于滤波的方法来测试其精度进行比较。数据8和9通过(5)．如图8和9，基于层次人工神经网络的方法降低了误检率，提高了图像危害性评估的准确性。

三种方法中，基于过滤器的强度的方法显示出最低的精确度。由于颜色信息没有得到充分利用，方法有很多错误。几何基于滤波-方法首先检测候选乳头区域，然后删除使用关键几何特征nonnipple区域。这种方法可能导致误检测，因为更多的特定的过滤是困难的。该方法采用分级的人工神经网络学习人类乳头区的主要功能的深度检测之前，实现更高的精度。然而，如果在建议算法中使用的主要参数不被初始化过程中充分地调谐，图像危害性检测的精度可能变得有些低。另外，当乳头区域被包含在输入图像，其中的图像质量降低的部分中，所提出的方法可以指示在图像危害性检测精度率的降低。

7.结论

本文提出了一种基于人工神经网络的输入图像危害性自动评估方法。该方法首先利用MCT特征检测输入图像中的人脸区域。然后，基于颜色特征获取人体皮肤区域，提取候选乳头区域。最后，在候选乳头区域中，使用分层人工神经网络去除非乳头区域，稳健检测实际乳头区域，最终评估图像的危害性。

在实验中，将该算法应用于不同类型的成人和非成人图像，在没有特定约束的情况下测试其性能。结果表明，与现有的检测方法相比，采用分层人工神经网络的检测方法具有更强的鲁棒性。也就是说，该方法首先通过神经网络学习乳头区域的特征，然后检测乳头区域，具有较高的准确性。

这项研究的未来的工作将包括更有效地通过将图像的危害性分为多个层次，而不是目前的两种状态，有害的，不会对人体有害确定不同类型的输入图像的危害性。我们也将尝试调整在建议算法中使用的预定义的参数自适应地提高整个系统的稳定性。此外，在评估图像危害性，如何考虑代表其他人的身体部位比乳头面积危害等，如肚脐，臀部和生殖器区域，也将不断探索。

利益争夺

作者声明本文的发表不存在利益冲突。

致谢

本研究由韩国教育科学技术部(2011-0021984)资助的韩国国家研究基金会基础科学研究计划(NRF)资助。

参考

G.-T。周克明，刘凤涛，“基于内容的多媒体信息检索的关联特征映射，”模式识别第45卷第5期4，第1707-1720页，2012。视图:出版商的网站|谷歌学术搜索
A. DOSEEFAOUI，H. NORA和Z. Fawaz，“一个集成的多媒体数据减少和有限网络设备的内容机密性方法”，ad hoc网络， vol. 32, pp. 81-97, 2015。视图:出版商的网站|谷歌学术搜索
F. Amato, F. Colace, L. Greco, V. Moscato，和A. Picariello，“电子政府应用多媒体数据的语义处理”，视觉语言与计算杂志，第32卷，第35-41页，2016。视图:出版商的网站|谷歌学术搜索
r . Sanchez-Iborra,医学博士。卡诺，J. J. P. C. Rodrigues和J. Garcia-Haro，“使用蝙蝠侠在Ad Hoc网络上高效传输高要求流量的实验QoE性能研究”，移动信息系统， 2015年第1期，文章编号217106,14页，2015。视图:出版商的网站|谷歌学术搜索
Y.-S。李和S.-B。Cho，“一个使用树状结构分层贝叶斯网络的移动图片标签系统，”移动信息系统，第9卷，第5期。3, pp. 209-224, 2013。视图:出版商的网站|谷歌学术搜索
F. M. Borrego-Jaraba, I. L. Ruiz, M. Á。Gómez-Nieto，“一个无处不在的、非侵入式的系统，用于使用NFC、地理定位技术和空中手势的无处不在的广告，”移动信息系统，第10卷，第5期。4, pp. 361-384, 2014。视图:出版商的网站|谷歌学术搜索
P. M. P.罗莎，J. J. P. C. Rodrigues的，和F.巴索，“用于移动多媒体系统的一个重量感知推荐算法，”移动信息系统，第9卷，第5期。2，pp。139-155,2013。视图:出版商的网站|谷歌学术搜索
V. M. T. Ochoa, S. Y. Yayilgan，和F. A. Cheikh，“使用机器学习技术的成人视频内容检测”第八届国际会议信号的图像技术和基于互联网的系统程序（SITIS '12），第967-974，IEEE，意大利那不勒斯，2012年11月。视图:出版商的网站|谷歌学术搜索
s. -w.jang，y.-j.公园，G.-Y.Kim，H.-i.choi和m.-c。洪，“基于强大的皮肤细分的成人图像识别系统”影像科学与技术杂志，第55卷，第55期2、2011。视图:出版商的网站|谷歌学术搜索
J.-L。施,学术界。李,c。杨，“利用图像检索技术的成人图像识别系统”，模式识别的字母第28卷第2期16, pp. 2367 - 2374,2007。视图:出版商的网站|谷歌学术搜索
Q.-F.郑，曾W.，G.文和W.-Q.王，“基于形状的成人图片检测，”在对图像和图形第三届国际会议论文集（ICIG '04），页150-153，香港，2004年12月。视图:出版商的网站|谷歌学术搜索
Y.-J。公园,工程学系。Weon, j。唱,我。崔,G.-Y。Kim，“通过检测乳房轮廓和乳头来识别成人图像，”信息，第15卷，第5期。7, pp. 2643-2651, 2012。视图:谷歌学术搜索
js。李,Y.-M。郭,P.-C。钟,E.-L。Chen，“基于自适应和可扩展肤色模型的裸体图像检测”，模式识别，第40卷，第5期。8，页2261-2270,2007。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学
蔡明俊。蔡,H.-S。张，“成人图像混合特征检测器的设计”第七届语义计算国际会议论文集(ICSC’13)，第389-390页，IEEE, Irvine，加州，美国，2013年9月。视图:出版商的网站|谷歌学术搜索
G. Feng，J. Guo，B.-Y.静和太阳，“使用Naive Bayes进行文本分类的子集选择”模式识别的字母，第65卷，第6297条，109-115页，2015。视图:出版商的网站|谷歌学术搜索
H.-C。林和C.-T。Su，“对不完整数据使用元启发式的选择性贝叶斯分类器，”神经计算， vol. 106, pp. 95-102, 2013。视图:出版商的网站|谷歌学术搜索
M.-K。“基于矩不变量的视觉模式识别”，信息论汇刊，第8卷，第2期2，第179-187页，1962。视图:出版商的网站|谷歌学术搜索
C.-W。Tan和a . Kumar，“使用稳定的虹膜编码和泽尼克矩相位特征的远距离精确虹膜识别，”对图像处理IEEE TRANSACTIONS，第23卷，第2期。9、pp. 3962-3974, 2014。视图:出版商的网站|谷歌学术搜索|MathSciNet
“基于多源双向相似度和非局部相似度匹配的超分辨率重建，”专业图像处理，第9卷，第5期。11，pp。931-942,2015。视图:出版商的网站|谷歌学术搜索
Lin Y.， Chen B.，“基于hough变换的鲁棒特征匹配，”模式分析与机器智能学报，第37卷，第2期12, pp. 2388-2401, 2015。视图:出版商的网站|谷歌学术搜索
K.-Y。郭德纲，贾斯特。Sheng, M. Gashinova，“利用毫米波雷达图像的条纹霍夫变换进行道路边缘识别”，IEEE智能交通系统汇刊，第16卷，第5期。2, pp. 825-833, 2015。视图:出版商的网站|谷歌学术搜索
K. B. Shaik, P. Ganesan, V. Kalist, B. S. Sathish，和J. M. M. Jenitha，“HSV和YCbCr颜色空间中肤色检测和分割的比较研究，”程序计算机科学，第57卷，第41-48页，2015。视图:谷歌学术搜索
X.-B。Liang和J. Wang，“具有连续可微分目标函数和有界约束的非线性优化的递归神经网络，”神经网络上的IEEE交易，第11卷，第5期。6，页1251-1262,2000。视图:出版商的网站|谷歌学术搜索
秦淑琴，“一种求解非光滑凸优化问题的双层递归神经网络，”神经网络与学习系统第26卷第2期6, pp. 1149-1160, 2015。视图:出版商的网站|谷歌学术搜索
B. Froba和A. Ernst的《改进的人口普查变换的人脸检测》第6届IEEE自动面部和手势识别国际会议的诉讼程序，第91-96，韩国首尔，2004年5月。视图:出版商的网站|谷歌学术搜索
L.白，J.梁，C.荡，和F.曹“为聚类高维分类数据的新型属性加权算法，”模式识别，第44卷，第5期。12, pp. 2843-2861, 2011。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学
K.-K.香港和K.-S.香“在AdaBoost的框架，并将其应用到行人检测加上强分类设计”模式识别的字母，第68卷，第1部分，63-69页，2015。视图:出版商的网站|谷歌学术搜索
R.-L。Hsu, M. Abdel-Mottaleb和A. K. Jain，《彩色图像中的人脸检测》，模式分析与机器智能学报，第24卷，第2期5，第696-706页，2002。视图:出版商的网站|谷歌学术搜索
K.-M。Lee，“基于组件的人脸检测和验证”，模式识别的字母，第29卷，第2期3，页200-214,2008。视图:出版商的网站|谷歌学术搜索
N.大津“从灰度级的直方图阈值选择方法”，IEEE系统、人与控制论汇刊，第9卷，第5期。1，第62-66页，1979。视图:出版商的网站|谷歌学术搜索
M. Sezgin和B. Sankur，“对图像阈值技术和定量性能评估的研究”，电子成像杂志，第13卷，第2期1，页146-168,2004。视图:出版商的网站|谷歌学术搜索
J. E.阿科，J.M.Górriz，J.拉米雷斯，I.阿尔瓦雷斯和C. G. Puntonet，“用于使用形态运算疟原虫自动列举的数字图像分析，”具有应用的专家系统，第42卷，第2期6, pp. 3041-3047, 2015。视图:出版商的网站|谷歌学术搜索
R. Su，C. Sun，C. Zhang和T. D.Pham，基于形态学操作，面向各向异性高斯功能和Hessian信息的2D图像线性特征和结增强的新方法。模式识别，第47卷，第47期。10, pp. 3193-3208, 2014。视图:出版商的网站|谷歌学术搜索
中州。李,D.-H。金,H.-S。Ko，“基于牛顿优化和MCT的改进adaboost学习的车牌检测，”韩国计算机与信息学会学报，第十七卷，第二期12，第71-82页，2012。视图:出版商的网站|谷歌学术搜索
“基于区域精度和召回措施的遥感图像分割质量评价，”ISPRS杂志摄影测量与遥感的，第102卷，73-84页，2015。视图:出版商的网站|谷歌学术搜索

移动信息系统