在许多深刻的学习方法中,卷积神经网络(CNN)模型在图像识别性能优良。研究使用CNN正在进行识别和分类的图像数据集。动物识别和分类与CNN将有利于各种应用程序。然而,复杂的具有类似特征识别分类至关重要准种特性,如准种鹦鹉的颜色相似度很高。本研究的目的是开发一个移动应用分类建立濒危鹦鹉物种使用先进的基于转移CNN模型学习(一些鹦鹉颜色和形状非常相似)。我们获得的图像在两个方面:收集他们直接从首尔大公园动物园爬行他们使用谷歌搜索。随后,我们已经建立了先进的CNN模型与学习和训练他们使用数据传输。接下来,我们把一个训练有素的模型转化为在移动设备上执行一个文件并创建Android包文件。每个八CNN的精度测量模型。整个相机的移动设备的准确性为94.125%。 For certain species, the accuracy of recognition was 100%, with the required time of only 455 ms. Our approach helps to recognize the species in real time using the camera of the mobile device. Applications will be helpful for the prevention of smuggling of endangered species in the customs clearance area.
随着信息技术的发展,基于深度学习图像处理和分类广泛用于各种应用程序(
尽管各种机器学习模型可以分类图像不同的动物,它仍然是一个挑战来区分动物物种。这是因为有些物种颜色相似度高的。它是一个复杂的过程,需要专业知识甚至人类。CNN模型现代识别方法是有效的。与传统的图像分类方法(
在这项研究中,一个实时移动应用开发利用CNN模型分类濒危鹦鹉准种基于转移学习。阐明本研究的目的,我们提出以下假设:
设计CNN-based转移学习模型可以分类濒危鹦鹉准种高颜色相似
开发的应用程序可以嵌入CNN-based训练而设计的
本文的其余部分组织如下。
许多著名的CNN模型架构存在的各种应用程序。2016年,微软研究院提出的问题解决方案与快捷连接建立深度模型(
许多相关研究存在保护物种的多样性。这些研究获得所需的数据,无人cameraswere安装获取图像的生物。然而,人力资源浪费在处理获得的数据。因为人类的判断是主观的,精度是不可避免地恶化。因此,有必要创建一个系统自动处理和分类的动物图片。Norouzzadeh et al .,在“项目快照塞伦盖蒂,”说,人类从动物图像数据集的信息处理耗时;因此,数据仍未处理。他们提出了一个系统,一台机器可以确定图像属于并检查实体的数量和他们的行为在图像
转移在深度学习学习是一种先进的技术研究。在这种技术的出现之前,人们不得不从头创建和火车模型。很难发明了一种模型的性能在一个特定的任务,因为计算基础设施的缺乏。此外,它是不可能需要收集足够的有意义的数据训练模型,虽然许多研究人员试图聚集他们。然而,各种转移学习方法的上下文中已经提出了知识转移功能,即时权重参数,或关系数据样本之间的信息在一个域(
图
转移图学习。
系统分为四个部分,如图
系统配置和场景分类濒危鹦鹉物种使用移动设备。
在我们的研究中,我们使用Python(蟒蛇)第三步和Android工作室的最后一步。数据预处理使用Python库称为“imgaug”[
开发一个应用程序,TensorFlow Lite提供了一个方法,将生成的模型转换成一个TensorFlow Lite FlatBuffer格式文件(.tflite),可以在移动设备上部署。根据TensorFlow Lite官方网站,FlatBuffer是一个开源跨平台序列化库,有效地序列化数据。TensorFlow Lite TensorFlow创建的支持文件的转换,具体功能,和Keras [
TensorFlow Lite转换过程图。
我们使用Keras库创建和训练深度学习模型。Keras神经网络是一个高级开源API编写的Python。这是作为一个开放式的一部分开发Neuro-Electronic智能机器人操作系统(ONEIROS)项目。模型由Keras构建基于TensorFlow使用快速和直观的界面,CNTK, Theano [
深度学习模型开发最大的局限性之一是,它需要一个大的数据集。千,百万甚至更多的数据样本被要求创建一个可靠的深度学习模型。这些限制可以克服通过操纵和改变少量的数据。这称为数据增大。数据增强技术已经被使用在许多研究[
数据增加濒危鹦鹉物种的图像。
阮等人设置两个实验场景的模型架构Lite AlexNet, VGG-16, ResNet50分类野生动物图片(
根据林et al .,完全连接层常用的传统的CNN模型可能overfit尽管使用辍学。他们提出了一个全球平均池(GAP)技术,插入每个特性映射到一个向量的平均值和链接到的输入将SoftMax层直接而不是一个完全连接层(
公式(
全球平均池的概念图。
根据他们的建议,差距有以下优势完全连接层。第一,可以减少计算成本减少参数的数量是由一个人(hyperparameters)。第二,一些模型参数可以被消除,以减少过度拟合。因此,不需要依靠辍学。在这项研究中,我们将使用差距,而不是传统的完全连接层利用这种技术。
我们进口ResNet50 NASNetMobile、InceptionResNetV2 InceptionV3 Keras图书馆的特征提取模型。导入的模型使用卷积层初始化权重,pretrained ImageNet。全球平均池层和致密层SoftMax卷积后添加层(图
卷积层和特征图谱濒危鹦鹉物种的特征提取。
在解释
卷积层和特征图谱濒危鹦鹉物种的特征提取。
鹦鹉是最常见的濒危物种在韩国,因为走私等社会问题。此外,鹦鹉都包含在列表中最濒危物种的濒危物种国际贸易公约的野生动植物(CITES)(表
四个濒危鹦鹉物种的例子。
| 图片 |
|
|
|
|
|
|
||||
| 的名字 | 红色和绿色的鹦鹉 | Sulphur-crested风头鹦鹉 | 戈氏凤头鹦鹉 | 灰色鹦鹉 |
|
|
||||
| 学名 |
|
|
|
|
|
|
||||
| 外观 | 飞羽、背部、臀部:深红色 |
小黄在耳羽或基地头部和腹部的羽毛 | 短,钝的法案 |
较短的灰鹦鹉,近似方形的红色尾巴 |
|
|
||||
| Cites附录 | 附录二世 | 附录二世 | 附件我 | 附件我 |
图
整个实验过程。
图形用户界面设计系统的例子。
图
学习曲线的每个模型的训练精度。
学习曲线的每个模型的验证精度。
时代数字是30的原因是因为我们检查超过三十是徒劳无益。我们设置一些回调函数称为“model.fit()在我们的实验中,“EarlyStopping()”和“ReduceLROnPlateau ()。“就停止如果验证准确性没有改善在五个时期。我们发现培训时代从来没有超过25,我们时代的数量设置为30。学习速率从0.001开始,逐渐降低了0.03如果验证准确性没有改善在三个时期,直到终止训练。当我们称为“model.compile(),“我们将损失=“categorical_crossentory”指标=“acc和优化器等于“亚当”。
表
混淆矩阵。
| ResNet50 (ImageNet /随机) | 预测 | |||
|---|---|---|---|---|
| 实际 |
|
|
|
|
|
|
100/92 | 0/1 | 0/3 | 5/10 |
|
|
0/1 | 98/66 | 6/38 | 1/0 |
|
|
0/2 | 15/40 | 88/55 | 2/8 |
|
|
5/4 | 1/5 | 10/6 | 89/90 |
|
|
||||
| NASNetMobile (ImageNet /随机) | 预测 | |||
| 实际 |
|
|
|
|
|
|
99/95 | 0/1 | 5/1 | 1/8 |
|
|
0/0 | 100/76 | 2/23 | 3/6 |
|
|
0/3 | 12/32 | 89/54 | 4/16 |
|
|
3/0 | 0/4 | 1/11 | 101/90 |
|
|
||||
| InceptionResNetV2 (ImageNet /随机) | 预测 | |||
| 实际 |
|
|
|
|
|
|
103/85 | 0/7 | 1/2 | 1/11 |
|
|
0/0 | 98/74 | 5/29 | 2/2 |
|
|
0/4 | 8/19 | 95/72 | 2/10 |
|
|
8/5 | 0/4 | 1/4 | 96/92 |
|
|
||||
| InceptionV3 (ImageNet /随机) | 预测 | |||
| 实际 |
|
|
|
|
|
|
100/99 | 0/1 | 3/1 | 2/4 |
|
|
0/0 | 94/77 | 3/28 | 8/0 |
|
|
1/2 | 8/10 | 97/89 | 0/4 |
|
|
8/6 | 0/1 | 0/2 | 97/96 |
数据
F1-score RestNet50的四个不同的濒危鹦鹉图像。
F1-score InceptionResNetV2的四个不同的濒危鹦鹉图像。
F1-score NASNetMobile的四个不同的濒危鹦鹉图像。
F1-score InceptionV3的四个不同的濒危鹦鹉图像。
预测精度反映了多少项目是正确的。记得反映预测有多少正确的物品。精度可以计算真阳性的数量除以积极预测的数量。例如,ResNet50 ImageNet 105图像分类
图
实时移动应用程序的图形用户界面开发的这项研究显示在图
鹦鹉是通过移动设备的摄像头捕捉图像。接下来,训练模型分类的图像。最后,应用程序显示的结果模型。我们可以检查结果在屏幕的底部,见图
在本文中,我们提出了濒危鹦鹉物种分类器。鹦鹉的模型提取特征出现在回旋的层,已pretrained大量数据,然后我们在最后一层的图像进行分类。我们建议的模型需要一个相对较短的时间来进行他们的工作。他们更准确的比模型从头开始训练,特别是对于物种有相似的颜色。这是因为pretrained模型已经可以提取底层特征的新形象。模型由转移训练学习的另一个优点是,该模型不需要画一个边界框训练最后一层。这种方法将极大地减少人类的不便通过消除手动流程。我们预计的准确性将会增加如果微调。最后,特遣部队。keras-based模型可以很容易地部署Android的移动设备上使用FlatBuffer TensorFlow Lite提供的文件转换器。 To clarify the key points of this study, we suggest the following highlights:
CNN模型与转移可以训练学习没有任何特殊的困难
设计先进的CNN模型不需要任何手动预处理(如标签或画边框的图像)
CNN模型可以很容易地转换成文件部署在移动应用程序中使用TensorFlow Lite框架
移动应用程序可以分类濒危鹦鹉的准种高颜色相似
在我们提出的系统,移动应用程序将从设备获得的图像实时摄像头。总之,我们的系统的工作原理如下。我们使用两种方法创建一个高质量的模型与少量的原始数据。首先,我们使用数据增加增加通过操纵原始数据的数据量。其次,我们使用转移学习顺利提取图像的特征。具体来说,我们使用了卷积层pretrained大量数据。接下来,我们使用了FlatBuffer TensorFlow Lite提供的文件转换器来部署这个模型在移动设备上。鹦鹉的准种分类模型的准确性与转移学习大约高出20%的模型从头开始训练。
根据这项研究,我们也希望进一步研究高级的主题可以探讨如下。第一,结果可以提高微调过程时补充道,如前所述
所使用的图像数据来支持本研究的发现可以从相应的作者。但只有一些样例数据是可用的,因为这项研究环境下,韩国。
作者宣称没有利益冲突。
这项研究支持的环境,韩国(2018000210004)。