文摘

有一个不断增长的需求的检测濒危植物物种通过机器学习的方法。Ziziphus莲花是一个濒危物种落叶植物在鼠李的家庭(鼠李科原产于欧洲南部。基于对象的图像分析等传统方法取得了较好的识别率。然而,他们是缓慢的,需要人工干预。基于迁移学习方法有几个申请数据分析在不同的物联网系统。在这项工作中,我们分析了潜在的卷积神经网络识别和检测Ziziphus莲花在遥感图像。Xception我们调整《盗梦空间》第三版,《盗梦空间》ResNet版本2体系结构为二进制分类植物物种类和裸露的土壤和植被类。取得的成果喜人,而且有效地证明了在同行深学习算法更好的性能。

1。介绍

栖息地的破坏和植物物种增多全球由于几个土地覆盖和土地利用的变化可以显著影响环境和社会。因此,迫切需要一个管理系统,包含了坚实的科学原理环境管理特别是植物物种的物种(1]。许多因素影响自然生态系统,全球土地覆盖也许是最重要的。结合遥感技术,这个新兴的领域有重要的应用物联网技术(物联网)的(2]。遥感数据集有效且高效地处理是否可以发现重要的模式有助于可持续发展的环境保护工作3]。

人为土地利用和覆盖变化(LUCC)的主要因素之一是改变环境在全球范围内。理解背后的潜在因素LUCC拥有可持续的关键努力减少砍伐森林和森林退化(4]。灌木和布什,农业用地、草皮和草grassland-type土地覆盖分类系统,研究活动对气候变化造型、环境保护和区域/国家土地利用规划正在进行中5]。

Ziziphus莲花被认为是梯形磨砂、消费和分散的种子的狐狸和其他脊椎动物,生长在低的土地叠梯田和温室气体的扩散受到威胁,农业和土地使用模式(6- - - - - -9]。传统上,物种分布模型(sdm)是用于识别和位置的稀有和濒危物种的数量。这些模型主要是用于保护植物物种。

然而,由于其增强的监控范围,快速的速度,和潜在的获得大量的信息,卫星遥感代表一个最实用的方法对土地利用模式。遥感传感器的光谱波段电磁波谱的范围从可见到红外区域土地覆盖的映射中使用其他应用程序(10]。缺点是,有一定的局限性与遥感监测栖息地的保护状态,因为它不能直接应用于评估小规模的特点(11]。由于广泛的传感器的可用性,几乎可以准确估计的使用不同的技术保护野生动物(12]。然而,监控专家仍在怀疑不同的遥感技术可以在财务条款满足他们的要求。这些专家发现很难使用他们的知识与这些技术(13]。此外,由于空间信息的利用方式,很难评估其对城市扩张的影响,特别是自然栖息地(14]。

尽管有这些限制,卫星技术被广泛部署研究土地利用模式(15],破碎的森林形成[16),影响人口与发展相关的土地利用模式(17),和选择性的物种和栖息地保护18)以及估计自然和人造景观的变化(19]。

分类方法是广泛部署研究机载可见光/红外成像光谱仪高光谱图像(20.),陆地卫星图像(21从城市地区,全色高分辨率数据22]。一个非常高分辨率空间遥感植被提供了详细的信息(23)、人工、水、绿色植被和裸露的土壤(24野生动物栖息地[],以及映射25]。

深度学习技术,如卷积神经网络(cnn)在医疗保健中的应用(26和其他领域27- - - - - -30.)和越来越受欢迎的土地覆盖分类使用光探测和测距(激光雷达)和陆地卫星图像在不同的时间点(31日),使用高分辨率相机遥感应用程序场景分类(32),和高光谱图像(33- - - - - -36]。传统上,方法基于分割的方法,如基于对象的图像分析(OBIA) [37- - - - - -39),用于土地覆盖分类映射、灾害管理、环境监测、民事和军事情报。然而,有许多问题在这种方法的成功应用,如分割挑战和概念基础的类型。从本质上讲,OBIA远非一个操作建立范式为特定研究或商业活动。

紧急人工智能(AI)的方法如IoT-based发现各种应用在无线传感器网络40,41),发现进入连接数以百万计的对象来获得有意义的结果从未经处理的数据42]。它致力于提供最好的解决方案来处理数据和信息(43,44]。物联网的一个巨大的挑战是惟一地标识每个对象的表示和存储的信息交换的对象。物联网的应用仍在初期阶段等多样性自然灾害预测,缺水检测、智能家居、医疗、智能农业、智能交通、智能城市、智能安全。

由于固有的局限性认识对象的现有对象识别方法在高分辨率图像获得遥感仪器,需要新的学习模式在这一领域的评价。在这个研究中,我们现在转移学习的分类方法的选择Ziziphus莲花灌木裸露的土壤和植被的遥感图像。区分Ziziphus莲花从邻近的植物是一个艰巨的任务非专家和现有计算方法,因为周围的植物和土壤背景不同强烈附近的地区(45]。我们使用Xception [46),《盗梦空间》第三版(47),《盗梦空间》ResNet版本2 (48]深转移学习架构微调ImageNet dataset-based特性问题。我们比较我们的方法与现有的文学作品,发现我们的方法优于OBIA。

剩下的内容,本文提出了如下。回顾现有技术中提供了部分2。提出的方法给出的描述部分3其次是实验,讨论和结论部分4,5,6,分别。

2。现有技术

已经进行了很多尝试在生物多样性的保护文学特别是植物物种,尽管任务的复杂性。作者(49]部署图像二值化的计算方法包括分类为背景和叶,利用去噪等步骤提取12 shape-based特性达到90%的精度。金等。50]提出的方法结合二值化、轮廓和角点检测以及分割实现多级分类率为76%(8类)分类问题。同样,Seeland et al。51]证明了加速的功效强大的功能(冲浪)结合尺度不变特征变换(筛选)的功能植物种类识别比传统的方法。格雷格et al。52]使用一个数据集包括213濒危植物物种使用点模式分析等交叉对相关函数来识别不同类型的生态系统是如何相关的。研究也有针对性的d . pectinatum在热带地区跨三个国家自然保护区在中国(53,54使用人工神经网络和支持向量机(SVM)的分类器。杜et al。55)差距分析技术用于在三江平原31濒危植物物种的保护,中国。Hamabata et al。56]利用核糖核酸测序技术获得详尽的植物物种序列属于海洋生物发现,这些物种积累变化导致其灭绝。

同样,智能农业实践已经申请苹果生长周期的监控(57)利用模式识别技术,如活跃的形状和高斯分布模型。此外,虚拟现实技术提供了一个环境使农业的学生提高他们的天赋58]。另一个关键技术是遥感用于研究城市landscape-based系统在城市发展的过程59]。同样,模糊逻辑也被应用于构建一个系统的管理环境破坏(60)以及鹦鹉物种的保护使用转移学习(61年]。

光学遥感图像提供丰富的信息内容来识别对象在一个基本的、充满挑战的方式,并从空中图像识别的任务是获得重要的关注(62年]。OBIA是一个重要的类型的这些方法和用于准确和及时识别杂草的63年),植被映射(64年),提取农田地块对精准农业等领域65年],映射小规模农业[66年),和海洋生物的映射67年]。

基于cnn是梯度优化网络,用于遥感数据的识别包括植被类(68年),土地使用(69年- - - - - -71年),场景分类(32],和多类问题[72年]。已知普遍接近者能够有效代表任意复杂的函数给出足够的能力,他们有很好的泛化能力以及高的表征能力。

当结合微调(73年),辍学,和数据增加74年),CNN-based深架构在一个给定的问题可以显著地提高性能。然而,这些系统的数学理解和影响仍在初期阶段。

3所示。提出的方法

3.1。研究领域

培训和验证区培训和验证基于CNN模型位于卡波德Gata-Nijar自然公园,36°49′43“北,2°16′22”西部,位于阿尔梅里亚的省,西班牙。植被是发现稀缺和片状,由Ziziphus莲花植物包围的裸土和小实习医生风云(45]。有两个测试区域。第一个测试区位于一公里半离训练区,36°49′28“北17′2°28”。第二个测试区位于Rizoelia国家森林公园在塞浦路斯,34°56′09年“北,34°33′26”东(45]。

3.2。遥感数据集

在我们的数据集有两类:Ziziphus莲花植物类和裸露的土壤和植被类。有180个图像训练集,20个图像验证集,和11个测试集的图像。有90个图像中的每个两类训练集虽然有10图像的两类验证集。有六个的图片Ziziphus莲花类和五个裸露的土壤和植被的图像类在测试集。样本训练和测试样本数据所示12

3.3。分类使用10倍交叉验证方法

交叉验证(75年)是一种常见的方法来评估模型的性能,一个独立的数据集,在我们的案例中是验证组20两类的例子。这种方法有助于选择最佳hyperparameters克服过度拟合。有很多方法来实现这种策略等k倍,分层k倍,等等。在这项工作中,我们考虑k倍交叉验证方法,k是10的平衡类数据集。

4所示。实验

分类是一个映射,将一个未标记的实例映射到一个标签。让z的设置和未标记的实例G的空间可能的标签。让一个=z×γ是实例和标签的集合X= {r1,r2,…rn}是一组组成的n为实例,r= <fϵz, ϵG>。一个标识符β映射一个未标记的实例fϵz一个标签 ϵG。正确的分类器的识别率β依赖于正确映射的概率fϵz ϵG

我们使用分类架构如图3。输入图像形状的模型是一个张量299×299×3根据初始版本3的要求,Xception,《盗梦空间》ResNet版本2的架构。然后通过图像传输学习模型ImageNet训练数据集的特性,它的输出之后再送至平层。平层不影响批量大小和转换一批大小批量×××高度宽度引导到一个简单的形状向量输出批×××高度宽度(渠道)。

完全连接(FC)第一层是由256个神经元激活修正线性单元(ReLU)激活函数。之后,有一个辍学层有50%概率提高模型通过降低神经元的过度拟合。最后,还有一个FC层与乙状结肠单个神经元激活函数,它的目的是将输入图像的两类。为训练数据集,我们使用水平和垂直翻转数据增强技术和标准化的输入通过在255年分裂。验证集和测试集,我们只是正常的输入通过255和部门不适用任何其它形式的数据扩充。作为损失函数需要最小化,我们使用二叉叉。优化器,我们选择最小化二叉叉是著名的随机梯度下降法(SGD)。最初的学习速率设置为0.00001。我们衰变学习速率随着时代的推移衰减策略使用步骤。我们还利用梯度剪裁使网络健壮反对过度拟合和梯度爆炸问题。 We trained the model for 30 epochs by setting the batch size to 5.

4.1。分类使用Xception架构

我们使用Xception架构pretrained ImageNet数据集和测试模型在一个独立的测试集。该体系结构采用了切除分离卷积的概念进行一个输入通道的然后通过逐点的1×1卷积投射一个通道的输出到一个新的空间。这种方法的一个优点是高效的使用模型的参数。

4.2。分类使用初始版本3架构

就像Xception架构中,我们使用《盗梦空间》第三版建筑pretrained ImageNet数据集和测试模型在一个独立的测试集,如图4,规范《盗梦空间》版本3模块。在此体系结构中,交叉流道和空间相关性过滤器里面学到的卷积层。它还使用辅助分类器的概念,作为演化,对抗梯度消失的问题。大型卷积块替换为小型的通过分解保存计算的过程。

4.3。分类使用初始ResNet版本2体系结构

Xception和初始版本3架构一样,我们用《盗梦空间》ResNet版本2架构pretrained ImageNet数据集和测试模型在一个独立的测试集。这个架构是一个混合版本的《盗梦空间》和ResNet架构。它使用剩余连接提高训练速度。在此体系结构中,每个初始块后跟没有激活的卷积1×1用于扩大滤波器组的维度来匹配输入允许赔偿的深度在《盗梦空间》引发的降维。

5。讨论

《盗梦空间》的培训/验证准确性和损失情节版本3架构图所示56

所示的阴谋,开始与一个相对较高的错误分类器训练仍然是学习两个类之间的映射和相应的标签。因为它变得更好和更好的传递的时代,分类器返回一个更好的映射。渐变的波动代表学习行为由于特性转化/随机样本。

的培训和验证准确性和损失情节Xception架构图所示78而《盗梦空间》的培训和验证准确性和损失情节ResNet版本2体系结构数据所示910

总的趋势中可以看到这些情节/人物初始ResNet版本2模型执行一点比其他两个模型。趋势描述过度拟合初始ResNet版本2体系结构也可能是由于大量的参数的模型,因为它自然需要大量样本进行训练。所需的参数训练初始ResNet版本2模型是《盗梦空间》的两倍多,版本3和Xception模型。随着参数的数量增加,那么要求训练样本的数量。正则化,如梯度剪切的作用是减轻过度拟合的制度有助于实现有效的机器学习模型的能力。

一个有趣的二分现象中可以观察到的数据910。在图9附近,迅速降低精度可以观察到时代6可解释为饱和神经元杀死渐变为ReLU激活函数可能会在培训过程中饱和-地区。死ReLU激活或更新有问题。另一个可能的原因这一现象可能是损失函数。损失函数的条件数高,在这种情况下,它是在一个局部最小值和梯度为零。学习速率是hyperparameter SGD,它的大小决定了步骤达到局部最小值。边坡表面的方向决定了渐变的方式到达山谷自一个更新执行高方差使目标函数波动严重,陷入局部最小值由于高度非凸的性质自SGD容易噪声误差函数。

我们现在定义的准确性、精密、召回和F1分数在我们的实验:

这里真阳性(TP)表示Ziziphus莲花类样本正确分类属于Ziziphus莲花类,假阳性(FP)代表了裸露的土壤和植被类样本正确分类属于Ziziphus莲花类,真阴性(TN)代表的裸露的土壤和植被类样本正确认定为属于裸露的土壤和植被类,而假阴性(FN)表示Ziziphus莲花类样本正确分类属于裸露的土壤和植被类。

我们实现了100%的精度测试数据集的所有三个架构。所有11个样本属于2类测试数据集的正确分类在各自的类。因此,我们取得了满分1分的精度,回忆,和F1分数为所有三个架构。样品测试数据结果在《盗梦空间》ResNet版本2中所示的两个类是架构的数字1112。类分数Ziziphus莲花类测试样本1,裸露的土壤和植被类,它是1.5358785×10−10

相比之下,Guirado et al。45)报道,精确率达到100%,召回率达到95%,和一个F1分数为96.5% ResNet-based深转移学习分类器时公布精确率达到91.78%,召回率达到97.29%,和一个F192.90%的得分方式上优于OBIA分类器。因此结果证明我们的方法的有效性,通过应用程序的初始版本3,Xception,《盗梦空间》ResNet版本2转移这个问题上优于架构。

6。结论

在这项工作中,我们探索、分析和比较了深度学习的分类体系结构的性能Ziziphus莲花这是一个濒危物种栖息地在欧洲生态系统。Xception我们调整《盗梦空间》第三版,《盗梦空间》ResNet版本2体系结构是在ImageNet pretrained dataset-based特性。我们取得了可喜的成果,建立了深度学习的有用性的方法在这一领域的问题。我们发现这三个人类监督他们的推理时间架构所需要的最小最小的其他方法相比,它不是基于OBIA等深度学习。在未来,我们打算扩展这项研究通过加入更多的濒危物种灌木在旱地不同地区的森林生物群落在全球范围内依照所采取的全球倡议联合国粮食和农业组织。我们也计划部署小说深度学习架构如图卷积网络和胶囊网络识别图像的植物物种的保护问题。

数据可用性

用于实验的数据集在这个研究可以合理要求通讯作者。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

ABT负责概念、方法、调查和软件。RK负责验证。国际单位负责正式的分析。OC负责资源。RK和本身负责数据管理。ABT和AY负责准备初稿。ABT和洛杉矶负责审查和编辑。负责可视化。IU和HH负责监督。YKM IU,佤邦,HH, OC负责项目管理。 OC was responsible for funding acquisition. All authors have read and agreed to the published version of the manuscript.

确认

这个项目是由塔伊夫大学的研究人员支持项目(TURSP),塔伊夫大学、沙特阿拉伯王国在格兰特号码:TURSP-2020/107。