文摘

为了提高遥感图像目标检测的准确性,提出了一种遥感图像目标检测算法DFS基于深度学习。首先,维聚类模块、损失函数和滑动窗口分割检测设计。实验中使用的数据集来自national mall,还有6类型的对象:飞机、船、仓库、大型船舶、桥梁、和港口。训练集,验证集和测试集包含73490张图片,22722张图片和2138张图片,分别。假定发现正样本和负样本的数量一个B分别和未被发现的正样本和负样本的数量CD,分别。实验结果表明,DFS六precision-recall曲线类型的目标表明,DFS的检测效果最好的桥梁和最严重的检测效果。主要原因是桥的大小是相对较大的,这显然是区别于背景的图像,因此,检测难度很低。然而,船的目标很小,很容易被与背景混合,因此很难检测到。DFS的地图是提高了12.82%,检测精度提高了13%,召回率略与YOLOv2相比下降了1%。根据探测目标的数量,假阳性的数量(FPs)的DFS比YOLOv2要少得多。假阳性率大大降低。此外,DFS的平均借据是YOLOv2的高出11.84%。对于小目标探测效率和大型遥感图像检测,DFS算法具有明显的优势。

1。介绍

目标检测是图像处理的一个重要组成部分,特别是对于遥感图像。在遥感图像目标检测在军事和民用领域中起着重要的作用[1]。在民事领域,遥感技术广泛应用于资源调查、城市规划、作物产量估计,等等。在军事领域,遥感技术已经成为军事调查和预警的重要手段在现代军队。遥感技术有许多优点2]。随着机器学习的深入,尤其是深度学习,深度学习已成为图像目标检测的一个重要手段。大量的卫星遥感图像为深度学习目标探测提供足够的样品。大量的结果表明,深层学习算法能够处理大量的信息快速、准确地当有足够的样品。因此,通过遥感图像目标探测系统基于深度学习和自动提取手段,大量的卫星遥感图像处理快速、准确、有效的信息可以挖掘,可以避免传统的目标检测算法的缺点,提高目标检测的性能。作为一个典型的问题领域的计算机图形学和计算机视觉,遥感目标检测已经研究了许多外国学者在最近十年,和一些好的研究成果已经取得了3]。目标检测算法大致可以分为周期基于传统的手动功能(2013年以前)和基于深度学习的时期(2013∼礼物)。在技术发展方面,目标探测的发展经历了“边界框回归,”“深层神经网络的兴起,”“多”“采矿和聚焦困难样本”和“多尺度和多端口检测。“传统的目标检测算法大多是基于手动功能(4]。由于缺乏有效的图像特征表达方法,我们必须尽力设计更多元化的缺陷检测算法来弥补手动功能的表达能力(5]。与此同时,由于计算资源的缺乏,我们必须找到更复杂的计算方法来加速模型。特征提取和分类器分类的关键步骤是传统的目标检测算法。各种修改和改进传统的目标检测算法也主要集中在这两个方面(6]。从理论上讲,因为目标是受不同的照明条件下,拍摄角度和拍摄距离,目标特性不一致。同时,目标对象的非刚性的变化也会导致不同的目标特性和目标检测算法需要找到这些目标,在某种程度上是具有挑战性的。近年来,深度学习的发展改善了目标探测的准确性在一定程度上,但仍存在以下问题:大尺寸和高分辨率图像的检测精度和效率较低。与一个小样本集,复杂场景目标探测的性能较低,导致低目标探测精度的因素主要体现在以下三个方面:大尺寸和高分辨率图像带来更多和更清晰的信息,但也会增加目标检测的难度。有许多小目标对象在大幅面高分辨率图像,检测精度低。此外,高分辨率图像将引入更多的计算,减少目标检测的实时性能7]。拍摄图像在不同的环境中会导致问题,如不同目标姿势和复杂目标的背景,这也极大地提高目标检测的难度。机器人应用领域的服务,遥感图像检测、医学图像,训练样本的数量很小,小样本集下的性能目标探测精度差,限制目标探测的应用范围。这些问题需要进一步考虑和解决的目标检测算法。根据这一研究问题,Ilyes相信用回归的方法来检测目标成为一个新的研究热点。分类问题转化为回归问题,简化整个目标探测过程,大大提高了整个系统的运行速度。YOLO组合目标的决心和目标识别成一个意思,大大加快了检测速度。因为整个地图信息是用于网络预测,假警报率很低。然而,该算法也有不准确的定位和检测精度低的问题。SSD模型集成回归思想和多窗口机制,使用多尺度区域功能回归,这不仅保证了检测速度,也保证了检测精度(8]。Kalyzhner等人提出了一个可变形的部分模型(DPM)基于经典手动功能。DPM长条木板整个目标的检测问题在传统的目标检测算法的检测问题模型的各个部分,然后聚合的每个部分的检测结果来获得最终的检测结果,这是一个过程,“从整体到部分,然后从部分到整体。“整个金刚石探测器组成的基础过滤器过滤和一系列的组件进行优化的策略弱监督学习(9]。张等人改进了模型,进一步转换成隐藏变量结构支持向量机的优化问题,这是解决通过结合困难样本矿业和随机梯度优化策略。线性支持向量机分类器在空闲“编译”为一系列级联决定桩分类器模型的加速度。DPM算法使用边界框回归和上下文信息集成,进一步提高检测精度。相对应的边界框检测基地滤波器和组件滤波器集成,最终准确的边界框坐标是通过线性最小二乘回归,和检测结果调整通过全球信息(10]。在当前研究的基础上,提出了一种遥感图像目标检测算法DFS基于深度学习。首先,维聚类模块、损失函数和滑动窗口分割检测设计。实验中使用的数据集来自national mall,还有6类型的对象:飞机、船、仓库、大型船舶、桥梁、和港口。训练集,验证集和测试集包含73490张图片,22722张图片和2138张图片,分别。假定发现正样本和负样本的数量一个B分别和未被发现的正样本和负样本的数量CD,分别。对于小目标探测效率和大型遥感图像检测,DFS算法具有明显的优势。

2。方法

2.1。DFS的目标检测算法

它主要由神经网络,维聚类图像分割和其他模块。神经网络模块负责目标位置和输入图像的分类。维聚类模块负责设计和选择候选帧。图像分割模块负责将原始图像分割,和损失函数模块位于神经网络模块用于优化损失函数。DFS设计一个新维度集群、损失函数和滑动窗口分割检测机制。其中,维聚类机制充分利用训练集的先验信息和设计一个新的帧机制之前,这有效地提高了定位精度。针对这个问题的遥感图像小目标难以检测,设计了一种新的Focalloss函数。针对大型图像检测精度低的问题,设计了滑动窗口分割检测机制。

2.2。维聚类模块

它是搜索簇的无监督学习过程,和聚类分析通常是进行数据挖掘的准备工作。K则是一种常用的聚类算法,其相似度的评价标准是数据之间的距离。该算法认为两个目标点之间的距离越近,他们的相似性越大。前框中使用当前单级目标检测算法是专为中型和大型目标,这与小的检测要求有很大差距和密集的目标在遥感数据集。因此,有必要重新计算模型和选择合适的前框来帮助学习。DFS算法添加维聚类模块来计算前框遥感图像目标检测。维聚类的功能模块在DFS算法提取帧标记训练集和集群他们(11]。宽度和高度( )每一个标记的盒子作为样本数据,宽度和高度 AnchorBoxes被定义为聚类中心。聚类的目的是获得之前的帧的大小和比例是尽可能的标签帧在训练集,也就是说,借据是尽可能大,所以距离的聚类算法被定义为所示

在这里, 指前框和标记框的借据重心由聚类生成,也就是说,十字路口的比率和工会之间的预测帧和真正的框架。值越大,距离越小,也就是说,越有可能是集群的集群。详细的过程描述如下:(1)给一个训练集d的宽度和高度( )得到每个目标标记框的采样点(2)随机指定宽度和高度 k前框的聚类中心K子集(3)根据采样点之间的距离和k集群中心,每个样本点划分为最近的聚类中心所在的子集(4)重新计算聚类中心k子集(5)重复操作步骤(3)中根据新的聚类中心(6)重复步骤(4)和(5),直到结果收敛

上述算法对初始化敏感。由于采用随机初始化,初始聚类中心可能会关闭,这可能会影响分工的子集。针对这个缺点,本文改进了初始化方法,聚类中心之间的距离是在初始化期间尽可能。选择初始聚类中心的具体过程如下:(1)随机选择的宽度和高度( )一个标记框的训练集d,并把它作为第一个聚类中心(2)对于每一个样本点x在训练集,计算距离d (X)之间的和最近的聚类中心(指的是选择集群中心)(3)采用以下原则选择一个新的集群中心:d(越大X),被选中的概率越高集群中心(4)重复(2)和(3),直到所有k选择集群中心。后k初始聚类中心是通过上面的方法,使用它们作为输入的空间聚类算法和最优前框生成。

2.3。损失函数设计

损失函数是指函数用于计算实际值和预测值之间的区别。机器学习的本质是通过训练样本训练模型,得到合理的权重。培训过程的评价取决于损失函数值,和重量训练过程是根据它(调整12]。在每个图像,计算损失函数,边界框可以分为积极的和消极的样本。一般来说,图像中对象的比例远小于背景,所以负样本是主要的两种类型的样本。这导致太多的负样本,这不利于目标的收敛,和大多数的负样本不是在前景和背景之间的过渡区域,所以分类是非常清楚的。很难区分样本的信息从正样本是隐藏13]。

这个损失函数可以减少单级检测方法的准确性,尤其是在遥感图像。因此,DFS介绍Focalloss函数来替换原来的损失函数。Focalloss提高标准的交叉熵损失函数的基础上,这是一个特殊的对数损失函数和通常用于multicategory回归任务。其平方误差损失函数是最常用的损失函数的分类和检测任务,及其更新梯度较大,可以加快神经网络的收敛和缩短训练时间。交叉熵损失函数的公式如下所示:

在这里,y代表了预测值, 代表真正的价值,x代表样本值,n代表样品的总数。

以two-classification问题为例,标准的交叉熵损失函数被定义为所示 在哪里l代表真正的标签样本,1代表积极的样品,和−1代表负样本。 代表目标类别的概率,它的值是(0,1)。方程(3)显示,当样例是一个正样本,样本越大,损失函数将越小,网络检测效果会越好。当样品是负的,越小 ,损失函数越小,网络检测效果越好。为了便于演示, 之间的亲密关系被定义为网络的预测值和真实值,所示

然后,交叉熵损失函数可以表示如图所示

为了解决类别不平衡的问题,有必要调整不同类别的贡献价值损失函数,也就是说,添加一个控制体重损失函数 考虑到样品越容易区分,分类的概率就会越高( )(14]。为了抑制容易区分样本的学习,加强无法区分样本的学习,一个监管因素 添加到损失函数。当 更大,损失函数乘以一个小因素。当 小,损失函数乘以一个更大的因素。 可以发挥调节作用的抑制程度(或提高)。最后Focalloss函数定义如下:

在这里, 不同类别的分类概率。 是一个大于0的值, 是固定值,不参加培训。从公式可以看出(6),无论是前台类或背景类,就越大 ,越小 这意味着样本属于“简单的示例中,“和学习者已经能够判断真实的类别的样本,所以没有必要给它学习更高的权重。Focalloss使其影响力较小的在整个培训过程中减少损失价值由这样的样品(15]。此外,对于二元分类问题, 是用来调整正负样本的比例和使用类别时积极的样本。 负样本分类时使用。

2.4。滑动窗口分割检测

大多数遥感图像存储在tif格式,有大量的信息和高分辨率。然而,单级的目标检测算法将输入图像的大小正常化。因此,如果直接遥感图像作为输入,许多小目标都将丢失。在本节中,一块检测方法旨在解决这个问题。它增加了检测阶段的两个步骤:(1)对任何大小的图像,使用滑动窗口部分,块大小归一化的图像大小( )。(2)输入片到原始的网络检测。检测后,部分根据初始位置拼接和组装。这种分割检测方法减少正常化造成的信息丢失,使输入图像的大小选择更加灵活,并极大地提高了算法的性能。

2.5。实验准备

实验中使用的数据集来自national mall,还有6类型的对象:飞机、船、仓库、大型船舶、桥梁、和港口。训练集,验证集和测试集包含73490张图片,图片、22722和2138分别图像。

假设发现正样本和负样本的数量一个B分别和未被发现的正样本和负样本的数量CD,分别。实验指标如表所示1。地图是指precision-recall图曲线下的面积,这表明平均精度的检测结果,也是最常用的性能指标(16]。

3所示。结果和分析

模型训练是通过使用一组参数,和损失函数10000轮迭代后趋于稳定。结果作为最终的重量训练模型,由测试组测试(17]。

precision-recall曲线验证设置六个类型的对象的数据所示12

可以看出precision-recall曲线的DFS六DFS的目标探测类型为桥梁的检测效果最好和最坏的检测效果。主要原因是桥的大小是相对较大的,明显区别于背景的图像,因此,检测难度很低。然而,船的目标很小,很容易得到与背景混合,所以很难检测到18]。比较YOLOv2算法和DFS算法的检测效果测试集,结果如表所示2

实验结果表明,DFS的地图是YOLOv2高出12.82%,检测精度高于YOLOv2 13%,召回率略有降低1% (19]。根据探测目标的数量,假阳性的数量(FPs)的DFS YOLOv2相比大大减少,和假阳性阳性病例是大大减少。此外,DFS的平均借据是YOLOv2高出11.84%,这是由于采用DFS的空间聚类方法。九更精确的帧选择之前,虽然之前YOLOv2只有5帧及其定位效果差。之前的帧的数量和质量更好的平均借据DFS显著改善。对于大型遥感图像的检测,DFS算法具有明显的优势(20.]。

4所示。结论

针对遥感图像目标探测误差,提出了一种新的目标检测算法DFS,主要由神经网络、空间聚类、图像分割等模块。维聚类模块、损失函数和滑动窗口分割检测设计。九更精确的帧选择之前,虽然之前YOLOv2只有5帧及其定位效果差。更好的数量和质量之前帧的平均借据DFS显著改善。对于大型遥感图像的检测,DFS算法具有明显的优势。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是支持的符号计算与知识工程重点实验室,教育部,吉林省科技发展计划项目(批准号20180520017 jh)。