航拍照片分类单纯依靠光谱遥感的内容是一个具有挑战性的话题。卷积神经网络(CNN)是分类开发的航拍照片等七个土地覆盖类建筑,草原,茂密的植被,严禁,贫瘠的土地,路,和阴影。数据的分类器利用光谱和空间内容最大化分类过程的准确性。CNN是从头开始训练样本与地面手动创建的真理。网络的体系结构由一个卷积32层过滤器和内核大小为3×3,池的大小2×2,批处理规范化,辍学,致密层Softmax激活。体系结构的设计及其hyperparameters选择通过灵敏度分析和验证精度。结果表明,该模型可以有效的分类航拍照片。整体的最佳模型的准确性和Kappa系数分别为0.973和0.967,分别。此外,辍学的敏感性分析表明,使用和批处理标准化技术在CNN至关重要,提高模型的泛化性能。上面没有技术的CNN模型实现了更糟糕的性能,与整体精度和卡巴0.932和0.922,分别。 This research shows that CNN-based models are robust for land cover classification using aerial photographs. However, the architecture and hyperparameters of these models should be carefully selected and optimized.
遥感数据分类(特别是三bands-red正色摄影、绿、蓝(RGB))与传统方法是一个挑战,即使一些方法在文学产生了优秀的结果
有几种方法和算法,已被许多研究人员采用有效分类非常高分辨率航空照片和制作准确的土地覆盖的地图。方法如基于对象的图像分析(或OBIA)主要是调查因其优势在高分辨率图像处理通过光谱和空间特性。在最近的一篇论文,谢长廷et al。
CNN的成功在计算机视觉等领域,语言建模,语音识别已经促使遥感科学家把它应用在图像分类。有几个作品已经完成在CNN对遥感图像分类(
太阳et al。
本研究调查CNN模型和正则化技术的发展如辍学和批处理规范化分类空中正色摄影到一般土地覆盖类(如道路、建筑、严禁、草原,荒地,影子,和茂密的植被)。这项研究的主要目的是运行几个实验探索的影响CNN架构和hyperparameters使用航拍照片土地覆盖分类的准确性。CNN旨在理解行为模型对其架构设计和hyperparameters生产模型泛化能力高。
本节介绍了数据集、预处理和拟议的CNN模型的方法,包括网络结构和训练过程。
实现当前的研究中,一个试点地区被确定基于面积的土地覆盖的多样性。研究区位于雪兰莪州,马来西亚(图
研究区位置的地图。
地面实况样本研究区域,手动选择七土地覆盖类,例如,道路、水体、草地,建筑,茂密的植被,影子,贫瘠的土地。括号中的数字表示每个类的像素数量。
由一个正色摄影
提出了分类模型的伪代码的算法
(
f
result_convolution (x, y) =点积
result_maxpool (x, y) =点积
result_cnn_model =训练模型
训练模型适用于整个形象和获得
卷积神经网络(cnn)或回旋网是一种人工神经网络,模拟人类的视觉皮质系统通过使用本地接受域和共享的权重。这是勒存了和他的同事们(
CNN的典型层。
CNN的架构模型是建立一个卷积层之后,马克斯池操作,批量正常化,和两个致密层分类器(图
的体系结构提出了空中正色摄影分类CNN。
摘要CNN模型的层。
| 层(类型) | 输出的形状 | 参数的数量 |
|---|---|---|
| 输入 | (没有,3、7、7) | 0 |
| 二维卷积 | (没有,1 5 32) | 2048年 |
| 马克斯池 | (没有,1、2、16) | 0 |
| 批正常化 | (没有,1、2、16) | 64年 |
| 辍学 | (没有,1、2、16) | 0 |
| 平 | (没有,32) | 0 |
| 密集的 | (没有,32) | 1056年 |
| 批正常化 | (没有,32) | 128年 |
| 辍学 | (没有,32) | 0 |
| 密度(Softmax) | (没有,7) | 231年 |
CNN模型训练与反向传播算法和随机梯度下降法(SGD)。它使用minibatch近似误差的误差反向传播训练样本,加速循环的重量更新与较小的误差反向传播加快整个模型的收敛速度。优化运行来减少损失函数(
在反向传播(
本研究使用多个统计准确性的措施来评估不同的模型和比较它们在不同实验配置。这些指标是总体精度(
图
CNN的性能模型最优参数集,(a)模型准确性和(b)模型损失93年时期(早期停止)。
CNN PA模型。
| 类 | 巴勒斯坦权力机构 |
|---|---|
| 路 | 0.971 |
| 严禁 | 0.944 |
| 草原 | 0.972 |
| 建筑 | 0.995 |
| 茂密的植被 | 0.999 |
| 影子 | 0.894 |
| 贫瘠的土地 | 0.980 |
CNN的混淆矩阵计算模型。
| 路 | 严禁 | 草原 | 建筑 | 茂密的植被 | 影子 | 贫瘠的土地 | |
|---|---|---|---|---|---|---|---|
| 路 |
|
0 | 0 | 23 | 0 | 0 | 21 |
| 水体 | 0 |
|
85年 | 0 | 0 | 1 | 0 |
| 草原 | 0 | 10 |
|
0 | 27 | 0 | 0 |
| 建筑 | 4 | 0 | 0 |
|
0 | 0 | 0 |
| 茂密的植被 | 0 | 0 | 0 | 0 |
|
1 | 0 |
| 影子 | 0 | 0 | 0 | 0 | 11 |
|
0 |
| 贫瘠的土地 | 6 | 0 | 0 | 8 | 0 | 0 |
|
CNN模型也训练不辍学和批处理规范化看到他们对分类地图的准确性的影响。表
CNN模型的性能与不同的配置。
| 模型 |
|
|
|
|---|---|---|---|
| CNN +辍学+批正常化 |
|
|
|
| CNN +辍学 | 0.958 | 0.956 | 0.954 |
| CNN +批正常化 | 0.964 | 0.956 | 0.961 |
| 美国有线电视新闻网 | 0.932 | 0.922 | 0.922 |
分类地图由CNN模型(a) CNN +辍学+批正常化,(b) CNN +辍学,(c) CNN +批正常化,(d) CNN。
CNN损失模型没有辍学和批处理规范化。
CNN虽然正色摄影分类的性能高度依赖其架构和hyperparameters。因此,灵敏度分析可以作为一个重要的一步找到一个好的设置的参数和结构配置除了理解模型的行为。图
hyperparameters的影响,卷积过滤器,激活函数,概率下降,优化器,批量大小和补丁的大小。
卷积过滤器的敏感性分析表明,更多的过滤器可以导致增加性能。然而,使用更多的过滤器可以增加训练时间和overfit训练数据如果模型不正确正规化。因此,这个参数被设置为32为最佳设置,而不是探索更多的过滤器。在这个配置中,该模型可以实现以下精度:
拟议的美国有线电视新闻网的另一个重要参数是补丁的大小,这是附近区域形成的大小(
补丁的影响大小分类地图的质量。
CNN模型的计算性能依赖于使用辍学和批量标准化层网络体系结构除了等hyperparameters卷积过滤器和图像块的大小。表
CNN的培训时间在秒200时代不同的配置。
| 模型 | 时间(秒)——早期停止 | 时间(秒)完整的训练 |
|---|---|---|
| CNN +辍学+批正常化 | 124年 | 230年 |
| CNN +辍学 | 150年 | 168年 |
| CNN +批正常化 | 75年 | 219年 |
| 美国有线电视新闻网 | 58.4 | 158年 |
本文基于CNN和spectral-spatial特征分类模型学习提出了空中拍摄的照片。利用先进的正则化技术,如辍学和批处理规范化,该模型可以平衡泛化能力和训练效率。用这样的方法来提高CNN模型连同其他预处理技术(几何校正和归一化)的特性和灵敏度分析可以使这些模型健壮给定的数据集进行分类。CNN模型作为特征提取器,可以训练一个分类器的端到端给定的训练样本。网络体系结构可以有效地处理国际米兰和同类场景内的复杂性。最好的模型实现
这些数据被用来从一个研究项目领导Biswajeet Pradhan教授。高分辨率航空照片被用于这项研究。要求提供的数据。
作者宣称没有利益冲突。