文摘

由于大量的乙状结肠激活函数推导在传统的卷积神经网络(CNN),很难解决的问题的低效率提取合成孔径雷达(SAR)图像的特点。CNN的乙状结肠激活函数改进是解决线性单元(ReLU)激活函数,和修改分类器的极端学习机(ELM)。最后,在这个CNN模型,改进后的CNN是特征提取器和榆树执行识别器。SAR图像识别算法基于CNN-ELM算法结合CNN和榆树的算法。实验进行移动和静止目标获取与识别(MSTAR)数据库包含十种目标图像。实验结果表明,该算法可以实现网络的稀疏,缓解过度拟合问题,加快网络的收敛速度。值得一提的是,这个实验的运行时间很短。与其他实验相同的数据库相比,这表明该实验产生了更高的识别率。SAR图像识别的准确性为100%。

1。介绍

合成孔径雷达(SAR)是一种重要的获取信息,并广泛应用于地质调查、地形测绘、海洋资源利用,等等。的原因是值得探索在未来由于其巨大的实际应用。

SAR图像识别总是似乎为研究火锅,在获取信息的过程中,特征提取是一个成功的关键因素之一图像目标识别系统。Mishra和Mulgrew首先提出的应用主成分分析(PCA) SAR图像分类。实验移动和静止目标获取与识别(MSTAR)数据库基于主成分分析表明,该分类器比偏差分类器基于高斯模型的训练数据有限的情况下(1]。膝盖等人提出了一个自动分类方法使用图像分区和稀疏表示的特征向量生成SAR图像(2]。王等人提出了一个互补空间金字塔编码(中海壳牌)方法的框架空间金字塔匹配。编码系数和编码残差都是探索开发更多的歧视和健壮的特性代表SAR图像(3]。陈等人提出了深卷积网络(宽带)为目标的SAR图像分类,可以达到平均99%的分类精度ten-class MSTAR数据库的目标(4]。丁等人提出的方法结合全球和本地过滤器(CGLF) SAR目标识别标准操作条件下和各种扩展操作条件,可以被看作是一个标准的比较(5]。

卷积神经网络(CNN)是一种前馈神经网络包括卷积计算和深层结构。这是一个深度学习的代表算法(6]。CNN在许多领域得到了广泛的应用。尤其是在识别领域,CNN用于手写数字识别(7,8),语音识别(9,10),面部表情识别(11,12)、人脸识别(13,14),冰箱果蔬识别(15),验证码识别(16),交通标志分类(17和识别18),等等。在图像识别领域,以下图片可以直接输入的CNN,这减少了实验的复杂性。此外,图像信息可以通过向前传播到卷积层由CNN和downsampling层。与此同时,它可以处理在不同的网络层,避免了提取过程的复杂特性在传统算法。图像的最基本特征可以通过访问CNN的神经元在当地传感领域。CNN仍然是一个高度的不变性在提取图像的复杂特性,不管转变,缩放、变形、旋转、或其他形式的变形图像的(19]。Cireşan等人建立了多列深层神经网络应用于混合国家标准与技术研究所的数据库(MNIST)手写数据库,它有一个很好的识别效果(认可率小于0.3%)20.]。因此,美国有线电视新闻网是一个更好的图像特征提取器。

近年来,美国有线电视新闻网也被成功地应用于雷达图像识别。杜等人提出了一种位移和旋转不敏感深CNN模型由增强训练数据集(21]。彭等人提出了一种新的CNN建筑与空间金字塔池(SPP),可以构建一个高的层次特性映射特征图卷积除以由细到粗的水平总地方特色的SAR图像(22]。Krizhevsky等人进行了一项CNN模型适用于ImageNet大规模视觉识别的挑战(ilsvrc - 2012)和得到一些好的结果23]。曹和公园提出了CNN架构使用聚合特性和完全连接层,军事目标的准确识别10类MSTAR数据集是94.38% (24]。

一般来说,CNN的最后一层可以被看作是一个线性分类器,但它不是最优分类器。常用的最优分类器是支持向量机(SVM)及其改进算法。勒存2006年,黄和卷积网络(CN)和支持向量机算法相结合来确定目标和生成高识别率(25]。2012年根据结合算法,手写的数字进行了实验;精度可达99.81%7]。尤其是在文献[26],CNN是可训练的特征提取器和支持向量机执行识别器,分类精度98.49%获得肯尼迪航天中心(KSC)数据集和99.45%在帕维亚大学获得场景(PU)数据集。

然而,与传统的支持向量机相比,反向传播(BP)和其他分类算法,极端的学习机器不仅具有训练速度快,调整参数较少,但也有短的运行时间和训练精度高27]。一种新的SAR图像识别方法的基础上,CNN-ELM算法。方法的过程如下:首先,ReLU函数在CNN,代替乙状结肠功能;其次,图像特征提取;最后,CNN的最后一层将被替换为榆树为了认识这些图片。和方法的特点是高识别率和短的运行时间。

2。CNN和榆树

2.1。卷积神经网络

近年来,因为机器学习不需要改变图像的拓扑结构,在图像识别是非常受欢迎。卷积神经网络(CNN)不仅是一个深度学习(28)也是一个人工神经网络,主要用于语音分析的领域(29日和图像识别30.]。

传统的CNN模型的结构如图1。有五层CNN模型。的输入层是一个矩阵归一化模式与大小 特征映射连接输入和它的上一层。这意味着卷积得到的特征层被用作输入池层。所有神经元的一个特性映射共享相同的内核和连接权值(称为共享重量(31日])。例如,使用一个内核大小5和2的二次抽样比例,每个特性映射层减少了特征尺寸从先前的特征尺寸

CNN模型中有三个独特的结构特点:本地传感领域,分享(重量31日),并将采样。当地的感知域是每一层的单神经元。只是每一层的神经元,神经元相对于在某一领域(一般矩形区域的神经元 )在网络输入层。由于独特的结构特性,输入图像的结构特点,可以提炼出每个神经元。体重共享可以大大减少网络的训练参数和训练样本的数量。将采样是一种有效的特征提取的图像,从而使该模型有很好的抗噪声能力和大大减少图像的特征维度。CNN模型分为输入层、隐层和输出层。有两个隐藏层:卷积层(提取特性)和downsampling层(选择优化的特性)。

2.2。极端的学习机器

极端学习机(ELM)算法是一种新的快速学习算法。在训练过程中不需要调整,但只需要设置隐层神经元的数目,并找到最优的解决方案。相比与传统的分类算法如CNN-SVM [7),学习速度快的优点,泛化能力强,很少调整参数被发现。单隐层神经网络,假设 任意样本 ,在哪里 ,

如果有 隐层节点,单隐层神经网络可以表示为 在哪里 是一个激活函数, 输入体重, 输出的重量, 是偏见, 的内积吗 单隐层神经网络的学习目标是最小化误差的输出。它可以被认为是 这意味着,有存在 , , ,这可以被看作是吗

它可以表示为一个矩阵

为了培养单隐层神经网络,希望得到 , , 这使得 在哪里 ;它相当于最低损失函数

没有需要调整的参数在榆树算法。一旦输入重量 和隐藏层的偏见 是随机决定的,输出矩阵 隐层的唯一确定。

3所示。基于改进CNN-ELM识别的SAR图像

在卷积层图1图(map),特点是复杂的卷积核,和卷积的地图层输出通过激活函数卷积的结构。卷积层和downsampling层交替出现,和每个输出卷积地图层与输入地图。一般来说,卷积的输出层 在哪里 卷积层的层数, 卷积核, 是偏见, 是输入地图。 是激活函数。标准的CNN激活函数是乙状结肠函数可以表示为32]

乙状结肠函数的输出范围(0,1)的过程中调整权重;它是积极改变体重值之间的比例和上层的输出;当它趋向于零的一部分,减少或没有调整的重量调整将增加训练时间。从图2(一个),可以看出它的导数曲线,反过来,看起来像一个碗,这很容易导致梯度分散的问题。

因此,改善ReLU函数(23),它是一种不饱和非线性函数;很容易获得,实现网络的稀疏。从图2 (b),有些神经元的输出是0,这减少了参数之间的依赖,缓解了过度拟合问题,可以传播梯度在反向传播网络很好。与此同时,它可以减少梯度引起的色散的问题,加快网络的收敛速度。ReLU函数的公式

本文改进的CNN用于提取图像特征作为输入的榆树算法的识别精度。因此,SAR图像识别算法提出了基于改进CNN-ELM,以及算法的结构可以看到在图3

算法步骤如下所示。(1)输入的CNN:特区灰度图像去噪后,分割、边缘检测等操作(2)第一层:卷积SAR图像灰度由6过滤器的大小错综复杂 和偏见,然后由ReLU激活函数得到6特征图(3)第一downsampling层:意思是池中使用从上一步获得每个地图。在这一步中,意思是池的长度是2。这一步的目的是把图像的结构信息(4)第二次卷积层:这些地图是复杂的偏见和12过滤器的大小 ,然后他们被ReLU激活激活函数得到12地图(5)第二个downsampling层:意思是池中使用每个地图从上一步获得的。在这一步中,意思是池的长度是2。这一步的目的是得到图像的特征向量(6)榆树算法识别:步骤(5)得到的特征向量作为输入的榆树算法,和榆树训练函数和训练集用于创建和火车榆树;接下来,训练参数和榆树预测功能是用来测试测试集;最后,识别准确性的训练集和测试集

4所示。仿真实验与分析

4.1。仿真实验

所有实验进行了MATLAB和i7 2016 b - 8700 CPU和8 G内存。在这个实验中,数据从数据库姆斯塔。有十种目标图像包括2 s1, BMP_2, BRDM_2, BTR_60, BTR_70, D_7, T_62, T_72, ZIL_13_1, ZUS_23_4;他们的形状和SAR图像形状如图4。每个目标的SAR图像观察到四面八方。一般来说,抑郁症的SAR图像来自15°角是用来训练提出了CNN的架构,和抑郁症的SAR图像来自17°角是用来评估该方法的性能。

与光学图像比较,SAR图像包含大量的噪音;SAR图像预处理包括去噪、分割和边缘检测。这些图像将显示在图5。然后,SAR图像进行预处理和来自15°的俯角用作训练集;与此同时,抑郁症的SAR图像来自17°角作为测试集,细节表中可以看到1训练集的总大小是2747,和测试集的大小是2426。旁边,改进的CNN是用来提取的特征训练集和测试集,和获得特征向量提取。似乎这些向量作为输入的极端学习机(ELM)。榆树算法识别精度,通过识别和分类是相对于其他实验算法(算法在文献[7,25]);该算法的性能明显改善。

4.2。实验结果分析

精度的计算方法是10种SAR图像(2 s1, BMP_2 BRDM_2, BTR_60, BTR_70, D_7, T_62, T_72, ZIL_13_1, ZUS_23_4)的训练集和测试集,分别标有1、2,···,10标签作为原始的标签。榆树算法用于标签。如果标签测试的数量是一样的,原来的标签,然后加1,最后,每个标签的数量除以总数量的标签的准确性。特征提取时利用CNN是1.2秒,和榆树的识别是0.15秒,所以总时间约为1.35秒。

为了测试的性能提出CNN-ELM SAR图像识别的算法,比较是用主成分分析(PCA) (1),深卷积网络(宽带)4(SRC)[],稀疏表示分类2(中海壳牌)[],互补空间金字塔编码3),结合卷积网络和支持向量机(CN-SVM) [25],CNN-SVM [7)方法,分别。实验结果如表所示2

在表2,从每一种SAR图像的分类和识别,很明显,CNN-ELM的准确率明显高于其他方法;CNN-ELM的平均准确率为100%,其次是CNN-SVM(99.57%)、宽带(99.13%)、CGLF(98.56%)、中海壳牌(94.48%)、CN-SVM (94.38%)、SRC(92.70%),和PCA (92.43%)。尤其是具有类似CN-SVM[详细比较25]和CNN-SVM [7)如下。

与CN-SVM相比,准确率的CNN-ELM 2型s1高出5.47%,在类型BMP_2高出4.03%,在类型BRDM_2高出14.96%,在类型BTR_60高出2.54%,在类型BTR_70高出8.67%,在D_7类型,T_72, ZUS_23_4高出1.82%,在类型T_62高出8.79%,在类型ZIL_13_1高出6.2%,分别。

与CNN-SVM相比,这些五SAR图像的分类准确率(BTR_60, BTR_70, T_62、T_72 ZIL_13_1)已得到改进。另外,CNN-ELM的准确率BTR_60类型高0.01%,类型BTR_70高出2.34%,在T_62类型和T_72高出0.5%,类型ZIL131高出1%,分别。总的来说,改进CNN-ELM算法的识别准确率比CN-SVM高出5.62%,而且准确率也比CNN-SVM高出0.43%。实验时间很短,这表明该算法具有很强的可行性和可以进一步应用到其他对象的分类和识别。

5。结论

摘要CNN通过改善提高激活函数;改进的CNN是用于提取的深度特征10种SAR灰色图像去噪的过程下,分割和边缘检测。在这个过程中,这些SAR图像分类的榆树算法结合从CNN的特性。实验结果表明,CNN和榆树的结合具有高准确率和短时间内识别的SAR图像,这表明了算法的有效性,可以进一步应用到其他对象的分类和识别,特别是对一些图像的特征并不明显。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

支持的研究项目是由中国国家自然科学基金(批准号61127008),山西省自然科学基金(批准号。201801 d121026, 201701 D121012, 201701 d221121),以及中国的山西奖学金委员会(批准号2016 - 088)。