文摘

卷积神经网络(CNN)可以应用在合成孔径雷达(SAR)对象识别实现良好的性能。然而,它需要大量的标签样本的训练阶段,因此其性能可以大大减少,当标签样本是不充分的。为了解决这个问题,在本文中,我们提出一个新颖的活跃semisupervised CNN算法。首先,主动学习是用来查询最丰富和可靠的样品未标记的样本来扩展初始训练数据集。接下来,semisupervised方法添加一个新开发的正则化项的损失函数CNN。因此,类中包含概率信息未标记的样本可以最大限度地利用。MSTAR数据库上的实验结果证明该算法的有效性,尽管缺乏最初的标签样本。

1。介绍

合成孔径雷达(SAR)已经广泛应用于军事和民用领域由于其优点,如穿透能力强,适应恶劣的天气。SAR自动目标识别技术(SAR-ATR)旨在从SAR图像自动识别目标1]。随着越来越多的数据获得的SAR成像系统,SAR-ATR已成为研究热点之一。

SAR-ATR传统机器学习方法包括支持向量机(SVM) [2),局部纹理特征(3,4),字典学习(5,6),和稀疏表示7]。这些方法产生了一些有希望的结果,但他们严重依赖手工特征提取(8]。由于成像性质,杂波和SAR图像斑点噪声存在,这就增加了特征提取的困难尽管专家参与。

近年来,随着深度学习的发展技术,CNN已经收到了一个伟大的关注对象识别(9- - - - - -11]。它可以自动提取目标特征没有专家的干预。与传统的机器学习方法相比,CNN是更有效的和健壮的和已经成功地应用于SAR图像识别。在[12),CNN方法提出了提高SAR图像分类精度。实验结果表明,CNN方法优于伽柏特性采用支持向量机方法,显示出巨大的潜力的CNN对SAR图像识别。一个卷积网络设计13)自动提取SAR目标识别的功能。使用了卷积特性,实现了84.7%的准确性10 MSTAR数据集类型的目标。周et al。14]研究深度的应用卷积神经网络(DCNN)极化SAR图像分类的层次空间特征的图像可以由DCNN自动学习和分类精度明显提高。

可以发现,CNN在SAR图像识别做出了一个伟大的突破。然而,样品标签用于SAR图像仍然是费时的,和图像识别的准确性下降很快,当标签样本是不充分的。主动学习(AL)可以通过添加最有效的信息和可靠的未标记的样本标记训练集。因此,这将是一个很有前途的方法来解决上述问题。王等人提出了一个基地SAR图像分类方法基于支持向量机分类器(15]。最不确定的样本选择根据信心值,对虚拟全球战争的方法,实验结果表明,可以有效地提高分类精度,当标签样本是不充分的。Babaee等人提出了一个活跃的学习方法利用煤分类器的训练模式。这种方法选择样本的标签预计错误但分类器高度肯定,即第一某些错误的标签(FCWL)选择标准16]。Samat等人报道一个活跃的极端学习机(第十三次极化SAR图像分类方法。在这种方法中,利用支持基于后验概率的类作为选择标准。根据实验结果,该方法比现有技术更快的学习和分类阶段(17]。

主动学习方法有效地将最丰富和可靠的未标记的样本添加到训练集,其余的样品可能更少的信息和主动学习的使用可能会导致过多的计算复杂度。然而,其中包含的信息可以用来提高分类算法的泛化能力。Semisupervised学习(SSL)是一种有效的方法利用未标记的样本中包含的信息。常用的方法包括semisupervised SSL支持向量机(18),标签传播(19),和semisupervised集群。最近,SSL已经成功地应用于SAR图像识别。段等人介绍了semisupervised分类方法结合的可能性空间方法的训练和测试流程,未标记的样本可以有效地用于改善分类性能(20.]。克服数据的复杂性,很难创建一个精密地面真理,一个semisupervised冰水分类方法提出了基于自我训练(21]。通过整合空间上下文模型、区域合并,自我训练方法,该算法能够准确区分冰和开放的水在SAR图像使用非常少量的标签样本。在[22),未标记的样本分析的无监督聚类算法在使用所有可用的信息。除此之外,每个样本被监督分类方法使用可用的信息在当前阶段的集群。SAR图像上的实验结果表明,该semisupervised方法导致有前途的分类结果。

最近,灵感来自CNN的优越性,,和SSL,三种方法的结合已经成为一种研究趋势。例如,一个深度的主动学习方法和semisupervised CNN建立了(23- - - - - -25]。实验结果证明了这些方法的有效性,为高光谱或光学图像识别。然而,我们已经看到许多问题从SAR图像,例如,特征提取困难,耗时的样品标签,标签样本不足。发达的技术很少应用于SAR图像识别。摘要小说活跃semisupervised CNN算法提出了SAR图像识别。首先,最有益的和可靠的样本选择的主动学习方法的标签使用信息熵判据。我们相信信息熵可以用来有效地测量未标记的样本的可靠性,它可以根据CNN的输出计算框架。然后,剩余的未标记的样本的类概率信息获得的输出将softmax CNN的层。之后,类概率信息设计作为正则化项和添加到损失函数CNN的培训目的。由于类概率信息可以有效地控制的影响未标记的样本在训练过程中,未标记的样本都在这个阶段使用。

本文的其余部分安排如下。节2介绍了卷积神经网络。部分3详细描述了该方法。然后执行实验部分4。最后,我们总结一下本文的部分5

2。卷积神经网络

CNN多层神经网络结构,主要由一个输入层、一个卷积层、汇聚层,和一个输出层,卷积和池层是隐藏的。输入层用于接收来自原始图像的像素值。卷积层提取图像特征,利用卷积内核。池层使用本地图像相关性减少要处理的数据量。输出层提取的特征映射到相应的标签。CNN的培训是由两种方式:向前和向后传播。

2.1。向前传播

图像的映射过程在CNN是一个向前传播的过程,在前一层的输出作为电流的输入层。为了提供一个完整的版本的线性模型,非线性激活函数添加到映射过程中每一层的神经元。因为第一层只接收图像的像素值,没有激活功能。第二层的CNN,非线性激活函数。每一层的输出可以表示如下: 在哪里 表示 层。如果 , 图像的像素值矩阵。如果 , 代表了特征映射矩阵 ,提取是哪一个 层, , , 代表权重矩阵、偏差矩阵和加权输入的 层,分别; 是非线性激活函数,选择和修正的线性单元(Relu)。假设 ;的 层是输出层 表示最终的输出向量。

2.2。反向传播

标准的反向传播(BP)算法来更新参数 CNN (10]。BP算法是一种监督式学习的方法,首先构造一个代价函数基于实际的和预期的输出,然后一个梯度下降法(GD)是用于更新 成本函数的梯度下降方向。在细节中,我们假设 代表CNN成本函数结构。输出层的误差向量可以表示如下: 向后传播的过程中,误差向量 层可以从误差向量 输出层。因此,误差向量 对于每一层可以通过链式法则计算如下: 的象征意义 是阿达玛产品(或舒尔产品),表示两个向量的element-wise产品。的梯度 是用 ,分别。的偏导数 可以计算使用(1)和(3): 的变化值 可以通过计算 在哪里 代表了学习速率。

2.3。输出层

如果在输出层神经元的数目N最终,CNN将输入图像划分为 类别。在正向传播过程中,输入的输出层 ,因为将softmax激活函数的输出提供了每个类的概率样本所属。因此,与CNN的中间层,我们使用将softmax激活函数而不是Relu函数在输出层,这是该方法的关键。输出归一化,将softmax函数,它可以表示为 在哪里 的输出是什么 输出层神经元和 是将softmax函数的参数。很明显, ,如果一个项目增加,所有的其他物品将相应减少。

3所示。该方法

首先,我们在本节定义要使用的符号。训练数据集 由两部分组成: ,在那里 代表了标签样本和的集合 代表未标记的样本集。 训练样本的数量。提议的方法的训练过程由两个阶段组成。如图1首先选择的信息最丰富的和可靠的样品标签主动学习方法基于信息熵。然后从剩下的样品提取的类概率信息设计作为正则化项,这将被添加到CNN损失函数进行再培训。训练过程结束时,未标记的样本去美国有线电视新闻网获得的标签可以从CNN将softmax层计算。

3.1。主动学习

提高分类模型的健壮性有标签样本不足,有必要扩展初始训练集。尤其是对CNN模型与大量的参数,该模型将在泛化如果过度拟合和弱标签样本是不够的。因此,一个活跃的学习方法是用来增加训练样本的数量。

CNN模型本文采用如图2Conv,马克斯池,平代表卷积层,二次抽样层,分别和完全连接层。首先,CNN使用最初标记训练样本。之后,未标记的样本进入CNN,每个未标记的样本的信息熵计算使用的输出将softmax层。信息熵度量样本的不确定性。信息熵的值越大,样本的不确定性就越大。换句话说,如果样品离分类面,属于一个特定类别的样本的概率更均匀。

每个类的概率样本所属的表示 (获得的,可以6)。然后,未标记的样本的信息熵 可以通过计算 提取信息最丰富的样本,顶部 未标记的样本选择的最大信息熵和手动贴上标签。然后他们被添加到初始训练集。因为小样本的确定信息熵值高,CNN模型得到的标签被认为是可靠的。因此, 选择小样本熵,并贴上CNN。然后这些样本添加到初始训练集。在这一点上,训练集是扩大。

自初始标签样本很小,CNN的能力模型测量样本的不确定性较弱,这可能会导致一个大的偏差。因此,而不是选择 样本,以迭代的方式更合理的选择。在培训过程的开始,时代都很小,因为标签样本是不充分的。训练集的增加,CNN时代可以逐渐增加。在本文中,我们选择时代按照下列规则: 在哪里 表示积极的迭代学习算法 在每个迭代中表示CNN的时代。

当一定数量的未标记的样本已手动选择,剩下的样品应该是可靠的。如果我们继续选择未标记的样本基于主动学习的方法,提高泛化能力的分类精度和CNN没有保证。因此,一定数量的未标记的样本后手动贴上标签,应终止迭代。CNN的主要缺点是,培训过程花费了太多的时间。为了实现之间的一种权衡未标记的样本的数目和算法的复杂性,应选择适当的迭代。

3.2。Semisupervised学习

尽管剩下的未标记的样本的不确定性并不重要,样品中包含的类概率信息可以用来改善CNN泛化能力。我们设计一个正则化项基于类概率信息的未标记的样本,这是添加到CNN损失函数。CNN的常用的成本函数包括二次成本函数、熵函数,成本和日志可能性成本函数。当将softmax层用作输出层,日志可能成本函数是简单和有效的。日志可能性成本函数的表达式如下: 在哪里 代表的输出 th在输出层神经元的输入样本 代表的期望值 神经元。 表示实际的矢量和预期的输出将softmax层,分别。

最大的类将softmax概率输出层是用于设计正则化项。的最大输出将softmax层相关的未标记的输入样本 表示如下: 未标记的样本表示的正则化项 在哪里 表示未标记的样本的标签分配由CNN。 扮演的角色约束。更高的价值 表明样本在训练过程中扮演更重要的角色的CNN模型。引入正则化项后未标记的样本,我们有成本函数如下: 在哪里 是权重参数。

,输出层的误差向量 ,输出层的误差向量 根据(1),(13)和(14),修改后的成本函数的灵敏度可以获得 的误差向量输出层,每一层的敏感性可以计算使用(3)迭代,每一层可以根据更新的参数(4)和(5)。

4所示。实验

我们执行实验在移动和静止目标获取与识别(MSTAR)数据库,得到国防研究规划局(DARPA)和美国空军研究实验室(AFRL)。十种MSTAR数据库中的车辆目标选择在我们的实验中,也就是说,2 s1, ZSU234, BMP2, BRDM2, BTR60, BTR70, D7, ZIL131 T62, T72。每个类型的SAR和相应的光学图像如图所示3。表1列出目标芯片的详细信息参与这个实验。

4.1。主动学习方法的有效性

我们选择5%的样本作为初始标记训练集用于训练CNN。基于信息熵的主动学习方法是利用扩大以迭代的方式标记训练集。在每次迭代过程中,主动学习方法手动标签8和样品最大信息熵和10个样本的最小信息熵由CNN贴上标签。为了演示主动学习方法的有效性,我们比较它与随机选择方法,8未标记的样本是随机选择和人工标注在每个迭代。上述两种方法的分类精度随迭代,如图4。显然,主动学习方法的分类精度高于随机选择的方法。因此,它确认主动学习方法可以更有效地选择未标记的样本。然后添加到所选样本训练集,这有利于提高分类精度。

4.2。Semisupervised学习方法的有效性

扩张后的初始标记训练集,利用semisupervised学习方法获取正则化项基于剩余的样本,然后将其添加到CNN的成本函数。为了演示了正则化方法的有效性,我们比较没有任何正则化方法。比较的结果显示在图5。可以看到,正则化方法的分类精度高于那些没有正规化。正则化方法的收敛速度也更快,因为没有任何正则化方法需要100时代收敛,但正则化方法只需要80时代。因此,它验证的正则化方法能够利用未标记的样本中包含的信息,有助于提高分类精度,该方法的收敛速度。

4.3。与其他方法相比

在本节中,我们比较我们的方法的性能与CNN (13),标签传播(LP) (19),和进步semisupervised SVM与多样性(PS3VM-D) [18]。CNN是一个完全监督算法只利用标签样本训练分类模型。LP和PS3VM-D都semisupervised方法。LP建立相似矩阵和传播的标签贴上样品未标记的样本根据相似的程度。PS3VM-D选择可靠的未标记的样本扩大初始标记训练集,比较结果如图6

我们发现,我们的方法优于CNN方法显著标签样本不足,这是由于我们主动学习和正则化策略。CNN方法的泛化能力弱是由于小数量的标签样本。增加的标签样本,CNN方法的分类精度逐渐增加,并最终我们的方法是一样的。此外,我们的方法的分类精度优于其他两个semisupervised方法。LP和PS3VM-D pseudolabels分配给未标记的样本;然而,如果pseudolabels是错误的,标签将有负面影响后续分类器的训练过程。相比之下,我们的方法利用未标记的样本通过设计基于类概率的正则化项信息;然后正则化项添加到损失函数CNN的培训目的。总之,我们的方法是有效的,具有很强的泛化能力尤其是标签样本是不充分的。

5。结论

CNN已经在图像识别领域取得了巨大的成功。提高SAR图像的分类精度,当标签样本不足,提出了一种新的主动semisupervised CNN方法。首先,我们查询最丰富和可靠的样本利用主动学习方法,然后semisupervised正规化设计基于剩余的未标记的样本。总结了本文的主要贡献如下:(1)我们使用了主动学习方法选择最有益的和可靠的样本,分别由CNN手动贴上标签,。因此,过度拟合的问题是由选定的样本添加到最初的训练集。(2)我们设计了一个基于类的正则化项的概率信息未标记的样本,然后正则化项添加到CNN损失函数进行再培训。因此,CNN的分类精度和泛化能力是有效改善。

从实验结果中,我们观察到,我们的方法是有效的,具有很强的泛化能力尤其是标签样本不足;例如,我们的方法的分类精度为95.7%时标签样本的数目是236,这是明显高于其他方法使用相同数量的标签样本。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是由中国国家自然科学基金(61771027;61071139;61471019;61171122;61501011;61671035),中国的航空科学基金(20142051022)和初步项目(9140 a07040515hk01009)。部分大肠博士支持杨RSE-NNSFC联合项目(2017 - 2019)(6161101383)与中国石油大学(华东)。h .周博士是英国由EPSRC资助下EP / N508664/1 EP / R007187/1和EP / N011074/1和皇家Society-Newton先进格兰特NA160342下奖学金。