文摘

合成孔径雷达(SAR)的一个重要和重要方法获取目标在遥感领域的特点,已经应用于许多领域包括智能搜索、地形测量、映射和地质调查。在SAR领域,SAR自动目标识别(SAR ATR)是一个重要的问题。然而,另一方面,它也有很高的应用价值。深度学习的发展使得它能够被应用到SAR ATR。一些研究人员指出,现有的卷积神经网络(CNN)更加关注纹理信息,通常不如形状信息。所以,本研究设计了enhanced-shape CNN,这增强了目标形状的输入。此外,它使用一种改进的关注模块,这样网络才能突出在SAR图像目标形状。针对小规模的问题现有的SAR数据集,一个小样本进行实验。Enhanced-shape CNN达到99.29%的识别率,整个训练集上训练时,虽然89.93%的八分之一训练数据集。

1。介绍

高分辨率雷达图像的距离和方位可以通过合成孔径雷达(SAR),其中包括合成孔径原理、脉冲压缩技术和信号处理技术。与光学和红外传感器相比,SAR白天和晚上的优点,全天候,穿透云层和植被等障碍的能力(1- - - - - -6]。随着SAR成像分辨率SAR已经多样化利用在军用和民用领域,如海洋、土地监测(7),和武器指导(8]。因此,SAR自动目标识别(SAR ATR)变得有意义和具有挑战性的研究领域。

麻省理工学院林肯实验室提出了SAR ATR划分为三个子系统:检测、歧视,和分类(9]。目标检测的任务是确定图像包含感兴趣的目标,找到图像中目标的位置。在歧视阶段,鉴别器旨在解决两分类问题(目标和杂波),并可以显著减少误报的可能性。然后真正的目标是分类的分类和识别阶段。

本文只着重于分类和识别阶段,不包括检测和歧视。有三种主流的识别方法:基于模板,基于模型和深度学习。对于模板匹配,测试样本与某些匹配标准模板库,这是由标记训练集(10,11]。基于模板的方法很简单但是需要建立大量的模板库和模板库的质量对识别结果有很大的影响。

由于unrobustness模板匹配方法,提出了一种基于模型的方法。的方法提取有效特征训练样本和测试样本,然后从SAR图像中提取特征送入分类器进行识别(12- - - - - -15]。SAR图像的特点主要包括几何特征、转换特性和电磁特性。几何特征描述目标的形状和结构,如轮廓、边缘,大小和区域。主成分分析(PCA) (16),核主成分分析(KPCA) [17),线性判别分析(LDA) (18),独立分量分析(ICA) [19),和其他手段都是转换特性,也申请了SAR目标识别。由于独特的SAR成像机理,SAR图像有独特的电磁特性20.,21包括偏振模式和散射中心。特征提取后,分类器对于特性是必要的。再(事例),支持向量机(SVM)和稀疏表示分类(SRC)是常用的SAR识别分类器。

虽然深度学习各领域应用多年,大量深学习方法也出现在SAR ATR。陈等人。22)建议完全连接层卷积神经网络(CNN)被替换为卷积层,有效地抑制过度拟合的问题,减少了参数的数量。由于SAR图像高度敏感的方位角,周et al。23)结合三个连续的相同方位的图像目标作为一个伪彩色图像输入,输入CNN。王等人。24)设计了一个多视图卷积神经网络短期和长期记忆网络(CNN-LSTM)提取和融合的特性从不同的相邻的方位角度。Zhang et al。25与CBAM]利用CNN,这是一个注意力机制来提高识别率。深度学习方法可以提取目标的深层语义信息。与基于模型的方法相比,它不需要手动提取特征,取得了较高的识别率在SAR目标识别领域。

CNN最近,有一个观点,不同于人类,更倾向于学习目标的纹理和表面特征但少关注深层语义特征,如轮廓和形状。轮廓和形状是最可靠的信息在人类和生物的愿景。Geirhos et al。26]表明,图像Net-trained cnn强烈偏向识别的纹理,而不是形状,这是人类行为的证据形成鲜明对比,揭示了从根本上不同的分类策略。赫尔曼et al。27]表明,out-of-distribution测试集上的性能模型,喜欢形状而非纹理图像的分类比基线。

因此,本文提出了一个enhanced-shape CNN的网络结构如图1。首先,enhanced-shape CNN加强输入目标的形状特征,构建一个三通道伪彩色图像数据集,所以卷积神经网络可以倾向于更加关注目标的形状。第二,cnn的池通常使用最大池和平均池、和目标信息很容易丢失时将采样特征图。因此,我们使用SoftPool [28),而不是马克斯池来提高网络。与此同时,在上述文献,一些注意力机制结合cnn已经应用到SAR的认可。频道关注模块机制,即。Squeeze-and-Excitation (SE)模块(30.),可以有效地提高信道权重,有利于识别和抑制功能,在cnn不太有用。然而,SE模块权重分配渠道更均匀地在目标识别中,这样在本质上是一样的CNN,正如文献[29日]。因此,SoftPool是全球池利用取代,从而获得通道不平衡重量。第三,它仍然是麻烦获取SAR图像数据集相对富裕的成像条件,尽管收购高分辨率SAR图像变得更容易了。这些年来,大量数据集的SAR船舶和车辆已经出现,但他们的决议并不足以被认可;因此,数据集用于检测。目前,大多数研究的SAR目标识别是基于移动和静止目标获取与识别(MSTAR) (31日)数据集。从减少样本的角度,本文设计实验来验证该方法具有更高的识别率比现有的方法在有限的数据集。

本文的主要贡献如下:(1)构建一个三通道伪彩色图像,提取目标的特征和形成的影子从原始SAR数据集,过滤原始SAR图像和原始SAR图像。伪彩色三通道的图像输入到CNN,提高模型使用图像的形状信息。(2)改善网络的池和全球关注模块的池。使用SoftPool网络可以增加信息的特征映射在池。同时,SE的池模块改进提高信道的重量分布不同,而不是平衡。(3)整个训练集训练,训练集的一半,四分之一的训练集,八分之一的训练集和测试完整的测试集基于MSTAR数据集。它是证明了本文提出的方法可以获得更高的识别率和一些样品。

本文的其余部分组织如下:部分2描述了该方法的原理,包括目标和阴影的提取方法,李滤波器的原理,和三通道伪彩色图像的融合。和小说池方法(SoftPool),紧缩和励磁模块和增强SE模块。部分3介绍实验结果验证该网络的有效性和部分4总结了纸。

2。方法

在本节中,我们将描述在我们的模型中使用的一些原则和结构。

2.1。提取目标和阴影

与光学图像不同,SAR图像侧视成像,图像中有阴影除了目标。影子是相互耦合的结果目标和背景环境下特定的雷达视线,和它的形状反映了身体大小和形状分布的目标,结合目标和阴影的共同特征是识别更有帮助。

有许多现有的分割算法提取目标和阴影。我们的模型的重点不是分割算法;因此,最简单的阈值法分割目标和阴影区域。我们的阈值设置是基于本文提出的阈值(32]。主要步骤如下:(1)平衡的原始SAR图像直方图;(2)使用均值滤波来平滑步骤1的结果,和转换的灰色动态范围[0,1];(3)阴影和目标区域的阈值设置为0.2和0.8,目标区域像素大于0.8,和那些小于0.2的阴影区域;(4)删除总像素的面积小于25减少背景噪音的影响;(5)利用形态学合闸操作连接目标区域和阴影区域,获得一个平滑的目标和阴影轮廓。

可以看出,一个简单的阈值方法可以实现良好的分割结果和删除大量背景噪音和混乱。然而,在现实世界的情况下,常见的分割算法可能无法细分目标和阴影,所以我们设置阈值0.1和0.9,0.3和0.7,分别验证稍微偏向分割算法更有效。

2展示了目标和阴影图像得到不同的分割阈值。(一)原始图像。(b)描述目标和阴影的形态图像阈值设置为0.8和0.2。(c)中的目标和阴影提取相对完整,和阴影的像素值太低是清晰的。相对,提取目标区域(d)是多余的,在(e)它是不完整的。

2.2。李过滤

由于其特殊的成像机理、SAR图像包含更多相干散斑噪声。过滤后的SAR图像,可以增强目标的形状特征,纹理,特别是噪声的干扰,可以减少。

散斑噪声,许多SAR图像的斑点噪声滤波方法。我们的模型利用李过滤,这是一个典型的SAR过滤策略。噪声抑制的两个关键方面,一方面,建立一个真正的后向散射系数的评估机制,另一方面,制定选择像素样本同类地区的计划。

李过滤是一种典型的散斑图像过滤方法使用当地的统计特征。它是基于一个完全开发的散斑噪声模型。第一,一个窗口选择一定长度的当地。然后,假设之前的意思 和方差 可以计算通过计算当地的意思吗 和方差 在哪里y——选择窗口中的值。窗口大小N本文选择的是7。

它可以看到从图3散斑噪声的图像显著降低,和纹理特性的目标和阴影部分减少,但轮廓形状是李过滤后更加明显。

2.3。融合

通常情况下,SAR图像的灰色图像。当认识到SAR图像与CNN,灰度图像通常转化为三通道图像输入。摘要原始图像结合的形象目标和阴影和过滤图像RGB模式形成一个三通道伪彩色图像,如图4。原始图像可以包含完整的目标信息包括形状、轮廓和纹理,而的形象目标和阴影和过滤图像可以提高目标形状特征。使用伪彩色图像作为网络输入可以获得全球信息和深层语义信息,而不是专注于纹理信息。

2.4。SoftPool

SoftPool被我们网络减少目标信息的损失。池用于CNN减少特征图的大小来实现本地空间不变性,增加接受域卷积。目前,神经网络中最常用的是马克斯池和平均池,将失去映射中映射的信息功能。因此,文献[28]提出SoftPool减少信息的损失,同时限制的计算和内存开销。

SoftPool是可微的。池内核k k,我们假设池操作的输出 ,相应的梯度 ,R是最大近似激活区域,每个激活吗 与指数对应于一个重量 重量 是自然的活化指数的比值之和在附近所有激活的自然指数R:

重量加上相应的激活值作为一个非线性变换。更高的激活比低主要激活。SoftPool后的输出值是所有加权求和得到的激活内核社区的标准R:

SoftPool培训更新阶段,梯度更新成正比的重量计算向前传播的过程,也就是说, 它是意识到较小的梯度更新激活小于梯度更新更大的激活。正向传播和反向更新SoftPool如图5

max池和平均池相比,SoftPool可以平衡的影响平均池和最大池,尽管平均池降低激活在该地区的影响,和最大池只选择最高的激活区域。对于SoftPool,所有在这个区域激活导致最终的输出,和更高的激活主导下激活。因此,在CNN的池,一个更大的激活值输出,有更大的影响和重要的细节特征映射可以最大程度保留。

6给的影响不同的池。第一列是原始图像,第二列是图像最大池后,第三列是图像平均池后,第四列是SoftPool后图像。比较表明,马克斯池激活像素点与大灰值在该地区,强调目标,以及强调分散噪音。池平均近似过滤,减少噪声的影响,但削弱目标的结构形状信息。SoftPooling,另一方面,保留目标的相对完整结构信息,去除散射噪声的影响,使形状更突出。

2.5。SE模块和增强SE模块

典型的美国有线电视新闻网的核心是卷积算子,并输入特征映射映射到新特性映射通过卷积的内核。卷积层,上一层的特征图谱被认为是为下一层有相同的重量,但研究[30.表明情况并非如此。平等的机制限制了卷积神经网络获得更多的信息。因此,文献[30.]提出SE模块,它主要关注渠道之间的关系,希望该模型能自动学习不同的信道特性的重要性。

SE模块的网络结构如图7。输入特性映射张量X: ,在哪里W×H代表的长度和宽度特征地图,和C代表输入通道的数量,SE模块执行一个挤压操作X获得全球通道级特性,然后执行一个激发操作在全球特征学习每个通道之间的关系,得到权重不同的渠道。最后,输出特性图 乘以权重计算和输入功能地图吗X

如前所述,SE模块包括两个步骤:紧缩和激励。的挤压 ,全球平均池是整个空间功能应用于编码通道作为全球功能。池平均特征映射的输入张量X挤压操作后,输出 ,表示的车车值向量z。之间的映射关系X 如下: 在哪里 代表了特征映射张量车车通道的输入X。挤压操作得到了全球描述特性,然后激发操作执行。 在哪里 , ,r是一个固定hyperparameter, 是乙状结肠激活函数,年代表示学习重量不同的频道。第一个FC层起到降维的作用,最后FC层恢复特性映射到原始尺寸。紧缩和激发后,通道重量,最后,重量乘以原特征张量。 在哪里 代表的重量 代表他们的产品。

从本质上讲,SE模块执行注意操作的通道尺寸。这种关注机制允许模型更加关注最多的信道特性信息,同时抑制那些不重要的信道特性。然而,这种优势并不是直接反映在MSTAR SAR数据集上的实验。从本文可以看出29日SE)通道的权重计算的模块都接近于1,不反映渠道的重要性。

全球池对整个执行马克斯池或平均池特性映射到获得1×1×C向量,但是这也将失去功能的信息。因此,我们认为全球池SE模块的替换为SoftPool确保主要特点映射具有很高的重量。图8给这两个特征矩阵的计算结果在全球池和软池。(1)可以表示目标的边缘信息,包含更多的信息比(2),但是这两个矩阵都相同的计算结果,这两个4,在全球池,不能区分渠道的重要性。当权重矩阵乘以特征矩阵使用软池后,(1)的输出是5.724,和3.69(2)的输出,使特征矩阵包含更多的信息有更大的重量和频道解决统一问题的SE模块的重量分布。

2.6。分析Channel-Wise激活地图

因为深度网络容易导致过度拟合与几个样本进行训练和识别时,本文构建了一个简单的CNN。网络的结构设计如图9。(a)是基本的CNN网络,和(b)的形状是增强网络中使用。

10说明了从网络地图的可视化特性分别使用SE模块和使用SoftPool-SE模块。SoftPool-SEnet明显突出某些渠道相比SE模块。

1116的地图显示了添加不同的模块在第一卷积层。与功能图(a), (b)明显消除了纹理信息带来的背景噪音,增强了网络的注意目标的形状。特征映射(c)中增加了大量的信息,在SoftPool用于网络。(d)中的网络使用普通SE模块,但与特性(d)的地图相比,有更多的黑像素,和更多的信息丢失。明亮的像素(e)的目标是增加因为增强SE模块的使用。

2.7。Enhanced-Shape CNN的配置细节

卷积层地图的输入一个新特性映射与卷积内核执行的本地感知目标。池层是减少二次抽样可训练的参数。为了防止下降等问题的收敛速度和泛化性能的不同分布训练集和测试集,我们采用了批处理标准化的网络。

卷积层,一步是设置为1,没有空间零填充用于卷积层。与此同时,采用ReLU非线性激活函数。前三个卷积的每一层是紧随其后的是一层软池的池大小2×2和1的步伐。输入enhance-shape图像的大小是128 128年。第一次卷积后层,卷积核的大小是5×5,输出特性图的大小是124 124年,它们的大小成为62×62后池层的第一层。62×62过滤输入图像的卷积核的大小6×6第二卷积层,导致特征的地图大小57×57。在第二次池、大小的特征映射成为28×28。此时,28日×28特性输入映射到SoftPool-SE模块,和学习渠道有不同的权重,而输出特性图的大小仍然是28 28。第三卷积过滤器内核层的大小7×7,地图大小22×22生产功能,成为11×11后池和SoftPool-SE模块。最后一层是7的卷积核 7,5×5地图的功能。最后,通过两个完全连接层和softmax分类器,10向量得到对应于类概率。

摘要交叉熵损失,损失函数和优化算法使用随机梯度下降法,动量参数0.9和0.005的重量衰减参数。随后,最初学习率是0.001,降低了0.5倍20世纪后,在时代表示每个例子都有培训期间使用的次数。最后,批量大小设置为8。

3所示。MSTAR数据集实验

3.1。数据集描述

本文的实验数据集是MSTAR公共数据集,所有图片的分辨率为0.3米×0.3米,和使用的偏振模式是HH极化模式。数据集包含成千上万的SAR图像,包括军事目标的不同类别,方面角度,角度和抑郁,其中只有一小部分是对外公开的。他们收集的X乐队,全方面覆盖的范围(0°~ 360°)。

披露的数据集包含十种地面车辆目标:装甲人员输送车(BMP-2, BRDM-2、BTR-60 btr - 70);坦克(t - 62 t - 72);火箭发射器(2 s1);防空单位(zsu - 234);卡车(吉尔(- 131);推土机(D7)。图12显示的例子十种目标和相应的光学图像。

当MSTAR SAR ATR中使用数据集,通常分为标准操作条件(SOC)和扩展操作条件(转换端)。SOC意味着目标配置和测试集和训练集的序列号是相同的,和抑郁的角度是不同的但很接近。转换端表明有很大差异测试集和训练集,包括目标配置和图像清晰度。

SOC是一个数据集,包括图像的成像条件17°俯角作为训练集,和15°俯角作为测试集。每个类别测试和训练样本的数量和总数量的样本如表所示1

除了SOC的数据集,我们也建立了一些曲线端数据集。配置更改是指添加或删除部分车辆,比如T72是否有油柜后面的车辆。在本文中,这两个变化被称为EOC-1 EOC-2,即。、配置变异和版本的变异。EOC-1的特定信息和EOC-2数据集表中列出23。训练集是BMP2、BRDM-2 btr - 70和T72 17°抑郁,和测试集只包含变异的T72 15°抑郁和17°萧条。的训练集EOC-2 EOC-1一样。测试集包含变异的T72和BMP-2。

此外,MSTAR的限幅图像比率高达30分贝,但大多数图像在实际情况下含有噪声。我们设置EOC-3数据集,这增加了噪声对MSTAR数据(33模拟一个嘈杂的情况。添加噪声的方法如下: var是方差算子。结果如图13

3.2。SOC的结果

4显示了一个混淆矩阵的行表示实际的目标类别,和列代表了预测目标类别。这是观察到所有目标的识别率达到96%以上,和整体识别率达到了99.29%。每个方法的识别率是列在表中5。与其他方法相比,我们的方法得到了最高识别率,验证了该方法的有效性。

为了验证enhanced-shape CNN也可以获得更好的识别一些示例数据集,我们将训练集的100%,50%,25%,和12.5%,分别,而测试集的大小是相同的计算识别率。比较网络使用基本的CNN网络图中指出9

如表所示6在整个训练集的情况下,enhanced-shape CNN识别率达到99%以上,这基本CNN相比并没有太大的改善。当我们只使用50%,25%和12.5%分别训练集,会有相应的增长了1.18%,2.23%,4.56%。与实验结果相比其他方法在小样本数据集,本文提出的方法也远优于其他方法。

由于MSTAR数据集的标准,它是相对简单的部分目标和阴影区域,但实际情况往往是更复杂的,所以目标和阴影可能不是完全分割。为了验证算法的鲁棒性,我们可以做阈值分割时略有偏差。偏差的图像已经给出的数据2 (c)2 (e),对应于分割阈值设置为0.1和0.9,0.3和0.7,分别。

图中可以看到14即使分割算法并不理想,我们的方法仍有更高的识别率比CNN少量的样本。的形状和阴影区域提取突出的目标,提高网络的学习目标信息。因此,即使在分割算法是稍微倾斜,它仍然可以取得更好的识别结果比原来的数据。

3.3。由于转换端

本文对两种类型的识别精度测试数据集,EOC-1 EOC-2,进一步测试的有效性提出了改进识别方法。测试混淆矩阵如表所示78。根据实验结果,提出的方法在EOC-1和EOC-2数据集都取得了良好的识别结果。EOC-1下的识别率达到99.3%,而它在EOC-2达到98.85%。这说明当目标略有变化,如油箱的添加或删除,网络可以实现更好的识别结果。

15显示的对比曲线识别利率获得的两个网络在训练集大小不同的不同的声音。可以看出,我们提出的方法取得了较高的识别率比普通CNN在不同的数据质量。当信噪比−5 dB和−10 dB, enhanced-shape CNN的识别率,使用12.5%的训练集,相比提高了近20%,在CNN。

3.4。烧蚀实验

为了验证不同模块对模型的性能的影响,本文也进行了烧蚀实验。我们设置不同的输入,分别选择原始图像,过滤的图像,并提取目标和阴影图像,融合图像,验证的数据增强融合多个特性是有效的。

16展示了几个输入获得的认可率。一个过滤图像的识别率和分割图像融合后低于。只输入分割图像的时候,发现识别率低于原始图像的输入。这是因为我们提取目标和阴影区域只有加强网络的关注目标和阴影。如果只输入目标和阴影,将目标信息不完整由于分割算法,所以没有输入原始数据高识别率。

17使用单个模块显示了识别率。可以看出,本文中使用的不同的模块对模型的识别精度产生影响。

4所示。结论

SAR ATR已成为一个重要的和有前途的遥感图像处理领域。从形状的角度提出了一种方法增强滤波和增强目标区域的输入和合成加强之间的联系渠道。同时,由于普通池是减少信息损失SoftPool在CNN的应用。此外,SE模块已得到改进,强调突出的渠道识别结果。因此,更多的目标信息获取几个样品。实验验证了该方法的准确性,可以达到99.29%的精度对十种目标,分割效果不好,这是更接近实际情况,它比CNN也有更高的性能。本文还证明了该方法的鲁棒性噪声。对于不同程度的噪声,该方法大大提高了CNN相比有一些样品。本文提出的基本方法可以继续在未来探索平衡纹理特征和形状特征的方法和指导网络的定向培训基于注意机制。

数据可用性

使用的数据来支持本研究的结果包括在本文中。

的利益冲突

作者宣称他们没有相互竞争的利益。

确认

作者没有收到具体的资金。