杂志上的传感器

在这一页上

文摘介绍分析结论数据可用性的利益冲突确认引用版权相关文章

研究文章|开放获取

体积2019年| 文章的ID6134610| https://doi.org/10.1155/2019/6134610

方法结合CNN和榆树SAR图像的特征提取和分类

彭王 ,¹ 小民张,¹ 和燕郝¹

学术编辑器: 爱德华·Llobet

收到了 2019年1月25日

修改后的 2019年10月04

接受 2019年10月31日

发表 2019年11月28日

文摘

由于大量的乙状结肠激活函数推导在传统的卷积神经网络(CNN),很难解决的问题的低效率提取合成孔径雷达(SAR)图像的特点。CNN的乙状结肠激活函数改进是解决线性单元(ReLU)激活函数,和修改分类器的极端学习机(ELM)。最后,在这个CNN模型,改进后的CNN是特征提取器和榆树执行识别器。SAR图像识别算法基于CNN-ELM算法结合CNN和榆树的算法。实验进行移动和静止目标获取与识别(MSTAR)数据库包含十种目标图像。实验结果表明,该算法可以实现网络的稀疏,缓解过度拟合问题,加快网络的收敛速度。值得一提的是,这个实验的运行时间很短。与其他实验相同的数据库相比,这表明该实验产生了更高的识别率。SAR图像识别的准确性为100%。

1。介绍

合成孔径雷达(SAR)是一种重要的获取信息,并广泛应用于地质调查、地形测绘、海洋资源利用,等等。的原因是值得探索在未来由于其巨大的实际应用。

SAR图像识别总是似乎为研究火锅,在获取信息的过程中,特征提取是一个成功的关键因素之一图像目标识别系统。Mishra和Mulgrew首先提出的应用主成分分析(PCA) SAR图像分类。实验移动和静止目标获取与识别(MSTAR)数据库基于主成分分析表明,该分类器比偏差分类器基于高斯模型的训练数据有限的情况下(1]。膝盖等人提出了一个自动分类方法使用图像分区和稀疏表示的特征向量生成SAR图像(2]。王等人提出了一个互补空间金字塔编码(中海壳牌)方法的框架空间金字塔匹配。编码系数和编码残差都是探索开发更多的歧视和健壮的特性代表SAR图像(3]。陈等人提出了深卷积网络(宽带)为目标的SAR图像分类,可以达到平均99%的分类精度ten-class MSTAR数据库的目标(4]。丁等人提出的方法结合全球和本地过滤器(CGLF) SAR目标识别标准操作条件下和各种扩展操作条件,可以被看作是一个标准的比较(5]。

卷积神经网络(CNN)是一种前馈神经网络包括卷积计算和深层结构。这是一个深度学习的代表算法(6]。CNN在许多领域得到了广泛的应用。尤其是在识别领域,CNN用于手写数字识别(7,8),语音识别(9,10),面部表情识别(11,12)、人脸识别(13,14),冰箱果蔬识别(15),验证码识别(16),交通标志分类(17和识别18),等等。在图像识别领域,以下图片可以直接输入的CNN,这减少了实验的复杂性。此外,图像信息可以通过向前传播到卷积层由CNN和downsampling层。与此同时,它可以处理在不同的网络层,避免了提取过程的复杂特性在传统算法。图像的最基本特征可以通过访问CNN的神经元在当地传感领域。CNN仍然是一个高度的不变性在提取图像的复杂特性,不管转变,缩放、变形、旋转、或其他形式的变形图像的(19]。Cireşan等人建立了多列深层神经网络应用于混合国家标准与技术研究所的数据库(MNIST)手写数据库,它有一个很好的识别效果(认可率小于0.3%)20.]。因此,美国有线电视新闻网是一个更好的图像特征提取器。

近年来,美国有线电视新闻网也被成功地应用于雷达图像识别。杜等人提出了一种位移和旋转不敏感深CNN模型由增强训练数据集(21]。彭等人提出了一种新的CNN建筑与空间金字塔池(SPP),可以构建一个高的层次特性映射特征图卷积除以由细到粗的水平总地方特色的SAR图像(22]。Krizhevsky等人进行了一项CNN模型适用于ImageNet大规模视觉识别的挑战(ilsvrc - 2012)和得到一些好的结果23]。曹和公园提出了CNN架构使用聚合特性和完全连接层,军事目标的准确识别10类MSTAR数据集是94.38% (24]。

一般来说,CNN的最后一层可以被看作是一个线性分类器,但它不是最优分类器。常用的最优分类器是支持向量机(SVM)及其改进算法。勒存2006年,黄和卷积网络(CN)和支持向量机算法相结合来确定目标和生成高识别率(25]。2012年根据结合算法,手写的数字进行了实验;精度可达99.81%7]。尤其是在文献[26],CNN是可训练的特征提取器和支持向量机执行识别器,分类精度98.49%获得肯尼迪航天中心(KSC)数据集和99.45%在帕维亚大学获得场景(PU)数据集。

然而,与传统的支持向量机相比,反向传播(BP)和其他分类算法,极端的学习机器不仅具有训练速度快,调整参数较少,但也有短的运行时间和训练精度高27]。一种新的SAR图像识别方法的基础上,CNN-ELM算法。方法的过程如下:首先,ReLU函数在CNN,代替乙状结肠功能;其次,图像特征提取;最后,CNN的最后一层将被替换为榆树为了认识这些图片。和方法的特点是高识别率和短的运行时间。

2。CNN和榆树

2.1。卷积神经网络

近年来,因为机器学习不需要改变图像的拓扑结构,在图像识别是非常受欢迎。卷积神经网络(CNN)不仅是一个深度学习(28)也是一个人工神经网络,主要用于语音分析的领域(29日和图像识别30.]。

传统的CNN模型的结构如图1。有五层CNN模型。的输入层是一个矩阵归一化模式与大小。特征映射连接输入和它的上一层。这意味着卷积得到的特征层被用作输入池层。所有神经元的一个特性映射共享相同的内核和连接权值(称为共享重量(31日])。例如,使用一个内核大小5和2的二次抽样比例,每个特性映射层减少了特征尺寸从先前的特征尺寸来。

CNN模型中有三个独特的结构特点:本地传感领域,分享(重量31日),并将采样。当地的感知域是每一层的单神经元。只是每一层的神经元,神经元相对于在某一领域(一般矩形区域的神经元 )在网络输入层。由于独特的结构特性,输入图像的结构特点,可以提炼出每个神经元。体重共享可以大大减少网络的训练参数和训练样本的数量。将采样是一种有效的特征提取的图像,从而使该模型有很好的抗噪声能力和大大减少图像的特征维度。CNN模型分为输入层、隐层和输出层。有两个隐藏层:卷积层(提取特性)和downsampling层(选择优化的特性)。

2.2。极端的学习机器

极端学习机(ELM)算法是一种新的快速学习算法。在训练过程中不需要调整,但只需要设置隐层神经元的数目,并找到最优的解决方案。相比与传统的分类算法如CNN-SVM [7),学习速度快的优点,泛化能力强,很少调整参数被发现。单隐层神经网络,假设任意样本 ,在哪里 , 。

如果有隐层节点,单隐层神经网络可以表示为在哪里是一个激活函数, 输入体重,输出的重量,是偏见, 的内积吗和。单隐层神经网络的学习目标是最小化误差的输出。它可以被认为是这意味着,有存在 , ,和 ,这可以被看作是吗

它可以表示为一个矩阵

为了培养单隐层神经网络,希望得到 , ,和这使得在哪里 ;它相当于最低损失函数

没有需要调整的参数在榆树算法。一旦输入重量和隐藏层的偏见是随机决定的,输出矩阵和隐层的唯一确定。

3所示。基于改进CNN-ELM识别的SAR图像

在卷积层图1图(map),特点是复杂的卷积核,和卷积的地图层输出通过激活函数卷积的结构。卷积层和downsampling层交替出现,和每个输出卷积地图层与输入地图。一般来说,卷积的输出层在哪里卷积层的层数,卷积核,是偏见,是输入地图。是激活函数。标准的CNN激活函数是乙状结肠函数可以表示为32]

乙状结肠函数的输出范围(0,1)的过程中调整权重;它是积极改变体重值之间的比例和上层的输出;当它趋向于零的一部分,减少或没有调整的重量调整将增加训练时间。从图2(一个),可以看出它的导数曲线,反过来,看起来像一个碗,这很容易导致梯度分散的问题。

(一)乙状结肠

(b) ReLU

因此,改善ReLU函数(23),它是一种不饱和非线性函数;很容易获得,实现网络的稀疏。从图2 (b),有些神经元的输出是0,这减少了参数之间的依赖,缓解了过度拟合问题,可以传播梯度在反向传播网络很好。与此同时,它可以减少梯度引起的色散的问题,加快网络的收敛速度。ReLU函数的公式

本文改进的CNN用于提取图像特征作为输入的榆树算法的识别精度。因此,SAR图像识别算法提出了基于改进CNN-ELM,以及算法的结构可以看到在图3。

算法步骤如下所示。(1)输入的CNN:特区灰度图像去噪后,分割、边缘检测等操作(2)第一层:卷积SAR图像灰度由6过滤器的大小错综复杂和偏见,然后由ReLU激活函数得到6特征图(3)第一downsampling层:意思是池中使用从上一步获得每个地图。在这一步中,意思是池的长度是2。这一步的目的是把图像的结构信息(4)第二次卷积层:这些地图是复杂的偏见和12过滤器的大小 ,然后他们被ReLU激活激活函数得到12地图(5)第二个downsampling层:意思是池中使用每个地图从上一步获得的。在这一步中,意思是池的长度是2。这一步的目的是得到图像的特征向量(6)榆树算法识别:步骤(5)得到的特征向量作为输入的榆树算法,和榆树训练函数和训练集用于创建和火车榆树;接下来,训练参数和榆树预测功能是用来测试测试集;最后,识别准确性的训练集和测试集

4所示。仿真实验与分析

4.1。仿真实验

所有实验进行了MATLAB和i7 2016 b - 8700 CPU和8 G内存。在这个实验中,数据从数据库姆斯塔。有十种目标图像包括2 s1, BMP_2, BRDM_2, BTR_60, BTR_70, D_7, T_62, T_72, ZIL_13_1, ZUS_23_4;他们的形状和SAR图像形状如图4。每个目标的SAR图像观察到四面八方。一般来说,抑郁症的SAR图像来自15°角是用来训练提出了CNN的架构,和抑郁症的SAR图像来自17°角是用来评估该方法的性能。

(一)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(我)

(j)

与光学图像比较,SAR图像包含大量的噪音;SAR图像预处理包括去噪、分割和边缘检测。这些图像将显示在图5。然后,SAR图像进行预处理和来自15°的俯角用作训练集;与此同时,抑郁症的SAR图像来自17°角作为测试集,细节表中可以看到1训练集的总大小是2747,和测试集的大小是2426。旁边,改进的CNN是用来提取的特征训练集和测试集,和获得特征向量提取。似乎这些向量作为输入的极端学习机(ELM)。榆树算法识别精度,通过识别和分类是相对于其他实验算法(算法在文献[7,25]);该算法的性能明显改善。

(一)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

(我)

(j)

4.2。实验结果分析

精度的计算方法是10种SAR图像(2 s1, BMP_2 BRDM_2, BTR_60, BTR_70, D_7, T_62, T_72, ZIL_13_1, ZUS_23_4)的训练集和测试集,分别标有1、2,···,10标签作为原始的标签。榆树算法用于标签。如果标签测试的数量是一样的,原来的标签,然后加1,最后,每个标签的数量除以总数量的标签的准确性。特征提取时利用CNN是1.2秒,和榆树的识别是0.15秒,所以总时间约为1.35秒。

为了测试的性能提出CNN-ELM SAR图像识别的算法,比较是用主成分分析(PCA) (1),深卷积网络(宽带)4(SRC)[],稀疏表示分类2(中海壳牌)[],互补空间金字塔编码3),结合卷积网络和支持向量机(CN-SVM) [25],CNN-SVM [7)方法,分别。实验结果如表所示2。

在表2,从每一种SAR图像的分类和识别,很明显,CNN-ELM的准确率明显高于其他方法;CNN-ELM的平均准确率为100%,其次是CNN-SVM(99.57%)、宽带(99.13%)、CGLF(98.56%)、中海壳牌(94.48%)、CN-SVM (94.38%)、SRC(92.70%),和PCA (92.43%)。尤其是具有类似CN-SVM[详细比较25]和CNN-SVM [7)如下。

与CN-SVM相比,准确率的CNN-ELM 2型s1高出5.47%,在类型BMP_2高出4.03%,在类型BRDM_2高出14.96%,在类型BTR_60高出2.54%,在类型BTR_70高出8.67%,在D_7类型,T_72, ZUS_23_4高出1.82%,在类型T_62高出8.79%,在类型ZIL_13_1高出6.2%,分别。

与CNN-SVM相比,这些五SAR图像的分类准确率(BTR_60, BTR_70, T_62、T_72 ZIL_13_1)已得到改进。另外,CNN-ELM的准确率BTR_60类型高0.01%,类型BTR_70高出2.34%,在T_62类型和T_72高出0.5%,类型ZIL131高出1%,分别。总的来说,改进CNN-ELM算法的识别准确率比CN-SVM高出5.62%,而且准确率也比CNN-SVM高出0.43%。实验时间很短,这表明该算法具有很强的可行性和可以进一步应用到其他对象的分类和识别。

5。结论

摘要CNN通过改善提高激活函数;改进的CNN是用于提取的深度特征10种SAR灰色图像去噪的过程下,分割和边缘检测。在这个过程中,这些SAR图像分类的榆树算法结合从CNN的特性。实验结果表明,CNN和榆树的结合具有高准确率和短时间内识别的SAR图像,这表明了算法的有效性,可以进一步应用到其他对象的分类和识别,特别是对一些图像的特征并不明显。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

支持的研究项目是由中国国家自然科学基金(批准号61127008),山西省自然科学基金(批准号。201801 d121026, 201701 D121012, 201701 d221121),以及中国的山西奖学金委员会(批准号2016 - 088)。

引用

a . k . Mishra和b . Mulgrew“雷达信号分类使用PCA-based特性,”IEEE国际会议言论声学和信号处理程序图卢兹,页1104 - 1107年,法国,2006年5月。
视图: 出版商的网站 | 谷歌学术搜索
p .膝盖,j . j . Thiagarajan k . n .需要和a . Spanias“SAR目标分类使用稀疏表示和空间金字塔”IEEE RadarCon(雷达),页294 - 298,堪萨斯城,密苏里州,美国,2011年5月。
视图: 出版商的网站 | 谷歌学术搜索
l . s . Wang焦、杨s和h . Liu”通过互补空间金字塔SAR图像目标识别编码,“Neurocomputing,卷196,不。C, 125 - 132年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
f·s·陈,h . Wang徐,Y.-Q。金”,目标分类使用深卷积网络SAR图像,”IEEE地球科学和遥感,54卷,不。8,4806 - 4817年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
b .丁和g·温”,全球和当地的过滤器健壮的SAR目标识别在各种扩展操作条件下,“信息科学卷。476年,48 - 63年,2019页。
视图: 出版商的网站 | 谷歌学术搜索
j . j .顾z . Wang Kuen et al .,“最近卷积神经网络的进步,”模式识别卷,77年,第377 - 354页,2018年。
视图: 出版商的网站 | 谷歌学术搜索
x x。妞妞和c . y .孙”,一种新颖的混合CNN-SVM分类器识别手写的数字,”模式识别,45卷,不。4、1318 - 1325年,2012页。
视图: 出版商的网站 | 谷歌学术搜索
h。赵和h刘”,多分类器融合和CNN的手写数字识别特征提取,”细粒度的计算4卷,1 - 8,2019页。
视图: 出版商的网站 | 谷歌学术搜索
s . Singhal诉Passricha p·沙玛,r·k·Aggarwal”多层次的cnn对端到端语音识别,”环境智能和人性化计算杂志》上,10卷,不。11日,第4624 - 4615页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
t . Tan y钱,h·胡,y, w·丁和k . Yu”自适应很深的卷积残余噪声鲁棒语音识别网络”IEEE / ACM交易音频、语音和语言处理,26卷,不。8,1393 - 1405年,2018页。
视图: 出版商的网站 | 谷歌学术搜索
谢和h·胡“面部表情识别与FRR-CNN”电子信件,53卷,不。4、235 - 237年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
j·d·j . Li Zhang Zhang et al .,“面部表情识别与R-CNN更快,”Procedia计算机科学,卷107,不。C, 135 - 140年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
康,j·李,k . Bong c . Kim y . Kim和周宏儒。柳,“低功耗可伸缩的3 d面临frontalization处理器CNN-based人脸识别在移动设备上,“IEEE杂志在新兴和选定的主题在电路和系统,8卷,不。4、873 - 883年,2018页。
视图: 出版商的网站 | 谷歌学术搜索
c·丁·d·道,“Trunk-branch合奏卷积神经网络对基于视频的人脸识别、”IEEE模式分析与机器智能,40卷,不。4、1002 - 1014年,2018页。
视图: 出版商的网站 | 谷歌学术搜索
s . k . b .公园,a Shin公园et al .,“生态研究用于冰箱、盐,蔬菜和水果的摄入量,和胃癌,”癌症的原因与控制,22卷,不。11日,第1502 - 1497页,2011年。
视图: 出版商的网站 | 谷歌学术搜索
l . g . Hafemann Sabourin r, l·e·s·d·奥利维拉,“功能学分析离线签名验证使用深cnn,”2016年23日国际会议模式识别(ICPR)2016年12月,墨西哥坎昆。
视图: 出版商的网站 | 谷歌学术搜索
j . d . CireşAn,迈耶∙马希,的和j。施密德胡贝尔表示“多列深层神经网络交通标志分类。”神经网络32卷,第338 - 333页,2012年。
视图: 出版商的网站 | 谷歌学术搜索
毛x, s . Hijazi r·卡萨斯·考尔和c .再生草,“分层CNN交通标志识别,”2016年IEEE智能车辆研讨会(IV)2016年6月,哥德堡,瑞典,。
视图: 出版商的网站 | 谷歌学术搜索
即下属特区玫瑰,t . p . Karnowski“深机器学习,人工智能研究的新领域的研究前沿,”IEEE计算机情报杂志,5卷,不。4,十三至十八页,2010年。
视图: 出版商的网站 | 谷歌学术搜索
d . Cireşan,迈耶,,的j。施密德胡贝尔表示“多列深层神经网络图像分类,”2012年,http://arxiv.org/abs/: 1202.2745。
视图: 谷歌学术搜索
k . Du y邓,t·赵r . Wang和n .李“SAR ATR基于位移和rotation-insensitive CNN,“遥感信,7卷,不。9日,第904 - 895页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
l . l .彭、刘x m . Liu, m .回族和y赵,“SAR目标识别和姿态估计使用空间金字塔池在CNN,”2017年国际会议上光学仪器和技术:光电成像/光谱学和信号处理技术,p。106200 w,北京,中国,2018年1月。
视图: 出版商的网站 | 谷歌学术搜索
a . Krizhevsky i Sutskever, g·e·辛顿“ImageNet分类与深卷积神经网络,”先进的神经信息处理系统太浩湖,页1097 - 1105年,NV,美国,2012年12月。
视图: 谷歌学术搜索
j·h·曹和c . g .公园,“附加特性基于CNN在SAR图像自动目标识别”2017第四届亚洲国防科技-日本(ACDT),页1 - 4,东京,日本,2017年12月。
视图: 出版商的网站 | 谷歌学术搜索
F.-J。黄和y LeCun(“大规模学习支持向量机和卷积网通用对象分类,”程序。计算机视觉和模式识别会议(CVPR 06年),纽约,2006年6月。
视图: 谷歌学术搜索
l . j .愣道,帮派,董,和d·汉”Cube-CNN-SVM:一种新颖的高光谱图像分类方法,”2016年IEEE 28日国际会议与人工智能工具(ICTAI)美国加利福尼亚州圣何塞,2016年11月。
视图: 出版商的网站 | 谷歌学术搜索
G.-B。黄徐瑞秋朱,C.-K。萧,“极端的学习机器:前馈神经网络的一个新的学习计划,”2004年IEEE国际联合会议上神经网络(IEEE猫。No.04CH37541),页985 - 990,布达佩斯,匈牙利,2004年7月。
视图: 出版商的网站 | 谷歌学术搜索
y LeCun (l . Bottou y Bengio, p . Haffner“Gradient-based学习应用于文档识别,”IEEE学报》,卷86,不。11日,第2324 - 2278页,1998年。
视图: 出版商的网站 | 谷歌学术搜索
s . Sukittanon a·c·苏伦德让j·c·普拉特和c j . Burges”卷积网络语音检测,”第八届国际会议上口头语言处理2004年10月,韩国济州岛。
视图: 谷歌学术搜索
Y.-N。陈,c c。汉族,C.-T。王,s。刘正,K.-C。粉丝,“CNN-based人脸检测器地图,而且分类器通过一个简单的功能,“IEEE模式分析与机器智能没有,卷。31日。3、1 - 12,2009页。
视图: 出版商的网站 | 谷歌学术搜索
f·劳尔,c . y .孙和g·布洛赫,“手写数字识别,可训练的特征提取器”模式识别,40卷,不。6,1816 - 1824年,2007页。
视图: 出版商的网站 | 谷歌学术搜索
j·汉和c .东湾”乙状结肠的影响函数参数的速度反向传播学习”国际研讨会在人工神经网络施普林格,页195 - 201年,1995年。
视图: 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

5587年

下载

1707年

引用