文摘
本文提出一种新的分类方法high-spatial-resolution卫星场景分类介绍贝叶斯信息准则(BIC)的特性过滤过程进一步消除不透明和多个特征之间的冗余信息。首先,两个不同的和互补的特征描述符提取描述卫星的场景。然后,稀疏的典型相关分析(SCCA)为研究对象,运用罚函数与融合提取的特征描述符和同时消除它们之间的歧义和冗余。之后,两阶段贝叶斯信息准则(BIC)过滤过程的特性是设计来进一步过滤冗余信息。在第一阶段,我们通过一个迭代过程逐渐施加约束为避免设置在载荷约束稀疏的相关性下降下面的近似置信下限典型相关。在第二阶段中,贝叶斯信息准则(BIC)是利用进行的过滤特性集的最小装载的绝对值为零在每个迭代中所有功能。最后,应用支持向量机与金字塔匹配内核获得最终结果。实验结果high-spatial-resolution卫星上的场景表明,提出的方法在分类精度达到令人满意的性能。
1。介绍
场景分类在遥感领域已引起越来越多的关注。high-spatial-resolution的卫星图像,它唤起了大量的具有挑战性的问题场景分类由于高组内变异、低阶级之间的差距,和其他外部因素变化等观点,灯饰和阴影,背景杂乱,部分遮挡,和多个实例。此外,大量增加的空间分辨率的图像,目标变得更清晰的细节,和大量的线索也变得更加独特,如结构和颜色。因此,重视适当结合,融合在各种方面。在过去十年左右的时间里,许多研究人员和从业人员都很努力在high-spatial-resolution卫星图像中利用不同来源的信息来提高分类性能(1- - - - - -5]。
不同空间分辨率低的卫星图像的情况下,单独类型的特征描述符已被证明是有效的和高效的分类(6,7),全世界都认识到,而不是采用一种单独的功能,它更有利于熔丝和合并一组不同的和互补的特性,比如功能基于结构和颜色信息(8,9]。因此,如何融合这些不同和互补信息,消除它们之间的歧义和裁员成为至关重要的问题。一个广泛的赞扬的方法就是特性融合、特征从不同渠道的融合,发展场景分类的新模式。很多方法已报告在文献[10- - - - - -12]。
典型相关分析(CCA) (13)方法已经凸显,尤其是在功能融合领域(14,15),由于其能力表达内在的两组特征之间的相关性。为了提取来自两组典型相关特性特性,CCA方法首先构造一个关联判别函数的提取两个不同特性相同的样本。然后CCA方法创建高效和有效的分类判别功能。
然而,当尺寸太大的特性,如在high-spatial-resolution卫星场景分类研究中,传统的CCA方法不再是合适的。除此之外,从相同的图像中提取特征时,样本协方差矩阵变成未定义或不稳定,导致额外的参数估计困难。因此,降维的方法是CCA必须解决这个问题。在过去的十年中,丰富的方法已经提出了功能收缩和选择,包含的非负绞死Breiman [16),至少绝对收缩和选择算子(套索)Tibshirani [17),顺利剪绝对偏差(许多)风扇和李18[],Elastic-net邹和黑斯蒂19]。最近,这些方法已经用来CCA关系评估两组高维遥感数据。利用特征选择策略的规范功能载荷系数的设定一些具体选择剩余的零功能。关键特性选择然后被称为稀疏的特性,这些特性和典型相关分析利用通常被称为稀疏的典型相关分析(SCCA)。最初,Waaijenborg et al。20.]提出一种惩罚的CCA采用迭代回归过程与单变量软阈值(科大)形式的Elastic-net点球。随后,Parkhomenko et al。21方法利用正则化的一种形式)建议西雅图癌症看护联盟注册类似科大Elastic-net [19]。威滕和Tibshirani22)将套索SCCA处罚。这些方法很有趣。然而,他们不以直接的方式控制稀疏。同时,它已经表明,各式各样的惩罚似然方法有oracle属性在特定条件下(18,23- - - - - -26]。然而,在实际应用中,没有一个适当的模型,特征选择,oracle财产不能实现。因此,方法不一定产生稀疏的特性。来解决这个问题,本文提出一个两阶段过程实施SCCA L1点球是利用特征载荷在第一阶段,然后基于贝叶斯信息准则(BIC)特性的滤波算法进行进一步去除冗余和噪声信息。具体而言,在第一阶段,我们通过一个迭代过程逐渐施加约束为避免设置在载荷约束稀疏相关性下降下面的近似置信下限典型相关。在第二阶段中,贝叶斯信息准则(BIC)是利用进行的过滤特性集的最小装载的绝对值为零在每个迭代中所有功能。
本文的其余部分组织如下。特征提取过程提出了部分2。部分3提供了一个具体的和详细的描述利用本文的方法。部分4显示实验结果,给出了性能评价。最后,部分5总结了工作和为未来工作指明了方向。
2。多重集特征提取
2.1。尺度不变特征变换(SIFT)描述符
在检测到的地区,筛选描述符提取一个梯度方向直方图(27]。梯度图像采样在4×4网格的八个方向的飞机;因此导致128年维度的描述符。每个样本点的大小重量是通过实现了高斯窗函数。这让更多强调的中心附近地区的梯度,并呈现描述符的微小变化不敏感的位置检测区域。梯度的大小是用来衡量贡献垃圾箱的方向和位置。描述符是在该地区免疫小错误检测和几何失真小,很大程度上是由于取向的量化和梯度的位置。组件的平方和的平方根计算规范化描述符获取光照不变性。
2.2。颜色直方图描述符
颜色直方图描述符三分离直方图的R, G, B通道(28]。颜色直方图表示的近似分布图像的颜色,因为每个直方图本代表一个给定的颜色空间中地方色彩范围。颜色直方图是图像的平移和旋转不变的内容;与此同时他们的计算。在我们的实验中,箱子的数量是40,120维的结果描述符通过连接的三个独立的直方图。
3所示。方法
3.1。稀疏的典型相关分析(SCCA)
典型相关分析(CCA)是一种多变量统计方法提出了摸索两组特征之间的相关性(13]。假设两个特征集和的维度和(,),从相同的图像中提取。我们的列和是标准化的标准偏差1和0,让和是和向量的权重,让和是数据集的特征的线性组合和,分别。请注意,和是向量。随后,(1)将最大化估计系数向量和: 在哪里和在数据协方差矩阵和数据协方差矩阵之间。方程(1)可扩展的新配方如下和已经很微不足道的影响相关系数:
上述CCA方法不适用时的功能数量过多。之间潜在的多重共线性预测特性进一步复杂化的计算协方差矩阵可以变成未定义或不稳定。因此,应该选择一些关键特性标准模型选择标准。在随后的过程中,选择的一组特性是用来计算的典型相关结果可以理解的,叫做稀疏的典型相关分析(SCCA)。从理论上讲,SCCA由惩罚最大化目标函数实现如下:
为了解决多重共线性问题,介绍了许多方法。Vinod建议合并处罚条款协方差矩阵的对角元素,它似乎像岭回归思想在回归分析(29日]。这需要额外的岭参数估计。其他正则化形式提出了方差矩阵与相应的身份代替矩阵(22)或对角矩阵(21]。在我们的工作中,矩阵和与相应的对角矩阵代替。
3.2。收缩的方法
惩罚线性回归机制已被广泛应用于高维数据进行分析,并结合特征选择和收缩技术。假设是一个向量和是一个矩阵。然后惩罚回归系数的估计可以通过使用以下处罚了回归模型: 在哪里惩罚项和吗是一个调优参数估计利用置换方法或交叉验证(简历)。作为第一个处罚回归方法,提出了岭回归缓和预测之间的多重共线性,二次惩罚项是嵌入式正则最小二乘估计方程(30.]。岭回归实现惩罚系数缩小为零。然而,萎缩的系数不等于零。因此,岭回归失败进行特征选择。绝对最小的收缩和选择算子(套索)Elastic-net,顺利剪绝对偏差(许多)不同于岭回归(即解决多重共线性问题。收缩)和设置一些系数的精确零,(即创建稀疏的特性。特征选择)。在本文中,我们应用不同的惩罚函数SCCA利用算法阐述了由Parkhomenko et al。21]。所有惩罚函数的调优参数估计通过交叉验证(简历)。
3.2.1之上。至少绝对收缩和选择操作符(套索)处罚
绝对最小的收缩和选择操作符(套索)点球是收缩的方法,选择判别特征的能力通过收缩系数和其他设置为0 (31日]。套索的点球术语定义如下: 在哪里是一个调优参数。套索给出的解决方案 这类似于软阈值规则引入Donoho et al。32)和Donoho约翰斯通(33),这是用来估计小波系数。
3.2.2。Elastic-Net点球
Elastic-net正则化机制,同时进行连续收缩和特征选择(34]。具体而言,这种方法利用两个处罚的套索和二次点球的岭回归创建一个凸组合。因此,这种方法保留了特征选择和系数收缩的能力。Elastic-net惩罚的定义可以制定如下: 然而,由于两个调优参数需要估计,计算Elastic-net成本有点高。
替代Elastic-net,邹和Hastie提出了一个简化版的Elastic-net称为一元软阈值(科大)34,所示的解决方案 本文基于单变量Elastic-net载荷采用软阈值来实现功能和如下:
3.2.3。顺利剪绝对偏差(许多)处罚
风扇和李提出了一个非凸罚函数命名顺利剪绝对偏差(竹荚鱼)18]。他们建议三个标准来确定一个优秀的罚函数,即稀疏(我),(2)连续性,和(3)无偏性。他们进一步努力,声称许多处罚具有这些属性。竹荚鱼点球显示如下: 当价值的范围内和竹荚鱼罚函数的同时,二次样条函数。函数是连续的,当和一阶导数可以制定如下:
竹荚鱼点球是连续可微的与其衍生品,但奇异(0,0以外的范围。这种罚函数集小系数为零,中型收缩系数为零,使得大型系数不变。因此,竹荚鱼点球生成几乎无偏系数和稀疏系数大的解决方案。竹荚鱼点球显示的解决方案如下:
这个阈值规则有两个未知参数:和。在理想的情况下,最优结果()可以获得利用方案涉及一个二维网格搜索类似交叉验证的方法与标准。然而,这样的一个执行是计算密集型的。在贝叶斯透视图中,李风扇和建议是一个明智的选择对于许多问题(18]。他们进一步强调,特征选择的性能问题不提高非常当采用数据驱动的方法。在本文中,我们设置3.7和被交叉验证选择。与此同时,阈值规则(12)采用负载向量和。
3.2.4。去惩罚
算法直接集几位系数为零35,36]。然而,这种罚函数不预测解决多重共线性的问题,因为它没有收缩系数对零。然而,这个处罚是无偏估计的结果影响大。解决方案的算法规则公布如下:
3.3。提出基于BIC特性过滤算法
当前SCCA方法的主要缺点是,他们不直接控制稀疏。因此,很难完整的高效和有效的消除噪音和冗余信息。之间有一个权衡的稀疏特性和最大相关性。在本文中,我们提出一个两阶段的过程建立一个平衡的稀疏特性和最大相关性。在第一阶段,我们通过一个迭代过程逐渐施加约束为避免设置在载荷约束稀疏的相关性下降下面的近似置信下限典型相关。在第二阶段中,贝叶斯信息准则(BIC)是利用进行的过滤特性集的最小装载的绝对值为零在每个迭代中所有功能。
提出功能过滤过程是迭代和简单。一个系数在每一次迭代,根据大小设置为0的系数绝对值。让和是制约有效降维方向;该特性过滤过程如下所示。(我)让。(2)定义一个新的方向通过保持最大的系数在绝对值和分配系数为0。搜索的投影进入空间的集合应该满足以下。(1)零系数的设置是一样的吗。(2)考虑,。(3)考虑。(3)计算出相关 和BIC-type标准,在那里是样本容量。(iv)让。重复步骤(2)-(4),直到。实现上述功能过滤过程后,我们获得的序列作为下降的为0。让的整数是最小化。然后,最小的系数在绝对的值被分配到0。这个提议特性过滤过程是一个流线型的特征选择的过程。在功能过滤,最多可能性都考虑在内,这使其可行的行为,即使是大的。最后,最小BIC值对应的特性是最后的选择功能。
3.4。支持向量机(SVM)与金字塔匹配内核(PMK-SVM)分类器
建立基于学习算法是基于数据映射到欧几里得空间的概念,然后发现内线性关系映射的数据。以一个典型问题为例,支持向量机最优分离超平面连绵起伏特征空间中两个类之间。内核提供的援助功能是对输入空间中的数据点映射到特征空间的内积,从而估计所有点之间的相似性,并决定他们的相对位置。线性关系发现的特征空间,虽然决定边界可能仍然在输入空间非线性,根据功能映射函数的方法。支持向量机(SVM)与金字塔匹配内核(PMK-SVM) [37]提供一个准确和节省时间的分类和金字塔匹配内核函数的解决方案制定如下: 在哪里输入集,在这是一个球体的直径,是特征提取函数,是th直方图在,是一个直方图相交函数衡量两个直方图之间的重叠的垃圾箱: 在哪里和直方图,垃圾箱,表示的数th的本。因为在金字塔的建设阶段,,(15)等价于 为了保持通用性和获得承诺和令人满意的分类结果。在这里,我们采用支持向量机(SVM)与金字塔匹配内核(PMK-SVM)作为分类器。在多级环境下,一组二元分类器和多数投票技术利用执行多级分类。图1说明了我们的分类方案的基础上,提出两阶段BIC过滤过程。
4所示。实验和结果
实验进行一个high-spatial-resolution卫星图像大小为4000×4000像素,像素呈现在图2。视图已被2009年11月21日在Majuqiao镇,位于通州西南、东南的北京,在右下方的纬度和经度和左上角落39°43′N, 116°32′E和39°44′N, 116°30′E分别。地面采样距离大约0.5 m和乐队的任务是红带3,绿色带2,蓝色带1。图像主要包含八级卫星场景:工厂、道路、水、农田,高层建筑,建筑,低裸地和绿地。与相关的地理信息,图中给出的参考数据6(一)是手动标记。此外,一些课程没有被考虑进去,可以被忽视,如绿地与邻国之间的间隙。图3展品从八级卫星场景每个类的一个例子。
摘要倍交叉验证方法是用于优化每个规范的惩罚参数特性对,在通过实证倍交叉验证设置为10。具体来说,获得的特性数据分为两个部分:比例的功能(测试)和剩余的数据验证比例的特征数据进行训练。加载向量产生在培训过程和测试过程中使用。我们测试特性的相关性最大化数据选择稀疏参数和用交叉验证的方法。加权向量和通过的预设值吗和。随后,相关计算 在哪里和训练集的权重向量和分别为,交叉验证的实施时间。在这里,和测试集。最后,和值确定为最优稀疏参数的最大值。
实现可靠的结果和看到的收敛趋势分类精度,用不同比例的training-testing我们进行整个实验样品通过使用线性训练样本数量的增加、学习分类精度逐渐提高,越来越多的训练样本。避免训练和测试样本太空间相关,我们训练5、10、15、20、25和30个图像在其余每个类和测试。同时,我们选择从不同的训练数据和测试数据为独立的数据集和reconducted high-spatial-resolution卫星场景分类与这些选择实验数据;获得的结果一致。分类器并没有明显的偏见在这个特定的图像中选择训练样本的比例,因此分类结果不会被极度夸大了。我们分裂的培训随机测试数据并重申实验十倍。同时,我们保持一个帐户的平均每次运行每个类的分类精度。结果的平均值和标准偏差从每个实验被用来量化最终结果。
为了提高分类的性能在某种程度上,这两个特性应融合在一个恰当的策略。出于比较目的,SCCA与不同的惩罚函数(Elastic-net套索,竹荚鱼,算法)介绍了融合产生的特性特征提取方法。从图都是显而易见的4和竹荚鱼容易观察到SCCA罚函数获得一个相对突出的结果在其他惩罚功能。勾勒出如下的原因。一方面,为了控制完整的图像信息的来源,我们利用两个典型的、有代表性的特征描述图像的结构和颜色属性,和这些特性包含的本质和内在信息图像。另一方面,竹荚鱼罚函数具有操纵特性之间的多重共线性的能力与其他惩罚功能。然而,这些方法没有立即控制稀疏。因此,一个额外的两阶段特性过滤过程是不可或缺的开展为进一步消除冗余和不透明的内部之间的信息和功能。图5比较四种不同的惩罚函数的分类性能的建议基于两阶段BIC过滤过程。很明显,分类精度提高后利用建议BIC过滤器,可以解释为,如果没有可能不一定建议BIC过滤器西雅图癌症看护联盟注册产生稀疏的特性。换句话说,在使用建议的BIC过滤噪声和特征之间的冗余信息进一步消除。
(一)
(b)
注意,竹荚鱼罚函数与建议BIC滤波器产生最好的分类精度。数据6(一)和6 (b)显示参考图像之间的比较在同一卫星场景和最好的分类图像获得的方法(竹荚鱼罚函数SCCA建议BIC过滤器),分别获得的混淆矩阵通过竹荚鱼罚函数没有和SCCA建议BIC滤波器提出了数字7和8,分别。
正如预期的那样,错误分类更短的建筑和工厂之间可倾斜的出现。这是由于这样的事实,工厂通常包括密集的房屋和水平和垂直的线,像短的建筑。同时绿色土地并被错误地归类为农田或裸地;这个错误分类最起作用的因素是这些类拥有相似的元素和模式。然而,一些类之间的混淆是很难理解。一些短的建筑、道路和工厂被归类为裸地。
5。结论
本文基于BIC特性过滤方法提出了high-spatial-resolution卫星场景分类。两阶段的SCCA BIC特性过滤过程作为一个至关重要的组件在卫星场景分类,可以明显改善分类精度,有效地筛选和选择两个不同的和互补的特性,筛选和颜色直方图。然而,在缺乏原始特征处理步骤之前使用前建议SCCA特征融合方法,目前的方法是在很大程度上限制Majuqiao城镇的实验卫星场景分类。为了解决上述问题,我们打算实现一个稀疏编码步骤之前最初的功能利用特征融合方法减少计算成本和提高分类精度。
利益冲突
作者宣称没有利益冲突有关的出版。
确认
这部分工作是支持中国国家基础研究计划(973计划)资助下不。2011 cb707102和中国国家高技术研究发展计划(863计划)资助。2013 aa122301。