文摘

云类型的地面图像自动识别有很大的影响天气服务,但构成了重大挑战。基于对称正定矩阵(SPD)管汇,一种新颖的方法叫“廖内核稀疏编码和字典学习”(MKSCDL)提出了云分类。不同于古典特征提取在欧几里得空间,社民党矩阵融合多个特性和代表非欧几里得的几何特征。MKSCDL由三个步骤组成:特征提取、字典学习,和分类。学习词典,云的社民党矩阵图像可以用稀疏描述代码。实验在两个不同的地面进行云图像数据集。受益于矩阵黎曼流形上的稀疏表示,最近的基线相比,实验结果表明MKSCDL拥有更具竞争力的性能在灰度和彩色图像数据集。

1。介绍

云起着关键作用的水蒸气循环和影响地球的能量平衡1- - - - - -3]。天气预报和气候变化的研究中,云总是被视为核心因素(4]。传统的云观测更依赖于观察者的经验,因此,它是耗时。实质性的和明显的硬件和数字成像技术的发展使人们有可能自动连续观察云。与卫星图像相比,地面保持高空间分辨率图像在当地规模(5]。

把天空成像系统的应用和云高计,自动观测实现云量和云底高度6]。识别云类型准确和有效,已经进行了很多尝试解决这一具有挑战性的问题(5- - - - - -17]。Buch et al。7)采用纹理、位置和像素亮度特性一起从整个天空图像和与决策树分类的数据。测试纹理特征提取方法,自相关,同现矩阵,边缘频率、法律的功能,原始长度是申请云识别(8]。Calbo和Sabburg5]提出统计纹理特征,傅里叶变换特性和阈值图像特征识别由全天空成像仪拍摄的图像(WSI)和全天空成像仪(TSI)。Heinle et al。912]提取统计特征来表示图像的颜色和纹理,然后采用k-nearest-neighbour(资讯)分类器来区分条件七个不同的天空。作为一个明显的区别存在于纹理方向卫星图像和地面之间的图像,Gabor-based多个特性是用于与支持向量机(SVM)分类,实现了88.3%的总体精度(10]。不同于典型的局部二进制模式(lbp),加权局部二进制模式(WLBPs) [11)被融合了本地块的方差为识别云类型以提高对比度。程和Yu (12)结合统计特性和枸杞多糖和执行基于块的贝叶斯分类器分类(BC)。除了纹理特性,刘et al。13)采用7边缘图像的结构特点来描述结构的特征红外云。卓et al。14)表示,仅仅使用纹理或结构特点分别将不会产生良好的分类性能。因此,纹理和结构特点都捕获与SVM获得云类型。此外,夏et al。6和肖等。15一起)提出利用多个特性,包括颜色、纹理、云类型识别和结构特性,并实验验证,各种功能的集成的表现比其他情况下。的物理特性也重视代表云。Kazantzidis et al。16]介绍了太阳能方位的角度,总云覆盖,可见的太阳,雨在天空图像描述存在的物理性质。除了12从天空相机图像提取的图像特征,日吨产量等。17)结合另一个从测云仪7云层特性,采用随机森林分类。

更有效地代表云映像,李et al。18)提出了一个基于一袋歧视模型微观结构(bom),它显示竞争云类型识别的性能。来弥补bom的弱点,它不能描述这些复杂的类别,双norm-bounded稀疏表示模型(19据报道。这个模型展示了有前途的分类性能和验证能够捕捉最突出的模式从复杂云类别和自然达到更高的精度。

最近,对称正定矩阵(SPD)管汇了多少人气在动作识别中,对象检测、人脸识别等。20.,21]。此外,在社民党稀疏表示矩阵集合管被应用到这些领域取得更好的性能(22,23]。尽管其有效性,很少研究矩阵集合管方法解决云分类的任务(24]。

本文多方面的内核稀疏编码和字典学习(MKSCDL)社民党矩阵歧管云分类提出了地面。本文的其余部分组织如下:部分2介绍了数据集,部分3描述MKSCDL的方法论。部分4报告实验结果和讨论。最后,结论部分进行了总结5

2。数据集

2.1。方位的数据集

天顶的数据集是由中国的国防科技大学,从历史中获得地面红外图像的整个天空红外cloud-measuring系统(WSIRCMS) [25]。图像分为五类:层状,积云状的,波形,触须状的云和晴空根据云的形态和生成机制(26]。100年的这个数据集是由云映像在每个类别。典型的样本的大小 从图中演示了每个类别像素1

2.2。SWIMCAT数据集

SWIMCAT数据集(27]包含784从白天WSI称为广角拍摄的图像分辨率sky-imaging系统(WAHRSIS)。图像分为5个不同的类别:晴朗的天空,有图案的云,厚厚的乌云,厚厚的白云,云面纱。每个类别的图像数量是224,89,251,135,和85年,相应的。在一段时间内获得的图像从2013年1月到2014年5月。他们选择的基于视觉特征和分类在专家的帮助下,来自新加坡的气象服务。代表样本的大小 从图中演示了每个类别像素2

3所示。方法

在本节中,介绍了方法主要在三个部分:特征提取、字典学习,和分类,说明整体图3

3.1。特征提取和斯坦内核

给定一个图像 的大小 ,特征图像 被定义为计算d维特征在每个像素: 在哪里 是映射的特性,例如: 在哪里 是像素位置; 表示像素的灰度值; , , , 表示第一和二阶导数 的方向 ,分别;和 意味着梯度的模量。

协方差描述符(CovD)特性的图像 计算由以下方程: 在哪里 代表的意思是特征向量 图像的像素数量。

一般来说,CovD是社民党矩阵。社民党矩阵形式黎曼流形 当被赋予了一个黎曼度量。注意,社民党采用矩阵提取的特征来描述图像;因此,它不同于传统的特征用于分类的欧几里得空间。

在本文中,我们采用斯坦黎曼度量,散度和社民党矩阵歧管映射到再生核希尔伯特空间再生核希尔伯特空间理论()。斯坦的散度 定义如下: 在哪里 点社民党矩阵歧管, 测量两点之间的距离。

斯坦内核定义如下:

这是一个正定内核的某些选择 (28]。斯坦的内核,我们可以再生核希尔伯特空间理论社民党流形映射到:

具体地说,

3.2。内核稀疏编码和字典学习

在本节中,我们给出一个框架箱内核稀疏编码和字典学习(MKSCDL),这是介绍的算法1。让 表示 是一本字典 原子。斯坦的内核,我们更新字典 通过两步迭代:内核稀疏编码和内核字典学习。模型是一个优化问题 约束: 在哪里 是一个样本 , 代表着稀疏的系数, 正则化参数, 表示重建误差。

输入:社民党矩阵 和atom的字典
输出:更新字典
初始化字典 通过 黎曼流形上则使用邻的意思是[29日]。
不收敛
内核稀疏编码
不收敛
结束
内核字典学习
不收敛
结束
结束
结束
返回
3.2.1之上。内核稀疏编码

字典是固定时,稀疏编码问题制定如下:

迭代shrinkage-thresholding算法(ISTA) (30.采用优化的解决方案。

,然后稀疏向量更新如下: 在哪里 步长, 表示的稀疏系数 th迭代,收缩算子定义如下:

方程(10)=

现在,问题是转换计算的梯度 关于 :

作为 ,的梯度 关于

第一项的方程(12)是

同样,第二项的方程(12)是

因此,梯度 通过添加右的方程(13)和(14)。与方程(稀疏的代码实现9)。

3.2.2。内核字典学习

首先,最初是通过字典 黎曼流形上则使用邻的意思是[29日]。它选择k分,从训练数据随机初始聚类中心。然后以斯坦散度来衡量,每一个点分配给最近的聚类中心再计算相应的迭代聚类中心基于邻意味着通过以下方程: 在哪里 是一组社民党矩阵和 是更新后的集群中心。最终, 形式的初始码书

当稀疏系数是固定的,字典更新由原子,原子和字典学习问题制定如下:

我们使用ISTA [30.)更新字典。欧几里得梯度的

的证明(22),黎曼梯度

th原子 更新如下: 在哪里 步长和吗 代表了 th原子在 th迭代。

3.3。分类

字典从训练集后,稀疏系数和重建错误的“重新”测试集预测云类型。算法2详细分类的过程。

输入:测试样品 和学习词典
输出:预测云类型
内核稀疏编码
计算重建误差
结束
返回

因为有 类型的样品,字典 类型,独立更新,详细的节3.2。2

稀疏的系数 测试样本的 计算如下:

各种字典稀疏系数,最小的重建误差表明测试样本所属的类。

在本文中,云类的数量 在这两个数据集都是5,重建错误5类词典的比较来决定云类型。

4所示。结果和讨论

在本节中,与基线相比(11,12,27),MKSCDL的性能评估是相同的实验装置在两个不同的图像数据集:绝顶的数据集,被WSIRCMS, SWIMCAT数据集,WAHRSIS收集的。每个实验实现三倍和10倍交叉验证,和平均值作为最终结果。

注意,功能映射 被定义在两个不同的独立数据集之间由于性质不同灰度和彩色图像。 定义在方程(2)在天顶的灰度图像数据集,而在SWIMCAT数据集 RGB图像, , , 分别代表三个通道的强度图像。参数设置用于我们的实验经验如下: , , ,

4.1。方位的数据集的结果
以下4.4.1。MKSCDL的性能

第一个实验是进行方位的数据集。多样化的选择字典的原子数,MKSCDL相应变化的性能。图4显示更新字典上的整体精度有不同的大小。这说明,当字典的大小 = 14,总体精度达到96.33%,优于其他情况下。

5报告时的混淆矩阵 元素的行和列j在混淆矩阵的百分比th类公认jth类。因此,对角元素对应于所有类别的识别速度。它说明了所有的层状云和晴空99.3%图像识别正确,这意味着这两个云类型具有突出的特点是杰出的。同样,积云状的识别,波形,触须状的云实现超过93%。总的来说,MKSCDL揭示了一个理想的性能在云识别地面灰度图像,而精度高。

4.1.2。与基线性能比较

进一步评估的有效性MKSCDL, WLBP [11公元前]和[12)申请比较:(我)WLBP [11)方法融合当地一个补丁变成枸杞多糖的方差。资讯分类器是用于云分类基于卡方距离。(2)公元前(12)整合统计和局部纹理特征,采用正规化判别分析的贝叶斯分类器。注意统计特性只有8个维度,因为红外图像颜色信息的缺乏。

1介绍了比较10倍交叉验证的结果。MKSCDL的性能超过了其他两个方法特别是对积云状的波形,触须状的云。MKSCDL达到最高的整体精度为96.33%。这意味着词典是学习好,充分描述的样本对应的字典而不是不同类型的词典,这使得贡献竞争性能。

4.2。SWIMCAT数据集的结果
4.2.1。准备MKSCDL的性能

第二个是在SWIMCAT数据集上进行实验。类似于第一个实验,图6展览的总体精度与大小不同学习词典。随着字典大小的增加,总体精度提高。当 是20,MKSCDL执行最好的结果为98.34%。考虑到MKSCDL良好的分类性能和计算成本,我们确认 能满足实验要求。

7演示时的混淆矩阵 图案的云层和厚厚的白云歧视具有明显特征的准确性达100%。同样,晴朗的天空和厚厚的乌云的结果达到98%以上。此外,挑战性的面纱云像晴空(27)达到92.94%的像样的结果。结果表明,每个类的误分类率相当低,这意味着从整体来看,该方法在分类效果良好的地基RGB图像。

4.2.2。与基线性能比较

除了两个基线中提到的部分4.1。2texton-based方法(27)结合颜色和纹理特征用于比较。注意,不同的灰度图像,统计特性提取彩色图像在公元前方法有12维度。

2介绍了比较10倍交叉验证的结果。相比之下,MKSCDL执行比WLBP和BC。很明显,MKSCDL拥有强大的力量的任务云SWIMCAT数据集的分类。

与texton-based方法比较好,我们也使用相同的配置,实现实验,在27),选择了一个训练集40每类别图像而另一个45的随机测试(40/45)。表3列出了结果。相比,表2,不同方法的总体性能变化小。texton-based方法达到适合所有类别的分类精度除了云,面纱的准确性还有待提高。查看MKSCDL的结果,每个云类型获得相当高的识别率。

全面,与其他三种方法相比,MKSCDL验证是最有效的一个认识到地面的颜色图片。

5。结论

摘要小说云分类命名为“MKSCDL”提出了导管。社民党矩阵是从图像中提取和作为图像特征。维护SPD的非欧几里得的几何特征矩阵,内核稀疏编码和字典学习获得代表进行字典。测试样本的重建误差计算不同类别的字典来识别特定的云类型。通过比较最近的灰度和颜色数据集的方法,有趣的是发现WLBP执行更好的在灰度图像,而公元前性能更好的颜色图片。相对而言,MKSCDL适用于灰度和彩色图像和配备大容量自动地面的云分类。

该方法MKSCDL可以应用到现实生活中,提供的结果采用目测法进行比较和评估自动分类方法。有限的图片,它可能不会产生完美的云类型识别的性能。随着数据集变得更具代表性和更充足,它将更好地工作,可以满足云分类的任务。在未来,应考虑多个改进更好的自动云类型分类。至于特征提取,更多的功能,比如灰度同现矩阵和伽柏过滤可以融合为特征的映射来描述图像。用字典学习,组内的差异可以考虑更有识别力的字典。更重要的是,样本的稀疏系数可用于建立支持向量机模型。此外,复杂的天空状况中存在多个云类别应该吸引我们的注意力在接下来的工作。

数据可用性

SWIMCAT数据集有关http://vintage.winklerbros.net/swimcat.html,天顶的数据集用于支持本研究的发现可以从第一作者((电子邮件保护))要求。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

作者要感谢李教授Yee回族Lei刘博士提供SWIMCAT数据集和抛光的手稿。这项工作得到了国家自然科学基金(批准号。61473310,61473310,41575024)。