短期降水预报当地地区基于雷达反射率图像已成为一个热点问题在气象领域,这对日常生活具有重要的影响。最近,深度学习技术已经应用于这一领域,并与传统的方法相比,明显地提升营销效果。然而,现有的基于深度学习方法没有考虑的问题不同区域对降水和渠道施加不同的影响。在本文中,我们提出将多线程注意到双通道神经网络强调降水预报的关键领域。此外,解决这个问题的全球信息的过度流失造成的注意力机制,引入的残余连接模型。定量和定性结果表明,该方法达到了先进的雷达回波数据集上降水预报的准确性。
一般来说,降水预测指的是提供了一个很短的范围(例如,0 - 2小时)预报降雨强度的局部区域尽可能精确的基于雷达回波图,雨量计或其他观测数据(
主要有两类降水预测的传统方法。一个是呼应了光流法(外推技术代表
降水预测过程基于光流的方法。
随着深度学习的发展方法,在降水预报领域已经取得了一些进展。施等。
最近,深度学习的注意力机制已经取得不错的效果,广泛应用于计算机视觉。它学习权重矩阵强调主要特性和抑制无关紧要的功能(
本文旨在降水预报,我们提出一种双通道深度学习模型,称为多线程关注残余卷积神经网络(MAR-CNN)。MAR-CNN可以区分重要的高度范围内施加更多影响降水云的多线程的注意。与此同时,它集成了剩余的概念网络multhead注意减少全球的损失特性。我们进行了气象数据集分布的实验在中国深圳气象局。结果证实该MAR-CNN优于传统深学习方法,比如回旋的注意力以及卷积多线程的注意。
总结了本文的主要贡献如下:
我们应对发现的挑战降水的关键功能,如重要的地区大降水强度和不同高度的重要渠道,通过引入multiattention卷积神经网络。
我们建议把多线程的关注与剩余连接,这样可以利用全球和本地信息综合,以减轻损失的信息。我们所知,这是首次尝试降水预报的工作共同使用剩余结构和multiattention机制。
深圳位于中国的南部之间22°27′∼22°52′N和113°46′∼114°37′E,它面积2020公里2(图
深圳的地理位置和空间分布的一些气象监测站。
本文中使用的雷达回波数据集是一个为期两年的气象雷达强度的一部分数据集收集的深圳气象局。数据集有10000套的样品,每个包含60雷达反射图像和相应的降水在一小时内收集的地面站如图
历史15时间跨度4不同高度的雷达图像。
首先,它要求预测未来目标站点上的雷达图像进行精确降水预测。指的是数据处理方法的姚明和李娜(
其次,目标站点为中心,子图象的大小是41×41像素从缝截获图像。每个子图象对应于三个高度通道从1.5公里到3.5公里。这里,0.5公里的通道是废弃的,因为它是太低,包含一个很大的噪音。所以,茶点的尺寸图片用于后续的实验是41 41××3。这些子图象将送入网络来提取图像特征。最后,我们获得了8721子图象。我们随机选择1000组作为测试集,剩下的7721组作为训练集。
最后,非成象特性的云,云的移动速度信息等,通过传统方法像尺度不变特征变换(筛选)描述符
降水等级的分类标准和数据集的数据分布如表所示
降水等级的分类标准和数据分布。
| 降水水平 | 降水范围(毫米/小时) | 总体样本容量 | 增强训练集的大小 | 测试集的大小 |
|---|---|---|---|---|
| 没有雨 | < 0.1 | 257年 | 2097年 | 24 |
| 小雨 | 0.1 - -1.5 | 844年 | 2352年 | 60 |
| 中雨 | 1.6 - -6.9 | 2794年 | 2503年 | 291年 |
| 大雨 | 7.0 - -14.9 | 781年 | 1696年 | 85年 |
| 暴雨 | 15.0 - -39.9 | 3275年 | 2846年 | 429年 |
| 大的大雨 | 40.0 - -49.9 | 450年 | 2246年 | 69年 |
| 非凡的大雨 | ≥50.0 | 320年 | 2224年 | 42 |
从表
首次提出了CNN勒存等。
LeNet-5模型。
卷积和池在CNN的本质是类似于过滤提取数据特征。通过卷积和池、输入数据转换为数据间隐藏的拓扑结构特性。然后,这些特性在完整的连接层合并,和分类或回归结果可以在输出层完成。
注意函数可以被描述为查询和一组键值映射到输出,查询,键值和输出向量。一般来说,键和值是相等的。特别是我们的使命,键和值都是雷达反射率图像的特征提取的CNN网络和查询权重矩阵,网络需要学习。输出计算值的加权和,的重量分配到一个兼容性函数计算每个值的查询与相应的关键(
通过关注机制,模型可以为任务(关注重要信息
最近,多线程方法(注意
多线程的注意力由一些平行的正面(层)的关注不同的可训练的参数;每个头执行线性变换之前注意操作项目的三个输入到一个较低的维度(
多线程的插图的注意。
注意多线程的优势是,它可以学习相关的信息在不同的子空间表示。然而,这个结构可能会失去一些全球信息。
广为人知,但它不能提高网络的影响通过简单地增加网络的深度梯度差异。他等。
所以,基于该模型结合了多线程关注残余思想,更全面的功能融合全局和本地信息可以研究,在降水预测是至关重要的。
在本节中,我们将详细介绍我们的模型。我们的模型的目的是提取雷达图像的特点通过深层网络实现回归预测降水。为了捕捉雷达图像的重要特征,掌握云计算的时空特征层,我们设计了以下框架绘制在图
MAR-CNN的结构。
可以看到从图
输入图像CNN1上面是未来云计算时刻的雷达图像目标站点,分布在三个高地,其尺寸41
评估的性能预测方法,本文使用三个统计标准。这些标准总结了表的定义
评估标准的定义。
| 评估标准 | 公式 |
|---|---|
| 均方根误差 |
|
| 解释方差的分数 |
|
在本节中,提出的双通道MAR-CNN模型用于预测降水在下一个小时。评估算法的性能,我们使用增强的训练集和测试集的表
结构图的流行模式降水预报。(一)MAR-CNN。(b)双通道卷积模型的关注。(c)双通道卷积模型。(d)单一的卷积模型。
短期降水预报模型参数设置。
| 参数名称 | 参数值 |
|---|---|
| 学习速率 | 0.001 |
| 最大迭代次数 | 50000年 |
| 数量的头 | 12 |
| 批训练集的大小 | 128年 |
有人指出我们模型的主要参数是正面的次数。为了评估该参数对性能的影响,我们做了一个实验,不同数量的正面的关注,结果如表所示
多线程的正面的影响关注实验结果。
| 数量的头 | 6 | 8 | 9 | 10 | 12 | 13 | 14 |
|---|---|---|---|---|---|---|---|
| RMSE (res)↓ | 9.57 | 9.07 | 8.57 | 8.62 | 8.43 | 8.46 | 8.55 |
| RMSE(残余)↓ | 8.15 | 8.09 | 8.13 | 8.10 | 7.90 | 8.04 | 8.24 |
| 电动汽车(res)↑ | 0.70 | 0.69 | 0.72 | 0.70 | 0.70 | 0.70 | 0.70 |
| 电动汽车(残余)↑ | 0.75 | 0.764 | 0.765 | 0.76 | 0.77 | 0.75 | 0.74 |
从表可以看出
培训损失曲线。
正如我们从图可以观察到
众所周知,在雷达反射率图像,不同的颜色代表不同的反射率值。一般来说,明亮的颜色代表了大的反射率值,如红色和红色,这表明相应的降水或在这个地区降水的概率更大。来验证我们的注意力模型是否真的抓住了这些更多潜在的降水区域图像,我们吸引了注意力热图,相比他们在图与原图像
原始图像和相应的注意力热图。
在图
在对比实验中,我们使用相同的参数设置表中列出所有的模型
不同算法的实验结果。
| 模型 | RMSE | 电动汽车 |
|---|---|---|
| 双通道MAR-CNN | 7.90 | 0.77 |
| 双通道CNN与关注 | 9.46 | 0.70 |
| 双通道CNN | 9.48 | 0.70 |
| 单通道CNN(基线) | 10.29 | 0.63 |
| GBDT | 11.86 | 0.47 |
| 支持向量机 | 9.80 | 0.70 |
从表
此外,为了分析模型的预测效果在不同降水的水平,我们比较模型的预测结果与真实观测根据降水水平。此外,我们计算其平均值,分别如表所示
不同模型在不同降水预测平均水平。
| 模型 | 没有雨 | 小雨 | 中雨 | 大雨 | 暴雨 | 大的大雨 | 非凡的大雨 |
|---|---|---|---|---|---|---|---|
| 观察 | 0 | 1.13 | 3.47 | 10.14 | 26.87 | 44.03 | 58.97 |
| 双通道MAR-CNN | 0.06 | 0.16 | 2.30 | 12.34 | 24.80 | 32.99 | 50.23 |
| 双通道CNN与关注 | 2.50 | 3.27 | 6.76 | 11.24 | 25.60 | 32.64 | 47.38 |
| 双通道CNN | 0 | 0.01 | 0.97 | 9.23 | 24.21 | 28.03 | 49.21 |
| 单通道CNN(基线) | 5.09 | 3.99 | 7.34 | 12.52 | 23.91 | 32.20 | 48.33 |
| GBDT | 7.55 | 8.24 | 11.09 | 12.63 | 21.53 | 25.47 | 27.31 |
| 支持向量机 | 4.06 | 2.95 | 6.15 | 11.38 | 22.48 | 30.01 | 46.45 |
观察从表
根据上面的分析中,一般来说,我们的MAR-CNN达到准确的降水预报时符合实际观测降水水平低于暴雨级别。随着降水水平继续提高,预测降水由MAR-CNN不匹配实际情况很好,但它仍然是最好的与其他方法相比。这些分析说明剩余连接在MAR-CNN多线程关注我们设计可以突出重点领域的雷达反射率图像,同时保留图像的全局信息,因此该模型取得了最好的预测效果。
接下来,我们为每个降水水平绘制模型的误差曲线如图
每个模型的误差曲线在不同降水水平(我第七∼匹配表中提到的降水水平
从图可以看出
提出了一种双通道多线程注意力模型结合基于深度学习剩余的连接。广泛的实验验证,通过添加多线程CNN,模型可以提取本地雷达反射率图像精确的空间特性。同时,引入的残余连接可以保留全球信息基础上的关注。结果表明,全球和地方特色都是降水预测具有重要意义。此外,第二通道提出了双通道网络可以有效地提取信息的移动速度、大小等的云。与其他算法相比,该模型具有更好的预测性能。此外,在实验中,模型的训练收敛快速和稳定。结果,提出了双通道MAR-CNN模型提供了一个新的有效的降水预报的时空特征提取方案。
在我们的研究中,发布的数据CIKM AnalytiCup 2017的链接
清颜,阜新市霁是第一作者。
作者宣称没有利益冲突有关的出版。
清颜,阜新市霁的贡献同样。
这项工作是由美国国家科学基金会支持中国。61602002)和安徽省自然科学基金(批准号1808085 mf209)。