文摘
快R-CNN架构是用来解决问题的移动路径的不确定性,多变的报道,在冷空气引起大规模的密集和高复杂性温度下降(ITR)检测和分类,因为这些问题通常导致路径识别偏差以及低识别算法的精度和泛化能力。本文改进了识别方法的国家ITR (NITR)路径在中国基于快R-CNN复杂气象系统提出了。首先,质量控制的原始数据集强大的冷却过程进行数据过滤的手段。然后,根据NITR标准和NITR的特点,NITR数据集在中国建立了通过强化温度下降地区位于空间变换。同时,考虑到Softmax分类方法的正则化参数的选择将导致概率计算的问题,支持向量机(SVM)是用于道路分类来提高分类的信心。最后,提高更快R-CNN模型用于识别、分类和定位的路径NITR事件。实验结果表明,与其他模型相比,改进的快R-CNN算法大大改善了NITR的路径识别的性能,特别是对于混合NITR路径和单一NITR路径。因此,提高更快R-CNN模型计算速度快,识别精度高,鲁棒性好,和NITR路径识别的泛化能力。
1。介绍
中国位于欧亚大陆的东部,毗邻西北太平洋,显著影响突出亚洲季风系统之间的热梯度来自大洋(太平洋和印度洋)和土地(亚洲大陆)[1]。中国气候通常展品多尺度可变性,从周日到十年(2),由于各种大气环流系统之间的复杂的相互作用包括西太平洋副热带高压、南亚高、中纬度地区高水平喷射,阻塞高压,台风和源调制包括ENSO (3),印度洋海面温度(4],在青藏高原积雪[5,在极地海冰6]。
在冬天,中国经常受到冷空气的影响(CA)过程尤其是对东北和西北地区,这可能会导致巨大的经济损失和严重的健康威胁。2008年1月,中国南方的大部分地区遭遇了一个极端的寒冷时期伴随着严重的降雨和降雪(7,8),带来了严重的交通和能源压力。不幸的是,这种寒潮发生在春节旅游旺季,因此许多人不得不呆在火车站或机场好几天,不能回家。
全球变暖的背景下,亚热带极端冷事件不断增加而不是减少由于西风减弱射流与降低温度梯度之间的极性和热带地区9,10),因此CA事件成为一个热点话题在当前气候研究[11]。一般来说,CA的研究可以分为三个领域:案例研究、天气动力学研究和气候动力学研究。案例分析主要集中在时空特征和相关的物理机制在某些极端CA事件(12- - - - - -14]。在天气动力学的角度,强度,持久性和CA的空间覆盖事件取决于复杂和非线性相互作用在不同的循环系统(15- - - - - -17]。灵敏度与气候诊断分析和数值实验中,CA的气候背景事件和关键外部营力的作用可以被理解18- - - - - -21]。同时,从空间的角度影响,CA事件可以分为国家和区域的过程,和前可以覆盖更大的地区,具有较强的对经济和社会发展的影响。由于大规模的CA事件频繁发生2000年之后,气象学家的兴趣近年来国家CA进程是推动。
尽管CA的研究已经取得了很大的进步在过去的几十年里,特别是调查subseasonal过程引发强冷空气的作用已深,如何识别的常规CA入侵和相关强化温度下降(ITR)仍不清楚。事实上,大多数的轨道移动天气系统很难用简单的统计方法检测。甚至对于一些单一的实体系统,如台风,确定准确的道路也非常困难22]。3月的CA和ITR,考虑到每个空气粒子都有自己的道路,CA的复合途径实际上反映了所有粒子的统计特征,这是无形的和艰巨的计算。在传统的CA和ITR监控操作,常规的通常是和主观评判预测(23),这显然是不精确的。提高监测和诊断的准确性CA事件和大规模ITR,客观CA和ITR路径识别方法是急需的。事实上,ITR的轨迹反映CA的影响和有亲密联系气象灾害预防、和大规模ITR特别是国家ITR (NITR)通常会导致极其严重的伤害,所以,在这篇文章中,我们主要关注客观识别NITR路径。
在过去的十年里,人工智能(AI)技术已经取得了很大的进步在计算机视觉领域(24),语言处理(25,26),机器翻译(27),医学成像(28,机器人29日),和生物信息控制(30.医疗诊断[],特别是31日]。例如,它表现良好的无人驾驶(32)和识别精度高于人类的大脑图像和语音识别。作为人工智能的核心方法,机器学习是主要的方法来实现人工智能。机器学习是一个集各种算法,让电脑自动学习。它有助于计算机分析大样本数据集,获得规则,然后用这些规则进行分类或预测新数据。因此,它在许多领域引发了一个历史性的革命(33,34]。共同的气象研究、低温预测涉及到数值预报产品的组合和统计理论35- - - - - -37]。人工智能的兴起促进深度学习技术应用到气象要素预报,提高预测的准确性的核心研究问题。机器学习算法的延伸,深学习目前主要用于图像识别技术在气象学和有限的。如何更好地把它应用到智能无缝网格天气预报是一个迫在眉睫的问题。相比之下,建立预测方程逐点过去,深度学习可以直接建立整个元素的预测领域,不仅可以正确预测结果的数值模型还考虑元素的空间分布的连续性。它有一个非常可观的优势在发展中客观预报技术网格点,也更符合预测的预测的想法。
卷积的深度学习的神经网络模型,包括卷积神经网络(cnn) [38递归神经网络(RNNs) [],39),深层神经网络(款)和封闭的复发性单位(天鹤座)40),主要用于提取和识别气象要素场的图像特征。长期短期记忆(LSTM) [41)网络特别适合预测和分析大数据为气象时间序列和不断改善。
检测的准确跟踪NITR事件和做出合理的分类、更快R-CNN目标探测体系结构是用来解决问题的移动路径的不确定性,多变的覆盖率,和高复杂性。在此基础上,改进了基于更快R-CNN和支持向量机的识别方法。该算法采用SVM NITR路径的分类来提高分类的信心。最后,提高更快R-CNN模型用于识别、分类和定位的路径NITR事件。实验结果表明,与原算法相比,改进的快R-CNN算法大大提高了路径识别的性能,特别是对于混合方向和不完整的开发场景。一般来说,修改快R-CNN算法具有计算速度快,识别精度高,鲁棒性好,泛化能力NITR通路检测的实际应用。
本文的其余部分组织如下。部分2描述数据处理、整体架构和方法更快的R-CNN和密集NITR识别和分类的支持向量机模型,包括更快R-CNN网络、网络训练、识别和分类方法。部分3介绍了实验环境和方法用来评估和分析的性能改进更快R-CNN和支持向量机模型。部分4总结了纸。
2。方法
在本节中,我们详细描述我们的模型。首先,我们介绍一下这篇论文使用的数据和源区域的分工NITR事件。接下来,我们现在faster-RCNN模型的总体结构。最后,提高集约NITR faster-RCNN模型识别和分类。
2.1。数据和方法
根据中国日报数据集的表面观察温度(包括平均温度、最高温度和最低温度超过1995国家传统电台)从1月1日圣1961年12月31日圣,2018年,国家气象信息中心提供的1995个车站的表面观测数据处理简单的时间序列的调查,邻居插值,和孤立点检测的分析方法和不同站数据集的密集的温度下降过程生成。如图1,有一个比较原始数据和修改数据的国家传统站数据集从1961年到2018年。有无效值和失踪测量数据中的数据1(一),1 (c),1 (e),由简单的时间序列修正调查,邻居插值和孤立点检测的分析方法。修改后的结果如图1 (b),1 (d),1 (f)作为本文的原始数据集。
(一)
(b)
(c)
(d)
(e)
(f)
根据大量研究的结果与对中国重引起的大规模ITR冷空气过程,NITR事件主要是源于密集的冷空气入侵(CAI)从三个来源区域:西北、北、东北和中国。尽管所有CA的向南运动与北极涛动的负相,每条路径是由独立的循环系统。西北通道通常是由西伯利亚高,控制和常规与东北活动东北冷涡和鄂霍次克海高。朝鲜的存在路径可以归因于交互/西伯利亚高,东北冷涡之间的竞争。因此,三个来源的地区CAI可以预先分配,即。,the northwest region (73°E-95°E), the north region (95°E-115°E), and the northeast region (115° E-135° E) (see Figure2)。考虑到可能存在复合途径,实际上我们有七种NITR例程:单一西北(西北)、北(N),东北北部(NE)西北路径和复合+ (NW + N),东北+北(NE + N),西北+ (NW + NE)东北,东北和西北+北+ (NW + N + NE)路径。
2.2。国家密集的温度下降的认可
2.2.1。快R-CNN网络
卷积神经网络(CNN)已广泛应用于许多领域,如目标探测和语音识别。除此之外,该地区基于卷积神经网络(R-CNN),于2014年提出的罗斯Girshick [42),也表现良好,得到快速发展。R-CNN是一个典型的图像识别算法和基本方法使用地区的建议,,的基础上R-CNN,两个新技术,快速R-CNN更快R-CNN算法,进一步提出和改进。
一般来说,R-CNN算法可以分为四个步骤:(1)候选人地区一代,(2)特征提取,(3)类别判断,并细化(4)位置。首先,大量的视觉方法生成的候选区域,然后这些地区的高维特征向量与CNN由卷积操作方法。随后,这些特征向量被发送到一些分类,如简单逻辑回归和Softmax回归。后计算对象的重叠程度借据分数和边界框的候选区域,实现目标识别的候选框精制和位置。
相比与传统的目标检测算法使用滑动窗口来判断所有可能的区域,R-CNN算法提取一系列候选区域更有可能提前对象,然后提取特征只在这些候选区域(CNN)使用的判断,从而有效地减少后续的特征向量的计算,可以更好的处理规模问题。CNN的实现采用GPU并行计算,提高了计算速度和效率。此外,外围的回归一步盒改善目标位置的准确性。
2.2.2。国家密集的温度下降的认可
尽管R-CNN已成为图像识别领域的一个典型的算法,算法的瓶颈是,它需要长时间才能产生地区建议第一步。针对这一缺陷,faster-RCNN。至于新算法,提出了一项,它是一个网络基于卷积。它可以同时预测目标区域框和目标分数输入图像的每个位置,旨在有效地生成高质量的区域意见箱。外观等取代了以前的方法选择性搜索和盒子边缘。它整个图像的卷积特性检测网络,这样的检测区域推荐几乎是耗时的。因此,越快R-CNN用于NITR识别本文,此外,采用支持向量机(SVM)模型对NITR的类型进行分类。
(1)网络培训。快R-CNN算法包括RPN和CNN检测网络。摘要ZFNet [43]pretrained初始化检测网络的RPN和R-CNN更快。ZFNet的典型结构如图3。这个方法的pretraining过程介绍如下。(1)Pretraining CNN。ZFNet的典型结构由五个卷积层和两个完全连接(FC)层。添加一个池层后面卷积层,每一层的卷积过滤器的大小和步长略有不同。最后卷积层5层(5)ZFNet输出256通道特征图,和完整的连接层6(6)层连接256个频道的所有功能来生成一个单通道与4096年高维特征向量维度。不同类型的图像深度特性有很大的差异。的分类器是用于特征向量输出层5层6和7层,输出图像识别结果。(2)培训项。的pretrained ZFNet用于初始化的RPN,卷积和一个小层6(6层)与特定的函数添加原卷积后层5层(5)。在这一层,卷积操作特性映射的输出通过卷积层5层(5)进行了滑动窗口的方式和滑动窗口的形状是方形或矩形和重叠率是0.5。对于每一个图像的位置,9个固定维度和纵横比(1:1,1:2、1:2和1:2)是2:1。6层的输出作为输入的两个独立的完整的连接层,框回归层和箱分类层,最后乘以9。两个窗口的概率是属于目标或背景,和四个锅缩放参数乘以9。(3)培训快R-CNN检测网络。同样,ZFNet用于初始化检测网络,和该地区的建议获得RPN用作检测网络的输入。卷积特性提取由五层,并通过相应的功能映射压缩池层得到256通道特征图。串联的地图的特性是通过完全连接层6和完全连接层7最后由支持向量机分类。通过这种方式,是否有密集的温度下降在意见箱的类型和相关的位置。样品用于培训和多次微调,和更新层连接权矩阵误差反向传播的过程。最后,检测网络适合NITR识别。(4)项和更快的R-CNN卷积层共享。经过上述训练过程,两个网络仍然是相互独立的,因此有必要共享卷积层,这样的特性可以用于区域意见箱生成和目标探测。具体方法如下:(a)使用ZFNet生成独立项;(b)训练越快R-CNN检测网络产生的地区建议和网络参数(a)项;(c)应用R-CNN检测网络参数初始化的RPN越快。在这个时候,有必要注意设置共享的RPN卷积层的学习速率和更快的R-CNN网络为0,也就是说,没有更新这些卷积层,但只更新那些网络层特有的RPN和重新培训他们。然后,RPN更快R-CNN检测网络共享的所有常见的卷积层,使该地区推荐过程,有效减少了算法的运行时间。
(2)分类方法。支持向量机是基于统计学习理论的机器学习方法。通过寻求最低结构风险最小化经验风险和置信区间,这样系统可以获得更好的统计规则即使样本的数量很小。与传统的模式识别方法相比,支持向量机泛化能力强并能保证全局优化。支持向量机算法的核心思想是找到一个最优分类满足分类要求。
在现实中,大部分的分类是非线性的,和强大的冷却路径识别本文也是非线性的。此时,可以将非线性问题转化成线性问题在高维空间中通过空间的转换,和最优广义最优分类面或分类面转换后的高维空间中可以获得。使用核函数将线性不可分的低维空间映射到线性可分的高维空间。常见的内核函数多项式函数,径向基函数(RBF)和乙状结肠函数。本文使用RBF NITR路径识别算法,可以表示为 在哪里是内核参数。和是矢量。
NITR通路识别是一个multiclassification问题。给定一组训练样本,有必要将这些原始数据分为七类,即NW(标记为1),N(标记为2),NE(标记为3),西北+ N(标记为4)+ N(标记为5),西北+ NE(标记为6),东北和西北+ N +(标记为7),所以我们需要完全7 SVM分类器。在实践中,可以训练支持向量机,用于分类通过以下步骤:(1)第一是分类图像的特征提取;(2)一个简单的线性方法用于规范化特征向量,以防止大型数据波动控制数据扰动和小数据波动从被忽视;(3)使用RBF核函数选择核函数;(4)交叉验证方法选择参数C;(5)最优参数用于训练训练集得到支持向量机分类模型;(6)训练SVM模型用于分类和预测输出特征向量,和输出特征向量矩阵与支持向量机重量dot-multiplied矩阵得到的分数建议盒子在该地区,也就是说,NITR路径输入推荐框在该地区。
(3)识别和分类方法。从上面的网络训练过程和SVM分类方法,我们可以看到两个网络使用更快R-CNN识别份额卷积层。因此,整个识别过程只需要完成一系列的卷积操作,这是能够有效地实现区域的识别和解决长耗时的问题的建议。此外,支持向量机作为最终的分类器最小化经验风险和置信区间,可以获得更好的统计规则的样本数量很小。更快的R-CNN和SVM模型的结构显示在图4。首先,模型的结构与项可用的数据提取功能上实现卷积层。其次,从卷积特性映射层进入RPN并生成大量的区域性特征地图上意见箱。应该注意的是,对于每个特征图的位置,9个候选窗口固定规模和比例。第三,nonmaximum抑制是应用于RPN-generated地区意见箱,和200箱得分越高被保留。第四,越快R-CNN识别网络从图像中提取特征向量在该地区建议框,输入完整的连接层,然后输入到支持向量机分类器来计算每个区域意见箱的分数。最后,快R-CNN识别网络改进地区意见箱回归。
3所示。实验和分析
检查的性能和有效性NITR识别基于快R-CNN模型、构造深度学习实验使用Python 3.7。实验的CPU是一个英特尔酷睿i5 @ 2.30 GHz, 8 GB的内存,操作系统是64位Windows 10。提出的混合速度R-CNN模型默认参数设置;中的数字1圣卷积层是64;过滤器尺寸在1圣卷积是3层;池的大小是2;辍学率是0.46。
实验的过程越快R-CNN模型包括数据采集、数据预处理、特征重要性评估,模型训练、模型测试和模型评估。数据预处理包括数据归一化、训练集分区测试集建筑、和时间序列建设。数据预处理后,使用训练数据生成模型,通过优化调整网络权重函数最小化模型的损失函数,直到迭代次数达到设定的值。然后,训练模型应用于测试集数据和模型的性能测量的平均精度(美联社),意味着平均精度(地图),和其他评价指标。
3.1。数据集
如何描述NITR事件包括冷却振幅的气候特征和相关报道在NITR路径识别是一个重要的问题。在中国气象局发布的国家标准,选择每日最低温度的变化来反映重型CA或寒潮过程的强度。因此,每日最低温度的时间序列在1995年全国传统电台选择这里作为原始数据集。
表1显示的分类stational ITR参照中国国家标准(GBT 20484 - 2017)。根据这个标准,线性插值方法选择为国家电网分析和图片站数据;497年NITR过程生成从1961年到2018年,共有3434目标图像。图像大小为800×800像素,像素和存储格式是JPG。
严格的选择后,完全有2800完全合适的图片,注明LabelImg工具,NITR记录的位置。根据预先指定的类型的NITR路径,数据集分为7个不同种类的NITR过程:西北,N, NE、NW + N + N, NW + NE、NW + N + NE,如图5。按照8的比例:1:1,数据集分为训练集(80%),验证组(10%),和测试组(10%)。这三个数据集是独立和相互排斥的,用于训练,参数优化,分别和绩效评估的目标探测模型。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
3.2。模型训练
为了提高目标模型的训练速度和收敛性能。首先,ImageNet数据集预处理将训练集和验证集数据转化为TFRecord格式。然后,训练开始基于TFRecord数据文件。在培训过程中,解决如下关键参数:批处理大小是64;图像大小比例是224×224像素像素;培训周期为85;在每个迭代周期的数量是10000和迭代的总数是850000;动量因子是0.9;重量衰减系数为0.0001;最初的学习速率是0.01。 The learning rate is attenuated by using the segmentation constant, and the final learning rate is faded to 0.00001.
最后,随机梯度下降方法用于部署目标探测模型。网络训练过程中,共有2240张图片在训练集;动量因子是0.9;重量衰减系统是0.0005;最初的学习速率是0.0001;衰减率是0.9和迭代的总数是6000。
3.3。评价
客观地评价NITR路径类型识别模型的泛化能力,美联社和地图标准作为测量观测值和预测值之间的推导。在本文的应用场景,NITR事件被设置为正样本和对应的背景负样本。强大的冷却路径的数量之间的比例正确检测到整个数量的预测模型和强烈冷却跟踪精度定义为(P),这是用来测量阳性样本的识别能力。回忆(R)被定义为正确识别出的数据的数量的比率的某种强烈的冷却通道测试集数据的总数如此强烈的冷却通道,用于衡量积极的报道样本。
平均精度与准确性和回忆。它的积分精度召回曲线与坐标轴,用于测量模型的识别效果。值越大,越强大的冷却路径的识别效果。值能够反映平均值multicategory强大的冷却路径识别的准确性。同样,值越大,模型实现的准确性就越高。(1)美联社可以更直观地显示了分类器的性能,这是定义在以下方程: 在哪里精度是一个函数的函数 。面积的函数曲线与坐标轴之间的平均精度。(2)精度和召回的计算公式如下: 在哪里准确率;召回率。是真正积极的数量样品,等样品观察的积极成员也要积极的样品通过识别模型,预测是正确的。假阳性样本的数量,等样品实际上负成员观察判断作为正样本模型,预测是错误的。是错误的数量负的情况下,此类案件的事实是有利的,但判断负样本的模型,从而错误地省略了这些样品。(3) 定义在以下方程: 在哪里代表平均精度和是被探测到目标的数量。有7个检测目标。
3.4。性能和分析
快R-CNN和R-FCN模型训练训练集样本,和训练模型的性能相比,我们的新模型在本文提出。
表2显示了这三个模型的性能比较。的准确性,NITR路径的平均模型的准确性高于1.7%和1.4%速度R-CNN R-FCN,分别,有较强的特征提取能力和准确位置回归。在实时效率方面,图像帧每秒处理的数量作为测量速度指数。由于特征提取网络的轻量级的设计和检测头在我们的模型中,网络复杂性降低,推理速度的3.4倍和1.7倍的速度R-CNN R-FCN,分别。网络规模而言,我们的模型的存储空间是85 MB,低于更快R-CNN (112 MB)和R-FCN (91 MB)。实验结果表明,新模型具有显著的优势,超过更快R-CNN和R-FCN平均精度,检测速度和网络规模。
NITR事件在许多情况下,出现混合NITR路径和一些单一NITR路径,这给严重的冷却路径的识别带来困难。为了区分多个强烈冷却在不同方向和模式识别精度的完整发展,160个样本是随机选择的每个细条件和输入R-CNN更快,R-FCN,和我们的模型,分别识别测试。结果如表所示3,平均精度的模型识别混合NITR路径和单一NITR路径在不同的方向是86.3%和87.6%,分别和两种情况的平均值是86.95%。所有的三个指标都高于R-CNN和R-FCN模型越快。这是因为我们的模型使用卷积核的大小不同的操作,拥有强大的多尺度特征提取能力。红外系统单位融合不同尺度特征信息加强目标特征的表达能力。在这种情况下,各种强大的冷却路径在不同方向和不完整的开发过程可以有效地确定即使地图上的语义信息丢失特性。
数据6和7展示我们的模型的识别效果单一和混合NITR路径中强大的冷却条件下。图6显示了一个示例的单身NITR路径和图7显示所有模型混合NITR路径的性能。可以清楚地看到,我们的模型能够准确地检测NITR路径的类型在不同的环境中。
(一)
(b)
(c)
(一)
(b)
(c)
4所示。结论和未来的工作
深度学习技术的发展,一种改进的中国国家ITR路径的识别和分类方法的基础上,加快R-CNN和支持向量机模型在复杂气象系统计算速度快,识别精度高。纸的方法提高NITR路径的识别性能。首先,质量控制的原始数据集强大的冷却过程进行数据过滤的手段。然后,基于中国国家标准(GBT 20484 - 2017),线性插值方法选择为国家电网分析和图片站数据;497年NITR过程生成从1961年到2018年。同时,Softmax分类方法的正则化参数会导致近似概率计算的结果,所以分类支持向量机用于路径,可以获得更好的结果时,样本的数量很小,确保全局优化,提高分类的可靠性。
实验结果表明,与其他模型相比,更快的R-CNN和SVM模型的存储空间是85 MB和识别速度是11.1 f / s,它有效地降低了网络规模并显著提高了识别速度。此外,新模式的地图是86.5%,1.7%,和1.4%高于快R-CNN R-FCN,分别。同时,具有良好的泛化性能的混合路径和单一NITR路径。因此,提高更快R-CNN模型新方法在气象应用NITR路径的识别。
在未来,随着深度学习的发展技术和云计算,我们将学习迁移模型的方法计算任务摘要边缘设备,包括移动边缘计算(44)、隐私意识到机器学习应用程序的部署(45),和动态资源分配(46]。然后,我们尝试使用边缘设备的闲置计算能力共享计算云服务器压力,提高计算效率。
数据可用性
在研究过程中使用的数据和模型可从相应的作者的请求。
的利益冲突
作者宣称没有利益冲突有关的出版。
作者的贡献
明杨和郝马概念化的研究。郝马进行数据分析。明杨和郝马写了初稿。所有作者已阅读及同意发布版本的手稿。
确认
这项工作是国家重点支持的共同研究和发展计划(批准号浙江省2018 yfc1505601)基本公共福利项目(批准号LGF19D050001),浙江省重点研究和发展计划(批准号2021 c02036),浙江气象服务的关键项目(批准号。2020 zd14 yyzx09 2021和2018 zd03)。