文摘
台风造成了严重的经济损失和人员伤亡在世界各地的沿海地区。热带气旋的大尺寸样品通过随机模拟可以有效地评价台风灾害风险,和台风全履带式模型为台风随机模拟是最受欢迎的模型。基于机器学习的优势在处理非线性问题,本研究利用反向传播神经网络(摘要)取代回归模型在实证追踪模型中,重新确立跟踪和强度预测的神经网络模型在随机模拟台风,台风和构造完整的作业活动1000年西北太平洋盆地。验证结果表明,摘要可以提高台风路径和强度预测的准确性。
1。介绍
台风是一个强大的灾难性的天气系统,发生在热带海洋。这是通常被称为西北太平洋台风。大风等灾害,暴雨和巨浪造成的台风导致了严重的社会和经济损失和人员伤亡在沿海地区。中国东南沿海地区的台风影响最严重的地区之一,在世界上。从1983年到2008年,平均每个中国的台风造成的经济损失每年约250亿人民币(元),和损失显示一个明显的增长趋势1,2]。以2016年台风柳安木为例,它降落在厦门,福建,在福建和浙江两省304万人受灾,直接经济损失为210.73亿元(3]。因此,台风风险的准确评估是非常重要的国家防灾减灾4]。
台风风险分析具有较强的统计特征,结果往往受限于样本的大小和质量。因此,随机模拟的方法扩大热带气旋(TC)国际台风风险评估了样本(5),已逐渐成为台风风险评估的一个重要研究领域。一般采用台风风险分析步骤如下:首先,热带气旋的特点(TCs)从历史数据中提取的建设台风随机模型。然后,丰富虚拟台风是由随机模型模拟的台风样扩张。最后,通过扩大样本区域风险分析完成。两个最被广泛接受的模式台风随机模拟是圆形次区域模型和实证追踪模型。
圆形次区域模型台风风险分析的传统方法。它最初是由罗素实现6)的台风风速估计德州海岸(美国)。自那时以来,许多研究人员(7- - - - - -13)已经做了很多研究工作循环区模型。他们分析了台风风险结合不同的台风风场模型对不同的研究领域,取得了良好的效果。早些时候,在中国,一些研究人员(14,15)也使用这个模型来分析台风风险。其基本步骤如下:首先,历史台风事件影响研究网站提取基于圆区,和台风关键参数提取,例如,中央压差,翻译速度,风暴标题,和年度出现率。接下来,最优概率分布是适合每个台风关键参数的概率分布拟合。第三,蒙特卡罗方法用于样品从每个概率分布,生成大量的虚拟台风的关键参数,并把它们形成虚拟台风事件。第四,虚拟台风的风速是台风风场模型,计算了台风的最大风速为一个网站可以获得。最后,不同的返回时间的极端风速为研究站点可以预测的极值分布。圆形次区域模型一般适用于TCs的小规模地区有足够的历史数据,不能胜任未来气候变化下台风风险分析(4]。
实证追踪模型是由维克瑞et al。16)这是台风的发展的起点全履带式模型。他们把整个大西洋盆地分为不重叠的单位,然后构建实证模型基于回归分析的跟踪和飓风强度从历史TC每个单元中的数据。有许多研究[17- - - - - -27]因为台风风险分析基于实证追踪模型。风速在美国建筑规范的设置也是基于这个方法(28]。圆形分区域模型适用于分析台风风险一个站点或在一个小区域,因为它取决于假设台风气候一致性在小范围之内。然而,经验可以产生一个完整的台风路径跟踪模型。因此,它适合于分析台风风险在一个大区域。虽然有许多不同的经验跟踪模型中的建模方法,基本思想是相似的。首先,模拟的道路段(生成模型、运动模型、强度模型,和灭绝的模型),然后组合成一个完整的TC跟踪。每个段的物理意义的实证追踪模型是非常清楚的。可以说,实证追踪模型是最潜在的随机模型对台风的风险进行评估。
安是分布式并行信息处理的算法数学模型通过模仿动物神经网络行为特征(29日]。安有很强的学习能力,善于模拟非线性系统,它适用于预测台风跟踪和强度。在许多训练算法中,反向传播神经网络(摘要)仍是使用最广泛的模型之一(30.]。摘要利用基于多层前馈神经网络的反向传播学习理论。具有结构简单、稳定的工作状态,容易实现。近年来,许多国际研究人员应用人工神经网络(ANN)基于大规模数据预测台风路径、强度(30.- - - - - -34]。王等人。30.摘要]用于在西北太平洋台风路径预测盆地。他们规范化TC数据和输入成摘要,打破长期人工建筑的限制的预测因素。Baik [35摘要]用来预测台风强度,并与回归方法。摘要的结果表明,该预测误差小于的回归方法,这表明摘要台风强度的前景预测。周et al。36]预测台风跟踪与改进的BP模型。结果表明,ANN预测的风暴标题之间的符合率和实际的TC路径是97%。邵et al。37)利用BP模型预测台风跟踪中国沿岸和比较预测结果与气候学和持久性(夹)模型。结果表明,BP模型的预测精度高于剪辑的模型。
传统的经验跟踪模型采用统计回归方法预测台风路径和强度,这无法逃避一些预测错误。安法具有更好的自适应学习和非线性映射能力。它更适合处理非线性问题复杂的物理机制,因果关系,或推理规则。因此,本研究打算使用摘要重新建立的预测模型在随机模拟台风台风路径和强度,提高台风路径和强度预测的准确性,然后提高台风风险分析的准确性。
2。方法
2.1。经验跟踪模型
暴风雨实证追踪模型是由维克瑞et al。16),它描述了翻译速度的变化c,风暴θ,强度我在两个相邻时刻的台风。模型描述如下: 在哪里一个1,一个2等是常数;Ψ代表台风中心的纬度(°);λ代表台风中心的经度(°);c飓风翻译速度(米/秒);θ是风暴标题(°);我飓风相对强度;我1,我,我+ 1代表不同的时间步长;之间的时间间隔我+ 1,我6小时;Δlnc= lnc我+ 1−lnc我和Δθ=θ我+ 1−θ我;T年代我是每月平均海面温度(SST,°K);和εc,εθ,ε我与零均值随机误差项。
台风相对强度的概念提出了达林(38)基于卡诺热机循环的原则。相对强度表达如下: 在哪里p达是环境压力(hPa);p直流的最低可持续的表面价值是中央干分压(hPa);pc台风中心的压力(hPa);和e年代饱和蒸汽压。
维克瑞et al。16)整个大西洋盆地分为5°×5°网格。基于每个网格的飓风历史数据,系数一个1,一个2回归模型安装等。此外,他们杰出的东风和西风为首的风暴和获得两组不同的模型系数。对于一些网格细胞与飓风太少的历史数据,拟合回归模型是不可靠的,所以附近的网格单元的可靠的回归模型使用。
最初的经验跟踪模型有许多系数为每个网格单元需要估计。李和香港22简化了风暴轨迹建模的维克瑞et al。16)基于ArcGIS中实现的地理加权回归方法(39),验证了简化模型的有效性。简化跟踪建模定义如下:
2.2。摘要利用反向传播神经网络
人工神经网络(ann)模型的任何对应输入和输出而不考虑它们之间的相互作用机理(40]。它处理信息通过调整大量的内部节点之间相互连接的关系(或神经元)(29日]。读者可以参考(29日,41]关于安的更多细节。
本文采用BP神经网络,广泛应用于人工神经网络,包括输入层、隐层和输出层(图1)。摘要利用来源于中立网络,信息数据传递前馈从输入层到输出层,然后,错误传播。BP算法实际上是一种广义的最小均方算法(30.,42]。它使用梯度最陡下降技术递归解决网络的重量和每个节点的阈值标准的均方误差最小化网络的实际输出和期望输出。前馈过程中,信息数据输入到输入层的节点,然后传输到输出层处理后的隐藏层(见图1)。若输出层的实际输出不匹配目标输出,结果误差的反向传播阶段(图1)。总是很难确定隐层数安。施罗德et al。43)表明,一个隐藏层对于大多数用途都足够了。因此,只有一个隐藏层用于这项研究为简单起见。
我们选择最常用的“最大平方误差(MSE)的性能函数BP网络训练,可以评估网络的模拟性能。 在哪里yt产出和目标吗ct是网络的输出。一组相对应的输入向量和目标输出向量构成网络的训练模式,米代表总数的训练模式,问在输出层神经元的数目。输出层的误差backpropagated并分配给所有节点的每一层作为调整每个节点的权重的基础。互连权重和偏见中迭代调整前馈反向传播过程和错误。迭代过程仍在继续,直到达到指定的收敛或者预定的学习次数(44]。
3所示。材料
历史台风数据集用于这项研究来自提供的热带气旋年鉴》由中国气象局(CMA)(1949 - 2019年,tcdata.typhoon.org.cn)。数据首次发布的中国中央气象台(CCMB)(从1949年到1982年),然后发布的中国国家气象局(CNMB)(从1983年到1992年)。自那时以来,它已经被CMA维护和更新。所有热带气旋的数据库记录的相关信息通过自1949年西北太平洋和南海。它包含台风的位置和强度信息的时间间隔6 h,包括名称和数量的台风,台风中心位置(经度和纬度),中央的压力,2分钟意味着中心附近最大持续风速(垃圾、m / s)。
由于使用不同的风速计,数据从1949年到1970年是相对较大的与后来的数据。因此,使用前台风CMA提供的数据,本文修正了数据在1970年之前基于李的校正方法等。45]。热带低压和变性台风从历史数据集被淘汰46]。
在这项研究中使用的海温资料台风强度模型的中分辨率成像光谱仪(MODIS)海洋产品(47]。MODIS是一个关键的仪器在泰拉和阿卡卫星,用于衡量全球气候变化。
4所示。BP网络和培训
4.1。选择的输入数据和目标数据
首先,我们西北太平洋盆地分为5°×5°网格和网格如图2(一个)。然后,台风翻译速度的预测模型,建立了风暴标题,每个网格和强度基于历史台风数据在每一个网格。当历史台风在网格的数量小于15,系数或预测模型取代与最近的网格单元。影响台风路径和强度的因素很多,例如,台风位置,翻译速度,和风暴的台风前6小时,台风和海气界面的背景环境。指的是以前的研究(16,22)台风预测模型的翻译速度,我们选择台风翻译速度,风暴标题,和台风位置(经度和纬度)在前6小时时间,也就是说,c我,θ我,ψ,λ作为输入数据,和翻译速度下一个相邻的时间,也就是说,c我+ 1作为输出数据。风暴标题,预测模型的输入数据是一样的,台风的翻译速度模型,和输出的风暴标题下一个相邻的时间,也就是说,θ我+ 1。当选择的相对强度我和海洋表面温度T年代台风强度模型的输入数据,我们发现预测台风强度很容易跳。这主要是因为相对强度的计算公式过于复杂,神经网络是容易过度拟合历史台风数据较少网格中的细胞。因此,我们直接选择台风中心压力在前6小时和12小时时间和SST在前6小时的时间,p我,p我1,Ts我作为输入数据,和台风中心压力下一个相邻的时候,也就是说,p我+ 1作为输出数据。
(一)
(b)
(c)
4.2。建立的BP模型
培训模式台风翻译速度的预测模型c我,θ我,ψ,λ,c我+ 1。这风暴标题的预测模型c我,θ我,ψ,λ,θ我+ 1。P我,p我1,Ts我,p我+ 1形成了培训模式对台风强度模型。基于历史台风CMA的数据的统计结果数据,训练模式的数量东风和西风为首的风暴在每个网格数据所示2 (b)和2 (c)。
有许多摘要模型中的待定参数,例如,在每一层的节点数神经网络的激活函数,和培训功能。
输入(输出)层的节点数取决于输入(输出)的维数向量。研究成果的基础上,维克瑞et al。16和李et al。22),本研究建立了不同中性网络为每个台风翻译速度模型,风暴标题模型,和强度模型考虑对应不同的训练模式的输入和输出向量,如表所示1。
还有没有更好的方法来确定隐层节点的数量。太少的节点会使网络性能差,和太多的节点将延长培训时间和容易过度拟合。因此,节点通常是逐渐增加或减少在培训过程中,直到达到要求的精度。调试后的试验和错误的方法,确定隐层的节点数为10(只有一个隐层)。当隐层的节点数是10,对于大多数网格细胞之间的相关系数神经网络预测结果和实际结果是最大的,和均方根误差是最小的。
4.3。评价指标
为了评估在不同的神经网络模型的预测结果,相关系数(R)和均方根误差(RMSE)之间的预测和目标结果本研究采用。的计算公式如下: 在哪里表示网络的预测结果代表实际观察到的结果。预测结果的平均值, 。 表明实际观察结果的平均值, 。相关系数是用来评估之间的相关性的强度预测和观察到的结果。越接近绝对值|R| 1,相关性越强。的RMSE代表之间的误差值的预测和实际观察。误差越小,更准确的预测价值。
5。培训和验证结果
5.1。训练的结果
图3显示了比较之间的相关系数为每个网格单元不同的神经网络模型。图3(一个)显示了不同的台风翻译速度模型的比较结果,图3 (b)显示不同的风暴标题模型,和人物3 (c)显示不同的中央压力模型。的统计结果R和RMSE每个台风预测模型如表所示2。
(一)
(b)
(c)
我们可以看到从表2的预测模型,对于台风翻译速度,平均相关系数从ANNa2是最高的,平均RMSE是最小的。因此,采用ANNa2台风翻译速度的最优预测模型。风暴的预测模型,预测结果比ANNb1 ANNb2更好。因此,选择ANNb2风暴标题的最优预测模型。台风中心压力的预测模型,预测结果比ANNc2 ANNc1更好。因此,ANNc1选为最优预测模型台风中心的压力。
为了反映神经网络预测模型的优点,我们比较相关系数和RMSE从神经网络预测模型与传统的回归模型的结果(22]。神经网络的最优预测模型台风翻译速度,风暴标题,和中央的压力ANNa2, ANNb2, ANNc1,相应的回归模型公式1 (一个),公式3 (b分别),下面的公式:
图4显示了不同的相关系数(或RMSE)台风翻译速度预测的BP模型(ANNa2)和回归模型(公式1 (一个为每个网格单元)。伊斯特利领导风暴的预测结果的比较数据所示4(一)和4 (b)为西风,风暴所示的数据4 (c)和4 (d)。从数据可以看出4(一)和4 (c)为每个网格单元,台风的相关翻译速度BP模型的结果与观测值比回归模型的结果对东风和西风风暴。数据4 (b)和4 (d)表明,对于每个网格单元,RMSE台风的翻译速度之间的BP模型和回归模型的观测值小于东风和西风风暴。上述表明,预测台风的翻译速度,BP模型的预测结果优于回归模型。
(一)
(b)
(c)
(d)
图5显示了不同的相关系数(或RMSE)的风暴标题预测的BP模型(ANNb2)和回归模型(公式(3 b为每个网格单元)。伊斯特利领导风暴的预测结果的比较数据所示5(一个)和5 (b)为西风,风暴所示的数据5 (c)和5 (d)。从数据可以看出5(一个)和5 (c)为每个网格单元,风暴标题的相关性之间的BP模型和观测值的结果比回归模型的结果对东风和西风风暴。数据5 (b)和5 (d)表明,对于每个网格单元,RMSE风暴标题之间的BP模型和回归模型的观测值小于东风和西风风暴。上述表明,风暴标题,预测的BP模型的预测结果优于回归模型。
(一)
(b)
(c)
(d)
图6给出了相关系数的差异(图6(一)),RMSE(图6 (b))台风中心压力预测的BP模型(ANNc1)和回归模型(公式(7为每个网格单元)。从图可以看出6(一)对于大多数网状细胞,台风中心压力的相关性BP模型的结果与观测值比回归模型的结果。图6 (b)表明,对于大多数网格细胞RMSE台风中心压力之间的BP模型和观测值小于的回归模型。上述表明,预测台风中心的压力,BP模型的预测结果优于回归模型。
(一)
(b)
5.2。BP模型的验证
构建一个虚拟的台风的过程是先将西北太平洋盆地划分为5°×5°网格,然后建立神经网络预测模型(或统计回归预测模型)台风翻译速度,风暴标题,和强度(中央压力)基于每个网格的历史台风数据。第三,基于历史台风的起始点的分布,虚拟台风的起点是随机选择初始化台风路径。第四,台风跟踪和强度预测模型网格的台风所在地是用来预测下次台风的位置和强度。最后,可以获得完整的台风路径重复第四步。
基于上述方法构建一个虚拟的台风,我们构建了一个虚拟数据集1000年西北太平洋台风流域基于BP模型,包括32693个虚拟台风事件。图7显示了虚拟的比较和观察到台风的痕迹。图7(一)显示所有观察到的台风跟踪(总共2384台风事件)1949 - 2019。图7 (b)显示了71年台风台风跟踪随机提取虚拟数据集由BP模型。比较结果表明,虚拟的分布与观测台风台风跟踪几乎是一致的。然而,由于终止虚拟台风是人为地设置为1002的台风中心的压力,它是相对均匀而结束时观察到的台风台风路径。
(一)
(b)
超级台风“利奇马”,于2019年登陆中国,作为一个例子,我们使用了构造BP神经网络模型来预测12台风跟踪“利奇马”一样的初始状态,预测和观察台风路径图所示8。从图可以看出8多数虚拟台风的移动趋势跟踪与观察到的台风路径是一致的,和一半的台风非常接近观察台风路径,表明虚拟台风跟踪由BP神经网络模型是可信的。
进一步验证虚拟台风的可靠性数据集构建基于BP模型,我们首先选择46研究站的空间间隔100公里中国东海岸,如图9。然后,我们提取台风事件影响每个车站的虚拟数据集和历史台风台风数据集,分别。提取方法是划定一个圆形次区域半径250公里,每个车站为中心的圆。当台风经过循环区,它将被视为一个台风事件影响车站。李和香港22,25和维克瑞等。48)也使用圆形次区域的半径250公里。第三,台风事件的关键参数是计算最接近每个车站,包括台风发生年率,翻译速度,和风暴标题,而且,这些参数的平均或标准偏差统计。台风中心压力的参数被定义为最小值的台风中心250公里次区域内的压力。此外,我们还构建了一个虚拟数据集1000年西北太平洋台风盆地相比基于回归模型和BP的统计结果与模型。
图10比较关键参数的均值和标准差的台风模拟BP模型(数据10(一)和10(c))或回归模型(数据10(b)和10(d))和观察每个研究站中国沿海地区台风。总的来说,虚拟台风由BP的统计特征模型或回归模型与观察到的台风是一致的。年均发生,BP模型的统计结果与观测结果有很好的一致性,而统计回归模型的结果是不同的观察结果沿海的浙江、福建和广东省。台风的中心压差,BP模型的统计结果与观测结果有很好的一致性,而统计回归模型的结果从观察到的结果略有不同的福建和广东沿海。台风翻译速度,统计结果从两个不同的模型不匹配的观察结果沿着海岸辽宁、河北、山东,而统计回归模型的结果更糟在河北和山东北部海岸。对于风暴标题,从两个不同的模型统计结果与观测结果相匹配。我们可以得出这样的结论:虚拟台风由BP模型和回归模型复制的统计特征在中国沿海台风,和BP模型更有效。
(一)
(b)
6。结论
人工神经网络具有更好的自适应、自学习和非线性映射能力,这是更适合处理复杂的非线性问题。本文利用BP神经网络来取代原始台风经验回归模型跟踪模型和预测模型重建台风台风路径和强度的随机模拟。台风预测模型的翻译速度,风暴标题,和台风中心的压力,不同的输入和输出因素被用来建立不同的BP模型,并通过模型评估选择最优模型。基于最优模型台风翻译速度,风暴,台风和台风中心的压力,本文构造虚拟的事件1000年西北太平洋盆地。验证结果表明,摘要可以提高台风路径和强度的预测精度。
数据可用性
本研究的数据来自CMA-STI(中国气象局上海台风研究所)最好的跟踪数据集对西北太平洋热带气旋(http://tcdata.typhoon.org.cn)。
的利益冲突
作者宣称没有利益冲突。
确认
这项研究由山东省自然科学基金资助(批准号。ZR2021QD108和ZR2019QD018),中国国家自然科学基金(批准号。41776020,41776020,61602188),中科院海洋科学技术重点实验室操作(批准号OOST2021-05)、科学研究基金会的山东科技大学招聘人才(批准号2017 rcjj068和2017 rcjj069),和热带海洋的国家重点实验室,南海海洋学研究所,中国科学院(批准号LTO2115)。