文摘
四维变分资料同化(4 d-var)方法被广泛使用作为一个操作计划在主流数值天气预报(NWP)中心。除了整体数据同化方法,随机化技术仍然是用于诊断背景误差的标准差在变分资料同化(VAR)系统;然而,这样的随机化技术诱导采样噪声,可能污染的质量标准偏差。首先,本文研究了采样噪声引起的随机化技术的属性。结果表明,采样噪声在小范围内显示高频振荡的估计相比,估计这差别激励使用过滤技术来消除采样噪声影响。标准偏差的特点的控制变量也进行调查,和标准差字段不同的模型参数与垂直模型有不同的尺度和不同的水平。消除这种采样噪声,谱滤波方法广泛应用于操作系统和改进的空间平均方法调查。虽然这两种方法都有精彩的表现消除采样噪声、空间平均方法是更有效的,在操作系统更容易实现。此外,最佳的过滤空间平均方法的结果依赖于模型参数和垂直的水平,这是与标准差领域的变化一致。最后,空间平均方法是测试的操作系统在全球范围内基于YH4DVAR和全球数值天气预报系统,结果表明,空间平均方法对分析和预测质量有积极作用。
1。介绍
数据同化系统优化的组合观测和状态变量提供的短期预测的最佳估计大气的初始状态(1]。著名的报告数值天气预报(NWP)中心,欧洲中期天气预报中心(ECMWF)表明,同化观测贡献15%的影响分析,任何一个和互补的85%来自背景包含信息从早些时候同化观测(2]。从观察和短期预测相结合的信息和相应的误差协方差矩阵加权,观测误差协方差矩阵(R矩阵),背景误差协方差矩阵(B矩阵)。四维变分资料同化(4 d-var)方法是许多领先的数值天气预报中心使用的主流方案估算大气的初始状态的数值天气预报模式3]。4 d-var可以吸收非传统类型的观察,特别是从卫星和雷达,这些观测通常被认为是一个关键因素数值天气预报的质量的持续改进4- - - - - -6]。4 d-var系统,B矩阵有深远的影响的分析,因为它决定了重量之前的状态,从观察传播信息,实施均衡模型控制变量之间的关系(7,8]。
的规范B4 d-var系统矩阵是一个关键组成部分,但它仍然是一个巨大的挑战。模型的尺寸状态向量的顺序在当前的数值天气预报系统;因此,它是太大的B矩阵显式表示。缺乏知识的背景误差的统计特性也是一个限制。为了克服这些困难,一直努力接近B矩阵。操作变分资料同化(VAR)的系统,一般来说,B用控制变量变换矩阵必须建模(CVT)和代表作为运营商的产品形式, ,在哪里C背景是相关算子和错误是背景误差标准差[的对角矩阵9- - - - - -14]。考虑到标准差多个变量之间的约束,需要在VAR系统诊断的。费舍尔和朝臣15建议背景误差的标准差可以被随机化技术如果估计B矩阵形式 。标准差被广泛的随机化近似实现在当前操作中心(16]。
YH4DVAR系统操作确定4 d-var系统使用全球谱模式作为约束条件对同化的动态平衡17]。考虑到采样噪声引入的随机化技术具有负面影响的估计,在一个固定的波数谱滤波方法截断操作设置YH4DVAR系统解决了采样噪声的问题(18]。光谱滤波方法可以消除大部分的采样噪声,同时保留感兴趣的标准差。然而,当地的标准差的变化特征可以通过固定的波数截断被摧毁。在本文中,我们将介绍改进的空间平均方法来解决采样噪声的问题。
本文组织如下。首先,当前操作版本的背景误差协方差矩阵模型YH4DVAR系统介绍了部分2采样噪声的空间结构和局部标准差的变化的特点进行进一步的调查。在第三节、过滤的方法实现对操作系统和过滤后的结果。结果应用过滤的方法并给出了操作系统第四节。最后,结论跟随第五节。
2。动机
4 d-var系统,成本函数措施之间的距离模型和观测同化窗口轨迹。成本函数(19可以写的增量通过 在下标t是时候指数,是增量,是切线性模型的增量发展从最初的时间指数吗t。和是背景误差和观测误差的协方差矩阵指数在时间吗t,分别。是创新向量在每个时间步长, ,在哪里是观察向量,背景时间指数吗t,是观测算子的线性近似 。
为了简化背景项 ,最领先的数值天气预报中心CVT的B矩阵建模框架。一般CVT的协方差矩阵可以写成一个特征向量分解(20.]。在VAR系统可以建模为B矩阵 ,这不是计算隐含的同化,但运营商明确吗 。运营商的建设背景误差协方差建模是一个挑战,目前分解为参数变换,横向变换 ,和垂直变换在操作设置21]: 在哪里介绍了平衡约束的同化和参数被认为是近彼此不相关的(22- - - - - -24]。因此,背景误差协方差矩阵可以被建模 ,的矩阵的协方差 。
2.1。随机化技术和采样噪声
YH4DVAR运营系统,控制变量包含涡度 ,散度 ,表面的温度和压力 ,和特定的湿度 。的矩阵变换 成 ,的参数对应的不平衡组件控制变量;因此,被认为是一个block-diagonal矩阵参数之间没有相关性。因此,背景误差协方差矩阵可以写自协方差矩阵的显式和参数变换 , ,与背景自协方差矩阵为每一个变量。VAR系统,它是至关重要的输入背景误差的标准差控制变量的自协方差矩阵估计B矩阵,其他变量的标准差是隐式的参数变换。
费舍尔和朝臣认为随机化技术可以用来诊断背景误差的标准差在同化系统中,从而减轻对平衡的影响条件背景误差的相关性(15]。B矩阵的形式 ,背景误差的标准差可以估计的样本标准差模型向量,应用一组的N(N= 10)随机向量 从高斯分布 。图1显示了涡度标准差领域获得的约1000 hPa随机化技术。数据1(一)- - - - - -1 (f)对应的原始估计获得10,50岁,100年,200年,1000年和10000年样本,分别的 , , , , , 。采样噪声往往是一个规模相对较小的特征这样估计强烈恶化,采样噪声显著降低当样本容量增加到50的主要涡度标准差的大规模的特征字段捕获。涡度估计的值更小在热带地区和七区和更高的纬度高的地区,特别是在南半球 。随着样本数量的增加,采样噪声大大删除,标准偏差场的规模是可见的。当样品的数量达到1000,估计就不再有意义的基本形状变化;例如,类似于 。
(一)
(b)
(c)
(d)
(e)
(f)
随机化技术被广泛用于诊断背景误差的标准差在VAR系统在许多操作中心,和采样噪声不可避免地引入欠采样时的估计。尽管增加样品数量可以缓解这个问题,它通常是不切实际的雇佣样本大小的估计超过100操作系统。之间需要一个妥协估计的准确性和操作时间的限制,认为操作系统维护的负担得起的计算成本。因此,重要的是要消除采样噪声有效地在欠采样的情况下。
分离采样噪声引起的随机化技术的估计,有必要调查抽样的区别噪声和标准差。采样噪声的空间结构在同化系统将探索操作版本的B矩阵。背景的真实状态误差标准差为涡度并不完全知道,但从图1样品的数量达到1000时,涡度场的估计是足够精确的。因此,涡度的参考标准偏差场来自1000个样本。采样噪声估计中通过减去参考从估计的值50、100和200个样本。采样噪声的定义
信号的能量谱是一种有效的手段来检查信号的空间结构。的波数谱空间对应于空间结构的规模在大型空间结构的网格点空间就意味着能量的小波数谱空间远远大于大的波数,而这是一个小规模的。图2显示采样噪声和相应的能谱样一个特定的空间领域的50个样本,样本,100和200样品。有两个显著的特征值得注意的人物2。首先,采样噪声明显是在涡度标准差字段并显示全球高频振荡在小范围内。从相应的能谱在右列的能量谱噪声在整个乐队更一致和接近白噪声。另一个显著特征是,从不同的样本采样噪声的结构分布是相似的,但随着样本数量的增加,噪声降低的绝对极值,这符合事实,更样本生成一个更准确的估计。数据中的信息1和2表明采样噪声的空间结构是不同的估计,这差别激励减少采样噪声的滤波技术。
(一)
(b)
(c)
(d)
(e)
(f)
2.2。标准偏差场的特征
背景误差的标准差的特点通过随机化技术在同化系统将探索操作的版本B矩阵。
标准偏差估计的特点与模型参数不同,如图3。图的概述3表明,低价值的涡度、散度、温度、和U风估计被发现在热带地区,和更高的值在高纬度地区,尤其是在南半球。也表明标准差领域的四个模型参数有不同的分布:低价值的温度和散度更加集中在低纬度地区,和更高的值被发现在更高的纬度地区;然而,有相对较大的涡度场沿着热带辐合区,和U风data-spare和南极地区具有更大的价值和一个较小的值在人口土地面积。
(一)
(b)
(c)
(d)
标准偏差的时间演化字段检查图4在1200 UTC, 2400 UTC。看来标准差超过12小时的发展不是很重要,和温度分布的标准偏差场500 hPa (1000 hPa),沿着西轴拉伸,非常相似。VAR系统的协方差矩阵估计的气候信息;因此,标准差的特征字段通过随机化技术有一定的相似性。此外,标准偏差的分布场的动力学与天气情况。有图的另一个显著特征4差异分布的标准偏差场的垂直水平模型。表面附近的值比500 hPa更大,可以解释为表面附近的复杂物理过程直接影响相对误差的统计数据。相应的能量谱的标准差为500 hPa和1000 hPa绘制在图5。标准差的两个不同的模型在大尺度上有相对大的能量水平,和能谱的标准差为1000 hPa在中等尺度较大的振幅比500 hPa。
(一)
(b)
(c)
(d)
(一)
(b)
的长度尺度的估计标准偏差随模型参数和垂直水平,和这些变化产生深远影响的过程消除采样噪声。因此,消除采样噪声的方法应该不仅保持兴趣的标准差也考虑标准偏差场中的变化与模型参数和水平。
3所示。过滤方法
背景误差的标准差估计的随机化技术被采样噪声污染,这噪声对估计有负面影响。前款规定的表明,采样噪声在不同空间结构基于标准差和标准偏差模型parameter-dependent和垂直等级相关。在本节中,光谱滤波方法中使用的操作系统和空间平均方法的概念将被引入,以讨论这些方法的实现的YH4DVAR系统。过滤结果的空间平均估计还将详细讨论。
3.1。过滤方法和实现
YH4DVAR运营系统,光谱滤波方法,在一个固定的波数截断 ,是用来消除采样噪声乘以一个系数每个波数。的系数被定义为 在哪里的波数谱空间。光谱滤波方法实现消除采样噪声通过设置合理的截断波数 ,根据经验设置和光谱滤波方法的效率更重要时,标准偏差场各向同性和变化缓慢。
过滤结果的网格点空间,空间平均(25估计被定义的 在哪里 , 是空间的长度平均,域的网格点数量吗 。这个方程表明,空间的双重求和平均增加采样实现的潜在影响。这意味着,在每个模型级别,总采样实现将大大增加了 ,在哪里是抽样数。因此,平均结果少采样噪声独立采样实现时增加。
调查是很重要的过滤方法的实现和计算成本当考虑操作系统的应用程序。的实现光谱滤波和空间平均方法讨论了操作系统,和流程图如图6。光谱滤波方法的实际实现中使用固定波数截断操作系统可以总结为以下步骤:(1)为一组N(N= 50)随机向量 从高斯分布 ,应用U每个向量获得一组模型向量 在光谱空间中, (2)计算标准差后,将模型参数转换为网格点空间(3)标准偏差转换成频谱空间,然后乘以系数(4)将过滤后的标准差转换为网格点空间
空间平均可以直接执行后的网格点空间来获取过滤结果的标准偏差在上述第二步得到;因此,空间平均方法不需要标准差转换成频谱空间和更高程度的并行网格点的空间。还有另一个显著特征,一旦确定了最优空间平均长度,不需要搬迁的网格点满足距离因为示例实现在该领域是不变的。计算最优空间平均长度l可以离线执行和更新频率的背景误差协方差的统计数据。
3.2。过滤效果
图7(一)涡度标准差参考字段生成从1000年样本,和原始的估计计算来自50个样品如图7 (b)。可以捕捉的主要大型特性只有50个样本,和采样噪声往往是规模相对较小,这样的细节估计强烈恶化。注意在操作同化系统,它通常是不切实际的采用的样本量估计超过100,因为计算成本。50个样本的筛选结果见图7 (c)和7 (d),缩写为和 ,分别。
(一)
(b)
(c)
(d)
对比图7 (b),和表明,采样噪声减弱的平均结果,和标准偏差的规模是可见的。的信噪比和分别是23.74和25.41,这两个比吗 ,和一个更大的信噪比强烈支持这一事实空间平均能够消除大部分的有害的噪音。仍有明显的噪音,这是由于固定截断波数。图8显示了固定系数截断波数的光谱滤波方法。的 这里使用的是一个保守的光谱滤波函数。它集大部分的波数系数等于1,这主要是切断一些低频噪音和不考虑当地的标准差领域的变化。捕获的物理结构非常详细,甚至尽可能准确的估计 。平均结果减少采样噪声随着独立采样实现的增加, ,这是连贯的,总样本量过滤的50个样品接近原始的1000个样本的样本大小。这迷人的结果显示了潜在的空间平均效率平均估计可以达到大样本估计的准确性显著消除噪音。
图9显示了涡度的过滤结果的相对误差 ,温度 ,和U风在1000 hpa: 在哪里是由空间平均方法和标准偏差过滤是到1000年实现参考标准偏差领域。可以看出,增加过滤,过滤结果的相对误差可表示为一个U形状。上有一个显著的影响降低了相对误差随着平均长度的增加,和有一个最优长度的过滤结果误差最小化。平均长度变得过度时,相对误差增加再次与更大的长度。这可以解释为空间过滤增加过滤结果的准确性通过增加独立样本实现;当长度变得过度,还包括相关的点的实现导致的减少过滤的结果。涡度的最优滤波长度250公里,温度是750公里,U风是500公里。这些模型参数的最优长度的差异显示了标准偏差的不同领域,这是符合2.2中提到的标准偏差场的特点。是绝对必要考虑模型参数的影响在空间平均长度在消除采样噪声的过程最优滤波长度依赖于模型参数。
空间的效率平均垂直水平不同的不同的模型参数如图10。图10 ()显示最优平均长度是不同的在不同的模型级别;例如,在表面温度的最优长度750公里,500 hpa大于500公里。此外,这一趋势在最优长度不同的垂直水平不同于模型参数。的最佳长度U风与模型级别增加明显,而温度的最优长度从1000 hPa 500 hPa逐渐降低,然后增加水平与垂直模型。一般来说,变量的最优长度增加而垂直的水平。这可以解释为上级相关变量字段的长度尺度大于表面,和一个更大的长度尺度对应于一个更大的更独立采样实现最优长度。图10 (b)显示的相对误差U风原始估计和最优滤波结果在不同垂直的水平。原始的相对误差估计仍然是大约0.08虽然有显著减少最优长度的相对误差。空间平均减少采样噪声的本质是提高独立采样实现最优长度。更大的最优长度可能会导致采样实现这一事实并不完全独立,这是一致的与最优长度相关的相对误差是提高64级以上。
(一)
(b)
4所示。对分析和预测质量的影响
前面的结果表明,背景误差标准差的大规模的特性可以被随机化技术,但这种技术可能被采样噪声污染,因为有限的样本大小。此外,固定波数截断在光谱滤波方法的影响下的局部变化特征的估计,但空间平均方法在解决这一问题提供了一些优势。在本节中,空间平均方法对同化的影响和预测质量将检查操作YH4DVAR组成的数值天气预报系统和全球谱模式。
申请同化诊断和预测将被视为与业务数值天气预报系统在低分辨率的网格与91年的水平(缩写为T399 L91)。有两组。在一个随机向量的N作为50在第一组,编号CN,使用光谱滤波方法与一个固定的波数截断,消除采样噪声。在其他实验组,随机向量的N与空间平均为10,SP编号。结果进行操作系统与91年的水平高分辨率网格(缩写为T799 L91)被用作参考。操作系统开始运行在2015年8月26日00 UTC,结束在2015年9月26日00 UTC,每12小时更新一次。的统计特性B矩阵生成使用流行的国家气象中心(NMC)方法,这种方法使用不同长度的差异预测评估预测误差(9),计算模型参数的最优平均长度在2015年8月26日00 UTC每个垂直的水平。
图11显示了均方根误差(RMSE)的位势高度作为时间的函数,有两个方案:CN和SP。北半球和南半球extratropics对应地区30°N - 90°和30°- 90°年代,分别。在南半球RMSE通常高于在北半球热带地区,热带地区和RMSE略小于在北半球。SP的RMSE分析这三个地区的不到控制,导致相同的结论,850 hPa在图11 (b)。它可以观察到,不同地区的RMSE显著减少通过使用空间平均方法表1,这往往是一致的空间滤波的结果有一个积极的影响提高估计的准确性。
(一)
(b)
SP和CN分析领域之间的差异水平接近500 hPa和850 hPa如图12。一个明显的共同特征是,在低纬度地区差异显著小于高纬度地区。这可以解释为赤道波耦合对流解释大部分的标准差在热带地区,尤其是在对流层较低;因此,空间平均方法的过滤效果类似于光谱的方法。另一个有趣的一点是,大值主要位于附近的脊和槽,与之前的研究结果相一致。
(一)
(b)
预测取得了申请通过检查过滤结果的预测质量在全球谱模式。图13显示了温度预测的RMSE (500 hPa)在不同时间与T799的引用在相应的时间。RMSE值小的热带地区和北部半球,而更高的值被发现在南半球分析法逐渐失宠。也观察到,三个区域的RMSE随长时间预测,热带地区和RMSE的增长低于nontropical地区。过滤后的估计预测质量产生积极的影响,及其改进通常低于预测分析。这可能是由于数值模型的过滤效果,并继续研究改进天气预报的技巧是很重要的。
(一)
(b)
(c)
(d)
(e)
(f)
5。讨论和结论
在VAR系统中,随机化技术被广泛应用于当前运营中心诊断背景建模误差的标准差B矩阵。在这种情况下,从有限样本标准差估计,将不可避免地受到采样噪声的影响,因为有限的样本的大小。因此,必须实现一些过滤技术来消除这种采样噪声。
采样噪声的空间结构引入的随机化技术是探索在操作的版本B矩阵。有限样本的估计标准偏差由采样噪声恶化,和噪声往往表现为一个相对较小的规模和均匀分布在全球地图相比估计参考字段。噪音大大降低的绝对值随着样本量的增加,大规模的标准差更可见估计领域的全球分布采样噪声仍是偶数。这样一个采样噪声之间的结构差异,估计是设计的关键过滤技术来过滤掉小规模噪声和保留感兴趣的信号。光谱滤波方法在一个固定的波数截断操作设置解决YH4DVAR系统采样噪声的问题。该截谱方法的应用是一种低通滤波器光谱空间中,使小规模噪声过滤掉,保留了大规模信息,适用于消除采样噪声的操作系统。
我们的调查也表明,估计的长度尺度的标准差随模型参数。低的值不同标准差更集中在低纬度地区,和更高的值被发现在更高的纬度地区,但也有相对较大的涡度场沿着热带辐合区。此外,标准偏差的分布领域模型垂直水平之间是不同的。估计的长度范围从随机化技术随模型参数和垂直水平;因此,固定波数截断在光谱滤波方法的影响下在当地标准差的变化特征。修改后的空间平均方法有一些优点在解决这个问题。在一个操作情况下,物理结构被50个样本的平均结果很好,与噪音极大地消除,参考空间平均方法有潜力增加独立样本实现平均长度、平均结果和最优长度总抽样数量最大化。最优平均长度与模型参数和垂直水平,这是符合变化估计标准差;因此,空间平均方法具有更好的性能在消除噪声和保护当地的变化估计的特点。此外,空间平均方法很容易实现操作系统和更高程度的并行网格点的空间。 The RMSE of the analysis in different regions is significantly reduced by the use of the spatial averaging approach, and relatively small values can be observed over data-spare regions such as the southern hemisphere. In addition, the results also show that the spatial averaging approach has a positive effect on improving forecast skill scores.
在下一步中,我们需要进一步改善的空间平均方法。最优平均长度是离线计算,平均长度的变化可能是次优flow-dependent信息同化时期。这将是有趣的考虑更新最优平均长度调整与变化。此外,一些定性分析结论给出需要详细检查了未来的工作。同质和均匀过滤类型的空间平均方法忽略了信号的各向异性特征;因此,一些重要的特征可能是平滑平均或在不断减弱,这将是值得的努力在未来引入一个自适应平均算法。
数据可用性
本文使用的观察是获得NCEP和NOAA网站(ftp://ftpprd.ncep.noaa.gov/pub/data/nccf/com/gfs/prod)。背景数据都不是免费的,因为它是一个短期预测的全球谱模式数值天气预报系统在国防科技大学商业机密。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作得到了国家自然科学基金(批准号。41675097、41375113和41605070)和中国国家重点研发项目(2018 yfc1506704)。