文摘

ensemble-based卡尔曼滤波器至少需要一个相当大的集合(例如,10000个成员)来识别相关误差协方差为多维物理系统在很远的地方。然而,增加大量的总体规模将扩大抽样错误。本研究提出了一种基于协方差本地化修改后的柯列斯基分解(CL)计划,即协方差本地化方案与修改后的柯列斯基分解(CL-MC)。我们的主要思想利用修改后的柯列斯基(MC)估计背景误差协方差矩阵分解技术;同时,我们采用可调的背景误差协方差的奇异值分解方法提高合奏增量,避免系统的不平衡。验证如果抽样错误,该方法可以有效地降低数值实验是在洛伦兹- 96模型和大规模的模型(快速模式)。结果表明,CL-MC为不同的数据同化方法优于氯方法参数(整体尺寸和本地化)。此外,通过执行一年快速的同化实验模型,发现天预测均方根通过CL是约等于5天预测均方根CL-MC。所以,CL-MC长期预测方法具有潜在的优势。也许该CL-MC方法取得了良好的大气环流模型中广泛的应用前景。

1。介绍

数据同化(DA)是观察与“先验知识”的组合(例如,数值模型和模型输出)来实现系统的真实状态的估计(cf Katzfuss et al。(1])。顺序数据同化的过程中,传统的卡尔曼滤波器(KF);卡尔曼和Bucy2)用于估计和预测的线性问题。对于复杂的多维系统,经典的合奏DA过滤器(EnKF;Evensen [3])的合并来自线性卡尔曼滤波器估计理论和非线性蒙特卡罗估计理论被提出,广泛应用于大型模型(cf哪里。Evensen和Van Leeuwen4])。然而,乐团成员总是小于模型组件所以抽样错误无法避免。抽样误差会引入大量的其他问题(例如,近亲繁殖和滤波器发散)合奏过滤的过程。近亲繁殖是一个术语,用来描述分析误差协方差(cf的低估。皮毛和本特松5]),分析误差分布和过滤分歧发生在远离真相,这可能是由于背景误差协方差的低估。这样的问题可以用协方差通货膨胀的方法,解决运营背景误差协方差乘以一个通货膨胀因素,防止协方差(cf的低估。安德森,安德森(6])。然而,通货膨胀因素的大小将取决于很多因素,包括过滤器的类型和使用的动力系统(cf。哈米尔et al。7])。因此,协方差通货膨胀并没有解决所有的问题,尤其是之间的虚假的长程相关性很远从EnKF观察和模型组件。通常使用本地化方案来解决这种虚假的相关性。

本地化的协方差矩阵EnKF大规模的模型是必要的,因为传统的集合体是有限的,只有10 - 100,这是明显小于模型的自由度。定位方法通常是通过相关矩阵的舒尔产品实现或本地化功能,这样的定位方法包含协方差本地化(CL;哈米尔et al。7])和观察本地化(OL;亨特et al。8])。另外,域的域分解为本地化(DL;Houtekamer和米切尔(9]),对每个域进行单独分析。CL方法普遍采用在特设的伪相关的问题。OL和DL方法经常结合使用,实现更好的观察权重根据他们的距离。此外,其他定位技术,如局部分析(LA;Sakov和Bertino10)、背景误差CL(提单;Greybush et al。11]),观测误差CL (RL;Greybush et al。11制定了)。虽然这样的定位可以有效地避免虚假的相关性和限制的负面影响抽样误差,同时介绍了失衡到系统(cf。Kepert [12])。尤其是协方差本地化EnKF潜在的失衡的主要因素。正在努力寻找方法来避免不平衡系统。产生的不平衡主要是增量的计算分析。增量更新(IAU)过程分析是用来防止失衡代在当地增量的计算(cf克莱斯特和Ide。13])。此外,它可以避免失衡利用较短的同化窗口(Houtekamer和张14])。

本地化计划框架,本地化参数(即。,the localization length and the weighting function), a key indicator of the localization scheme, are often manually configured. These parameters are unknown a priori and can usually be found by trial and error. Kirchgessner et al. [15]研究了最优定位半径DL和OL是线性相关的地方观察维度,和OL效果被证明比DL的效果。与高分辨率模型,使用窄本地化半径减少抽样误差,但是它限制了使用的观察。三好和近藤16)提出了一种多尺度定位(500公里和900公里)方法EnKF在独立subobservation找到分析增量空间。然而,它需要一个大当可用的观测数量计算成本 此外,为了保持大规模的结构从整体规模有限,近藤et al。17)采用dual-localization方法分别分析小规模和大规模分析的增量使用空间平滑。对于复杂的地球物理模型,尽管观测的影响将与再定位范围,减少一些本地化的问题需要简要地讨论了。首先,基于距离的定位方法利用单峰分割函数(例如,GC函数)来构建相应的矩阵,有困难在“本地化”外地观察(白et al。18])。这些观察结果表现出多通道相关性模型组件(cf。多数时候et al。19];De La Chevrotiere和Harlim20.])。此外,在某些情况下,该模型组件或相应的观测可能没有相关的物理位置,这可能是对基于距离的方法(cf的原则。白等。21])。模糊控制函数用于产生更精确的观察权重代替定位功能(例如,GC功能)(cf。Mingheng et al。22];Mingheng et al。23])。对于理想中间大气环流模式(AGCM),本地化的负面影响可以避免与足够大的整体大小。三好et al。24)调查,使用大型合奏大小(10240成员)可以获取远程刻度误差相关性的实现本地整体变换卡尔曼滤波器(LETKF;三好et al。25]),然而,这是至关重要的防止内存溢出采用相对较大的乐团成员。近藤和三好26)修改了EnKF代码不使用协方差本地化的先决条件。发现使用10240乐团成员也揭示了长期背景误差协方差矩阵的结构特点。上述研究通常认为水平尺度上同化效果的影响。Farchi和Bocquet27使用协方差)被认为是现实的延伸LEnSRF定位在垂直方向。王等人。28]引入了多尺度局部获得整体变换卡尔曼滤波器(MLGETKF)允许同步更新的多尺度预测总体均值和扰动通过同化观测一次。最近,柯列斯基分解方法被应用于预测误差协方差矩阵的估计(cf。康和邓29日])。

在上述研究中,使用多尺度定位方案或大型乐团成员(例如,10000个成员)迄今为止必要减少抽样误差。然而,很少有研究在预测误差协方差矩阵的估计。,协方差本地化方案修改后的柯列斯基分解(CL-MC)估计的背景误差协方差。CL-MC提出的方法的有效性由洛伦兹- 96和快速检测模型。因此,本文的组织结构如下:部分2专注于集成卡尔曼滤波器的背景,协方差本地化,修改后的柯列斯基分解,提出了协方差与修改后的柯列斯基分解本地化。部分3描述的配置双模型和分析实验结果。部分4提供结果的讨论和结论。

2。背景

2.1。集合卡尔曼滤波(EnKF)

EnKF是ensemble-based卡尔曼滤波方案,它是由Evensen提出(3];随后,它发展多种形式的EnKF (cf方法。蒂et al。30.];Houtekamer和米切尔(9];Evensen和Van Leeuwen4];Evensen [31日];汉堡等。32]。安德森(33])。这些方法大致可以分为两类:确定性过滤器(cf,汉堡等。32(cf)和随机过滤器。惠特克和哈米尔(34])。它们之间的主要区别是是否介绍了扰动观测保持正确的统计数据的过滤器。

EnKF的实现是更新的先验估计 大气中有效的大气有效时间 在新的观测的信息 到达最近的估计 大气(方程(1))。为此,卡尔曼滤波增益矩阵 是用来观测误差协方差调度适当的权重 和背景误差协方差 (方程(2))。在所有方程,标 分别指的是分析和预测变量。观察操作符 表示从模型空间观测空间的映射。模型操作符 表示估计的转移 到下一个分析时间(方程(3))。 在哪里 表示集合的大小和 表示大气有效时间。卡尔曼增益的 在方程(2),整体的大小通常是用来近似估计 (cf Houtekamer和米切尔。35];Ghil和Malanotte-Rizzoli36])。在随后的方程,我们省略时间指数的上标 为便于符号。

随机EnKF,小的整体背景和观察领导之间的相关性分析,远离真相。惠特克和哈米尔(34]介绍了确定性合奏平方根滤波(EnSRF)。然而,使用EnSRF方法计算分析误差协方差与一个相对较小的整体大小,卡尔曼增益由抽样误差容易受到污染,使它有可能真正的分析误差远远大于背景误差。合奏可能变得过于集中,不利于同化结果也在预料之中。常见使用协方差协方差通货膨胀或定位来弥补这个问题。根据协方差的通货膨胀,它并没有解决所有问题与采样。协方差本地化(CL)对数据同化至关重要。

有两个原因在EnKF使用协方差本地化,这些通常是在文献中列为“伪协方差”和整体排名(cf不足。Sakov和Bertino10])。“伪协方差”意味着整体大小的限制使元素的协方差之间没有连接的远程状态向量。它会导致过度降低的状态误差协方差分析,导致整体崩溃和滤波器发散。乐团的合奏等级不足表示大小小于模型组件。因此,整体尺寸的正确使用是一个最基本的规则,确保EnKF系统的设计。

2.2。协方差本地化(CL)

CL的方法,它是用来修改和更新方程(2)乘以距离相关系数矩阵 每个元素的背景误差协方差(舒尔)。它是应用于大规模系统的定位方法。这个操作背后的核心理念是修改每个元素的背景误差协方差协方差矩阵的秩。

然而,局部背景误差协方差矩阵几乎没有被明确地计算除了小规模的系统。相反,如果我们有足够的观察,我们可以大致计算条件 在方程(2)的整体大小。算法1总结了分析步骤产生的通用CL详细方法。

(我) 要求:一个统计的样本 状态估计 是整体矩阵,即 ,列的合奏。 模型组件。 观察向量 (输入)。 是一个乘法通货膨胀因素(参数)。 代表所有元素的向量1。 是单位矩阵。 是本地化函数
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11) 返回 分析合奏
(12) 结束了

在哪里 指的是整体异常的每个成员的立场 周围 观察, 代表了观测算子与所有行除了设置为零 th, 意味着观察位置矩阵,这样 , ;0, , 是观察成员。尽管引入协方差的通胀和本地化技术可以克服EnKF的问题。将会有一个限制这些技术只应用于背景误差协方差矩阵 那里仍然存在有限的整体大小。因此,当地可以rank-deficient样本协方差矩阵。为了避免这个问题,背景误差协方差矩阵 由改进的柯列斯基分解直接估计。一个稀疏近似的 取而代之的是 目的是避免限制合奏的大小以及防止内存溢出。

2.3。修改柯列斯基分解

背景误差协方差估计的准确性一直是核心问题的协方差本地化方案在使用有限的整体大小。最近,一些研究人员采用柯列斯基分解实现背景误差协方差估计的准确性(cf。[土屋上野和37];Nino-Ruiz et al。38];康和邓29日];波义耳氏和Katzfuss39])。在这方面,我们的估计稀疏的背景误差协方差矩阵的逆使用修改后的柯列斯基分解。柯列斯基分解也称为平方根的分解方法。它的核心原则是代表一个对称正定矩阵的分解的产物下三角矩阵及其转置。考虑(大约) 样本的高斯随机向量 与统计的时刻 表示 所有样本模型组件。修改后的柯列斯基分解来源于先前组件回归(Nino-Ruiz [40])。

然后,估计的 可以计算如下: 对方程(5)和(6),的eigenstructure 取决于的结构 结构特点的基础上 ,稀疏的估计 通过实施的元素吗 是零。主要的零组件 如下:如果两个模型组件是有条件的独立对于一个给定的本地化半径 ,中相应的元素 为零。此外,基于CL的方法,不同的模型组件之间的条件独立的背景误差可以通过使用当地社区(cf上野和土屋。37])。对于一个给定的模型组件,它的邻居是由一些组件在一个本地化半径 如果超过一个模型组件 距离,设置相应的背景误差之间的相关性为零。

2.4。协方差与修改后的柯列斯基分解本地化

本节研究修改后的柯列斯基分解的协方差矩阵估计协方差本地化(CL-MC)。首先,根据方程(5)的结构 取决于的结构 ,考虑背景误差协方差的估计。如果我们假设之间的相关性模型组件之外的地方和没有相关定位半径 ,我们获得一个下三角稀疏的估计 , 稀疏和本地化。根据文献(cf Nino-Ruiz et al。(38];波义耳氏和Katzfuss39]),回归方程只能为每个模型组件上执行前,所以模型组件计算之前必须进行排序(标记) 网格模型,我们主要考虑列顺序。

的估计过程 如下:

1。为 模型组件,我们用截断奇异值分解法估计回归系数 ,模型组件 如下: 在哪里 代表了前任索引模型的组件 当定位半径 表示 模型组件之前 条件下的 1(一)显示了模型元素的本地前辈和社区28当列顺序使用。 表示的错误 回归模型组件。 表示系数可以解决优化问题的计算 ,在哪里 , 最简单的解决方案是

2。创建稀疏矩阵

方程的残差(8)永远是零,它含蓄地估计协方差的通货膨胀。协方差的应用所需的通货膨胀可能不是CL-MC同化方案。

一次 估计,在下一节中,我们介绍如何避免不平衡效果和处理它 然而,在这里,分析配方如下: 在这里,矩阵摄动的观察 对方程(9),我们得到它通过使用基本分解矩阵的身份。 在哪里 是观察成员。的 在方程(10)代表了扰动观测。方程(10)是众所周知的EnKF双重配方和方程(9)的增量形式的原始配方。使用方程(10),我们得出这样的结论:计算方法是有界的努力由以下方程:

2.5。平衡和截断奇异值分解)

在上面的部分中,我们介绍了CL与修改后的柯列斯基分解的方法。然而,协方差的本地化是一个巨大的潜力的主要来源EnKF失衡,尤其是对本地化的距离短。因此,如何有效地减少不平衡的来源已成为数据同化的一个关键问题。有很多主要方法减少不平衡的来源(如修改初始向上过程和增量分析更新(IAU)) (cf。布鲁姆et al。41];克莱斯特和Ide (13])。在实际操作中,修改初始向上过程或应用IAU迄今为止减轻系统中的不平衡的关键。在我们的本地化计划,使用稀疏的背景误差协方差 作为替代 ,模型组件的分布,分析了在空间尺寸如图1 (b)1 (c)。原理图中使用的观测的定位方案 - - - - - -网格点的 - - - - - -网格点。为了提高效率,我们只计算距离的观测与坐标 有效的地方观察驻留在本地范围半径的圆 ,这是根据这个距离决定。分析点之间的物理距离和观测位置更新前的状态估计计算。近距离观察位置,观测点的重量越大,反之亦然。

虽然我们使用修改后的柯列斯基分解估计 , 表现出很强的相关性。定义的相关保留在一个距离但已被消灭超出定义的距离。然而,与高维系统,整体协方差变得满秩时,我们不得不面对一个伟大的协方差矩阵(利用对称性,我们可以通过使用代表 元素)。不想代表这样一个矩阵在内存中,最好制定过滤器在某些matrix-free方式。大多数matrix-free配方依靠两件事之一:域分解和舒尔产品。在这里,我们采用截断奇异值分解和表示这样一个矩阵在内存中。

假设我们有截断奇异值分解 由以下方程: 在哪里 正交矩阵, 对角矩阵, , 因为 是对称的正定,方程(12)是一个截断奇异值分解。在截断奇异值分解方案,如果整体尺寸小于当地观测的数量,然后当地乐团扰动是写成 ;在相反的情况下,它变成了 是一个 矩阵, 请注意, 代表 合奏扰动,称之为“增强合奏”为简单起见;和 表示整体增量。然后, 是一个解决方程(12), 扰动。对方程(13),我们如何有效地构建 矩阵。我们想要构建一个矩阵具有相同的经验协方差矩阵和集中。自 排在最 ,我们需要找到一个矩阵 这样

,我们定义 (乘法通货膨胀因素)和 随着 矩阵的系数如下:

它可以很容易地检查 (例如, 是一个正交矩阵)和 ,第一个基向量。

矩阵的第一列是零和的其他列 ,也就是说,

通过建设, 是一个解的方程(15)和(16)。

协方差定位、研究主要局限于分析上的每个观测距离的影响在一个固定的水平距离 和垂直距离 此外,背景协方差矩阵中的每个模型组件 是彼此相关的。因此,在顺序同化方案的背景下,卡尔曼滤波增益矩阵的元素 除了这些零距离(cf。Houtekamer和张14];方程(20.))。

网格点的观测数据应用于不同的权重根据物理网格点的距离。这些权重主要对逆舒尔产品的观察协方差矩阵 和相关系数矩阵来实现(cf。亨特et al。8])。传统的定位功能是一个可调函数的分布函数类似于正态分布的概率密度函数。此外,正在努力找到可以安装的高斯函数广泛应用Gaspari-Cohn函数和紧凑的支持(cf。Gaspari科恩(42]),观察在定位区域应用不同的观察权重和Gaspari-Cohn功能定位区域外是零。阶跃函数如下: 在哪里 表示可调切半径。观察权重,权重主要有观察区域和权重在观测区域内(通常设置为0)。因此,方程(19)也被认为是域本地化(DL) (cf。Kirchgessner et al。15])。

3所示。双模型和实验设置

3.1。洛伦兹- 96模型实验设置

对于简单的40-dimensional洛伦茨(cf - 96模型。洛伦兹和伊曼纽尔43]),模型参数选择如下:确保足够的集成同化频率变量在模型中,所有40个网格点。我们设置了0.05倍(即步。,corresponds to 6 h atmosphere valid time), and this 0.05-time step is labeled as a DA step. To introduce more observation errors in a more challenging way, the observation error covariance is 这里,选择的观测误差协方差值3.05是用于验证CL和CL-MC同化性能,这主要是因为引入较大的观测误差协方差值是否仍然CL-MC方法达到更好的DA性能。洛伦兹- 96模型的状态 , 是基于以下方程:

在这里, ,和观察成员20(例如, )。输入参数(如通货膨胀因素,本地化半径,整体大小)也被认为是。初始条件生成过滤器的乐团成员。模型第一次被提出多年的实际时间不吸收任何变量。最初的预测乐团成员是相似的,除了征收额外的高斯噪声。真正的小扰动值是随机产生的不稳定。在这种情况下,最初的乐团成员离开吸引子的模型。没有明确的传播和误差之间的关系。的向上周期一年半就足以消除不利影响(cf Hoteit et al。(44])。不断增加的通货膨胀因素(cf。安德森,安德森(6)用于扩大整体传播,防止滤波器发散。默认的力量迫使是8。一组数据同化实验为每个数据同化方法进行365天,使用默认设置和不同同化参数(通货膨胀和本地化)。手动调优参数如表所示1

3.2。实验设置快速模型

中等复杂的快速模型(cf。里奇(45];三好(46)类似于天气动力学。其同化变量包含温度、维风组件,经向风分量,特定的湿度、表面压力,和降水(cf。布瑞克(47])。它有8个垂直的水平 分辨率的σ坐标系统。快速模型创建一个输出文件每6小时天气预报(cf Greybush et al。(11])。更详细的快速模型可用Molteni [48]。最初的整体状态是随机生成的模型与一段向上的1年(cf近藤和三好。26])。自然运行时从一个固定标准大气(即开始。1月1日,没有风)在0000 UTC。总模型组件 所有过滤情况下,模型状态空间超过整体尺寸

为快速模式,相同的观测是通过添加系统生成的随机数与自然运行每6 h radiosonde-like地点8水平(100 hPa, 200 hPa 360 hPa, 520 hPa, 800 hPa, 850 hPa, 880 hPa, 925 hPa)。观测误差的标准差的纬向风、温度、含湿量,和表面压力是固定在1.0毫秒−11.0,1.0 K, gkg−1和1.0 hPa。

3.3。验证数据

如果有 - - - - - -维度模型组件、均方根误差(rmse参看方程(18在白等。21])和合奏(参看扩散方程(22)Hoteit et al。44)应用于评估同化性能误差因素,方程如下: 其中下标 表示状态的索引组件和下标 指乐团成员的索引; 表示 - - - - - -分别th分析价值和真正的价值; 表示总体的方差 ,同化算法的分析质量平均计算可以更加全面地反映被测量的空间。通常,更好的同化结果对应于较小的均方根。

3.4。洛伦兹- 96模型的实验结果

本节分析了CL和CL-MC算法使用洛伦兹- 96模型同化的结果。敏感性实验是在CL和CL-MC算法通过配置不同的定位与默认的整体大小尺度,固定观察成员,力量迫使,手动调整最优通货膨胀值(表1)。为了提高实验的准确性,每个实验重复两次,应用他们的平均值作为每一个算法的评价标准。

功率谱密度(PSD;cf, Sakov Bertino [10)评价标准是用来测试CL和CL-MC算法的性能。与不同的本地化尺度,PSD的CL和CL-MC算法改变相应如图2。图中蓝色曲线“预测”代表合奏的傅里叶谱奇异值的预报值,和绿色曲线“氯”和红色曲线“CL-MC”代表合奏的傅里叶谱奇异值分析的价值。垂直坐标表示的PSD PSD的系综均值和面板下的面积代表方差。

2显示了CL和CL-MC算法的影响PSD定位不同半径。默认的整体大小,观察分数,观测误差方差,力量迫使和通货膨胀因素的优化配置。结果表明,曲线下面积的逐渐变得小而PSD值小于CL和CL-MC算法的预测价值随着光谱分量的增加。此外,随着光谱分量的增加,PSD值CL和CL-MC算法表现出不同的结果。(1)曲线下的面积为CL-MC算法总是小于CL算法;然而,随着光谱分量增加,CL和CL-MC方法的PSD值远低于预期值。(2)根据修改后的柯列斯基分解导致的大小CL-MC算法在0.1和0.2之间,CL方案,震级在0.10和0.30之间时,定位半径为10(图2(一个))。当定位半径增加到15日修改后的柯列斯基分解导致大小的PSD CL-MC算法在0.05和0.15之间和CL算法(图0.13和0.25之间2 (b))。值得注意的是,PSD的价值定位时的CL和CL-MC方法成为小半径为20。然而,PSD CL-MC仍小于CL的价值。总的来说,CL-MC比CL算法算法具有更好的性能。

在当地的分析过程,从方程(1),卡尔曼增益的更新中扮演着重要的角色在分析价值,从而影响最终的分析精度。默认的整体大小,观察分数,观测误差方差,力量迫使和通货膨胀因素的优化和本地化半径(表使用1)。图3显示了CL和CL-MC方法对卡尔曼增益的影响对不同定位半径。在这种情况下,卡尔曼增益是40 20矩阵。水平轴图3相应的观察,表明索引数字和垂直轴表示状态变量的索引号。卡尔曼增益值获得的CL和CL-MC方法,以及不使用本地化方案。图类似于文学Sakov和Bertino [10)在图3。结果表明,卡尔曼增益没有本地化计划保留的伪相关远程观察,而CL和CL-MC方法消除伪相关的远程增益矩阵。此外,我们注意到,卡尔曼滤波增益矩阵展品重大diagonality和对称由于使用本地化方案(包括CL和CL-MC)。然而,CL-MC性能优越的方法可能是更重要的比CL方案(从colorbar规模)。而言,为每个观察(冢)获得的增益,增加定位半径有利于CL和CL-MC方法获得小卡尔曼增益,而CL, CL-MC,没有使用本地化方案有较大的卡尔曼增益值,当观察指数方法20(第四列图3)。

时间序列rms的纬向风(ms−1)在第四模型级别(∼510 hPa)不同的整体大小:(a)合奏大小= 75 (b)合奏大小= 100 = 125 (c)整体大小,(d)合奏大小= 200。在这里,14600同化步骤对应于10年后0000 UTC 1 1982年1月至1992年1月1日0000 UTC。集合卡尔曼滤波定位方法是有益的消除虚假的长程相关性。尤其是本地化参数未知先验的选择,和大多数研究人员获得最优定位参数和通货膨胀因素足以处理相应的同化问题连续迭代实验。在这项研究中,通货膨胀因素和定位是手动调整与优化参数。默认的整体大小,观察成员,观测误差方差,力量迫使和通货膨胀因素的优化(表使用1)。图4显示了CL rms的时间序列和CL-MC算法不同的本地化半径。在操作模型中,同化周期是1460步。一个同化周期大约相当于6小时的“天气”。1460年同化周期是一年(365天)。结果表明,CL和CL-MC方法实现更好的过滤性能和增加本地化半径。然而,CL和CL-MC方法执行大型rms自不稳定的系统状态初始时刻。CL的rms和CL-MC方法存在收敛结果同化一步增加。经过一段时间的同化步骤,rms不减少,实现一个收敛的趋势,这可能是由于通货膨胀因素的优化和默认的乐团成员25,由于通货膨胀和大量本地化半径小。此外,值得注意的是,大约50天的同化步骤之后,CL展览劣质资产(图4 (c)),这可能是由于缺少的一部分分析增量更新本地状态变量,导致可怜的同化的结果。然而,CL-MC方法显示了更好的同化结果和整个同化过程中达到平衡。

3.5。实验结果的快速模型

在上述实验中,CL和CL-MC方法的有效性检查玩具洛伦兹- 96模型与不同同化参数。进一步调查CL和CL-MC方法在大规模的应用程序模型,在本节中,CL和CL-MC性能的进一步研究快速模型。初始化所有实验最初的合奏随机选择的自然运行在0000 UTC (cf。三好(1月1日46和康等。49])。通货膨胀,避免手工优化的参数,自适应协方差膨胀方法应用(cf。三好(50])。

调查的同化结果CL和CL-MC方法在大规模的模型,进行了一个实验使用不同大小的合奏,因为这个选择DA过程中的一个重要组成部分。在实际应用中,可行的整体大小通常小于系统的自由度(或不稳定子空间的维度或错误子空间)。其他同化参数,如本地化规模(包括水平和垂直尺度),观察成员,和观测误差方差(1.0 ms−1)也适用于默认值(表2通货膨胀),一个自适应协方差方法也用来扩大整体传播,防止滤波器发散。图5显示了时间序列的rms CL-MC和CL方法研究了纬向风的第四模式(∼510 hPa)水平。结果表明,增加整体大小提高同化结果CL-MC和CL方法。整体大小是75年和125年,rms概要CL-MC和CL方法显示出类似的同化行为(数字5 (b)5 (c))。然而,随着同化一步的增加,特别是当合奏大小是100,125年和200年的rms CL-MC和CL方法存在高峰(在同一同化一步)(数据5 (b)5 (d))。这可能是自适应通货膨胀对于更大的整体尺寸,由于通货膨胀和广泛的本地化尺度小我们预计随着整体尺寸的增加。的rms CL-MC方法远小于CL合奏大小是200,这意味着一个更大的整体规模有利于CL-MC方法(图5 (d))。CL-MC方法优于CL,总的来说,特别是在整体规模比较大。

为了更好地理解CL和CL-MC方法背后的机制和测试他们的真正的大气系统的适用性。纬向风的空间分布上分析rms CL-MC和CL方法检查了0000 utc时间1982年3月至0000年utc时间1982年4月1日与不同的整体大小。其他同化参数、本地化,观察成员,和观测误差方差(1.0 ms−1)作为其默认值。图6显示器上的空间分布分析rms CL-MC和CL方法从0000 utc时间1982年3月到0000年utc 1982年4月1日与不同的整体大小。结果表明,CL和CL-MC方法合奏时表现出不一致的同化结果大小是75和100。(1)时间上的分析rms CL方法尤为明显,特别是当合奏的大小是100,在经度地区 W - W(稀疏观测),纬向风的平均均方根分析达到约0.152 ms−1。时间上分析rms CL-MC方法的相对较小(约0.116 ms−1)(数据6(c)和6(d))。(2)在高纬度地区,时间上分析rms达到0.148毫秒−1CL方法(图6(c))和0.135 ms−1CL-MC方法(图6(d))。在稀疏的观察,值得注意的是,EnKF-based CL方法易受大协方差自适应通货膨胀因素,固定定位,小协方差膨胀因子是一个期望的整体尺寸增加。当整体大小是125,时间上的空间分布分析rms CL和CL-MC方法达到不一致的结果。(1)CL方案达到较大的rms,主要在低纬度地区( W - E),平均分析rms大约0.120 ms−1(图6(e))。(2)在大多数地区,CL-MC方法获得较小的分析rms(最大值达到0.112 ms−1)(图6(f))。这可能是由于CL-MC计划保留背景误差协方差的主要特征半径较大的本地化。CL计划忽视一些短中程相关性。当整体大小是200,北极上空,尤其是附近 W - E观测相对稀疏,时间上分析rms CL-MC方法接近0.04毫秒−1(数据6(h)), CL计划达到约0.10 ms−1(图6(g)),作为参考,只能观察位置在十字路口的误差标准偏差1.0 ms−1。总的来说,这些结果说明这里的CL和CL-MC技术测试导致well-constrained分析,误差显著降低和增加整体尺寸,但是当合奏的大小增加从75年到125年,CL方案的误差并不存在显著减少一些观察稀疏分布的领域。这可能是由于更广泛的本地化规模和更大的通货膨胀因素用于CL方案由于通货膨胀和更广泛的本地化比例越少人会期待什么合奏大小增加时(数据6(一),6(c)和6(e))。因此,上级的行为CL-MC方法可能是更重要的在考虑实际应用方面。

最后,CL的稳定性和CL-MC方法自适应协方差膨胀因子是探索利用时间上分析整体传播而不是时间上分析rms (cf近藤和三好。26])。结果表明,地区很少有观察,CL和CL-MC方法的效果上分析整体传播与增加更大的整体大小。相比之下,在地区和大量的观测,分析整体传播定值非常小(数字7(一)7(h))。因此,自适应协方差膨胀因子为不同大小的合奏中表现出很强的鲁棒性。表1列出了全球通货膨胀自适应协方差参数的平均值CL(左值在最后一行)和CL-MC大胆(右值在最后一行)在第四模型级别。

前面的实验情况下是基于分析rms检查CL和CL-MC方法的有效性,CL-MC方法优于CL, CL和CL-MC易受当地不稳定因为使用相对较大的自适应协方差膨胀因子。防止此类情况,短期预测均方根的CL和CL-MC方法检查默认的观测,观测误差协方差,本地化的规模,和协方差自适应通货膨胀因素。这里,整体大小是200成员和分析整体的意思是作为初始条件乐团成员。所有的变量(包括纬向风、温度、含湿量和表面压力),245年预测的平均日预测均方根病例从0000 utc 3月1日到0000 utc调查(图5月1日8)。所有变量的结果表明,除了特定的湿度、平均日预测均方根的概要文件是从来没有过。的平均预测均方根CL-MC方法总是小于整个日- CL初始时间的预测。通过计算245年预测的平均日预测均方根的情况下,我们发现天预测均方根CL约等于5天的预测均方根CL-MC。这表明CL-MC方法有潜在优势相对较大的整体大小,考虑到相关的短期预测错误。然而,在实验设置,结果可能会过于乐观因为假设如完全已知的观测误差统计和一个简化的模型,使用低分辨率。一般来说,CL-MC明显优于氯方法的短期预测。

4所示。结论

合奏DA,因为使用大合奏大小导致抽样误差和DA系统的不平衡,提出了一种协方差定位法(CL-MC)柯列斯基分解消除抽样误差,实现逆的背景估计的协方差矩阵。几个优点使用下面列出了这样的一种新方法。(1)一般来说,整体协方差是一个满秩矩阵,大多数Schur-product rank-deficient矩阵依赖。由于矩阵有大维度,它不是适合矩阵存储。预定义的稀疏矩阵结构构造成柯列斯基分解的协方差系数的倒数。如果两个遥远的模型组件是不相关的,相应的条目的逆协方差矩阵为零,从而避免使用过多的记忆;(2)以来唯一的非零项柯列斯基因素对应模型组件相互接近,使用稀疏结构逆背景协方差协方差矩阵是一种本地化。(3)为了便于存储的背景误差协方差矩阵,可调节的奇异值分解方法应用于背景误差矩阵。

验证该方法的有效性,进行了一系列的实验在简单的洛伦兹- 96模型和速度模型。洛伦兹- 96模型的结果表明,获得的rms CL-MC小于CL方法和稀疏的观察结果 此外,增加定位半径有利于使用更多的观测信息,提高该算法的同化结果。快速模型的结果表明,增加总体数量有利于CL和CL-MC方法获得更好的同化的结果。然而,空间分布的差异分析整体传播和CL和CL-MC方法之间的均方根分析更加明显。这可能是由于这一事实的使用协方差自适应定位容易大通胀因素在过滤过程中,反映了混沌模型的背景场的变化特征,即对DA系统不是一个好的选择。因此,调查协方差自适应定位方法是一个未来的主题。此外,计算245年预测的平均日预测均方根情况下,我们发现天预测均方根的CL约等于5天预测均方根CL-MC。这表明CL-MC方法有潜在优势相对较大的整体大小考虑短期预测的相关错误。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

Mingheng Chang进行概念化、方法、软件验证,草稿准备和复习。Hongchao左监督的概念和方法。Jikai段进行调查和编辑。

确认

这项工作是支持的第二次青藏高原科学考察和研究程序(步骤)批准号2019 qzkk0103,中国国家自然科学基金批准号下422750699。这项工作也由兰州大学,中央大学基础研究基金在格兰特lzujbky - 2021 sp61数量。非常感谢帕维尔Sakov提供公开EnKF-Matlab软件。