文摘
在这篇文章中,Box-Cox和Yeo-Johnson转换模型应用于两个时间序列数据集的每月平均温度提高预测能力。应用程序算法将原始的积极响应使用第一个模型和固定响应使用第二个模型改进的非参数估计函数时间序列。Box-Cox模型有助于提高原始数据的非参数估计的结果,但结果变得有点困惑后试图使转化反应变量固定的意思,而函数时间序列的预测更准确的使用改变了固定数据集使用Yeo-Johnson模型。
1。介绍
预测未来是时间序列分析的主要功能。从这个想法,研究人员已经开发出几个关心的技术预测精度的改进治疗时间序列作为随机过程。功能数据分析方法或所谓的随机预测(1)允许处理观察作为一个函数(2]自由以外的条件参数和完全非参数建模。这个处理时间序列的观测数据是连续的,可以分为连续时间(3]。因此,时间序列的尺寸减少损失有限的信息(4)和代表几个函数的线性组合的数据(精选)而不是治疗其原始形式的数据作为一个向量的值(2),也就是说,处理和转换时间序列数据的结构符合回归模型的结构。商2019年表明,观测的时间依赖性在一些数据集,主成分方法可能导致错误的估计。因此,两位作者认为,这个问题可能加剧了在某些时间序列数据,特别是那些具有季节性变化的存在。然而,它已成为在实际应用时间序列,他们很少静止和季节性变化,趋势,和外部因素的依赖已经成为规则,没有例外5]。出于这个原因,它可以表示,数据转换已成为传统的一部分参数和非参数分析复杂的时间序列。
在这篇文章中,两位作者使用了Yeo-Johnson转换改善功能的非参数估计时间序列。这两种方法的使用、转换和功能分析不考虑建模条件是为了重点分析目标和效率标准的预测能力。
本文的其余部分组织如下。Box-Cox和Yeo-Johnson转换在下一节介绍。第三部分包含问题的配方和拟议中的应用方法。实例都包含在第四节中,当第五部分包含一些结论。
2。Box-Cox和Yeo-Johnson转换
轮流地(6)建议Box-Cox转换(BCT)方法在回归模型,以减少异常数据,减少非线性,实现常态随机错误。方法假定,任何响应变量 和 ,转换后的变量 当 和 当 。当= 1,数据分析在原有规模,而案例 对应的自然对数转换数据。旅级战斗队的假设是基于转换后的正常反应,然后定义原始响应的概率密度函数作为变量的变化的“逆向转换”技术。
杨和约翰逊(7)广义旅级战斗队在数据集(包括正面和负面的值7]。他们用光滑条件将转换为积极的和消极的观察,从而获得一个单参数变换的家庭(8]。为 ,YJT给出的
这种转变是适合当纠正左和右歪斜 和 ,分别在线性关系时实现 (9]。此外,Yeo-Johnson转换(YJT)可以容纳对数平均标准化逆变换后的属性是可逆的10]。
1970年,盒子,詹金斯建议首次使用电力转换ARIMA模型(11]。日期之后,许多作者拿起这个话题,多次建议在许多数学和应用方面的时间序列。同时,他们中的一些人表示一些故障在实际情况下,例如,成功限制正常的假设转换后的数据,这可能导致明显的改善数据模型的简单性和估计的准确性12尤其是在模型变量的偏态(10]。库克和橄榄,13和阿特金森8)还指出,转换参数的估计可以特别敏感的离群值。时间系列的一些实际情况下,旅级战斗队可能不会导致改善预测性能(11),或陈和李14)说,它不一致产生优越的预测。
一些问题在实际应用中出现的原因有两个:第一个是很难获得一个最优值转换的参数,同时,假设分布的拟合的条件得到满足,转换后的数据和模型误差是最小的,而第二个是转换导致的性质改变模型的变量之间的关系,这可能会导致缺乏平衡的效率统计推断和解释变量的影响的大小(15]。
3所示。配方的问题
让我们考虑一个单变量时间序列{ ,通过时间序列样本再分割成( )统计样本的大小 。这个部门可以重新定义为时间序列数据功能在这样的时代之间的变化趋势系列通过功能分析诊断工具(1]。因此,这种关系可以被描述为一个标准的回归模型。 在哪里是光滑的功能数据,是独立同分布的序列函数白噪声序列在这样 。 同分布的随机变量的功能 和 作为一个标量的回应。为了描述的关系,响应 ,考虑到功能变量 ,假设 对于一些和一些 。然后,我们得到一个统计的样本曲线 的大小和响应 (16,17]。通常的非参数估计的函数关系有几个优点,可以很好适应本地特性的时间序列数据18)和鲁棒性的函数形式misspecification [19]。内核回归估计量是评价在给定函数通过 在哪里是一个内核函数,(取决于 )是一个积极的实际带宽,和 表示任何半度量的(接近)指数之间观察到的曲线。作者建议几个方面找到方程(3),包括内核回归估计量、功能条件分位数和条件模式。
很多有用的解释方法可以用来测量之间的亲密(亲近)曲线的函数变量降维空间。Ferraty和Vieu16)指的是至少三个家庭的半度量的测量 ,例如,函数主成分分析(FPCA)的距离是衡量数量的平方根 。同时,还有另一个测量基于二阶导数,近距离的测量数量的平方根(Dauxois et al。(1982), Castre et al。(1986), Ferraty和Vieu16),Febrero-Bande和奥维耶多。德。拉。(2012))
关于内核估计量(3),魔杖et al。20.)表明它不工作当数据是不对称的,至于标准主成分分析可能不是合适的技术应用当数据分布偏斜或有异常值21]。因此,电力转换被认为是一种重要的替代提高功能数据的非参数估计的效率(更多细节,请参阅[12,22,23])。
大多数转换方法有一个共同的分析路径,幂变换模型的选择,并提出一种算法估算的电源参数并行机制的传统参数估计模型。同时,通常有两种方向的参数的估计;第一个是参数方向下的电力参数估计统计建模的假设。这个方向的最重要方法是Box-Cox转换(BCT)来提高效率的常态下的多元线性回归模型的假设转化反应(6]。此外,魔杖et al。20.)用相同的方法Box-Cox提高密度估计的效率的假设下一些转换变量的分布20.)(参见[24,25,26])。
第二个方向是权力的非参数估计的参数没有任何假设响应和误差分布或所谓model-independent方法(27)(参见[28,29日])。在这个方向,电力参数可以根据一些估计决策规则如最小化或最大化模型效率的一些指标。
4所示。应用程序的方法
众所周知,电源转换是重要的进行时间序列方差固定,而使得时间序列的差分是有用的静止的意思。一般来说,这些方法可以代替另一个。然而,有时权力转换可以使时间序列平稳。及因为BCT用于转换的积极响应,使用它将成为重要的原始数据作为第一阶段,然后计算差异实现平稳的时间序列。因此,方差从权力转换将获得稳定差分化过程的影响。在这方面,Dittmann和格兰杰30.]表明,对于每一个非平稳的过程,多项式转换也非平稳的随机趋势意味着和不变性。为了克服这些问题,作者认为使用YJT将适当提高forecastability,因为它可以用来稳定平稳时间序列的方差。同时,电力参数的估计根据一定的决策规则,我们指的是适当的,只要问题是与非参数相关的功能分析。
方法包括估计平滑功能数据的应用程序在回归方程(2根据内核估计方程()3)改造后时间序列数据集。学力测验应用于原始时间序列数据集,而YJT用于平稳时间序列数据集。所以,重新定义了曲线的统计样本的表达
和响应的表达式
在哪里 和代表一个数据转换函数的功率参数 。
对于每个转换模型,决策规则采用选择功率参数的最优估计是对应于最低的估计意味着广场功能的最后曲线预测错误的变量根据方程 在哪里和是 - - - - - -估计和实际价值在过去的曲线。至于值,他们从旅级战斗队的反演计算,YJT,或者我们可以称之为变回原形从转换后的数据度量原始指标。
所以,旅级战斗队的应用算法和YJT模型和非参数估计转换函数时间序列如下:(1)修复定义表达式(4)和(5)(2)消除季节性模式的差异使时间序列平稳(3)修复 ,在哪里 (4)为每一个 ,旅级战斗队用于将原始时间序列和YJT用于平稳时间序列的变换差异两个解释功能矩阵 和 (更多关于矩阵R中的少女组织程序的详细信息,参见[16,31日])。(5)评估说明函数估计的关系 根据以下内核估计量:
最优值的参数是减少了吗最后的功能变量。
5。应用程序
两个转换模型、旅级战斗队和YJT被应用到两个时间序列的例子每月平均温度,和R程序被用来分析数据。第一次系列有一个大小为200的观察尼尼微城在伊拉克(听)每年八个月下雨。我们的月平均气象观测站的尼尼微(图1976到20001(一))。第二有一个大小为300的观察突尼斯(TST)个月期间的1991年到2015年。这些数据可以发现https://climateknowledgeportal.worldbank.org(图1 (b))。
(一)
(b)
发现这两个时间序列并不是静止不动的,这显然是证明了自相关函数(ACF)的值以外的信心水平在图2。
(一)
(b)
旅级战斗队模型运用到两个时间序列根据五步算法建议部分4,我们获得的结果见表1。
正如预期的那样,很明显从表中所示的结果1的估计均方误差下降相比,它的价值在使用银联信讬造成原始数据的分析 这些令人困惑的结果克服当YJT模型是根据相同的五步算法。
至于试图使原始和转换一阶时间序列平稳的差异,两个转换系列的MSE估计增加和减少在原来的系列。通过应用YJT模型根据相同的五步算法,更准确的预测得到了更少的错误比错误估计通过使用BCT模型(表2)。图3显示了块最新的原始值和预测值曲线(25年)后平滑的数据使用YJT模型两个时间序列。
(一)
(b)
6。结论
重要的是要注意,最优功率参数对于转换模型是显著不同,即使YJT代表模型的扩展版本银联信讬。作者认为,这种差异和位移两种模型生成的原始数据是由于使用非参数估计方法选择最优功率参数代替正常的假设参数方法转化反应,除了差异水平平稳和非平稳的时间序列数据集之间的同质性。
应用本文方法表明YGT可以成功的替代旅级战斗队改善功能的非参数估计时间序列。同时,非参数估计的参数不受限制的条件概率分布为研究者提供了广泛的选项,以确保预测的准确性。
数据可用性
数据集支持本文的结论都包含在这篇文章。
的利益冲突
作者宣称没有利益冲突。