基于VMD-DSE和Volterra自适应模型的月平均气温预测

摘要

气候是一个复杂而混乱的系统，温度预测是一个具有挑战性的问题。准确的温度预测在能源、环境、工业和农业等领域也备受关注。为提高月平均气温预测精度，减少混合预测过程的计算规模，提出了一种基于变分模态分解-微分符号熵(VMD-DSE)和Volterra的组合预测模型。首先，利用VMD将原始月平均气温序列分解为有限模态分量;利用DSE对序列进行复杂度分析和重构。然后，在相空间上重构新的序列。分别用互信息法和G-P法确定延迟时间和嵌入维数。在此基础上，建立Volterra自适应预测模型，对各分量进行建模和预测。最后，将预测结果叠加，得到最终的预测值。利用咸阳和延安的月平均气温数据验证了模型的预测效果。 The experimental results show that the VMD-DSE-Volterra model shows better performance in the prediction of monthly mean temperature compared with other benchmark models in this paper. In addition, the combined forecasting model proposed in this paper can reduce the modeling time and improve the forecasting accuracy, so it is an effective forecasting model.

1.介绍

在过去的一百年中，人类一直处于快速发展阶段，但全球平均地表温度在这一阶段有所上升[1］.全球变暖引起的气候变化导致极端天气事件频繁发生，气象灾害对人类发展的影响越来越大[2]，极端天气会对农业及经济发展造成不同程度的影响[3.］.温度被认为是影响人类、植物、动物和气候变化的因素之一。因此，准确预测气温具有重要意义[4，5］.

气候是一个复杂而混乱的系统;Blóschl等[6]，对水文研究中尚未解决的23个问题进行了分析和讨论，其中之一就是如何解决预测模型的不确定性。本文提出的建模方法为解决这一问题提供了一种新的途径。气温的变化与水文有密切的关系。建立确定性的温度预测模型一直是一个具有挑战性的问题。准确的温度预测在能源、环境、工业和农业等领域也备受关注。目前，温度时间序列的预测模型大多是基于统计的。它包括自回归模型(AR)、自回归滑动平均模型(ARMA)、自回归综合移动平均模型(ARIMA)、自回归部分综合移动平均模型(ARFIMA)和季节自回归综合移动平均模型(SARIMA)。AR、MA和ARMA模型常用于预测平稳序列。ARIMA是研究具有趋势的非平稳时间序列的一种重要方法。SARIMA是研究具有趋势和周期性的非平稳时间序列的一种重要方法。 In order to predict the temperature accurately, Papacharalampous et al. [7，8]研究了温度、降水、水流等水文时间序列预测，是目前规模最大的研究。大量的算法和多个时间序列被用来比较统计模型和机器学习模型在水文时间序列预测中的应用。Ma et al. [9]，利用ARIMA模型对三峡库区局部环境温度变化趋势进行分析和预测。Murty等人[10]使用SARIMA来预测印度的月平均最高和最低气温。Papacharalampous等[11]采用ARFIMA模型，采用自动单变量时间序列预测方法对月平均气温和降水进行预测。该统计模型使用方便，计算量小。它广泛应用于温度序列的预测。近年来，随着时间序列预测研究的发展，人工智能模型采用了新的研究方法和机器学习来解决复杂的预测工作。因此，越来越多的学者将人工智能模型应用到预测研究中。一些典型的人工智能模型，如人工神经网络(ANN)、回声状态网络(ESNs)和随机森林模型，已被应用于温度序列的预测。Tyralis和papacharalamous [12]采用大尺度温度序列数据评价随机森林的一步预测性能。Suzulmus [13提出了利用人工神经网络预测平均温度的方法。神经网络虽然具有良好的自学习能力和预测的非线性，但也存在易陷入局部最优、收敛速度慢、易振荡、隐层单元数难以确定等问题。Huang et al. [14]提出了一种基于回波状态网络模型的递归贝叶斯状态算法来预测温度时间序列。作为一种新型的复发性网络,回声状态网络克服了传统的复发性网络的问题是容易陷入局部最优,其训练算法是复杂的,但回声状态网络的随机产生水库不相关的具体问题和参数难以确定。上述预测模型可以有效地预测温度。但根据研究，温度序列具有非平稳特征[15，混沌时间序列的预测本质是重构原始动态系统的相空间。在各种非线性预测模型中，Volterra自适应预测模型由于其训练样本小、易于编程而被应用于不同的领域[16，17］.

在温度预测中，由于单一的预测模型无法达到最佳的预测效果，因此通常采用混合预测模型结合信号分解方法来提高预测精度。Huang等人提出的EMD [18]是一种数据驱动的信号分解方法，已被证明是一种很好的时频分析工具。Cai等[19]提出了EMD结合SVM预测南京月平均气温的方法。EMD得到的本征模态函数(IMF)能较好地反映系统的物理特性。然而，由于EMD对噪声敏感，因此存在模态混合和端点效应[20.，21］.德拉戈米列茨基和佐索[22]在2014年提出变分模态分解(VMD)。结果表明，VMD在信号分解中具有较强的分解能力、较好的噪声鲁棒性和较快的处理速度，因此在许多领域得到了广泛的应用[23，24］.利用VMD将复杂信号分解为易于处理的简单分量，然后对每个分量建立预测模型，以提高预测精度。例如，Ali等人[25]，利用VMD将风速数据分解为多个内禀窄带分量，便于其预测，实验结果验证了该方法的有效性。吴和林[26将VMD与小波分解相结合，预测空气质量指数，提高AQI预测精度。

结合模态分解的混合预测模型可以有效地提高预测精度。但如果对各模态分量进行建模和预测，则计算规模和预测误差会增大。香农提出利用熵[27来测量信号的不规则性和复杂性。结果表明，将具有近似复杂度的模态分量结合起来，对每个新的子序列建立预测模型，可以提高预测性能。魏和王[28]提出了基于样本熵(SE)的模态分量合并方法。尽管SE功能强大，但其计算速度相对较慢。Cao等[29]提出了一种基于置换熵(PE)的超短期风电功率预测IMF分量合并方法。作者认为，样本熵在小样本情况下会产生估计不准确的缺点，这可以用样本熵来弥补。Chen等[30.]提出了一种基于色散熵(DE)的模态分量合并方法，但该方法没有考虑信号波动对映射的影响。姚等人[31，32提出了微分符号熵(DSE)。李等人[33]提出DSE与模态分解相结合可以提高水声信号特征提取的识别率。DSE是一种量化非线性时间序列复杂性的新工具。从三个相邻元素中提取局部非线性动态信息，利用可调控制参数提高了非线性复杂度检测的灵活性。因此，DSE不仅计算效率高，而且可以度量短数据集的复杂度。

为提高月平均气温预测精度，减少计算尺度，提出了一种基于变分模态分解-微分符号熵(VMD-DSE)和Volterra的组合预测模型。首先，利用VMD方法将原始温度时间序列分解为有限平稳模态分量;其次，利用DSE分析子序列的复杂度，对熵值相近的模态分量进行合并叠加;然后分别计算每个新序列的时延和嵌入维数，并用Volterra预测模型进行预测。最后，将各分量的预测值进行叠加。实验结果表明，与其他基准模型相比，本文提出的组合预测模型提高了预测精度，能够有效预测月平均气温。此外，该模型对水文时间序列预测具有较好的参考价值。

2.材料和方法

2．1.月平均温度序列的相空间重构

混沌系统通过重构月平均温度序列的相空间，将一维时间序列扩展到高维相空间。恢复时间序列的原始动态特性，揭示其内在规律。在重建的相空间中，月平均温度的时间序列设为，以及适当的延迟时间和嵌入维被选中。重构相空间如式(1）.是时间的移动价值。所选的必须保持重构相空间的各分量彼此独立。如果延迟时间的值太大，时间序列中任意两个相邻的延迟坐标点都不相关，不能反映整个系统的特征。如果延迟时间过小，会造成数据冗余。嵌入维度确定重构相空间的维数。数据序列的嵌入维数不同，重构的相空间维数也不同。在哪里和相点是米-多维相空间。

帕卡德等[34]提出利用延迟坐标重构相空间。Takens证明了嵌入定理[35，表明当嵌入空间的维数至少为吸引子的两倍时，重构相空间在拓扑上等价于原系统的状态空间。因此，找到一个合适的嵌入维数，满足，在哪里重构相空间的维数是和吗为原始状态空间的相关维数。目前选择时间延迟的方法有两种:自相关法[36]和互信息法[37］.与第一个最小值对应的互信息法互信息较少，可清楚区分折叠的起始时间。因此，通过重构相空间可以定量和定性地分析吸引子的动态特性。本文中，G-P方法[38]来计算嵌入维数。互信息法[39计算延迟时间．G-P方法被证明是计算嵌入维数的一种简单有效的方法，此外，该方法还可用于判断时间序列的混沌性，如果相关维数随嵌入维数的增加而达到饱和值，则表明时间序列具有混沌特性信息法是一种非线性方法，广泛应用于解决相空间重构的时滞问题，自相关法仅描述两个变量之间的线性关系，难以推广到高维空间，而互信息法则描述了两个变量之间的整体关系wo变量。

２.２.变分模态分解

VMD是由Dragomiretskiy和Zosso提出的一种自适应信号分解方法[222014年)。分解过程实质上是求解一种特殊变分模型的迭代过程。通过迭代求解各模态分量的频率中心值和带宽;迭代过程的目标是最小化每个模式的估计带宽之和。

为了准确描述频率随时间的变化，需要一种更好的自适应、直观的瞬时频率分析方法。VMD是一种典型的瞬时频率分析方法。VMD方法的主要功能是稳定信号。将原始信号在不同频率下的波动或变化趋势进行分解，产生一系列具有不同特征的序列，每个序列称为本征模态函数(IMF)。利用VMD将复杂的非平稳信号分解为一系列不同频率的简单稳定信号。此时，对每个简单构件进行预测建模，可以有效降低预测的难度，提高预测的准确性。

首先，在建立信号分解的变分模型之前，将VMD得到的每个IMF定义为调幅调频(AM-FM)信号，如下式所示: 在哪里是k届国际货币基金组织的组件,和的瞬时振幅和相位是，分别为瞬时频率．所以,是带有振幅的谐波信号吗和频率．

在上述定义的基础上，VMD理论假设输入信号是由有限数量、有限带宽和不同频率的IMF组成的。在每个IMF分量的和等于输入信号的约束下，以最小估计带宽和为目标，建立了信号分解的变分模型。变分模型的建立过程如下[40]：（1）对每个模态分量进行希尔伯特变换，通过构造解析信号得到模态函数的单边谱。(2）每个模态分量的解析信号与相应的中心频率混合，从而将每个模态分量的频谱移动到基带。（3)估计每个模式组件的带宽。（4)通过引入约束条件，建立了约束变分模型。具体结构如下: 在哪里，表示子信号及其中心频率，K表示子信号总数，和表示狄拉克分布。

求变分问题的二次惩罚因子和拉格朗日乘子介绍了。为了将约束问题转化为无约束变分问题，推广了拉格朗日函数如公式(4)须表述如下:

变分模态分解采用乘子交替方向法(ADMM)求解方程(4), ，，和交替更新，在哪里表示迭代次数。公式如下:

给定一个判别精度e> 0，停止迭代的收敛条件为:

分解的逆过程是将熵值相近的序列划分为一类，再将同一类的子序列相加得到新的序列。本节描述了温度序列的分解和重构过程4．3．

2.3.微分符号熵

Shannon提出用熵来测量信号的混淆度和不确定性[27］.对于任意随机变量，当不确定性增加，熵值也增加。考虑到相邻元素的差异，Yao和Wang [31，32]建议DSE作为量化时间序列复杂性的工具。这种符号化将其复杂性检测归因于详细的局部动态信息。DSE的计算过程是对符号化后的数据序列进行编码。然后，通过计算每个代码的概率得到最终的DSE。流程图如图1所示1．具体流程如下:

（1）符号化过程:考虑时间序列，当前元素与其前向和后向元素之间的差异表示为和．4符号微分符号化通过以下等式获得：在哪里和．参数αIn可以从0.3调整到0.6。(2）符号序列编码过程:符号序列或词的构建，是在时间顺序中收集符号组的下一步。这种编码过程是用有限符号创建符号模板或字，与相空间构造的嵌入理论有一些相似之处。符号序列将被编码成米钻头系列还有考虑四符号微分符号化的编码序列的符号学。DSE的符号化和编码过程如图所示2．首先，将原序列按照方程(9)形成符号系列．其次，对符号序列进行编码。如果符号序列是，，则代码系列可表示为 ,“不应该少于符号类型的数目。把图2作为一个例子;符号类型个数为4，前三位符号序列为3、0、2，根据式(10）.在计算出代码序列后，计算出每个代码符号的概率为．（3)计算DSE值:根据所有单词的概率分布计算Shannon熵得到DSE，如式(11）.它的规范化形式是．

据参考[31，符号长度米DSE的调节因子α分别设为3和0.6。

２.４.Volterra自适应预测模型

Volterra模型可以适用于任何动态系统，无需假设模型结构[41］.设非线性离散动力系统的输入为输出是．从Takens嵌入定理可以看出，混沌时间序列的相空间重构本质上就是对动力学模型的重构通过动态系统的状态。方程建立如下:

然后，将三阶Volterra自适应级数展开如下:

根据公式(13），是对应每一阶的沃尔泰拉核，过滤器的长度，和米为电力系统的最优嵌入维数。方程(12)扩展为线性状态形式，如下式: 在哪里为信号的预测输出值，为滤波器的有效输入信号向量，是信号核系数矢量，和和表示如下:

对于Volterra自适应滤波器，采用自适应性能较好的归一化最小均方算法进行处理。滤波系数的滤波向量为输入信号有效向量为．最小均方算法描述如下：在哪里为收敛步骤( ）.

3.月平均气温预报的建议方法

vmd - dds - volterra组合预测模型流程图如图所示3.．具体步骤如下:

步骤1:VMD进程为了建立有效的预测模型，提高时间序列的预测精度。时间序列对月平均气温进行VMD分解，得到一组模态分量得到不同的频率和振幅，其中n表示模式组件的数量。每个模态分量相加得到原始信号．步骤2:DSE过程利用DSE计算了IMF1, IMF2，…并分析其复杂性。然后，加入熵值相似的IMF，得到新的子序列，在哪里年代是模式组件合并后的数量。其目的是解决超分解和计算负担的问题。VMD-DSE的分解和重组过程如图所示4．3．步骤3:Volterra预测过程（1）选取月平均气温历史数据作为训练数据，对训练数据进行相空间重构，得到预测的输入向量。(2）初始化Volterra模型的系数向量，并通过时间正交自适应算法训练系数向量，直至收敛。（3)将待测点时刻所包含的相空间输入训练后的Volterra滤波器，得到预测结果。步骤4:混合过程预测结果是，哪一个将被叠加来输出最终的预测结果．表示原始数据的预测值。

4.结果和讨论

4．1.数据来源和仿真软件

陕西省位于中国西北部，跨越北温带和亚热带。它整体上属于大陆性季风气候。咸阳市地处陕西省关中盆地，高温的季节也是降雨的季节。年平均气温9.0 ~ 13.2℃，年最低气温−18.6℃，年最高气温41.2℃。延安市位于陕西省北部的南半部。其地貌以黄土高原和丘陵为主。属暖温带半湿润干旱气候。每年的气候变化受季风环流的影响。年最低气温为−25.4℃，年最高气温为39.7℃。

本文选取咸阳市1958 - 2017年和延安市1951 - 2017年的月平均气温资料分别为60年和67年。数据来自中国气象数据网(http://data.cma.cn/）.咸阳和延安月平均气温的时间序列图如图所示4．另外，本文的软件环境是Matlab 2014b。在Matlab编程语言中进行了分析和可视化。我们使用了以下贡献的Matlab工具箱:混沌时间序列分析与预测Matlab工具箱试用版2.9 [42]信号处理工具箱[43］.在SARIMA模型的预测部分，SPSS 25 [44]软件用于处理数据。

(一)

(b)

4．2．月平均温度的相空间重构

以咸阳地区的温度序列为例，选取互信息法计算延迟时间，并用G-P法确定相关维数。数字5（a）显示咸阳月平均气温的延迟时间。当延迟时间为2时，互信息量第一次达到最小值。在此值之后，互信息的趋势趋于稳定，因此时延为2。数字5（b）显示了相关维数与嵌入维数之间的关系曲线。用G-P方法确定相关维数的变化曲线如图所示5 (c)．它可以从5（b）随着嵌入维数的增加米时，D-M曲线饱和。当米相关性维度继续增加d收敛到2.756。根据，嵌入维度米得到咸阳地区月平均气温时间序列为7。同时，d图中相关维数的值5（b）为饱和，表明咸阳地区温度序列存在混沌。

(一)

(b)

(c)

4．3．VMD-DSE处理

VMD需要设置模式号K在分解;当K值太大，会造成额外的噪声或导致模式重复。当K值过小，将导致模式未分解。所以，选择合适的模式号K对分解结果非常重要。由于各振型数的中心频率不同，采用中心频率法确定振型数K文中给出了相应的各模态中心频率K值测试。如果中心频率值接近模态值，则视为过分解[45］.经过反复实验，后续趋向于近似时K> 6,所以K= 6在本文中被选择。同样，将延安地区的温度序列用VMD分解为7个子序列。咸阳和延安地区温度序列的VMD和EMD分解结果如图所示6．

(一)

(b)

(c)

(d)

如图所示6(一)对咸阳地区气温序列的EMD计算得到的IMFs具有不同的特征。由于IMF1、IMF2、IMF3、IMF4分量在分解过程中不能被有效分离，会出现模态分量的混频现象。同时，EMD分解得到的IMFs受噪声干扰，两端有较大的摆动，影响整个分量序列。因此，它会产生较大的误差，使分解结果严重失真。数字6 (b)结果表明，咸阳月平均气温时间序列可通过VMD分解为6个imf。从分解结果可以看出，VMD改善了模态混叠和波形失真，分解后的IMF更加清晰，更有利于提高预测精度。对于延安温度序列，EMD结果如图所示6 (c)VMD分解结果如图所示6 (d)．与EMD相比，VMD克服了模态混合的问题，产生了更好的分解效果。通过VMD分解，得到延安地区7个imf。VMD可以通过分解得到具有近似复杂度的有限模态分量。如果采用Volterra模型直接预测每个子序列，计算规模会增大。为了减小计算规模，采用DSE算法分析各模式子序列的复杂度。对DSE逼近的子序列进行合并叠加，以减少模态分量。咸阳地区各IMF分量的DSE计算结果如表所示1．


子	IMF1	IMF2	IMF3	IMF4	IMF5	IMF6

内镜下动态慢动作影像价值	0.4853	0.5983	0.7291	0.6286	0.8008	0.6916
重组	IMF1	IMF2&IMF4	IMF3和IMF6		IMF5
新子	DSE-IMF1	DSE-IMF2	DSE-IMF3		DSE-IMF4

从表1将咸阳地区月平均气温划分为6个模态分量，其中IMF 2与IMF 4的DSE差值为0.0303，并将IMF 2与IMF 4合并为新的子序列作为Volterra的输入。同理，IMF 3与IMF 6之间的DSE值为0.0375，因此IMF 3与IMF 6可以合并为一个新的模态分量。IMF1和IMF5的DSE值与其他模式明显不同，可以作为新的子序列使用。VMD-DSE分解重构后咸阳的温度序列如图所示7(一)．

(一)

(b)

延安地区温度序列VMD分解后各分量的DSE值如表所示2．从表中可以看出2IMF2和IMF3的DSE值很接近，IMF5和IMF6的DSE值也很接近，因此我们合并了复杂度很接近的模态分量。IMF 1、IMF4、IMF7的DSE值与其他模式明显不同，可以作为新的子序列使用。延安经过VMD-DSE分解重构后的温度序列如图所示7 (b)．


子	IMF1	IMF2	IMF3	IMF4	IMF5	IMF6	IMF7

内镜下动态慢动作影像价值	0.6032	0.7293	0.7496	0.7090	0.8347	0.8484	0.7832
重组	IMF1	IMF2&IMF3			IMF5&IMF6
新子	DSE-IMF1	DSE-IMF2		DSE-IMF3	DSE-IMF4		DSE-IMF5

4.4。预测精度性能指标

本文选取了三个误差指标来衡量所提出的预测模型的预测效果:平均绝对误差(MAE)、均方根误差(RMSE)和相关系数(R）.MAE和RMSE用于量化预测值的误差;数值越小，预测精度越好。R表示真实数据与预测数据之间的相关性。越接近R为-1时，模型的预测性能越好。方程如下：在哪里代表预测数据,代表原始数据,表示预测数据的平均值，为原始数据的平均值表示数据的长度。

4.5. 咸阳市模型预测及结果分析

为了验证本文中描述的方法的有效性,共有704个数据咸阳的月平均温度从1959年到2017年由VMD-DSE分解和合并成四子序列,然后是三阶沃尔泰拉自适应模型用于训练和预测每个组件。对前647个数据进行训练，对后57个数据进行预测。

根据上述设置，利用Volterra模型对VMD-DSE分解的新子序列进行预测和重构。各分量的预测结果如图所示8(一个)图中红线代表咸阳月平均气温的实际值，蓝线代表组合预测模型的预测值。从图中各分量的预测效果来看8(一个)， DSE-IMF2对原始数据的拟合程度明显优于其他方法。在重建子序列时，可以从Table中看到1IMF3、IMF5、IMF6的DSE大于IMF2、IMF4。随着DSE的增加，组件的复杂性也随之增加。由于复杂性决定了预测的难度，预测误差也会增加。从表中可以看出1新序列DSE-IMF2是由原序列IMF2和IMF6合并生成的，因此DSE-IMF2的预测误差较低。

(一)

(b)

VMD DSE Volterra的最终预测结果是将每个组件的预测结果相加，如图所示8 (b)．可以看出，红线所代表的真实值与蓝线所代表的预测值拟合程度较好，预测效果较好。结果表明，VMD-DSE-Volterra模型具有较高的预测精度。为了进一步衡量该方法的预测效果，还将其与VMD-Volterra、VMD-DE-Volterra、EMD-Volterra以及Volterra、RBF等其他单一预测方法进行了比较。不同预测方法的结果如图所示9，局部放大如图所示10．从图中可以看出，蓝色的VMD-DSE-Volterra曲线与红色的原始数据曲线最接近。也就是说，VMD-DSE-Volterra具有更好的预测效果。与此同时，图11和表3.更直观地列出了不同预测模型的预测误差指标MAE和RMSE。


模型	RMSE	美	R

RBF	3.6643	2.5906	0.9303
SARIMA	2.3869	2.1014	0.9819
沃尔泰拉	2.1188	1.6170	0.9828
EMD-Volterra	1.4036	1.1556	0.9892
VMD-Volterra	1.0485	0.8181	0.9939
VMD-DE-Volterra	0.9348	0.7588	0.9955
VMD-DSE-Volterra	0.6703	0.5684	0.9977

数据9- - - - - -11和表3.验证本文提出的组合模型比其他模型具有更好的预测精度和误差。同时，从表中可以看出4VMD-DE-Volterra和VMD-DSE-Volterra的运行时间比VMD-Volterra短。结果表明，本文提出的模型不仅能减少预测误差，而且能有效地缩小运行规模。采用RBF模型和SARIMA模型作为基准模型，并与Volterra模型进行比较。RBF模型是局部近似的神经网络，SARIMA模型是季节性的ARIMA。根据比较R-square和BIC准则，SARIMA的周期为12，且SARIMA (1,0,1) (0,1,1)₁₂建立了预测月平均气温的模型。从结果来看，Volterra模型和SARIMA模型在咸阳地区的预测效果优于RBF模型，但Volterra模型的预测效果最好。RMSE表示预测值与实际值之间相对于实际值的均方误差。因此，当索引越小，结果越好。从表3.， RBF模型的预测精度低于Volterra模型。可以看出，VMD-Volterra的RMSE值为1.0485，而单一预测模型Volterra对应的RMSE值为2.1188。此外，VMD-Volterra的MAE值也远小于单一模型。结果表明，采用分解方法建立的预测模型可以大大提高预测精度，降低预测误差。


模型	沃尔泰拉	EMD-Volterra	VMD-Volterra	VMD-DE-Volterra	VMD-DSE-Volterra

次/秒	0.5136	0.7110	0.7557	0.4016	0.4597

从表3.可以看出，加入VMD分解和EMD分解可以提高预测精度3.，可以看出，VMD- volterra的RMSE和MAE分别为1.0485和0.8181,EMD- volterra的RMSE和MAE分别为1.4036和1.1556,EMD分解后，模型的误差指数大于VMD分解的误差指数。原因是EMD在分解过程中存在模态混叠和端点效应，分解效果明显比VMD差，预测误差相对较高。DSE作为一种量化非线性时间序列复杂度的新工具，极大地提高了非线性复杂度检测的灵活性。同时，为了验证DSE的优势，在相同的数据预处理基础上对VMD-DSE-Volterra和VMD-DE-Volterra进行了比较。VMD-DSE-Volterra的RMSE和MAE分别为0.5684和0.6703,VMD-DE-Volterra分别为0.7588和0.9348。从指标值来看，DSE非线性信号检测的复杂性更灵活，有利于提高预测的灵敏度和准确性。

综上所述，通过比较其他六种基准模型的预测性能，表明本文提出的混合模型能够有效提高预测精度。此外，分解方法和适当预测模型的选择对于预测非常重要。从表中可以看出3.，本文模型的误差最小。另外，从表中可以看出4VMD-DSE-Volterra的运行时间小于VMD-Volterra。结果表明，本文提出的组合预测模型可以减少建模时间，提高预测精度，是一种有效的预测模型。

4.6.延安市模型预测及结果分析

为进一步说明VMD-DSE-Volterra混合预测模型在月平均气温预测中的普适性和有效性，利用延安地区1951 - 2017年804个月平均气温数据进行了另一个实例分析。在本文中，前736个数据用于训练，后68个数据用于预测。预测结果如下:

数字12为延安地区7种模式的月平均气温预报曲线，局部放大如图所示13．表格5显示了每个模型的三个预测评价指标MAE、RMSE和R的值。如图所示14本文提出的VMD-DSE-Volterra模型的预测指标最低。如图所示12模型预测值与实际值的拟合程度最高。综上所述，混合模型的预测精度高于单一模型，本文提出的模型的预测效果优于其他基准模型。另外，从表中可以看出6通过将复杂度相近的部件组合在一起，可以减小操作规模。与咸阳地区月平均气温预测效果相似，Volterra模型优于RBF模型和SARIMA模型。另外，与VMD和EMD的分解效果相比，EMD分解后的序列预测误差较大。从图中可以看出6 (c)节4．3延安地区经EMD分解后的温度序列存在模态混合，模态混合的位置在序列的后半部分。因此，在分解的过程中，不能有效地将组分分离出来，导致预测值与实际值之间存在较大的误差。VMD可以避免模态混叠，产生更好的预测结果。从表5，最终预测精度与咸阳地区基本相同。预测精度最好的模型仍然是本文提出的VMD-DSE-Volterra模型。误差指标为RMSE、MAE和R分别为0.6728、0.5352、0.9976。


模型	RMSE	美	R

RBF	1.8565	1.5132	0.9850
SARIMA	1.6019	1.3093	0.9882
沃尔泰拉	1.4349	1.1668	0.9895
EMD-Volterra	2.8355	2.1598	0.9575
VMD-Volterra	1.0106	0.8677	0.9942
VMD-DE-Volterra	0.9248	0.7649	0.9953
VMD-DSE-Volterra	0.6728	0.5352	0.9976


模型	沃尔泰拉	EMD-Volterra	VMD-Volterra	VMD-DE-Volterra	VMD-DSE-Volterra

次/秒	0.4949	0.9812	0.9914	0.4071	0.6345

5.结论

为了提高月平均气温的预测精度，提出了一种基于VMD、DSE和Volterra的组合预测模型，并将其应用于咸阳和延安地区月平均气温的预测。主要结论如下:（1）该方法能有效克服EMD中模态混叠的缺陷。仿真结果表明，VMD分解效果更清晰，有利于预测。(2）本文利用DSE计算VMD模态分量的熵，并将熵值的近似分量合并重组。两组真实数据的仿真结果表明，该方法能有效地降低计算复杂度，提高预测精度。（3)本文首次将DSE与非线性信号预测相结合。实验结果表明，DSE在非线性信号预测中的应用可以有效地提高预测精度，减少操作规模。（4)本文提出的方法通过实际的月平均气温数据进行了检验，并与RBF、SARIMA、Volterra、EMD-Volterra、VMD-Volterra和VMD-DE-Volterra等6个模型进行了比较。实验结果表明，本文提出的组合预测模型VMD-DSE-Volterra能够有效预测月平均气温。与其他模型相比，本文提出的组合预测模型提高了预测精度，减少了误差。本文提出的建模方法为解决预测模型的不确定性提供了一种新的途径。此外，该模型对水文时间序列预测也具有较好的参考价值。

数据可用性

本文使用的温度数据来自中国气象数据网(http://data.cma.cn/）.

的利益冲突

作者声明没有利益冲突。

致谢

基金资助:国家自然科学基金资助项目(no. 201430430429);51709228)。

参考文献

L.V.Alexander，X.Zhang和T.C.Peterson，“全球观测到的每日极端温度和降水的气候变化，”地球物理研究杂志，第111卷，文章编号D05109, 2006。浏览：出版商的网站|谷歌学者
陈涛，敖天强，张旭东，李旭东，杨克斌，“岷江流域极端气温的气候变化特征”，气象学进展，第2019卷，第1935719号，第15页，2019年。浏览：出版商的网站|谷歌学者
“基于数值模式的极端天气集合预报研究进展”，地球科学进展第34卷第3期7，第706-716页，2019。浏览：谷歌学者
刘春霞，唐海清，尹永元，徐春霞，“气候变化下中国综合环境风险区划”，中国环境科学，2018,29(3):457 - 461。Scientia Geographica中央研究院第38卷第2期4, pp. 636-644, 2018。浏览：谷歌学者
O. Kisi和J. Shiri，“利用地理输入预测长期月气温”，国际气候学杂志第34卷第3期1，页179-186,2014。浏览：出版商的网站|谷歌学者
G. Blöschl, M. FP。Bierkens, A. Chambel等人，“水文(UPH)的23个未解决的问题-一个社区的观点，”水文科学杂志号，第64卷。10, pp. 1141-1158, 2019。浏览：谷歌学者
G. Papacharalampous, H. Tyralis，和D. Koutsoyiannis，“在纯统计框架内超前一步预测地球物理过程”，地球科学的信，第5卷，第5期。12, pp. 1-19, 2018。浏览：出版商的网站|谷歌学者
G. Papacharalampous, H. Tyralis，和D. Koutsoyiannis，“用于水文过程多步预测的随机和机器学习方法的比较”，随机环境研究与风险评估第33卷第3期2，页481-514,2019。浏览：出版商的网站|谷歌学者
“基于时间序列分析的三峡库区局部环境温度变化及预测研究”，中国农业气象第39卷第3期1，第9-17页，2018。浏览：谷歌学者
K. V. Murthy, R. Saravana，和K. V. Kumar，“1981-2015年印度月平均最高和最低气温模式的随机模拟，”气象学和大气物理学，第131卷，第2期4，第775-787页，2019。浏览：谷歌学者
G. Papacharalampous, H. Tyralis，和D. Koutsoyiannis，“使用自动时间序列预测方法的月温度和降水的可预测性”，Acta Geophysica第66期4, pp. 807-831, 2018。浏览：出版商的网站|谷歌学者
H. Tyralis和G. Papacharalampous，“随机森林时间序列预测中的变量选举”，算法，第10卷，第5期。4，页114,2017。浏览：谷歌学者
S.Suzulmus，“使用人工神经网络方法预测平均温度：土耳其Gaziantep Provnice的案例，”费森尤斯公司环境公报第28卷第2期2A, pp. 1494-1502, 2019。浏览：谷歌学者
黄斌，秦国华，“基于自适应膨胀因子的温度预测递归贝叶斯回波状态网络，”神经计算与应用，第29卷，第12期，第1535-1543页，2016年。浏览：出版商的网站|谷歌学者
罗勇，吴军，徐学军，“非平稳时间序列分析在合肥市平均气温动态变化中的应用”，安徽农业大学学报，第40卷，第6期，第1059-1062页，2013年。浏览：谷歌学者
王振宇，田春霞，朱秋波，“基于信号分解的最小二乘支持向量机模型的小时太阳辐射预测”，能量，第11卷，第5期。文章编号en11010068, 2018。浏览：谷歌学者
黄富民，田永刚，“基于混沌理论的WA-Volterra耦合模型在月降水预测中的应用”，地球科学第39卷第3期3, pp. 368-374, 2014。浏览：谷歌学者
黄乃东，“基于经验模态分解和Hilbert谱的非线性非平稳时间序列分析”，伦敦皇家学会学报，第454卷，第2期。1998年，第903-995页。浏览：出版商的网站|谷歌学者
“基于经验模态分解和支持向量机的南京市月平均气温预测，”数学的实践和理论，第44卷，第5期。22, pp. 103-111, 2014。浏览：谷歌学者
“基于自适应带宽约束信号的b样条经验模态分解消除模态混叠方法研究”，振动与冲击学报，第37卷，第2期16，第83-90页，2018。浏览：谷歌学者
何振平，朱志强，谢海昌等，“基于最小二乘拟合的经验模态分解边界效应抑制方法，”系统仿真杂志，第30卷，第9期，第3377-3385+33982018页。浏览：谷歌学者
K. Dragomiretskiy和D. Zosso，《变分模式分解》，IEEE信号处理汇刊第62期3, pp. 531-544, 2014。浏览：出版商的网站|谷歌学者
Y.Wang，R.Markert，J.Xiang和W.Zheng，“变分模式分解及其在转子系统碰摩故障检测中的应用研究，”机械系统和信号处理，第60-61卷，第243-251页，2015年。浏览：出版商的网站|谷歌学者
C. Aneesh, S. Kumar, P. M. Hisham，和K. P. Soman，“基于经验小波变换的变分模态分解在支持向量机电能质量扰动分类中的性能比较”，Procedia计算机科学，第46卷，第372-380页，2015。浏览：出版商的网站|谷歌学者
M. Ali, A. Khan，和N. U. Rehman，“基于变分模态分解的混合多尺度风速预测”，国际电力能源系统汇刊， vol. 28, Article ID e2466, 2017。浏览：出版商的网站|谷歌学者
吴青，“考虑空气污染因素的空气质量指数预测的一种新的最优混合模型，”全环境科学，第683卷，第808-821页，2019。浏览：出版商的网站|谷歌学者
c·e·香农，《交流的数学理论》贝尔系统技术期刊第27卷第2期3，第379-423页，1948。浏览：出版商的网站|谷歌学者
“基于快速集合经验模态分解、相空间重构、样本熵和改进的反向传播神经网络的短期风速预测，”能源转换与管理， 2018, vol. 157, pp. 1-12。浏览：谷歌学者
曹伟，刘立春，王志强，李建辉，“基于MEEMD和排列熵的风电功率超短期预测研究，”可再生能源资源，第37卷，第2期3，第439-444页，2019。浏览：谷歌学者
陈勇，“基于AVMD-DE和IBSA-KELM的混沌网络流量组合预测”，计算机应用及软件第35期6，页117-121,2018。浏览：谷歌学者
W.Yao和J.Wang，“非线性动力学复杂性分析中的微分符号熵”，2019年，http://arxiv.org/abs/1801.08416v2．浏览：谷歌学者
姚伟，“非线性动态复杂性分析中的双符号联合熵”，AIP预付款，第7卷，第5期7、文章ID 075313, 2017。浏览：出版商的网站|谷歌学者
G.Li，Z.Yang和H.Yang，“基于再生相移正弦辅助EMD、互信息和微分符号熵的船舶辐射噪声特征提取，”熵第21卷第2期2、2019、76。浏览：出版商的网站|谷歌学者
N.H.Packard、J.P.Crutchfield、J.D.Farmer和R.S.Shaw，“时间序列中的几何”物理评论快报第45卷第5期9，第712-716页，1980。浏览：出版商的网站|谷歌学者
F. Takens, D. A. Rand和L. S. Young，《探测湍流中的奇怪吸引子》，数学课堂讲稿，第898卷，第366-381页，1981年。浏览：出版商的网站|谷歌学者
H. D. I. Abarbanel, R. Brown, J. J. Sidorowich, L. S. tsiming，“物理系统中观测到的混沌数据的分析”，现代物理学评论，第65卷，第5期4，第1331-1392页，1993。浏览：出版商的网站|谷歌学者
A. M. Fraser和H. L. Swinney，《来自相互信息的奇怪吸引子的独立坐标》，物理评论一个第33卷第3期2，第1134-1140页，1986。浏览：出版商的网站|谷歌学者
P. Grassberger和I. Procaccia，《测量奇怪吸引物的奇异性》，物理学D:非线性现象，第9卷，第5期。1-2页，189-208,1983。浏览：出版商的网站|谷歌学者
吕学强，曹波，曾敏，黄绍生，刘学刚，“互信息方法中延迟时间的选择算法”，计算物理学报，第23卷，第2期。2，页184-188,2006。浏览：谷歌学者
“基于变分模态分解和基于萤火虫算法改进的反向传播神经网络的太阳黑子时间序列预测模型，”计算智能与神经科学，第2018卷，文章编号3713410，9页，2018年。浏览：出版商的网站|谷歌学者
R. D. Nowak和B. D. Van Veen，“volterra滤波器识别的随机和伪随机输入”，IEEE信号处理汇刊，第42卷，第2期8、1994年。浏览：出版商的网站|谷歌学者
“基于稀疏volterra滤波器的混沌时间序列非线性自适应预测，”电子系统工程，第29卷，第2期9，第1428-1431页，2007。浏览：谷歌学者
丁磊，潘志成，丛伟，“基于MATLAB信号处理工具箱的数字滤波器设计与仿真，”电力系统保护与控制第31卷第1期9，第49-51页，2003。浏览：谷歌学者
徐德胜，杨伟，魏哲，刘国贤，“SPSS在短期负荷特征分析中的应用及其预测，”电力系统保护与控制，第37卷，第2期21, pp. 147 - 151,2009。浏览：谷歌学者
基于变分模态分解和模糊C均值聚类的滚动轴承故障诊断，"中国电机工程学报第35期13, pp. 3358-3365, 2015。浏览：谷歌学者

气象学进展

摘要

1.介绍

2.材料和方法

2．1.月平均温度序列的相空间重构

２.２.变分模态分解

2.3.微分符号熵

２.４.Volterra自适应预测模型

3.月平均气温预报的建议方法

4.结果和讨论

4．1.数据来源和仿真软件

4．2．月平均温度的相空间重构

4．3．VMD-DSE处理

4.4。预测精度性能指标

4.5. 咸阳市模型预测及结果分析

4.6.延安市模型预测及结果分析

5.结论

数据可用性

的利益冲突

致谢

参考文献

版权