文摘

随着全球国际化的影响,旅游经济也在快速发展。引起的兴趣越来越浓厚创新使我们更先进的预测方法预测方法。摘要季节性自回归综合移动平均趋势与树突神经网络模型(SA-D模型)来执行提出了旅游需求预测。首先,我们使用季节性趋势自回归综合移动平均模型(SARIMA模型)排除长期线性趋势,然后火车的残留数据树突神经网络模型和短期预测。本文结果表明,SA-D模型可以实现更好的预测性能。为了演示SA-D模型的有效性,我们也使用其他作者的数据用于其他模型和比较结果。它也证明了SA-D模型取得了良好的预测性能的归一化均方误差,绝对误差百分比和相关系数。

1。介绍和文献综述

与全球国际化的影响,旅游业也在快速发展的状态。我们都知道,旅游业的影响一个国家的经济和社会发展是巨大的。它不仅可以商业、贸易和资本投资,但也为员工创造就业和创业精神和保护文化遗产和文化价值观(如表所示1)。每个国家都想知道数据的入境游客和旅游为了选择一个合适的策略为其经济福利。因此,需要一个可靠的预测,在旅游规划中起着重要作用。

准确预测构建更好的旅游规划和管理的基础。然后更高效的旅游需求预测技术研究正在呼吁。

在过去的二十年里,旅游需求建模和预测中两个最重要的区域旅游研究吸引了越来越多的学者和实践者的关注。李歌和总结说,二十年前,只有少数学术期刊发表旅游相关研究(1]。现在有超过70种期刊,一个蓬勃发展的研究社区服务覆盖全球五大洲3000多个大专院校。然而,没有一个灵丹妙药旅游需求预测。

近年来,统计被广泛应用于旅游经济研究。在统计方法中,时间序列预测是一个重要的预测领域。它可以分为两类:线性方法和非线性方法。最受欢迎的线性方法简单模型(2- - - - - -5),指数平滑(ES)模型(2,6],和自回归综合移动平均(ARIMA)模型(3,4,6]。其中,最先进的预测模型的线性方法是集成自回归移动平均模型(ARIMA)已成功在许多实际应用测试。如果线性模型可以近似底层数据生成过程,他们可以被认为是首选的模型。然而,如果表现良好的线性模型失败样本内拟合和样本外预测,应该考虑更复杂的非线性模型。基于这种观点,许多学者也转向非线性方法如神经网络(NN) [3,4,7,8]。尽管仍有一些怀疑基于神经网络的旅游需求预测,人们普遍认为,非线性方法比线性方法在建模的经济行为和有效地帮助明智的决策。

神经元网络已经被许多专家认为是一种很有前途的技术,时间序列预测。因此,在过去的几十年里,超过2000篇文章发表的关于神经网络预测的覆盖范围广泛的应用程序(9]。统计预测技术相比,神经网络方法有一些独特的特性,如(1)非线性和数据驱动的,(2)没有要求一个明确的底层模型,和(3)更加灵活和通用,因此适用于更复杂的模型(10]。此外,尼尔森等人,张和克莱恩(11,12)建议时间序列预处理(如)消除趋势和消除季节性明显有助于神经元网络模型的性能。

到目前为止,有许多研究者使用很多方法预测旅游需求。他们可以分为三种类型:时间序列神经网络,结合模型。2014年,特谢拉和费尔南德斯发表(13),三种方法都提到过。除了这些,还有很多作者分别使用三种方法。例如,盒子et al .,赵,楚,歌曲,和李,法律,曲,和张Shahrabi et al .,李et al ., Kawakubo Kubokawa使用了传统的时间序列方法预测旅游需求1,3- - - - - -7,14- - - - - -17]。神经网络是出名的,有很多作者转向使用神经网络来预测时间序列数据,如陈et al ., Claveria,给了戴维斯et al ., Constantino et al .,法律、林等,和Pai和香港3,4,8,18- - - - - -22]。随着科学的进步,越来越多的方法被使用。合并后的模型是最受欢迎的方法。到目前为止,贝茨和格兰杰,陈,沈et al .,和燕使用这种方法,得到了预期的结果23- - - - - -26]。除了这些,其他一些方法,如支持向量回归(27,28和新型混合动力系统29日,30.提出了]。他们已经取得了巨大的成就在优化问题和预测问题;然而,数据预处理和已故的参数选择问题相对复杂。

分析时间序列数据的时候,我们应该特别注意的季节性时间序列。季节性是旅游需求的一个显著特征和不容忽视的建模过程使用月度数据时。如何处理旅游的季节性波动的数据一直是一个重要的问题在旅游需求预测。我们总是使用正常分位数转换或季节性差分法消除季节性的影响(31日,32]。

在本文中,我们最先进的混合线性模型(SARIMA模型)与创新的神经网络模型(模型)款在一起,称之为混合模型SA-D模型。我们获得SA-D模型执行比款模型在旅游需求预测比较结果显示。

本文组织如下。节2、SARIMA模型款模型,组合模型(SA-D模型)。部分3描述了数据集,讨论了评价方法比较预测方法和需要统计测试来检查SA-D模型,然后比较了模型,其他作者给了通过使用相同的数据。在那之后,给出了实验结果。部分4提供结论。

2。建模(统计建模和神经网络)

时间序列模型解释变量对自己的过去和一个随机扰动项。时间序列模型被广泛用于旅游需求预测在过去四十年。在本节中,两种模型描述如下。

2.1。ARIMA模型和SARIMA模型

华宇电脑是最受欢迎的预测时间序列的线性模型。它取得了巨大的成功在学术研究和工业应用。一般的ARIMA模型是有序的 ,它可以写成 在哪里 代表的游客和随机误差项 ,分别。 是一个向后移位算子定义的 与之相关 通过 ; ; 差分的顺序。 自回归(AR)和移动平均线(MA)运营商的订单吗 分别定义为 自回归系数和吗 是移动平均系数。

当合适的ARIMA模型的原始数据,ARIMA模型包括以下四个步骤:(我)识别的ARIMA 结构(2)未知参数的估计(3)估计残差拟合优度检验(IV)根据已知的数据预测未来的结果

正常应该独立同分布随机变量和的意思= 0和恒定方差= 。的根源 都应该在单位圆之外。箱等人提出的,至少50或100最好的观察应该用于ARIMA模型(14]。

如果数据定期具有显著的季节性变化。我们可以使用SARIMA模型使用季节性差分法消除季节性周期的影响。然而,如果季节性被认为是确定性的,季节性的假人引入时间序列模型就足够了会计的季节性变化。为了测试季节性的存在单位根,HEGY测试(33被广泛使用。与HEGY测试,另一种方法称为测试分数测试季节性组件集成在2004年引入了时间序列(34]。模型季节性波动的另一种方法是使用周期自回归模型。这个模型允许参数根据不同的季节,因此可能反映了季节性经济决策比常数参数规格更充分。

2.2。款模型(神经元树突非线性模型)

最近,越来越多的非线性预测模型提出了解决时间序列的问题。李歌和得出结论,其中,ann(人工神经网络)正在接受增加利益由于不完善的数据的能力,自组织功能,自学,数据驱动的,相关的记忆,和仲裁者函数映射(1]。

我们都知道,每个神经元的结构是独一无二的;它包含三个部分:胞体、树突和轴突。从其他神经元树突接收信号;然后计算信号在胞体突触和传播。如果信号在胞体超过阈值,细胞将火和发送信号到其他神经元轴突。

在1943年提出了一个简单的神经元模型由McCulloch和皮特树突和突触无党派人士并没有影响他们从一个到另一个(图1)[35]。然而,在1987年,明斯基,Papert表明McCulloch-Pitts模型仅限于解决复杂问题[36]。

不同于McCulloch-Pitts模型不考虑神经元树突结构,神经元树突非线性模型与模型(模型)款提出了我们的研究。款模型可以概括如下:(1)树突可以被任意初始化的决定。(2)突触在同一分支相互作用。(3)非线性相互作用产生一个树突可以表示一个逻辑网络。(4)在学习后,树枝的成熟突触的数量和位置和类型将合成的树枝上。

如图2树突分支接收信号 然后执行一个简单的乘法的信号。树枝交界处,输出总结然后进行soma(细胞)。如果输入的soma超过一个阈值时,细胞会火,并将其发送到其他神经元轴突。

突触功能。在连接层,乙状结肠函数反映了树突突触之间的交互。突触的输出的地址的 th ( )输入 th ( )分支是由以下方程: 分别指的是连接参数 是一个积极的常数。当 变得足够大,乙状结肠函数将会类似于阶跃函数。通过改变的价值 四种类型的突触连接可以定义:直接连接,反向连接,一个常数,连接,和常数1连接。

树突的功能。它执行一个简单的乘法不同突触连接的分支。的输出 分支是由

膜功能。这是近似如下:

Soma函数。由乙状结肠soma描述的功能操作;当 作为一个积极的常数, 是作为一个阈值从0到1。

学习函数。因为款是一个前馈网络与连续函数,误差为款back-propagation-like算法是有效的。通过学习规则,目标向量和实际产出之间的误差向量可以表示如下: 根据梯度下降学习算法,突触的参数 可以修改的方向减少的价值 。方程如下所示: 在哪里 是一个积极的表示学习速率常数。较低的学习速率使收敛非常缓慢,而高学习速率是困难的制造误差收敛。部分差异 关于 计算如下:

2.3。合并后的模型(SA-D模型)

两种线性和非线性模型取得了成功在自己的线性或非线性问题。然而,没有人是一个通用模型,适用于所有的情况。贝茨和格兰杰表示,组合模型有线性和非线性建模能力将是一个不错的选择对于预测时间序列数据(23]。线性和非线性模型有不同的独特的力量来捕获数据特征在线性或非线性领域,所以在这项研究中提出的组合模型是线性组件和非线性组件组成。因此,组合模型可以用改进的模型线性和非线性模式预测的整体性能。

它可能是合理的考虑时间序列是由一个线性自相关结构和非线性组件可以执行 在哪里 线性组件和吗 是非线性组合模型的组件。这两个 必须是估计的数据集。首先,作者让线性模型(在这里我们使用SARIMA模型执行明显的季节性趋势)模型线性部分;然后从线性模型的残差将只包含非线性关系。让 代表剩余时间 ;然后我们可以知道 在哪里 表示线性模型的预测价值 。通过使用非线性模型残差模型(在这里我们使用款模型),非线性关系可以被发现。在本文中,我们建立了模型使用以下输入层: 在哪里 代表剩余时间 从ARIMA模型, 是一个非线性函数由款模型,然后呢 是随机误差。和组合预测可以执行 在哪里 的预期值是(12)。

3所示。结果和预测

3.1。数据集和过程

由于经济的快速增长和国际旅游促销,游客来到日本的数量逐年大幅增加。这里我们选择2015:12入站2009:1游客。和数据集的过程如图3。收集到的数据被分成两组:训练数据(数据在2015年之前)和测试数据(2015年数据)37,38]。

3.2。评价方法

等定量统计指标归一化均方误差(NMSE),绝对误差百分比(猿), (相关系数),程序运行时间(PRT)是用来评估预测模型的预测性能(表2)。NMSE和猿是用来衡量预测和实际值之间的偏差。NMSE和猿的值越小,越接近实际值的预测值。度规R采用测量相关的实际和预期的值。PRT可以测量模型的运行速度。

3.3。实验结果

定期的数据有明显的季节性变化,我们在本文中使用SARIMA模型来消除线性趋势。如图4所示,我们可以决定可能的一代又一代的ARIMA模型和使用Akaike信息准则(AIC)来测试它的后代是最好的。

通过SARIMA模型,我们得到的数据没有线性趋势和培训单独的数据模型和SA-D模型款。我们可以得到的结果模型和SA-D模型如下款。

作为数据5- - - - - -7节目,我们可以看到,SA-D模型执行的结果比那些款的模型。为了深入评估模型和SA-D款的性能模型,我们计算猿,NMSE,R测试数据集如表3所示。

我们可以看到,虽然PRT款模型的毛比SA-D模型,NMSE,猿,RSA-D模型的比那些款的模型。

3.4。模型比较

为了演示SA-D模型的有效性,我们训练中使用的相同的数据,其他作者其他组合模型和比较的结果SA-D模型和其他组合模型。我们收集了每月的出境旅游台湾人口数据三个方面(美洲、欧洲和大洋洲)旅游局,M.O.T.C.中华民国(台湾)。研究时间范围从1998年1月到2009年6月(39]。收集到的数据被分成两个部分,训练数据(数据从1998年至2007年)和测试数据(数据2007年之后),为每个旅游需求时间序列。作者按比例缩小的范围内的数据 通过以下公式: 所以我们使用相同的数据与预设的作者一样,没有预设的数据分别,让我们的实验结果。

与模型之前,我们总结实验结果基于正交阵列,因子赋值,如表和统计测试4所示。这里的MSD值计算 ,在那里 意味着结果的均值超过20分, 意味着标准差。它可以验证是否数据更接近现实。和 价值可以确定是否剩余是白噪声序列统计检验后使用QLB统计。最后,我们选择7号的结果做比较。

如表5表明,我们的模型有更好的结果比其他作者的模型。但是我们不得不说,预设的数据(14)使结果更好,减少程序的运行时间。

4所示。结论

在这项研究中,我们提出了一种新的模型,SA-D模型,混合SARIMA模型和款模型联系在一起。首先,我们使用收集的数据来自日本观光厅土地、基础设施、交通、旅游业和日本国家旅游组织比较SA-D模型和款模型;结果表明,SA-D模型表现更好的拟合和预测时间序列数据。然后我们验证了我们的模型的有效性进行比较与其他作者的模型,得到了预期的结果。

本研究的贡献在于两个方面。我们的研究是基于神经元模型与树突非线性模型,在理论上加强一个假设,即神经网络模型比线性模型预测非线性变量时执行。

这个研究混合线性模型和非线性模型一起打开车门进一步组合模型用不同的方法和模型。

相互竞争的利益

作者宣称没有利益冲突有关的出版。

确认

这项研究部分由jsp KAKENHI(批准号15 k00332)。