文摘
酒店业在旅游业的发展中扮演着关键角色。预测未来需求的酒店是酒店收益管理过程中的一个关键步骤。酒店客流预测中发挥着重要作用指导制定酒店价格和操作策略。一方面,酒店客流预测可以为酒店管理者提供决策支持,有效地避免酒店资源的浪费和损失的收入造成客户的损失。另一方面,它是保证优先占领商机的酒店企业,可以帮助酒店企业合理调整自己的经营策略,以更好地适应市场情况。此外,酒店客流预测有助于判断酒店业的整体运营情况和评估酒店项目的风险水平。酒店客流受到许多因素的影响,比如天气、环境、季节,假期,经济,和突发事件,具有复杂的非线性波动的特点。现有的需求预测方法包括线性方法和非线性方法。线性预测方法依赖于环境和时间序列的稳定性,所以他们不能完全模拟酒店客流的复杂非线性波动特征。传统的非线性预测方法需要提高预测精度,他们很难处理酒店客流的增长数据。 Based on the above analysis, this paper constructs a deep learning prediction model based on Long Short-Term Memory (LSTM) to predict the number of actual monthly arrival bookings. The number of actual monthly arrival bookings can reflect the actual monthly passenger flow of a hotel. The prediction model can effectively reduce the loss caused by cancellation or nonarrival of bookings due to various reasons and improve the hotel revenue. The experimental part of this paper is based on the booking demand dataset of a resort hotel in Portugal from July 1, 2015, to August 31, 2017. Artificial neural network (ANN) and support vector regression (SVR) are built as benchmark models to predict the number of actual monthly arrival bookings of this hotel. The experimental results show that, compared with the benchmark models, the LSTM model can effectively improve the prediction ability and provide necessary reference for the hotel's future pricing decision and operation mode arrangement.
1。介绍
旅游业的发展中发挥着越来越重要的作用在促进世界经济增长和文化繁荣。近年来中国的旅游业稳步增长。根据公布的“2019年旅游市场的基本情况”由中国旅游研究所(http://www.ctaweb.org),2019年在中国旅游总收入6.63万亿元,占总GDP的11.05%,国内旅游接待规模是60.06亿人次。随着旅游业的蓬勃发展,游客对住宿的要求和环境要求也增加。酒店经营正面临机遇与挑战并存。
目前,收益管理是一种现代科学的运营管理模式广泛应用于酒店管理。它指的是市场分析和预测每个细分市场的消费者行为在酒店管理的过程中确定最优价格和最优股票分配模型,以优化酒店盈利能力(1]。酒店收益管理主要包括需求预测、定价策略,超订策略,和房间分配策略(1,2),这是酒店的战略决策的一个重要工具。酒店需求预测是收益管理过程中的一个关键步骤。通过收集历史数据,建立预测模型,酒店经理能理解和掌握市场需求,使差别定价和在不同时期采用不同的收益管理策略使收入最大化。酒店需求预测可以为后续发展规划提供基本信息和决策的酒店。因此,酒店需求的准确预测是对酒店的经营管理具有重要意义。
酒店客流不仅能反映当前酒店的发展趋势也是当地旅游业是否发达的重要体现。正确分析和预测酒店的核心是客流需求预测,在酒店经营决策起着至关重要的作用[3和是酒店收益管理的关键4]。酒店客流受到许多因素的影响,比如天气、环境、季节,假期,经济,和紧急情况5,具有复杂的非线性波动的特点(6]。因此,酒店经理通常难以准确估计客流,导致不合理的决策,从而导致酒店资源的浪费和损失的收入。客流的随机性,很难分析和预测。找到一个合适的预测方法是关键和难点的酒店客流预测。传统的线性预测方法不能准确地符合酒店客流,如自回归综合移动平均(ARIMA),这是使用最广泛的时间预测方法。张(1)利用ARIMA模型和预测方法三个地区酒店入住率数据预测研究的酒店入住率。在此基础上,她使用了集成经验模态分解(EEMD)来弥补时间序列模型的缺点,不能准确地捕捉数据波动的特点来提高ARIMA模型的预测精度。大多数现有的非线性预测方法使用传统的机器学习方法建立客流预测模型,不能自动提取特征信息,适应不断增长的实验数据。此外,他们很容易陷入局部优化和过度拟合的问题。霁(7)使用奇异谱分析(SSA)模型和预测酒店入住率和收入,酒店入住率历史数据的基础上维多利亚酒店从1980年1月至1995年6月。吴(3)利用SVR模型预测入住率,也基于维多利亚酒店的入住率情况的统计数据,提供有意义的参考安排维多利亚酒店未来的商业模式。
基于上述分析,本文构造LSTM模型具有良好的预测能力对复杂时间序列预测每月客流的度假酒店。我们预测每月实际到达预订的数量为酒店定价策略的制定提供参考和操作模式的调整。
与现有工作相比,本文的贡献可以概括如下:(我)深学习算法自动提取的基础上首次提出了非线性复杂的序列特征来预测实际的数量到达预订的酒店。(2)酒店客流预测构造基于LSTM深度学习模型来预测实际到达预定在未来一个月。这个模型有更好的性能比传统的酒店需求预测方法。(3)安和SVR构造作为基准模型并与LSTM模型。平均绝对误差、均方误差、平均绝对百分比误差作为评价指标来评估这三个模型的预测效果。
后续部分组织如下:部分2概述现有的需求预测方法和预览之前努力预测酒店客流。论述了各种类型的预测模型。部分3分析了酒店需求的数据在葡萄牙度假酒店。部分4介绍了LSTM网络和基于LSTM酒店客流预测模型。部分5本文描述了实验结果和分析;最后,总结讨论了部分6。
2。文献综述
早在1960年代,专家和学者已经开始研究需求预测方法(8]。现有的需求预测方法包括线性和非线性方法(6]。这些方法可分为四类:古典时间序列方法,计量经济学方法、机器学习方法和综合预测方法(8,9]。
在需求预测方法、经典的时间序列和计量经济学方法代表线性时间序列预测方法。经典的时间序列预测方法被广泛使用。他们大多使用变量之间的线性关系进行建模和预测8),其中包含很多类型,主要包括移动平均、指数平滑法、微分自回归,回归预测模型和增量方法(8,9]。安德鲁et al。10基于Box-Jenkins)建造两个时间序列模型和指数平滑预测每月酒店入住率和验证这两个模型可以非常有用的在酒店实际操作和其他应用程序如收益管理;Pfeifer et al。11)描述时空ARMA建模的应用从八酒店需求相关的数据从一个在美国大型城市连锁酒店;魏泽福et al。4)选择酒店和万豪酒店的数据用于测试各种预测方法和确定最准确的;深入研究使用万豪酒店数据表明,基于指数平滑模型,传感器,和移动平均线是最健壮的;锅等。12)首次提出搜索查询的值体积数据在预测酒店房间需求领域的旅游和酒店业研究;他们使用五个相关的查询搜索量数据来预测对酒店客房的需求一个特定的旅游城市,证明三个ARMAX模型始终比ARMA同行;张(1)提出了一个ARIMA-EEMD混合模型,得出的结论是,这个模型有更好的效果比单一的ARIMA模型在预测酒店入住率;于(5)构建了一个基于Mann-Kendall酒店管理决策支持系统,移动平均、指数平滑法、模糊综合评价建模方法,实现了短期客流预测;杨(13)设计了一个旅游度假酒店的流量预测系统基于物流模型,并证明了系统具有较高的预测精度,这有助于提高度假酒店的管理和调度的决策能力;太阳(14)实现了需求预测基于nonincremental巡航收益管理,古典增量相结合,和先进的增量相结合的预测方法。计量经济学方法可以解释目标变量之间的因果关系和影响因素从经济学的角度来看,但影响因素的计量经济学只能基于理论推测,这是很难澄清(8]。吴作栋et al。15)使用时间序列的季节性ARIMA (SARIMA)和多变量ARIMA (MARIMA)模型预测旅游需求在香港和得到最高精度与其他8个时间序列模型;然后吴法(16)用误差修正模型分析气候对旅游需求的影响;崔(17]美国酒店业的关键经济指标确定和建立综合指标来预测美国成功酒店的要求。
机器学习是最广泛使用的方法在传统的需求预测。霁(7]SSA模型用来预测酒店入住率时间和每月的收入基于维多利亚酒店的酒店入住率历史数据从1980年1月到1995年6月;吴(3)利用SVR模型来预测每月占用时间,也基于维多利亚酒店入住率的统计数据;香港et al。18]提供了一个SVR模型与混沌遗传算法(CGA),即SVRCGA,预测旅游需求;拉施德et al。19)开发了一种fuzzy-rule-based酒店入住率预测系统模型通过分析40个月的时间序列数据和应用模糊c均值聚类算法;太阳et al。20.]提出了一种新的机器学习框架集成和网络搜索索引来预测旅游容量和证明该内核极端学习机模型更稳定和有效的根据精度和鲁棒性分析比最小二乘法SVR (LSSVR),利用人工神经网络(ANN)和ARIMAX。
生产综合预测方法解决传统的单一预测方法的缺点,包括预测相结合,综合预测和混合预测方法(8]。Ke-wei et al。21)建立了一个基于BP神经网络组合模型和ARIMA全面分析和预测中国的入境游客的变化趋势;龚和黄等。22)建立了一个基于灰色理论的需求预测模型和指数平滑法预测一定模型的汽车公司的需求;根据酒店入住率的非线性特点,ZHANG et al。23了北京旅游消费者搜索数据从2011年1月至2017年4月作为输入集和构造了一个混合模型整合消费者搜索数据和SVR。他们用蝙蝠SVR算法(BA)优化参数,这有效地提高了模型的预测精度。
通过以上的分析研究,我们发现预览研究主要是基于线性模型来预测酒店需求1,4,5,11- - - - - -13,17,19]。然而,时间序列的线性模型依赖于稳定和经济环境,,很难有效地模拟酒店需求的非线性特征。在现有的非线性酒店需求预测模型,SVR [3,18,23被广泛使用。这是善于利用小样本数据预测和非线性数据有很好的处理能力,但参数的选择对预测结果有很大的影响。此外,传统的非线性预测模型往往无法处理增加数据在实际应用和缺乏自动提取数据特征的能力。
目前,一些学者还建立深度学习模型预测的需求。例如,Chang和蔡24)解决神经网络和SVR和所面临的问题提出了深度学习神经网络预测游客数量;结果表明,特征选择的深度学习应用神经网络达到最佳的测试精度。虽然深度学习网络提出了研究可以进行特征选择,其预测精度需要改善。Zhang et al。6]做了实验基于深度学习框架和搜索索引从2008年8月到2019年5月预测隔夜乘客流在海南省酒店住宿,中国,然后构造一个LSTM模型结合互联网搜索索引处理预测问题在酒店住宿要求,这显示了良好的性能改善预测性能。然而,并不是所有的客户都知道旅游目的地的相关信息通过搜索引擎在预订酒店之前,和这种方法只能预测预订的数量,但无法预测实际的用房,有一定的不完全性和不确定性。
上述研究方法对酒店需求预测主要有一个或多个下列问题:(1)他们过于依赖环境和时间序列的稳定性(2)复杂的非线性波动特征的酒店客流不能自动提取(3)他们不能处理大量的样本数据在实际应用(4)它是不完整的和不确定的估计酒店客流根据客户搜索数据
神经网络模型与多个隐藏层显示强劲的优势在学习特征信息和相关的复杂的数据集。与其他模型相比,基于深度预测模型学习方法可以更准确地预测需求。此外,LSTM模型有更重要的优势比其他深度学习模型的预测序列作为输入(25,26]。
基于上述分析,我们使用的历史预订需求数据集在葡萄牙度假酒店(27],建立深度学习基于LSTM酒店客流预测模型来预测实际每月的数量到达预订的酒店。这个模型可以自动、有效地提取复杂非线性特征的酒店客流数据和做更准确的分析和预测。
3所示。预订需求数据分析
本文从纸中使用的数据集27]。它包含预订度假酒店需求数据从7月1日,2015年,2017年8月31日。共有31个变量描述40060年的观测手段,包括“is_canceled”,“lead_time”,“arrival_date_year”,“arrival_date_month”,“reservation_status,”和“arrival_date_week_number, reservation_status_date。reservation_status”包括三个类别:“取消,”代表客户的预订被取消,“退房,“代表客户入住但已经离开了,和“失约,“代表客户并没有检查,并告知酒店的原因。本文预测的数量每月实际到达预订的酒店,也就是说,“退房”的数量出现“reservation_status”的一个月。
并不是所有的变量都是高度与“reservation_status的变化有关。“我们使用CorrelationAttributeEvala属性评估者和士兵搜索方法和选择最相关变量与“reservation_status。“我们可以看到他们在表1。
在表1,“deposit_type”表示如果客户存款担保预订。这个变量影响最大最后的预订状态;它可以分为三个类别:“没有存款,”这意味着没有存款,“不退款,”这意味着存款是在保持总成本的价值,和“退还”,这意味着存款是由一个值的总成本。“lead_time”表示间隔的天数,进入预订日期和到达日期;“total_of_special_requests”表示特殊请求的数量由客户;“required_car_parking_spaces”表示所需的汽车停车位数量;“国家”表示客户来自哪个国家;“distribution_channel”表示预订分销渠道,“TA”代表旅行社和”到“代表旅行社;“assigned_room_type”房间类型分配给客户;这个变量的值可能不同于客户预定房间类型,这是因为有时由于超额预定房间类型分配将被改变或客户需求; “booking_changes” represents the number of changes made to booking from the moment the booking was entered until the moment of check-in or cancellation; “customer_type” represents the type of the customer; it has four categories: “Contract,” “Group,” “Transient,” and “Transient-party”; “previous_cancellations” represents the number of cancellations before this booking; it has the least influence on the final booking status of customers.
表2显示了一些预订度假酒店于2017年7月的需求数据。“d_t”、“l_t”、“t_o_s_r”,“r_c_p_s”,“c”“d_c”,“a_r_t”,“b_c”,“c_t”和“p_c”代表10变量在表1;代表“a_d_y arrival_date_year”、“a_d_m”代表“arrival_date_month,”和“r_s”代表“reservation_status。”
从表2,我们可以看到,2017年7月,酒店共有9个订单,其中5预订被取消和1预订未到。实际到达预订的数量是3。通常,酒店预订的数量可以反映其发展趋势。然而,预订可能被取消的客户,或者客户未能检查。如表所示2由于客户状态的变化,酒店可能会有6个备用房间,对酒店房间分配和定价产生负面影响,最终导致酒店收入的损失。如果订单的数量到达酒店可以提前估计,它可以帮助酒店预定房间的分配,使一个更合理的定价决策和操作策略。因此,预测每月实际到达预订的数量具有实际应用价值。本文的重点是建立预测模型来预测实际到达预订的数量在未来一个月。
4所示。预测模型
4.1。LSTM网络
本文我们要预测是实际到达预订的数量在未来一个月,也就是说,实际的月度客流;这是一个典型的非线性时间序列预测问题。时间序列预测分析是指使用一个事件在过去的时间特征来预测事件的特点,在未来一段时间,也就是说,预测对象的未来的变化根据已有的时间序列数据。
递归神经网络(RNN)是一种常用的算法在时间序列预测。它是一种神经网络与短期记忆能力。RNN的连接可以循环结构,可以提高时间行为建模的准确性在时间序列中,文本、音频和其他领域。连接方法引入RNN可以隐层神经元的输入输出和在相同的隐层神经元联系,以便输入可以从之前的时间步获得的一部分传入神经元的信息。因此,网络的输出不仅与当前输入,也与前一时刻的输出,使RNN的短期记忆能力在处理任何长度的时间序列数据。图1显示了RNN的循环结构。
从图可以看出1神经元之间的连接存在不仅在相邻层(如隐层1和隐藏层2)隐层神经元之间,也在同一时间维度(如神经元t= 0时间步和神经元t= 1时间步隐藏的图层1)。假设时间步t,RNN的输入 ,隐层的神经元活动的价值 ,和隐层的网络输入向量 。 不仅是相关的吗而且相关活动的价值隐藏的神经元在前面的时间步骤: 在哪里W矩形输入权重矩阵,R平方环重量是矩阵,b偏差向量,f是非线性激活函数,通常设置为棕褐色h或乙状结肠功能。在方程(1),当 , 。
尽管RNN一些优势领域的时间序列,其长期记忆能力很弱。梯度消失或梯度爆炸发生在优化RNN在特定的时间步骤很难长期结构性依赖的模型输入数据集(6]。
LSTM RNN网络是最常用的变体,在1997年的Hochreiter提出和。施密德胡贝尔表示(25]。LSTM比普通RNN网络更好地捕捉长期依赖模型。LSTM网络融合记忆细胞提供了一个解决方案,允许学习之前忘记隐藏的细胞,和更新基于新的信息隐藏的细胞(6]。LSTM网络是由许多LSTM细胞,LSTM块的主体,包括输入门,忘记门,输出门,快速输入,存储单元,输出的激活函数,窥视孔连接。记忆细胞,遗忘大门,大门和输入的关键组件是LSTM网络。存储单元的内容被遗忘和输入登机口调整。当两门都关闭,存储单元的内容从一个时间步将保持不变。门结构允许信息跨多个步骤和时间还允许保留梯度跨多个传输时间的步骤,以便LSTM RNN网络克服了梯度消失问题[28]。请参考[28];图2显示LSTM块的结构。
LSTM块的输出和输入是周期性与门的输入,输出,和忘记门。在图2橙色的矩形代表输入激活函数,和蓝色的矩形代表输出激活函数;他们通常是褐色h。●(黑色小圆)代表分支点,⊗代表点积,⊕代表所有的输入,细线表示连接没有重量,粗线代表与重量,虚线代表了与时间延迟。三个绿色矩形表示输入门,门的输出,忘记门。他们通常使用乙状结肠激活函数限制[0,1],在激活输出为0意味着“忘记一切”和1的激活输出意味着“记住一切。”
参考文献(6,26,28)给向前LSTM转移层的向量方程如下: 在哪里P代表窥视孔的权向量,棕褐色h代表激活功能, 。方程(2)代表输入门,记得一些当前信息,并决定哪一个值将被更新,保护细胞免受无关的输入事件。方程(2)代表忘记门,控制数据被丢弃当前内存状态并帮助细胞忘记以前的记忆内容。细胞状态决定多少信息添加或删除从内存状态之前的时间步通过s形的激活函数 和内积定义层。方程(2)代表输出,控制存储单元的内容是否暴露在LSTM细胞。 控制多少内存的数据将用于下一阶段更新。
4.2。预测模型建设
我们建立一个深入学习LSTM的预测模型有两个隐藏层。所有层的激活函数是棕褐色的h一个更稳定的梯度和通常用于回归问题(6]。乙状结肠被选中作为门两个LSTM隐藏层的激活函数。LSTM层的输出的数字都是150。随机梯度下降算法用于优化,和亚当为参数的迭代算法。解决过度拟合问题的模型,我们使用辍学算法由辛顿et al。29日)和设置所有的辍学LSTM隐藏层为0.5。辍学算法是一个强大的工具来解决过度拟合问题的深度学习模型。
图3显示了酒店的预测模型的基本结构的实际每月客流构造。
指定的输入层的第一个隐层的“input_shape”LSTM模型及其数据是三维数据数组。这三个维度如下:样本(时间序列),时间步(一个观察点在示例代表一个时间步),和特性(时间步内观察)。预测模型在这篇文章中,我们设置的时间步骤输入层和功能为1。
我们使用输出层输出层的预测模型,它有一个内置的完全连接致密层。输出层的输出的数量设置为1时,和功能损失l1被选中作为损失函数。损失l1也称为最小绝对值偏差最小绝对值误差;其目的是为了减少之和实际值之间的绝对差异和估计价值 。
5。实验
5.1。数据处理
原始数据集从葡萄牙度假酒店预订需求数据从7月1日,2015年,2017年8月31日(27]。预测的数量实际预订一个月到来,首先,我们通过时间片的原始数据。时间片的大小设置为一个月,从7月1日开始,2015年7月31日,2015年,从8月1日,结束,2017年,2017年8月31日。我们计算所有预订的数量,实际到达预订,取消预订,在每个时间片未到预订。然后,我们使用2017年4月1日,随着时间点分成训练集和测试集;即80%的数据集训练集和20%的测试集。
5.2。基准模型和实验装置
为了评估的预测效果LSTM网络下的数据集酒店预订需求,安和SVR模型构造的基准模型。ANN模型采用一个相对简单的单隐层的网络结构。SVR模型是一种最具代表性的非线性预测模型。SVR模型的介绍证明深度学习本文预测模型比传统机器学习有更多的优势预测模型在处理复杂非线性数据。
我们构建LSTM,安和SVR模型在WEKA 3.8.5 Windows 10系统平台。在实验中,我们调整的参数模型来更好的状态,以确保他们能取得更好的预测精度。所有模型的初始学习速率被设置为0.001。因为处理数据集很小,我们模型的批量大小设置为4。ANN模型中隐藏层的数量是1。SVR模型设置为RBF核函数的内核,它包含两个重要的参数:c和γ。c是惩罚系数,它代表着宽容错误。当c较大,过度拟合更可能发生,当c比较小,underfitting更有可能发生。γ隐式确定的分布数据映射到一个新功能空间。大,支持向量的个数比较小,影响训练和测试的速度。在这里,我们组c1.0和伽马至0.05。
5.3。评价指标
在本文中,我们使用下面三个常见的模型评价指标来评估LSTM的预测性能,安,SVR。他们是平均绝对偏差(MAE)、均方根误差(RMSE)和平均绝对百分比误差(日军)。美可以反映实际情况的预测误差值。美是越大,更糟的影响模型;RMSE措施预测值和实际值之间的偏差,哪个更受异常值影响比另两个评价指标;日军的值范围(0,+∞)。当日军0%,模型是完美的;当日军超过100%,模型是可怜的。
其计算公式如下: 在哪里是实际的价值,是预测值,n测试样品的数量。
5.4。结果分析
我们训练三个模型的训练数据集。表3显示了10个月的预测结果LSTM,安,和SVR训练集,每个月最好的预测价值红色所示。从表可以看出3在10个月的预测结果,LSTM模型表现最好,SVR执行第二个最好,和安表现最差。最优的预测结果LSTM、安和SVR 5个月,1月和4个月。
为了更直观地比较三个模型的预测效果的训练集,我们画每个模型的预测曲线在图4。LSTM和SVR模型的拟合效果比2016年10月的ANN模型,但其他九个月的拟合效果好。SVR的表现在2016年8月和2017年4月略逊于LSTM模型。ANN模型的拟合效果,7月,8月和2016年11月是好的,但是,在2017年1月和3月,它显示了一个完全相反的趋势实际客流。
(一)
(b)
(c)
一般来说,LSTM模型更符合实际的动态特性每月到达预订的,其次是SVR模型,和ANN模型是最糟糕的。
为了评估模型的泛化能力,训练后获得的最优结构的模型被用来预测的预测模型测试。表4显示了五个月的预测结果LSTM,安,SVR模型在测试集上,每个月的最好的预测价值红色所示。从表可以看出4在5个月的预测结果,LSTM和ANN模型执行最好的,尽管SVR模型执行最坏的打算。最优的预测结果LSTM、安和SVR是2个月,2个月,1个月,分别。
为了比较LSTM的预测效果,安,和SVR在测试设置更多的直觉,我们画每个模型的预测曲线在图5。一般来说,三个模型在测试集上的预测效果比在训练集,LSTM模型的拟合效果最好的2017年4月和2017年7月,ANN模型的拟合效果最好的2017年8月,和SVR模型的拟合效果最好的2017年5月和2017年6月最糟糕的拟合效果。从图可以看出5,从2017年4月到2017年5月,实际到达预订的数量略有上升趋势,虽然ANN模型和SVR模型的预测结果显示出下降的趋势,这是完全与现实相反。从2017年6月到2017年7月,实际到达预订显示一个明显的上升趋势,但是在这段时期这三个模型的预测结果显示拟合效果差,和SVR模型的预测结果是完全相反的实际的。
(一)
(b)
(c)
一般来说,LSTM和ANN模型显示在测试阶段比SVR模型更好的预测效果。
为了进一步探索LSTM模型的预测能力,美,RMSE,日军是用来比较和评价的三个模型训练阶段和测试阶段。表5记录评价指标得分的三个模型的实验数据集,和每个评价指标的最佳得分红色所示。
从表可以看出5LSTM模型有最好的RMSE MAE和日军但不得分。ANN模型的整体拟合效果实验数据很差。我们可以注意到LSTM模型在测试集的预测精度接近,在训练集,这表明它有最好的泛化能力。相反,SVR模型在测试集的性能远,在训练阶段。
在训练阶段,比分的美和日军LSTM模型是最低,其次是SVR模型,和ANN模型是最高的。在测试阶段,大量的美和日军LSTM模型仍然是最低,其次是ANN模型和SVR模型是最高的。至于RMSE,我们知道RMSE对离群值非常敏感,如果有预测价值非常不同于实际的价值,分数会很高。在训练阶段,ANN模型在这个指标得分最低,LSTM的得分略高于安,和SVR是最高的。在测试阶段,SVR对这个指标得分最高的。从数据可以看出4和5在训练阶段,LSTM的预测值和SVR在2016年10月大大偏离实际值;在测试阶段,2017年6月SVR的预测价值大大偏离了实际的价值。因此,RMSE LSTM和SVR的得分高于ANN模型。
基于上述分析,LSTM模型有更好的性能比安和SVR模型在预测每月实际到达预订的数量,这可以更好地捕捉酒店客流的复杂非线性特征,实现更好的拟合效果。
6。结论
酒店客流是受天气的影响,季节,假期,环境,和其他因素,表现出复杂的非线性波动特征。考虑到传统的需求预测方法不能自动从客流数据中提取特征信息,不能处理增加样本数据在实际应用中,本文构建了一个基于深度学习酒店客流预测模型的方法。在葡萄牙度假酒店作为一个例子,我们构建一个LSTM模型具有良好的预测能力对复杂时间序列来预测实际每月的数量到达预订酒店。为了探索这个模型的预测能力,我们构建安和SVR作为基准模型在实验阶段和比较数据集上的三个模型的预测效果,与美、RMSE,日军为评价指标。实验结果表明,与基准模型相比,LSTM模型能更好地模拟酒店客流的动态特性和有效改善预测性能和可以帮助酒店经理做出更准确、合理的定价决策和调整操作模式。
数据可用性
本研究中使用的所有数据可以根据客户要求提供。
的利益冲突
作者宣称没有利益冲突。