提高电影票房预测精度,本文提出了一种自适应的关注与消费者前哨(LSTM-AACS)电影票房预测。首先,电影票房的影响因素进行了分析。解决问题的忽视消费者团体在现有的预测模型,我们添加消费者特性,然后定量分析和规范化票房影响因素。其次,我们建立一个LSTM(长短期记忆)票房预测模型和注射的注意机制来构造一个自适应注意消费者对电影票房预测的前哨。最后,10398块电影票房数据集用于Kaggle竞争与LSTM-AACS模型预测结果进行比较,LSTM-Attention模型,LSTM模型。结果表明,LSTM-AACS预测的相对误差是6.58%,低于其他模型用于实验。gydF4y2Ba
电影票房,作为电影发展水平的指标,已经吸引了各行各业的极大关注。目前,电影票房的预测已经成为最热门的研究学者之一gydF4y2Ba
LSTM [gydF4y2Ba
解决目前电影票房预测问题,本文提出了一种自适应的注意力LSTM模型与消费者的前哨。与传统LSTM相比,该模型提出了一种关注消费者的前哨。一方面,它可以充分考虑电影消费者信息对电影票房的影响和改进模型的输入。另一方面,自适应的关注可以捕获输入更积极地情感信息,从而进一步提高预测精度。具体地说,该模型是基于LSTM模型(AAM)注入自适应注意消费者的前哨。消费者可以识别的影响电影票房的影响因素从更多的维度和解决长期存在的问题在票房预测无视消费者的信息。使用LSTM考虑随机波动和长期的电影票房。LSTM还记得很长一段时间的信息预测电影票房。注射一种自适应的关注可以捕捉情感输入信息,它提供了一个保证电影票房预测结果的准确性。该模型为电影提供了一定的参考价值投资者在电影风险控制,它可以有一定的电影发布时间表和计划值具有实际应用前景。 The contribution of this paper can be summarized as follows. (1) To improve the movie box office prediction accuracy, this paper proposes an LSTM model with an AAM and consumer sentinel (LSTM-AACS). It can better capture consumer characteristics, thereby improving prediction accuracy. (2) The LSTM-AACS model is applied to the prediction of the movie box office and achieves good results. The results show that the relative error of LSTM-AACS prediction is 6.58%, which is lower than other models used in the experiment.
有许多因素包括投资、导演、演员,续集和扮演一个角色在促进和指导这部电影票房ʼ年代。在[gydF4y2Ba
上述研究提供了重要的参考当选择影响电影票房的因素。然后,他们使用了Sawhney Eliashberg模型预测的累积数量的观众的电影几周后发布(gydF4y2Ba
基于多层神经网络算法,多影响票房的电影属性组合(gydF4y2Ba
LSTM-AACS模型用于本文使用基于自适应LSTM模型的关注。很多工作LSTM模型提出了基于注意力。的引起LSTM模型提出了金融时间序列预测gydF4y2Ba
上述主要问题如下。(1)它在短期预测表现良好,但长期预测的效果并不理想。(2)模型的输入数据不全面,导致预测结果只在一个特定的数据集达到较高的预测精度。(3)结果的影响因素在预测问题不考虑全面,如忽略用户信息,导致预测精度较低。基于上述问题,我们提出一个麦电影票房预测消费者的前哨。与消费者前哨,它可以解决忽视消费者团体的问题在之前的预测。麦可以捕获有效输入信息。最后,基于上述两种算法LSTM模型用于预测电影票房和与其他模型进行比较。实验表明,预测精度的麦电影票房预测模型与消费者哨兵比其他模型用于实验。gydF4y2Ba
框架如图gydF4y2Ba
模型的总体框架。gydF4y2Ba
本文运用历史盒电影办公室数据的统计分析在中国电影市场的实际情况相结合。本文选择导演、演员、电影流派,国家,和发布数据作为电影的影响因素(如电影ʼ年代信息输入)。本文然后向每个因素分配不同的权重。计算方法将详细解释gydF4y2Ba
基于考虑电影ʼ年代的影响因素中提到的部分gydF4y2Ba
LSTM是一种改进RNN(递归神经网络)模型解决问题的梯度爆炸或梯度消失在RNN培训。不同于单一的双曲正切循环结构标准RNN LSTM是一种特殊的网络有三个“盖茨”[gydF4y2Ba
LSTM的核心是细胞:细胞状态是整个模块的内存传输带,随着时间的变化。传送带本身不能控制哪些信息是记住了。忘记门、输入通道和输出通道发挥控制作用。gydF4y2Ba
忘记状态信息:选择输入gydF4y2Ba
更新状态信息和有用的新信息存储在细胞状态。首先,计算输入的值。输入通道的功能是控制当前的数据输入如何影响内存单元的状态值。然后,计算候选内存单元信息gydF4y2Ba
输出信息:首先确定哪些国家将输出的一部分。最后,获取内存单元的输出信息在当前时间之后的值输出门和状态信息的内存单元进行双曲正切变换:gydF4y2Ba
本文增加了麦层(gydF4y2Ba
同时,注意分配gydF4y2Ba
最后,矩阵的概率分布可以表示如下:gydF4y2Ba
本节将详细说明影响电影票房的因素并给出了相应的定义。与此同时,每个属性的量化过程将电影的票房数据LSTM-AACS训练集的建设做准备。gydF4y2Ba
定义电影票房导演的影响gydF4y2Ba
定义票房的影响演员gydF4y2Ba
定义电影票房的电影流派的影响gydF4y2Ba
定义票房电影的影响gydF4y2Ba
定义票房发布数据的影响gydF4y2Ba
本文分为4年龄:18岁以下,18-45,46 - 69年,69岁以上的老人。定义票房电影的影响gydF4y2Ba
在LSTM-AACS模型中,我们设置了辍学率至0.5。培训期间,一小批随机梯度下降法用于减少培训损失,minibatch是设置为64。在分析预测结果,使用相对误差进行分析。本文使用电影票房预测数据集Kaggle竞争。在获得电影票房预测数据,预测结果的相对误差计算公式如下:gydF4y2Ba
在实验中,crossvalidation的结果进行了分析。本文随机拿出第一个3000块的数据从10398年数据作为训练集,最后7398块的数据作为测试集。学习时做30次训练模型,然后应用十crossvalidation轮。最后,这两个模型的平均相对误差如表所示gydF4y2Ba
特定的错误表。gydF4y2Ba
| 方法gydF4y2Ba | 平均相对误差(%)gydF4y2Ba |
|---|---|
| LSTMgydF4y2Ba | 28.54gydF4y2Ba |
| LSTM-attentiongydF4y2Ba | 11.45gydF4y2Ba |
| LSTM-AACSgydF4y2Ba | 6.58gydF4y2Ba |
从表可以看出gydF4y2Ba
随机选择从测试集预测结果的几个电影,人物gydF4y2Ba
相对误差比较。gydF4y2Ba
从七个随机选择的电影,可以看出LSTM-AACS模型预测的相对误差的测试集低于LSTM模型预测的相对误差和LSTM-Attention模型。LSTM-AACS模型的预测结果相对更准确,性能得到了改进。gydF4y2Ba
为了使模型都有长期和短期预测能力,我们比较长期LSTM-AACS模型的预测能力,LSTM-Attention模型和LSTM时间序列模型。我们也比较和分析电影票房数据Kaggle竞争。此外,我们选择Maoyan电影的票房数据来预测短期内票房。考虑到前几年的经典电影,本文选择Dangal;我的人,我的国家;狼战士二世和速度与激情7电影来预测他们的累计票房。使用这些电影,本文比较了实际价值,预测价值,绝对不同,分别和三个模型的相对误差。具体结果如表所示gydF4y2Ba
电影票房预测结果以前的经典电影。gydF4y2Ba
| 电影的名字gydF4y2Ba | 真正的(1亿)gydF4y2Ba | LSTMgydF4y2Ba | LSTM-attentiongydF4y2Ba | LSTM-AACSgydF4y2Ba | ||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 预测(1亿)gydF4y2Ba | 绝对误差(1亿)gydF4y2Ba | 相对误差(%)gydF4y2Ba | 预测(1亿)gydF4y2Ba | 绝对误差(1亿)gydF4y2Ba | 相对误差(%)gydF4y2Ba | 预测(1亿)gydF4y2Ba | 绝对误差(1亿)gydF4y2Ba | 相对误差(%)gydF4y2Ba | ||
| DangalgydF4y2Ba | 12.99gydF4y2Ba | 14.31gydF4y2Ba | 1.32gydF4y2Ba | 10.16gydF4y2Ba | 13.98gydF4y2Ba | 0.99gydF4y2Ba | 7.62gydF4y2Ba | 13.18gydF4y2Ba | 0.19gydF4y2Ba | 1.46gydF4y2Ba |
| 我的人,我的国家gydF4y2Ba | 31.71gydF4y2Ba | 35.42gydF4y2Ba | 3.71gydF4y2Ba | 11.70gydF4y2Ba | 33.67gydF4y2Ba | 1.96gydF4y2Ba | 6.18gydF4y2Ba | 32.59gydF4y2Ba | 0.88gydF4y2Ba | 2.78gydF4y2Ba |
| 狼战士二世gydF4y2Ba | 56.92gydF4y2Ba | 60.21gydF4y2Ba | 3.29gydF4y2Ba | 5.78gydF4y2Ba | 58.66gydF4y2Ba | 3.10gydF4y2Ba | 5.45gydF4y2Ba | 58.34gydF4y2Ba | 0.52gydF4y2Ba | 0.91gydF4y2Ba |
| 速度与激情7gydF4y2Ba | 24.27gydF4y2Ba | 27.66gydF4y2Ba | 3.39gydF4y2Ba | 14.00gydF4y2Ba | 25.78gydF4y2Ba | 1.51gydF4y2Ba | 6.22gydF4y2Ba | 25.57gydF4y2Ba | 1.3gydF4y2Ba | 5.36gydF4y2Ba |
从表可以看出gydF4y2Ba
解决问题的忽视消费者因素和较低的电影票房预测的预测精度,本文提出了一种自适应的关注电影票房预测模型与消费者的前哨。消费者数据的实验结果表明,引入到预测模型可以提高预测精度的基础上电影的影响因素。相比单一LSTM模型和一个LSTM模型关注机制,与麦LSTM模型具有更好的预测能力对电影票房预测。在未来,该模型可以进一步优化丰富专家经验的特点,引入更多的消费特点,并添加影评作为一个影响因素。gydF4y2Ba
使用的数据来支持这个研究的发现可以从相应的作者。gydF4y2Ba
作者宣称没有利益冲突。gydF4y2Ba