WCMC 无线通信和移动计算 1530 - 8677 1530 - 8669 Hindawi 10.1155 / 2021/6094924 6094924 研究文章 电影消费的影响因素研究和票房预测在数字时代:基于机器学习的角度和模型的集成 https://orcid.org/0000 - 0002 - 7909 - 8412 Yuanpeng 管理学院的 上海工程技术大学 上海201620 中国 sues.edu.cn 2021年 14 10 2021年 2021年 24 8 2021年 12 9 2021年 15 9 2021年 14 10 2021年 2021年 版权©2021年气他和胡本。 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

电影产业的核心产业之一数字创意产业,数字创意经济具有巨大的正外部性。电影票房收入是一个重要的指标来衡量电影消费的市场价值的实现,也是可持续发展的基本保证的电影业。本文依靠Maoyan电影市场的专业数据库使用Python软件收集830国内约翰逊说近来电影相关的消费特点销售数据从2017年到2019年。在这项研究中,叠加方法在机器学习整体算法结合了五倍crossfolding训练方法基于分布式随机森林,非常随机树,广义线性模型。模型是擅长处理不同的数据类型。它具有较高的拟合精度和模型特征采矿和模型建设,以有效地掌握相关特性影响因素的电影消费和准确地预测未来电影票房。基于模型融合的创新设计方法,提取的特征向量用于建立一个更精确的电影票房预测模型通过叠加五倍crossfolding训练方法。旨在打开黑盒子,影响电影内容的价值的实现在数字时代消费市场并提出相应的对策和建议。

中国国家自然科学基金 71704102
1。介绍

随着数字技术的不断发展,数字转换为人工智能( 1- - - - - - 3)和大数据应用促进了内涵的不断进化,边界,和形式的创造性的经济和工业发展。提高国家竞争力的作用,促进工业发展的一体化,并诱导新模型和新业务形式日益深化,和对社会发展的影响越来越深远。大力促进数字消费已经成为一个重要的驱动引擎为中国建立一个新的发展模式,着重于国内周期和国内和国际双重循环。

电影行业充分体现人文和艺术和技术的集成创新,整合传统媒体和数字媒体,生产者和消费者的集成。文化和创意产业的规划和分类和数字内容产业在不同国家和地区,一直是在核心范畴,数字经济具有巨大的正外部性。电影产品的典型代表的发展创意文化产品和数字内容。电影票房收入是一个重要的指标来衡量消费者的实现市场价值的电影产业。截至2019年,中国电影业已经跳第二次在世界上的地位而言,市场规模和作出了重要贡献的经济效益和社会影响国内数字内容产业,虽然发展的新皇冠2020年流行在一定程度上影响了离线电影行业。但与此同时,电影行业的重塑数字转换贯穿整个产业链,深刻改变了格式和电影产业生态系统。深的操作逻辑集成的技术和创造力深深植根于人民的心。大数据的逐步发展和人工智能,数字技术已经渗透到整个产业链的生产,分配,和电影行业的销售,包括算法策略打开技术支持视听在线分销的流媒体电影,以及开放的人工智能系统的介入电影票房预测和受众定位等生产管理( 4]。自2020年以来,许多影视集团,包括好莱坞巨头华纳兄弟,已经建立了自己的人工智能项目管理系统,试图逐步使用人工结果技术评估主要内容和创造的价值,以帮助电影发行策略的决策参考 5]。

然而,在数字经济时代电影产品的消费是受到多种因素的影响,及其票房预测更具挑战性。尽管先前的研究已经进行了一系列的实证分析使用统计分析方法和相关指标,统计分析模型的简单的使用是不够的解构的复杂特征和结构关系的电影消费新模式。目前,仍然没有方法,全面考虑电影消费的综合特征的背景下,数字转换进行深入系统的研究,为准确把握不足的特点,影响因素数字内容创意消费和解释和预测未来的票房价值。因此,基于原始研究,本文系统地分析了多维因素影响电影消费在数字时代,依靠Maoyan电影市场的专业数据库,全面使用大数据和机器学习的研究方法来提取,构建相关的消费影响因素的特点。通过模型融合培训一个创新和增强预测模型,它试图建立一个电影消费影响因素的研究框架的背景下,数字转换和打开黑盒子影响电影票房。本研究的主要任务如下:

数据收集和预处理。这个研究主要的数据源来自著名的专业电影网站Maoyan专业数据库,新浪微博,IMDB专业数据库,和微信官方账户平台。这些平台提供的数据手动筛选了单位和文字错误,以及数据清洗的错误数据、冗余数据,在数据传输过程中丢失的数据。共有830部电影被索引

叠加方法在机器学习整体算法结合了五倍crossfolding训练方法基于分布式随机森林,非常随机树,广义线性模型。模型是擅长处理不同的数据类型。该方法具有较高的拟合精度和模型特征采矿和模型建设,以有效地掌握相关特性影响因素的电影消费和准确地预测未来电影票房

2。相关研究 2.1。研究影响电影票房的因素

影响电影票房的因素的研究有着悠久的历史。它可以追溯到1940年代。早期的研究主要集中在研究技术( 6]。第一次盖洛普( 7)和汉德尔( 8)系统地解决电影票房的影响因素如演员、营销、故事,和评估预测票房收入。后来的学者深入研究这一研究框架下进行。一般来说,一部电影的票房成功主要是基于三个维度:电影的特点(如导演、明星、编剧和类型),营销策略的力量(主要是通过广告预算、屏幕,拖车,等等),和评论(从评论家和电影观众,等等)。研究影响因素的电影票房的电影产品的供应方和需求方。研究人员探索许多潜在的影响因素,包括电影,电影成本,进度,导演的影响,获奖的影响力,专业的评级,口碑,流派,名人的影响,电影的内容,评论,文化熟悉,和消费者的因素。其中,名人的三个主要因素影响,评论,和口碑得到了广泛的关注 9]。此外,针对电影续集的巨大的经济影响产品在电影行业,学者们开始研究这个因素的影响( 10]。爆炸性增长和数字技术的发展,电影消费者可以表达自己的观点或态度的产品跨越空间和时间。因此,近年来,电子口碑(eWOM)在线评论的形式呈指数增加( 11]。许多研究人员研究eWOM票房性能指标的影响。随着大数据技术的发展,越来越多的学者利用社交媒体和数字营销活动影响因素预测票房[ 12]。总的来说,传统的票房预测研究使用预算等因素,演员、导演、制片人、故事地点,编剧,检查时间,音乐,放映地点,目标受众,续集变量。研究背景的基础上,数字转换扩展的影响因素包括社会媒体话题,搜索引擎营销活动,和其他变量与数字消费的内涵特征。

2.2。票房预测模型研究

早期票房预测方法是基于受众调查。自利特曼et al .(1989)提出了这位模型影响电影票房收入因素和电影租赁收入通过回归分析( 13),电影票房预测模型研究方法继续进步。斯科特Sochay(1994)做了改进基于上述模型( 14]。代表学者de Vany和墙壁等(2004)利用OLS模型,和Deuchert et al。(2005)提出了一个两阶段模型( 15]。其他研究人员已经进行了广泛的线性回归研究在此基础上。拉梅什et al。(2006)首次提出一个票房预测模型使用神经网络方法、开放创新的研究方法的票房预测模型在数字时代( 16]。基于大数据和机器学习技术,票房预测模型的准确性得到进一步改善。Choudhery et al。(2017)建造一个多项式回归模型为票房预测提取聊天数据来分析用户情绪和其他三种方法 17]。尽管提高神经网络模型的准确性与前两个预测模型相比,结果仍不满意。

总之,有一个坚实的研究基础电影消费的影响因素和票房预测模型,以及影响因素评价体系的框架包括主要的创意团队,电影的特点,营销推广,口碑评论已基本形成。在研究方法方面,统计测量模型的研究方法,如市场调查问卷访谈和线性回归已逐渐扩展到神经网络,机器学习和数据融合在大数据的上下文中。然而,在以往的研究,不同研究方法只考虑一些因素的线性影响票房预测,票房预测模型和实证研究使用机器学习和模式融合的基础上,充分考虑到数字时代和全面的影响因素比较复杂是相对缺乏。这为本研究奠定了一定的理论基础从影响因素研究方法的改进。

3所示。特征指标体系设计影响因素的电影票房数字经济时代

成熟经验的基础上,国内外电影产品属性特征选择,结合消费者的个性化特征和审美喜好,本研究着重于数字环境因素对消费的影响逻辑的背景下数字转换;探索消费者的三维特性因素、电影产品,和数字环境中,有一个伟大的影响在数字时代电影消费;和构造一个指标体系。为了保证评价的全面性的特点,在数字时代电影产品消费的影响因素,首先,根据电影消费的个人影响因素一般在现有文献中提到,这些指标的性别、年龄、教育水平、活跃的区域,选择和偏好类型的基本信息,以反映个人特征的电影消费、审美偏好、群体氛围的影响。其次,充分考虑电影的决定因素的主要创意团队和电影产品的特点。文化意识的核心创意主题导演、编剧,和主要演员,如人气口碑、票房吸引力,许多电影,释放时间表,3 d和IMAX因素,添加到电影产品特性评价指标。通过这种方式,原始价值、艺术价值,体验和情感的象征意义和文化识别相关电影产品测量的特点。第三,它专注于最重要的变化在电影消费数字经济时代的影响下,如在线社会支持、社会营销活动,和数字意见领袖。包括营销活动在数字时代的环境特征,公众舆论的普及,宣传配售数量的影响下网络口碑,这个平台,广播,网络媒体的舆论评价和普及,网络口碑的分数,时间表和其他因素。基于上述原因,数据的可用性,影响因素的评价指标体系在数字时代电影消费的特点设置在这项研究中,也就是说,后续特征数据采集系统设置,如表所示 1

设置特征影响因素指标体系的电影票房在数字时代。

一级指标 二级索引 三级指标 解释相关的指标
个人消费特征 基本信息美学和偏好从众心理 性别 消费者性别分布信息
年龄 消费者的年龄分布信息
教育水平 消费者教育水平分布信息
活动区域 消费活动区域分布信息
喜欢的电影类型 消费者最喜欢的电影类型
电影产品的特点 核心文化价值经验和情感价值文化意识 电影金像奖提名或 奥斯卡奖是指所有有效的电影主要电影节
电影类型 类别、类型或形式的电影形成了由于不同的主题或技术,包括13个类别,如动作,科幻,喜剧
视觉效果 它是否属于3 d IMAX,或大屏幕上
改编自IP是否 这部电影是改编自经典的经典,是否畅销小说,动画作品,游戏作品,等等。
是否续集 这部电影属于某个系列的续集的电影吗
导演的票房吸引力 导演的历史票房累计
主演的票房吸引力 十大主要演员在各自历史票房累计
编剧票房吸引力 三大编剧的历史票房累计
导演话题讨论体积 导演的在线主题讨论
主要话题讨论体积 十大主要演员在各自的网络话题的讨论
电影剧本创作主题的体积 三大编剧讨论各自的在线主题
数量由公司生产的杰作 公司主要生产累积的杰作
数量由公司生产的杰作 主要生产公司的累积量的杰作
数字环境特征 营销活动受欢迎的公众舆论网络口碑营销 许多代表签发的公司工作 累积的主要发行公司的杰作
拖车运行时间 拖车网络运行
拖车的总数 累计播放预告片的体积
销售平台 拖车交付平台的分布
累积的数量受欢迎的微博 数字相关的热门微博的讨论
累积微博互动 的微博互动
微博话题讨论体积 在微博上的话题讨论
累积的官方账户数量的文章 相关的公共账户的文章数量
累积的文章阅读 累计阅读卷相关的公共账户的文章
猫眼睛的分数 口碑的Maoyan电影网站
IMDB得分 IMDB口碑得分
筛选时间/计划 电影第一轮筛选
4所示。机器学习融合预测模型建设和示范 4.1。数据收集和处理

这个研究主要的数据源来自Maoyan的专业数据库,一个著名的专业电影网站在中国,新浪微博,IMDB专业数据库,和微信官方账户平台。相关专业数据库主要提供及时、准确、专业的电影创作和票房数据分析在国内外电影产业从业者。其中,Maoyan数据库完全打开在线电影信息数据库,这是更适合研究国内电影消费的影响因素。新浪微博和微信的来源主要是用作数字环境特征集合。为了充分反映环境变化的影响,在数字经济时代电影消费的特点,考虑到数据的全面性和连续性,样本收集间隔相关的索引信息消费特征的国内电影从2017年到2019年。初步数据收集使用Python来完成数据采集和分析。首先,收集每个电影消费者的个人特征的信息显示在网站,其次,收集文化,经验,和认知信息的电影,比如公司的主要创造者和局部讨论社交媒体,历史票房,代表作品和电影奖,IP信息,类型,续集。此外,收集信息等外部环境要素相关的分销和促销和电影发行公司的代表工作来确定公司的能力,以及宣传材料的数量,数量、平台、主题的专业质量社会媒体,舆论流行指标,以及电影时间表的计划周期的影响。随后,手动检查单位和文字错误,错误数据以及数据清洗,冗余数据,和丢失的数据,由于数据传输过程,进行,总计830部电影的所有索引信息。在未来,新功能建筑将根据研究的需要和特定的场景。 In view of the different data types having their own characteristics, different processing methods will be used to fit the research model.

4.2。研究方法的选择

使用机器学习的方法对电影票房预测近年来取得了一些研究成果,但大多数的研究只票房预测回归问题转化为分类问题。然而,分类方法的使用预测票房将失去很多特征信息,这可能会导致某些限制使用的预测结果。特性工程方法可以提取核心特性,产生重要影响的准确性预测模型( 18]。通过机器学习功能的创新集成工程和处理多个数据的回归模型,它更有利于准确评估的影响因素和票房预期消费在数字时代的电影。因此,本研究首先使用Python的计算机程序设计语言学习数据定向爬虫( 请求 + 废话 4 + 再保险 )库来完成数字电影产品的分析消费者的个人特征、产品特征和数字环境网络交互行为特征。通过人工筛选、数据清洗和预处理,结合工程特性研究方法在机器学习领域,Scikit-learn用于特征提取和功能建设。然后,根据数据类型的多样性与电影相关的影响因素。机器学习的创新使用叠加方法集成算法融合模型基于五倍crossfolding训练方法为分布式随机树森林(分布式随机森林),极其随机树(非常随机树),广义线性模型,擅长处理不同的数据类型。它有一个更高的适合采矿和模型结构和模型精度特性,以便更有效地把握相关特性影响电影消费的因素,更准确地预测未来电影票房。

4.3。研究概念设计

本研究是基于探索性的数据结构和深刻理解特点和创新采用机器学习应用程序模型融合的角度。研究的设计思想如图 1。首先,全面的初步研究和文献研究相结合的设计影响因素指标体系和准确的数据收集特性的基本保证建设工程模型。良好的数据预处理可以探索的方向和精度模型的训练。其次,进行数据清洗和筛选保留有效信息。之后,输入有效数据反映出电影学习到不同的功能的不同影响因素模型,提取相应的电影的特点,并试图构建新特性。由于非常大尺度不同类型的变量在这项研究中,探索性数据分析发现,累积票房等数据,第一周票房,和明星累积票房都呈指数分布,因此对数变换的这些特性可以构造新特性。最后,叠加模型融合方法构建票房预测模型,选择和三种基本模型被设计学习和融合特征向量五倍crossfolding训练方法构建一个更准确的预测模型。通过这种方式,它能更准确地确定符合电影消费的特征向量在数字时代,揭示电影票房收入的来源。

机器学习的研究流程图和模型融合的基础上,分析在数字时代电影消费的影响因素。

高维复杂数据的处理是机器学习中的一个难点。在传统的分类算法,很难处理的实际应用中存在的问题,提出问题,如低精度和过度拟合。叠加模型本质上是一种层次结构,善于处理模型融合问题,也特别适合模型训练和学习,处理多维复杂的因素。通过拟合和学习不同类型的模型,构建一个融合创新的融合模型,更符合数据的特征。非常适合复杂而多元的影响特征变量类型的研究和准确的票房预测的实际需要。图 2显示了该方法的基本过程结构。

堆垛过程模型结构图。

4.4。模型建立和实证分析

机器学习的特性工程施工方法用于分析,收集和构造特征,并确定哪些消费特征是最重要的,这有助于预测模型的性能。它有助于避免错误在人为因素的判断和一些惯性问题,传统的统计测量模型,有助于获得更多的解释变量系统特征。根据数据特征的影响因素指标体系,以下三种类型的经典模型是用于拟合,分别和叠加模型融合方法用于执行5倍crossfolding培训不同的模型来构造一个新的融合模式。这使得融合模型在融合和泛化和形成一个模型结构更适合电影消费的影响因素的识别和票房预测在数字时代。

4.1.1。分布式随机树预测模型实验

伯纳德等人提出,随机森林是一种最经典的数据处理模型集成学习算法。它为用户提供了合理有效的分类标签信息通过使用集成的思想,从而提供可靠和有效的数据信息推荐( 19]。Fernandez-Delgado等人发现,随机森林算法的分类性能最好通过比较179分类算法的分类性能 20.]。励志的分布式随机森林算法等人发现火花是学习更适合特性的二维变量( 21]。数据收集符合数据结构和特点在数字时代电影消费的因素。实证研究也显示了一个合适的效果。表 2表明该模型的拟合优度达到约94.12%,和预测误差模型的均方根误差达到19.9%。

分布式随机树森林模型的拟合效果分析。

DRF:分布式随机森林
模型 DRF_1_AutoML_20200707_105158
框架 automl_training_Key_Frame__movie_r2.hex
描述 度量报告out-of-bag训练样本
Model_category 回归
均方误差 0.039718
RMSE 0.199295
r2 0.941232
Mean_residual_deviance 0.039718
0.134591
rmsle 0.023422
10/24/11。极端随机树预测模型实验

吉尔茨极端随机树算法提出的et al。 22)非常类似于随机森林算法,但是极端随机树特性是随机选择的。选择最好的分区特性指定的阈值作为最优分区属性不仅保证了利用训练样本,也减少了最终的预测偏差,所以它比获得的结果在某种程度上通过随机森林。因此,它也被用作预测模型方法进行实验。本文获得的结果也符合一个高水平的拟合优度,基本上达到约94.46%,RMSE预测误差达到19.3%,如表所示 3

极端随机树模型的拟合效果分析。

导:非常随机树
模型 ERT_1_AutoML_20200707_105158
框架 automl_training_Key_Frame__movie_r2.hex
描述 度量报告out-of-bag训练样本
Model_category 回归
均方误差 0.037427
RMSE 0.193462
r2 0.944621
Mean_residual_deviance 0.037427
0.132382
rmsle 0.022773
4.4.3。广义线性预测模型的实验

广义线性模型是一个扩展的一般线性模型。它的期望值之间的关系建立了响应变量和预测变量的线性组合,通过连接功能。它的特点是不强行改变自然数据的措施。数据可能会有非线性和非常数的方差结构,或者它可能是目前最受欢迎的机器学习算法。本研究也使用该算法适合根据数据的结构特征指标。分析的结果是相对一致的数据特点,达到92.41%的适合,但RMSE预测误差高达22.63%(见表 4)。

分析的广义线性模型的拟合效果。

全球语言监测机构:广义线性模型
模型 GLM_1_AutoML_20200707_105158
框架 automl_training_Key_Frame__movie_r2.hex
描述 ·
Model_category 回归
均方误差 0.051241
RMSE 0.226365
r2 0.924182
Mean_residual_deviance 0.051241
0.16952
rmsle 0.027431
4.4.4。三实验模型融合了5倍交叉训练

合适的电影消费的数据特点和上述三个模型,我们可以发现,首先,初始指标体系的选择更有效,使这些基本特征代表电影消费更多的常规。同时,这三个算法拟合精度超过90%和强大的解释力,但仍有进一步改善的空间预测精度。为了进一步探索消费特点、叠加模型融合方法用于火车crossfolding五倍的三种模式,和一个更精确的模型。拟合优度达到99.18%,而均方根误差为7.4%,和RMSLE明显低于前三个经典模型的分类预测误差仅为0.8%。这充分说明,学习从这个模型提取的特性非常符合数据库的特点和实际结果。模型有更多的泛化能力和基本的功能结构相匹配当前电影消费影响因素(见表 5)。

分析拟合效果的5倍crossfolding训练融合三个模型。

叠系综
模型 StackedEnsemble_AllModels_AutoML_20200707_105158
框架 automl_training_Key_Frame__movie_r2.hex
描述 ·
Model_category 回归
均方误差 0.005488
RMSE 0.074081
r2 0.99188
Mean_residual_deviance 0.005488
0.050961
rmsle 0.008718

这种融合模型的结果由上述三个模型算法集成,以及他们的组合系数如表所示 6

分析融合组合因素五倍crossfolding培训有三个模型。

的名字 系数 Standardized_coefficients
拦截 -0.1308 7.6077
XRT_1_AutoML_20200707_195606 0.9967 0.7847
DRF_1_AutoML_20200707_195606 0.0043 0.0033
GLM_1_AutoML_20200707_195606 0.0166 0.0129
4.5。结果与讨论

基于上述模型的学习结果,可以发现,通过创新模型融合训练,拟合优度比较高和预测偏差低于单个预测模型。在数字经济时代,电影消费的影响因素的提取更准确,可以提供更有效的票房预测模型方案。根据分析结果,本研究进一步探讨和分析提取的特征可以更好地反映电影消费的解释性和影响力在数字时代。通过不同的模型进行特征提取和学习。重要的指标数字电影消费的影响特征变量在图所示 3

特征提取的影响因素在数字时代电影消费的特征。

因此,它可以发现,最具影响力的特性是累积的历史票房明星作家主体的核心内容创造者,这充分反映了当前市场上的核心内容的重要性。首先,作者是核心的创造者当前数字内容产品的创意来源,也是IP核心故事的来源。过去的票房代表了作者的创新能力,文化和艺术价值的工作和市场的对接能力,强调内容的重要性作王。

其次,数字营销已成为一个重要的电影消费的影响因素。至关重要的变化发生了在数字时代电影营销推广的形式。广播在互联网上的营销材料已成为影响电影消费的一个重要特征。在数字时代电影消费更多的观众。数字内容产品的市场中,社交媒体的话语权和影响力发挥重要作用。精确的交货和分配机制基于互联网平台可以帮助实现数字营销的效果。第三,累积的历史票房明星创造者显示过去的艺术表现和认可的明星创造者是非常重要的,和明星还是内容产品的核心价值的创造者。第四,电影还有一个重要的类型的影响。虽然这个因素,许多研究已证明是密切相关的电影消费,特殊类型如爱情,动作,科幻小说仍然成为一个重要因素,触发共鸣的电影消费和刺激市场活力。第五,热点舆论已经成为影响电影消费的重要变量,包括不同类型的self-media评论和口碑沟通和讨论,如Weixin公共号码和微博话题讨论。

5。结论

基于这些电影消费影响因素的实证结果,给出以下建议如何提高消费数字内容有关的未来:

首先,高度重视和增加资本投资创意学科高质量的文化内容和治疗小心流效应。随着数字内容形式的不断创新,给消费者带来更愉快的消费体验但也改变人们传统的消费习惯和消费的概念。其次,进一步规范网络环境,加强网络生态治理。最重要的影响因素消费数字内容产品的网络舆论的指导和评价。网络环境应进一步标准化;主要影视网站应该做一份好工作在相关的管理,关注“僵尸”号和账户恶意评分记录,和纠正的黑色产业链网络品种。第三,鼓励多样化的数字内容价值评价体系的建设。文化创意的消费者,大数据在互联网上只意味着大概率事件的显示和预测,只能用作参考。数字内容产品本质上是文化创意产品。其文化价值和审美体验不能苍白,浅只由一系列的数据。 Finally, encourage content providers such as digital content creative subject, production producer, and dissemination subject to adhere to the original intention of content creation. Make good use of digital diffusion channels and create a win-win situation between content providers and consumers by using “big data.” However, the prediction model used in this article is sensitive to noise, and the prediction accuracy needs to be further improved. These two shortcomings are also the direction for future work.

数据可用性

使用的数据来支持本研究的结果包括在本文中。

的利益冲突

所有的作者没有任何可能的利益冲突。

确认

这项工作是由中国国家自然科学基金(批准号71704102)。

M。 杰哈 一个。 Q。 米尔斯 b。 Mahadevan-Jansen 一个。 l 乡下人 b。 Tyska m·J。 Y。 快速均值漂移:GPU-accelerated集群余弦embedding-based细胞分割和跟踪 医学图像分析 2021年 71年,第102048条 10.1016 / j.media.2021.102048 Z。 M。 X。 机器人掌握检测使用新颖的两阶段方法 ASP对物联网交易 2021年 1 1 19 29日 10.52810 / TIOT.2021.100031 M。 Q。 杰哈 一个。 R。 T。 Mahadevan-Jansen 一个。 Tyska m·J。 米尔斯 b。 Y。 VoxelEmbed: 3 d实例分割和基于体素的嵌入深度学习和跟踪 2021年 https://arxiv.org/abs/2106.11480 W。 D。 机器绿灯系统”和“算法矩阵电影”——人工智能电影制作行业的影响 当代电影 2020年 12 30. 36 西格尔 T。 兄弟 W。 交易迹象AI-Driven电影管理系统 2020年 1 好莱坞记者 汉德尔 R。 好莱坞如何了解观众 2014年 中国媒体 Ayoub B。 乔治·盖洛普在好莱坞 太平洋的历史回顾 2008年 77年 4 693年 695年 汉德尔 l。 好莱坞看着观众。电影观众研究的报告 1950年 乌尔班纳, 伊利诺伊大学出版社 F。 l 安瓦尔 年代。 X。 明星效应和票房收入:来自中国的证据 文化经济学杂志 2019年 43 2 247年 278年 10.1007 / s10824 - 018 - 9338 - 0 2 - s2.0 - 85058178355 Belvaux B。 Mencarelli R。 预知模型和实证检验的票房结果续集 商业研究杂志》 2021年 130年 1 38 48 10.1016 / j.jbusres.2021.03.008 H。 j . M。 E。 分析动态评估操作和它对电影票房收入的影响 电子商务研究与应用 2019年 35岁,第100840条 10.1016 / j.elerap.2019.100840 2 - s2.0 - 85063478390 Z。 J。 年代。 C。 T。 Y。 预测和排名基于大数据的电影票房收入 信息融合 2020年 60 25 40 10.1016 / j.inffus.2020.02.002 Litman b R。 科尔 l S。 预测的成功电影:80年代的经验 传媒经济学杂志 1989年 2 35 50 10.1080 / 08997768909358184 2 - s2.0 - 0012781670 Sochay 年代。 预测性能的电影 传媒经济学杂志 7 4 1 20. 10.1207 / s15327736me0704_1 2 - s2.0 - 84950181144 de Vany 一个。 w·D。 电影产业的不确定性:明星效应降低票房的恐怖吗? 文化经济学杂志 1999年 23 4 285年 318年 10.1023 /:1007608125988 2 - s2.0 - 0001298337 拉梅什 年代。 Delen D。 预测和神经网络电影的票房成功 专家系统与应用程序 2006年 30. 2 243年 254年 10.1016 / j.eswa.2005.07.018 2 - s2.0 - 28544450051 Choudhery D。 c K。 社交媒体挖掘:票房收入的预测 21国际数据库程序的工程与应用研讨会于2017年——的想法 2017年 10.1145/3105831.3105854 2 - s2.0 - 85028032291 俄文 Y。 B。 J。 J。 电影票房预测模型基于深入学习 中国传媒大学学报:自然科学版 2019年 26 1 30. 35 伯纳德 年代。 亚当 年代。 Heutte l 动态随机森林 模式识别的字母 2012年 33 12 1580年 1586年 10.1016 / j.patrec.2012.04.003 2 - s2.0 - 84862295459 Fernandez-Delgado M。 Cernadas E。 巴罗 年代。 阿莫林 D。 我们需要数以百计的分类器来解决现实世界中分类问题? 机器学习研究杂志》上 2014年 15 3133年 3181年 荔枝 M。 Jiyao D。 l 基于引发乳腺癌的风险预测分析和随机森林 计算机技术与发展 2019年 29日 8 142年 146年 吉尔茨 P。 恩斯特 D。 Wehenkel l 非常随机树 机器学习 2006年 63年 1 3 42 10.1007 / s10994 - 006 - 6226 - 1 2 - s2.0 - 33646430006