文摘

为了构建体育经济运行指标的预测模型,本文结合深度学习和集成学习算法集成,提高算法和分析的原则LightGBM合奏的hyperparameters学习模型和模型。此外,本文获得适当的智能算法根据数据分析需求的体育经济运行。体育赛事经营的盈亏平衡分析方法是找到项目的利润和亏损的临界点之间的关系通过分析体育赛事的运营成本和利润。此外,本文使用深度学习和整体学习体育活动情况做出综合评价,构造运动项目总结评价结构,本文评估模型与实验研究相结合。测试结果验证了模型的可靠性。

1。介绍

随着经济的发展,社会物质财富的不断增长,人们开始追求休闲消费、休闲消费需求孕育了休闲产业。休闲产业指的是一般的休闲产品的生产和休闲服务行业在国民经济引发的休闲消费需求1]。它广泛存在于三个国民经济的主要行业,包括主要的休闲产业,二级休闲产业,次要的休闲产业。休闲的第三产业,第三产业是休闲产业的主要行业,主要由旅游、文化、体育和其他休闲产业(2]。转变经济增长方式,尤其是消费驱动型的经济增长模式,促进了休闲产业的快速发展。休闲消费已逐渐成为国民经济新的增长点,在许多国家和地区,甚至一些人成为占主导地位的地区或国家3]。休闲产业,特别是在一些旅游城市,已成为当地的支柱产业,甚至经济增长模式已经从依赖一个休闲分支工业依靠整个休闲行业的整体发展。然而,中国休闲产业的发展相对较晚,分支工业的发展不平衡、旅游和休闲发展迅速,开箱即用的,行业的经济效益突出。文化休闲和体育休闲的发展明显滞后,和工业效果并不明显。这使得中国休闲产业的发展。发展和竞争力的总体水平不高;此外,旅游和休闲两到三年,经历了广泛的发展和它的发展势头和发展空间显然是阻碍,这进一步限制了中国休闲产业的发展。特别重要的探索如何快速,不断促进中国休闲产业的全面快速发展,使国民经济新的支柱产业。

中国经济的腾飞,人们的经济消费水平也有了质的飞跃。越来越多的人开始提出新的要求在他们的精神层面上,他们已经开始度过他们的闲暇时间通过改善他们的美学。因此,各种各样的国内一流的比赛已经越来越成为人们的精神需求。近年来,大型体育赛事在世界舞台上变得越来越频繁。然而,我的国家的事件服务质量参差不齐。作为体育赛事运行的重要基础,组织者迫切需要产生很大的大惊小怪事件服务的质量,因为大型体育赛事的优秀的服务质量。自卑直接影响到活动的质量和效果。好的服务质量会让参与者继续支持这项运动,和糟糕的服务质量会使参与者感到厌恶,不再支持这项运动。

根据前面提到的分析,本文结合深度学习和整体学习构建体育经济运行指数预测模型,评价体育经济运行,并提供一个参考的后续发展体育经济的发展。

文献[4)认为,大型节日和普通事件的区别特征如下:首先,这个事件必须吸引大量的参与者和观众,形成一种全球的关注;第二,大规模的节日也是一种市场策略;旅游业,特别是,它能使组织者和地区在国际市场上受到极高的关注;最后,大规模的长期传统节日可以创建,它仍然可以发挥作用在事件结束后。

文献[5)进行系统的文献回顾的产业链效率从五个角度研究产业链竞争力、效率(性能),生态稳定、可持续发展能力和整体效果。文献[6)采用的概念、方法和手段,绩效评估,实现政府绩效评估的过程。

它已经成为一种普遍现象,体育活动推动旅游业的发展。文献[7)认为,举办体育赛事可以增加城市的知名度,带来大量的游客,促进城市之间的文化交流。文献[8)解释了城市的特定角色特点和体育赛事如何塑造城市的独特的特点,提出了使用创建体育赛事来塑造城市特点和独特的人文精神,通过旅游交流。体育活动发挥重要作用在塑造城市的形象,推动城市的发展。文献[9)认为,体育赛事带来的经济影响城市经济的快速发展和旅游业。文献[10]提出体育景观的塑造也是一个重要的手段展示主办城市的文化,它有一个积极的影响城市形象的传播。文献[11]提到体育赛事的作用在塑造和传播城市的形象和品牌。文献[12)提出,体育赛事,最常用的城市的文化活动,对城市形象有积极的影响,并提出五个策略来传达和塑造城市的形象。

文献[13)以城市体育为研究视角,建立一个科学的评价系统对城市体育的现状。文献[14)建立了一个评价体系为大学生体育权利。文献[15]分析了裁判的工作角色和工作过程,构建一个裁判选择的评价指标体系。文献[16研究体育旅游,给体育旅游人力资源的评价指标体系,并发展相应的评估。文献[17)从经济效益的角度进行研究。指标主要包括设备利用率,设备完整率、场馆收入,场地自给自足率,和利润。文献[18评估体育场馆的经济效益和使用多因素综合分析构造体育场的分级模型。文献[19)主要研究场所的两个基本属性:“公共福利”和“业务。“文学(20.构建一个评价指标体系正常运行的球场经营管理体育赛事后举行。

3所示。深入学习和整体学习预测算法

集成学习是机器学习技术常用于商业和经济分析。机器学习算法通常不能直接获得模型与更好的性能在所有方面,而整体的学习可以升级多个弱个体学习者偏好强烈学习者获得更高的精度。的基本思想是首先生成一组学习者,然后使用策略来整合他们,不断优化迭代过程中的目标函数。

GBDT算法由一个梯度增强算法(梯度增加)和一个决策树算法(决策树)。它使用一个决策树为基础的学习者,使用多个弱学习者提高算法结合到一个强大的学习者通过剩余配件,并使用从上一轮梯度信息构造决策树的迭代过程。

3.1。梯度提升算法

的梯度增强算法的扩展增强方法。在迭代过程中,通过添加子损失函数进行了优化。如果损失函数扩展为一个可微的函数,和提升法和梯度下降法结合获得梯度推进的方法,基本思想如下。

复合模型的公式见公式(1),f(X)是子模型。

我们假设损失函数 ,使用贪婪确保损失函数的方法是减少每次新的子模型 补充说,使用梯度下降法执行剩余配件。

3.2。决策树算法

决策树算法使用一个树结构,根节点包含所有的样本,内部节点表示特征属性测试和叶节点分类的结果。决策树的学习过程包括三个步骤:特征选择,生成决策树,修剪。关键是在分裂过程中分工的最优属性。

有三种特征选择标准:信息获取、信息增益系数和基尼系数。其中,它通常用于执行自上而下的划分根据信息增益准则,并计算每个特征在每个部门的信息增益,选择最大价值。

Ent (D)的信息定义为公式(3),Pk代表比例的样本集D k样本。

在信息增益公式, 代表v-th属性中包含的样本值V的分支节点,这个公式如下:

决策树分割方法GBDT算法分为两个,一个是leaf-wise增长的方法根据利润最大化,另一个是直接level-wise增长的方法。

根据叶增长的方式,所需的决策树可以用较小的计算成本。这种方法的优点是精度高,能够迅速和有效地完成树的增长,但与此同时,很容易overfit和成长过程是连续的,不能直接并行加速。图1决策树的生长过程是树叶。

层的增长意味着每个节点的每一层必须分离。因此,这种方法可以直接执行并行加速度,但它会产生冗余节点分裂,这需要较高的计算成本。与此同时,每个迭代都需要遍历完整的数据集,所以需要更高的运行内存。图2是决策树的生长过程层分割了。

LightGBM主要基于决策树算法的框架如GBDT优化使用直方图算法,直方图差分优化、基于限制树木生长最佳叶节点,单边梯度采样、直方图和重新排序的类别特征。与其他决策树模型相比,它改善了速度、内存消耗和准确性。

为了减少计算成本和获得更好的准确性,LightGBM模型使用一个树木生长方法,根据最优叶子节点分裂。原则上算法只能顺序执行,所以三个功能并行性的方法,数据并行性,和投票的并行性,执行和并行加速度三方面的特性,数据,和沟通。

3.2.1之上。直方图算法的优化

基本思想是将连续特性值分成许多#箱,使用离散值作为索引,然后寻找最佳分裂点#本,降低计算成本和存储成本。此外,柱状图可以用来优化的差异进一步加快和获得更好的性能。与此同时,由于离散特性,LightGBM自然可以处理类别特征。

直方图算法只需要存储# lbin离散值,不需要原来的功能价值,不需要排序。#本值可以使用较小的数据类型存储训练数据,如uin8_t类型,它可以减少内存消耗预分类算法的1/8。内存优化过程如图3

3.2.2。Gradient-Based单边采样算法(高斯)

高斯算法的概念第一次被应用到演算法模型。基本思想是先对梯度排序,保留所有实例与大梯度(错误)抽样,只有随机样本所有实例与小的梯度,以减少信息计算迭代过程中的特征选择。同时,为了减少损失的准确性,将一定重量值小的梯度的样本。

O是固定的训练数据集决策树的节点,该实例 ,和损失函数的梯度来标示 然后,传统的方差计算获得分裂的特性j节点的d被定义为

其中,

当使用高斯算法,该算法首先各种训练例子降序根据梯度的绝对值和实例子集组成的大的梯度α×100%。之后,以一个较小的梯度算法剩余的样本集(1−组成一个B)×100%实例作为一个子集的大小 最后,获得 计算根据AUB子集

每个子项的定义如下:

使用估计获得 在一个更小的子集的实例而不是准确的获得 在所有实例来确定分割点可以大大降低计算成本。证明戈斯不会失去太多训练精度,但效率比随机抽样。

3.2.3。相互排斥的稀疏特性绑定

最优特征捆绑问题通常可以使用贪婪算法获得一个近似解来选择需要的特性值的总和。互斥特性合并过程,因为柱状图数据是离散的,原始数据可以区分抵消实现合并功能的目的。

3.2.4。比较LightGBM和XGBoost模型

与整体学习另一种流行的框架XGBoost模型相比,LightGBM模型发布后提出以下改进,如表所示1

LightGBM模型的最重要的参数设置包括算法的学习速率,决策树的最大深度的限制,一个决策树的叶子的数量,和选择的比例特性的迭代过程。

以下是主要参数的控制和优化LightGBM模型。(1)mum_leaves是主要参数控制树模型的复杂性,代表每个树的叶子数。通常,认为mum_leaves小于2 mar_sdeph;否则,很容易造成过度拟合问题。其中,叶子的数量对应关系的满二叉树和树的深度 (2)learning_rate算法的学习速率。如果太小,模型的优化效率太低。如果它被设置太大,可能降低精度。(3)max_depth指的是树的最大深度模型,它可以防止过度拟合数据时小。(4)max_bin特性存储在本的最大数量。(5)min_data_in_leaf是最低的数据量,可以设置在叶子,和少量的数据还可以防止过度拟合。(6)feature_fraction和bagging_fraction选择功能的总数的比例特性和所选数据的比例分别为总的数据量。这两个参数的值通常是在0和1之间,可以确定模型的速度训练,还可以处理过度拟合问题。(7)mm_iterations表示迭代的数量增加。

可以看出,一些参数重叠在提高算法的精度和处理过度拟合的问题。因此,本文选择相对重要的参数优化模型。

我们配置参数来获得一个更好的平衡模型的训练速度,准确性,防止过度拟合。下面是hyperparameters产生更大的影响模型预测:(1)提高训练速度:增加learning_rate和减少max_bin(2)提高准确性:增加max_bin、增加mum_leaves和减少learning_rate(3)防止过度拟合:限制树深度max_depth和减少min_data_in_leaf和用小mum_leaves

通过优化算法优化机器学习模型参数是一种常见的研究内容。在使用粒子群算法选择hyperparameters支持向量机的优化的支持向量机应用于电力负荷预测的研究,证明了粒子群算法的优化能力通过实验。然而,该算法需要更多的参数调整。网格优化是另一种常见的优化机器学习模型参数的方法。程陈等人通过研究发现,该方法相对单一和参数改进范围是有限的,很难寻找最好的在全球范围内。因此,一个新的量子粒子群算法优化的hyperparameters XGBoost模型。预测营销研究实验的数据,相比于XGBoost预测基于网格方法优化,实验证明了新模型取得了较高的预测精度。

果蝇优化算法是一个很好的优化算法适用于机器学习调优。它的优点是简单的实现和更少的配置参数。算法模拟果蝇群体的特点,通过嗅觉和捕捉食物的空气首先收集空气中的各种口味。果蝇的殖民地获得最高浓度的食物味道的地方根据他们的位置信息,然后,所有的果蝇飞往闻到点。之后,该算法还使用果蝇的嗅觉特征识别的同伴的位置和迭代,利用果蝇的嗅觉和视觉特征,逐步找到点最大的气味浓度在当前区域,并获得食物的位置,也就是说,全局近似最优解。

4是一个原理图的标准果蝇优化算法的优化模型。

标准的果蝇算法实现简单,操作步骤如下。

步骤1。算法首先初始化果蝇人口,即初始化种群规模Sizepop,设置最大迭代数T,随机初始化(X_axis Y_axis)果蝇种群的初始位置21]。 其中,随机是[0,1]之间的随机数,和顶部和底部的上下界搜索区间。

步骤2。算法生成一个随机数为每个单独的果蝇在一定的范围内,并使用它作为个人的方向和距离的果蝇随机搜索过程。算法将值赋给初始化的果蝇果蝇的个人获得下一个位置。其中,随机值是搜索距离。

步骤3。该算法获得的味道浓度测定值年代通过计算当前位置之间的距离Dist果蝇和原点的坐标。

步骤4。该算法代替年代到味道浓度测定功能,这是相应的适应度函数,并计算出味道浓度Smelli在个体水果蛹的位置。

第5步。最好的算法发现果蝇气味浓度(以最大值为例)在当前果蝇人口和使它作为最好的味道浓度点。

步骤6。算法法官是否最好的味道比以前更好的集中值最好的味道浓度。如果它是更好的,算法记录最好的味道浓度bestSmellIndex值和位置信息,使所有果蝇飞到这个位置。

步骤7。开始迭代寻找最优解的算法。同时,也是衡量一个公司的最大数量是否达到设定的迭代算法,和其他的条件满足提前终止算法。如果当前迭代过程是最好的味道浓度获得比以前更好的最佳口味浓度,执行步骤6;否则,重复执行步骤2到步骤5,直到获得近似最优解。
失落的执行流算法如图5
从算法执行流程图可以看出,所需的时间为每一个失落的单个果蝇优化算法T .与此同时,在迭代过程中,每个单独的果蝇需要执行一个搜索,直到算法达到最大迭代次数,所以标准的果蝇优化算法的时间复杂度是O (T '×Sizepop)。因此,控制算法的计算成本的关键在于最大迭代数的设置T和果蝇种群规模的大小。
评估是指评估预测模型预测结果的准确性或预测精度的测量。在统计数据,预测误差的大小是常用来衡量预测的质量效果。常用的回归预测评价方法包括平均绝对误差、均方误差、均方根误差、均方日志错误,平均相对误差均方日志错误,平均绝对误差,确定系数。
是一系列大宗商品价格的实际价值,然后呢 预测的价值。
(1)平均绝对误差(MAE)。美是用来描述预测值和真实值之间的差异。值越小,越好。的平均绝对误差n样品如下: (2)均方误差(MSE)。计算均方误差的平方误差预测值和实际值。的均方误差n样本计算如下: (3)均方根误差(RMSE)。极大或极小的误差值的一组预测结果数据,使用均方根误差可以代表预测结果的偏差。计算如下: (4)对数均方误差(怪物带有) 当目标指数增长的特点,使用这个指标是最合适的。怪物带有更敏感的预测低于真实价值。
(5)平均绝对误差(MedianAE)。平均绝对误差使用中值的绝对差异目标和预测计算损失,从而减少异常值的影响,定义为 (6)确定系数(R2分数)。最适合的预测模型和实际数据判定为1,它可以是一个负值。的R2分数的n样品如下:

4所示。体育经济运行指数预测模型基于深度学习和整体学习

盈亏平衡方法主要是评价体育赛事的运营利润的不确定性。体育赛事经营的盈亏平衡分析方法是找到项目的利润和亏损的临界点之间的关系通过分析体育赛事的运营成本和利润。判断的过程不确定性因素对经济效益的影响的体育赛事运营计划是用来说明风险的程度体育赛事经营计划的实现。这个临界点叫做收支平衡点(cep),如图6

cep的收支平衡点是体育赛事运营,年代体育赛事经营收入,Q是体育赛事操作的数值输出。Ql是体育赛事运作的数值输出的输赢的平衡,c体育赛事经营的总成本,Cr是体育赛事运作的成本。

中国体育产业开发标准的基础上,本文充分考虑了一般特征的体育产业的发展构建一个一级指标体系与体育产业发展的指导理论。具体内容如图7

本文使用整体学习深入学习和全面评价体育赛事。综合评价的过程中,我们经常使用定性和定量相结合的方法,层次分析法,综合评价。无论采用哪种方法或手段,必须注意评价的有效性和可靠性。原因是最终综合评价的目的是给一个评估是否决定是可行的和体育赛事的成功或失败。从前面提到的主要过程,我们可以获得体育赛事的过程评估,如图8

建立上述模型后,我们评估方法的影响。本文算法的数据处理通过深度学习和整体学习。因此,首先,本文算法的效果处理的体育经济运行指标数据测试,结果见表2和图9得到了。

从前面提到的分析,可以看出,本文提出的方法具有良好的效果在体育经济运行指标的数据处理。之后,体育经济运行指标的预测效果本文模型的评估,结果见表3和图10得到了。

通过前面提到的研究,我们可以看到,体育经济运行指数预测模型基于深度学习和整体学习提出了好的结果。

5。结论

本文试图结合中国国情和大型体育赛事的特点来构建指标体系,可以诊断和预测各种服务质量存在的问题在当前的事件,并提出建设性的意见。改善服务质量的体育赛事可以实现更快更好的发展城市体育赛事产业,形成一个系统的、科学的体育赛事服务质量评价体系,并提供指导举办其他大型体育系列活动。本文结合深度学习和整体学习构建体育经济运行指数预测模型,评价体育经济运行,并提供一个参考的后续发展体育经济的发展。通过实验研究,可以知道,体育经济运行指数预测模型基于深度学习和整体学习提出了好的结果。

数据可用性

标签数据集用于支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究是由国家社会科学基金项目:一个评估研究政府购买体育公共服务的“合法性和有效性”(项目号19 bty026)。