文摘
性能预测是未来体育发展战略研究的重要内容。本文对运动性能进行了研究预测和基于机器学习的影响因素分析和大数据统计数据。预测研究的目的是制定短期、中期和长期体育发展规划和政策服务体育发展的决策者。优点和缺点使体育工作者有意识地修正,实现自己的体育未来的计划。首先,运动性能的影响因素的分析,提出了包括体育考试项目的设置和评分,研究标准,为体检项目训练方法,物理考试学习。第二,大数据统计的应用基于机器学习算法的研究。基于机器的优化算法,它总结了朴素贝叶斯分类算法和大数据统计分类算法。粗糙集算法的理论思想,最后通过比较分析实验基于大数据统计的男性和女性的体育考试成绩和比较实验的三个算法预测结果的准确性,得出的耐力质量男生优于女生,这表明可持续发展的质量。有一定的性别差异,有显著差异在男性和女性学生的技能,和machine-optimized算法可以预测体育三个算法中精度最高的性能。
1。介绍
机器了解的方法,一个家庭的统计策略源于人工智能领域,被视为保护了不起的进步的承诺升值和预测生态现象。这些建模方法是柔韧的适当的管理复杂问题的互动因素和经常比标准方法,使它们适合提高生态系统(1]。最跳跃的边界在人工智能领域的查找笔记本电脑学习。这包括探索提高掌握过程的计算方式。查找在这个位置的根本原因是构建计算机系统,可以加强在该地区的整体性能和独立收集记录(2]。人工智能研究的一个最活跃的领域是机器学习领域。在这一领域研究的主要目标是建立计算机能够改善他们的表现领域和独立获取信息3]。提升是一个通用的方法来提高学习算法的准确性。主要集中在学习演算法,包括分析演算法训练误差和泛化误差,与游戏理论和线性规划,加强联系与逻辑回归和改善关系(4]。统计机器学习方法进一步揭示定性不同的权衡小规模和大规模的学习困难。大规模的实例包含底层优化算法的计算复杂度,和更少的可能的优化算法(如随机梯度下降法),提出了在大问题令人震惊的整体性能5]。在当代的实现,首先计算潮流主要基于物理概念可以明显获得科学事实的最新爆炸。事实上,这两个分支利用算术能大程度上进行善意的他们已经这样做了6]。巨大的统计数据的改善将成为主要颠覆性创新制造真实的统计数据,带来一系列的机遇,挑战,和危险的工作国家统计研究所(NSI) (7]。大数据变得越来越重要,因为额外的官方统计数据来源(OS),机器学习的贡献在于大数据技术的概述有关操作系统,它来源于实际项目我们在分居的问题进行描述和分类8]。hidden-missing-artificial-utility算法处理事务通过事务删除隐藏敏感项集。隐藏失败的结果,它认为三方面缺乏项集,和合成项集来评估是否处理事务要删除某一阶段在清理9]。积极的体育这个荟萃分析研究了两个关系:国家认知焦虑和整体性能和王国自信和性能。配对样本 - - - - - -测试确认测量的建议影响自信曾广泛大比的暗示影响维度认知焦虑。认知的版主anxiety-performance关系被性别和反对标准(10]。在体育运动中,国内的区别和评级被建模为一个布朗运动过程描述 获得国内团队的领导(或滞后)在时间与国内流行的船员简单的可能性之间的关系(11]。为了建立一个科学的和真实的评估方法对身体教育学院,思考课程的意义和问题的区别,模糊层次分析技术被用来确定每门课程的权重系数,和灰色关联评价用于组装完整的比较系统。评估模型。实践表明,这种方法科学比不同的技术(12]。构造一个结构模型的大学生身体教育独一无二的教育年总体性能评价和指导数据,通过结构方程,然后描述之间的关系模型,对身体产生影响培训教育年总体性能和量化的关系大学生身体训练整体性能独一无二的教育。最后,一些积极的指导方针在大学体质是提前13]。物理教育无疑可以扮演一个重要的援助在改善公共健康促进有利的体育态度和广告健康卫生项目,强调感知能力和内在动机的意义的体育活动(14]。cross-context模型提出,青少年认为自力更生引导身体训练的影响感知的因果关系,意图,和身体的任务行为在某种程度上的娱乐时间。及时感知自主帮助身体训练而不是直接影响休闲身体锻炼通过激励序列涉及内部认为因果关系、态度、感知行为控制和意图(15]。
2。运动性能影响因素的分析
2.1。研究目标布局和评分标准的物理教育学位
马从教育测量的角度,应指出,物理考试科目的测试困难应该约0.5和歧视程度应高于0.3。王Quanhui建议应该有更大的深度和难度的设计测试中心和分类标准的制定,以便更容易区分的入学水平和能力的候选人。杨Zongyou和李学界分析结果体育候选人从2011年到2014年在重庆。有很强的相关性之间的100米跑,5米的三方来看,医学球扔在前面,长传。跳过到重庆医学检查的目标。改变原来的质量检测方法和添加特殊的质量检测。测试的有效性和经济,建议重新锻炼的身体状况更有效地衡量考生的身体健康。李玉玲分析了从2006年到2008年湖北省体育成就,指出男性和女性之间有显著差异的总分和个人得分。整体得分的男孩比这低得多的女孩,和女孩的分数在单独的目的地相对较低。王Guanxiong相信的重量基本身体素质高于特殊的品质,这是不利于发展的体育能力的专业化和多种能力。 The method of determining the score only according to the arithmetic sequence of the next paragraph cannot objectively reflect the law of athletic ability to take the test.
2.2。体检对象的文化研究方法
吴本文章中指出,基层教练需要更新他们的培训概念,不仅关注特殊的运动和力量训练,还关注加强速度、耐力、灵活性和敏捷性,和其他体能训练。除了传统的训练腰、腹部、四肢,教练们也关注核能培训和开展有针对性的培训根据不同运动员的情况。江金在文章中指出,垂直三级跳远是一个强制性的项目在一些省市。从技术的角度来看,暂停更复杂,需要更多的不仅仅是良好的力量、速度、协调、和跳跃能力的候选人。申请人的步伐也是必需的。站三跳三跳是关键和管理三跳之间的连接。除了良好的身体健康外,申请人还必须有正常的技术动作为了更好地展示他们的技术水平。为了得到一个高分,候选人必须加强他们的力量在标准实践;双手投掷实心球当场也是一个项目培训时间较短和更复杂的技术动作。朱鲁伊在文章中指出,跑步800米需要稳定的注意力和简单和自然运动和节奏,和一般的身体健康应该开发在基础训练阶段,应该使用和持续培训。 Introduce interval training. The above researchers are all from the perspective of sports events. Most of the training strategies proposed for a certain event are theoretical, and there are few studies on the arrangement of individual stages.
2.3。研究体育考试的研究
体育教育的培养候选人和讨论体育考生的文化课程学习提供理论支持的更新和发展我国体育和产生深远意义。针对体育问题,许多学者发表意见,努力找到更科学,更合理,更公平的方式。我的国家已经取得了很大的进步在制定体育内容和查看标准。虽然在国外仍存在一些差距,我们可以学习他们的先进经验,把粗糙和提取精华,持续改进。随着社会的不断发展,我国学校体育的发展,体育相信一些问题将逐步得到解决。针对这种情况,本文使用统计软件和统计数据分析和测试的考试分数重庆羽毛球超级球员和显示的规则的质量测试和特殊测试重庆羽毛球超级球员。的缺点并提出具体有效的对策,希望为重庆体育部门提供一定的参考,并使体育在重庆更客观、科学、公平、合理、有效。
3所示。大数据的应用研究基于机器学习算法的统计数据
3.1。机器学习原理
在构建模型的假设空间之后,机器学习应该考虑学习或选择最优的标准模型。质量损失函数通常措施中的第一个预测模型,预测的风险函数措施的预期值输入,给出的模型预测值之间的差异和实际值对应于模型的输出从假设空间中选择存储作为损失函数。常用的函数的公式如下:
损失函数的值越低,模型的性能越好。每个样本都可以被认为是独立随机来自一个共同的空间根据未知的常见分布,可以测量和模型的质量风险函数或期望风险如下:
一般来说,预期风险越低,模型的性能越好。如果训练集包含独立和随机样本的平均损失模型相对于训练集被称为经验风险,公式如下:
因此,一个可行的学习则是找到一组参数0,最小化经验风险,即
3.2。机器的优化算法
因为笔记本电脑学习经常有许多人体模型参数和一个巨大的数量的学术资料,是不可能使用二级优化技术与一个巨大的计算量,和校长二级优化技术教育通常是不太好。为了使用一些成熟的、环境友好的优化技术在凸优化理论中,最常用的优化算法是梯度计算方法,并制定如下:
这是最原始的形式的梯度降落,这对应于样品的经验风险估计风险近似独立于实际的数据分布,但当训练样本大,每个迭代计算密集型和训练过程是缓慢的。为了解决这个问题,只随机梯度下降的梯度计算随机选择样本,并使用它来更新参数在每个迭代更新。为第十次迭代,更新方法如下:
随机梯度下降法很容易实现,收敛速度快,是广泛使用的。所以在第十次迭代的一个子集的样品是随机选择的,损失函数的梯度计算,平均每个样本子集,和梯度更新:
小梯度下降法已逐渐成为主要的优化算法对大规模机器学习因为它的收敛速度快,计算成本低。
3.3。朴素贝叶斯分类算法
朴素贝叶斯时尚安全的分类效率。它对小规模执行好数据,可以应付multiclassification任务,和适合增量训练,特别是当信息的数量超过了内存,它可以deincremental指导批量。缺乏是不太敏感的数据,该算法非常简单,经常用于文本内容分类。朴素贝叶斯分类算法是基于概率统计的发展,是一个典型的分类方法。要点是使用先前的知识和经验得到之前的一个事件,然后使用贝叶斯概率公式来计算概率基于前面的概率,也就是说,属于一个特定的概率的事情。相对应的类别最高概率值确定类别的当前情况。让是一个随机事件,代表的条件 ,如果代表了训练样本获得的先验概率吗 。在这种情况下,假设是真的,概率呢能被探测到,结果获得的条件概率叫做吗 。然而,这个计算的概率值计算是基于 ,的后验概率 。通过调整前面的概率,数据可以显示的概率以后再确定。
方程(8)是一个完整的贝叶斯公式。其天真自然是假设每个条件是相互独立的,使用预处理和选定的组练习,倒成一个朴素贝叶斯模型,实践和学习常见的概率分布和 ,等培训,最后接受模型后验概率是获得的条件作为输入。方程(9)可以用来计算最终的条件概率;也就是说,如果属性元素出现在一个给定的文档 ,它可分为类的条件概率 。
在公式(9),代表类的概率可以从统计获得一个完整的数据集,和 是一个条件概率,代表形容词的概率在文本类 。最后一个表示文档中所有的属性项的数量 。正如上面提到的,和 应使用统计方法计算最大概率估计可以用来找到他们。使用最大概率估计,preprobability可以获得 ,在哪里代表文件类的总数在整个训练序列和文档的总数在整个训练,和计算 见公式(10):
模型后教通过一系列的练习,最终确定参数,模型预测在一系列的测试中,模型的预测类值比实际类值,计算和评估性能评价指标评价模型。通常情况下,全部或部分的三个测量准确性、内存和用于测量和评估模型。准确性代表样本的数量的比率日志的总数在测试集样本测试模型与测试集的标签。复苏代表样本的数量之间的关系模型可以正确确定测试何时一个标记测试系列和样本的数量,测试系列实际上属于该类。的价值考虑精度和恢复速度,和具体计算两者之间的平均。在文本分类中,定义类别通常分为正面例子和消极的例子 ,和的公式计算精度速度是由方程(10)。效率计算公式见公式(11),评价指标主要措施是否检验样本数据的模型不匹配另一个类别去了。
计算的公式值显示在公式(12),评价指标是一个综合衡量模型的分类效果。
3.4。大数据的统计分类算法的粗糙集算法
经典粗糙集理论的基本思想是造粒和近似基于等价关系的数据分析方法。艰难的原理和软件的核心基础是一对近似运营商源自近似空间,特别是上近似算子和减少近似算子(也承认更高,降低近似集)。目前,有两个主要查找技术轮廓近似算子:乐观技术和公理化方法。开发技术的二元关系,部门报道,附近的系统,布尔子代数,在宇宙的主要因素等轮廓的近似算子,从而推导困难集代数工具。最初的研究继续遵循减少复杂性简化不确定性的传统观念,成为确定的。因此,不确定性问题可以表示为一组下近似集和大致上近似集,可以精确定义如下:
因为精度的大小成反比边界地区,评估模型的近似精度和近似分类质量,这是由
近似分类质量被定义为以下:代表的比例正确的决策在决策分类数据元素使用知识,和表示数据元素的比例,可以正确地划分为预定的类使用的知识。 确定性因子表达式定义规则
判别矩阵是另一种形式的知识表示方法,它可以很容易地计算减少和内核的属性,所以方程(13)是所有属性的集合,区分对象和总结,和表达式如下:
通常是由包装实现方法,也就是说,一个粗糙集用于选择属性,最后,近似计算模型的准确性和近似分类。
的近似精度质量模型表示为
近似分类质量表示为
3.5。基于大数据的分类算法的统计数据
没有饱和区,没有梯度消失问题,没有复杂的指数运算,计算简单,并有效改善;真正的收敛速度更快,比乙状结肠/双曲正切快很多;它更符合有机神经激活机制比乙状结肠。一个随机变量服从正态分布称为概率论中的中心极限定理。一个随机变量的分布函数满足的 :
评级模型使用顾客评论作为评级的一个表达式。由于分类的本质是建立模型实现从数据元素的条件属性映射到数据元素的类标识属性,基于统计评分模型的主要思想
统计评分模型
4所示。预测和分析基于大数据的体育考试成绩统计
4.1。实验对象的选择
本文以物理考试成绩为研究对象。为了更直观地反映身体检查性能指标的变化趋势,男孩和女孩需要跑100米,200米,400米和4×100米,分别和体检结果统计和预测。
本文利用DPS数据处理系统从理论上预测男性和女性的平均成绩。从图可以看出1和表1和2,固定基地比和链比是基于男性和女性的平均成绩的学生在2016年。洛阳体育参与率测试显示的趋势逐年降低,然后增加。2017年,男孩和女孩的耐力质量恶化,降幅较小。的耐力素质,增加耐力素质的女孩略高于男孩,反映了性别差距在增加耐力素质。
4.2。分析不同因素的体检结果
可以从表3,零被拒绝是因为投机行为值这张支票是一个很多远低于0.05;即。,the numbers are appreciably exceptional between the three years. Therefore, the outcomes of the evaluation right here have to be precisely equal to the preceding assessments of the ordinary model. Therefore, it suggests that there is a giant distinction in the common values of the boys’ 1000-meter run in 2016, 2017, and 2018, so more than one comparison of the common values is required. In statistics, df refers to the wide variety of impartial or freely altering records in the pattern when the parameters of the populace are estimated by using the statistic of the sample, which is known as the diploma of freedom of the statistic. In general, ranges of freedom are equal to the impartial variable minus the quantity of its derivatives. For example, the variance is described as the pattern minus suggest (a spinoff decided by using the sample) and for this reason has N-1 tiers of freedom for随机样本。的价格是一个参数用于决定猜测测试的结果相比,另外可以根据独一无二的发行版使用的拒绝位置分布。的费用模式评论或额外的严重后果的机会当零的猜测是正确的。如果费用很小,它有能力零的发病率投机的机会很小,如果它发生,根据小概率的规则,拒绝零假设我们有一个目的。越小价值,为我们更好的原因拒绝零假设。
如表所示4,这个测试的价值远低于0.05,表明有一个显著区别就是女性的力量事件(永久跳远)在2017年,2018年和2019年。因此,多重比较的方法是必需的。
4.3。统计物理教育考试的基本情况
体检的结果被分为四个等级:优秀,良好,通过了,并且失败。得出体能考试达到优秀的水平,占总人数的18.96%和32.95%的水平。学生总数中通过了标准,41.21%,近50%的学生反映在我们的城市有不令人满意的考试成绩,表明学生的整体身体状况并不乐观,极化(见图2)。
男孩的选择倾向的身体作为一个可选的目标,两个地区的比较表的主题显示,男孩在城市地区的运动性能比其他男孩高。这表明城市男孩有更好的运动性能。整体身体素质高于在其他省份和城市的男孩。几乎没有区别的两个区域之间的主题分类坐在向前弯曲。的比率的第一级向前屈坐在两个地区是0.5%,表明男孩选择坐的姿势向前弯曲所选择的项目。卓越的属性高,如图3。
4.4。体育考试成绩的预测模型
身体健康看看统计数据预处理和标准化,初步信息修改与评价方法重要方面的援助,然后,BP神经社区用于生成一个模型。在这个项目中,神经网络模型构建使用neuralnet包中,男孩和女孩有不同的评分标准和方法,所以男孩和女孩分开的测试数据,并为预测模型分别生成。不断调整和优化模型使用80%的训练集,最后模型参数如表所示5。RPROP算法的基本规则如下:首先,一个初步的成本分配给每一个重量变化,设置重量交换加速组件和减速因子,在社区和前馈迭代,当不间断误差梯度信号现在不改变,加速度方法采用速度教育速度。不间断的误差梯度变化的信号时,减速的方法是采用预测保证收敛。社区结合了先进的误差梯度图像和替代一步维度认识到英国石油公司。在相同的时间,为了避免振荡或下溢的社区学习,该算法需要将顶部和减少限制重量的变化;上交所经常用作“误差平方和的缩写。“一元回归,我们使用的基本因素的加权残差平方和来代替的方法筛选特征值只有残差平方和,大大提高了系统误差和模型具有较高的精度。精度大大提高;有一个自然的发展规律:在其发展的早期阶段,数量或规模的增加速度越来越快,在一定时期内,其增长速度逐渐减慢,最后数量或规模不再增长,从而稳定在数量或大小的限制。
4.5。评估三种算法的性能
机优化算法和粗糙集算法,它不同于朴素贝叶斯算法,所以划分训练集分为7:3。三种决策树算法的增长和修剪,机器优化,朴素贝叶斯,和原始集,分别构建的最后阶段的性能预测模型相同的训练数据集,然后,使用相同的测试数据来测试三种不同的性能预测模型。设置性能最好的算法性能的评估和选择在这个数据集,如图4,这是一个比较图表三个算法的预测精度。
舞台表演的准确性预测模型图所示5。图显示,随着学习行为特征的数量的增加在每一个阶段,阶段性能预测模型的准确性通常显示了上升趋势。
5。结论
在大数据的背景下,本文进行了动态分析和研究体育教育调查的结果从2016年到2018年,在项目设置和研究,评分标准和考试科目的特点来提高学生的考试分数和改善学生的体质。策略是更科学。科学、合理地制定有效的锻炼方法对于学生练习,实践科学,教学生根据他们的能力,充分调动学生的积极性和热情,为体育教师,使学生有意识的行动,爱运动,教师积极探索。因此,一种新的方式来提高学生的身体素质是实现。本文还构建了一个阶段的性能预测模型基于三种算法的性能。实验结果表明,machine-optimized算法可能最高的三种算法在预测精度运动性能。鉴于有许多专业知识不足的理解体育examination-related政策和新兴信息技术的方法,“大数据”,本文只进行动态分析和研究体育考试成绩在大数据的上下文中。通过深入挖掘有效信息的数据,它发现存在的问题和影响因素,然后发现策略来提高学生的考试成绩,增强学生的身体健康。没有深入研究的体检项目,评分标准是否合理,以及测试项目是否有很好的区分男性和女性学生的程度。
数据可用性
使用的实验数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称,关于这项工作他们没有利益冲突。