文摘

摘要森林算法和决策树算法主要用于分析学生体育信息、课程考试成绩和学生的学习数据属性的在线教学平台和相关功能。我们的目标是使用决策树算法生成决策树生成分类规则的目的,在此基础上我们可以找到因素对学生体育教育重要的性能和表单数据基础提高教学质量来帮助教学管理和教师改进教学方法,调整教学策略。我们具体实现这一目标通过构建一个模型来评估学生的教学的有效性,包括数据收集和准备的步骤,数据预处理(数据清洗、转换、集成),模型结构(培训)算法,以及算法优化,实现模型的仿真结果。同时,模型的相关属性的重要性进行了分析,并提出一些措施来改善大学:体育教学的标准和相应的策略来改进教学方法。主流开发环境选择,以确保项目的完整操作系统,集学习、操作,和评价。体育虚拟仿真实验教学系统实现本文具有良好的功能,稳定,应用程序在操作和使用。

1。介绍

报告“物理教育质量:指导决策者采取行动,”发表的联合国教科文组织指出,体育教育是唯一的方法结合物理的发展运动技能的学习与交流,为学生价值观和理想的路径获取核心竞争力(1]。研究高校体育教育的最后阶段能够收到正式的体育教育和完善是一个重要的方法,提高他们的知识的物理教育和高校体育教育的发展是由学校教育规定的要求,以及满足患者的需求,体育的发展(2]。结果青少年身体健康的调查发现,大学生的肺活量近年来是一个下降的趋势。学生也有视力低下,神经系统失败,和心血管疾病,一些问题已经严重影响身心健康。与世界发达国家的大学生,大学生的健身和健康需要改进(3]。现有的研究集中在物理教育的核心竞争力的发展,针对改变体育课程和教学,大部分集中在理论方面的基础教育领域。这些研究忽视的因素影响自己的发展以及其他方面(4]。因此,本研究不仅限于学科界限,但基于核心人类体育文化的发展起点,除了研究策略的核心人类体育文化的发展在高等教育5]。基于高等教育的发展,在丰富的经验在实施素质教育和实践教学的积累下,大学生体育核心素养已经提升(6]。许多因素影响大学生体育教育发展的核心品质。首先,体育教育的一个重要影响因素,主要为大学生参与体育锻炼,这是密切相关的体育教师的专业素质以及学校的实施政策,管理系统,体育环境,组织课外体育活动(7]。因此,为了能够更好地培养学生的体育核心品质,整个学校应放置在培养系统,寻求实现方式,培养和优化培养策略。

派等人他们的PageRank模型基于本校的性能统计和排名在篮球、曲棍球等运动来评估学生的个人和团队绩效以更全面的方式,促进他们的参与学习8]。定量的性能评估是用来定义学生的游戏性能,和学生的定性评估是实现个性化采访形式促进参与者的感知和体验游戏的性能(9]。在体育课程的结构设计,马丁等人在他们的论文中分析了体育课程的新概念与传统教学相比(10]。在此基础上,他们讨论课堂评估的重要性,因为它的发展。研究指出,新的物理教育(肺水肿)课程的角度来看,基于国家发展和青少年健康问题,对传统的课程设计有重大影响,实现和评估(11]。此外,研究评估体育教学和学习都集中在沟通和学校之间的联系,社区和家庭;例如,金等人研究了父母对学校评估和需要改进学校的课程基于父母的观点(12]。迪等人进一步分析了物理教育模型(SEM)来评估学生的动机从自决理论的角度,说明学生需要一定时间来决定他们的行为在一个教育环境。最有效的手段之一,处理课堂评估是评估准则的设计和使用13]。毛等人状态,使用评估准则来确定学生的总体学习性能可以大大增强学生的动机(14]。

可以看到,有几篇文章和著作对体育学习评价。无论是学习评估和课程开发或之间的关系的具体实现和应用学习评估,很明显,体育学习评价已成为当今教育领域的一个重要热点。有必要建立“健康第一”的教育理念,并提供足够的体育课,帮助学生享受乐趣,加强自己的体型,增强他们的个性,脾气他们在体育锻炼意志。这些重要论述极大地提高大学体育的地位和对大学人才培养重要的指导方针。应用软件理论评价系统功能需求分析,设计最主要的功能模块,实现了基于数据挖掘的决策支持系统和仿真,评估部门提高工作效率,并通过一定的挖掘分析提供决策指导。研究提出了一种简单而有效的数据仓库的设计和实现方法,并使用在线分析和处理技术分析数据仓库中的数据,为后续的数据挖掘提供基本数据。经过学习和研究常用的数据挖掘算法和理解不同的算法的特点,适合这个数据挖掘决策树算法根据数据研究,选择一种改进算法建立挖掘模型,并分析了挖掘结果中提取有价值的决策信息。根据发现的问题通过应用决策树算法,该算法在深度学习,分析和比较,结合这个项目的数据的特点,分析数据挖掘和数据仓库和联机分析处理技术用于获得有用的信息为决策提供有意义的参考在物理教育的评价。

2。设计决策树模型来评估教学效果的大学

2.1。改进的决策树算法和计算机模拟设计

作为一种最常用的数据挖掘方法,决策树算法已广泛应用于不同领域以来介绍。它经历了一个漫长的过程,从浅到深,从简单到复杂。决策树是一种自顶向下的递归分割,采用自顶向下的,各个击破的方法,其基本算法本质上是贪婪的(15]。从根节点开始,每个nonleaf节点发现找到一个属性在其相应的测试样本集的样本集,和训练样本集分为若干次级样本根据不同测试的结果。每个子样品组构成一个新的叶子节点,重复上述过程的新叶子节点,这样循环继续达到一个特定的终止条件(16]。采用灵活的方法来管理教师和教学,这是由大学工作的特点决定的,是去上课的时候有类,然后有空的时候没有课。虽然这是有利于研究和学习,也可能继续教学的某些方面,如课程计划、作业修改,和实验室教学、失控。决策树采用自顶向下的递归方式比较和评估决策树中节点的属性值,并确定分支的节点根据不同的属性值。最大的优势之一的决策树学习算法,它不需要用户获得很多基本知识在学习过程中,如图1

构造决策树的过程分为两个步骤:构建和修剪树。第一步是树构建阶段,选择训练数据的一部分,构建一个广度优先决策树的递归算法,直到每个叶节点属于同一个类。第二步是修剪阶段,使用剩余的数据检查生成的决策树和纠正错误,错误和最终决策树并将节点添加到一个正确的决策树构建。决策树构建算法是一个递归的过程,最终导致决策树,修剪和降低了噪声数据对分类精度的影响。总的来说,信息增益越大,越大的“纯洁”改善了使用功能分区数据集。因此,信息增益可以用来为决策树分区,选择属性,选择信息增益最大的属性。

信息增益是变化的量所需的信息,这主要反映了样本特征重要性的方法,还有一个两者之间的正相关:样本特征的重要性与获得的信息量的增加和减少。信息熵是用来测量信息的数量,所以我们定义熵 的数据(17]。

信息增益率和目的地信息增益将倾向于选择更大的信息增益的属性值。它适用于参数值信息增益的规范,这是计算如下(18]。 计算的公式,并在此基础上,获得率可以得到如下:

有许多算法生成决策树数据挖掘和几种典型的决策树生成算法如下突出显示。ID3算法是最具影响力的和典型的决策树挖掘,选择测试属性为每个nonleaf树中的节点通过一个基于信息理论的规则集,用熵作为分类的基础,最后将数据分为决策树的形式(18]。ID3算法的基本思想是使用信息熵作为衡量属性选择决策树节点;每次它首先选择最多的属性信息,即。,the attribute that can change the entropy value to the smallest, to construct a decision tree with the fastest decrease in entropy, so that the entropy value at the leaf node is 0 [19]。目前,实例的集合对应于每个叶节点属于同一个类。以来最高的属性获得的信息总是选择划分规则,快速算法分类数据,树的深度平均,规则很简单。ID3算法构造决策树的过程中很重要:属性确定和设置分区。确定属性的过程是选择的属性获取信息从所选数据的最大价值作为根节点,构造一个分支与这个节点的属性值将选中的数据分成几个不相关的子集;分支nonleaf节点之后,它将决定价值两倍的属性子集,然后继续分支,直到分支到叶节点。

机器学习中C4.5决策树分类算法,基于ID3算法,提高ID3的优点。该算法使用信息增益的概念或减少熵来选择最佳的部门,以更好地实现决策树的建设:(1)它选择基于信息增益率属性列,克服偏见的选择缺乏更多的属性值在选择属性的信息增益。(2)构造决策树。树上的树修剪过程完成施工过程。(3)连续属性的数据通过应用离散化处理。(4)树修剪建设也用于不完整的数据。ID3算法只能解决离散数据属性,但C4.5算法可以处理连续属性离散化,用下面的程序。

计算机模拟(数据可视化),顾名思义,是一个模拟的数据表示使用计算机图形学和图像处理技术来解释数据通过分析、转换、和图形模式(包括动画)在平面或三维形式,同时提供方法,理论,和交互技术20.]。它能帮助人们查看数据和数据之间的关系更多的视觉效果。阿特拉斯的计算机模拟是由大量的数据。每个数据项的基本单位是阿特拉斯,和每个属性的值表示的数据的多维角度,这样用户可以从不同的角度观察和分析数据,以更好地服务于用户,帮助用户做出决策。仿真技术是数据挖掘结果的抽象信息,用一个简单和直观的表达形式,加深用户的理解数据的含义,同时了解数据之间的相互关系和发展趋势。计算机仿真技术的特点如下。有强烈的与用户交互。用户不再是简单的信息,但是也可以接收管理、流程和开发数据。计算机仿真技术可以进行分类、整理和显示数据从多个视角。例如,用户可以查看数据时,百分比,排名和其他维度。 Users can view data and analyze it using simulation charts, histograms, line graphs, puzzles, etc. [21]。

科学计算模拟是指利用计算机图形学和图像处理技术来显示工程测量数据,通过科学计算,生成的数据和计算结果在屏幕上,将它们转化为图像。他们也可以交互地使用处理的理论方法和技术。科学计算数据的分类相对广泛,可分为结构化、非结构化的,根据不同的数据结构和混合数据或标量,矢量和张量根据数据类型。科学计算仿真技术在开发过程中面临两个难题:第一,分类对象数据的方式研究;第二,如何显示在屏幕上模拟对象实际和有效,让用户交互式地看待它。

2.2。评估设计高校体育教育的影响

模型建立是数据挖掘的核心,这意味着确定哪些选择构建决策树算法。算法的实现需要一定的编程工具。本文使用MATLAB工具构建决策树。有三个主要原因。首先,数据挖掘的研究内容的学习和应用模型和算法和MATLAB算法特别适合发展。因为MATLAB可以直接调用一个丰富的数学函数库来快速实现算法,根据算法的流程步骤,使用MATLAB编程工作量将大大减少计算需求时是一样的。MATLAB的语法比Python或更直观R,更容易的学习和编程算法。其次,MATLAB具有高效和丰富的科学计算功能,包括微积分、矩阵计算、符号计算、系统仿真应用非常广泛。第三,MATLAB本身就是一个程序开发工具与友好的GUI开发函数(22]。使用MATLAB学习深度算法的原理,然后动手编程的计算机程序部署到机器学习解决许多实际应用问题。使用MATLAB更集中,工具箱主要是用c语言开发的工具都是相互关联的,以及更容易开始如果你有或理解这个数据挖掘知识,然后应用这些工具,如图2

从上面的规则,通过分析详细规则的意义,一些教学策略可以调整出现的问题,如需要相对有效的教学方法在网络教学平台,是否强制或设置打开作业(作业认真学生开放,而懒惰的学生做强制性的作业),引导学生独立学习。其他方面,如out-of-province学生与一个贫穷基金会和学生有良好的基础也失败的考试,可以预测preintervention可以;良好的英语成绩的学生通常有一个积极的态度鼓励学习和专业学习。由于数据不完整和全面,结果只能为主要服务学生的地方建设的建议,但在某种程度上使学生学习有效性的评估成为可能。与不断深化新课程改革,课程改革正在稳步推进深度;逐步整合的新课程理念和课堂教学,我们取得了一些成就和积累一些经验在教室里。与此同时,许多问题常常出现在教室里,我们事先没有预料到,当我们必须想到一个好的策略,找到一个解决问题的好方法。

随着高校的发展和网络技术的发展,数据挖掘技术的引入,可视化技术等高校的评估信息管理系统将提供巨大的便利和工作效率。此外,通过数据挖掘技术来分析学生信息,你可以找到一些有价值的法律和因素影响学生的评估报告,因此更科学指导调整我们的计划和决策。数据库系统的设计直接影响到评估的质量和操作管理系统。的相对独立性,数据库的数据完整性和一致性,在数据库的设计。根据该系统的设计特点,传统的数据库处理机制大大不同于决策分析的需求,不能处理在线分析处理,因此数据仓库建立基于数据库的不同数据库之间的数据。的评价管理信息系统使用SQL Server 2012作为数据存储和管理的软件,本文只需要评估数据库的设计为例,旨在说明之间的关系数据表,数据库和数据挖掘功能和可视化功能。

2.3。绩效评估设计

当执行数据挖掘算法,提高学院的报告成功率,评估数据集作为研究对象;因此,决策树算法是用于分析的关键属性评估数据源可能影响报告率和确定因素最可能影响学生的报道,这些潜在的相关影响可以科学地应用于提供关键决策未来的评估工作。决策树算法的优点包括易于理解的分析、分类精度高,执行效率高,适合于使用决策树算法在挖掘大量数据。常用的决策树ID3和C4.5算法,但是这两个算法的选择是非常不同的分裂规则。ID3选择信息增益的分类标准,这是选择分裂属性,更多的属性值和它只能我的非线性数据。C4.5分类评价标准是信息增益率,也就是说,根据信息;因此,C4.5可以有效地规避ID3的问题。此外,通过比较分析在2.1节中,决策树算法C4.5的首选用于数据挖掘更好的属性因素,如图3

改进算法合并分支具有较高和较低的熵值,即:,branches where the division is not important, effectively reducing the fragmentation problem, improving branch efficiency, and limiting the impact of the overfitting problem. In contrast, this paper studies the promotion of assessment in universities, with diverse student sources, but the number of people assessed in each major is relatively small due to local and other reasons, so this requires a more balanced analysis of the diverse assessment channels and student sources, to prevent analysis bias. The improved C4.5 decision tree algorithm makes better use of memory space, balances the selection of information entropy, and avoids low or high information entropy caused by the human influence of competent factors, which is more conducive to a more accurate decision tree.

由于小数据量选择在训练集的选择,可能会有一些偏差得到了挖掘模型,然后训练集模型通过测试集验证来验证模型是否准确,以便挖掘模型可以进一步改进和修正,将会被分析的决策树分析系统模块的功能模块分析。

3所示。结果和分析

3.1。分析评估结果

发现更多的决策树基分类器,泛化误差越小。算法的准确率接近98.25%至8258%为一个基分类器。这是与CART算法的准确性。这表明决策树算法可以预测新数据比CART算法。

在图4,发现预测分类器的错误率降低;即。,the prediction accuracy rate is increasing. It is more clearly known that the algorithmic accuracy of the decision tree keeps improving with the increase in the number of classifiers. Evaluating the decision tree classification performance cannot be done by simply counting the accuracy of a single breakpoint, but it requires analysis of the classifier’s ROC curve, AUC value, and other metrics. The decision tree algorithm is used to validate predictions for 30.25% of the test sample and compare them with the true category. The ROC curve and AUC value are calculated and Figure5是获得。AUC值为0.7444,尽管中华民国和AUC指标提高了一点在购物车算法和决策树是更准确的。然而,这种算法的综合性能是否仍然可以改善实验还有待进一步探索。中华民国(接受者操作特征)曲线和AUC(曲线下的面积)值通常用来评估一个二进制分类器(中华民国的优缺点和AUC(分类)是这里讨论)。中华民国和AUC是用于评价模型预测结果在医学图像计算机辅助肺结节检测在过去。中华民国的特点和AUC简要介绍,以及如何让中华民国情节和计算AUC值更详细的讨论。

不满意的分析实验结果,数据集的分布,揭示了可能的原因。一个是数据不平衡数据集的问题。两分的数据集的目标变量分类比例为586:110(通过或失败)。之后,我们调整了目标分类比例407:258(指部门)训练,预测了30.25%的测试数据,然后进行ROC曲线和AUC值统计数据。达到了预期的实验效果。决策树算法能更准确地预测分类。然而,独立变量的属性的重要性不能被表示为清晰决策树。根据决策树的最重要的属性总结(专业成绩),删除该属性和再培训分类器后,测试集的虚假和真实利率可以获得中华民国曲线图计算6,AUC值为0.611,下降23.34%,显示该属性的重要性。同样,可以统计ROC曲线和AUC值通过删除其他属性决定的。通过这种方式,我们可以间接分析最重要的特征属性,影响目标变量。

最高的决策树算法的AUC只有0.8441,这是远离性能优良。最高的决策树算法的AUC只有0.8441,这是远离性能优良。但是,实际的分类应用程序在这个数据集可以更准确地预测分类和满足实际应用需求。

购物车和RF算法用于训练数据。首先,车模型作为一个分类器,购物车和分类器作为基分类器。训练数据使用随机森林算法和不同数量的基本分类器,导致四集成分类器和总共五分类器。新的数据表“数据”是使用每个分类模型,预测,预测结果与实际分类标签,如图7

结果表明,决策树(CART)和随机森林(RF)算法,通过构造一个随机森林算法基于车分类器,随机森林算法与不同数量的基本分类器集成提高了分类评价指标、真实的通胀率,precision-P, recall-R, F1值提高,模型的分类性能达到预期的结果。随机森林算法的准确性5-tree分类模型是0.981,0.991 0.99 10-tree分类模型,20-tree和100 -树分类模型。分类精度已达到理想的状态。对于分类器的综合性能ROC和AUC指标,比较已在前一节中,不会重复。

预测学生成绩的过程中使用分类算法,最终分类模型的性能不仅与善良和分裂属性选择的标准算法,而且收集原始数据集和数据预处理。分类和预测学生成绩的关键是需要过滤的主要属性,影响学生课程性能属性特征的原始数据,用这个影响因素作为候选属性集,并构造一个分类预测模型与学生的测试成绩作为目标变量。发现属性的一组原始数据可能不是很全面,可能缺乏的一些主要特征属性;然后,构造分类模型的准确性将不会很高。因此,该算法不是灵丹妙药;世界上没有完美的算法,需要收集和完善数据来实现它。异常数据的数据集也会影响模型的分类精度。它影响单一决策树模型,而集成组合模型是相对不容易影响,而且具有很强的泛化能力。然而,如果多个树被训练在相同的数据,也容易树有着密切的联系,影响是很坏的,这是所有相关的样本集和属性选择的选择。

3.2。计算机仿真结果的分析

根据系统测试用例设计方案,虚拟仿真实验系统的“人体运动能力评估和健身路径设计”进行了测试。48建立测试用例和测试报告如表所示1

其中,18岁的用户界面测试用例,20个功能测试用例,和10性能测试用例通过了测试率为100%,这表明,系统已经通过了应用程序测试,可以放入教学应用程序,如图8

系统的交互是虚拟仿真实验的基本特征。根据建构主义理论,保持良好的互动学习的过程可以有效地激发学习者的动机,提高学习效果。易用性是一个重要的维度探讨逻辑和科学虚拟仿真实验教学系统的功能设计,可提供重要指示系统的设计和优化。此外,生动的实验场景和简单易用的操作程序也有利于有效操作的知识学习过程,这是一种有效的实验传统体育教育的延伸。

系统的有效性的指标来评价体育虚拟仿真实验的教学效果。运动的虚拟仿真实验的目的是为了满足实际需要的体育实验教学,提高实验的教学效果。通过评估系统的实用性,我们可以清楚地了解学习者的知识的虚拟仿真实验,实际效果的评估提供了依据和教学意义的运动虚拟仿真实验教学系统。系统的动机是学习者的心理反馈在使用虚拟仿真实验系统。表明高水平的动机的学习者认识到价值的虚拟仿真实验的学习效果;另一方面,这也表明该系统可以深入挖掘学习者的学习需要加强他们渴望学习体育知识,这反映了虚拟仿真实验的指导作用在体育学习者。虚拟仿真实验教学在高等教育的发展是高等教育信息化的重要内容。本文指出虚拟仿真实验教学的必要性根据中国高等教育的实践,分析了当前虚拟仿真实验教学项目的问题,并提出了虚拟仿真实验教学的可持续发展机制项目。

应用程序功能和体育教学效果的虚拟仿真实验教学由李克特五级量表和评价统计分析的具体结果如图所示9。上述结果表明,测试对象是高度满意的虚拟实验“人体运动能力评估和健身路径设计,“平均得分4以上,这表明交互性的四维空间,可用性,可用性,和动力系统的相对较好水平,系统是测试对象的认可和赞扬。

评价反馈的交互性、易用性、实用性、和动机,我们可以看到,系统可以构建一个虚拟仿真教学场景中具有良好的交互性,使测试对象使用虚拟实验设备和仪器,自由,独立学习和探索体育知识和流利和提高他们的体育知识,实际应用能力,和学习动机。

本文两个决策树算法ID3和C4.5是用来选择同样的训练数据集来构造模型的学生报告情况,然后使用相同的测试数据集来评估这两个不同的模型的性能。表现最好的算法如图10

两种算法的准确性是根据公式计算精度评价指标,和图10表明C4.5的准确性明显高于的ID3算法。

4所示。结论

摘要CART算法应用于分析和预测学生的基本信息、课程考试成绩和电子学习平台学习行为特征。此外,车模型是基于改进的决策树构造算法来研究高校体育教育的有效性及其评价模型和计算机模拟研究。购物车标识规则关联学生学习因素,和一些教学策略可以调整,如需要有一个相对有效的教学方法在电子学习平台,是否强制或设置开放式作业指导学生自主学习。除了指导的重要性预见的建筑专业的学生和专业教学中,一定程度的评估学生学习的有效性可能会实现。有许多不同的数据挖掘方法,其中决策树和随机森林有非常广泛的应用和实际意义。这是因为他们理论上是清晰,容易理解,相对计算温和,非常准确。本文应用CART算法的分析和预测学生在体育教学有效性的评估具有重要意义。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称他们没有已知的财务利益冲突或人际关系可能出现影响工作报告。