文摘
高等教育质量保障和改善大学的建设和发展是一个永无止境的主题。大学教学质量包括体育教育教学的质量。体育教育的独特关注需要教学质量评估工具的使用。在本文中,我们提供了一个决策树算法对大学体育教学质量评价指标体系。系统的评价指标和体重评估体育教学的质量是决定采用专家咨询法和层次分析法。换句话说,讨论数据挖掘理论,本文侧重于决策树算法流程和结构。开发一个决策树模型建立体育教学质量评价系统,修改后的C4.5算法应用于从125名教师课堂教学评价数据,并验证了模型的正确性和适用性。当一切都说了,该做的也做了,它突出了关键决策属性,影响体育教师是如何评估,基于这些发现,它提供了一些合理的建议。
1。介绍
当讨论教学质量评价方法,我们谈论的是屏幕上的一个好方法,确定评价指标以及收集、分析和解释评价数据。这是最重要的因素在确定有效的体育项目。作为他们的“研究评价体系的高校体育教学质量,”毛“亲和图”技术用于基于一个理论创建初始评价指标来评价高等教育教学质量。分析指标之间的关联关系利用因子分析方法,和衡量指标是使用层次分析法来完成的。层次分析法,通常称为AHP,决策是一个强大而简单的方法。AHP抒发排名偏好选择和权重偏好属性使用范围从1到9;更高的分数表明更大的相对偏好。层次的相对排名被组织在一系列矩阵和整体排名通过线性代数程序派生而来。综合评价决策支持系统进行了初步分析,和教学质量评价管理系统开发。决策树算法是用来创建一个模型,预测目标变量的值,它使用树表示法来解决问题,叶节点对应一个类标签和属性在树的内部节点表示。 For two consecutive years (four semesters), the system was used to assess the quality of teaching at Tianjin University, and the results were generally positive [1]。另一项研究发表在同年,题为“决策树技术的应用研究在体育教育质量的评价,“利用决策树技术在数据挖掘系统调查当前体育教育质量评价系统。你应该提出一个健身项目评价方法使用决策树技术,确保健身项目更公平,合理,有效的(2]。学生学习结果反映在各种各样的目标元素构成体育教育的质量,根据余Sumei 2014篇文章,“三一目标系统的策略,以促进体育教育的质量。“体育是一分之三的目标系统,旨在提高学生的身体健康,同时也教他们体育技能和培养一个积极的态度。如何更好地实现这些目标可以从如何提高教学的质量。几项研究已经发现很强的相关性之间实现物理健康促进的目标和决定一节课的内容,确定教学目标,选择教学方法。此外,加强运动技能的重要和困难的方面,安排一个合理的教室,并提供适当的评估都是与掌握运动技能的最终目标(3]。
由于学院和大学物理教育的系统性和复杂性,我们必须首先采取一种全面的系统的评价内容,并确保评价内容在评估过程有一个明确的优先级;其次,我们必须尊重每一个专辑的过程中评估。集中决策和判断的形成是基于意见。最后测量的客观性,定量评价是经常使用。定量评估,另一方面,将无法完全捕捉体育教学的现状。很多变量都难以确定。大学体育教育质量评估在未来将以混合定量和定性的评估方法。
2。相关工作
最重要的一个研究领域的数据库知识发现和数据挖掘。世界各地的人们已经开始意识到它的重要性。数据仓库提出了Inmon, w·h·早期阶段的数据挖掘和数据准备成功的解决了这个问题;美国政府制定了sequoia2000项目作为大型数据库(数据分析工具4]。弗里德曼成功刺激的兴趣开发、应用和研究数据挖掘在1997年,导致出现超大数据库。这个商业机会被大量的商业企业。银行和零售行业,例如,使用业务数据(5)为了更好地理解和掌握顾客的声誉、习惯和消费心理,然后根据需要调整自己的市场策略来最大化自己的收益。概念学习系统是第一个使用决策树技术,为未来的决策树学习算法奠定了基础。在1970年代末,昆兰提出了臭名昭著的ID3算法。ID3代表迭代二分3和命名等,因为算法迭代(反复)二分(分裂)功能分成两个或两个以上的组在每一步。属性分类是用来确定分裂属性利用信息熵的概念理论第一次在这个算法。在处理大型数据库问题,该算法有明显的优势。然而,也有一些明显的缺陷。选择分裂节点时,属性值优于单个值。
昆兰后改善了算法和想出了C4.5算法,这是广泛使用的今天。C4.5通常被称为一个分类器。使用C4.5算法在数据挖掘决策树分类器,可以用来生成一个决定,基于一定的样本数据(单变量或多变量预测)。选择分裂属性,C4.5算法使用信息增益率估计,弥补了ID3算法无法处理连续属性和缺失值在很大程度上。在1990年代末,梅塔等人提出了SLIQ分类算法,快速和可伸缩的。SLIQ决策树分类器,可以同时处理数字和分类属性。它使用一种新型预分类技术在树木生长阶段。SLIQ还使用一种新的《砍树砍出算法是便宜的和结果在紧凑和精确的树木。这些技术的结合使SLIQ为大型数据集和分类数据集规模不论数量的类,属性,和例子(记录),从而使一个有吸引力的工具,数据挖掘(6]。
SPRINT算法,提出的沙佛et al .,是可伸缩的,平行的决策树归纳算法类似于SLIQ [7]。SPRINT算法是一种经典算法建立决策树是一种广泛使用的数据分类方法。然而,SPRINT算法具有较高的计算成本的计算属性细分。这个算法是不受限制的内存。但也有一些缺点。例如,寻找最佳分割点的离散属性需要大量的计算,和连续属性的划分不合理。公众提出的算法Rajeev和Kyuseok“集成构建和修剪”的角度8]。雨林算法后来提出的耶尔克等人充分利用内存资源。中国的数据挖掘研究落后其他国家。在这个领域的研究最初是由中国政府支持的1993年国家自然科学基金。清华大学目前与中国科学院,复旦大学等国内知名高校开展基本理论和应用数据挖掘研究[9]。由于这些发现,我国在这一领域取得了快速的进步。决策树在我国已被广泛的研究,可以找到,结果在以下领域:一个目标是提高精度。第二步是削减选项的数量。第三个选项是使用其他技术结合你自己的。软件是第四步的实现。其中一个研究方向是实现决策树softwareization。在我的国家,使用数据挖掘技术在高校教学管理的发展逐渐[10]
本文的其余部分是根据以下组织模式。方法是在部分讨论3。实验和讨论下提到的部分4节中,《华尔街日报》的结论5。
3所示。方法
3.1。决策树技术
3.1.1。介绍了决策树
决策树是一种归纳学习方法,使用一组无序和不规则的实例来推断的分类规则表达式的形式决策树(11,12]。决策树是一个树状结构,它有很多的相似之处与流程图由普通人。每个分支节点对应于一个特定值的属性,而且每条路径从根节点到叶子节点是一个规则的目标变量。所以实际上,整个决策树想要表达是一组析取表达式规则。
3.1.2。建立决策树
决策树的生成是一个逐步细化的过程,循序渐进的训练集,分裂的过程就是从上到下,从树的根逐渐增长。首先,根据一定的分裂属性作为评价标准,在原样品最优属性数据集作为根节点的分裂属性。与此同时,相应的最优分割点分裂属性选择分支的边界。然后,初始样本集分为若干个不相交的子集根据选定的列属性和分割点,形成不同的分支节点。分裂每个生成的子节点以同样的方式,直到所有的叶子节点生成(13]。
3.1.3。属性选择度量标准
属性选择度量是一个选择分割标准,它占据了核心地位的过程中决策树结构。决策树ID3算法使用信息增益”作为属性选择度量(14]。信息增益的定义如下:
让是一个数据集组成的样品,这属于不同的类别。假设是类的样本的数量吗 。然后,样本的信息价值的定义如下:
让属性有值。使用属性将数据集成子集 。然后,生成的信息价值除以样本集与属性是:
属性的信息增益代表了信息价值减少分裂属性的数据集 。
决策树C4.5算法使用“信息增益率”作为属性选择度量(15]。信息增益率的表达式如下:
3.2。等级秩序和一致性检查
3.2.1之上。层次单排序
层次单排序的最大价值是计算每个判断矩阵的特征值及其对应的特征向量得到层次单排序和获得的数据序列重要性指标层对目标层。获取最优决策,具体步骤是首先要解决的最大特征值的判断矩阵 ,然后,用公式 。解决了特征向量对应于 。标准化后,的排名权重对应元素的相对重要性在同一水平的一个因素之前的水平(16]。
3.3。一致性测试
一致性测试是用来评估必要的,但不充分方面的鲁棒性。一致性起着至关重要的作用的抗压强度测定混凝土或混凝土和易性试验。
这是测试的一致性矩阵。虽然不可能要求所有的判断是完全一致的,判断应该大致一致。因此,有必要检查的一致性判断矩阵。首先,计算一致性指数的矩阵 。
在上面的公式中,判断矩阵的顺序。当完全的一致性, 。置信区间越大,矩阵的一致性就越低 。测试矩阵是否具有满意的一致性,这也是必要的比较C1的平均随机一致性指标RI。判断矩阵的顺序1 - 9,RI,如表所示1。
对于1和2阶矩阵,RI是正式的。当大于2,由矩阵的一致性 , 。当 ,认为判断矩阵有满意的一致性;否则,必须调整,直到有一个令人满意的一致性。
3.4。一致性检查和层次总排序
3.4.1。一致性检验
评估的一致性测试的总排名等级,需要计算的索引的一致性测试。CI是一致性指数。国际扶轮是平均随机一致性指数;CR是随机一致性比率。
的公式,层的一致性指数吗对应于 。
的公式,平均随机一致性测试的指标层对应于 。
同样的,当 ,认为总排名的计算结果具有满意的一致性。
3.5。数据收集
3.5.1。集合对象
随机选择25某所大学的教师为研究对象。其中,25年龄段的体育教师选择每个学校都应该涉及年轻、中年,和老;标题和水平应该包括助理,讲师,副教授,教授;度应该包括医生,硕士,学士。此外,对于每个老师,35个学生被随机选择基于教学类。使用教师体育教学评价形式对教师进行评估。
3.5.2。收集数据
项目的调查方法的研究过程主要是问卷调查的方法,主要包括发行和复苏的问卷。问卷项目的问题随时可以回答和解释提高问卷的准确性和完整性。问卷的收集应达到一定比例,一般应不少于70%的发行数量;否则,它将会影响信息的代表性。总共有3824名学生在这个调查问卷分发。3658张被找到,其中3371是有效的调查问卷。
3.5.3。数据处理
它可以从相关的文献和资料,总结教师的素质,包括他们的教学年龄,学历,职称,和班上学生的知识基础,也影响老师的课堂教学的质量在一定程度上。以确定它们之间是否有关系,这部分的信息也添加到输入属性的决策树。因此,数据集成需要预处理。老师的基本信息表中的信息JSJBXX和表JSKTPJ从学术事务办公室是综合,获得结果存储在表JSPJXX(教师评价信息)。
本章主要描述了设计过程的教师课堂教学质量评价指标,以及数据收集和处理的过程。首先,采用专家咨询法,利用专家的专业经验和知识,和原来的指标修改的方式征求意见,最后,高校课堂教学质量评价体系的建立。
4所示。实验和讨论
4.1。建立决策树模型对课堂教学质量评价
使用决策树C4.5算法,预处理表JSPJXX(教师评价信息)作为训练样本数据集建立决策树模型,大学教师课堂教学质量的评价和提取分类规则。具体步骤如下:(1)分类属性的信息熵的训练集。首先,用公式计算训练集的分类信息熵,然后,利用信息熵计算每个属性的信息增益率。在训练数据集,样品的总数是80。其中,样本的分类属性的数量是23日,样品具有良好的分类属性的数量是25日,样品合格的分类属性的数量是23和分类属性很穷,和样品的数量是9。根据公式(1),我们可以得到以下: (2)计算信息熵除以每个属性值的子集。首先,取子集信息熵的计算的“教学时代”属性作为一个例子。为教学年龄属性有三个值,这里有必要计算每个属性的子集的信息熵值。“教学时代”是“高”,有7个数据样本优秀课堂教学表现,6为良好的课堂教学性能数据样本,3个数据样本性能合格的课堂教学,课堂教学表现不佳和0。计算公式(2):
建立决策树的根节点。根据上面的计算,每个属性的信息增益率的顺序如下:学生basics-teaching effect-teaching attitude-teaching method-degree-professional title-teaching age-teaching content-basic skills-emotional态度和价值观。根据C4.5算法,以“学生基础”最大的测试属性信息增益率作为决策树的根节点的计算结果是最好的分类。因此,“学生基础”是用作测试属性构建决策树,和决策树的根节点被标记为“学生的基础。学生的基础“的两个值:优秀的和一般,相应的子集,分别推导和相应的分支机构,和上面的方法也用于每个子集划分成树枝,如图1。
4.2。修剪决策树
可以看出,最终的决策树规模太大,这表明决策树的训练数据太低,时间相对较长,并且有长和不平衡的分支。在实际使用中,目前尚不清楚这是主要的结果,这使得它很难理解,使加工过程变得复杂。因此,我们需要正确prun决策树。在这里,我们使用postpruning方法修剪决策树(17- - - - - -20.),以克服低的问题决策树的可理解性和适用性。决策树剪枝的本质是替换子树的叶子节点。如果一个决策规则检测到子树的误分类率大于单个叶片的误分类率,它需要被替换。
4.3。分类规则的测试
本文使用50测试数据进行评价和比较。结果表明,合理数量的体育教育质量的评价研究方法制定的决策树算法是46岁的和不合理的号码是4。比较图所示2通过率是92%,如图3。
它可以被比较测试,发现上面构造的决策树模型的预测精度很高,表明决策树模型的建设研究是非常合理的。与此同时,如果收集到的数据样本量足够大,准确率会进一步改善,将会有更高的使用价值在实际的应用程序。
本文采用决策树C4.5算法,使用SQL Server来建立一个数据库,连接在MatLab建立了一个决策树模型来评价高校体育教育的质量,并使用postpruning prun决策树方法。更好地挖掘其潜在的法律,决策树也被修改,主要是通过添加句子算法和合格的统计数据的记录添加到叶节点。然后,提取相应的分类规则。测试后,分类规则有一个高准确率和一定程度的适用性。最后,提出了一些建设性的意见和建议基于实验的结论。促进质量的提高高校教师的体育教育,协助有关部门进行相关决策工作的质量保证高校体育教学。它有一定的实用价值的研究大学体育教育。
5。结论
近年来,决策树算法已应用于社会的各个领域。例如,它最初是用于军事科学研究,后来逐渐发展成为各领域,如医疗服务、商业金融、零售。决策树算法的应用在大学体育教育在我国正逐渐扩大。根据目前的趋势,我们可以认识到在教育决策树算法的应用已经开始,但它并没有进一步的提升。我们要做的是继续深入研究基于以前的工作。基于质量的大学教师的体育教育,本文使用C4.5决策树算法在数据挖掘技术构建决策树模型,研究大学教师的评价方法物理教育质量。结果表明,它是可行的。在接下来的工作,有必要增加促销和提供可行的建议为大学体育教育通过这种方法。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突。