文摘
先验的算法和DM技术介绍,检查,和之间的关系改善教师课堂教学质量、方法和手段进行了探讨。高等教育的学生成绩的评价体系和建立的基础上,提出了先验的算法。先验的算法也是为了进一步改善避免盲目搜索在挖掘和提高频繁项集的有效性。本文避免了多次扫描数据库,而是将整个数据库读入一个二维数组,从而提高程序的性能。该算法用于从数据库中提取有用的数据在高等教育管理中使用数据关联挖掘系统。根据实验结果,改进的先验的算法的精度可以达到94.81%,高于10.31%的准确性原始先验的算法。结果证明该算法模型的适用性和可靠性。经理在教学和管理,它可以是一个有用的参考。
1。介绍
高校教学无疑是教育行政管理的核心任务。这是一个至关重要的和必不可少的教学环节管理,教学质量是一个关键组成部分,链(1]。的日常管理和指导高校已经积累了大量的数据,但这些数据还没有充分利用2]。学校的管理这些成就还在简单的阶段的数据备份、查询和统计。同时,学校管理学生的成绩,有大量的信息对学生的成绩需要统计。教务管理系统已经积累了丰富的教学知识在这个时间3]。学术事务办公室的管理员无法确定课程从学生的学习成绩之间的关系,尽管这些信息已经形成了一个数据仓库和主要的大学入学率的增长4]。固有的信息隐含在这些数据没有被彻底检查或考虑大多数学院和大学,。大部分的教务管理系统中的数据是存储在数据库中,数据处理是限于简单的数据插入,查询,修改,没有充分利用信息技术。高等教育必须立即解决的迫切问题,将这些数据转化为信息,可以用来支持决策为学校管理员(5]。根据本文的论点,关联规则挖掘技术可以用来分析教学数据,识别有用的数据内的模式和规则,并提供一个客观的评估教学活动,提高教学的基础。
使用和DM(数据挖掘)技术的发展提供了良好的发展前景和坚实的帮助解决问题涉及数据统计分析。DM的应用技术在教育教学领域的很多,生产,和困难。糖尿病是一种决策支持过程,可以发掘潜力,从大量的日常积累有用的知识实际应用数据6]。利用DM技术有效地找到广阔的教育信息可用,给管理者有用的援助已经变得越来越重要。一种新的数据分析技术称为DM中提取有用的信息用于人类使用大量的数据在信息世界7]。人们越来越感兴趣的从这些数据中提取有用的知识在长期教学和管理积累了越来越多的数据。经理依据决策通过DM使用时结合当前使用的教学管理系统在学院和大学。关联规则挖掘在DM技术是计算机自动众多关联规则挖掘大量的真实数据。发现、理解和正确使用这些关联规则的一个至关重要的部分完成DM任务(8,9]。关联规则处理变长数据的优势,支持间接DM和预测计算消费(10]。先验的算法是最重要的一个布尔关联规则挖掘频繁项集的算法。先验的算法目前已成功地应用在商业和金融领域。本文发展高等教育管理机制和评估学生成绩基于先验的算法。其创新如下:(1)本文推测的算法介绍了关联规则分析学生的成就,发现前期和后续课程之间的关系,并使管理员能够根据市场变化制定教学计划和分析教师的教学成果,它提供了一个参考评估教师的教学质量。以帮助学术事务办公室更好地安排教学工作,促进教师的建设。(2)摘要先天在关联规则算法改进并应用于高等教育管理和学生成绩评估。改进算法用于分析教学评价数据样本,和用户交互的数据记录在数据库中用于挖掘频繁项集和最小支持度和最小的信心,和有价值的数据模式的分析结果。它可以挖掘课程之间的关系,并提供指导学生选择课程和学校合理安排教学计划。
本文将分为五个部分,每个部分的内容如下,根据它所包含的内容和要求的文章的结构:介绍,这是第一部分,主要阐述了课题的背景和重要性,提出了本文的研究创新和组织结构。第二部分是一个伴侣。本节探讨了高等教育和管理学生成绩的评估。本文的工作和研究。部分是在第三部分的方法。本节分析了先验的算法和使它更好。和高等教育管理提出了一个模型,衡量学生成绩的一个系统;详细描述的特定的实现策略。实证研究是在第四部分进行讨论。本节进行实证分析来确认评价体系的客观性和逻辑。 Summary and outlook for section5。本章主要总结了关键的贡献和创新在论文的最后阶段,确定了未来的研究方向。
2。相关工作
贾巴等人提出了一种改进的算法基于AprioriTid算法;与此同时,使用改进算法,挖掘影响性能的因素,为提高教学质量提供依据(11]。吴和高提出了一种改进的先验的算法来解决问题效率低下的先验的算法(12]。算法有机地集成了0 - 1编码和映射的逻辑与操作,有效地提高先验的算法的效率,并确保算法结果的准确性。它是一种有效的改进方法。西安等人之间的关联规则发现课程通过分析学生成绩数据库;通过分析学生的成就,教师之间的关系教育背景、专业职称,教师的教学效果是提取,取得了某些结果(13]。Aifeng等人应用DM技术教学评价。通过对这些数据的分析,发现,大学教师的教学效果与年龄、职称、教育、教师等,(14]。吴用DM中的关联规则算法来研究可能影响学生成绩的因素(15]。你们分析教学数据样本,发现现有的关系和规则,对教育和教学活动起着指导作用,为教学管理提供了合理、科学的决策支持,并提出进一步改进的建议的系统16]。品特等人指出的缺点传统的定性分析,定量分析,在教学评价和标准偏差的方法,应用关联规则挖掘在教学评价DM,发现老师的课堂教学效果和教师的教学过程和教学。之间的关联规则方法和手段(17]。Martinez-Garza等人避免内存之间的具体的和复杂的转换过程和外部内存和选择直接依赖于数据访问系统数据库系统本身的(18]。虽然不一定是最高的效率,实现步骤相对简单,可以实现更好的效率。Reddy et al .,基于关联规则挖掘的研究技术,把一个专业课程的成绩作为一个关系数据库和应用关联规则分析学生成绩我的课程之间的关系(19]。
本文深入研究了相关文献,并提出构建高等教育管理的模型和学生成绩评价机制。改进算法用于分析教学评价数据样本,和用户交互的数据记录在数据库中用于挖掘频繁项集和最小支持度和最小的信心,和有价值的数据模式的分析结果。它可以挖掘课程之间的关系,并提供指导学生选择课程和学校合理安排教学计划。
3所示。方法
3.1。先验的算法在高等教育管理的设计
在DM,关联规则挖掘是一个重要的一个。关联规则的作用是获取和保存大量数据通过各种方式,从堆积如山的数据挖掘有价值的信息。最基本的关联规则挖掘算法是先验的算法(20.]。先验的算法基于支持,创造性地使用修剪技术和系统控制候选项的指数增长。这个循环方法使用项集生成 项集。先验的关联规则挖掘算法包括两个基本步骤:首先,从数据库中挖掘频繁项集,然后基于频繁项集产生关联规则。在大型数据库中,有各种各样的它的字段之间的关系,这些关系是隐含在数据库中包含的数据。找到这些隐藏的关联从各种复杂的关系是关联规则挖掘的目的。先验的发现所有频繁项集通过多个扫描数据库,和只考虑所有项集在每个扫描长度相同。发现频繁项集一层一层地迭代是先天的关键和核心算法,可以通过修剪和连接项集。整个事务数据集扫描并与交易物品,预设的最小支持度阈值和事务项目支持低于这个阈值删除,叫做修剪步骤。
先天的高效率的关键算法是生成较小的候选项集,也就是说,为了避免不能频繁项集的生成和计算候选项集尽可能多。为了实现这一点,该算法利用这样的一个基本属性,任何一个频繁项目集的子集必须频繁项目集,和任何不频繁项目集的超集也必须是一个罕见的itemset。丢失有用的信息,而不是寻找规则可能都是由于过度的值;发现无用的规则,找不到目标,浪费系统资源,影响了执行效率,等等,可能是由于过小的值(21]。估计用户的目标是这些影响的关键。为了提高搜索效率的迭代法一层一层地并生成相应的频繁项集,算法的两个重要属性有助于有效地压缩搜索空间的频繁项集:(1)频繁项目集的任何子集也是一个频繁项集。(2)一个频繁项集及其所有超集也不频繁项集。然而,先天算法也有一些缺陷。算法的时间和空间主要在两个方面:(1)的生成候选集。当频繁项集长或最低支持很小,候选项集生成的连接操作是相当大的。(2)扫描数据库。反复和大量扫描数据库生成多个相应的候选集耗时和占用空间。先验的算法需要多次扫描数据库,即使一些短模式搜索的方式从FP-growth转换连接后缀,仍然很难适用于大型数据库(22]。增加数据库的大小,算法的时间和空间性能,尤其是对矿业长期模式,是急剧减少,大量的候选集生成。在先天的实现过程中,首先从数据库的东西挖掘频繁项集。强关联规则生成,基于频繁项集和测量的最小可信度和支持,并且必须满足预定的阈值的要求。最后,预期的生成规则。基于频繁项集生成在上面的步骤中,生成的规则仅包括项目集。基于中国规则的概念,只有一个条目右侧的每个规则。图1显示了先验的算法流程。
先验的算法包括两个步骤,即连接步骤和删除步骤。本文基于先验的算法,提出一种改进的先验的算法。它的基本思想是:将整个数据库读入一个二维数组,避免多次扫描数据库,提高程序运行的效率。删除“无用”的交易。最小可信度,这些规则必须满足最小支持度,所生成的频率集。相同的最小支持度,其预定义和频繁项集的发生至少,和所有频集发现算法的基本思想。与预定的阈值范围,如果项集在一个叶节点的数量太大,叶子节点是被转换成一个内部节点。功能子集需要搜索所有候选人包含在一个事务中 ,从根节点到叶子。原理如下:如果这是一个内部节点,通过哈希方法达到这个节点完成项目 ,然后哈希后应该处理所有项目在 ;和递归地应用这一过程在桶的节点。如果是一片树叶,有必要确定项集的叶子都包含在事务 ;让它指向的答案,并添加一个引用,以确保它正确点。如果是根节点,散列处理事务中的所有项目 。找出候选项集通过扫描事务,并生成候选项集,然后统计满足条件的候选项集,并删除不符合条件的候选项集的最小支持;生成频繁项集相互连接来生成新的候选项集。重复这个循环次,直到新的候选项目集是空的,最后确定频繁项目集,最大频繁项集。当一个事务不包含频繁项集的长度 ,它必须不包含频繁项集的长度 。因此,此类交易产生之前可以删除 频繁项集来减少扫描时间下次数组。因为删除数组需要很多时间,删除事务的操作并不真正删除数组元素本身,而是使标志表明,记录已被删除。
3.2。高等教育管理模型建设和学生成绩评价机制
数据库保存在学校的学术事务办公室,和教务人员可以使用校园网络连接和执行在线操作,比如添加、删除、更新和查询。通过网络,学校的学术事务办公室可以查看汇总数据和执行各种统计分析。用户可以获取必要的信息使用一个浏览器,从学术事务办公室和一些公共信息可能在校园网络上发表。为了组织高校整个教学体系,确保学生学习整个学年,甚至整个大学课程,很多课程必须集成和连接。结果,学生的课程应该以特定的方式组织,和许多课程应该是彼此相关的。系统管理、教学计划管理、成绩管理、学籍管理、查询,选课系统能够执行所有功能。DM至关重要一步是识别挖掘目标和对象。矿业目标应该是可预测的即使挖掘结果是不可预测的。要花很多的时间和精力来收集数据。学生的数据基本特征和学术进步必须聚集在教学过程中各种各样的方式。 The structure design of the higher education management model based on the Apriori algorithm is shown in Figure2。
为了确保业务系统的升级和更换在未来,数据仓库应旨在保护原有的投资。此外,未来的任何主题添加不能影响数据仓库的建设和原始数据库的应用系统,所以应该相对独立的业务系统和数据仓库。从算法的流程,可以看出该算法是基于数据库,所以我们必须首先访问数据库,发现成绩和课程之间的关系,以获得频繁集教学管理。一致的数据存储容器,存储数据的组合形成一个整体,但原本存在于多个数据源。这种方式是数据集成。数据集成可以统一模棱两可,含糊不清的,在原始数据或矛盾的地方。根据形势的需要,它还可以将两个或更多属性合并到一个属性的操作。选择收集的数据,并建立相应的数据库。数据库的建立是提供所需的数据挖掘关联规则,和教师的数据是存储在数据库中。通过设置参数,可以调整关联规则的挖掘结果,结果分析具有一定的参考。 The teaching management system uses the data acquisition and preprocessing module to analyze and gather a large amount of data, extract the data that is useful to the system and make some formatting changes so that the data can be used in the system. An association rule is an implication of the form ,在哪里
规则的支持度 在事务数据库中交易数量的比率包括吗和所有事务的事务集的数量,表示 。:
规则的信心 事务中设置是指包含的事务数的比率和包含的事务数 ,表示为 :
事务中,规则的信心 是 ,如果概率,既包含事务和是 ;这是条件概率 ,看到下面的公式:
项集的发生是独立的项集的发生如果
itemset的外观取决于itemset的外观 。的发生之间的相关性和是衡量
如果 ,有一个负相关;如果 ,没有相关性;如果 ,有正相关。相当于上面的公式
这也被称为“提升”的关联规则。
本文数据集成、数据选择和离散化主要用于数据预处理。首先,专业课程成绩的学生在同一个会话的一个主要是教学系统的从数据库中随机选择分数,并存储在数据库的访问。其次,删除不完整记录的访问数据库,并把成绩分成三个部分:0∼59、60∼79和80∼100。每个部分由离散字母表示,每个主题是由数字表示。在教务管理系统中,数据存储通常是全面、简单和异常值和零值等问题是不可避免的。这些无用的因素必须被移除在清洗过程中确保数据分析的真实性。如果数据缺陷影响正常执行数据的算法,应该相应地处理。如果这种数据丢失发现任务的影响很小,可以忽略,没有必要采用数据丢失的处理方法。预定义的数据流和控制流的任务都包含在工具箱窗口。控制流、数据流、事件处理程序,包括package explorer视图窗格中。 The control flow view provides a design environment in which the use of toolboxes and items related to the control flow can be used to build the control flow. Starting with improving the analysis efficiency, this paper puts forward an improvement scheme to reduce the calculation amount of the Apriori algorithm. It is mainly carried out from two aspects: on the one hand, reducing the times of scanning the database, changing the data storage mode, using a two-dimensional array to store all the data in the database, and deleting useless and redundant information in time to reduce spatial redundancy; On the other hand, based on the Apriori property, the candidate set is reduced, and the amount of calculation is reduced, thus improving the efficiency of the algorithm.
4所示。结果分析和讨论
的高校教务管理系统的应用大大减少了劳动力,减少很多不必要的人为错误,这样大量的数据信息可以保存很长一段时间,充分的利用。挖掘有用的信息积累的教务管理系统,学校可以调整相关设置不受欢迎的课程和受欢迎的课程,引导和鼓励学生选择补充课程在选择课程。这是有利于提高学生的综合素质,而且教学资源的合理分配。本章进行了仿真实验。在此系统中,使用一个特殊的数据服务器和应用程序服务器,主要是为了保证系统的安全与稳定。与此同时,本文使用高性能PHP技术来构建动态web页面。PHP是一种嵌入HTML语言,C、Java、Perl和PHP样式新语法。它不仅可以运行在不同的操作系统和支持几乎所有的数据库还具有良好的系统安全性,稳定性和可伸缩性。测试环境如表所示1。
在测试中,学生的成绩也有其不同的特征。表面上看,我们通常认为每个学生的学术成就是事务的一个项目。事实上,它不是。在这个数据集,交易的物品,也可以交易的元素,是每个学生的成绩的成绩。对模型的准确性,本文选择两个评价指标全面、系统地评估预测模型。包括MSE(均方误差)和梅(平均绝对误差)。每个评价指标的计算公式如下: 在哪里实际的价值和什么模型的输出值。MSE的比较不同算法如图3。美比较不同算法如图4。
原始数据应该尽可能真实和准确,即原始数据的质量直接影响DM结果决策支持的参考价值。先验的算法,每一步,候选人的这一步,和每个候选人的支持度计算,然后与预定义的最小支持度,以找出并确认的最大项目集这一步。算法的精度测试结果如图所示5。
在测试中,三组的支持和信心来测试算法。综合后的结果进行比较,结果数据的支持度1和信心度0.5最终采纳。比较评估精度的算法如图6。
先行词或先行词的关联规则在本文是成就,然后相关的因素成就了。这样,过滤可以删除许多关联规则与目标无关,和提高算法的效率。的过程中选择的数据集,数据的复杂性和普遍性的要求数量也考虑。课程相关的另一个在一个特定的顺序,所以把一个课程可能会影响你在另一个。可以分析相关课程,帮助学生选择课程和学校之间建立课程计划以一个合理的方式,挖掘学生的考试分数在各学科教学体系分数和数据库的挖掘隐藏在数据背后的有用的规则或关系这些大量的数据。信心度是0.6和0.2的支持程度。使用增强的关联规则得到先验的算法。结果部分关联规则如表所示2。
通过上述结果,可以得出结论,加强数据结构的研究有助于数据库原理的研究。其他规则也可以以这种方式进行了分析。根据挖掘结果,用户可以很容易地获得相关课程之间的信息,做出决策,并引导学生选择课程,这有利于学生更好地学习各种各样的课程。算法的运行时间图所示7。
从图可以看出7改进的先验的算法大大减少了数据库扫描的数量。基于逻辑和映射操作,它只需要扫描整个数据库的两倍,从而大大提高了算法的效率。分析和研究先天算法后,本文进一步改善它,使之更高效。本章实验结果表明,改进的先验的算法精度可以达到94.81%,高于10.31%的传统先验的算法。结果表明,该模型可以应用于高等教育管理和学生成绩评价机制,本文构造和算法模型具有一定的可靠性和实用价值。系统可用于分类和分析相关数据,这些数据有了新的价值,为高层管理者提供决策依据。
5。结论
许多领域已经成功地使用DM技术。DM技术应用到教学领域的教育系统可以解决现有教学体系的问题由于增长数据。学生的学术成就,在某种程度上,是教学质量的反映,也是高校教学工作永恒的主题。因此,大学教师和管理员一直感兴趣的方法来提高学生的学业成就和教学标准。本文进行一次彻底的审查有关文献,发展高等教育管理模式,建立一个系统来评估学生的成绩。先验的算法改进,进一步防止盲目搜索在采矿过程中,提高了频繁项集的有效性。根据实验结果,改进的先验的算法的精度可以达到94.81%,高于10.31%的准确性原始先验的算法。改进的先验的算法大大减少了数据库扫描的数量。基于逻辑和映射操作,它只需要扫描整个数据库的两倍,从而大大提高了算法的效率。结果表明,本文建立的算法模型具有一定的可靠性和实用价值。 In addition, due to the limitation of experimental conditions, there are still some problems in this study. The next step is to improve the efficiency of the Apriori algorithm, so as to better serve the higher education management.
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者没有任何可能的利益冲突。