文摘
最活跃和知识密集型大学,利用网络信息技术的前沿,教育、管理和服务模式的学校,和意识形态,学习方法,教师和学生的行为习惯将深刻影响的大数据的时代。当前高校学生管理的形式取而代之的太老了,需要一个新的管理系统。随着智能校园建设的促进,大数据技术的快速发展已经意识到高校学生管理的创新。本文以武汉大学的学生为研究对象。通过收集各种校园信息系统应用程序数据,K则算法在聚类分析用于分类的学生的校园行为特征,然后推测的算法用于关联学生的行为特点和他们的学业成绩。实验结果表明,消费行为有密切关系,工作和休息的行为,研究不同学生群体的行为特征,他们的学业成绩。使用这些分析的结果,大学可以采取差异化管理措施对不同类别的学生而言,这可以帮助提高学生的学业成绩以及进一步提高学生管理的效率。
1。介绍
有丰富的互联网应用程序,每一个学生和老师每天都生产各种数据。的数据量达到一定水平时,它可以以一种有意义的方式分析和挖掘,以及海量数据的分析将产生深远的影响,信息技术对教育的影响。与此同时,学校有越来越多的实时数据,为研究提供新的方向找到模式背后的原因。例如,学生所使用的校园网络平台交流生成大量的数据组成的照片、视频,对话,信息,电子邮件,每天等,这些数据反映出学生的思维、情感方向和行为动力学和包含丰富信息和常规内容。如何科学地存储、管理和后有效地分析和利用海量数据是非常重要的在大学的学生管理。
大数据已经成为了显微镜,通过它人们可以分析他们的想法并观察他们的行为,因为它超越的描述事物的本质,可以挖掘和分析具体量化人们的思想和行为的各个方面。同样,在高校学生管理不仅需要经验来指导它还科学引导。在这方面,如果高校学生管理可以更有效地使用数据分析问题和做决策,工作的质量将会大大提高。随着移动互联网的快速发展,学生们已经在使用更多的信息网络活动。例如,拍摄视频和音频和摄影广泛用于网路广播录音,发表在结合传统格式。这些异构数据源的信息数据之间的联系,获得在不同的形式,都是这么复杂,难以计数和描述在一个传统的、简单的方法。因此,科学合理的分析、整理和聚合的信息和数据,和显示结果的直观和decision-friendly形式已经成为高校学生管理的一个主要问题。
学生管理经常利用即时通讯设备如手机收集校园时事信息,了解学生思想动态,也产生大量的数据流,它反映了流经系统和数据显示动态数据的特点。了解学生的需求和反馈的最好方法是利用学生所产生的信息数据和分析他们的行为。最好的方式来理解学生的需求和反馈是使用学生数据来分析他们的行为,但其中一个问题是解决数据并将其存储在一个科学的方法。同时,信息数据的安全,这是学生的身心安全密切相关,也是必须考虑的一个方面,以确保学生的信息不泄露,不使用其他机构和恶意的人。
在大数据技术的不断进化的过程,大学智能校园建设的深刻变化对互联网和大数据,学生管理问题的同时,也在网络的影响下,越来越突出。无处不在的移动网络让学生通过互联网获取各种信息,同时不可避免地使学生研究不同程度的负面影响。例如,学生没有养成良好的学习习惯和生活习惯,使用手机看电视剧,玩游戏,和刷微博和跳吉特巴舞课程,导致课堂学习效率低,缺乏兴趣,学习新的技术和知识,学习的动机不足,偏爱中避难的投机和容易的选择(1,2]。
大学教育有三个主要的问题在新的信息技术环境。首先,学生没有足够的动力去学习主观。在大学的轻松的学习氛围,由于缺乏外部压力和有效的监管,很多学生经常缺课,早点离开,甚至沙漠类,这种情况大多出现在大一的学生,所以它也被称为新疾病。从长远来看,缺乏能源的输入会导致学术浪费。第二,学生学习不当。许多学生仍然保持他们的学习习惯高中天进入大学后,不适应新的教学模式,如蕴藏和翻转教室,导致一半的努力和一半的结果,导致他们的学习成绩不理想。第三,学生的学习障碍尚未纠正。这是由于老师的教学方法,以及学生的个人主观努力的缺乏。三种类型的情境:不想学习,不知道如何学习,和想要学习但不能学习,前两个占绝大多数情况下(3]。为了应对这些情况下,高校大学生迫切需要创新管理方法,促进精制和差异化的管理方法。大数据技术提供新思路的个性化管理和智能决策。
中国学者已经开始研究大数据技术的应用在教育领域和它带来的影响和变化4与研究成果,关注大数据技术的使用来分析学生的行为(5- - - - - -7和改变管理思想和模式8- - - - - -10]。然而,很少有研究成果发表在使用大数据技术来调整和区分大学生的管理。本文从大学生管理的角度来看,我们使用数字教育平台的数据探索隐藏信息价值和为大学生管理提供新的思路和方法。
目前,大部分的高校学生管理工作者能够调整他们的工作概念,方法,和方法及时和充分利用网络信息技术带来的便利的条件来提高工作的效率和质量。然而,在大数据时代,高校现有的技术手段只能分析少量的信息数据与相似的类别和结构形状和还不能收集、存储、分析、和想象现代意义上的大数据的结果,和数据分析技术还没有广泛使用,大多数员工不熟悉。此外,很难投入大量精力和财力在当前高校学生管理使用这种技术来分析学生的个人需求方面的学习和发展。同时,专业数据挖掘、整合、稀缺和分析技能。大数据的价值是不可否认的,但使用分析人才和技术的局限性使其难以完全实现数据的价值。
大数据时代的到来是不可否认的,和数据作为一个重要的资产正在改变政府和企业的决策模型。学生管理在高等教育必须面对的挑战这个改变,改变自己的思维,用所有可能的方法来充分利用大数据的价值,并提供多种对其工作的支持。大数据的时代需要更复杂的人才与数据技术技能。充分利用大数据技术的作用在学生管理中,团队需要形成与大数据分析技能。介绍的更具体的技术培训团队,掌握理论,方法和工具对大数据的数据分析平台,构建一个基于云的学生管理系统,通过实时跟踪和分析等。校园内部交流的论坛,了解和掌握学生的动态的思想,积极引导公众舆论热点问题和突发事件,学生讨论和关心,和维护校园安全与稳定。
从目前的团队结构的角度来看中国高校的学生管理,很难充实在很短的时间内教学力量与大数据技术的背景知识和学生的法律管理。因此,为了实现高校学生管理的挑战和创新的背景下大数据,本文收集校园信息系统中的各种应用程序数据,将学生的校园使用行为特征K则算法在聚类分析,然后使用先验的算法与学业成绩相关学生行为特点。实验结果表明,消费行为有密切关系,工作和休息的行为,研究不同学生群体的行为特征,他们的学业成绩。使用这些分析的结果,大学可以采取差异化管理措施对不同类别的学生而言,这可以帮助提高学生的学业成绩以及进一步提高学生管理的效率。
2。大数据的应用在高校的学生管理
在高校学生的管理,科学合理的分类,学生在学校行为,制定相应的管理服务方法对不同类型的学生,并提供个性化的支持措施可以提高学生管理和教学服务的细化,提高人才培养的质量水平。在大数据时代在互联网上,学生的一个信用卡消费数据,教室里卡考勤数据,本借款数据,和互联网访问数据可以动态地、准确地绘制出学生的行为特征和行为习惯隐藏在这些数据。
2.1。实验数据
摘要2021年武汉大学类的本科生作为研究对象,和行为数据四个年级的本科生学年被选中,和学生行为的研究变量特征和学生成绩,和特定的关系如图1。其中,消费行为数据主要来自于一卡系统,和工作和休息行为数据主要来自阳光考勤系统,一个卡系统,互联网身份验证系统。学习行为数据主要来自教学考勤系统,图书借阅系统,互联网身份验证系统。原始数据提取包括8426392消费流从一个卡,741904出勤来自阳光系统,和929088年的书《借贷流动。由于冗余和数据结构不一致,学生样本严重缺失的信息和数据处理一些异常值被消除后,最后一个示例数据得到的12904名学生。
具体指标规范学生行为特点和学生成绩的研究变量给出了表1。
2.2。使用聚类分析学生的行为K则算法
的K——学术Mac算法的女王在1967年,它是一个经典算法的聚类算法(11- - - - - -13]。的核心理念K算法则是找出K聚类中心 ,然后每个数据 ,通过不断迭代,尽可能接近集群中心 它所在,使数据不相同的集群尽可能远离对方。不同的计算集群中心根据聚类算法,和K则算法决定了集群中心基于集群中所有数据的平均值。
自K则算法总是收敛,K则可以达到一个稳定状态在一个有限数目的步骤,即。,聚类中心也不会再次改变(14- - - - - -16]。因为聚类中心的变化通常发生在前面的迭代过程中,为了优化算法的时间复杂度,迭代过程通常可以停下来,结果可以直接输出只有99%以上的数据点属于集群,不再改变。这种方法有效的降低了时间复杂度K——当处理大数据17,18]。一般来说,我们可以使用空间距离的倒数作为表达式计算相似度,见以下方程: 在哪里c代表了集群中心,x代表一个特定的数据点,代表了欧氏距离。在一个表达式计算欧氏距离N维连续空间中给出了(2),x和y两个点吗N维空间,代表的价值点x在我维坐标。
一般来说,集群中心集群中的所有数据均值或中位数,即。,(3),集群的集群中心吗和数据集群的数量吗 。
有两个不同的聚类结果K在相同的数据集,则可以判断结果比较的优越性SSE,小SSE表明一个更理想的结果。这是因为SSE表示小的和错误的数据,这意味着集群中心能更好地代表其集群中的所有数据。
聚类分析是数据挖掘任务的上下文中描述,特点是算法的输出不能描述的正确性或不正确,即。,没有唯一解。虽然没有唯一解对于这种类型的任务,其结果的评估是很重要的。
2.3。分析学生行为和学业成绩之间的关系在学校使用先验的算法
先验的算法是一种算法的挖掘布尔关联规则频繁项集(19- - - - - -21]。先天是布尔关联规则频繁项集挖掘算法是无监督学习的一部分,在机器学习(22,23]。有必要设置一个最小置信度约束关联规则的置信度。先天的核心算法的递归采矿过程分为两个阶段,第一阶段是找到所有的组合因素的高频数据集,第二阶段是发现关联规则,满足要求的所有频繁项集。公式支持(24和信心25)如下: 支持显示事件的概率和事件B同时发生的概率和信心表明事件B同时发生的发生事件A所示的两个信心水平的结果以下方程:
3所示。K聚类分析则
在数据集中和分析之前,他们是正常和无量纲。聚类分析被用于创建一个新的数据流和数据加工使用K则算法。
3.1。分析学生的行为
3.1.1。聚类分析学生的消费行为
根据聚类算法的评估标准,获得最好的集群效应是当集群的数量设置为5。集群学生分类结果进行分析,通过比较每个集群的意思是学生总体的均值指标根据学生消费的实际情况和注意H上面的意思是整个学生和指标l如下的意思是整个学生指标。学生消费行为的聚类分析的结果为每个集群如表所示2。
平均每月支出和相应比例的学生这一类图所示2。
(一)
(b)
数据平均每月消费频率和平均每月消费峰值图所示3。
数据2和3表明,学生消费行为的特征分为五类。第一组的学生每月最低消费水平和最低的每月消费高峰但消费频繁,属于低消费水平。第二组的学生有一个媒介每月的消费水平,但每月消费峰值高,花费更少。第三组学生中每月的消费水平高,高的月度消费频率和介质每月消费高峰。第四组学生的月消费水平最高,每月消费频繁,每月最高消费高峰。五组学生每月的消费水平很低,至少每月消费频繁,每月和低消费高峰。
3.1.2。聚类分析学生的工作和休息的行为
的K则算法聚类分析进行了饮食习惯,互联网的习惯,早醒的习惯,和体育锻炼习惯的学生工作和休息行为的指标。根据聚类平均标准,当集群的数量是3,每种类型的集群的学生的百分比的平均值指标如表所示3。
表3显示第一组的学生醒来早期经常每个月,更有规律地吃学校食堂,花更多的时间在线,经常参加体育活动。第二组的学生经常醒来的每个月,在学校食堂吃了不规则,花了最长的时间在线,很少参加体育锻炼。第三组学生醒来早期经常每个月,但经常在学校食堂吃,花更多的时间在线,和参与体育活动较少。
比较数据的定期在学生吃的次数,如图早起4。
比较的数据信息的时间在线和身体活动会话的数量这三组学生如图5。
3.1.3。聚类分析学生的学习行为
K则算法四个指标进行聚类分析学生的学习行为:上课、图书馆借阅的数量去图书馆,和长度的研究。学生的比例在每个类别的集群和指标的平均值如表所示4。
表4类别1表明,学生上课最高,借来的书少了,参观图书馆,花了大部分时间学习。第二类学生上课最低,借了最少的书,至少去图书馆,在最短的时间内学习。3级学生出席率最高,借来的书,经常去图书馆,学习的时间更长。第四组学生平均出勤率,借来的书少了,经常去图书馆,花更少的时间学习。在图所示的比较6。
3.2。学生团体的特点和管理的建议
通过聚类分析上述三类学生的不同的行为特征,我们认为不同的学生群体的行为特征可以作为对学生实施个性化管理的基础管理的大学生和实施个性化管理提出建议,总结在表5- - - - - -7。以下是一些建议。首先,针对学生在学校食堂支出差异很大,重要的是要特别注意学生花太多和太少和发展贫困的政策帮助经济困难的学生。其次,针对这一事实的学生通常花大量的时间在互联网上一学年期间,管理员应该有一个清晰的理解,在互联网时代,尽管它是更方便的从互联网上获取信息,而不是其他方式和学生越来越依赖于网络,一个合理的行为准则为学生在互联网上应该制定和学生的管理和监督应加强在互联网上针对学生的健康。第三,为了应对这种情况,学生们没有投资足够的在他们的研究中,很少到图书馆,借书籍较少,综合措施激励大学生学习应该制定,如卓越奖学金设立和开展阅读一天活动。
4所示。先验的算法分析
4.1。分析学校学生行为和学业成绩之间的关系
上述聚类分析划分学生的学校行为分为三类:消费行为,工作和休息行为和学习行为。为了进一步研究之间的关系学生的行为特点和他们的学术表现和发现是否存在不可避免的联系学生的行为特点和他们的学术表现,推测的算法选择进行相关分析和探索隐藏的相关性从大数据和模式。
执行之前推测的算法相关分析,招生指标数据和学术成就指标数据作为数据源。创建一个新的数据流在软件SPSS Modeler,先验的算法模型,及相关参数设置。在先验的算法模型中,学生收费行为的五种类型,这三种类型的休息行为、学习行为的四种类型,三种类型的学生学业成绩设置为前提,postecedent变量的关联规则。支持水平的10%和80%的置信水平的关联规则分析,共24关联规则。根据本研究的目标,高度大于1的关联规则选择通过消除和合并冗余规则,post-item是学生学业成绩的关联规则,如表所示8。
从表可以看出8第一个规则反映了,10.265%的学生人口的特点是不早起,饮食不规则,花很多时间在线,很少锻炼,82.423%的学生在学业低成就的可能。规则支持为8.461%,表明8.461%的学生在这种类型的行为是2型和学业成绩不佳。第二个规则反映了11.841%的学生人口的特点是低每月消费,消费峰值低,低消费,并且经常早起,饮食不规则,花更多的时间在网上,和锻炼少,83.246%的学生在这一类可能平均学习成绩。9.857%的规则的支持表明,9.857%的学生在这一类消费行为类型的5日休息行为类型的3,平均学习成绩。第三个规则反映了53.156%的学生特色是早起的,不规则的食客,花更多的时间在互联网上,和锻炼少,84.068%的学生在这一组可能的平均成就。44.687%的规则的支持表明,44.687%的学生在这种类型的行为类型3,平均学习成绩。
第四个规则反映了23.683%的学生平均出席,很少去图书馆,书低借贷,学习时间短,早起床,经常吃东西,长时间上网,和经常性的锻炼可能是平均80.366%的学术成就。相比之下,19.033%的规则的支持表明,19.033%的学生在这一类行为类型的4的一项研究中,一种休息和放松行为1,平均学习成绩。第五规则反映了学生,10.308%的人口的特点是早起,更有规律地吃,花更多的时间在线,定期锻炼,经常在课堂上,经常去图书馆,借更多的书,学习的时间更长,81.343%的学生在这个类别可能会在学业上做得很好。相比之下,8.385%的规则的支持表明,8.385%的学生在这个类别1型休息行为和3型研究行为和学业表现良好。详细比较分析关联规则的数据显示在图7。
大数据技术的使用对学生进行分类成不同的行为特征可以方便管理员进行有针对性的干预和咨询为不同类型的学生团体,这有利于大学生个性化的管理,进一步提高高校学生管理的效率;它可以提醒管理员特别关注那些学习成绩差的学生团体由于高概率事件和发展相应的学生管理系统。研究还发现,早晨锻炼是提高学习成绩的好方法。早期研究还发现,定期锻炼,有规律的进食,书借有助于提高学习成绩。相反,学生缺乏良好的工作和休息的行为更有可能学习成绩差。
4.2。大数据技术的创新管理的大学生
通过K——聚类分析和推测的相关分析,聚类结果的学生的学校之间的相关规则的行为和学生的学校行为,他们的学业成绩。这不仅与学校学生日常行为与他们的学业成绩也是区分不同组的学生具有不同特点。基于学生的行为数据的聚类分析的结果,大学可以为不同类型的学生团体开发差异化的管理措施,进一步提高学生管理的效率,促进高校学生管理的创新。(1)大数据技术的使用可以改变学生管理模式从个性化管理的统一管理。在当前的背景下,高质量的高等教育的发展,大学生的传统的管理模式已经不能满足时代的需要。在信息技术的背景下,大学的智能校园建设是变化的一天,学生获取知识和信息的方式变得多样化,他们收到越来越多的来自外部世界的信息。通过大数据技术,大学可以掌握学生的行为习惯在日常消费中,工作,休息,学习,等等,了解不同学生群体的个性化需求,并制定相应的管理措施,以便学生管理模式可以改变从统一管理个性化管理。这将会改变学生的管理模式从个性化管理的统一管理。(2)大数据技术的使用可以改变学生管理从被动管理为主动管理。作为人才培养的摇篮,大学需要跟上社会的发展。大学是一个卡系统,数字校园系统,学生教学系统,图书借阅系统,考勤系统,阳光和其他应用程序为学校管理提供了丰富的数据资源。通过挖掘这些数据,我们可以获取信息的学生在大学的学习和工作习惯,从而改变学生管理工作的方式试图解决问题后,他们会主动发现问题,立即解决潜在的问题或设置提前预防。例如,在学生管理、个人学生行为特点但没有发现异常,常常会导致的后果在他们被发现之前,而使用大数据预测算法可以预测和检测异常行为的学生时间和由导师安排早期干预,从而改变学生管理从被动管理为主动管理。(3)大数据技术的使用可以使学生和学生管理性能的评价从单一向多元化转变的方法。目前,学生和学生管理绩效的评价主要集中在学业成绩排名,这在某些方面是片面的。首先,评价方法和指标的设计不是很合理;另一方面,评价者和学生之间存在严重的信息不匹配,,是不可能掌握学生的日常表现和努力水平在学校系统地通过有效的技术手段。大数据技术的使用可以收集数据的行为他们的学校生活和学习的大学生,可以分析类的学生的行为,成绩,甚至整个大学,以便全面、系统地评价学生的学校生活和学习以及学生管理工作的有效性,从而改变学生和学生管理工作性能的评价从奇点的多样性。
5。结论
针对当前高校学生管理的团队结构,很难填满一个教员与大数据技术的知识背景和学生管理的法律在很短的时间内,所以有必要充分发挥学生管理大数据技术的作用。在本文中,我们选择不同类型的行为数据的校园信息系统四个的武汉大学2021级本科生一个学年,用聚类分析对学生进行分类的行为在学校特点和分析之间的联系学生的行为特点,在学校,他们的学业成绩。实验的结果发现,消费行为有密切关系,工作和休息的行为,研究行为,以及学业成绩不同的学生团体,它提供了一种依据学校采取差异化管理措施对不同类型的学生,并在此基础上,建议给出改进学生管理方法通过使用大数据技术在智能校园建设的背景下。高校应充分利用教育信息化建设的成就和处理大量的数据信息通过大数据技术和信息化手段,提供丰富的数据支持学校决策和发展。
数据可用性
在当前的研究中使用的数据集是可从相应的作者以合理的要求。
的利益冲突
作者宣称没有利益冲突。
确认
这项研究得到了辽宁省教育部青年项目(项目没有。2017年lj2017qw001)。