文摘

大数据是时代发展的产物,影响社会发展的方方面面并整理到了大学思想政治网络系统。大数据的发展带来了新的机遇和挑战,NIPE(网络思想政治教育)的大学体系。因此,大学应该注重思想政治网络系统中的数据。NIPEDM服务平台的开发,结合了现有的基于网络的PC和移动开发技术,找到一个新的教育DM(数据挖掘)路径。使用分类器预测学生的未来表现,一个新的NB_BPNN(天真Bayes-BP神经网络)模型,提出了有效地结合了两种现有模型的优势。实验结果表明,新模型取得了好成绩在学习领域的评估。

1。介绍

随着信息技术的发展(1),它已经进入了大数据的时代,它的特点是大量的信息数据,丰富的多样性,和快速的数据处理。在这个时代,大学NIPE(网络思想政治教育)有很大的发展空间和机遇。与此同时,我们应该与时俱进,把握大数据的优势,不断改善和发展大学NIPE系统。因此,大学NIPE必须找到工作的想法和目标服务学生的成长和发展,建立以学生为中心和面向服务的概念,和服务学生的成长和发展。我们必须加强大学生思想政治教育,以建立一个高质量和独特的大学(2]。传统大学NIPE管理大数据时代的深入发展既是挑战,也是机遇。目前,有一个新的趋势在大学NIPE管理(3]。

随着科技的迅速发展,信息的流动变得越来越光滑,和人们的交流是越来越亲密。大数据是这个时代发展的结果。收集、组织和分析大量的数据在一个短的时间内被称为大数据。NIPE业务在大学正面临着新的危机和挑战在大数据时代,需要更深入地理解和分析。新时期的教育和高校管理和加强NIPE管理都与提高思想政治教育的适宜性和有效性,以及它的吸引力、说服力和培训。“四个新人才”的形成在大学NIPE提供了保障基本任务的成功完成4]。李等人说:“学校可以积极发挥集体教育的力量,充分发挥民主管理的作用,提高学生的自我管理能力,实现有效的教育和管理,使学生达到协调和统一”5]。徐注重人本管理思想和更多的关注学生的主观价值判断和行为选择的理解(6]。通过各种价值观的评价和解释,Gurcan和Cagiltay阐述了信息技术和互联网的影响力和价值在时间和人们的生活7]。女士和其他人认为,思想政治教育科学学院主要涉及五个方面:领导、规划、控制、评价、和管理创新8]。张等人认为,大数据是实现目标的前提和扮演的角色预测,指导和控制(9]。

NIPE工作是教育者和教育材料之间的合作努力。大学我们可以有效地指导有序进展NIPE NIPE大学的项目,如果我们加强研究方法。加强大学NIPE NIPE方法研究课程有利于平等NIPE工人和大学生之间的交流,以及改变大学生单边洗脑的习惯。加强大学NIPE水平的有效性。本文系统地介绍了大学的思想和观点NIPE系统从全球的角度来看,进步的概念细化管理和系统的促进大学NIPE和丰富了大学NIPE理论。改善和提供一个理论依据大学NIPE实践和NIPE。

创新:(1)基于内涵的理解大数据的时代,互联网被认为是一个重要手段来解决高校NIPE管理问题。利用互联网,NIPE管理在大学可以成为一个动态的、开放的操作模式,提高业务时效性,成功完成NIPE的目标和任务(2)在本文中,我们使用监督学习方法作为分类器的基本模型,提出基于NB NB_BPNN和摘要模型。模型取得了好成绩在学生行为评估

这个主题篇章的结构如下:

第一部分介绍了研究的背景和意义在继续之前的主要工作。第二部分着重于教育DM技术。第三部分概述了研究的具体方法和实现的方法。第四部分建立了研究模型的优越性和可行性。全文的总结和前景提出了在第五部分。

2.1。NIPE的研究现状

大学的探索阶段NIPE方法论概念的研究正在进行中。平等互动、虚拟环境和现代开放,根据鲁宾et al。10),是NIPE的主要方法。大学NIPE方法综述了Shadroo和压力如下:信息,信息隐藏,话题互动,虚拟现实,线上和线下的教育方法(11]。张提议,首先,所有教师和学生了解大学NIPE;其次,坚定立场和建立概念;第三,管理转型得以实现;第四,义务教育不引入的概念,概念指导实现(12]。应该进行持续改进和完善的过程中形成了NIPE系统,根据王et al。13]。最重要的一点所谓的在线NIPE根据Sumalatha Subramanyam在线心理教育14),除了网络道德和理性教育。根据Mapca et al。15),当前NIPE学校的网络是受到以下问题的困扰:首先,内部系统是有缺陷的,教育资源短缺;第二,网络平台促进虚假信息的传播,而缺乏严格的法律和法规限制网络相关法律;第三,西方思想逐渐影响了大学生的自尊,和外国人的概念及其崇拜开始蔓延。

综上所述,可以看出,存在重大缺陷NIPE在线。首先,从沟通的角度来看,大学还没有做深入的研究和研究中出现的问题网络思想政治教育的发展。第二,没有相应的解决问题的办法。你会发现大学仍然需要不断探索的问题和解决方案,找到一个更好的突破。

2.2。DM在教育领域的应用和发展

领域的教育、DM(数据挖掘)是一种相对较新的信息处理技术,及其应用和研究尚未成熟。这种技术的持续进步领域的教育,许多大学员工已经开始应用DM技术等许多系统教师管理、教师评价、个性化的培训,课程结构的合理化,从而提高高校的有效管理,发挥了突出的主导作用显著提高教育水平。

在近几十年来迅速DM技术先进。一般来说,有很多领域的国际研究DM,结果非常令人印象深刻。金等。16)提出了一个Apriori-based DM方法。提出了一种改进的NB朴素贝叶斯模型由布劳恩et al。17]。杨和他的同事们增强现有的摘要(BP神经网络)算法和应用DM技术。比较的结果表明,改进的算法可以提高数据分类和识别能力18]。Jk和木菠萝开发了一种滑动窗口模型K-medians聚类算法(19]。构建学习者的能力DT,马吉德等人利用ID3算法,将其划分为DT(决策树)20.]。公园和他的同事开发了一个基于关系演算和可变精度粗糙集模型进行了初步分析,学生的表现(21];谢等人利用先验的关联规则算法分析的关键因素,导致学生接受优秀的专业学位课程(22]。

当然,仍然有一些问题在DM教育在现阶段的应用。有大量的学生在大学的信息数据,但与此同时,教育工作者获得的有价值的信息是非常稀缺的。因此,教育工作者需要做什么现在是进行广泛的筛选和大量的学生数据的深入分析,从而获得有价值的信息,可以指导教育决策和教育体系的发展。我们在这方面还有很长的路要走。

3所示。方法

3.1。NIPEDM服务平台

现有的信息系统在获取信息比较慢,落后,和有很多的信息传输渠道,但它是复杂和不平衡。随着大数据的时代,可以快速收集和处理大量数据,有效地改善NIPE大学系统的及时性和最大化的教育作用NIPE系统。大数据的帮助下,大学可以更好地捕捉学生的意识形态趋势和再教育通过相关平台提高NIPE的有效性。简而言之,随着大数据的发展,大学不仅可以让学生的思想趋势从大数据还传播思想政治理论通过各种大数据通道,以实现人类教育的目的。它也是一个信息窗口和数据发布窗口集合。

迭代循环的解决方案过程称为DM。首先,它从数据库中提取数据,挖掘潜在的未知的有用信息,并应用到人们的生产和生活。问题定义、数据准备、DM、分析和总结四个步骤。DM的优势是能够分析和预测未来的行为或趋势,然后使用这些信息来帮助人类做决策。它使人类的生产和生活更容易在许多方面。应用程序已逐渐渗透到各级dm相关技术的快速发展。dm相关技术的使用在教育是不可避免的16]。的 - - - - - -意味着聚类算法,属于无监督聚类学习,是基于一个简单的概念。骨料但不属于一个相关的类具有相同或相似的属性基于性能相似的属性。聚类分类使用传统算法。的 - - - - - -意味着算法适用于下列原则:平均算法的主要思想是将大量的数据样本 集群。首先,选择 随机从集群数据点作为初始聚类中心,计算质心中的每个点之间的距离,所有数据对象除以最近的聚类质心,平均每个集群的所有点,每个类重写一个新的点,重复直到最后一次。如果没有变化,完成聚类算法和位置确定最终的类保持不变。

协会分析任务的目的是发现潜在的内部数据之间的关系,找到有价值的关联。例如,有一个产品a和B之间的关系,因为当用户去超市,他们经常购买产品a和B在同一时间。关联分析任务的目的是找到这些内隐联想,这本质上是一个解释性的任务。软件基于B / S架构的优点是很好的部署、良好的可伸缩性,强大的交互性,相对简单的维护。它也有一个相对简单的系统升级程序。NIPEDM服务平台集成Web客户端和手机客户端的优势,致力于整合大规模的教育信息,找到有用的信息,随时查询信息快速、方便,在任何地方,校园和支持决策。

数据库发送命令来确定是否可以直接访问数据库;数据库返回响应信息并发送服务请求到Web或移动终端通过数据层,缓存层,业务逻辑层实现遍历。总体框架如图除以命令1

数据层主要负责数据存储和转换,而缓存层主要用于减少服务器负载和加快程序访问,因为缓存层缓存数据库中的数据集,和缓存时间很短。逻辑层负责交换数据和完成业务流程的执行之前和之后的链接。

3.2。NIPE关联规则挖掘

目前,不完美的大学NIPE系统很大程度上是由于相关人员的疏忽。为了建立一个完整的NIPE系统,相关学校领导,所有相关人员,大学NIPE员工,所有的社会成员都必须进行大学NIPE工作,促进大学的建设和改善NIPE系统通过构建数据形成的思考。通过研究和分析学生信息数据,以找到特定的规则,使特定的预测未来的数据,我们可以知道大学生的改变方向提前的心理状态和思想,制定相应的预防措施。学生应该能够观看教育视频,无论何时何地,只要他们想要探索的教育内容,教育内容和老师应该能够创建和调整课程时间无论何时何地,只要他们想要的东西。在线NIPE平台生成大量的信息。大教育数据可以分析和我的各种各样的信息隐藏在数据基于单个学生大量的数据信息,使其更具针对性和个性化。个别学生在教育大数据生成个人信息来源作为正常的学习过程的一部分。教师可以使用实时数据收集和分析来指导他们的及时和有针对性的教学方法。

先验的算法必须扫描整个数据库时发现一组候选人频率,和增加的数量集的频率条目,组2的候选人的数量线性增加,导致过度的I / O负载和效率高。基于Hadoop并行先天算法平台可以有效地弥补这些缺点通过使用分布式集群。

集群是一组数据点,和 是被划分类别的数量。的 - - - - - -算法首先随机选择 数据点从 作为初始聚类,然后计算数据点和聚类质心之间的距离,将数据点分配给最近的重心,重新计算质心在获得一个新的分区,重复上述过程,直到参考函数收敛。

在这里,判别函数的一般定义如下:

其中, 代表一组数据点属于类 , 是类的中间点吗 , 代表标准,这是一个距离计算方法,通常使用欧氏距离。

如果两个簇的质心不亲密,但也有类似的密度分布,他们被认为是合并。如果两个具有相似的密度分布的集群相距太远,他们不应该被合并。基于这个想法,考虑距离和数据分布,本研究提出了一种新的方法合并局部聚类结果。

集群中心 通过本地集群阶段,欧几里得距离是用来测量之间的区别的两个集群中心的距离。

定义两个类之间的区别 ,看到下面的公式:

在上面的公式中, 代表了权重系数,代表距离差异和分布差异的影响系数两个类之间的区别。以下公式给出的定义 :

在哪里 代表一组数据点属于类 在全球数据集。根据片系数的定义,当两个类之间存在很大的差异,两类上的分布差异的影响主要是考虑。

根据先验的算法的核心思想,一组1 _frequent项目必须首先开采,开采和并行1 _frequent物品在Map / Reduce相当于处理单词的数量每个事务的一项。因此,在地图操作,地图的输出键-值对可以改变使用之前 项目的关键 项目的价值。第一个 条目和 条目。

使用现有的先验的算法,可以找到可操作的信息充分挖掘频繁项集,但是如果我们分析用户点击生成的数据集训练数据的在线课程,可以看到,用户点击的次数一个在线课程是一个数字。传统的先验的算法必须是一组布尔关联规则挖掘时,数据和数值数据必须适应处理算法。

协会挖掘之前,英国《金融时报》(频繁树)算法类似于先验的算法,实现最低的设置支持并选择一组根据这种支持频繁项。算法的核心思想是构造一个英国《金融时报》基于一组物品和马克。英国《金融时报》与相关信息。它扫描数据库一次,矿业英尺从下到上,和删除子节点的英国《金融时报》来生成所需的频率。

如果新数据 ,要处理的数据 和标准偏差 ;的公式 - - - - - -评分标准是

处理过的数据可以更好地反映用户的点击在线课程,从而使链接规则的挖掘更准确。

最后,生成的键-值对作为输入减少,减少操作结合的两个元素数组的键和值来生成一组k_candidate物品。例如,如果有6组3 _frequencies,分组的过程生成4 _candidate 3 _frequent设置如图2

3.3。NIPE成就的预测

分类器预测学生的近期表现,分类器预测学生的未来的性能根据数据。分类器模型计算样本属于另一类的概率和预测类别分配最可能的类别。特征的选择也会影响最终的分类结果。因此,在本章中,如何选择学生的特点和如何定义学生的类别是第一个要考虑的问题。

本文采用监督学习方法作为分类器的基本模型。监督分类的任务,是要学会如何使分类模型更好的预测给定样本的类别分类。本文基于现有的两个模型,本研究提出了一个新的NB_BPNN模型,有效地结合了两种现有模型的优势。

让输入空间 是一组的 - - - - - -维特征向量,输出的类别设置空间 ,输入特征向量 ,和输出类别 , 随机变量定义在吗 , 随机变量定义在吗 , 的联合概率分布 假设训练数据集

让的可能值 th特性 ,条件概率的最大似然估计

的公式, th的特点 th训练样本; 可能的值 th特性, 指标函数的分类。

,为了确保概率总和仍然是1,一个词的 添加到分母,哪里 是所有可能的值的总数这一维度的影响特性。同样,先验概率的估算结果是畸形的如下:

类型,以确保概率总和仍然是1,分母增加了一个期限

在这一章,我们提出了未来NB_BPNN模型来预测学生的学习结果。在这个结构中,我们首先通过多层摘要提取和转换非线性特性,然后向NB的输出神经网络分类器获得相应的分类。模型的左右部分相同的方式对待传统神经网络或注模型,这是一个改进的模型结合NB和摘要。结构如图3

具体计算方法是修改NB的重量损失,然后找到连接损失的偏导数向量,最后修改的偏导数的所有权值神经网络由梯度下降法。在测试阶段,每次测试样本输入的特点,中间输出是通过几层网络,和中间输出输入NB分类器,分类是根据输出判断。

美联社(亲和力传播)算法提出了一种有效的方法找出的中心点 ,它可以满足条件,上述相似性最低的总和。让 代表了中心点最近的数据点 ,然后算法的目标是找到最合适的 ,以最大化 在以下定义:

当点之间的欧氏距离作为相似性, 被定义为 , 被称为数据点的参考程度 ,这是记录为 更大的价值 ,更有可能的数据点 是成为集群代表点。

WAP(美联社)加权算法是美联社的泛化算法,适合集群复杂的multidata集。WAP算法可以合并连续点在大型数据集,使聚类过程更高效的聚类结果不改变。

定义数据集 包含 数据项 ,其中 然后,数据集的相似性矩阵 定义如下:

解决问题为中心的观点 上面的数据集 ,也就是说,解决

如果数据集,最大的优化问题 数据项 ,相当于优化问题。

因此,本文使用Hadoop平台的数据处理机制和HI_WAP算法设计的分治思想P_WAP(平行WAP)算法。

假设原始数据集的大小 ,我们可以看到从图4P_WAP算法的基本思想如下:

分布相似的数据节点的一个子集 Hadoop性能,平衡作业调度和处理机制是Hadoop平台的独特优势。聚类结果存储在本地磁盘上进行后续处理。如果非常大的数据量,生成聚类代表点的数量在WAP阶段是非常大的。这时,WAP集群可进行多次获得足够的聚类结果。获得的聚类结果是减少reduce函数,这样相同的数据代表点聚集到相同的集群,最后,结果写入输出文件。

4所示。实验和结果

4.1。设置实验

Hadoop是一个云计算的分布式海量数据处理框架。HDFS和MapReduce系统中两个最重要的模块。MapReduce是并行计算模式,它使用HDFS文件系统作为它的基地。Hadoop几乎没有机器配置需求,构建一个小型的Hadoop集群的成本很低。它非常适合小型企业希望建立自己的数据中心,和集群可以扩大随着数据量的增长。因此,本文创建了一个实验性的云计算平台和测试算法的聚类效果使用开源分布式软件Hadoop。实验平台由五个通用的pc和一个路由器,和集群软件配置表所示1

集群的主要计算任务完成TaskTracker。为了实现本地数据阅读和本地计算的好处,最好是运行在一个DataNode TaskTracker。这提高了在集群上运行作业的效率。

4.2。结果分析

从图可以看出5先验的算法,与英国《金融时报》算法相比,指数增长所需的时间找到的一组项目。英国《金融时报》算法非常有效,因为它只需要两次扫描数据集,和项目信息存储在一个树结构。

当改进的关联规则算法用于测试算法在数据集上的性能低于2000条目在并行环境中,可以看出,与2000年数据条目的执行时间长于一台计算机。原因是适用于大数据处理并行环境。时的数据量太小,算法的执行时间不再多节点块操作的好处。执行时间主要由数据传输和复制。

6显示了性能分析的改进的并行关联规则挖掘算法在并行环境下,与2000年的数据集。

从图的分析6可以看出,在并行环境下,当支持的最小数量很小,两个节点的运行速度比单个节点的快。这是因为如果节点和单一节点相等,当最小数量的支持达到4,支持大多数项目的数量小于4,所以他们被淘汰,也就是说,有更少的键值和更少的因素。不再多节点计算影响算法的执行时间,但是数据传输,复制,和时间消耗。

输入节点的数量是6,输出节点的数量是6,隐藏层可以是1、2、3层,隐层节点的数量(64),训练停止条件迭代连续10次,和损失的方差小于0.05。结果如表所示2和图7

可以看出,模型的性能提高了隐层节点的数量增加至64人。结果表明,模型的性能也可以改善通过适当增加隐层节点的数量。NB_BPNN成功地结合了两种分类器的优点,是一种有效的分类器。使用上面的配置,我们建立了一个独立的伪分布环境的节点上,跑三个数据集1的算法,分别为2和3,。在第一阶段的实验中,100年的数据被美联社集群,和实验结果如图8

如图8,当聚类数据集1相同的硬件配置,嗨WAP算法花费更少的时间比P WAP算法执行。P WAP算法的执行时间和你好WAP算法随着输入数据的数量增加而增加,但增加的P WAP算法小于嗨的WAP算法,和增加率保持稳定。在处理大量数据时,P WAP算法优于嗨WAP算法。在这个实验中,我们运行P WAP算法在分布式环境中集群1到8的datanode的执行时间和比较各种大小的P WAP在集群中使用伪分布环境计算结果。实验结果如图9被获得。

如图9算法的执行时间,减少线性增加的集群中的DataNode的数量。从数据集1的实验结果,可以看出,当一个Hadoop集群处理数据集,它最有效的处理节点数的一定规模的数据集,并增加节点的数量不一定缩短数据集。这是因为随着集群节点的数量的增加,运行所需的资源消耗集群本身也将增加。因此,在处理大数据时,需要选择合适的Hadoop集群来处理数据集。

5。结论

的解释和建设大学NIPE模型在大数据时代将促进NIPE,提高服务质量。大数据的价值在于,它只能用于工作如果它反映了总体情况和它所包含的法律有效地分析和研究。在这种环境下,本文NIPEDM服务平台开发能满足这一目的。学生的分类器模型映射的行为信息和预测学生的分数。两个方法,NB分类器和神经网络分类器,用于测试。的优点和缺点进行了分析,和一个新的方法,NB_BPNN模型,它结合了两种方法的优势。模型可以有效地分类和预测未来学生的学习结果根据他们的学习行为和习惯。本文的实验数据集P_WAP算法相应的文本数据,与实际应用环境常常是多源异构数据。如何处理多源异构数据为未来的研究也是一个重要的话题。

数据可用性

使用的数据来支持本研究的结果包括在本文中。

的利益冲突

作者没有任何可能的利益冲突。