文摘

随着经济全球化的加速,日本专业人士的需求也增加。针对这种情况,提出了一套大学日语测试系统。大学日语教学模式建立,基于大数据,提出一种改进的聚类算法通过比较相关分析和数据挖掘技术。针对这一现象,ACA(蚁群算法)不能保证所有数据对象是获取和收集的蚂蚁和可以重复访问相同的数据对象,本文提出了一些相应的改进。聚类结果表明,算法的聚类精度为80%。这证明了动态的合理性和可行性评估学生的成就基于聚类算法,并对引入数据挖掘具有重要意义的教学环境。

1。介绍

的加速教育信息化、教育技术已经融入到课堂教学生态系统,影响课堂教学生态系统的平衡与教师、学生和课堂环境。社会对日语人才的需求是多样化的,日本和许多等单位和企业需要人才。在这种背景下,传统的日本人才培养方法不再能满足新形势的要求。因此,新课程改革特别强调课堂教学有效性,要求教师精心设计和组织课堂教学提供日本学生更快更方便的学习以及更大的能力。经济全球化所带来的影响被放大在大数据的时代。学习日语,作为国际语言,在本例中是至关重要的。写作教学尤为重要,其中日本应用密切相关。

目前,日本教育主要是使用传统方法进行教学与教师优先考虑。学生的自主学习能力没有得到充分利用,他们的学习主动性和国家很穷,和学习差的需要很长时间的结果。邝等人认为,“教学”的概念应该是自由的传统思维限制,而且它不应局限于一个多媒体辅助课堂教学。Amirian提取文本特征变量使用自然语言处理技术,分析两个变量之间的相关性,然后确定每个变量的β值使用多元线性回归获得作文分数统计。尽管许多文学作品描述了成功的数据挖掘应用中,戈什等人指出,仍有一些与数据挖掘相关的挑战和其他应用领域。最后,他们指出,许多相关技术研究应继续以推进矿业教育。

随着日本学习者的人数的增加在中国,日本已成为中国最重要的外语之后,因此,日本教育是向更加多元化的方向发展。因此,面向应用的大学必须构造一个日本人才培养的新模式,不断改革课程体系。只有这样,日本专家符合时代潮流和更好的锻炼他们的勇气和经验。通过数据挖掘技术的应用,本文将讨论一些学生学历的管理中存在的问题。我希望大学日语测试模式的改革可以肯定和推广,这在当前的形势下,日本测试可以充分利用计算机技术和多媒体技术。本文的研究意义在于提高日本测试的信度和效度,提高日本测试的效果,使其更有效地评估候选人的日语能力。本文的研究贡献如下:(1)目前,没有考试系统,可以完成智能评分和准确。本文将利用自然语言处理技术,计算句子之间的相似度通过使用最小编辑距离和余弦向量算法,并确定分数和语法规则匹配,获得的知识要点,以提高自动校正的准确性提前主观的问题。(2)学生成绩评价是一种教育评价的关键环节和重要内容在教学和教师管理和教师质量评价的最重要的信息来源。本文主要运用聚类分析的评估学生的成绩,为了提取数据背后的综合成绩,判断和分析学生的综合学习能力通过集群的结果,并提出了一些相关建议的结果。

在报纸上可以找到以下部分:第一章介绍了研究背景和意义,然后介绍了本文的主要工作。第二章主要介绍了相关技术的大学日语测试模式。第三章提出了本研究的具体方法和实施。第四章验证本研究模型的优越性和可行性。第五章是全文的总结。

2.1。数据挖掘研究

成绩管理的最直接的目的是实现科学、有效的管理学生的成绩通过相关技术的应用。具有重要意义,利用数据挖掘工具我学生的学术成就。LP线性回归分析方法用于预测学生的成绩。通过统计数据,寻求改变规则,变化的影响因素进行了分析,发现拟合关系。因此,图表直观的变化和发展趋势的学生的成绩,教学的未来发展预测,并提供科学的管理教学的基础。关等人应用改进的数据挖掘算法研究分析和管理的大学生的成绩和得到一些内部原因和结论,影响学生的成绩,为高校的教学管理提供参考(1]。Maggioni等人使用关联规则挖掘分析学生成绩和开采一些规则有一定的可信度,为未来提供了科学依据年级管理(2]。娇等人指出,尽管面临有效性不能取代实验有效性,它可以快速提供考试的学生和教师意见(3]。我林和胡锦涛利用数据挖掘技术实现关联规则指导教育管理员实现的方针、政策4]。该方法可用于指导教育,充分发挥主观能动性。罗等人应用数据挖掘技术的分析学生的分数和发现课程之间的关系,为教学管理提供了参考和学生选课(5]。

2.2。对聚类算法的研究

集群的本质是把所有的数据在数据集分成许多组,一组必须有类似的功能,而其他不同的团体有不同的特性。

周等人使用一个学习规则的竞争称为第二个赢家点球来自动决定适当数量的类(6]。这个想法是,对于每一个输入,中标单位的重量将被修改以适应输入值,第二个获奖单位将受到惩罚让它远离输入值。陈等人应用算法、k - means和杂交PSO算法四种不同文本文件和集群数据集。聚类后,通过比较分析,聚类结果得到混合PSO算法非常紧凑,需要很短的时间内(7]。太阳等人聚类算法分为较小的数据聚类和大数据聚类8]。较小的数据聚类主要反映聚类的基本思想,而大数据聚类的思想主要体现在几个方面,如概念、体系结构和体系结构。至于底层工人的具体实现算法聚类,其实没有本质区别它和小数据聚类算法。李提出了一个快速、自适应算法。该算法使用隶属度来确定采样点的相似性,这是一个基于目标函数的模糊聚类方法(9]。杨等人提出了一个快速聚类算法(10没有提前设置集群的数量)。算法完成聚类中心的决心通过转移两个索引,吸引力和归因,是比较适合大规模数据集。Hamzenejad等人提出的定义轨迹数据和混合回归模型的轨迹聚类(11]。轨迹聚类扩展了原来孤立的点状分布的采样点到队列时间轴上的数据。国内研究人员用来调用轨迹聚类生动地“时空轨迹聚类”。

3所示。方法

3.1。大学日语测试系统的设计

大数据不仅向传统教育提出了挑战,也使教师更容易理解和掌握学生的学习行为。学生的行为可以数字化的教学过程中,教师可以使用行为的数据,以确定问题教学模式,这允许他们提高和优化教学模式。学生学习行为将记录在网络学习过程中,形成一个大的数据源,包括每个学生的鼠标点击,时间,数量的问题,参与讨论,等等。不同的人采取不同的路径,和大数据可以帮助他们找到定制的解决方案。传统的日本主要评价方法相对简单,强调理论,小应用程序,一个不完整的评价方法。一个笔试只能评估学生的日语基础知识;然而,评估学生的实践能力、解决问题的能力、团队合作能力、沟通能力,和创新能力是很困难的。我们希望新的评估方法能够满足学生的培训和测试能力。教师应成为设计师、助理、指南和反应学生的学习,或者换句话说,那些为学生服务。

我们可以把质量结构的学生综合素质评价体系分为两个水平,基于当前形势:义务级别和追求。最基本的要求,学生的思想道德修养、理论学习和身体素质是必修课程。层次结构的目的是帮助学生提高他们的整体素质,这样他们就可以开发一个高尚的思想和道德品质以及更高层次的专业能力。日本的考试系统是一个计算机辅助学习相结合的教学助理,诊断、检查、反馈,和其他特性。它是建立在一个系统完善的知识结构和一个大问题。图1描述了系统的基本框图。

主要功能是自动纠正错误的诊断引擎根据用户的反馈和纠正主观问题通过使用向量空间模型中,矩阵的奇异值分解,动态规划算法和最小编辑距离,和自然语言处理技术。作文自动评分,用户诊断报告的日本知识点根据知识形成点组成。

3.2。日本智能评估

大数据是指一个大型网络,让老师发现学生的规则和特点的学习,开正确的医学,更好的符合趋势,改善学生的学习行为和问题,并跟踪教学数据的发生和发展,形成一个良性循环。我们可以提供具体的帮助和个性化学习需求不同的学习者使用学习行为数据挖掘,以及不同群体不同知识的发现不同的反应点和不同的环境中。鼓励学生学习工程中一个活跃的、实用的和有机的方式,重点培养学生的系统工程技术能力,强调学生的工程实践能力,和面对社会不适应。

教师是日本教育的最重要的一个方面。很难教日本如果老师质量很差。因此,以创新人才培养模式,必须组建一支高质量的教师。因此,面向应用的大学应该能够澄清教授的研究方向,让教授向学生介绍日本职业的发展方向和学术趋势通过科学研究,促进教学与科研的结合,并使科学研究成就之间的连接和教师教学工作。教师良好的研究成果,根据相关研究调查,有较高的教学水平和更有可能受到学生的喜欢。

从测试的角度来看,大学日语作文主要考察学生的综合能力运用日语知识,包括拼写、词汇搭配,语法、词汇选择和句子结构,对主要思想的理解,设计和规划,和修辞风格。在语料库语言学,统计数据处理技术是主要的手段从语料库获取各种必要的见解。日本人的词汇和语法的基本元素。等主观问题组成,另一组基于正则表达式的语法规则是必要的。系统自动选择的问题库根据设定条件的原型文件并生成试卷。用户可以下载测试文件从服务器到本地计算机。同时,他们也可以选择保存在银行的问题为候选人在线考试。这个模块的程序流程图如图2:

教育测量的工具,测试必须有良好的质量,减少错误的测量结果。可靠性的程度测量结果偏离真实价值。在测量、可靠性可以被定义为真正的得分比实际分数;也就是说,

这表明真正的得分方差的比例就越大 在实际得分 ,更高的可靠性 根据误差方程 ,(1)可以改写如下:

可以看出,如果真正的得分 接近实际的分数吗 , 也会关闭,而错误呢 将小,可靠性将会增加。可以看出,可靠性是衡量测量值和真实值之间的差距。

文本相似度被广泛使用。通过设置阈值来过滤规则的组成规则,结合语料库正则匹配,我们可以精确测量等语言能力文字位置,词汇结构、词语选择、句子结构。因此,它是非常重要的计算句子相关诊断日本组合问题。

每个关键字的重量;然后,计算公式的相关性成为加权和(13];也就是说,

是词汇出现的次数在当前句子, 总数的句子词汇出现在所有其他句子除了这句话,和 的总数文本句子;然后,

从上面的公式可以看出,与更多的出现更大 值,但是这样的话不一定高 值。因此, 价值考虑的频率单词和这个词来区分不同的句子的能力。

分裂后学生的组合成句子,每个句子相似度计算和执行正则匹配阿特拉斯和所有的规则,得分最高的计算和相应的规则是消除。每个规则后筋疲力尽,作文的最后得分。有鉴于此,背包问题可以转化为充分利用分数之和的最大值在每个规则的规则数量是有限的,和它的数学表达式如下。

目标函数如下: 在哪里 是一个0 - 1决策变量, 显示规则 成功匹配的句子,和 显示规则 成功匹配的句子。

3.3。聚类分析应用到学生成绩评估

聚类是数据对象分类到不同的类或簇的过程,分区的原则,工作对象在同一集群非常相似,而在不同的集群对象是非常不同的。聚类的类划分是未知的提前,和阶级的形成完全是数据驱动的,表明这是一个不能控制的学习方法。

给定一个数据集 ,在哪里 是一个数据对象,数据集分为 组根据数据对象之间的相似度,和下面是满足:

然后,这个过程被称为聚类 被称为聚类。

ACA(蚁群算法)是一种仿生优化算法,它有许多优点,用于解决车辆调度问题(12),连通图的颜色填充问题,销售人员的问题,等等。然而,ACA有一些缺点,这将影响这些问题的解决方案。

在实现的过程中聚类算法基于蚂蚁觅食原理,我们首先需要确定目标集群的数量,然后选择一个集群每个集群中心。初始聚类中心的选择可能会影响最终的聚类效果。同一个类的不同的数据对象是按照下列公式计算:

聚类的结果判断,如果之和小于所有类参数的不同 的聚类,聚类结束(14]。

在一个二维网格,蚂蚁继续前进,上升,下降。当蚂蚁遇到一个数据对象 在位置 在某种程度上,我们需要计算它的局部密度通过以下表达式: 在哪里 表示这个对象和其他对象之间的相似性密度。 单位面积范围

较低的平均相似性对象及其附近,越不可能这个数据对象属于这个社区(15),反之亦然。乙状结肠对称函数选为概率转换函数根据这一原则。

概率的定义 蚂蚁随机移动的母亲捡一个对象没有数据对象显示在以下公式:

的定义 公式如下:

可以看出,如果参数 较大,曲线饱和会更快,导致算法的收敛速度越快。

改进的ACC的流程图(蚁群集群)算法如图3

改进算法的基本过程描述如下:(1)每个蚁蚁群的初始化。(2)预计所有数据对象聚集成一个平面与给定的范围;也就是说,每个数据对象被随机分配到一个点在二维平面上,和坐标位置 (3)开始时,每只蚂蚁并不含有任何数据对象,和“全球记忆的历史位置”设置和初始化是空的。(4)计算的平均数据对象之间的相似性。当蚂蚁不装载数据对象,其小概率计算和标记为 (5)如果一个对象是孤立的或者在周边国家的对象的数量小于某一常数,标志着对象作为一个孤立点。否则,集群序列号分配给对象和递归其邻域对象标记为相同的序列号。

4所示。实验和结果

这个算法的性能验证实验数据的聚类分析和与其他经典聚类算法。的实验是一个比较测试算法的有效性和性能。为了比较聚类算法的性能,实验设置如下:CPU:英特尔酷睿2双核T5600, 1.83克;记忆:1.5 GB;硬盘:100 GB;操作系统:微软Windows XP专业。

1比较该算法、k - means算法和ACA。

从表可以看出1该算法的聚类分析结果明显优于k - means算法和ACA,集群性能大大提高,和更好的聚类中心。可以看出,本文的算法是最常用的复杂的聚类问题与许多类别和大量的数据挖掘中的数据。该算法的聚类效果很好,同时也克服了影响“噪音”。

4比较判别函数值的变化与迭代的数量800 k - means算法和二维点集的算法,分别在18个类别。

从图可以看出4k - means算法容易陷入局部极值,难以逃脱。与k - means算法相比,该算法收敛于全局最优速度更快。和概率是更快,即使标准函数的值达到最小值。该算法优于k - means算法的迭代时间和最终收敛值。

5比较的标准函数值15种700二维点集的聚类分析的k - means算法和该算法的25倍。

从图可以看出5,k - means算法的结果波动极大地在许多聚类分析实验,虽然该算法的结果已经相对稳定,并且结果比k - means算法。加载数据后,蚂蚁算法的随机移动在二维平面上,然后与周围的数据比较相似。如果是满足相似条件,数据将被删除和重新加载;否则,他们将再次随机移动。从几个实验的平均结果如表所示2

可以看出,当结果是相似的,所需的迭代次数的改进算法比原来的算法快,执行时间比这更快的第一个。因为前者可能有局部最优解,蚂蚁不能接数据对象。未被利用的算法,集群可能发生死锁。综上所述,可以看出,改进后的算法能够提高集群的收敛速度。该算法验证聚类结果的准确性,因为类成员的数量大大不同,且属性值包含其他类型的数据。测试样品车评估数据库在UCI机器学习数据集。在这个数据集有四类,即不可接受,接受,满意,很满意。

集群的数量分类类别的实际数量是一样的。样品的数量相对应的详细信息被包含在每个类别和数量的样本聚类结果如图6

1350年接受类别,错误的样本的数量是120,占8.66%。然而,接受的分类错误的样本的数量是88,占5.01%。令人满意的分类错误的样本数量是30,1.66%的错误率,和非常满意的数量分类错误是35,出错率为1.89。因此,正确的集群率约为80%,并且聚类结果在一个可接受的范围。聚类的聚类结果正确性测试实验可以验证算法的聚类精度在80%以上,这表明,聚类结果的准确性高,和适用于后续聚类研究。我们做出正确的统计数据率和错误率下列不同的聚类算法,给出一个比较图表。

从图可以看出7k - means算法的分组结果,标准ACC算法和增强ACC算法分为三组。可以看出,k - means算法的出错率相对较高,其次是标准ACC算法,和增强的ACC算法的误码率低。同时,比较三种算法的执行效率,我们发现改进的ACC算法花费更少的时间和具有较高的执行效率。从这两个方面,改进ACC算法显示了优势,可以进一步研究。ACC的改进算法,我们只在较小的数据集验证一下,如果条件允许,我们还需要验证聚类分析在大型数据集的影响。

学生学业成绩的分类在一段时间内被称为学生成绩评估。成绩有一个评估函数,它是提供一个数值结果通过测试各级学生为了提供一个学生在学习过程中表现的评估。当然,他们也反映了教师的教学和管理的能力。他们指导重要性的学校的办学模式、人才培养模式和办学效果在整个学生学习的过程。因此,绩效评估是教学活动中不可避免的副产品,和所有教育人员应该关注它。

本文进行学生成绩数据的聚类分析,希望从数据中提取有用的信息。分组的最终结果是,学生的分数分为组。将学生的学习习惯、学习风格,上课率在同一组是相似的吗?我们的实验和相关研究必须支持这些说法。然后,根据实验结果,我们应该制定适当的法规和教学生根据他们的能力。选择一个适当的算法,确保所选数据的准确性和完整性是在数据挖掘过程中关键步骤。聚类分析,500年日本学生的课程成绩。我们必须将所有的数据在数据集转换成一个有效的数字形式后,它已经被打扫过了。考试课程和选修课程将会出现在我们的一些分数数据集。我们必须把他们的分数转换成百分比值格式,因为他们分为通过和失败的类别和没有具体的分数。 500 student records are divided into 5 clusters, as shown in Figure8

分组的结果表明,第一类学生的结果通常是平均,结果所有科目都处于中等水平,可以提高各领域。我们可以看到,这些学生有一个多样化的利益,这或许可以解释为什么他们不学习一些主题深度。我们可以鼓励这些学生去探索他们的激情和爱好,最大限度地发挥其潜力,并集中精力发展自己的话题。一些学生的学习成绩可能相对较高,有超过90点,在他们努力学习。第五个类别中的学生,另一方面,60 - 70分在汇编语言程序设计中,数据结构,算法甚至失败,根据聚类分析结果。我们可以看到,这些学生有一个日本疲软的基础。一些问题必须回答在日本由于双语教学,对这些学生的性能有显著影响。

5。结论

随着经济全球化的加速,中国和日本之间的经济和文化交流增加了对日语人才的需求。因此,面向应用的大学应加强日本专业的创新人才培养模式和课程改革,以及采取有效的措施。系统辅助教学软件,集教学、诊断、测试、反馈等功能通过主观和客观问题的自动校正和个性化诊断设计。记录数据对象的历史地位下降了蚂蚁,“历史位置的全局内存”机制,介绍了改进ACC算法是应用到学生成绩评估。聚类算法的准确率可以通过集群校正测试实验,验证表明,聚类结果的准确率高,而且适用于集群进一步调查。聚类分析的合理性解释基于实际的应用程序。

数据可用性

使用的数据来支持本研究的发现可以从作者要求。

的利益冲突

作者没有任何可能的利益冲突。

确认

这项研究支持了香蕉Yoshimoto结构特性的研究在文献治愈系的工作,项目编号SK1704。