文摘
在本文中,我们分析的智能辅助设计模拟评分系统进行深入研究。本文提出了n元的相关性分析量化值和理性enhancement-based得分匹配算法对英语散文。句子特征,本文还提取单词功能,和论文章节结构特性符合英语作文的分数。因为并不是所有的学生可以根据主题要求,完成论文分类评分模型是用来区分正常的文章和低分作文。据统计,发现这篇文章的分数也表现出一定的正态分布。标准支持向量回归算法容易出现数据倾斜问题,所以本文解决这个问题通过使用理性增强方法,给出了相应的惩罚因子根据数据集的分布。结果表明,英语作文得分匹配算法提出了可以提高一些数据的预测精度和解决倾斜的数据的问题,成绩正态分布。本文设计和实现了一个在线模拟考试系统,包含一个智能对论文评分系统,使其能够满足教师和学生的需要对在线考试和智能评分。
1。介绍
近年来,随着IT技术的不断发展,尤其是智能教育的波由人工智能、云计算、大数据和互联网,这些技术引发了新一轮的教育革命,也完全颠覆传统的教育评价领域,显示一个宏伟的蓝图的教育评估和评价教育专家、学者,和大部分的一线教师1]。基于计算机网络在线考试的特点是方便的组织,独立于时间和空间的限制,考试成绩和快速访问,这带来了显著增加标记效率和直观的评估成本下降(2]。然而,许多在线考试系统,通常有很少或没有自动机器评分涉及主观问题类型(3]。研究后,算法用于自动机器标记的客观问题在线考试系统相对简单、容易实现,只需要比较候选人的答案与标准答案确定正确性和给实时考试分数;很明显,自动标记技术的应用对客观问题类型由多项选择题、判断,匹配和填空题大大提高了标记的性能,使错误或遗漏的概率接近于零(4]。自动机器人领域的标记的主观问题,特别是在中国领域的主观标记(5),智能标记技术已经成为超过词词比较和验证过程。考虑到不同层次的理解每个候选人和汉语表达的多样性,即使学生能回答准确,很难完全协调的叙事和逻辑的标准答案(6),这无疑造成了重大的问题“不聪明”电脑评估。
模拟考试平台的发展不需要频繁的试卷的印刷。教师只需要选择的话题是银行系统的问题,评估组装时的论文考试是必需的,和发布的文件。模拟测试系统节省了老师的时间在打印试卷和节省纸来保护环境7]。没有需要填写的答案卡在线考试,和标记目标问题的准确率是100%。这可以防止学生失去是由于非标准答案卡和允许教师时要更准确计算错误率。智能标记系统可以用来标记文章的问题,降低了教师的工作压力和允许他们总结学生的错误及时,这样就可以解释他们的文章时更有针对性;对于学生,他们可以得到客观、公正的分数,他们的文章也可以纠正错误系统根据反馈结果。
我们的目标是使标记更合理,公正,公开,使我们的英语成绩更准确。英语论文测试是一种非常重要的综合考试的问题学生的英语应用能力,有助于提供一个全面的了解学生的英语熟练程度。自动基于机器的标记将帮助建立一个一致的标记标准标记过程,这将不再是由主观的“人类”,但实现目标机器,确保整个评分过程一致性。这将确保学生的英语作文报纸与高质量的客观和公正,这将提供一个严格的教学改进和人才选拔的依据。
2。相关的研究
项目论文成绩(挂钩)论文评分系统已由一个团队在美国杜克大学(8]。此时,自然语言处理技术仍处于起步阶段,基于工作生活经验自然语言,因此,盯住评分系统是一个基于规则的方法文章,关注形式(9]。系统使用单词长度来确定学生的掌握词汇,句子长度来预测学生的掌握句子结构,等等。它提取这些简单和容易量化的文本特征,然后对这些变量进行多元线性回归分析,以产生一个线性回归方程。当文章分段,每个特性变量输入来确定文章的分数。这只提取简单功能没有涉及的内容特征考生的文章很容易找到漏洞,这是钉住汇率制的原因并没有广泛使用。
通过提取多维特性和设置相应的权重根据用途,吴缝合LSTM单元的输出层的特征向量本文在遍历递归神经网络多层深和获得分数使用岭回归等统计分析(10];李提取语法错误使用语言模型和检测到错误的使用日冕和介词词语11),Malak使用多元基于规则的语法检查和熔融n元语法模型检测语法(12];Lasen CNN用来提取深度特性和LSTM处理时间信息结合传统的自动标记方法得分散文,等等(13]。后老师登录并设置文章的主题,文章数量是给学生,然后回应网上系统并提交论文,成绩自动作文评分(14]。系统自动评分的文章通过计算学生的文章之间的距离和语料库系统,接近学生的论文是语料库,分数越高(15]。一句一句地基础上给出的反馈是,列出了每个句子中的任何错误或提示。论文的评价、反馈主要是单词的拼写和用法错误,而肤浅的评价主要是在句子和篇章结构。英语和汉语是完全不同的自然流动;中国是一个词对的;基本上没有弱读,更不用说断字,而英语是完全不同的;在普通英语中,大量的音节将连接在一起,导致一个短语或一个句子听起来像一个长词,是一个完全陌生的单词,听写,无论如何倒带我不能理解它,但是当我看文本,我发现它完全是一个不同寻常的短语组成的几个简单的单词。
通过这种评价,学生可以有一个清晰的理解的程度掌握他们所学到的东西在这个阶段基于考试的内容,这样他们可以调整他们的学习方式和重点根据评估结果,和老师也可以调整自己的教学内容和教学风格基于学生容易出错的问题和分级结果的分布,并提供深入的解释,大部分学生不能掌握的内容。老师也可以调整教学内容和教学风格根据分配的学生容易出错的问题和分级结果,深入解释的内容大多数学生不能掌握,纠正他们的错误中学习,提醒学生关注审核相关内容,并提出下一阶段的目标实现。通过这些功能,它可以发现云标记系统的应用不是教学评价的工具,但支持教师教学,帮助他们客观的教学内容和教学方法的改变,使得课堂更相关和有效应对评估的考试。它还可以用于发现不同学生的学习方式,通过分析他们的表现和发现他们的最近发展区,以提高他们的享受学习通过选择有针对性的教学方法,提供个性化和组教学不可或缺的帮助。
3所示。智能标记系统设计
3.1。自然语言处理技术
自然语言是自然发展的语言与文化,不同于一种人造语言,而编程语言如C语言和VB的人工语言。自然语言处理的处理是我们使用的语言交流在我们的日常生活中。它是一门交叉学科,语言学作为研究的主题,并使用计算机科学与统计的帮助处理它和其他学科方法(16]。尽管基于规则的自然语言处理方法有一定的缺点,他们是有相当的有效分离。在计算词的数量方面,中国可以直接计算字符串的长度,而英语需要一个词分离步骤。在编写良好的文本,英文单词之间有空格来表示单词的独立性。使用相同的方法计算数量的英文句子,每个句子结束标点符号。一般来说,英语句子通常以点结束,问号、感叹号,等等。句子可以清点的数量根据句子中标点符号的类型。
浅文本特性,比如单词和句子的数量可以通过基于规则的方法,提取和词汇注释的属性,虽然可以通过检索数据库的处理已经明显的话,并不准确由于一些词有多个词汇属性和其他原因和使用统计方法17];对文章内容的主观性质,使用规则提取是更合适的。文章内容主题的分散性质使它不可能全面制定规则,而规则的制定需要首先阅读大量的文本获得经验总结主题。这个方法是费力而难以确定它是否符合主题。因此,statistical-based方法被开发。
早期的词汇注释属性也意识到规则的方法,和语言学家意识到建立一个规则库为词汇属性通过总结规则。其中之一,标记系统,是在美国开发的,编译86词汇分类规则。准确率只有77%,当布朗语料库中的词被自动注释。相比之下,维特比和爪子算法基于统计方法可以达到超过90%的准确性。本文使用的词汇注释工具是斯坦福大学的POS尾随者,这是一个开源的词汇可以使用注释工具,不仅在eclipse环境中,而且在python中。
TF-IDF是一种评估的重要性,整个文本或一个词语料库,出现的次数一个重要词增加随着文本的长度,和语料库中出现的频率会减少。TF代表词的频率,这意味着一个单词的出现频率的文本。(所示的TF的计算公式1),count (w)表示文档中出现的次数词w, Di | |表示文档中所有单词的数量:
IDF代表逆文档频率,这是一个测量的通用词的重要性23]。以色列国防军计算公式见方程(2),其中N是所有文档的总数,和我(w, Di)表示一个关键字是否存在于文档Di,和它的值是1,如果它的存在;否则,它是0:
因为分母(2)不能是0和分子不能0和一些热点词汇的存在将使以色列国防军值0,使用平滑方法,如下面所示:
总之,一个词的TF-IDF特遣部队和IDF的乘积计算值。这个算法的综合分析表明,该算法的目的是过滤掉常用单词,把重要的词。不难找到一个随机文章阅读,,很容易发现“”这个词经常出现在中国,在英语中,单词“”也是一个高频词。但这些单词或单词没有实际意义,所以数据分为词不仅可以直接使用TF-IDF算法还需要预处理文本。文本预处理的主要任务是消除停止的话,主要包括一些毫无意义的词,如辅助的话,冕珥,连词。删除这些无意义的停止词还可以大大加快算法和提高效率的文本关键词。
如果文档中所有重要的词作为关键词的主题,那么这些关键字将这么多,他们就不会特别突出真正的关键字的文档,也不会达到检测的目的是否八卦的话题。因此,需要进一步的特征选择中提取真正的文章的关键词。特征选择可以有效地降低文本向量空间的维数,简化文本模型,提高关键词提取的效率和精度。卡方统计测试方法是一种计算之间的相关程度,词汇和文章类别。它的基本思想是确定正确性基于理论和实际值之间的偏差,并计算其正确性如下面所示:
这是一个很好的选择TF-IDF过滤关键字的基数统计使用向量空间模型。它可以将关键字映射到空间向量操作,通过计算两个向量的相似度空间,从而表明的语义都是相似的。余弦相似性计算使用余弦定理,可以测量两个单词向量之间的相似之处(18]。两个单词向量之间的夹角越小,越相似的两个单词向量。类似地,两个向量是重叠;然后夹角是0和余弦函数值是1。如果两个向量正交,余弦值为0。根据余弦值的大小,它可以确定两个关键词是否相关。余弦相似度计算如下所示:
英语语法检查通常使用统计方法。如果规则是用来检查,不仅是费时又费力,而且一些规则本身可以是相互矛盾的。假设英语单词的数量现在是N,如果根据贝叶斯算法的原理,每个单词是相互独立的,一个单词出现在任何句子的概率应该是1 / N。但据统计,这并非如此。一个完整的英语句子通常开始于一个主题,它排除了许多单词开始的可能性。其次,在决定第一个单词,单词使用后也不能判断高概率的基础上发生在语料库这个词。“”这个词在英语中是最高概率和不能紧随其后的任何单词。模型的当前状态只取决于最初的几个州,和图1显示了自然语言处理技术的框架。
句子提取的特征,不可能准确地配合的形式作为一个指标的分数只智能标记,还从语法方面的句子。紧张的动词和名词的单数和复数不能单独从单词但从紧张和单词在句子单词的数量。紧张的正确性和单可以由定位相关的单词基于词汇特征提取。
复合句子包括平行句子和主要和下属的句子,和下属的句子加上在英语作文。各种从句结构的复杂性比简单句更复杂,这意味着它是比较困难的学生写一个正确的比一个简单的从句。困难是唯一的方法来展示学生的写作能力。根据英语的语法部分跳级教学大纲,学生需要掌握五种主要和下级复杂的句子。如果学生在他们的论文多次使用多个subject-subject复杂的句子,它将很多颜色添加到文章。
3.2。标识系统设计
研究智能标记算法,本文获得了高中的数据集模拟考试。文章通过收集数据和计算分数,我们发现论文分数显示一定的正态分布。低的文章和完美的分数乐队占领一小部分,剩下的分带占领不同比例(19]。因为数据的变化在每个分数乐队,一个智能标记模型设计分类正常论文和低分作文使用诊断计分法。确保实验模型有一个不错的选择,论文成绩为训练数据集选择涉及所有分数。因为学校的这些高中学生被随机排序根据计算机在入学之前,本文选择数据集的训练集和测试集基于分数排序,而同样的得分排序策略是基于学校数量的大小。首先,获得样本集的分数排序顺序从最小到最大,和70%的样本集在每个连续得分乐队被作为这个实验的训练集,剩下的样品作为测试集。这确保抽样的全面性和随机性。
英语仿真平台开发和智能标记系统包括三个主要部分:论文的形成,模拟考试,和纸标记(20.]。前面的一部分,本文主要介绍和研究智能标记算法部分,不介绍审查标记部分的设计和实现。改善整个系统的功能检测和标记,本章主要介绍了仿真平台的设计与实现和高考的智能标记。
本系统的主要功能是为高中学生提供自主学习的一种方式,尤其是那些已经毕业但想要高考,,有困难及时标记从教师;即使是学校的学生,有很多的压力由于辅导教师面临学生的大学入学考试。学生可能没有任何人庆祝他们所做的试题,和老师可能没有时间大量的试卷。这个系统是一个研究系统开发解决这个实际的社会需要一个模拟高考。
学生系统的直接需求者。使用这个系统之间的显著差异和传统自学,第一,时间控制,其次,“老师的及时反馈。“所谓的时间控制,在传统的学习过程中,学习者往往关注他们是否可以解决这个问题,但往往忽略的能力在一定时期内完成的问题。这个系统特别是模拟高考的整个论文和每个问题的答案类型。和所谓的“从教师、及时反馈”系统,以弥补手工标记想做但很难做到“及时反馈:”。你可以说,系统可以给你测试的结果“立即”当学生们提交他们的论文。与手动标记相比,教师通常需要至少一天给反馈。
在此系统中,学生可以参加在线考试成功登录系统后,选择考试功能。考试页面应该设置一个倒计时功能,这样如果时间耗尽,系统自动保存答案表并提交试卷。考试结束时,你将能够查看结果在时间和理解你的错误的原因分析的基础上测试问题。这可以让学生快速了解正确的测试问题的基础上,测试问题的答案时仍在他们的头脑中。在线模拟测试系统,测试学生的问题和答案可以记录下来。当学生需要找到试卷,他们可以快速找到测试论文直接通过搜索功能,这样的试卷不容易丢失。它不仅可以节约学生的时间在寻找论文论文也可以永久保存不占用桌面空间有限。对学生的错误,他们可以添加到未来回顾错误的书。经过一段时间的在线考试,学生的考试记录将生成一个图表显示当前的趋势学生的考试表现。有效地传输多个高精度导航信号的L1乐队,GPS全球导航卫星系统是设计用来传输多个信号在同一中心频率,信号光谱重叠严重,所以内部系统的干扰成为主要的考虑。 Through detailed analysis of the attenuation values of the carrier-to-noise ratio of the M, L1C, C/A, andP(Y)编码在GPS L1乐队,这是发现,CDMA干扰的主要来源是内部干扰,除了C /代码,这是受到更严重的干扰,和其他三个信号受干扰较少。
系统认为教师评分的困难阶段,学生回答后校正阶段论文和解决问题这两个方面。首先,辅助问题系统可以分析文本是否适合当前应试者根据老师的阅读理解试题。它主要是基于词的比例水平文本。例如,如果一个高中生低6级词汇和文章包含更多的6级词汇,应试者回答问题会有一些困难。第二,学生的反应是使用智能标记技术得分后回答。客观的问题是使用字符串匹配方法,虽然这篇文章的问题标记使用本文提出的智能标记技术。管理员,系统管理员,负责管理老师,学生,和类(21- - - - - -24]。管理员在这个系统的位置相当于教学和研究团队的负责人和评论组完成的论文老师和批准之前提交的文件系统。考试管理包含几个重要功能,设置考试,考试房间打开和关闭。设置考试允许您设置状态,模型,检查室的名称,等等。在提交的设置,测试文件系统被释放。
最重要的功能老师角色的管理问题银行和大会的论文。英语考试问题略有不同于其他科目。而我们常见的测试系统是一种类型的问题和几个次要的内容,英语考试是一种类型的问题和几个大的问题和几个次要的大问题,其中最典型的是阅读理解。当你看的英语考试近年来,阅读理解分为四篇短文,每一个都有不同数量的子主题。对于这种问题数量可变的次要的内容,不可能简单地使用固定数量的次要的内容在每个大问题。因此,本系统采用动态调整方法首先进入干测试的一部分问题,和其余次要的内容形成一个相关的主要问题。数据库表设计的主要和次要的问题测试如表所示1。
英语模拟平台和智能标记系统的高考涉及三个主要角色的教师、管理员和学生,其主要的流程图如图2。
提高系统的安全性,防止不道德的人使用机器方法破解用户密码,系统需要输入一个验证码登录。验证码是一个很好的方式,以防止机器结合用户名尝试密码多次,从而实现密码破解的目的。这台机器不能识别或识别验证码,在短时间内破解密码。同时,系统为每个用户将暂时停止接受登录超过5不正确的登录密码。这个功能实现通过添加登录错误的数量和时间5日登录错误的用户数据库。如果用户登录连续5次失败,将注册登录失败的时间,会出现一个弹出消息,用户可以尝试重新登录后5分钟。五分钟后,如果用户成功登录,登录失败的时间将更改为0和5日登录失败的时间将被清除。
基于上述,本系统使用单独的条目或大或小的问题和设置困难的问题当进入测试问题。当教师进入测试问题,他们进入的第一个屏幕是大屏幕问题条目。问题是作为阻止信息的问题或输入文本内容的阅读理解。更容易搜索条件,您需要选择的范围问题,当进入问题。
下拉列表包含所有GCE英语考试问题类型,你可以设置问题所属类别通过选择问题类型。控制测试的困难问题分组文件时,您需要选择当前测试的测试困难的问题。大问题也要求条目的条目,和所有必要的字段需要填写当前的大问题条目之前提交。如果有必填字段不填满,系统将使用红色字体显示不符合需求的内容项。
4所示。分析的结果
4.1。智能算法的结果分析
在本文中,我们测试中的得分运行时的传统VSM和本文的混合智能评分模型和不同数量的学生响应文本根据测试标准的描述,如图3。的得分运行时中的传统VSM和本文的混合智能评分模型检测不同数量的学生响应文本特征向量,如图3。执行时间的混合模型和传统VSM模型随着学生数量的增加响应文本和功能词在每个响应文本向量的数量增加。然而,由于采用LDA用于文本降维在这个模型中,这个模型的运行时间线性增加和快速测试文本和功能词向量的数量增加,而传统VSM的运行时间几乎没有显著的影响。运行时不如传统的向量空间模型(VSM)。
精度测试本文指的是混合分数评估之间的协议的智能专家评分模型和成绩评估。均方根误差(RMSE)可以准确、有效地反映了小错误的分数之间智能评分系统和专家们的分数;RMSE越小,越接近智能评分系统的成绩和分数的专家。因此,均方根误差值是选为文本精度测试和分析的基础。摘要智能评分模型非常接近的分数由专家给出λ= 0.1,这表明本文中的混合智能评分模型具有较高的精度。进一步测试混合智能评分模型的准确性,我们测试了均方根误差(RMSE)不同数量的学生的反应和传统VSM成绩时λ= 0.1,如图4。时的值λ是合适的,这个模型的均方根误差小于传统模式,表明此模型的准确性优于传统VSM。
同时,由于智能评分模型的线性组合,根意味着平方误差时的两个模型λ值改变模型中也可以反映出传统VSM的准确性和本文的模型,如图5。这进一步表明,智能评分模型的准确性优于传统VSM的时候λ适当的价值选择。
建筑性能的混合智能评分模型和传统VSM模型的时间效率比较根据预定义的测试用例,如改变学生的数量响应文本和学生响应文本特征向量的个数,和建筑性能的混合智能评分模型和传统VSM模型空间消耗的比较在相同的测试用例。同时,表现在时间效率和空间消耗之间构建本文的混合智能评分模型和建筑中的传统VSM模型相比,在相同的测试用例。然后,我们现在具体的例子混合智能评分模型的得分和专家评分在本文中以表的形式。最后,本文的混合性能的智能评分模型的精度测试指标是通过统计图表直观地展示,也就是说,尽管本文的混合智能评分模型比传统VSM模型的算法运行时间效率和空间消耗,这成为本文的混合智能评分模型的瓶颈。
4.2。系统性能结果分析
之前进行系统测试,模拟的20个学生的反应是预处理和导入到数据库,然后是原型系统被用来协助老师标志着分数,,最后,辅助标志的分数比较分数的手动标记,和统计结果如图6。
从上面的测试报告表和评分比较图表,它可以分析原型系统的主要模块或功能可以满足预期的需求和设计要求,并通过辅助原型系统的评分结果标记通常符合手工标记的得分。有两个可能的原因错误的几个学生的成绩:一方面,它是由于教师添加他们的主观理解标记时,例如,考虑到学生的解决方案和他们的答案的逻辑顺序;另一方面,这是由于缺乏完美的构造域的单词列表或相对缺乏这个词分离过程的准确性。在随后的研究和开发,该系统将在两个方面:改善算法的设计和改进和测试数据的数量,提高评估的准确性。
软件测试是一个重要的工具,以确保软件的质量和可靠性。其根本目的是能够探测到尽可能多的逻辑和代码中潜在的错误之前提供一个软件程序。软件测试技术包括静态测试方法和动态测试技术。其中,静态测试技术包括代码审查和技术审查在需求分析阶段。动态测试包括白盒测试和黑盒测试。白盒测试是代码的逻辑与控制结构已知的程序,和所有逻辑和控制结构需要被测试覆盖根据代码表示。黑盒测试主要是测试各种功能的实现,以确保软件能达到设计的目的。
四个核心算法的实验数据是通过MATLAB长椅上独立运行30倍,和迭代的最大数量为每个运行设置为100。图7显示了四种算法的均值和方差后获得独立运行30倍,粗体和最优值。
值越小,更好的学习路径的实际需要相匹配的学习者和学习质量越高;相反,它不匹配需要的学习者。通过比较这三组实验数据图7,我们发现随着知识的数量的增加点,MABPSO算法的收敛精度最好,但方差是最好的只在实验1中,这是没有不同于其他算法,表明MABPSO算法的稳定性是可以接受的。实验2的数据,实验4,实验5,和实验6只不同数量的学习者。通过观察这三组实验的数据图7,我们发现MABPSO算法具有最好的收敛精度随着学生数量的增加,相同方差并不是最好的,但不同于其他算法,这表明MABPSO算法的稳定性是可以接受的。
算法的收敛图可以清楚地显示每个算法的优化搜索过程,并优化搜索过程可以观察到的比较优化每个核心算法的搜索性能。图8显示了实验排斥程度的收敛图的功能。
通过比较平均收敛曲线总优化功能的健身知识在不同数量的点,我们可以看到MABPSO核心算法的收敛速度和收敛稳定性最好,这表明MABPSO个性化学习路径优化的核心算法满足学习者的需要更多的知识点数的增加和显示更好的优化速度和匹配度。首先,介绍了个性化学习路径优化方法作为一个整体;其次,个性化学习路径被认为是一个组合优化问题,最小化的解决方案,和解决方案过程阐述了个性化学习路径的优化方法;最后,个性化学习路径的操作性能优化方法分析的optimization-seeking准确性和optimization-seeking过程,与基本的全局搜索算法,通过比较LPSO算法,RPSO算法,RPSO算法。
5。结论
论文评分算法,支持向量回归算法是用于正常的文章符合要求的问题。由于高分的文章,使用分类算法需要分类均获得部分,这可能会导致高时间复杂度影响得分效率的执行。因此,采用支持向量回归算法适合回归曲线正常文章的分数,虽然分数查询学生提出了使用四舍五入。研究英语写作和阅读国内外文献显示,没有等项的声音在论文评分的特点。本文从侧面反映了学生英语学习水平通过检查英语语感。它还借鉴了国内外提取成分特性的全面评估学生的作文。本系统采用的相关性主要和次要的问题和实现的英语考试的问题通过周期性输入小问题与相应的主要问题。通过两者的有机结合,既可以在线参加考试学生根据教师的需要和实现整个组测试的标记文件通过计算机。它解决了问题,主流测试系统在市场不能马克主观问题,添加了英语语言特征的提取,提高了模型的评分算法来实现提高精度的目的。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突。