文摘

进一步解决问题的存储瓶颈和过度计算时计算估计在两种不同格式的大量的纵向数据,检查数据分析和评价方法提出了基于一种改进的线性mixed-effects模型。首先,三步估算方法提出改善linear-effects模型的参数,避免了最大似然估计的迭代步骤复杂。其次,我们基于测试数据进行谱聚类的基础上定义数据属性和基本评价规则。最后,基于云计算技术,一个跨区域、多用户教育考试大数据分析和评估服务平台开发评估拟议的方法。实验结果表明,该模型不仅可以有效地提高测试数据采集和存储的效率,也减轻计算负担和内存使用量,解决内存不足的问题,提高计算速度。

1。介绍

如今,大数据的时代影响许多行业。其中,教育行业也加强了教育考试通过使用大数据技术(1]。在传统教育考试,教师很少理解考试的作用。老师认为考试只能提供一个简单的了解学生的知识和技能。然而,结果衡量传统教育考试有许多不确定因素(2]。教学考试,学校可以开展大规模的网络教育考试和在线学习。只要他们从大数据的角度来看,学生可以参与在线学习活动。通过互联网在学生学习的过程中,教师可以准确地把握学生的状态的学习能力发现学生的不足,同时,可以提高学生的非智力因素,如情商、价值观、学习动机,和热情。

教育考试大数据分析和评价是我学生的原始测试数据,反馈大量信息和数据中隐藏的法律关系,并协助教育部、教师、和学生分析测试结果的形成原因。测试结果之间的关系和构建学生的实际能力,提高教育的过程和方法,在此基础上评估。科学、准确、全面的测试数据分析和评价具有重要意义的学生“自我诊断、教师反馈和总结,和教育测试政策制定,这是体现在3]:(1)一个理性的自我诊断可以帮助学生了解自己的长处和弱点学习和提高他们的自我效能感和自我心理(2)教师可以分析和总结测试结果,联系教学、反馈教学,对教学进行反思(3)教育行政机关可以调整教育考试政策和改进考试评价通过考试的形式和方法评估和分析结果(4)通过多维分析学生的测试结果,家长和学校之间的信任与合作可以加强,为联合开发提供参考学生的个人学习和生活计划

然而,当前的考试数据分析和评价主要有以下缺点4]:(1)检查数据的简化处理(2)模糊测试结果的分析(3)简化的测试结果反馈

然而,当前的测试结果可以很容易地导致简化测试问题系统的僵化,失去活力的测试问题,这并不有利于教育当局的控制。整个教育教学情况制定适当的教育教学政策。

随着信息和网络技术的快速发展,数据增长和变化的速度是惊人的,显示趋势的数据大规模量化(5]。传统的线性混合模型估计方法在大规模数据遇到了一系列的挑战,比如存储瓶颈,计算效率,和其他问题6),因此有必要探索新的算法来改善之前的线性混合效应模型的评估方法。为了构造最优估计系数的线性混合效应模型,(7)提出了一种基于协方差的加权最小二乘方法的结构,但这种估算方法的效率密切相关的协方差结构纵向数据的估算方法。有一些常用的协方差结构评估方法,包括最大似然法和有限的最大似然法。然而,这些方法需要反复迭代计算和优化步骤,这将导致高成本计算时间和数量的数据量是非常大的。

为了解决这样的问题,8)提出了一个简单的方法研究随机效应估计方差组件变系数模型。这种方法不需要迭代计算,可以适应大量数据情况。然而,直接使用矩阵形式的加权最小二乘法估计模型系数会遇到存储问题,因此,分治算法已经提出,已广泛应用于大量数据的统计计算(9]。分治算法的核心思想是先将一个复杂的问题分解成几个子问题,找到解决这些子问题,然后用一个合适的方法将每个子问题的结果得到整个问题的结果。提出的分治算法(10)是最实用的方法来解决大规模数据分析的问题。文献[11)结合分治算法的最小二乘方法解决大规模数据下的线性回归模型的估计问题。数据集被分为一系列可控的数据块。然后,最小二乘法是独立运行在每个数据块,每个数据块最后的结果集成得到最终结果。但是,先前的学者只利用分治算法解决简单的数据模型的估计问题在大量数据和没有研究更复杂和更广泛的估计算法利用线性混合效应模型在大规模数据。

基于加权最小二乘估计线性mixed-effects模型系数法(12)和方差分量的估计方法和分治算法(13),本文提出了一种改进的线性mixed-effects模型(14]。首先,三步为线性混合模型参数估计方法提出了基于传统的线性mixed-effects模型。估计方法,基于最大似然估计的迭代计算或有限最大似然估计是避免大量数据的要求。然后,基于两种不同情况下的大规模数据,分析规则算法计算步骤的估计量。实验表明,本文提出的算法不仅可以减少内存使用量,解决存储问题也缩短计算时间,提高计算速度。针对单一、片面的和复杂的教育考试质量评价过程的特点,以及由此产生的不科学的和抽象的考试评价问题,基于改进的线性混合效应模型中,我们已经开发了大量的教育考试大数据和应用程序的分析方法,包括以下。(1)定义测试数据属性,包括属性和反向属性,并建立梯度评价规则(2)的基础上定义数据属性和基本评价规则,执行分级过滤基于谱聚类的测试数据来确定基本组集群(3)基于梯度评价规则,集群是两次纠正避免unscientificity单一的分数评价机制(4)基于云计算技术,跨区域、多用户教育考试大数据分析和评价服务平台

应用结果证明,该平台能有效提高测试数据采集和存储的效率,同时,为教育管理者提供有效的分析工具和实施部门。

2。改进的线性Mixed-Effects模型

2.1。线性Mixed-Effects模型及其估计方法

考虑纵向数据的线性混合效应模型:

在这里,未知参数 是一个 空间固定效应向量, 是一个 维随机效应向量, ,分别代表了协变量相关。假定随机效应 ,和模型误差 满足条件的独立和相同的分布,和 是相互独立的。

为了避免迭代计算,提出了三步估计方法估计的方差分量和固定效应的线性mixed-effects模型,分别。的一致性和渐近正态估计可以通过使用证明(类似的步骤15]。因此,本文只考虑了估计算法。首先,我们使用最小二乘法进行初步估计的系数。让 ,在哪里 类似的定义,表示 , , 然后,(1)可以reexpressed如下:

模型的最小二乘估计系数直接通过(2)。然后,初步估计也可以得到以下方程:

第二,方差分量估计。我们使用的原则15估计方差分量

,然后 ,此外, ,然后 ,此外, 因此,随机效应的估计价值 可以使用最小二乘法得到的 ,在哪里 是未知的,所以估计价值的 可以代替吗 得到 此外,请注意, ,然后是模型的残差平方和 因此,

据估计过程(15),进一步考虑系数的估计价值的影响 ,方差的估计可以构造类似: 在哪里 , 的尺寸是 , 的尺寸是 接下来, 根据估计的定义 : 此外,我们有以下方程:

通过直接计算每个项目的第一和第二的时刻,它可以证明,最后两项的顺序(6)是 ,所以它与其他项目相比可以忽略。因此,

所以,我们可以获得

最后,计算出的加权最小二乘估计

从(6)和(8),获得以下:

根据加权最小二乘估计的方法(13),我们可以得到

或者我们也可以使用示例求和的计算方程(12)(13]:

2.2。改进的线性Mixed-Effects模型大规模教育大数据分析

考虑两个场景的大规模数据:(1)单独的数据量较大,但在该集团的数据量比较小,(2)个人数据量较小,但集团更大的数据量。

此时,存储和计算效率低下会遇到瓶颈,和前面提到的估计方法不再适用。因此,在这两个场景中,分治算法用于调整三步估计方法。

2.2.1。单独的数据量很大,集团内的数据量很小

是整个数据集。根据分治算法,数据集 分为 子集 样品的数量在每个子集 ,和数据中包含的每个子集 ,在哪里 , , ,和数据中包含的每个子集不能超过单个机器的处理能力。首先,我们已经初步估计计算。还记得 , , , 类似的定义, , , 根据前面提到的理论是定义良好的。然后,相对应的数据模型 - - - - - -可以写成子集

最小二乘估计为每个subdataset直接 , ,根据分治算法,将每个子集的结果,保存每组 , ,最后获得初步估计:

其次,我们利用分治算法估计方差分量。记住, , 类似于(4),所以我们可以得到

因此,我们可以获得

在前面的小节中,我们可以看到

在(14)~ (16),数据计算和保存相应的每个数据子集 最后,加权估计模型系数 计算。根据计算公式(15)和(16的协方差矩阵)的方差分量 - - - - - -subdata模型估计 利用加权最小二乘法估计每个子集 ,可以看出,数据 , 保留,每个子集的综合结果得到:

2.2.2。单独的数据量很小,和小组的数据量很大

首先,我们有分治算法适用于每个人。让 , ,把数据 子集 ,和样品的数量在每个子集 数据包含在每个子集 , ,在哪里 , , ,和数据中包含的每个子集不能超过单个机器的处理能力。首先,我们已经初步估计计算。还记得 , , 类似的定义,和相对应的数据模型 - - - - - -th的子集 - - - - - -th个人

对于每个数据集的每个人,直接最小二乘估计 , , 根据分治算法,综合每个和每个子集的结果,保存每组 , ,最后获得了初步估计:

其次,利用分治算法估计方差分量。记得的定义 类似于(4),所以我们可以得到

因此,我们可以获得

它可以看到从一节2.1 根据(20.)~ (21),对应于每个子集,数据计算并保存 最后,加权估计模型系数 计算。

根据计算公式(21)~ (22的协方差矩阵)的方差分量 - - - - - -subdata模型 - - - - - -个人估计 权重应用于每个人的每个子集,和最小二乘估计

可以看出,每个子集的数据保留每个人:

3所示。应用程序架构的改进模型在大规模教育考试大数据

3.1。数据属性

连续得分属性定义的测试数据是通过结合测试数据挖掘主题,测试学生的特点,梯度评估规则和二次校准目标(16]。以客观问题类型为例:选择题有四个答案,其中一个是正确答案。然而,从命题的角度,其他三个选项并不是随便说没有基础,还有一些错误的选项是正确答案“关闭”。学生选择了错误的选项的原因不在于他们不了解这方面的知识,而是因为他们是不充分或粗心的和欺骗的迷惑选项。在传统的考试评估过程中,这个功能并不准确反映。

相反,有个人选择没有任何联系的知识,并选择此选项可以判断这个点的学生没有知识。显然,这两种类型的对象是不同的,所以考试分析和评价应该以不同的方式对待他们,进行有针对性的指导和治疗。此外,对于不同的测试目标,检查学生的能力不应该仅仅基于考试分数。一些评估目标希望得到学生的综合能力评估,包括实践能力,专业,兴趣,等等。因此,在测试的命题问题,对于不同的问题类型,不同的答案,和不同的测试目标,积极的和消极的多维属性定义的测试数据,并建立了测试数据的多维属性模型(17]。数据模型如图1,除了得分属性。事实属性设置在同一时间,以反映测试的实际掌握知识的考生和二次校准提供数据依据。

根据数据模型的定义,考试评价也分为两类:定期评估规则和修正的规则。定期评估规则只包含某一测试的测试成绩。修正规则包括梯度评估候选人的错误答案,通常的结果,测试结果,特别爱好,家庭背景,父母的职业,等等。梯度评估错误的答案可以用来找到一个特殊群体的学生由于特殊原因的答案是错误的。通常的分数是用来评估学生的平时学习状态。考试成绩的直接评价某一阶段的学习。特殊的爱好对学生综合评价很重要。根据基础,家庭背景和家长的职业调查学生的专业的一个重要因素,部分科目。同时,不同家庭背景的关系,父母的职业和学生的学业成绩进行分析18]。

以客观的问题为例,在四个选项中,只有正确答案得分100,令人困惑的答案设置检查一个特定的点可以被定义为一个知识得分的50到70据之间的相关性程度,它和正确的答案。比分是0完全无关的选项改变话题,调查知识要点。此外,我们建立了一个统计规则。如果一个学生选择了错误的选项一定学科考试,有更多的选择是高度相关的知识点检查,然后比分可以增加重量错误的选项。相反,如果有更多的选择错误的选择较低程度的相关性,比分重量应适当减少。修正规则可以客观地反映了参与者的理解知识的测试点。事实评价规则可以发现专题组织,如“粗心的错误,”“一无所有”,和“随机选择”,并提供有针对性的指导和治疗。为了实现这一目标,本文首先对测试执行基于谱聚类分层过滤数据19),然后对每个数据集群执行二次校正是分层过滤。

3.2。基于谱聚类分层过滤

聚类识别和分类的过程中根据一定的规则和要求。在这个过程中,没有先验知识分类,只有事物之间的相似度作为分类的标准。与传统的聚类算法相比,谱聚类的优点是能够在任意形状的样本空间集群和收敛于全局最优解。谱聚类算法可以简述如下:给定一个数据集 , ,根据数据集 ,一个加权图 建立了, 的顶点集, 是连接顶点的边缘 每个节点 图中 有关 在数据集 一个相似准则是用来构造相似矩阵 图的顶点之间 ,

两个对象 ,相似之处 定义 相似矩阵的算法的输入 图的 和集群的数量 和输出的聚类结果 基于谱聚类的分层过滤算法添加答案的距离矩阵数据对象特点的基础上测试答案数据对象基于谱聚类和获得一个谱聚类算法适合回答数据分析(20.]。假设调查问卷数据对象 的研究 测试点,表示为 ,的距离 两个调查问卷数据对象 可以定义如下: 其中, , , ; 根据调查问卷的数据对象之间的距离,相似 调查问卷数据对象之间的关系 两个对象可以定义如下: ,通常情况下, 分层过滤和分析算法的谱聚类算法回答数据包括以下步骤。(1)读入数据库记录的考试。回答集表示为数据对象 , 其中, 答案是信息的 - - - - - -th主题, 是数量的问题。我们已经计算距离矩阵 的答案表数据对象。(2)计算相似度矩阵 的回答数据对象。的顺序矩阵 矩阵的顺序是一样的吗 (3)计算扩展邻接矩阵 根据相似度矩阵 ,建立一个对角矩阵,表示 ,和矩阵的定义是 (4)计算矩阵的特征值和特征向量 ,选择第一个 特征向量 ,构造一个矩阵 的特征向量 列,比较矩阵的每一行 是统一的。(5) 相对应的向量 - - - - - -矩阵的行 使用 - - - - - -意味着算法,聚类向量 (6)建立一个映射 根据之间的对应关系 ,行向量的聚类结果 矩阵的 在步骤(5)是用来确定点的结果 在集群。

3.3。二次校正算法基于改进线性效应模型

基于谱聚类的分层过滤是第一个主题分类过程。在分类过程中,只使用受试者的测试成绩信息。然而,在一些特定的选择过程,只有分数用来衡量考生的能力似乎不够科学,不能真正反映考生的整体能力和特殊情况造成的特别小组在检查过程中。因此,在第一层次的基础上筛选的测试成绩,两次聚类结果修正(21]。以一个单一选择客观选择题的问题为例。假设一个测试问题有四个答案a, B, C, d。其中,一个是正确答案的评分 ;B是一个密切相关的答案得分 ;C是一个弱相关回答得分 ;D是一个无关紧要的回答得分 和值区间 假设试题的数量 ,和某个学生回答的问题 ,在哪里 错误的数量与重量的问题 , , 错误的答案 , , ,分别为, 然后,最后修正的分数 的参与者记录如下:

同样,为多项选择题的问题,假设有6个选项A, B, C, D, E, F的问题,正确的答案的数量与一个不正确的回答这个问题 , 正确答案选项的数目选择的参与者 , 错误的答案选项的数目选择的参与者 , 然后,参与者给正确的答案。最后的分数 这个选择题的问题定义如下:

基于前面提到的描述,一个新的校正和测量可以在参与者的实际能力基于分类的基本考试分数。第二次修正算法描述如下。(1)输入单一选择的总数和多项选择题的问题 ,开始和结束的问题数量的单一选择和多项选择题,每个分数的 对于每一个单一选择,多项选择问题,并输入多项选择题的答案评分标准表,表中每条记录是三倍 (2)扫描的答题纸上。(3)对单一选择问题,改正分数计算单一选择问题 根据(26)。(4)多项选择题,计算选择题分数问题修正 根据(27)。(5)计算校正总分 分层过滤和二次修正后,每个主体有两个分数:真正的得分和纠正得分。每个主题在自己的集群。这将分析测试考生能力的主体和教师提供一个更准确的判断依据。

4所示。仿真实验和结果分析

4.1。改进的线性Mixed-Effects模型的实例分析

为了比较与最大似然估计算法本文方法(12),验证本文算法的优势在计算时间方面,和测试算法的可行性同时,Matlab软件用于数值模拟和实验。实验的硬件平台上执行英特尔i7 9700 k CPU与16 GB记忆机器,运行在Windows 10操作系统。假设纵向数据的线性mixed-effects模型如下:

在方程中,我们考虑两个示例场景下大量的数据。方案(1):个人的数量很大,但集团的数据量很小。两个样品被认为是如下:(1) ,和总样本量是100,000(2) ,和总样本量是1000,000场景(2):有数量有限的个人,但在集团是大的数据量。样品 此外,该参数系数 ; ,在哪里 , , , , , 是相互独立的。 , , 都是独立同分布在 ; , 都是独立同分布在 ; ,在哪里 , 是相互独立的。迭代模拟是50倍的数量。

以下4.4.1。场景的仿真结果和分析(1)

在两个示例场景(1)的情况下,最大似然法(12)和本文算法用于估计模型系数和方差分量,分别计算两种方法所使用的时间和估计精度进行了比较。

(1)估计精度和计算效率。的均方误差(MSE)是用来测量模拟之间的偏差估计价值和真正的价值,和估计精度进行了分析。更小的均方误差值会导致更高的估计精度。均方误差的计算公式如下:

在(29日), 是模拟的数量, 参数的真正价值, 是参数的估计价值获得的吗 - - - - - -模拟。计算时间和均方误差值在两样本大小情况下(1)通过仿真得到如表所示1

从表可以看出1的均方误差值模型参数极大似然估计的方法和本文的算法都是小,表明参数估计效果更好、估计精度较高。此外,与最大似然法相比,该算法可以提高操作效率,而几乎没有减少四倍估计精度,表明该算法可以大大减少计算时间,提高计算速度。

研究之间的关系计算时间和subdataset块的数量和说明使用分治算法的必要性块计算,数据在两个样本大小分为不同的数据块数字,和估计参数记录。样本的计算时间之间的关系(1)和样本(2)和数据块的数量显示在图2。图中的数据生成的示例使用的是时候求和方法。

从图可以看出2,当 ,加权最小二乘方程(11)是直接用于估计模型系数。在这个时候,它将超过内存,无法计算。根据样品(1)和(2),即当 10000年和100000年,分别使用示例和方程(12)估计模型系数。 表中的其他值,根据本文算法计算。当 慢慢的增加,所使用的时间逐渐减少。在一个适当的值 ,如2000年和20000年的样本(1)和(2),分别计算时间最小化与样品和方法。运行速度可以增加了超过20%。这是因为当 增加,样品分配给每个数据块的数量减少的同时,也减少了计算时间。与此同时,在和固定的独立处理能力有限的情况下,一定程度的数据是适当的。最好的计算速度可以实现在单一的机器的数量。更大的数据量,在实践中,通常达到数百万甚至上千万,本文算法的效果会更好。总之,本文的算法可以减少内存开销和计算时间,提高计算速度。

4.1.2。场景的仿真结果和分析(2)

在场景(2),计算时间之间的关系本文使用的算法和数据块的数量显示在图3。图中的数据生成的示例使用的是时候求和方法。当 ,使用示例求和方程(12)计算系数。当 需要其他值计算了该算法,可以看出时间的变化趋势与场景类似数据块的数量(1),和当 ,计算时间达到最小。同时,最大似然法用于计算场景的模型参数(2),使用的时间是2269.71秒,这再次证明了本文算法的效率。

选择数据的年度国内生产总值(GDP),工业产出,消费品零售总额。为选定的数据,我们固定资产投资和城市居民的储蓄在285年末余额从2006年到2010年全国地市级。地区生产总值( )作为响应变量和工业总产值( )和社会消费品零售总额( )不固定的效果。考虑到固定资产投资( )和年终平衡城乡居民的储蓄( ),这些因素也会影响地区国内生产总值。因此,这两个因素作为随机效应的一部分,和线性混合效应模型建立:

把数据放入(30.)表明,此时数据结构符合场景(1),所以场景中的估计算法(1)是用来估计参数。具体结果如表所示2

从表可以看出2的系数工业总产值和社会消费品零售总额都是积极的,这表明这两个因素积极影响地区生产总值和构建的模型是有效的。因此,增加地区GDP,我们必须努力提高工业生产的水平,增加社会消费品零售总额,增加人们的收入,改善消费环境,稳定价格水平,并解决医疗、健康、和就业问题。

4.2。大数据实证分析大规模教育考试
4.2.1。准备大规模教育考试大数据系统的体系结构

为了验证分层过滤的效率和准确性和二级修正策略测试大数据分析,云computing-based教育测试大数据分析和评估服务平台开发。整个平台的建设包括一个中心、两级应用程序和三层的子系统。该系统的整体架构如图4

该平台主要包括三层:基础设施层,公众支持基地层,应用服务层。功能模块如图5。基础架构层主要包括云基础设施和系统软件。它的主要功能是完成教育考试的分布式云存储数据。hadoop分布式文件系统(HDFS)系统基于云技术主要用于文件系统的组织和管理;公众基本支持层是评价分析系统,以及数据仓库的主要组件包括数据仓库的部分(22)和二次数据处理工具。数据仓库主要包括基本功能的实现部分数据收集、数据交换、数据挖掘和评估引擎。在单位的学校和学科,公共支持应用程序部分包括测试题库,数据清洗、试卷生成、历史信息分析、主题分析引擎,等等。应用程序服务层是平台的面向用户的服务模块,主要包括基本检查数据查询、在线评分综合服务系统,评估分析和管理子系统和测试问题银行应用系统。教育考试数据分析和评估云平台建造的这个项目通过这些服务直接与用户交互,因此这样的平台是最面向用户的部分。

4.2.2。大规模教育考试大数据分析的结果

对某门课程系统可以执行统计分析在一定阶级或执行统计分析在某一地区某一课程。此外,它还可以对所有学生进行统计分析在一定的范围内某一主题(23]。在二年级政治和英语考试在一定区域作为一个例子,受试者的原始分数和second-corrected分数计算,分别。统计结果如图67

从数据可以看出67的对象基本上是分为三类:第一类35到65分,第二类的分数为65至90年,第三类有90或更多的分数。同时,可以看出,在第二次修正,所有学生的成绩提高了与原来的分数相比,但第一个和第三个类别的增加显著小于第二类。第一类小增加的原因是,这一组通常有一个糟糕的学业成绩。因此,在考试过程中,错误的问题基本上是类型的不理解,所以校正范围很小。第三类小增加的原因是,这一组的性能已经非常高,和修正的空间被严重压缩。第二种类型的改进是相对较大的,因为这群学生的中产阶级,还有很大提升的空间。教师应特别关注和指导的问题导致的错误。

4.2.3。大规模教育考试大数据分析报告

云computing-based教育考试大数据分析和评价服务系统目前有13个省和全国100多个城市。考试数据采集、存储、分析和评估业务占40%的国家学术审查和分析评估业务市场。系统支持多种类型的报告格式,并提供相关分析报告对不同组的人通过各种参数。有三个报告主要包括如下:(1)学生报告。主要是学生用户报告显示性能的学生考试。分析了学生学生的总体形势和个人主题,指出他们的优点和缺点,并给出了有针对性的改进意见(24]。一个学生报告的一个例子是图所示8(一个)(2)机构报告。这里的机构覆盖了学校和学校的主管部门。机构用户报告主要表现整体机构的检查条件的学生在考试。该机构是统计分析的总体形势学生和学生的个人主题。有各种各样的指标,用于研究机构的长处和弱点。机构报告分为测试概述报告,机构主题报告,subquestion回答报告,机构知识比较,和学生知识的比较。机构报告的一个例子是图所示8 (b)(3)老师报告。老师的报告主要是基于知识的多维映射关系建立一对多的点,部分知识,认知水平和能力字段(13]。每个维度的得分项是主要的统计指标。样本组不同的候选人,成绩或类指出薄弱环节在教学和指导中发挥作用,灵感,并为教师的后续教学反馈。分析报告的一个例子是图所示8 (c)

5。结论

与大数据时代的迅速发展,现在,许多应用程序源自大数据也被用于教育考试。提出了一种三步估计算法,这样复杂的统计模型还可以应用于大规模数据。数值模拟表明,该算法可以大大减少计算时间,提高计算效率,解决计算机内存不足的问题在大规模数据。在改进的线性mixed-effects模型应用到大规模的教育考试大数据,本文进行了相应的平台架构和实验:(1)定义测试数据属性;(2)基于数据属性的定义和基本评价规则,该集团集群数据基于梯度修正两次评估规则,避免单一的分数评价;(3)基于云服务技术研究和开发是一个跨区域、多用户教育考试大数据分析和评估云平台。未来的工作将集中在如何减少之间的关系不同的大规模教育考试和大数据更加注意提高性能和效率分析。

数据可用性

原始数据支持了本文的结论将由作者提供,没有过度的预订。

的利益冲突

作者宣称,关于这项工作他们没有利益冲突。