文摘

知识跟踪(KT)建模的任务是学生根据他们的历史知识状态交互智能辅导系统。现有的KT模型忽略的多个知识概念之间的相关性问题,在线辅导系统的特点。神经图灵提出了一种基于机器skill-aware知识跟踪(NSKT)连接的能力,可以捕捉知识概念之间的相关性问题模型的学生的知识更准确和有效地发现更多潜在的知识概念之间的相关性。我们分析的特征三个真实的KT深度数据集。真实数据集的实验表明,NSKT优于最先进的深KT AUC的预测模型。本文探讨了预测过程的细节造型的NSKT学生知识,以及知识的相关性之间的概念和条件影响练习。

1。介绍

随着智能辅导系统的发展(同期)和大规模网络公开课的出现网络公开课()(1,2跟踪),知识起着重要的作用在提高个性化学习平台的效率。知识的任务是跟踪模拟学生的知识状态基于历史交互来预测学生的掌握知识的概念(;),可以锻炼KC,技能,或者一个概念(3,4]。

为了更好的模式学生的知识状态,提出了各种knowledge-tracing模型。在以前的研究中,贝叶斯跟踪(支架)是一个强大的知识knowledge-tracing模型。支架模型状态的学生知识概念使用隐马尔科夫模型(HMM)为每个KC [5]。

随着深度学习的发展,大量的深度学习模型应用于KT。克里斯皮应用递归神经网络(RNN)模型首次学生学习过程,提出了深入了解跟踪(DKT) [6- - - - - -9]。动态键-值记忆网络(DKVMN)使用一个静态内存称为密钥和动态内存称为价值发现潜在的锻炼和知识概念之间的关系(10,11]。Self-attentive知识跟踪(SAKT)提出了一个self-attention-based KT模型模式学生的知识状态,与练习注意查询和学生过去交互注意键/值(3,12- - - - - -15]。

然而,上述作品只关注学生的运动交互和忽略的问题之间的关系和技能。模范学生不能仅仅关注学生的知识状态准确地交互。知识跟踪模型开始关注知识概念的结构(16- - - - - -18]。

深层次化模型跟踪学生的知识状态通过捕获问题和知识概念的层次结构16]。尼尔·霍夫曼的最新工作考虑的问题信息知识概念所属(17]。基于知识跟踪认为周边知识概念之间的影响(19- - - - - -22]。两偶图是一种有效的结构模型来捕获潜在的问题和技巧之间的关系(18]。这个方法是有效的,但是计算量巨大,因为它需要提取问题和技能,分别。因此,它很难被视为一个精简和有效knowledge-tracing模型。

以上KT模型充分利用multiknowledge概念信息的问题。现有的知识跟踪模型无法捕捉到潜在的问题之间的关系和概念简洁和有效的。我们知道问题通常由多个知识的概念,它实际上是密切相关的。为了更好的模式学生的学习过程,我们的模型是由使用神经图灵机(特种加工),这是memory-augmented神经网络的实例(曼),有一个很大的外部内存容量(23- - - - - -25]。因此,在以上的基础上深入了解跟踪模型,我们提出一个NTM-based skill-aware knowledge-tracing模型。我们工作的亮点是利用问题模型的知识概念成分信息学生的知识状态更准确和有效地发现更多潜在的知识概念之间的相关性。本文的贡献总结如下:(我)我们处理现实世界的KT详细数据集和发现新的网上辅导系统的特点和知识跟踪数据集。(2)我们设计一个question-skill字典算法获得的连接技巧问题。输入编码包含学生的回答信息交互信息和相关的知识概念。(3)我们应用神经图灵机到跟踪创新知识提高我们的记忆能力模型和预测学生的掌握知识概念准确、有效地发现知识概念子结构。(iv)我们提出一个新的NTM-based skill-aware knowledge-tracing模型结合的技能并应用一种新型优化损失函数来深入了解跟踪技能意识增强模型的能力。我们的模型考虑了连接的知识概念信息包含在一个问题的过程中造型学生的知识状态;因此,我们的模型优于现有KT模型。

本文的其余部分组织如下:部分2提出了一个简要的概述跟踪相关工作领域的知识。节3,我们制定的过程执行knowledge-tracing NSKT任务。然后,部分4介绍了在线辅导系统的特点和分类。NSKT模型的细节提供了部分5。实验结果和模型的性能的比较真实的数据集给出了部分6。节7的过程中,我们详细讨论NSKT造型学生的知识状态。部分8给出了结论和未来的研究工作。

在本节中,我们提出的模型和方法的简要概述相关工作领域的知识跟踪,可以分为两大类,如表所示1

2.1。项目反应理论

项目反应理论是最常用的认知模型来预测学生的掌握知识的概念在1995年知识提出了跟踪之前(26,27]。红外热成像的基础上,学生的知识状态的认知模型基于因子分析后提出:LFA [28]和PFA [29日]。这些逻辑回归模型预测学生的掌握知识的概念,通过分析之间的关系因素影响学生回答的准确性(30.,31日]。

2.2。知识跟踪

贝叶斯跟踪(支架)模型知识学生的知识状态使用隐马尔科夫模型(HMM)对一个知识概念,即表示为一组二进制潜变量(5]。

与深度学习的兴起,深入了解跟踪(DKT)提出了6),将学生的历史交互模型时间序列和学生的知识状态的递归神经网络(RNN)。实验结果表明,DKT有强大的建模能力学生的知识状态。DKT之后,很多深KT模型提出了改进的AUC预测学生的掌握知识的概念。然而,大多数的这些深knowledge-tracing模型只关注学生知识的交互概念和忽略的结构性问题和知识概念之间的关系。

2.3。跟踪Question-KC关系知识

岑等人提出了两个红外热成像模型(加法因子模型(AFM)和连接因素模型(CFM))模型结合的技能在学生数据集(32]。AFM和CFM考虑连接技能信息包含在一个项目的概率来预测学生回答正确的项目。

深度层次知识跟踪(DHKT)开始关注知识概念之间的层次关系和问题来预测学生的表现16]。DHKT列车平均嵌入的嵌入问题属于问题的技能。模型使用一式两份的图能有效捕捉知识概念和问题之间的关系和系统pretrain嵌入每个问题[18]。尼尔·霍夫曼的最新作品开始关注知识的体系结构概念和问题(17]。

3所示。问题公式化

一般来说,KT可以制定一系列监督学习问题:学生的互动时间戳的元组 , 代表的组合技能(运动)回答,如果回答正确的技能,所以 , ,在哪里 是独特的训练数据集的数量。考虑到学生的过去运动相互作用, ,KT的目标是预测学生回答问题的概率 正确地在下一个时间戳 , (3,6,10]。

可以看出,现有的KT模型只有关注学生的交互运动,所以他们很难预测学生有效地掌握的技能。本文中使用的符号如表所示2

定义1。相关知识的概念(RKCs):相关概念(RKCs)参考其他知识的概念 组成一个问题 知识概念 ,在哪里 相互连接的知识(技能)的概念。
算法1处理技能和数据集的问题获得一本字典 与问题的关键和连接能力问题作为值,而结合的技能是构成同样的问题。算法1的时间复杂度 在本文中,我们使用KC表所示2代表的技能。让 KC RKCs相关 回答问题的 ,在哪里 如图1(一)

输入:问题列表 ;技能列表 ;字典 ;数据集 由技能和问题。
输出:
(1)
(2)
(3)
(4) 为每一个
(5) 如果 不是在 然后
(6)
(7)
(8) 结束
(9) 结束
(10) 为每一个
(11)
(12)
(13) 为每一个
(14) 如果 不是在 然后
(15)
(16)
(17) 结束
(18) 结束
(19)
(20) 结束
(21) 返回
skill-aware知识跟踪模型可以制定如下:学生互动的时间戳 , ,在哪里 是这个问题的正确性 在技能 , RKCs KC的吗 , 是RKCs的正确性 考虑到学生的互动, ,我们可以预测的概率下KC学生回答 正确的时间戳 , 或预测学生的概念,掌握全面的知识

4所示。在线辅导系统

在线辅导系统可以分为两类:

4.1。Question-Level网上辅导系统

在question-level在线辅导系统,学生直接回答这个问题。如果问题回答正确或不正确,所有;(技能)的问题也回答正确或错误。如果一个学生回答 正确或错误,那么他们必须回答RKCs 正确或错误,见图1 (b)。因为 是同样的问题,所以在question-level在线辅导系统,为学生的互动时间戳 : ,

4.2。上面临了失业网上辅导系统

在上面临了失业在线辅导答疑情况系统要复杂得多比question-level在线辅导系统。学生可以单独回答一个技能的问题,能回答这个技能一次或多次。如果一个学生的答案 正确,但这并不意味着学生必须回答 正确,如图所示1 (c)

从表面上看,没有明显的回答正确的技能之间的关系 和相关的技能 然而,有大量的学生回答的例子见表3在上面临了失业在线辅导系统,这表明如果一个学生的答案 错了很多次,即使他最后的答案 正确,这表明,他掌握的技能 很差,同样的,他可怜的掌握 很可能他会回答 年代有关的技能 不正确。所以学生的掌握 , 和学生的掌握 , 关闭:

这一发现强烈支持的学生在上面临了失业在线辅导系统的实际响应。所以在上面临了失业在线辅导系统,根据公式(2),我们可以假设。 如表所示4

5。方法

在本节中,我们将详细介绍NSKT框架,其中,概述架构图2

5.1。模型

模型由一个编码层和神经网络层。为了更好的模式学生的知识状态,与神经图灵机模型,这是一个实例memory-augmented神经网络(曼)提供快速编码和检索新信息的能力(23]。

5.2。输入特性
5.2.1。回答的信息编码

学生的互动元组的编码 ,因此 :

5.2.2。RKC信息编码

的信息集 相关的RKCs KC 编码 的长度 : :

5.3。神经图灵机

神经图灵机memory-augmented神经网络的实例(曼),通过耦合神经网络的功能扩展到外部内存资源。实验表明,神经图灵机有更强的记忆能力比LSTM [23),这是非常适合学生的知识建模状态(33- - - - - -35]。图3显示了一个高级神经图灵机架构图。

从图可以看出3,特种加工由4个模块组成:控制器,读,写,和记忆。控制器可以递归神经网络前馈神经网络或(23,34),并访问外部存储器的读写头的矩阵。

5.4。阅读

这是一个外部存储器的内容 记忆矩阵的时间戳 ,在哪里 内存位置和数量吗 在每一个内存位置是向量维度。的 元素 ,这是一个向量的权重 位置的读头发出的时间戳 ,遵守以下限制:

是读向量的长度 头返回的时间戳 :

5.5。写作

记忆矩阵 在时间戳 被抹去修改向量 和添加向量 :

5.6。寻址机制
5.6.1。关注的内容

每个头产生一个长度 关键的向量 用于计算正常化权重 如下: 在哪里 是一个积极的关键力量产生的控制器和相似性度量 余弦相似度:

5.6.2。聚焦位置

定位寻址机制旨在促进简单迭代在内存的位置和随机访问跳跃。它是通过实现一个旋转转变的权重如下(23]。

首先,内插门 用于混合之间的权重吗 和权重 :

此外,该模型使用一维卷积核转移到当前权重盘旋 : 在哪里 是生成的移位加权控制器。

纠正发生的模糊由于卷积运算,每个头发出一个进一步的标量 其作用是提高最终的权重如下:

5.7。控制器

特种加工控制器在我们的模型中是长期短期记忆网络(36),可由公式制定如下:

激活矩阵输入的门口,忘记门,输出门,记忆细胞,和隐藏的状态矩阵,分别。wb是重量的偏差向量矩阵和相应的门,分别。 表示阿达玛的产品。 分别表示乙状结肠和双曲正切函数: 是去年NSKT模型的神经网络的输出,学生掌握的知识概念模型预测的时间戳 在哪里

5.8。优化

的损失函数模型由两部分组成,即回答互动的损失 和相关的知识概念信息损失 是二进制交叉熵损失:

我们优化学生的交互的平均交叉熵损失如下: 在哪里 是一个炎热的KC的编码 在时间戳 , 是学生的交互的总数,然后呢T表示转置操作。

平均熵概念的相关知识信息损失 在哪里 , 是技巧的正确性

失去一个学生代表 ,这是如下: 在hyperparameter 是决定回答信息损失的比例系数和相关信息的损失。我们使用一个优化器优化模型。让 是最低的 ,因此,NSKT的培训目标如下:

5.9。技能的意识

过去学生的互动在网上辅导系统: ,在哪里 元组表示学生互动的时间戳 知识概念的集合 学生回答实际上到目前为止表示如下:

知识的集合概念(技能) 到目前为止回答NSKT表示如下:

如图4,当学生回答下一个技能 在接下来的时间戳 ,即使学生没有回答问题相关的技能 之前, ,但是如果NSKT意识的技能 到目前为止, ,NSKT可以预测学生的掌握能力 准确。

6。实验

在本节中,我们给出一个详细的解释数据和实验评估NSKT模型的性能和其他KT模型在三个真实的开源知识跟踪数据集。

6.1。数据集

评估KT模型的性能,我们使用三个数据集收集的在线学习平台。这三个数据集在KT广泛使用真实的数据集。(我)ASSISTments2009 (https://sites.google.com/site/assistmentsdata/home/2009 - 2010 -援助-数据)(ASSIST09)由援助提供在线辅导平台,是应用最广泛的数据集知识跟踪。(2)ASSISTments2017 (https://sites.google.com/view/assistmentsdatamining/dataset/)(ASSIST17)提供的2017 ASSISTments数据挖掘竞争,是最新的ASSISTments数据集最学生响应。(3)EdNet (https://github.com/riiid/ednet)是所有学生管理系统交互的数据收集/ 2年圣诞老人,多平台智能辅导服务超过780 K用户在韩国可以通过Android, iOS和Web (37]。我们进行实验EdNet-KT1由学生解决问题的日志,是圣诞老人的记录收集自2017年4月以来遵循question-response序列格式。

这三个数据集的完整统计信息如表所示5

数据集的详细信息列所示如下:ASSISTments:(我)user_id:学生的ID(2)problem_id:问题的ID(3)集中:技能的ID相关的问题(iv)1:正确的第一次尝试0:不正确的第一次尝试,EdNet:(我)user_id:学生的ID。(2)question_id:问题的ID。(3)标签:expert-annotated标签为每个问题。(iv)correct_answer:每个问题的正确答案记录为一个字符之间d在内地。(v)user_answer:答案,学生提交记录为一个字符之间d在内地。

6.2。数据集的特点
(我)ASSIST09 EdNet:多个技能问题,记录学生的交互将与不同的技能重复标记,每条记录代表学生回答问题的技巧(38]。(2)ASSIST17:类似于ASSIST09数据集,每个记录在ASSIST17代表学生回答问题的技巧。然而,我们注意到这个数据集的特点。大量用户多个ASSIST17数据集只回答一个技能的技能问题,回答了这个技能一次或多次。多个技能问题,在这种情况下的数量占总数的44.88%回答学生的问题。也就是说,多个技能的学生回答一个或多个技能问题,和应对技能的数量可以一次或多次。
6.3。对比模型和实现细节

展示我们的模型的性能,证明我们的模型的改进现有KT次方模型,我们比较NSKT最先进的KT模型。我们给一些KT的参考GitHub库模型。(我)支架(5知识:贝叶斯跟踪使用隐马尔科夫模型(HMM)模型学生潜在的知识状态为一组二进制变量。我们使用pyBKT (https://github.com/CAHLR/pyBKT)实现支架和设置模型参数: (2)DKT-LSTM [6]:DKT-LSTM标准深knowledge-tracing模式。我们实现了DKT (https://github.com/chrispiech/DeepKnowledgeTracing)与LSTM双曲正切激活。(3)DKT-NTM: DKT实现通过使用神经图灵机https://github.com/MarkPKCollier/NeuralTuringMachine)。(iv)DKVMN [10]:DKVMN (https://github.com/jennyzhang0215/DKVMN)是曼的一个变体,它使用一个静态内存称为密钥和动态内存称为价值模型学生的知识状态。(v)SAKT [3]:SAKT (https://github.com/shalini1194/SAKT)是KT模型基于self-attention架构与练习注意查询和学生过去交互键/值关注。(vi)DSKT: skill-aware深knowledge-tracing模型实现LSTM和双曲正切激活。我们动态地设置的值系数 探索DSKT的最佳性能。(七)NSKT: NSKT是个NTM-based skill-aware知识跟踪。我们测试的性能NSKT不同的系数值 年代优化模型的性能。

对于所有的模型,我们使用亚当优化器 , , , 优化。minibatch大小和的最大长度序列数据集设置为32和100年,分别。我们执行标准5倍交叉验证评估所有的KT模型。我们在服务器上进行实验和一个8核2.50 GHz Xeon (R) (R)铂8163 CPU和64 GB的内存。

6.4。实验结果
6.4.1。模型的性能

我们使用接受者操作特征曲线下面积(AUC)作为评价指标,比较预测性能的KT模型中提到的部分6.3。更高的AUC表明更好的性能。测试AUC结果三个真实数据集的所有KT模型如表所示6。从实验结果中,我们可以找到以下的观察:(我)NSKT执行比其他竞争KT模型在所有的数据集和达到的平均测试AUC 85.38%, 82.35%, 80.81%, ASSIST09, ASSIST17和EdNet分别。(2)比DKT-LSTM DSKT性能更好,达到84.88%的平均测试AUC, 81.27%, 79.71%,数据集ASSIST09, ASSIST17 EdNet,分别获得平均0.82%的性能提升(的AUC DKT-LSTM达到84.45%、80.04%和78.91%)。NSKT执行比DKT-NTM,获得了平均1.33%的性能提升(的AUC DKT-NTM达到84.53%、80.51%和79.49%)。(3)DKT-NTM模型在知识有一个更好的性能比标准的DKT-LSTM跟踪。DKT-NTM达到平均测试AUC为84.53%,80.51%,和79.49%的三个数据集,分别而标准DKT-LSTM达到84.45%的平均测试AUC, 80.04%,和78.91%的三个数据集,分别。(iv)在数据集ASSIST17 NSKT更好的性能,具有更复杂的数据特性比ASSIST09和EdNet。NSKT收益平均性能提升2.31%相比,ASSIST17标准DKT-LSTM同时提高AUC ASSIST09和EdNet 0.93%和0.90%,分别。最好证明NSKT从复杂的教育数据挖掘隐藏信息特性来提高预测的准确性。

5显示了KT的训练过程模型的三个KT数据集。这表明DKVMN和SAKT可以学习速度比其他KT模型。的训练速度DKT-LSTM、DKT-NTM DSKT, NSKT是接近,但测试的AUC NSKT是最好的。

我们设置了概率KC KT预测的模型: ,和假设学生回答KC 如果正确 如果 ,学生回答 错误:

如果 ,这意味着模型可以预测正确。因此,预测的准确性KT模型在数据集如图6

7显示DSKT和NSKT在不同的性能 价值和价值 当模型实现最佳的性能。从图7,我们可以得出以下结论:测试的AUC DSKT和一个小NSKT并不理想 价值。然而,随着的价值 增加,测试结果DSKT NSKT变得更好和更好;因此,我们建议

6.5。Friedman-Aligned等级测试

我们执行Friedman-aligned等级测试39)AUC KT模型的测试结果见表6由以下公式: 在哪里 笔的行列吗th样本, 组样本的数量, 在每组样本的数量。的概率分布 可以用卡方分布的近似 自由度 现在,我们测试零假设,如下:H0:没有显著差异在KT的性能模型。

P价值 Friedman-aligned等级测试的测试AUC结果

然后,我们拒绝零假设 ,这表明一个重要的区别在KT的性能模型。

6.6。执行时间

我们比较KT模型的执行时间在每个数据集如图每200批次8。如图8,支架模型要求最小执行时间训练数据的大小相同。这是因为支架不是深度学习知识跟踪模型,它需要更少的参数训练。深度学习知识跟踪模型,执行时间的DKT-LSTM DKVMN, SAKT接近DKT-NTM的执行时间和DSKT关闭。的执行时间DKT-LSTM DKT-NTM比这更多。特种加工的原因可以花更多的时间来访问自己的外部存储器矩阵。NSKT认为在训练过程中连接的技术问题,需要访问特种加工的外部存储器模型的矩阵来增强记忆能力。因此,NSKT最执行时间,但这也是为什么NSKT执行更好的模拟学生的知识状态。

实验结果表明,该NTM-based skill-aware knowledge-tracing模型有很强的能力获取知识之间的相关性概念和技能来提高模型的能力意识结合的技能,提高预测的准确性在造型学生的知识状态。实验证明NSKT是有效的。

7所示。讨论

在本节中,我们讨论的细节KT的预测过程模型模拟学生的知识状态,以及知识的相关性之间的概念和条件影响练习。

7.1。预测过程

在我们看来,一个优秀的KT模型不仅可以预测学生回答问题正确的概率在下次时间戳造型准确,还可以执行在学生整体知识观的状态。

KT预测过程的分析模型可以显示NSKT的性能。我们随机选择一个学生样 从ASSIST09数据集,DKT和NSKT建模的详细过程 的知识状态如图9

从图可以看出9(一个)在预测,尽管DKT表现相当好,DKT只侧重于知识的概念是预测在下一个时间戳,不关心 掌握其他知识的概念。因此,后 答案 正确 在时间戳 ,模型的预测的概率 迅速降低,表明 的掌握 是越来越糟了,这不是应该的吗 真正的知识状态表所示7。因为缺乏相关知识概念(RKC)信息,DKT的预测精度和预测广度并不理想。

如图9 (b),我们使用两个热图subfigures造型的过程 在NSKT知识状态。的x设在subfigure较低的序列 的相互作用 y设在技能指数。的x设在上层subfigure RKC y设在RKCs的索引

因为 技能32(缩写为答案 )正确 在前三个时间戳 ,预测的概率的 变得越来越高的颜色 y设在低subfigure被变得越来越亮。所示的x设在上层subfigure, 相关知识的概念吗 在前三个时间戳 ;因此,预测的概率 变得越来越高的颜色 y设在上层subfigure会变得越来越亮了。

在接下来的三个时间戳 , 正确答案s33 在继承中,预测的概率 变得越来越高的颜色 y设在低subfigure被变得越来越亮。 相关知识的概念吗 ,所以预测的概率 继续增加,的颜色 y设在上层subfigure变亮,亮也维持在一个相对较高的值。

在接下来的三个时间戳 , 继续回答 正确 ;然而,这 没有相关知识的概念是一个技能,所以唯一的预测概率吗 变得越来越高的颜色 y设在低subfigure被变得越来越亮。

在最后的时间戳 , 回答 正确 ,所以预测的概率 变得越来越高的颜色 y设在低subfigure被变得越来越亮。因为 相关知识的概念吗 ,所以预测的概率 变得越来越高的颜色 y设在上层subfigure会变得越来越亮了。

相比之下,我们随机选择一个学生样 表所示回答的准确性较低8

DKT和NSKT造型的过程 的知识状态如图10。从图可以看出10 ()DKT模型的 的知识状态几乎准确,但预测广度还不够。

如图10 (b)、NSKT DKT等模型 准确的知识状态,执行好预测广度。在时间戳 , 答案 错了很多次,预测的概率 变得越来越低的颜色 y设在下subfigure变得越来越黑。所示的x设在上层subfigure, 相关知识的概念吗 ;因此,预测的概率 变得越来越低的颜色 y设在上层subfigure变暗。

从数据可以得出结论910NSKT性能更好的预测精度和广度和模型能更好地预测学生的知识状态。NSKT不仅关注学生掌握知识的概念是预测在下一个时间戳,还关注学生掌握相关的知识概念。这就是NSKT优于其它现有的KT模型,在造型和NSKT执行更好的学生的知识比DKT状态[4]。

7.2。皮尔森相关系数

在本文中,我们使用皮尔逊相关系数作为指标来衡量能力之间的相关性。通过估计协方差和标准偏差的样本,我们可以得到样品皮尔森系数 :

数据1112显示技能皮尔逊相关性的比较 的交互和 分别的交互DKT和NSKT。数据(11日)12(一个)DKT显示技能皮尔逊相关性,数据11 (b)12 (b)显示技能NSKT皮尔逊相关性。从数据可以看出,DKT只能我的技能之间的相关性回答过去,表明DKT不能有效发现知识概念之间的相关性。如数据所示11 (b)12 (b),NSKT可以发现四项技能之间的相关性,而DKT只能发现在三个。例如,它可以看到从图11 (b)皮尔逊相关性 在NSKT 的相互作用 ,这意味着之间存在弱正相关

之间的皮尔逊相关 在NSKT 的相互作用 ,这意味着之间有很强的正相关关系 通过以上例子,我们可以得出结论,NSKT性能更好的能力发现潜在的知识概念之间的相关性比现有的KT模型。

7.3。知识概念的发现

NSKT可以学习潜在的知识概念子结构之间的技能没有专家注释和集群相关技能到一个集群,这代表一个知识概念(KC)类6]。

13显示了使用k - means聚类技术的可视化表示向量,已由t-SNE方法(40,41]。所有技能都聚集成八集群,每个集群可以代表一个知识概念类。技能在同一集群用同样的颜色标记,和这些技能有很强的相关性和相似性。例如, 有很强的相关性和相似,因为他们是非常接近在图吗13,这进一步证明了NSKT发现技能潜在的相关性信息的能力比现有的KT模型。

我们已经探索潜在的条件影响之间的练习 在哪里 正确的概率是由NSKT锻炼吗 当运动 回答正确的步骤(第一次6]。我们展示了一个潜在的条件影响相对应的练习图之间的关系9 (b)交互。我们已经用箭头标记符号在图13。线宽显示连接强度和节点可以连接在两个方向。我们只显示与影响边缘阈值大于0.08。附加ASSIST09技能地图如图13(我们只显示110技能与技能名称)。

8。结论

在这项工作中,我们提出了一个新颖的NTM-based skill-aware knowledge-tracing模型结合的能力,可以捕捉的多个知识概念之间的相关性问题,预测学生的掌握知识的概念;更准确和有效地发现更多潜在的知识概念之间的相关性。为了更好的模式学生的知识状态,我们采用神经图灵机,使用外部存储器矩阵来增强记忆能力。此外,NSKT相关知识概念(;)相关知识概念(RKCs)作为一个整体来提高技能的模型的能力意识和提高预测精度和预测广度。现实世界的KT数据集实验证明NTM-based知识概念skill-aware knowledge-tracing模型(NSKT)优于现有最先进的KT模型模拟学生的知识状态和发现潜在的知识概念之间的相关性。

对于未来的研究,我们将专注于挖掘隐藏的知识之间的关联的概念和构建学生的个性化智能辅导系统回答道。此外,我们将构建知识的整体结构的概念,加强学生对整个知识如何影响彼此的理解。

数据可用性

本研究的数据集用于支持这些发现都包含在这篇文章,可从相应的作者合理要求。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是支持的CCF-AFSG研究基金会(格兰特号码:CCF-AFSG RF20200014)和甘肃的科技项目(格兰特数字:21 yf5ga102 21 yf5ga006 21 zd8ra008)。