计算智能和神经科学

在这一页上

文摘介绍相关工作讨论结论数据可用性的利益冲突确认引用版权相关文章

特殊的问题

4.0人类行为建模在工程管理行业

把这个特殊的问题

研究文章|开放获取

体积2022年| 文章的ID9153697| https://doi.org/10.1155/2022/9153697

NTM-Based Skill-Aware跟踪连接的技能知识

羌族黄 ,¹ 魏苏 ,¹ Yuantao太阳 ,² 天元黄,¹ 和Juntai史¹

学术编辑器: 慧华陈

收到了 2022年3月17日

修改后的 2022年5月10日

接受 2022年6月12日

发表 2022年7月27日

文摘

知识跟踪(KT)建模的任务是学生根据他们的历史知识状态交互智能辅导系统。现有的KT模型忽略的多个知识概念之间的相关性问题,在线辅导系统的特点。神经图灵提出了一种基于机器skill-aware知识跟踪(NSKT)连接的能力,可以捕捉知识概念之间的相关性问题模型的学生的知识更准确和有效地发现更多潜在的知识概念之间的相关性。我们分析的特征三个真实的KT深度数据集。真实数据集的实验表明,NSKT优于最先进的深KT AUC的预测模型。本文探讨了预测过程的细节造型的NSKT学生知识,以及知识的相关性之间的概念和条件影响练习。

1。介绍

随着智能辅导系统的发展(同期)和大规模网络公开课的出现网络公开课()(1,2跟踪),知识起着重要的作用在提高个性化学习平台的效率。知识的任务是跟踪模拟学生的知识状态基于历史交互来预测学生的掌握知识的概念(;),可以锻炼KC,技能,或者一个概念(3,4]。

为了更好的模式学生的知识状态,提出了各种knowledge-tracing模型。在以前的研究中,贝叶斯跟踪(支架)是一个强大的知识knowledge-tracing模型。支架模型状态的学生知识概念使用隐马尔科夫模型(HMM)为每个KC [5]。

随着深度学习的发展,大量的深度学习模型应用于KT。克里斯皮应用递归神经网络(RNN)模型首次学生学习过程,提出了深入了解跟踪(DKT) [6- - - - - -9]。动态键-值记忆网络(DKVMN)使用一个静态内存称为密钥和动态内存称为价值发现潜在的锻炼和知识概念之间的关系(10,11]。Self-attentive知识跟踪(SAKT)提出了一个self-attention-based KT模型模式学生的知识状态,与练习注意查询和学生过去交互注意键/值(3,12- - - - - -15]。

然而,上述作品只关注学生的运动交互和忽略的问题之间的关系和技能。模范学生不能仅仅关注学生的知识状态准确地交互。知识跟踪模型开始关注知识概念的结构(16- - - - - -18]。

深层次化模型跟踪学生的知识状态通过捕获问题和知识概念的层次结构16]。尼尔·霍夫曼的最新工作考虑的问题信息知识概念所属(17]。基于知识跟踪认为周边知识概念之间的影响(19- - - - - -22]。两偶图是一种有效的结构模型来捕获潜在的问题和技巧之间的关系(18]。这个方法是有效的,但是计算量巨大,因为它需要提取问题和技能,分别。因此,它很难被视为一个精简和有效knowledge-tracing模型。

以上KT模型充分利用multiknowledge概念信息的问题。现有的知识跟踪模型无法捕捉到潜在的问题之间的关系和概念简洁和有效的。我们知道问题通常由多个知识的概念,它实际上是密切相关的。为了更好的模式学生的学习过程,我们的模型是由使用神经图灵机(特种加工),这是memory-augmented神经网络的实例(曼),有一个很大的外部内存容量(23- - - - - -25]。因此,在以上的基础上深入了解跟踪模型,我们提出一个NTM-based skill-aware knowledge-tracing模型。我们工作的亮点是利用问题模型的知识概念成分信息学生的知识状态更准确和有效地发现更多潜在的知识概念之间的相关性。本文的贡献总结如下:(我)我们处理现实世界的KT详细数据集和发现新的网上辅导系统的特点和知识跟踪数据集。(2)我们设计一个question-skill字典算法获得的连接技巧问题。输入编码包含学生的回答信息交互信息和相关的知识概念。(3)我们应用神经图灵机到跟踪创新知识提高我们的记忆能力模型和预测学生的掌握知识概念准确、有效地发现知识概念子结构。(iv)我们提出一个新的NTM-based skill-aware knowledge-tracing模型结合的技能并应用一种新型优化损失函数来深入了解跟踪技能意识增强模型的能力。我们的模型考虑了连接的知识概念信息包含在一个问题的过程中造型学生的知识状态;因此,我们的模型优于现有KT模型。

本文的其余部分组织如下:部分2提出了一个简要的概述跟踪相关工作领域的知识。节3,我们制定的过程执行knowledge-tracing NSKT任务。然后,部分4介绍了在线辅导系统的特点和分类。NSKT模型的细节提供了部分5。实验结果和模型的性能的比较真实的数据集给出了部分6。节7的过程中,我们详细讨论NSKT造型学生的知识状态。部分8给出了结论和未来的研究工作。

在本节中,我们提出的模型和方法的简要概述相关工作领域的知识跟踪,可以分为两大类,如表所示1。

2.1。项目反应理论

项目反应理论是最常用的认知模型来预测学生的掌握知识的概念在1995年知识提出了跟踪之前(26,27]。红外热成像的基础上,学生的知识状态的认知模型基于因子分析后提出:LFA [28]和PFA [29日]。这些逻辑回归模型预测学生的掌握知识的概念,通过分析之间的关系因素影响学生回答的准确性(30.,31日]。

2.2。知识跟踪

贝叶斯跟踪(支架)模型知识学生的知识状态使用隐马尔科夫模型(HMM)对一个知识概念,即表示为一组二进制潜变量(5]。

与深度学习的兴起,深入了解跟踪(DKT)提出了6),将学生的历史交互模型时间序列和学生的知识状态的递归神经网络(RNN)。实验结果表明,DKT有强大的建模能力学生的知识状态。DKT之后,很多深KT模型提出了改进的AUC预测学生的掌握知识的概念。然而,大多数的这些深knowledge-tracing模型只关注学生知识的交互概念和忽略的结构性问题和知识概念之间的关系。

2.3。跟踪Question-KC关系知识

岑等人提出了两个红外热成像模型(加法因子模型(AFM)和连接因素模型(CFM))模型结合的技能在学生数据集(32]。AFM和CFM考虑连接技能信息包含在一个项目的概率来预测学生回答正确的项目。

深度层次知识跟踪(DHKT)开始关注知识概念之间的层次关系和问题来预测学生的表现16]。DHKT列车平均嵌入的嵌入问题属于问题的技能。模型使用一式两份的图能有效捕捉知识概念和问题之间的关系和系统pretrain嵌入每个问题[18]。尼尔·霍夫曼的最新作品开始关注知识的体系结构概念和问题(17]。

3所示。问题公式化

一般来说,KT可以制定一系列监督学习问题:学生的互动时间戳的元组 , 代表的组合技能(运动)回答,如果回答正确的技能,所以 , ,在哪里是独特的训练数据集的数量。考虑到学生的过去运动相互作用, ,KT的目标是预测学生回答问题的概率正确地在下一个时间戳 , (3,6,10]。

可以看出,现有的KT模型只有关注学生的交互运动,所以他们很难预测学生有效地掌握的技能。本文中使用的符号如表所示2。

定义1。相关知识的概念(RKCs):相关概念(RKCs)参考其他知识的概念组成一个问题知识概念 ,在哪里和相互连接的知识(技能)的概念。
算法1处理技能和数据集的问题获得一本字典与问题的关键和连接能力问题作为值,而结合的技能是构成同样的问题。算法1的时间复杂度。在本文中,我们使用KC表所示2代表的技能。让KC RKCs相关回答问题的 ,在哪里如图1(一)。

	输入:问题列表 ;技能列表 ;字典 ;数据集由技能和问题。
	输出:
(1)
(2)
(3)
(4)	为每一个做
(5)	如果不是在然后
(6)
(7)
(8)	结束
(9)	结束
(10)	为每一个做
(11)
(12)
(13)	为每一个做
(14)	如果和不是在然后
(15)
(16)
(17)	结束
(18)	结束
(19)
(20)	结束
(21)	返回

skill-aware知识跟踪模型可以制定如下:学生互动的时间戳 , ,在哪里是这个问题的正确性在技能 , RKCs KC的吗 , 是RKCs的正确性。考虑到学生的互动, ,我们可以预测的概率下KC学生回答正确的时间戳 , 或预测学生的概念,掌握全面的知识。

(一)

(b)

(c)

4所示。在线辅导系统

在线辅导系统可以分为两类:

4.1。Question-Level网上辅导系统

在question-level在线辅导系统,学生直接回答这个问题。如果问题回答正确或不正确,所有;(技能)的问题也回答正确或错误。如果一个学生回答正确或错误,那么他们必须回答RKCs正确或错误,见图1 (b)。因为和是同样的问题,所以在question-level在线辅导系统,为学生的互动时间戳 : ,

4.2。上面临了失业网上辅导系统

在上面临了失业在线辅导答疑情况系统要复杂得多比question-level在线辅导系统。学生可以单独回答一个技能的问题,能回答这个技能一次或多次。如果一个学生的答案正确,但这并不意味着学生必须回答正确,如图所示1 (c)。

从表面上看,没有明显的回答正确的技能之间的关系和相关的技能。然而,有大量的学生回答的例子见表3在上面临了失业在线辅导系统,这表明如果一个学生的答案错了很多次,即使他最后的答案正确,这表明,他掌握的技能很差,同样的,他可怜的掌握。很可能他会回答年代有关的技能不正确。所以学生的掌握 , 和学生的掌握 , 关闭:

这一发现强烈支持的学生在上面临了失业在线辅导系统的实际响应。所以在上面临了失业在线辅导系统,根据公式(2),我们可以假设。如表所示4。

5。方法

在本节中,我们将详细介绍NSKT框架,其中,概述架构图2。

5.1。模型

模型由一个编码层和神经网络层。为了更好的模式学生的知识状态,与神经图灵机模型,这是一个实例memory-augmented神经网络(曼)提供快速编码和检索新信息的能力(23]。

5.2。输入特性

5.2.1。回答的信息编码

让学生的互动元组的编码 ,因此 :

5.2.2。RKC信息编码

的信息集相关的RKCs KC编码的长度 : :

5.3。神经图灵机

神经图灵机memory-augmented神经网络的实例(曼),通过耦合神经网络的功能扩展到外部内存资源。实验表明,神经图灵机有更强的记忆能力比LSTM [23),这是非常适合学生的知识建模状态(33- - - - - -35]。图3显示了一个高级神经图灵机架构图。

从图可以看出3,特种加工由4个模块组成:控制器,读,写,和记忆。控制器可以递归神经网络前馈神经网络或(23,34),并访问外部存储器的读写头的矩阵。

5.4。阅读

让这是一个外部存储器的内容记忆矩阵的时间戳 ,在哪里内存位置和数量吗在每一个内存位置是向量维度。的元素的 ,这是一个向量的权重位置的读头发出的时间戳 ,遵守以下限制:

让是读向量的长度头返回的时间戳 :

5.5。写作

记忆矩阵在时间戳被抹去修改向量和添加向量 :

5.6。寻址机制

5.6.1。关注的内容

每个头产生一个长度关键的向量用于计算正常化权重如下: 在哪里是一个积极的关键力量产生的控制器和相似性度量余弦相似度:

5.6.2。聚焦位置

定位寻址机制旨在促进简单迭代在内存的位置和随机访问跳跃。它是通过实现一个旋转转变的权重如下(23]。

首先,内插门用于混合之间的权重吗和权重 :

此外,该模型使用一维卷积核转移到当前权重盘旋 : 在哪里是生成的移位加权控制器。

纠正发生的模糊由于卷积运算,每个头发出一个进一步的标量其作用是提高最终的权重如下:

5.7。控制器

特种加工控制器在我们的模型中是长期短期记忆网络(36),可由公式制定如下:

激活矩阵输入的门口,忘记门,输出门,记忆细胞,和隐藏的状态矩阵,分别。w和b是重量的偏差向量矩阵和相应的门,分别。表示阿达玛的产品。和分别表示乙状结肠和双曲正切函数: 让是去年NSKT模型的神经网络的输出,学生掌握的知识概念模型预测的时间戳是在哪里。

5.8。优化

的损失函数模型由两部分组成,即回答互动的损失和相关的知识概念信息损失。让是二进制交叉熵损失:

我们优化学生的交互的平均交叉熵损失如下: 在哪里是一个炎热的KC的编码在时间戳 , 是学生的交互的总数,然后呢T表示转置操作。

平均熵概念的相关知识信息损失在哪里 , 是技巧的正确性。

失去一个学生代表 ,这是如下: 在hyperparameter是决定回答信息损失的比例系数和相关信息的损失。我们使用一个优化器优化模型。让是最低的 ,因此,NSKT的培训目标如下:

5.9。技能的意识

过去学生的互动在网上辅导系统: ,在哪里元组表示学生互动的时间戳。知识概念的集合学生回答实际上到目前为止表示如下:

知识的集合概念(技能)到目前为止回答NSKT表示如下:

如图4,当学生回答下一个技能在接下来的时间戳 ,即使学生没有回答问题相关的技能之前, ,但是如果NSKT意识的技能到目前为止, ,NSKT可以预测学生的掌握能力准确。

6。实验

在本节中,我们给出一个详细的解释数据和实验评估NSKT模型的性能和其他KT模型在三个真实的开源知识跟踪数据集。

6.1。数据集

评估KT模型的性能,我们使用三个数据集收集的在线学习平台。这三个数据集在KT广泛使用真实的数据集。(我)ASSISTments2009 (https://sites.google.com/site/assistmentsdata/home/2009 - 2010 -援助-数据)(ASSIST09)由援助提供在线辅导平台,是应用最广泛的数据集知识跟踪。(2)ASSISTments2017 (https://sites.google.com/view/assistmentsdatamining/dataset/)(ASSIST17)提供的2017 ASSISTments数据挖掘竞争,是最新的ASSISTments数据集最学生响应。(3)EdNet (https://github.com/riiid/ednet)是所有学生管理系统交互的数据收集/ 2年圣诞老人,多平台智能辅导服务超过780 K用户在韩国可以通过Android, iOS和Web (37]。我们进行实验EdNet-KT1由学生解决问题的日志,是圣诞老人的记录收集自2017年4月以来遵循question-response序列格式。

这三个数据集的完整统计信息如表所示5。

数据集的详细信息列所示如下:ASSISTments:(我)user_id:学生的ID(2)problem_id:问题的ID(3)集中:技能的ID相关的问题(iv)1:正确的第一次尝试0:不正确的第一次尝试,EdNet:(我)user_id:学生的ID。(2)question_id:问题的ID。(3)标签:expert-annotated标签为每个问题。(iv)correct_answer:每个问题的正确答案记录为一个字符之间d在内地。(v)user_answer:答案,学生提交记录为一个字符之间d在内地。

6.2。数据集的特点

(我)ASSIST09 EdNet:多个技能问题,记录学生的交互将与不同的技能重复标记,每条记录代表学生回答问题的技巧(38]。(2)ASSIST17:类似于ASSIST09数据集,每个记录在ASSIST17代表学生回答问题的技巧。然而,我们注意到这个数据集的特点。大量用户多个ASSIST17数据集只回答一个技能的技能问题,回答了这个技能一次或多次。多个技能问题,在这种情况下的数量占总数的44.88%回答学生的问题。也就是说,多个技能的学生回答一个或多个技能问题,和应对技能的数量可以一次或多次。

6.3。对比模型和实现细节

展示我们的模型的性能,证明我们的模型的改进现有KT次方模型,我们比较NSKT最先进的KT模型。我们给一些KT的参考GitHub库模型。(我)支架(5知识:贝叶斯跟踪使用隐马尔科夫模型(HMM)模型学生潜在的知识状态为一组二进制变量。我们使用pyBKT (https://github.com/CAHLR/pyBKT)实现支架和设置模型参数: 。(2)DKT-LSTM [6]:DKT-LSTM标准深knowledge-tracing模式。我们实现了DKT (https://github.com/chrispiech/DeepKnowledgeTracing)与LSTM双曲正切激活。(3)DKT-NTM: DKT实现通过使用神经图灵机https://github.com/MarkPKCollier/NeuralTuringMachine)。(iv)DKVMN [10]:DKVMN (https://github.com/jennyzhang0215/DKVMN)是曼的一个变体,它使用一个静态内存称为密钥和动态内存称为价值模型学生的知识状态。(v)SAKT [3]:SAKT (https://github.com/shalini1194/SAKT)是KT模型基于self-attention架构与练习注意查询和学生过去交互键/值关注。(vi)DSKT: skill-aware深knowledge-tracing模型实现LSTM和双曲正切激活。我们动态地设置的值系数探索DSKT的最佳性能。(七)NSKT: NSKT是个NTM-based skill-aware知识跟踪。我们测试的性能NSKT不同的系数值年代优化模型的性能。

对于所有的模型,我们使用亚当优化器 , , ,和优化。minibatch大小和的最大长度序列数据集设置为32和100年,分别。我们执行标准5倍交叉验证评估所有的KT模型。我们在服务器上进行实验和一个8核2.50 GHz Xeon (R) (R)铂8163 CPU和64 GB的内存。

6.4。实验结果

6.4.1。模型的性能

我们使用接受者操作特征曲线下面积(AUC)作为评价指标,比较预测性能的KT模型中提到的部分6.3。更高的AUC表明更好的性能。测试AUC结果三个真实数据集的所有KT模型如表所示6。从实验结果中,我们可以找到以下的观察:(我)NSKT执行比其他竞争KT模型在所有的数据集和达到的平均测试AUC 85.38%, 82.35%, 80.81%, ASSIST09, ASSIST17和EdNet分别。(2)比DKT-LSTM DSKT性能更好,达到84.88%的平均测试AUC, 81.27%, 79.71%,数据集ASSIST09, ASSIST17 EdNet,分别获得平均0.82%的性能提升(的AUC DKT-LSTM达到84.45%、80.04%和78.91%)。NSKT执行比DKT-NTM,获得了平均1.33%的性能提升(的AUC DKT-NTM达到84.53%、80.51%和79.49%)。(3)DKT-NTM模型在知识有一个更好的性能比标准的DKT-LSTM跟踪。DKT-NTM达到平均测试AUC为84.53%,80.51%,和79.49%的三个数据集,分别而标准DKT-LSTM达到84.45%的平均测试AUC, 80.04%,和78.91%的三个数据集,分别。(iv)在数据集ASSIST17 NSKT更好的性能,具有更复杂的数据特性比ASSIST09和EdNet。NSKT收益平均性能提升2.31%相比,ASSIST17标准DKT-LSTM同时提高AUC ASSIST09和EdNet 0.93%和0.90%,分别。最好证明NSKT从复杂的教育数据挖掘隐藏信息特性来提高预测的准确性。

图5显示了KT的训练过程模型的三个KT数据集。这表明DKVMN和SAKT可以学习速度比其他KT模型。的训练速度DKT-LSTM、DKT-NTM DSKT, NSKT是接近,但测试的AUC NSKT是最好的。

(一)

(b)

(c)

我们设置了概率KCKT预测的模型: ,和假设学生回答KC如果正确如果 ,学生回答错误:

如果 ,这意味着模型可以预测正确。因此,预测的准确性KT模型在数据集如图6。

(一)

(b)

(c)

图7显示DSKT和NSKT在不同的性能价值和价值当模型实现最佳的性能。从图7,我们可以得出以下结论:测试的AUC DSKT和一个小NSKT并不理想价值。然而,随着的价值增加,测试结果DSKT NSKT变得更好和更好;因此,我们建议。

(一)

(b)

(c)

6.5。Friedman-Aligned等级测试

我们执行Friedman-aligned等级测试39)AUC KT模型的测试结果见表6由以下公式: 在哪里笔的行列吗我th样本,组样本的数量,在每组样本的数量。的概率分布可以用卡方分布的近似自由度。现在,我们测试零假设,如下:H₀:没有显著差异在KT的性能模型。

的P价值Friedman-aligned等级测试的测试AUC结果

然后,我们拒绝零假设 ,这表明一个重要的区别在KT的性能模型。

6.6。执行时间

我们比较KT模型的执行时间在每个数据集如图每200批次8。如图8,支架模型要求最小执行时间训练数据的大小相同。这是因为支架不是深度学习知识跟踪模型,它需要更少的参数训练。深度学习知识跟踪模型,执行时间的DKT-LSTM DKVMN, SAKT接近DKT-NTM的执行时间和DSKT关闭。的执行时间DKT-LSTM DKT-NTM比这更多。特种加工的原因可以花更多的时间来访问自己的外部存储器矩阵。NSKT认为在训练过程中连接的技术问题,需要访问特种加工的外部存储器模型的矩阵来增强记忆能力。因此,NSKT最执行时间,但这也是为什么NSKT执行更好的模拟学生的知识状态。

实验结果表明,该NTM-based skill-aware knowledge-tracing模型有很强的能力获取知识之间的相关性概念和技能来提高模型的能力意识结合的技能,提高预测的准确性在造型学生的知识状态。实验证明NSKT是有效的。

7所示。讨论

在本节中,我们讨论的细节KT的预测过程模型模拟学生的知识状态,以及知识的相关性之间的概念和条件影响练习。

7.1。预测过程

在我们看来,一个优秀的KT模型不仅可以预测学生回答问题正确的概率在下次时间戳造型准确,还可以执行在学生整体知识观的状态。

KT预测过程的分析模型可以显示NSKT的性能。我们随机选择一个学生样从ASSIST09数据集,DKT和NSKT建模的详细过程的知识状态如图9。

(一)

(b)

图9

比较预测的过程DKT和NSKT。的颜色的热图显示预测的概率相互作用后的掌握的技能在时间戳。黄颜色,概率越高。(a)的热图DKT的预测过程。的x设在的顺序U ₁的交互(问 _t;一个 _t)和y设在技能指数。(b)的热图NSKT的预测过程。的x设在subfigure较低的序列U ₁的交互(问 _t;一个 _t)和y设在技能指数。的x设在上层subfigure RKC年代 _t和y设在RKCs的技术指标年代 _t。

从图可以看出9(一个)在预测,尽管DKT表现相当好,DKT只侧重于知识的概念是预测在下一个时间戳,不关心掌握其他知识的概念。因此,后答案正确在时间戳 ,模型的预测的概率迅速降低,表明的掌握是越来越糟了,这不是应该的吗真正的知识状态表所示7。因为缺乏相关知识概念(RKC)信息,DKT的预测精度和预测广度并不理想。

如图9 (b),我们使用两个热图subfigures造型的过程在NSKT知识状态。的x设在subfigure较低的序列的相互作用和y设在技能指数。的x设在上层subfigure RKC和y设在RKCs的索引。

因为技能32(缩写为答案 )正确在前三个时间戳 ,预测的概率的变得越来越高的颜色在y设在低subfigure被变得越来越亮。所示的x设在上层subfigure,相关知识的概念吗在前三个时间戳 ;因此,预测的概率变得越来越高的颜色在y设在上层subfigure会变得越来越亮了。

在接下来的三个时间戳 , 正确答案s33在继承中,预测的概率变得越来越高的颜色在y设在低subfigure被变得越来越亮。相关知识的概念吗 ,所以预测的概率继续增加,的颜色在y设在上层subfigure变亮,亮也维持在一个相对较高的值。

在接下来的三个时间戳 , 继续回答正确 ;然而,这没有相关知识的概念是一个技能,所以唯一的预测概率吗变得越来越高的颜色在y设在低subfigure被变得越来越亮。

在最后的时间戳 , 回答正确 ,所以预测的概率变得越来越高的颜色在y设在低subfigure被变得越来越亮。因为相关知识的概念吗 ,所以预测的概率变得越来越高的颜色在y设在上层subfigure会变得越来越亮了。

相比之下,我们随机选择一个学生样表所示回答的准确性较低8。

DKT和NSKT造型的过程的知识状态如图10。从图可以看出10 ()DKT模型的的知识状态几乎准确,但预测广度还不够。

(一)

(b)

图10

比较预测的过程DKT和NSKT。的颜色的热图显示预测的概率相互作用后的掌握的技能在时间戳。黄颜色,概率越高。(a)的热图DKT的预测过程。的x设在的顺序U ₂的交互(问 _t;一个 _t)和y设在技能指数。(b)的热图NSKT的预测过程。的x设在subfigure较低的序列U ₂的交互(问 _t;一个 _t)和y设在技能指数。的x设在上层subfigure RKC年代 _t和y设在RKCs的技术指标年代 _t。

如图10 (b)、NSKT DKT等模型准确的知识状态,执行好预测广度。在时间戳 , 答案错了很多次,预测的概率变得越来越低的颜色在y设在下subfigure变得越来越黑。所示的x设在上层subfigure,相关知识的概念吗 ;因此,预测的概率变得越来越低的颜色在y设在上层subfigure变暗。

从数据可以得出结论9和10NSKT性能更好的预测精度和广度和模型能更好地预测学生的知识状态。NSKT不仅关注学生掌握知识的概念是预测在下一个时间戳,还关注学生掌握相关的知识概念。这就是NSKT优于其它现有的KT模型,在造型和NSKT执行更好的学生的知识比DKT状态[4]。

7.2。皮尔森相关系数

在本文中,我们使用皮尔逊相关系数作为指标来衡量能力之间的相关性。通过估计协方差和标准偏差的样本,我们可以得到样品皮尔森系数 :

数据11和12显示技能皮尔逊相关性的比较的交互和分别的交互DKT和NSKT。数据(11日)和12(一个)DKT显示技能皮尔逊相关性,数据11 (b)和12 (b)显示技能NSKT皮尔逊相关性。从数据可以看出,DKT只能我的技能之间的相关性回答过去,表明DKT不能有效发现知识概念之间的相关性。如数据所示11 (b)和12 (b),NSKT可以发现四项技能之间的相关性,而DKT只能发现在三个。例如,它可以看到从图11 (b)皮尔逊相关性和在NSKT的相互作用 ,这意味着之间存在弱正相关和。

(一)

(b)

(一)

(b)

之间的皮尔逊相关和在NSKT的相互作用 ,这意味着之间有很强的正相关关系和。通过以上例子,我们可以得出结论,NSKT性能更好的能力发现潜在的知识概念之间的相关性比现有的KT模型。

7.3。知识概念的发现

NSKT可以学习潜在的知识概念子结构之间的技能没有专家注释和集群相关技能到一个集群,这代表一个知识概念(KC)类6]。

图13显示了使用k - means聚类技术的可视化表示向量,已由t-SNE方法(40,41]。所有技能都聚集成八集群,每个集群可以代表一个知识概念类。技能在同一集群用同样的颜色标记,和这些技能有很强的相关性和相似性。例如,和有很强的相关性和相似,因为他们是非常接近在图吗13,这进一步证明了NSKT发现技能潜在的相关性信息的能力比现有的KT模型。

我们已经探索潜在的条件影响之间的练习在哪里正确的概率是由NSKT锻炼吗当运动回答正确的步骤(第一次6]。我们展示了一个潜在的条件影响相对应的练习图之间的关系9 (b)交互。我们已经用箭头标记符号在图13。线宽显示连接强度和节点可以连接在两个方向。我们只显示与影响边缘阈值大于0.08。附加ASSIST09技能地图如图13(我们只显示110技能与技能名称)。

8。结论

在这项工作中,我们提出了一个新颖的NTM-based skill-aware knowledge-tracing模型结合的能力,可以捕捉的多个知识概念之间的相关性问题,预测学生的掌握知识的概念;更准确和有效地发现更多潜在的知识概念之间的相关性。为了更好的模式学生的知识状态,我们采用神经图灵机,使用外部存储器矩阵来增强记忆能力。此外,NSKT相关知识概念(;)相关知识概念(RKCs)作为一个整体来提高技能的模型的能力意识和提高预测精度和预测广度。现实世界的KT数据集实验证明NTM-based知识概念skill-aware knowledge-tracing模型(NSKT)优于现有最先进的KT模型模拟学生的知识状态和发现潜在的知识概念之间的相关性。

对于未来的研究,我们将专注于挖掘隐藏的知识之间的关联的概念和构建学生的个性化智能辅导系统回答道。此外,我们将构建知识的整体结构的概念,加强学生对整个知识如何影响彼此的理解。

数据可用性

本研究的数据集用于支持这些发现都包含在这篇文章,可从相应的作者合理要求。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是支持的CCF-AFSG研究基金会(格兰特号码:CCF-AFSG RF20200014)和甘肃的科技项目(格兰特数字:21 yf5ga102 21 yf5ga006 21 zd8ra008)。

引用

j .自我,“智能辅导系统的理论基础,人工智能在教育杂志》上,1卷,不。4,3 - 14,1990页。
视图: 谷歌学术搜索
m·冯:霍夫曼,k . Koedinger”应对评估挑战与一个在线系统,导师评估,”用户建模和User-Adapted交互,19卷,不。3、243 - 266年,2009页。
视图: 出版商的网站 | 谷歌学术搜索
Pandey和g . Karypis“self-attentive模型知识跟踪”学报》第12届国际会议上教育数据挖掘加拿大蒙特利尔,页384 - 389,,2019年7月。
视图: 谷歌学术搜索
c·k·杨和d . y .杨”,解决两个问题在跟踪通过prediction-consistent正规化,深入了解”学报》第五届ACM大规模学习会议,页1 - 10,伦敦,英国,2018年6月。
视图: 出版商的网站 | 谷歌学术搜索
a·t·科贝特和j·r·安德森,“知识跟踪:建模程序性知识的习得,”用户建模和user-adapted交互,4卷,不。4、253 - 278年,1995页。
视图: 出版商的网站 | 谷歌学术搜索
c·皮耶希j·斯宾塞,黄j . et al .,“跟踪,深入了解”28日学报的发展神经信息处理系统加拿大蒙特利尔,页505 - 513,,2015年12月。
视图: 谷歌学术搜索
s .沈问:刘,e . Chen等人“卷积知识跟踪:个性化建模在学生的学习过程中,“学报》第43届国际市立图书馆会议在信息检索的研究与开发,页1857 - 1860,纽约,纽约,美国,2020年7月。
视图: 出版商的网站 | 谷歌学术搜索
l . w . Wang t . Liu, t·顾x赵,“卷积经常性的对知识的神经网络跟踪,”《2020年国际会议上Cyber-Enabled分布式计算和知识发现(CyberC)重庆,页287 - 290年,中国,2020年7月。
视图: 出版商的网站 | 谷歌学术搜索
诉Mandalapu j .锣和l .陈”,我们需要深入?知识与大数据跟踪,”2021年,https://arxiv.org/abs/2101.08349。
视图: 谷歌学术搜索
j .张x史,即国王,d . y . Yeung“动态键-值对知识记忆网络跟踪,”学报》第26届国际会议在万维网上,页765 - 774,珀斯,澳大利亚,2017年4月。
视图: 出版商的网站 | 谷歌学术搜索
r . s . Liu邹,j .太阳et al .,“分级跟踪内存网络知识,”专家系统与应用程序文章ID 114935卷,177年,2021年。
视图: 出版商的网站 | 谷歌学术搜索
t岛和美国Morishima LSTM-SAKT: LSTM-encoded SAKT-like变压器对知识跟踪,”2021年,https://arxiv.org/abs/2102.00845。
视图: 谷歌学术搜索
聚氨酯,m . Yudelson l .或者,y黄,“深入了解跟踪与变形金刚,”21国际会议的程序在人工智能教育Ifrane,页252 - 256年,摩洛哥,2020年7月。
视图: 出版商的网站 | 谷歌学术搜索
Pandey和j·斯利瓦斯塔瓦,“RKT: relation-aware self-attention知识跟踪”学报》第29届ACM国际会议信息和知识管理,页1205 - 1214年,爱尔兰,欧洲,2020年10月。
视图: 出版商的网站 | 谷歌学术搜索
崔y y李,j .赵et al .,“对一个适当的查询、关键和跟踪值计算知识,”第七届ACM学报》会议上学习@规模芝加哥,页341 - 344年,2020年8月,美国。
视图: 出版商的网站 | 谷歌学术搜索
马f . t . Wang, j .高,“深度层次知识跟踪”学报》第12届国际会议上教育数据挖掘加拿大蒙特利尔,页671 - 674,,2019年7月。
视图: 谷歌学术搜索
a . Ghosh、n·霍夫曼和a . s .局域网,“环境敏感细心的跟踪、知识”第26届ACM SIGKDD学报》国际会议上知识发现和数据挖掘,页2330 - 2339,纽约,纽约,美国,2020年8月。
视图: 出版商的网站 | 谷歌学术搜索
陈x y y . Liu Yang, j .沈h . Zhang和y,“改善知识嵌入跟踪通过训练的问题,”学报》第29届国际联合会议上人工智能1583年,页1577 - 2020年1月,日本横滨。
视图: 出版商的网站 | 谷歌学术搜索
h .中川、y Iwasawa和y松尾“基于知识跟踪:造型学生熟练使用神经网络图,”学报IEEE /每各月ACM国际会议网络情报塞萨洛尼基,页156 - 163年,希腊,2019年10月。
视图: 谷歌学术搜索
问:刘、黄z . y .阴et al .,“Ekt: exercise-aware知识跟踪学生成绩预测,“IEEE工程知识和数据,33卷,不。1,第115 - 100页,2021。
视图: 出版商的网站 | 谷歌学术搜索
美国通,问:刘黄w . et al .,“小知识跟踪:影响传播的观点,”20国际会议的程序数据挖掘索伦托,页541 - 550年,意大利,2020年11月。
视图: 出版商的网站 | 谷歌学术搜索
瞿y, j .沈y . et al .,“GIKT:基于对知识交互模型跟踪,”学报欧洲会议机器学习和数据库知识发现的原则和实践西班牙毕尔巴鄂,页299 - 315,,2020年9月。
视图: 出版商的网站 | 谷歌学术搜索
答:坟墓、g·韦恩和Danihelka,“神经图灵机,”2014年,https://arxiv.org/abs/1410.5401。
视图: 谷歌学术搜索
m·科利尔和j .分为“实现神经图灵机”学报》第27届国际会议上人工神经网络罗兹,页94 - 104年,希腊,2018年10月。
视图: 出版商的网站 | 谷歌学术搜索
坟墓,g .韦恩·m·雷诺兹et al .,“混合计算使用神经网络和动态外部存储器,”自然,卷538,不。7626年,第476 - 471页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
f .主啊,项目反应理论的应用实际测试问题美国新泽西,Erlbaum Associates Mahwah, 1980。
f .主”,理论考试成绩”心理专著,17卷,1952年。
视图: 谷歌学术搜索
h .岑,k . Koedinger,破车,“学习因素分析-认知模型的一种通用方法,评价和改进,”国际会议智能辅导系统学报》上Jhongli,页164 - 175年,台湾,2006年6月。
视图: 出版商的网站 | 谷歌学术搜索
p . i Pavlik h .岑,k . r . Koedinger”性能因素分析知识跟踪的新选择,”14日人工智能国际会议的程序教育布莱顿,页531 - 538年,英格兰,2009年7月。
视图: 出版商的网站 | 谷歌学术搜索
k·h·威尔逊,y Karklin,汉族,和c . Ekanadham“回到基础:贝叶斯的红外热成像优于神经网络扩展能力的估计,”第九届国际会议上教育学报》数据挖掘罗利,页539 - 544年,北卡罗莱纳,2016年6月。
视图: 谷歌学术搜索
罗苏y, z, p . et al .,“Time-and-Concept增强深多维项目反应理论可判断的知识跟踪、”以知识为基础的系统文章ID 106819卷,218年,2021年。
视图: 出版商的网站 | 谷歌学术搜索
h .岑,k . Koedinger,破车,“连接能力,比较两个红外热成像模型”智能辅导系统的程序加拿大蒙特利尔,页796 - 798,,2008年6月。
视图: 出版商的网站 | 谷歌学术搜索
美国Malekmohamadi Faradonbe、f . Safi-Esfahani和m . Karimian-kelishadrokhi”回顾神经图灵机(特种加工),“SN计算机科学,1卷,不。6,333年,页2020。
视图: 出版商的网站 | 谷歌学术搜索
答:澳网,s . Bartunov m . Botvinick d . Wierstra和t . Lillicrap“一次性memory-augmented神经网络学习,”2017年,https://arxiv.org/abs/1605.06065。
视图: 谷歌学术搜索
j .赵Bhatt, c . Thille n . Gattani和d . Zimmaro”冷启动知识跟踪关注神经图灵机,”第七届ACM学报》会议上学习@规模,第336 - 333页,芝加哥,2020年6月,美国。
视图: 出版商的网站 | 谷歌学术搜索
,的Hochreiter和j。施密德胡贝尔表示“长短期记忆。”神经计算,9卷,不。8,1735 - 1780年,1997页。
视图: 出版商的网站 | 谷歌学术搜索
崔y y李,d . Shin et al .,“EdNet:大规模的教育层次数据集”21国际会议的程序在人工智能教育Ifrane,页69 - 73年,摩洛哥,2020年7月。
视图: 出版商的网站 | 谷歌学术搜索
x,赵,e . g . Van Inwegen和j·e·贝克”更深层次的深入了解跟踪,”第九届国际会议上教育学报》数据挖掘罗利,页545 - 550年,数控,美国,2016年6月2日。
视图: 出版商的网站 | 谷歌学术搜索
m·弗里德曼“使用中避免正常隐式的假设方差分析,“美国统计协会杂志》上,32卷,不。200年,第701 - 675页,1937年。
视图: 出版商的网站 | 谷歌学术搜索
g l . Van Der Maaten和辛顿,“使用t-SNE可视化数据。”机器学习研究杂志》上,9卷,不。11日,第2605 - 2579页,2008年。
视图: 谷歌学术搜索
j . MacQueen“一些分类方法和多变量分析观察,”第五伯克利分校学报》研讨会上数理统计和概率,1卷,不。14日,页。281 - 297年奥克兰,加利福尼亚,1967年1月。
视图: 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

571年

下载

583年

引用

计算智能和神经科学

4.0人类行为建模在工程管理行业

NTM-Based Skill-Aware跟踪连接的技能知识

文摘

1。介绍

2。相关工作

2.1。项目反应理论

2.2。知识跟踪

2.3。跟踪Question-KC关系知识

3所示。问题公式化

4所示。在线辅导系统

4.1。Question-Level网上辅导系统

4.2。上面临了失业网上辅导系统

5。方法

5.1。模型

5.2。输入特性

5.2.1。回答的信息编码

5.2.2。RKC信息编码

5.3。神经图灵机

5.4。阅读

5.5。写作

5.6。寻址机制

5.6.1。关注的内容

5.6.2。聚焦位置

5.7。控制器

5.8。优化

5.9。技能的意识

6。实验

6.1。数据集

6.2。数据集的特点

6.3。对比模型和实现细节

6.4。实验结果

6.4.1。模型的性能

6.5。Friedman-Aligned等级测试

6.6。执行时间

7所示。讨论

7.1。预测过程

7.2。皮尔森相关系数

7.3。知识概念的发现

8。结论

数据可用性

的利益冲突

确认

引用

版权