文摘

针对缺乏层次和系统资源推荐由在线学习资源丰富,许多学习平台,一种引起ADCF在线学习资源推荐模型提出的将注意力机制引入深度合作的DCF)。实验结果表明,该ADCF模型支持的准确推荐在线学习资源,在人力资源和NDCG指标达到0.626和0.339,分别与DCF模型改进之前,1.31%和1.25%,和提出ADCF模型1.79%,2.17%,和2.32%,分别比IUNeu和NeuCF模型。

1。介绍

近年来,互联网的应用促进了教育从离线到在线。网络教育已成为当今教育的发展趋势,在庞大的教育市场占有一席之地。数据显示,2020年中国网络教育用户的数量从9099.2万年的2015增长到1.82492亿,增长了50.14%。在线教育的渗透方法,在线教育和学习资源越来越丰富,它不仅带来了教育的均衡发展和多方向的发展也给的推荐学习资源带来巨大困难。一方面,有更多的在线教育平台,每个平台的课程类型是复杂的和课程质量差,使学习者很难选择自己;另一方面,在线教育和学习资源缺乏对学习者的理解,这使得很难平台向学习者推荐个性化的课程。因此,有必要整合和分析在线学习资源,并建议他们根据学习者的需要。为了实现这个目的,相关学者进行研究。根据学生的不同特点,胡锦涛和其他选择一小块内容课程知识的学习资源,以课程知识为推荐点,实现个性化的网络学习资源的推荐设计个人个性化的学习机制的建议(1]。为了解决数据稀疏问题和协同过滤算法的可扩展性差,Honggang小王和其他使用动态优化它们k近邻和斜率算法,并分析了网络学习资源数据的稀疏基于邻居选择的结果。采用双向self-equilibrium阶段进化提高个性化推荐的资源推动,和模糊自适应二进制粒子群优化算法采用基于进化状态的判断来解决最优序列推荐问题,从而实现学习资源个性化推荐,提高网络学习资源的匹配程度和推荐速度(2,3]。元研究链接预测方法在网络教育,网络教育,构建一个合适的模型,提出了一种改进的基于神经网络的路径排序算法排序方法通过改进传统方法的分析。与此同时,随机游走模型和神经网络路径排序算法应用到在线学习知识库的链接预测问题(4]。谢等人提出了一种基于交互的用户推荐框架,探讨了实时即时反馈的兴趣,和真实数据集的实验表明,该算法实现更准确的预测结果和较高的推荐效率(5]。梁等人提出了一个学习风格模型,AROLS模型,代表在线学习者的特点,实现学习资源适应学习者的采矿行为数据,和提高网络学习资源的推荐效果6]。Antequera等人提出一个新颖的方法来提供快速、自动的,应用程序所有者和灵活的资源有限的专业知识构建和部署合适的云架构;与现有方案相比,该方案提高了资源推荐精度制造科学网关应用21% (7,8]。通过以上研究,可以发现,现有的网络学习资源推荐仅限于自己的推荐课程平台和不整合,全面推荐类似课程在其他平台上,导致经常准确的推荐课程的学习者。为了解决这个问题,本文构造一个基于现有的DCF ADCF推荐模型,通过整合整个平台的在线学习资源和引进注意力机制来分配资源,实现准确的重量在线学习资源的建议。

2。基本方法

2.1。简要介绍DCF)

DCF)是一个深度学习协作过滤推荐模型基于神经协作过滤推荐(NeuCF)模型,解决问题的一些NeuCF模型的输入特征类型,有效提高了特征模型的组合能力和非线性的能力。其基本架构类似于NeuCF模型架构,主要由多层感知器(MLP)和广义矩阵分解(GMF),包括输入层、编码层,嵌入层,嵌入层、特征提取层、汇聚层,功能连接层,神经网络层和输出层,如图1(9,10]。

模型输入层主要负责输入相关信息和辅助信息到模型进行训练。编码层负责编码输入特征信息。嵌入层负责将编码转换成相应的特征表示,通常包括两种类型GMF的线性模型和非线性模型的中长期规划。特征提取层负责提取特性关系,GMF是用于提取线性特性的关系,和延时是用于提取非线性关系10]。池层负责调整特征尺寸拼接方便功能,包括最大池,池(11]。功能连接层负责集成来自GMF的特征信息提取和中长期规划,主要是通过添加或拼接提取的特征。神经网络层负责训练模型和模型参数调优,并使用叉损失函数来调整网络的重量。输出层将输出值映射到一个特定的范围通过激活函数。乙状结肠函数选为激活函数,及其数学表达式如下(12]:

公式的值的范围f(x)是[0,1]。

的DCF)可以提取非线性和线性特性信息和个性化推荐能力强,但模型认为,所有功能都有相同的影响最终的推荐结果并没有区分不同功能的重要性。在实践中,不同的特征因素不同模型的预测结果,因此有必要改进模型。本文模型的推荐效果提高注意力机制的引入到模型中来区分不同功能的重要性。

2.2。DCF)细化

摘要DCF的改善注意力机制的引入到模型,提高模型的推荐效果通过添加特性之间的区别的重要性的关注层拼接层和神经网络层。DCF的注意机制主要是编码器和译码器的框架,和本质上是一种思维模式,公式(2)∼(4),通过允许DCF中的神经网络只关注局部信息的输入和选择特定的输入13]。

的公式,Xn代表了n维特征向量输入层的关注,f (x)表示注意力机制的网络,一个代表了n维特征向量,通过相对应的关注f(x),Z一个表示输出层的输出结果。在那个时候, ,的值范围一个(0,1);当一个常数1,关注网络有助于适应复杂的函数模型,当模型退化成DCF)。

的注意力机制层DCF(以下简称ADCF模型)获得每个特性尺寸的重量通过方程(5)∼(7)[14]。使用softmax计算每个特征维度的注意,然后与相应的交互特性point-multiply输入神经网络,最后预测值可以通过迭代训练获得的。

的公式,Z代表了th元素输入将softmax函数,软马克斯(Z)代表相应的softmax这个元素的价值,和Xn代表了拼接层输出值的特性。⊙表示点乘法;一个nsoftmax代表相应的价值计算,一个表示层输出值的关注。

ADCF模型,通过引入注意层DCF),可以区分不同的程度的贡献功能信息预测推荐结果,然后改进模型推荐效果。因此,本文提出一种新的在线资源推荐方法基于ADCF模型。

3.1。ADCF数学模型

ADCF模型的数学模型如下:

的公式, 代表连接;liGMF和liMLP代表GMF的学习者特征向量和延时模型, ,分别对应于{ };ciGMF和ciMLP代表课程资源模型的特征向量, ,分别对应于 ;piMLP, piGMF qcGMF, qcMLP代表学习者和课程资源特征向量和GMF和延时模型辅助信息; ,分别代表底层特征关系学会通过延时和GMF模型。从模型中,整个模型流程使用学习者和课程辅助信息,这些共同决定了预测模型的推荐性能。

3.2。基于ADCF在线学习资源推荐

从上面的分析,基于ADCF在线学习资源推荐模型设计,如图2。模型的输入层包括学习者和课程的相关信息,输入表单的learner-course的行为序列 在这其中,X代表了th行为 包含有关学习者的ID、性别、职业、和 包含课程ID、标签、名称等。

编码层转换输入信息通过一个炎热的嵌入特性演示(15]。以学习者性为例,男性被编码(1,0)和女性[0,1]。

嵌入层首先初始化一个嵌入性矩阵,矩阵的大小 ,2表示可能的性价值观和在哪里d表示嵌入维数。使用上面的操作,棘手的类别特征能够被转化成容易处理的向量。过程和学习者特征,包括课程编码ID、名称、复杂性,标签,和学习者ID,性别,专业,职业。嵌入对应于一个16的长度,所以总嵌入长度 和输出矩阵维度 然后,辅助信息( )添加·n通过扁平化操作扩展长度 ,在哪里代表输入长度,n表明潜在的特征长度和嵌入层输入规模扩展从(1,1,n)(1),n)。

特征提取层使用GMF和MLP提取线性和非线性的学习者和课程之间的关系,GMF模型需要用户的隐式特征向量点乘和项目作为输出结果,模型和连接压扁结果始终作为输出结果到神经网络。的激活函数神经网络采用ReLU函数(16]。

池层采用最大池大小调整功能,这样的输出向量GMF模型和网络模型达到相同的大小通过汇聚层。

功能拼接层拼接,拼接GMF的特征信息提取和中长期规划模型。注意层分配拼接重量和输入到神经网络层的分配结果。神经网络层损失函数遵循叉DCF的损失函数,通过反向传播调整权重的每一层(17]。输出层遵循乙状结肠函数作为激活函数和地图的输出值在一定范围的建议。

4所示。仿真实验

4.1。实验环境建设

这个实验进行分布式框架和NVIDIA CUDA并行计算平台与硒+网络驱动程序,安装Chorme80.03987.132, Python3.6编译环境,编译器PyCharm Requests2.21.0和依赖模块,美丽的汤,Selenuim等等。

4.2。数据预处理

考虑到大量的爬数据集,computer-class-related数据构建实验数据集,选择与学习者互动大于20被选为主要的研究对象。通过统计整理,878年的计算机课程,203987年3066学习者,学习者历史数据。当然交互数字和学习者的数量分布如图3

4.3。数据集建设

在线学习资源推荐问题实际上是一个disclassification预测学习者是否将学习课程(18]。在线学习资源推荐问题实际上是一个disclassification预测学习者是否将学习课程(18,19]。如果缺失的样本数据集被默认情况下积极的样本,很容易导致不平衡的数据集。因此,为了解决这个问题,本文选择一些样品作为负样本的随机均匀采样缺失值。

考虑到学习者学习历史记录特定的序列关系,第一个 记录被用作训练集和最后有效互动n作为测试集。该模型通过训练集训练,及其性能检测使用验证。验证组由100课程和拼接测试组随机数据来自没有交互。实验方便、批量大小训练的模式设置为有效交互的数量 每个学习者。

4.4。评价指标

命中率、人力资源和归一化累积获得折扣,和NDCG作为性能指标评价模型,计算公式(9)和公式(10)[20.- - - - - -22]:

在方程(9),HitRatio @K代表了命中率,测试的数量预测Top-k列表中的每个学习者和分母代表测试集的数量。在方程(10)∼方程(13),代表这个职位的推荐名单;k代表了k最高的价值k;CGk表示累积获得;和代表了推荐结果的相关位置。在这篇文章中,= 1表示支安打,贫= 0表示怀念。DCGk代表了累积损伤增加,所以当= 1,DCGk计算公式(14),当= 0,DCGk计算公式(15)。IDCGk代表了理想化的增益损失,与所有预测,= 1,所以IDCGk计算方法可以写成公式(16)。

4.5。参数设置

在这个实验中,模型学习速率被设定为0.001,20岁的迭代次数,预测数字k= 10。模型采用熵损失函数,计算公式如下(23,24]:

的公式,X代表输入变量,Y输出变量,l损失函数,N输入样本大小和可能的类别的数量。的yij是一个二进制指示器指示是否类别j进入真正的实例的类别x。的pij代表的概率模型预测输入实例x属于的类别j。本文推荐的结果包括建议和反对,表示的1而不是0。因此,公式(17)可以被覆盖

的公式,y代表真正的输入实例的类别x,p表示的概率预测输入实例x属于类别1,l(损失)代表对数损失平均为每个样本。熵函数是用来测量的相似性yp

4.6。实验结果
4.6.1。分析参数对模型的性能

这个实验被用来探索不同参数对模型性能的影响。数据45人力资源和NDCG指标的变化在不同的迭代次数,分别。根据图,与相同数量的迭代,DCF和ADCF模型表现更好的人力资源和NDCG指标IUNeu和NeuCF模型相比,DCF和ADCF模型还显示更好和更稳定的性能随着迭代次数增加。拟议中的ADCF模型添加关注机制提取特征和表现最好的。

对于不同的推荐课程k,推荐不同的模型的性能数据67。如图,用k值增加,人力资源和NDCG ADCF矩阵,DCF,和NeuCF模型逐渐增加,表明该模型建议效果越来越好。在同一k价值观,ADCF模型优于比NeuCF和IUNeu DCF模型和ADCF模型,表明ADCF模型推荐最好的效果。因此,它表明,拟议中的ADCF模型推荐最佳的性能。

人力资源和NDCG指标对不同模型在不同负采样num-neg值比较数据89,分别。从图-采样的值范围n是(1,10),和不同的模型是最优的推荐效果n= 4。总体而言,该ADCG模型具有较小的波动在HR和NDCG指标比DCF和NeuCF模型。这表明整个ADCF模型通常有更好的推荐性能。

4.6.2。模型的性能分析

验证该模型的性能,不同模型的测试结果如IUNeu NeuCF,和DCF与拟议的模型进行了测试实验数据集,如表所示1。根据表,该模型对人力资源和NDCG执行最好的指标,达到0.626和0.339,IUNeu模型相比,分别;人力资源和NDCG指标分别增长1.79%和1.86%;与NeuCF相比,增加了2.17%和2.32%,人力资源和NDCG指标,分别;相比于DCF模型,分别增加了1.31%和1.25%。

的时间指标,提出ADCF模型改进了训练时间和数据集的验证时间相比比较模型;DCF和NeuCF模型相比,平均总培训时间增加1和2.6年代,每个迭代的平均总验证时间增加了0.5和0.2年代,分别。分析的原因是,该模型引入了一个拼接层注意机制的特点,所以它的时间性能下降,但整体效果很小。

5。结论

在本文中,一种引起深度协作提出了在线学习资源推荐方法;它可以实现在线学习资源的准确的推荐。与拟议中的前DCF)相比,该ADCF模型提高了1.31%和1.25%的人力资源和NDCG指标,分别;与IUNeu和NeuCF模型相比,该ADCF模型提高了1.79%和1.86%,2.17%,和2.32%的人力资源和NDCG指标,分别有一些实际的应用价值。本文提出一种在线学习资源推荐的初步研究,但这项研究仍处于初级阶段,存在一些问题需要改进。例如,当有一个特征融合方法,采用拼接的方法,虽然有很多特征融合方法,不同的融合方法适用于不同的模型。因此,应该探索多种方式选择最好的融合方法。下一步,将会优化从上面的缺陷,进一步提高网络学习资源的推荐效果。

数据可用性

使用的实验数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。