文摘
如今,推荐系统被广泛应用在各个领域解决信息过载的问题。协同过滤和基于内容的推荐系统模型代表解决方案;然而,基于内容的模型也有一些缺点,如单一的推荐结果和缺乏有效的用户首选项的看法,而对于协同过滤模型,有冷启动问题,这样一个模型极大地影响其采用聚类算法。为了解决这些问题,提出了一种混合的推荐方案,基于协同过滤和基于内容的。在这个方案中,我们提出时间影响因子的概念,和time-aware用户偏好模型构建基于它。同时,用户反馈的建议项是用来改善我们的提出的建议模型的准确性。最后,提出了混合模型结合内容推荐和协同过滤的结果基于逻辑回归算法。
1。介绍
与互联网的快速发展,用户可以享受丰富的信息服务,方便社会互动通过互联网应用1]。然而,互联网应用的信息过载问题正变得越来越严重,这使得用户很难选择他们真正喜欢的。因此,各种推荐模型被广泛用于帮助用户定位信息。一般来说,这些流行可分为协同过滤推荐模型,基于内容的,混合的方法。协同过滤方法(2- - - - - -4)是基于视图,用户之间的相似度越高,越用户首选项的重叠。基于内容的方法(5,6)是基于表示推荐项目,这些表示通常从描述中提取。有必要计算项目之间的相似性表示和用户配置文件。混合方法(7)生成建议通过结合其他方法。这种方法是基于混合方法应该利用其他方法,避免每种方法的缺点,实现更好的建议。
在这些方法中,协同过滤是在电子商务领域得到广泛应用。基于内容的推荐博客表现良好,新闻,和文档。一般来说,比基于内容的协同过滤有更好的性能模型。注意,更好的性能是基于充分的用户信息,包括个人信息和行为信息。此外,协同过滤模型通常遭受冷启动问题由于缺乏足够的评级记录(3,5)情况下的基于内容的模型似乎是另一种方法。然而,这种方法有其局限性。例如,用户的配置文件无法准确获得因为缺乏足够的用户行为信息2,6]。另一个问题是,基于内容的方法是缓慢的感知用户偏好的变化。事实上,用户的兴趣通常随时间变化。例如,一个时尚风衣适合秋天启动。用户有这样的需求和关注它。但在秋天,他可能不再需要这样的衣服,和相关的行为记录仍在推荐模型和影响推荐结果。这是因为基于内容的模型只取决于用户的偏好某些项目在过去,和生成的建议CB将类似,用户喜欢使用。
混合推荐模型提供了一种新的方法来解决上述问题。不同种类的混合推荐模型提出了互联网应用(8,9),如加权结果不同的推荐技术,使用(即切换机制。,this mechanism changes and adopts different recommendation technologies according to the background and actual situations of problems). However, there is no research considering the impact of time on user preferences in the hybrid model. Based on our experience, the time factor has a significant impact on user preferences, and these preferences are usually changing with time. Thus, we should pay attention to the time factor that affects user preferences. Moreover, we can improve the recommender system by utilizing feedback from users. Therefore, we propose a novel hybrid recommendation model, which contains 3 key points:(1)为构建用户配置文件中,我们使用时间因素作为选择加权基础行为记录。在这个选择过程中,我们将关注生成的行为记录,更接近当前时间。因此,所选的记录中包含的兴趣点,应该放在首位。(2)应引入反馈机制模型,可用于建立反馈库基于用户的反馈记录(例如,点击率和浏览时间)之前的建议。此外,混合模型的建议应该过滤反馈机制来提高模型的准确性。(3)谱聚类算法用于提高协同过滤的效率。
最后,我们使用逻辑回归方法聚合基于内容和协同过滤的推荐。本文的其余部分组织如下。节2,并给出了相关的工作。第三节提供了必要的背景来理解该方案,如偏好表征和谱聚类算法。在第四节,我们详细描述该方案,包括时间影响因子的定义。在第五节介绍实验环境和分析实验结果。最后,结论和未来的工作介绍第六节。
2。相关工作
推荐模型的主要目的是为用户提供有用的和合适的物品。传统的推荐方法,包括协同过滤、基于内容的,以知识为基础的。具体来说,这些方法主要集中在在线新闻、社交媒体、网络广告和电子商务。然而,一个推荐方法可能不是表现良好,很难收集足够详细的用户行为记录隐私问题。因此,越来越多的受到关注的混合方法和最近研究已经开展。
早期的混合模型主要用于提高协同过滤。2005年,李et al。10)提出一个混合模型基于项的协同过滤和用户。该模型结合了基于项目和基于用户的协同过滤。活跃用户和其他邻居用户之间的相似度计算是基于其他项目相关预测项目,不是所有项目。研究人员认为将各种辅助信息引入到推荐模型构建更好的混合模型。例如,研究[11- - - - - -13引入一个混合模型,利用基于用户相似度,POI-based(兴趣点)相似,和地理信息推荐旅游景点。郑et al。14)设计了一个混合以信任为基础的模型。这个模型应用于在线学习领域,处理数据稀疏的问题通过合并两个信任关系到算法计算。我更多的混合模型中隐含的信息,在15),一个贝叶斯网络模型结合基于内容和协同过滤,提出了贝叶斯网络是用来计算用户访问时间和资源的联合概率分布信息来获取用户的兴趣所提供的资源。在[16- - - - - -18),组织推荐的概念,提出了Boutilier et al。16)开发的概率推理方法来预测个体偏好给出观察社会关系。太阳et al。18)提出了一个social-aware集团推荐框架,共同利用的社会关系和社会行为不仅推断出一群的偏好也模型小组成员的宽容和利他主义特征。在[19),提出了一种time-aware混合模型在微博话题。自微博社区的热点话题很快改变随着时间的推移,有必要推荐时间敏感的话题。这样一个模型结合基于内容的方法和time-aware组件,以发现潜在的主题。
人工智能技术提供一个新的视角来提高混合模型。在[20.),系统使用一个情绪分析方法分类用户的关键词或评级提出了积极的和消极的。该系统将向用户推荐商品匹配他们的情感倾向。在的工作21,22)、知识图主要是集成到推荐生成过程作为一个数据集丰富的语义。在[23),一个混合模型,构建模型,提出了一个基于潜在的因素。这种方法结合了潜伏的力量分解图。在[24),一个协作提出了深刻的学习模式。这个模型适用于深层神经网络和卷积神经网络提取隐藏的特征向量的用户和项目构建评分矩阵稀疏的评级。Yu et al。25)提出了一种多重线性互动MF(矩阵分解)算法(MLIMF)模型之间的交互的用户和每个事件与他们的最后决定。该模型认为不仅user-item评级信息,而且基于一些实证支持的两两交互作用因素,这个模型是用来解决问题的过度依赖user-item MF-based评级矩阵(矩阵分解)方法。解决的问题的稀疏的内容项目协作检索系统(CR),余et al。26]建议的复杂的关系(查询、用户和项目)三重从项目的角度应该足够了。此外,模型提出了另一种映像(26],它能够更好地评估这些项目的排名与给定query-user稀疏信息。
总的来说,混合推荐的先前的研究工作主要集中在解决评级矩阵的稀疏和矿业隐式的用户和项目之间的关系。然而,来自用户的反馈建议和及时性的建议并没有足够的关注。这项工作是建立在之前的工作基于内容和协同过滤,我们考虑特别是时间因素和用户的反馈来提高性能的建议。
3所示。预赛
3.1。偏好表示
用户偏好应该代表的方式可以很容易地由计算机处理系统。通常情况下,自然语言描述的物品应该直接转换为计算机可以处理的结构。具体的,有几个结构得到了广泛的应用,如user-item评级矩阵(8),用户兴趣知识表(27),关键词向量、VSM(向量空间模型),和语义本体(28- - - - - -30.]。在这项工作中,我们选择扫描仪作为用户偏好结构由于以下原因:(1)与用户兴趣知识表(27],VSM模型相对简单,结构和建筑VSM模型的计算成本并不是很大。(2)与关键字向量相比,VSM模型相当于一组通用关键词向量,它包括推荐计算更有用的信息。(3)此外,VSM模型不依赖于自然语言处理技术,和实现困难的特点是小于语义本体的方法。
在那之后,我们可以简要介绍几个概念有关VSM如下:(1)文档:通常一个片段和一定规模的一篇文章中,如句子、句群、段落,和段落组织。在推荐系统中,文档主要指项目推荐(如新闻、博客、视频和音乐)或用户行为记录。(2)项/功能项:一个功能项是最小的不可分割的特点,语言单位可以是一个词,一个短语,短语组。针对推荐系统,这个术语指的是关键字可以代表推荐项目的特点或评级项目的用户。因此,一个文档可以被视为一个条款和集合可以表示为 ,在哪里( )是一个功能项。(3)项重量:为文档 ,每一项 应该分配一个体重吗在文档中显示它的重要性 。然后,这样的文档可以表示为 。在推荐系统中,这个词代表的重量重量特征关键词推荐的物品后转化为向量形式或每个评分项的得分在用户评级向量。因此,给定一个文档 ,它符合以下两个原则:(1)每个功能项 是不同的(没有重复)。(2)没有顺序关系的每个特性(即文档的内部结构不考虑)。然后,我们调用 文档的向量和向量空间模型。TF-IDF(术语frequency-inverse文档频率)9)通常是用来计算特征项的权重在VSM。TF-IDF的主要思想是,如果一个功能词经常出现在一篇文章中,但很少在其他的文章中,认为这一项应该分配高体重。我们可以描述TF-IDF的计算过程如下:(我)步骤1:特遣部队频率(频率)意味着词,也就是说,一个词出现的次数在一篇文章中写道。它可以计算如下: 在哪里是多的在文档和分母所有条款的总数在吗(2)步骤2:IDF(逆文档频率)显示所有文档中一个词的频率。如果一个词出现在许多文本,其IDF应该低。它可以计算如下: 在哪里所有文件的总数和吗 显示包含这个词的文档的数量 。我们通常用 避免分母为零的分母。(3)步骤3:我们可以计算的TF-IDF值项作为 ,所示如下方程:
之后引入的定义VSM和TF-IDF计算过程的细节,我们可以给偏好表示的定义如下。
定义1(表示)的偏好。让 代表了用户偏好特点,计算的重量吗 - - - - - -偏好。
3.2。谱聚类
一般来说,用户或项目之间的相似度计算的协同过滤算法。例如,在基于用户的协同过滤,第一步是提供一个用户组成的集合元素相似度最高的。然后,项目的建议是基于相似用户的利益和偏好。因此,随着用户的增加,推荐算法的效率会下降。为了解决这个挑战,聚类算法和应用的推荐算法。通过将用户划分为不同的集群基于用户相似度,涉及的计算只在集群和不同集群。
谱聚类的概念来自于图论。的本质是将聚类问题转化为图的最优划分问题。谱聚类的过程中,数据的节点作为顶点图中,边缘顶点之间分配权重根据数据节点之间的相似性。最后,一个无向加权图 就形成了。相比与传统的聚类算法等 - - - - - -意味着,谱聚类算法可以解决凸样本空间的局部最优问题,可以在任意形状的样本空间集群,具有更好的聚类效果。谱聚类的具体过程可以概括如下:(1)用户行为数据集应该清洗和过滤后的第一,然后是相似性矩阵 由计算用户的相似的行为。(2)度矩阵创建基于相似矩阵 :的和矩阵的每一行的元素分配矩阵中的元素 。然后,拉普拉斯矩阵被构造成 。(3)矩阵分解为特征向量,并选择适当的特征向量是列存储形成特性矩阵吗 。(4)每个向量的特性矩阵作为一个独立的样本,向量是集群使用吗 - - - - - -意味着形成集群 , ,…, 。
3.3。相似度计算
基于用户的协同过滤,用户的相似度评价是基于评级矩阵,和皮尔森相关系数用于测量相似。然而,评级矩阵通常是稀疏的;特别是,不同用户的评级相同的项目相对稀疏。因此,用户的利益明显不同,但计算相似性可能相对较近。因此,当使用皮尔逊相关系数来计算用户相似度,应该考虑共同利益的用户数量,所以修改后的皮尔森相关系数定义如下:
在哪里表示用户的相似性和 , 的协方差和项目评级,和表示用户的标准差和分别为评级。在这里,和被表示的一组项目和 ,分别。因此, 表示额定的物品和 。同时, 是常见的用户评分项的比例和 ,用于修改计算皮尔逊系数。 表示物品的数量被用户或 。
4所示。提出了方案
4.1。Time-Aware偏好模型
用户偏好模型的建立是一个关键的一步我们的推荐方案。基本思想是分析用户的行为记录的在线网站或应用程序。基于概率统计理论,术语的频率越高,越高用户的兴趣,可以在此基础上建立用户偏好模型理论。图1显示了构建用户偏好模型的基本框架包括三个主要步骤:
定义2。(影响因子):让用户的关键词 。 ,的时间戳是 ,和当前时间 ,然后的时间因素可以定义如下: 在方程(7),成反比的区别和 ,也就是说,越近的一代时间是当前时间 ,越高应该是。因此,应该重新定义为关键字的重量 ,可以详细描述如下: 因此,可以被定义为用户偏好模型 。
4.2。反馈机制
推荐模型通常基于的想法当用户感兴趣的几个项目,他或她仍然沉浸在很长一段时间。随后,类似的项目类型用户的偏好将推荐的系统。然而,这种模式有两个缺点:(1)评级通常是稀疏的,很难获得完整的评级的用户隐私问题。(2)离线训练模式很难保证推荐系统的实时性能。为了解决这些问题,我们引入用户反馈机制提出方案。正如我们所知,点击率高的推荐的物品或浏览率可以被认为是适合用户的偏好。因此,这些内容应该增加的重量。此外,推荐的物品点击或浏览率较低可能被认为与用户匹配度较低的偏好模型,和这些内容的重量应该降低。具体来说,反馈机制可以分为两个阶段:构建用户反馈库和应用反馈库。构建用户反馈库而言,关键的步骤如下:步骤1(识别反馈数据的特点):物品已经建议用户后,需要追踪反馈用户建议项目优化模型。第一件事是,我们应该确定反馈数据的特点和用户的反馈数据存储到一个数据库中。一般来说,我们主要考虑反馈数据的基本特征,如点击或浏览率、商品标签,点击、浏览时间在这个工作。因此,一组特性 将在这一步中生成。步骤2(反馈数据分类):获取标准的反馈数据后,下一步就是根据建议对这些数据进行分类的效果。在这项工作中,我们定义来表示用户的兴趣推荐基于反馈数据,可以计算如下:
在哪里表示特性的重量 。事实上,基于反馈数据,信息增益每一个 计算的重量来表示 。除此之外,我们应该数字化和规范化的所有特性(例如,单击或浏览率和浏览时间)的反馈数据;用于表示的分数值吗在数字化和规范化。在这里,我们使用的信息增益特性在方程(9),因为信息增益可以表达的贡献分类的记录(例如,等特性点击率和浏览时间有不同的贡献决定是否记录是负的)。至于使用分数在方程(9),它本质上是一个规范化的具体特征(例如,点击率是0.43)。我们采用归一化法的原因是不同的特性和测量的值范围是不同的。因此,我们需要不同特性的值映射到相同的数值空间(即。[0,1])。
之后,我们可以将数据反馈到积极的样本库和负样本库基于反馈影响因子 。具体来说,积极的样本库包含与用户的积极反馈(即物品。,users are more interested in these items), while the negative sample library represents the items that are of little interest to users. The detail process of building feedback libraries is shown in Algorithm1。
|
完成后反馈库的建立,我们可以详细描述反馈机制如下:(1)当最高推荐项目 推荐系统生成的,那么 ,平均相似性是哪一个 和积极的图书馆,应该计算。基于同样的原理, ,平均相似性是哪一个 和消极的图书馆,应该计算。(2)我们设置积极的相似性和设置的阈值的阈值-相似。这些阈值参数由机器学习算法进行了优化,但具体过程不是本研究的重点。(3)如果 ,然后应该建议体重增加了吗 。与此同时,如果 ,然后应该体重减少了吗 。
最后,将重构基于反馈机制。具体来说,项目的将会被重新排序根据体重调整建议,和较低的项目建议重量将被删除从顶部-推荐列表。
4.3。基于谱聚类的协同过滤
在这部作品中,基于谱聚类的协同过滤方法可分为两个阶段:用户信息聚类的推荐项目。具体过程可以描述如下。
4.3.1。用户聚类阶段
(1)构建评价矩阵从用户的评级数据和矩阵通过数值归一化,平滑的评级矩阵(2)的矩阵 ,用户相似性计算方程(4),然后用户的相似性矩阵获得(3)相似度矩阵输入参数的谱聚类算法,然后用户的聚类结果 将会获得
重要的是要注意,协同过滤算法也不敏感;因此,在这一过程中使用评级数据建立评价矩阵 ,我们使用方程定义的时间影响因素(7)改善的及时性 。也就是说,对于每个评级元素 ,我们计算它的时间影响因子和重量评级的价值。
4.3.2。项目建议阶段
(1)选择 - - - - - -最近邻集合 从集群包含用户(2)计算预测评分值的用户对于一个未分级的项目如下: 在哪里表示用户之间的相似性和用户 ,可以计算出方程(4)。然后,是用户的评级吗的项目 。
最后,我们可以获得用户的预测评价向量为所有项目 。在这里,应该排序和顶部项目可以选为推荐商品。
4.4。基于用户偏好的内容过滤
基于构建的偏好模型 ,我们使用基于内容的模型生成一批候选人推荐项目,可有效推荐新物品不被其他用户。由于每个用户的偏好模型是基于他/她的行为记录,那么这个方法可以消除干扰其他用户的恶意行为(例如,使用多个帐户建立一个项目)的评级从干扰推荐结果。内容过滤的基本思想是根据用户偏好模型推荐项目。在这项研究中,我们使用内容过滤方法是我们计划的重要组成部分之一。我们可以简要介绍流程如下:(1)让是 - - - - - -项目的关键字 。 的重量是在 ,之后的内容可以被定义为 。(2)正如上面提到的,建议用户提供内容过滤方法相似的内容以前最喜欢的物品。因此,有必要模型用户的偏好基于以前的行为。事实上,我们利用提出的方法4.2节建立偏好模型 。(3)总的来说,我们应该地图和相同的向量空间,所以推荐的计算可以转化为向量相似度计算。一个重要的事情是计算语义相似度向量之间的关键字。例如,“算法”和“机器学习”语义相关性很高,但是如果我们只使用余弦相似性,语义相似度可能会被忽略。在这项工作中,我们使用Skip-gram模型(31日)获得字嵌入的,我们使用谷歌新闻语料库作为训练数据集。Skip-gram的基本结构如图2,这是一个三层神经网络。为关键词,第一层是输入层和输入关键字通常是用向量形式;我们使用一个炎热的编码技术将自然语言关键字转换成向量。第三层是输出层,这句话说的概率出现在输入时的上下文,和Softmax通常是用来计算概率在这一层。此外,隐层没有任何激活函数,通常是由线性细胞。我们使用随机梯度下降的方法31日更新模型参数,嵌入生成的词是用来测量输入关键词的语义相似度。事实上,关键词语义相似,他们的背景是相似的,他们的向量表示也类似。(4)属性映射完成后,和将统一到相同的特点。然后,我们应该计算内容向量之间的相似度和用户偏好向量如下: 余弦相似度是用来测量符合用户首选项和的程度的重量吗 - - - - - -属性向量中 。最后,我们可以获得物品的相似向量 。在这里,应该进行排序,前-项目可以选为推荐商品。
4.5。混合模型
在本节中,一个混合的推荐模型提出了基于逻辑回归,以及体系结构如图3。
定义3。(混合模型):让
建议项向量,向量对应的预测评级基于用户的协同过滤作为
。与此同时,评级基于内容模型的价值
。然后,让
混合模型的结果,代表建议项目的最终评级
,这是计算使用和
。
逻辑回归用于聚合协同过滤和基于内容推荐的结果。然后和应的参数方程如下:
在哪里可以定义如下:
在哪里
常系数表示的输入参数
和
,和
可以通过梯度下降算法计算。
总的来说,我们应该使用该混合方法来获得一个更好的推荐效果,具体过程可以被描述为以下步骤:步骤1:使用上面的协同过滤4.3节获取推荐项目
和相应的预测评分值
。步骤2:使用上述基于内容模型中定义4.4节获取推荐项目预测评级的价值作为
。步骤3:
和
被选中作为输入参数方程(13)。然后,综合评级
将生成的。步骤4:
将分类和相应的物品吗
应该选为顶部-推荐项目。重要的是要注意,应该由反馈库(即过滤。积极的和消极的图书馆4.2节)来获得更好的建议。
5。实验和结果
5.1。数据准备
比较该模型与最先进的方法,我们使用三个公共真实数据集的比较,介绍如下:(1)经OULAD(开放大学学习分析)数据集32:这是一个最近发布的开源数据集。使用数据集(经OULAD)包含32593学习者和他们的评估结果(约10655280条记录)。在这篇文章中,我们主要关注呋喃(虚拟学习环境)数据,显示学习者在选择学习材料的偏好。(2)MovieLens-Latest:收集这个数据集的一部分GroupLens明尼苏达大学的研究项目。这个数据集包含27000000评级和1100000标签应用程序应用到280000年58000部电影的用户。(3)图书漂流:这个数据集收集的Cai-Nicolas齐格勒图书漂流的社区。数据集包含278858个用户(匿名但人口信息)提供1149780评级(显式或隐式)约271379册。
事实上,我们应该采取进一步的措施来处理上述数据集。具体来说,数据应该过滤来实现更可靠的和完成的记录。例如,我们从studentAssessment获得约140406有效记录。通过提取分数超过csv从173913年开始记录。此外,减少干扰的异常数据的实验中,我们使用 - - - - - -意味着集群数据和消除异常数据。大数量异常可能会导致聚类结果的巨大偏差。图书漂流的数据集,我们删除Bx-Book-Ratings.csv大约8576条记录。然后,这三个数据集的统计数据,如表所示1。
此外,我们应该确定哪些基本功能使用基于特定的数据集。具体,我们选择在线学习时间,课程的点击率,一类课程经OULAD数据集的基本特征。至于MovieLens-Latest数据集,我们选择浏览时间,类型的电影,和评级得分为基本特征。图书漂流数据集时,评级得分来自用户,出版日期,选择项标记为基本特征。
5.2。评价指标
在这项研究中,精密、召回和F1-score运用指标来评估我们的方案。的定义如下: 精度是正确的比例判断存在的传播关系的判断存在的传播关系。召回的比率是正确判断存在的传播关系系统中所有存在的传播关系。F1-score是调和平均数(平均)的精度和召回。因此,F1-score时将是一个更好的测量精度和召回有时是矛盾的。的意义 , ,和描述在表2。
5.3。评估基线
在本节中,我们比较方案与几个先进的推荐算法。因此,基线用于我们的实验如下:(1)PRMR [33]:这个方法提出了提高协同过滤(CF)的效率对电影推荐,然后一个简单但高效的推荐算法,它利用用户的配置文件属性划分成几个集群。对于每一个集群,一个虚拟的意见领袖是构思代表整个集群,这样原始的维数user-item矩阵可以显著减少。(2)AROLS [34]:这项工作介绍一个在线学习者的学习风格模型来表示特征。它还提供了一个增强的推荐方法自适应推荐基于在线学习风格(AROLS),实现学习资源适应通过挖掘学习者的行为数据。AROLS应用协同过滤(CF)和关联规则挖掘提取每个集群的偏好和行为模式。(3)HRBRM [35]:这个研究最重要的成就是在混合推荐系统,提出一个新颖的方法识别用户相似性社区隐性信息。(4)HRSRL [36]:这项工作提出了一个混合推荐系统,结合基于内容和协同过滤推荐工作。在这个系统,提出统计关系学习(SRL)用于结合两种推荐方法通过其能力直接代表了概率相关对象的属性之间的依赖关系。
注意,所有比较方法,我们调优hyperparameters仔细根据相应的引用来确保每个方法达到其性能对于一个公平的比较。具体而言,我们将采用数据集划分为五部分,可以测试数据集和训练数据集。此外,我们将测试数据集占 (20%)和训练数据占用 (80%)的原始数据集。五轮的培训和测试要求,每一轮的训练过程需要改变测试数据(测试数据集的数量保持不变,占 (20%)的数据集),所以,经过五轮的测试数据集使用的总可以利用。在这里,我们可以简要描述这个过程,如图4。
5.4。参数的影响
使我们的计划取得更好的性能,我们分析的参数如何影响我们的方案的性能在所有使用的数据集(例如、经OULAD MovieLens-Latest和图书漂流)。我们的hyperparameters学习和 ,分别是图书馆建筑正面和负面的阈值。我们样品的值和从0.1到0.9,结果F1-score如图5。具体来说,我们第一个评价参数的影响上的建议。我们设置 和- - - - - -= 25(即。,the number of recommendation items). F1-score increases when增加,这符合我们的计划利用更多的信息从用户的偏好。然而,当增加到一定值,相应的F1-score减少;这可能是因为图书馆减少反馈的准确性。基于同样的原理,我们也设置 和- - - - - -= 25评估的影响 ,结果如图所示5(b)。此外,选择适当的和 ,我们进行离线训练的过程参数,最大化F1-score由不断变化的推荐结果和 。
如图6,我们不断调整和不断取得更好的建议(F1-score),最后获得了优化的参数表3通过几轮的离线训练。
(一)
(b)
5.5。实验结果
在我们的实验中,选择的内部参数(例如,和 )基于表的结果吗3。性能比较,我们报告推荐不同的方法的精度和召回三个数据表4。重要的是要注意,所有结果表4每个实验五倍的平均性能。
从结果表4,我们有以下的独到见解:第一,我们的方案执行比其他基线评估在三个数据集的精度和召回工作。具体,我们可以看到,我们的计划执行比PRMR约11.6%和9.2%指标的精度和召回,分别。事实上,PRMR用于提高协同过滤的效率在电影推荐场景;时间复杂度的主要焦点是提高CF的实时性能的建议和用户首选项并没有充分考虑。至于AROLS模型,经OULAD表现良好的数据集,因为这种方法关注的推荐学习资源,但它只适用于协同过滤(CF)和关联规则挖掘提取偏好不使用任何用户的反馈,从而导致的精度和召回仍然低于我们计划约15.8%和8.5%,分别。其次,从结果,我们发现混合方法比传统的推荐算法有更好的表现。例如,HRBRM执行比PRMR和AROLS约4.5%和4.9%的召回。HRSRL还执行比PRMR AROLS 4.8%和10.1%精度的指标,分别。这是因为这些混合方案利用协同过滤和基于内容的方法。与上述混合模型相比,我们计划这三个数据集上达到更好的性能。 Specifically, for all the used datasets, our scheme performs better than HRBRM and HRSRL by about 7.2% and 6.6% on the metrics of F1-score, respectively. Note that the F1-score that we used is the average value of different Top-N conditions in Table4。特别是,建议的增加,性能稳定的方案优于其他两个基线。事实上,随着实验的时候,我们的计划时间和用户偏好的优点感知会更明显。原因可能是我们与time-aware方案和用户反馈机制对用户偏好更敏感。
F1-score措施建议方案的总体性能,如图7。对于我们的方案,F1-score略有变化的数量推荐项目,而某些值周围的基线也发生了变化。具体而言,我们可以测量的稳定性方案通过计算F1-score的标准差。方案,计算标准差F1-score大约是0.0401,这是在一个较低的状态。我们可以看到,我们的方案的性能在一个相对稳定的状态与其他混合动力方案(即使用。的标准差HRBRM HRSRL的0.0428和0.0459)。如图7,我们的方案达到最佳性能F1-score在所有三个数据集。具体地说,我们的计划的平均F1-score大约是10.2%,12.5%,7.2%,和6.6%大于PRMR, AROLS, HRBRM和HRSRL分别。总体而言,与PRMR和AROLS相比,我们的方案可以使用协同过滤和基于内容模型的优点。混合基线(即。,HRBRM and HRSRL), our scheme takes into account the time characteristics of user preferences and the user feedback on recommendation items. Furthermore, to verify that the improvements in our scheme are statistically significant, we conduct severalt测试分析实现改进。具体而言,我们采用paired-samplet测试和使用的计算F1-score基线作为分析数据。因此,我们可以简要描述的过程t测试如下。首先,我们应该提出如下假设和测试水平。
(一)
(b)
(c)
: (零假设); : (备择假设);双面的测试,测试水平: 。
然后,我们可以计算出测试数据 , 。因此,我们获得的测试数据: , , ,和 。注意,计算过程复杂,不是这个工作的重点,所以我们直接给结果。最后,我们查询t测试表,发现阈值 。因为所有的计算值(即, , , ,和 )更大比 , 不应批准,所有我们的方案是显著的改进。
6。结论
在这项研究中,我们提出了一个混合结合基于内容和协同过滤推荐方案。改善混合模型的准确性,我们建议用户首选项的时间影响因子和分析建议的时间因素的影响。同时,用户反馈机制提出了工作,和这种反馈机制是用来过滤最终建议。仿真结果证明该方案是有效的与基线相比。将来还需要进一步的研究,例如,如何调频(分解机)方法引入到我们的方案来提高该模型的查全率和查准率。同时,我们应该学习如何过滤掉无效的反馈根据不同的推荐方案,提高反馈机制的效率。
附录
答:稳定的性能
我们采用了多个头n个测试来研究我们的方案的性能是否相对稳定。因此,我们分析F1-score方案(在这里,我们使用F1-score作为指标来评价混合动力方案)的性能,考虑与建议的变化趋势和波动的大小。然后,我们绘制了F1-score比较直方图所涉及的所有混合动力方案。如图8的平均F1-score我们的方案 ,我们可以计算出标准差F1-score方案 。我们看到我们的方案的性能相对稳定与推荐的大小。注意,其他混合方案的标准偏差(HRBRM和HRSRL)是0.0428和0.0459,分别。
b效果反馈机制的分析
验证反馈机制的影响在我们的方案,我们设计并实现了一组实验,包括提出完整的方案,该方案没有反馈机制。在该测试中,我们使用F1-score作为性能指标,实验结果如图所示9。
从图中的结果9,我们可以看到,没有反馈机制的方案的性能明显低于完整的方案。F1-score而言,完整的计划获得更高的分数比计划没有反馈机制在所有的数据集。此外,平均F1-score完整的方案 ,和的平均值没有反馈机制的方案 。因此,完成方案的平均F1-score大约高出17.9%的计划没有反馈机制。因此,从每个数据集上的测试结果还是整体平均表现,反馈机制可以显著提高推荐结果。
c .时间因素的影响分析
评估时间因素的影响在我们的方案中,我们设计并实现了完整的控制实验方案和计划没有时间因素的机制。在该测试中,我们使用F1-score作为性能指标,结果如图所示10。
从图中的结果10,我们可以看到完整的方案在F1-score更好的性能比计划没有时间因素的机制。具体,完整的计划获得更高的价值比计划时间因素在每个数据集。此外,平均F1-score完整的方案 ,和平均值的计划没有时间因素的机制 。因此,完成方案的平均F1-score大约高出19.2%的计划没有时间因素的机制。因此,时间影响因子可以明显改善我们的方案的性能。
d .资源消耗比较
此外,评估资源消耗我们的方案,我们设计和实现了一个比较实验。这个实验是建立在一个台式电脑(联想联想桌面机系列M720)与英特尔酷睿i7 - 7500 2.7 GHz处理器和32 GB。具体来说,我们评估算法的资源消耗的内存消耗和CPU使用率,然后使用VisualVM 1.4.4作为测量工具来监视内存和CPU使用率。
如表所示5,我们主要考虑所涉及的资源消耗之间的比较(即混合模型。,HRBRM [35]和HRSRL [36])和我们的计划。我们可以看到,我们的方案执行比其他两个模型;我们方案的内存使用量小于2 MB;而对于HRBRM [35]和HRSRL [36)计划,最低5.53 MB和2.79 MB的内存使用情况,分别。CPU使用率,我们的方案是显著低于HRBRM [35]和HRSRL [36),分别。为我们的共识,具体而言,CPU使用率最高的是4.4%(最高-我们的方案N= 60)低于HRBRM的最小值35(即。,5。7%) and HRSRL [36(即。,5。3%), because our scheme adopts the efficient and simple VSM model, which involves less inner product computations. Also, our scheme adopts the hybrid approach based on the logistic regression, which does not involve complex computations compared with other comparisons. Hence, our scheme has more advantages than other schemes in memory and CPU consumptions.
数据可用性
经OULAD(开放大学学习分析)数据集32)是一种最近发布的开源数据集。使用数据集(经OULAD)包含32593学习者和他们的评估结果(约10655280条记录)。在这篇文章中,我们主要关注呋喃(虚拟学习环境)数据,显示学习者在选择学习材料的偏好。MovieLens-Latest收集数据集作为GroupLens研究项目的一部分,明尼苏达大学的(网上https://grouplens.org/datasets/movielens/)。这个数据集包含27000000评级和1100000标签应用程序应用到280000年58000部电影的用户。图书漂流收集的数据集Cai-Nicolas齐格勒图书漂流社区网上(https://grouplens.org/datasets/book-crossing/)。数据集包含278858个用户(匿名但人口信息)提供1149780评级(显式或隐式)约271379册。
附加分
效度威胁:因为我们的方案是基于基于内容和协同过滤模型,这个方案的效果是有限的场景,不适合内容的建议,如视频和图片的建议。
的利益冲突
作者宣称没有利益冲突。