文摘
个性化推荐系统是广泛接受为一个有用的工具来处理信息过载问题,推荐一个相关的信息。这项工作提出了一个混合个性化推荐系统基于亲和力传播(美联社),即APHPRS。亲和力传播semisupervised机器学习算法用于集群项目基于它们之间的相似之处。在我们的方法,我们首先计算集群质量和密度,然后结合其输出中生成一个新的排名得分集群个性化推荐。在第一阶段,收集用户首选项和规范化项目评分矩阵。这个生成矩阵然后离线使用亲和传播和保存在一个数据库未来的建议。在第二个阶段,在线建议是通过应用离线生成的模型。消极的欧几里得的相似性和集群一起使用的质量来选择最好的集群的建议。提出APHPRS系统缓解问题,如稀疏和本身的问题。使用亲和力传播和混合推荐技术用于该方法有助于改善结果对稀疏。 Experiments reveal that the proposed APHPRS performs better than most of the existing recommender systems.
1。介绍
推荐系统(RSs)扮演着至关重要的角色在自适应web使用复杂的算法来减少日益增长的负载信息。利玛窦等人。1)定义了推荐系统、软件工具和技术,向用户提供选择的产品选择。在过去的十年中,所使用的推荐系统已经在许多研究领域,例如,信息检索,认知科学、电子商务应用、知识管理系统、近似理论(2,3]。随着社交媒体的流行,等产品推荐系统越来越聪明,他们经常把用户的评论特定产品作为输入,并相应地更新他们的基本算法。然而,由于互联网技术的快速发展,网络数据是巨大的增长;因此,获取相关数据从异构资源已成为一项艰巨的任务4]。推荐系统是一种有效的技术帮助用户解决这个问题通过自动推荐相关信息基于他们的个人喜好,这通常是存储在用户配置文件中。
个性化的建议通常作为评价的项目。在执行这个评级,RS试图预测最合适的项目的基础上,用户的偏好以及其他推荐参数,从门户到门户。预测一个适当的选择列表,RSs获取用户评级信息和翻译user-item矩阵。
当前的工作天推荐系统来预测项目评级,然后推荐接近用户的偏好。推荐名为Tapestry的ever-first系统(5)是1990年代中期发展起来的。最常见的研究论文是专注于电影推荐研究[6]。然而,大量的文献对RS可以找到推荐音乐(7- - - - - -9),最好的电视节目(9),读最好的书(10),相关文档抓取电子学习(11)、知识系统管理(12)、电子商务(13),应用市场14),和网络搜索15]。
RSs可分为三大类,包括协同过滤(CF)和基于内容和混合方法16]。基于内容的过滤(CB)的建议是基于过去决策的用户。基于内容的过滤效率找到文本和项目相关的某种利益通过使用技术,如布尔查询,虽然也有一些限制。基于内容的技术往往缺乏多样性项目推荐的问题(17]。在文学中,基于内容的方法被广泛应用于信息检索(3和信息过滤18)的研究。一些方法用于基于内容的系统消息除草机(19),信息仪(20.],和新闻老兄[21]。
协同过滤(CF)收集评级的用户对某些项目的意见。建议取决于用户的意见相似与相异的活跃用户(邻居)22]。他们的目标,收集到的信息可以非常有效的新建议。协同过滤技术是发现更有效;然而,它也有一些限制。它的局限性之一是用户评级分析可能最低;因此,推荐的东西质量会差。同时,协同过滤稀疏的常见问题,本身的问题,新用户问题(23,24]。进一步分为基于模型的协同过滤算法和基于内存的算法(25]。基于内存的基于用户的资讯技术(26使用整个user-item评级来定位k最近的邻居的活跃用户,然后使用这些邻居的评级来产生推荐。然而,基于内存的协同过滤(CF)算法不像的大小可伸缩的用户增长。相比之下,基于模型的聚类技术(27和贝叶斯模型28)建立一个模型首先从评级矩阵,然后用它来产生推荐。基于模型的算法的缺点是,必须添加一个新的后重建模型评级矩阵。结合两种表示方法的优点,基于模型和基于内存技术的混合像地区资讯25)和clustering-based资讯(28可以使用)。
混合推荐系统的系统结合两个或两个以上的推荐技术的特点;例如,基于内容和协同过滤(29日)结合的目的使用这些技术的力量和克服任何个人技术的弱点(30.,31日]。混合推荐系统可以有效提高预测精度。
本文混合相结合的方法提出了协同过滤和基于内容的过滤为提高预测准确性和有效的建议。此外,我们提出了系统采用的基于模型的协同过滤和基于内存的功能集群用户相似性和user-item评级矩阵,分别。我们的算法提出了我们的系统是一个叫亲和力传播聚类算法(32]。亲和力传播算法产生集群更高效、准确的方式,因此提供了更好的建议与基线相比,聚类算法。这项工作的主要贡献如下:(我)使用亲和力传播算法,有效的稀疏数据集。(2)混合的推荐技术,提高预测和推荐精度。(3)而利用CF技术的特点,与传统CF推荐系统不同,我们把集群的密度和相似性度量选择范围集群的一代的建议。这样的集群提供辅助的活跃用户一个像样的设置建议。
本文的其余部分组织如下。节2的一些相关工作。部分3简要描述了亲和力传播技术。部分4是用于拟议的系统。节5,我们的实验装置和结果解释APHPRS求婚。最后,在节6,本文总结道。
2。相关工作
推荐系统专注于提供给用户最相关的信息。在文学作品中,不同的推荐系统都可以开发各种应用程序域。这些推荐系统是基于不同的过滤技术和利用各种推荐方法。Bilal和哈马德(33)提出了一个推荐系统为移动应用程序开发。系统旨在帮助移动应用程序开发人员推荐款式新颖和工件。他们使用协同过滤技术提出了一个独特的测量,考虑到相似性和信任信息表明预测精度。在另一个工作,提出了一个基于本体的推荐系统对社交网站广告(34]。他们应用共享本体为代表的广告以及用户的利益。本体的使用推荐系统的推荐系统研究的新趋势之一。系统对提高推荐系统的推荐精度提出了在35]。他们已经提出了一个名为基于双重训练误差校正的方法(DTEC)推荐的性能的提高。
聚类是一种技术,可以利用对准确预测在推荐系统中。集群的组可以被定义为一个特定的对象根据其特点、聚合根据他们的相似之处。聚类算法已被证明超过相似性度量的类似于目标用户定位用户。集群技术还有助于解决数据稀疏和高维度问题[36]。范教授等。37)使用层次聚类算法(38)集群用户基于用户的社会信息,然后使用传统协同过滤等级预测。电影推荐系统使用提出了七种不同的聚类算法的性能比较(39]。优化了k值不同的聚类技术的电影推荐系统。此外,为验证应用社会网络分析提出系统的推荐质量。Shindi [40]提出了基于centering-bunching集群(英)推荐系统的算法,也就是说,“混合个性化推荐系统使用基于centering-bunching聚类算法(CBBCHPRS)。“英国广播算法用于集群评级矩阵。该算法比传统k的意思是,k适当-medoid最初质心的计算,从而导致集群的合适的形成;然而,这项技术还需要指定集群的数量是作为输入。然后使用相似性度量选择最合适的集群/ s评级预测的一代。Bedi et al。41]colony-based蚂蚁聚类算法用于集群user-item评级矩阵,然后最相似集群/ s的活跃用户/代选择的建议。Shindi [31日)提出了一个快速k-medoid集群算法评级矩阵和选择最相关的集群的活跃用户评级的生成预测。在这项工作中,我们提出一个机器学习的算法称为亲和力传播(32]对我们提出的混合(基于模型和基于内存)的个性化推荐系统,它可以自动找到适当的集群在一个给定的数据集,而不需要指定集群数量。亲和传播提出了细节部分3。
3所示。亲和力传播
亲和力传播是一种新型semisupervised机器学习算法用于集群和被称为“聚类数据点之间通过传递消息”32]。已经观察到,亲和力传播可以用更少的错误和集群定位相关信息在短时间内与其他可用的技术。集群的中心点,这本身就是一个数据点,称为一个模范。为集群的一种常见方法是学习的范本,以便总平方差异可以最小化数据点和自己最亲近的范本。亲和力传播认为每一个数据点是同样可能被选择作为一个范例,把它作为网络中的一个节点的消息传递系统。这种方法需要作为输入数据点之间的相似性。基于输入相似,数据点之间的转会消息,最终,足够数量的集群生成相应的原型。与其他技术相比,亲和力传播自动生成的簇,从不需要指定集群的数量。两个点之间的相似性年代(我,k)表明类似的两个点是通过计算一个消极的欧几里得距离: 在哪里我≠k。
亲和力传播需要一个编号的值年代(k,k),每个数据点之间的相似性k,分有更高的价值年代(k,k更多的机会成为一个范例。这个编号的值被称为“偏好。”集群中根据输入参数的数量也出现在消息交换过程中。因为亲和力传播假定每个数据点作为一个范例最初,preferences作为一个共同的价值。这种偏爱可能被设置为最低的所有输入相似之处将产生集群数量少,也可以将所有输入值的相似之处,会产生适度数量的集群。
此外,消息发送分为两种类型:数据点之间的责任和可用性(32]。消息(责任我,k)从数据点发送这些消息我的数据点k代表是如何适合数据点k数据点的范例我在考虑其他可能的范本我(图1(一)),而可用性的消息一个(我,k)从数据点发送的消息k的数据点我代表如何适用于点我拿点k因为它是模范考虑其他点的支持这一点k应该是一个范例(图1(b))。在任何时候,这两个消息可以统一确定原型。亲和力添加一个值λ∈[0,1]消息传递称为阻尼因素在某些情况下的周期性变化。之间的消息传递过程数据点时结束范例的决定不会改变对一定数量的迭代,通常10。
(一)
(b)
图2显示了消息交换亲和力传播的过程。(一)发送的责任r(我,k)从数据点的消息发送到候选人范本来指定每个数据点的候选人的支持价值范例相比其他范本。(B)发送可用性一个(我,k)是发送这些消息从候选人原型数据点表示的学位候选人范例可以选择作为一个集群中心的数据点。
在初始迭代的亲和力传播,可用性都初始化为零,也就是说,一个(我,k)= 0。责任在这一步然后计算规则(方程(2))。在成功的迭代中,而很少有数据有效地与其他相关的原型,他们的可用性下降低于零批准使用可用更新规则(方程(3))。发现消极的可用性将降低提供相似度值作为输入年代(我,k′)更新规则和责任分离范本已经支持的候选人。当价值k=我的价值的责任r(k,k)作为输入初始化倾向k被选中作为一个范例,年代(k,k),减去最大的相似点我和所有其他候选人范本。发现“自我负责”证明k作为一个范例,是基于输入偏好减轻是多么不被分配到不同的范例(32]。 在哪里r(我,k)代表更新规则的责任,年代(我,k)代表输入数据点的相似性我它的范例k,和 的最大相似点我与其他范本。
上面的可用性规则是用于收集信息的数据点,如果候选人范例可能有助于使一个好的范例。的可用性一个(我,k)将自我负责r(k,k)+候选人范例的和积极的责任k接收来自其他点。拟议的亲和力传播算法计算成本高的缺点。其计算复杂度的秩序O(n2t),“n”表示数据点的总数和“t“是所有迭代的数量,直到最终集群。此外,该算法可能无法产生有效的结果相似矩阵时不生成。
4所示。拟议的亲和力Propagation-Based混合个性化推荐系统
拟议的亲和力Propagation-Based混合个性化推荐系统(APHPRS)结合基于内容的方法和协同过滤方法的特点来处理诸如稀疏和本身的问题。该方法在两个阶段(图工作2)。在离线阶段,它执行数据的预处理。在此阶段,评级矩阵生成和归一化,然后成对相似性矩阵为用户生成的正规化矩阵user-item评级。然后加载到一个相似矩阵亲和力传播聚类算法。集群形成后,他们被关在一些数据库文件,所以可以使用集群生成建议的未来。
第二阶段(阶段2)是为活跃用户生成的建议。在这个阶段,相似性度量和用户首选项的数量在一个特定的集群寻找适合集群的生成的建议。此外,项目的质量评级在每个集群也记录下来。根据这一标准,适合集群得到选择的列表选择集群的评级预测。这一步后,建议使用加权平均生成选择项目评级的集群。与经典的协同推荐系统不同,我们把集群的密度和相似性度量选择范围集群的一代的建议。这样的集群提供辅助的活跃用户一个像样的设置建议。然后进一步细化结果选择集群/ s拥有最高质量的评级。的详细过程和工作提出APHPRS在以下描述以小丑的数据集的例子。
图2代表提出APHPRS系统。(1)预处理步骤:user-item评级基质取自Jester数据集和规范化。正常化后,两两之间的相似度矩阵计算用户。(2)聚类步骤:发现相似矩阵的步骤是提供给美联社分组算法的用户有类似的评级。(3)建议步骤:在这个步骤中,活跃用户的建议进行。这里,活跃用户之间的相似性和集群计算找到最好的集群产生的建议。每一项的评级质量不被一个活跃的用户在选择计算集群。生成的建议,选择集群进一步基于评级一个项目的质量。注意,步骤1和步骤2的部分离线阶段,虽然步骤3的在线阶段提出的系统。
4.1。离线阶段
拟议中的APHPRS始于离线阶段,由两个不同的步骤:预处理和集群。在这个阶段完成的步骤更快的执行建议和离线模式,以减少运行时间。该算法有一个小的高计算成本(例如,O(n2t)),计算在离线阶段阻止系统缓慢的建议。在这一步中,数据的形式收集user-item评级和集群使用该算法。此外,相似矩阵也获得了用户评级,然后作为输入用于拟议的亲和力传播算法。在这里,在这个阶段,我们不需要在线处理所有的步骤没有连接与一个活跃的用户。
以下4.4.1。预处理
在这一步中,我们把Jester数据集作为输入,并规范化为未来处理我们的系统。然后计算不同条目之间的相似性在Jester数据集和获取下一步的相似性。预处理的细节在接下来的步骤:
(1)数据集小丑。Jester数据集是一个在线的数据集的基于web的笑话推荐系统。杰斯特的数据集,每一行代表一个不同的用户,而每一列(除了第一列)显示一个特定用户的评价分数。第一列给出了特定数量的笑话被一个特定的用户。其余列给评级为不同的笑话。user-item评级矩阵从Jester收集数据由项评级规模−10 10日在任何细胞,值99表示null或没有评级项目的(开玩笑)。表1Jester的显示了一个示例数据集,我们只有10个条目将表可读的读者。
(2)标准化。在这一步中,我们已经Jester数据集(表1)作为输入,并把第一列。表1代表Jester的样本数据集,第一列显示的数量的笑话被特定用户而其他的列显示每个笑话额定的值。注意,我们只能选择10以下表中的笑话。然后我们标准化的评级范围从0到1,其中0表示null或没有评级为特定的笑话(表2)。值得注意的是,我们一直积极和零评级仅为建议的基础上,将这两个因素。与杰斯特的数据集,我们已经删除了负面评级标准化评级矩阵。归一化值计算使用 在哪里n我是归一化的值,x我是在标准化之前,min (x)是最小值,马克斯(x)是最高价值。每个等级的计算值在表2。表2代表Jester数据的标准化形式,第一列被移除,评级转换规模在0和1之间。注意,负面评级已经被跳过,建议将在积极的评级。
(3)相似矩阵。亲和力传播需要一个成对相似矩阵值作为输入提供。我们已经获得用户根据他们的评级项目之间的相似性(表3)。我们使用了消极的平方误差或欧氏距离计算相似度。相似矩阵可以发现使用 在哪里我和k可以是任何两个用户和我≠k。
归一化的相似矩阵构造评级矩阵有10个用户;因此,相似矩阵n(n−1)= 10(9)条目,让我们创建一个表有90个条目。为了简便起见,短版的矩阵(表复制在这里3)。这里,列1和2表示指数的两个用户,而列表示消极的欧几里得距离对应的用户。
4.1.2。聚类
我们使用亲和力传播作为分组聚类算法基于他们的相似之处。默认的阻尼因子λ初始化为0。5;看到阻尼因子的细节部分2。使用聚类算法产生的三个集群相似矩阵。
我们选择亲和力传播聚类算法中,我们不需要指定集群的数量。此外,该算法是有效的稀疏数据,和需要的优势数据稀疏时相似之处是品行端正的42]。发现集群的细节如表所示4。
表4代表了集群发现使用亲和力传播。第一列显示了三种不同的集群,第二列显示了在每个集群的用户数量。在第三列,每个集群的中心点(范例)记录。
4.2。在线阶段
在此阶段,预测和建议的活跃用户。此阶段的步骤完成在线的活跃用户是在处理每一个步骤。在线阶段给出的详细描述在接下来的部分。
4.2.1。准备选择最佳的集群(年代)
选择最好的集群(s)建议的产生取决于两个方面:(1)用户的数量在一个集群中,(2)的相似集群与活跃用户。获得某一集群的匹配分数 在哪里sm(我)之间的相似性是我的榜样th集群和活跃用户,ρ(我)的密度我th集群,n代表了成套集群形成。
相似度度量是用来发现集群的用户偏好匹配最活跃用户的概要文件。有数字不同措施用于计算相似性皮尔逊相关性、欧氏距离度量,向量相似性度量。我们使用欧氏距离度量找到相似性的一个活跃的用户和集群。计算欧氏距离可以使用方程(7): 在哪里d是物品的总数或属性的用户,经验吗我,j我th集群属性的范例j,uj是jth用户。
因此,相似的我th集群与活跃用户计算如下:
集群的密度可以计算使用以下方程:
一个集群的密度增加而增加的用户在一个集群中,反之亦然。那些比赛得分的集群范围内的谎言(−最高分数α≤match_score≤最高分)选择建议。在这篇文章中,α= 0。2。通过使用这个范围,不仅不同于协同过滤,集群有得分最高的也是其他集群有他们的分数略低于最大的一个选择。比赛得分,密度ρ,相似度值计算如表所示5。表5代表了计算相似度sm(j与一个活跃的用户),密度ρ(我)的每个集群,集群之间的匹配分数,第一列显示了不同的集群的功能,而其他的列显示相应的函数为每个集群测量值。
集群选择2和3,因为他们的匹配范围内的分数是0。4311−0。2≤匹配得分≤0.4311。
4.2.2。计算质量评级
评级质量物品解释了类似评级的不同用户在任何特定的集群。可以发现使用质量评级 在乌兰巴托评级是一个项目的最大速率的分数和意味着什么评级代表项目评分的平均值在任何集群。如果乌兰巴托评级和平均评级值相等,得到质量评级数量为1,代表质量好。因此,更大数量的价值将会导致更高的评级质量,反之亦然。不同的计算评级质量未分级的笑话如表所示6。表6显示未分级的笑话的评级质量在不同的集群,在第一列代表活跃用户未分级的笑话,而第二和第三列显示相应的质量评级,即集群2和3,分别。
4.2.3。预测新项目评级
发现每个未分级的项目的质量质量评级的基础上,然后选择集群从最初选择集群(表7)。而不是选择集群与质量未分级的项目,这些集群的质量“数量”每个未分级的项目范围内(17)另外从集群中检索设置,最初选择生成评级预测。在这篇文章中,α= 0。1。表7显示了评级预测未分级的笑话。如果只有一个集群被选中,然后选择集群中的项的平均评级计算;否则,评级计算加权平均。笑话4、6和9日评级计算的加权平均收视率在集群中2和3,而对于笑话3,平均评级计算集群3。
然后使用预测项目的评级 在数量我代表选择集群中的物品的质量,的意思评级评级项目的任何选择的集群,然后呢k表示被选中的群集的数量。
4.2.4。代的头n个建议
预测项目评级之后,接下来的一步是为活跃用户提供头n个建议。例如,如果N= 1,笑话3将建议。为N= 2,笑话3和6将建议,等等。
5。实验装置
5.1。聚类性能评估
提出了聚类算法的性能评估利用虹膜在UCI数据集可用库(https://archive.ics.uci.edu/ml/datasets/Iris)。IRIS数据集包含一个150对象分为三个主要的类,每个类都有50个对象。类是贴上“Setosa”、“杂色的,”和“Virginica。“集群的性能评估的准确性分组根据真正的每一个对象类。在实验中,我们与许多基线算法相比,该算法用于聚类。拟议的亲和力传播算法优于现有算法在集群对象(见表更准确8)。精度提高了该算法的消息发送过程。此外,该算法不需要指定集群数量,它自动生成聚类质心(范本)。
表8显示了该聚类算法的评价虹膜数据集。在这个表中,第一列表示虹膜的各种类数据集和第二列包含不同的算法及其聚类结果。这个表清楚地表明,亲和力传播算法生成集群更准确。
5.2。提出的推荐系统的性能评估
APHPRS一直在MATLAB 7.8版本中实现。Jester数据集上的实验进行。我们还执行另一个协作filtering-based推荐系统43手动进行性能比较,使用R精度和梅指标。评价性能,我们使用两种不同大小的数据集。数据集1是杰斯特的一个小子集的数据由一个user-item评级矩阵有10个用户和10个笑话(表2)。Jester数据集的数据集2是一个大型的子集组成的70000个用户和100个笑话。拟议中的APHPRS评估通过检查其质量和推荐质量的预测。
预测质量测试相关的测试集预测用户评级实际用户评级。评估预测精度,平均绝对误差(MAE)作为通用指标[44]。因此,我们使用了美规评估预测APHPRS提出的质量。如果我们代表评级预测项目的集合p1,p2,p3…pN,代表了相应的实际用户评级问1,问2,问3…问N可以计算使用,那么美
美价值较低会导致更大的推荐系统的质量,也就是说,小美值,表明评级预测更类似于真正的评级。为实验数据集1,我们从小丑数据集和随机选择的7个不同的用户逐渐增加测试集的大小从1,2,3,4,5,6,7(图3)。我们比较建议APHPRS系统与现有的混合使用centering-bunching-based个性化推荐系统聚类算法(CBBCHPRS) [40]。该算法和CBBCHPRS都使用相同数量的杰斯特的用户数据集。
图3代表了美计算为我们提出APHPRS CBBCHPRS是无法相比的。结果表明,我们建议的系统有一个较小的美,将产生更好的建议比其他的推荐系统。水平的数据显示在图中,七种不同物品的杰斯特的数据集,而垂直数据显示相应的美得分两个系统的选择项。
在图美曲线的算法3相比其他算法优越,这表明,我们的算法生成质量预测项目评级。对于推荐质量,使用最广泛的指标精度和召回。精度是推荐项目相关的推荐项目的总数。召回的数量相关推荐项目的相关条目的总数。这两个指标是有问题的情况下在给定的分界点,例如,precision@N,相关建议的数量小于说等。43)提出了推荐质量的指标,称为R-precision。它已经被经验证明R精度更准确地反映出建议的质量相比传统指标。因此,我们使用R精确的评估我们的推荐系统的推荐质量。R计算精度为 在哪里R显示的总数相关建议,r是检索的数量相关的建议。在这里,R作为分界点和不同的查询来查询。为实验数据集1,我们随机选择6个不同用户的小丑数据集和生成1,2,3,4,5,6建议。获得的结果在图所示4。
图4显示R精确生成的头n个建议。结果与CBBCHPRS相比,这表明我们提出APHPRS与其他系统相比有更好的性能。
另一个实验进行数据集2,我们随机选择10个不同用户的小丑数据集和逐渐增加的测试集的大小从3、6、9、12、15、18、21、24、25日和27日。获得的结果在图所示4。
第二个实验进行了使用不同的数据集(dataset 2)取自Jester数据。对于这个实验,我们随机选择10 Jester的活跃用户数据集生成前5,10,15个建议。第二个实验的结果与蝙蝠算法(BA)用于(45]。结果表明,我们建议的推荐系统产生高R精度比现有的英航。
图5代表了美计算为我们提出APHPRS相比,英航算法使用数据集2。结果表明,我们建议的系统有一个小美在大多数情况下比其他系统。在这个图中,梅的值十用户总结为每个头n个建议。
第二个实验进行了使用数据集2取自Jester数据。对于这个实验,我们随机选择10个不同用户Jester数据集生成前5,10,15个建议。实验进行查找R精度值。结果表明,我们建议的推荐系统产生高R精度比现有的BA(图6)。
图中可以看到6这一R我们系统的精度值高于其他的系统,这表明我们的建议的质量。
6。结论
推荐系统的工具和技术用于处理大量信息的过滤大量的信息,然后显示一个与用户相关的信息。提出了APHPRS,亲和力Propagation-Based混合矩阵的个性化推荐系统收集用户首选项的物品被不同的用户,集群,为用户生成的建议。这项工作中所使用的聚类方法优于其他基线方法测试虹膜数据;然而,这种方法不能产生有效的结果当相似矩阵计算不好。我们已经结合基于内容的方法和协同过滤方法的特点使系统混合。之前的工作在这一领域表明只有相似分数被认为是现有的推荐系统,而我们将集群的质量和密度和组合的相似性得分选择的质量集群范围的建议。这有助于发现相似的其他集群按照用户的偏好。评估我们的提议APHPRS使用Jester数据集。此外,CBBCHPRS APHPRS相比另一个混合动力系统。我们的系统的性能评估的质量和推荐质量的预测。 The prediction quality was calculated using the MAE score, while recommendation quality was measured in terms ofR精度。轻微的减少美分数是稀疏的证据少对我们提出系统的影响。类似地,R我们提出了系统的精度要高得多比现有的系统。的增加R -精度表明,我们建议的方法更好的结果在推荐项目。
在未来的工作中,我们将使用种子亲和力传播(SAP)算法,是一种先进的版本的亲和力传播寻找集群。我们还将考虑本体知识库在未来提高预测精度。
数据可用性
支持这项研究的数据来自之前报道的研究和数据集,已被引用。处理过的数据是可用的(https://goldberg.berkeley.edu/jester-data/)。
的利益冲突
作者声明没有潜在的利益冲突。
确认
科学研究的作者感谢院长以来,沙特国王大学,资金通过科研副院长职椅子。