处理纯新用户本身的问题推荐系统基于公开数据和社交网络功能有关

文摘

喜欢精度计算时间,反之亦然是非常具有挑战性的环境中推荐系统,鼓励许多研究人员选择混合推荐系统。目前,研究人员正在努力产生正确和准确的建议,建议使用本体,但缺乏技术呈现出它的充分利用。推荐系统的一个主要问题困扰许多研究人员是纯新用户本身出现问题,由于缺乏信息系统的新用户。相关公开数据(LOD)倡议集之间的互操作性标准交叉领域和收集了大量的数据在过去的几年中,它提供了各种方式,可以提高推荐系统的性能,丰富用户的资料与相关特性。本研究工作集中在解决纯新用户本身问题,构建基于LOD用户的资料,协作功能,和社交网络功能。在这里,一个新的方法是设计了基于本体相似度计算项,从而预测nonrated项目的评级。修改方法来计算用户的相似度基于协作功能来处理其他问题如精度和计算时间也提出了。实证结果和比较分析,提出的混合推荐系统支配它的更好的性能特别为纯新用户本身问题提供解决方案。

1。介绍

包含大量数据的获取所需的信息从网站或应用等项目,视频,图片,文本是一个非常具有挑战性的和非常耗时的任务。研究领域,如信息检索和信息过滤系统是高度启发与进步做人工智能方法。推荐系统(RS)是一个有能力的工具,帮助用户通过提供一个项目列表排名根据他们的需求或偏好不明确的搜索系统。这个系统已经被证明是一个重要工具推荐项目,从而为各种个性化应用程序域,如旅游、营销、电影、歌曲、酒店和餐馆,新闻,和预测理论。

有许多著名的顶级电子商务应用,如提供的推荐系统Flipkart公司,Amazon Prime的视频,MakeMyTrip。所有推荐系统的主要动机是为正确的用户提供最合适的产品在合适的时间。巨大的研究在这一领域,并提出了许多不同的方法把不同类型的数据和分析技术中获益。有各种各样的问题而设计一个适当的推荐系统,如可伸缩性、高计算,和多样性。但在所有,有一个重要的问题,主要得到了研究者的关注本身的问题时,出现注册新用户或系统中添加新的资源或项目。很明显,就没有信息用户的兴趣或他的评级系统中任何特定项目,并推荐合适的项目当时新用户是非常具有挑战性的。

推荐系统的质量降低,当没有足够的信息或任何评级是可用的(1]。虽然本身的问题是一个非常著名的和潜在的问题在推荐系统中,不同的研究来解决这个问题。本身的问题基本上分为两类,即新用户本身的问题和新项目本身的问题。新用户本身问题指的是缺乏信息用户的兴趣或非常少提供的评级系统中用户对任何特定项。纯粹的新用户本身的问题指的是当没有评级的问题是系统中用户提供的。随着电子商务平台,每天大量的新用户签署或用户几乎在每一个应用程序中创建一个严重的问题对于推荐系统(2]。另一个主要问题是新项目本身的问题指的是新添加的项在任何特定的系统已非常少或没有用户提供的评级,因此在这种情况下分析项目,指用户可以是一个冗长的任务(3]。新项目本身问题也称为early-rater问题在各种文学研究[4]。

在最近的文献,提出了许多混合的方法来克服新用户冷启动的问题,如跨域协同过滤使用矩阵分解模型(5),学习潜在因素表示视频基于建模用户和项目之间的情感联系6),提高基于内容的算法使用社交网络(7),结合社会subcommunity和本体决策模型8),并使用社交网络文本信息模型的用户兴趣和项(9]。

相关公开数据(LOD)云是一个巨大的RDF语句相互连接在一起形成一个跨域本体图和包装很多领域,如公司,人,地理位置,电影、音乐和书籍。DBpedia最大的LOD之一,被认为是“典型的入口点“这些数据10]。维基百科的RDF映射通常被认为是核新兴的数据网络。DBpedia设置一个标准来定义属性和类代表不同的域和提供大量的机器可读数据,主要研究在调查如何有益了推荐系统这种过多的数据(5,11)和如何关联数据项可用于协同过滤算法(12]。

但是仍然有缺乏的特性计算用户之间的相似性。相似的措施不应只局限于由用户给出的评级为特定项目还是比较基本的人口统计信息如年龄和位置。有一个严重的需求分析更多的和不同的功能,可以很好地描述用户根据不同的域。例如,让我们考虑服装领域;两个用户相似的身高和体重是最可能喜欢类似的衣服。因此,它是高度需要建立用户的资料根据不同的数量的特征根据域的推荐系统需要开发。用户之间的相似度计算来提高推荐系统的性能。主要的问题在于标准化的功能可以成功地描述用户的属性和提供相关数据。这些数据可以进一步用于各领域代表用户的资料。这个作品侧重于解决本身的问题通过寻找相似用户之间基于他们的社会,合作,开放数据特性有关。

本文以下部分被组织成。第二节描述了使用的好处与领域相关的本体,语义web,并在推荐系统相关公开数据。第三节礼物的调查研究工作在各种类型的推荐系统。第四节详细描述了该推荐系统的框架。第五节描述的详细描述功能采用建立用户配置文件。第六节提供现有工作的比较分析,提出工作。第七节展示了实验结果8节大纲提出的结论和未来的扩展工作。

2。背景理论

2.1。推荐系统的本体

使用本体的主要目的是模型相关信息任何域在语义级别(13]。本体在不同领域有不同的定义,但特别是在上下文与计算机科学,它是由格鲁伯(14),后来被Guarino精制et al。13]。本体的概念最初是由格鲁伯(14)作为一个“概念化的明确的规范。”

本体称为图O= (Cℛℒ)这是一个有向标记图。C= {c1、…cn}是一组类或属性代表一个本体的概念n是定义的节点数量概念。ℛ= {r1、…rm}表示直接边的集合代表所有在本体概念之间的关系O,在那里米是边的数量定义关系。rk∈ℛ代表一个导演两个相邻概念之间的关系ci,j∈C,也就是说,rk= (ci,cj)。ℒ={ℓ1,…,ℓ米}表示一组标签显示每个概念图节点的名称。

采用本体的推荐系统已经成功地克服各种缺点中提到(15,16]。同时,模糊本体已经极大地用于提高推荐系统的准确性。在[17)、领域本体是用来预测最合适的项目按照用户的喜好。大部分的研究工作框架语义推荐方法结合基于项目协同过滤和基于语义相似技术。

2.2。语义网和相关公开数据(LOD)

语义web的目标,根据最初的愿景18web上可用),是所有知识的机器可读的格式,这样机器能够处理大量的信息。这将需要巨大的努力达成一个共同的框架嵌入信息和数据。使用RDF和OWL等各种知识表示语言和协议如URI将允许互操作性,从而使数据在许多应用程序中共享和重用,平台和社区。一些值得称道的进展这一愿景已经达到最近的增长与开放数据(LOD)倡议[19),目标是链接各种孤立的应用程序之间的数据,突出它的重要性数据公开供其他应用程序使用,和链接数据相互使用标准模式。

协作的LOD计划非常成功。根据最近的统计,“1500亿数据集相关的RDF三元组和近10000现在可用在所谓的LOD云,一个巨大的一系列互相关联的语义的数据集核通常由DBpedia”[10]。DBpedia数据可以使用属性定义为自由而轻松地提取中提到其本体通过SPARQL查询语言。这中提供有价值的信息或数据相关领域的知识库可以有效地使用推荐系统(11),以克服它的一些重大问题。LOD包含局部领域的本体包含属性描述的特定领域,所以它可以很容易地解决各种相关问题基于内容的推荐系统(20.]。例如,有时是非常有限的特性来描述需要推荐的项目,因此,不能有效地进行内容分析,从而产生的问题有限的内容分析。也基于用户的协同过滤,LOD提供了标准模式和数据来表示各种功能与用户相关领域,这也会提高用户的分析,推荐最合适的产品。

在以前的研究中,推荐系统的几种方法已经开发出来。本节解释普遍研究工作提出了相关工作。推荐系统的典型方法分为协同过滤、基于内容的过滤和混合方法(21]。采用标准,划分为我们建议的框架混合推荐系统。

研究人员改善电影领域的混合推荐系统基于人口和协作filtering-based方法。他们的策略分类电影基于人口属性的类型,例如,用户年龄(儿童、青少年或成人),学生(是或否),有孩子(是或否),和性别(男性或女性)22]。

提出的解决方案本身问题,利用博客文本数据和标签按照用户的意见,然后构造user-item评级矩阵协同过滤和改善建议23]。刘等人的研究。24)提高安的研究(1)凭概念叫做Proximity-Significance-Singularity改善皮尔逊相关系数和余弦相似性的缺点25)提高新用户本身的问题。

研究人员开发了推荐系统提供最合适的云平台即服务(PaaS) application developer算法基于本体。他们的实验分析表明,工作处理可伸缩性的问题(26]。

研究人员开发出一种基于语义网络的推荐系统建模技术和基于图形语言的所有信息是2 web本体语言(OWL 2)。这个推荐系统在混合类别结合各种方法如基于内容相结合,环境敏感,和CF。实验评价了使用MovieLens数据集,并显示结果F1精度和召回等措施[27]。

学习者使用的系统推荐学习资源本体和序列模式挖掘(SPM)提出了它在混合以知识为基础的推荐系统。作者利用本体模型不同的学习方法和学习资源和利用SPM找到更多关于用户的顺序学习模式(Tarus,妞妞,Yousif, 2017)。一个完整的框架,提出了使用各种web挖掘技术和基于不同领域本体克服本身问题等主要问题,稀疏和可伸缩性。MovieLens数据集评估使用各种精度指标(15]。

在许多最新的文学研究中,作者利用DBpedia主要使用其属性定义或修改各种相似性措施来自LOD (28,29日]。像Facebook这样的社交网络平台是用于收集用户的音乐偏好和DBpedia用于计算各种音乐项目之间的相似之处和构建个性化为用户播放列表(30.]。有限的内容分析的核心问题相关公开数据大大发挥了重要作用,许多研究人员正在利用使用它。研究人员开发了一个应用程序命名TasteWeights;是一种推荐系统中用户的偏好音乐流派从Facebook被提取,然后DBpedia使用SPARQL查询利用端点发现所有的音乐由新艺术家属于同一类型的活跃用户喜欢,然后推荐相同的其他用户(31日]。

各种矩阵分解模型进行评估为跨域协同过滤通过使用公开数据有关,它充当一个连接器分析项目在不同的域用户喜欢的。元数据提取相关公开数据有助于生成项目属于不同的领域之间的关系。但是这种方法有一定的局限性,因为它可以仅仅依靠那些领域与其他领域共享信息。如果源和目标域是封闭的领域,它将不可能共享信息,因此项之间的语义链接不会暴露(5]。

系统性文献回顾的研究工作发表在2011年和2017年之间一直在减轻使用社交网络本身问题和协同过滤提供建议。根据同期的研究,发现研究数量的增加,专注于减轻使用社交网络本身问题,这些都是发表在著名期刊或会议高引用率(32]。

在这项工作中,混合推荐系统框架提出了解决纯新用户本身的动机问题,提出使用基于域本体算法,明确user-item评级矩阵和聚类相似的项目。稀疏问题解决建议评级预测算法。也有效地找到用户之间的相似度并比较它们与新用户,用户配置文件生成模块提出了直接利用特征提取LOD云,社交网络图,和协作功能。这些都是这个工作的区别方面。

4所示。提出了框架

在拟议的框架,如图1涉及各个模块,找出可能的纯新用户和准确的解决方案本身的问题。建议的体系结构的简要解释如下:(我)首先,系统提供user-item矩阵的评级给每一项由用户指定。找到项目之间的相似度,项目集群需要生成使用模糊C聚类方法。(2)基于相似集群项目,计算两两之间的相似物品。基于本体的相似度和基于项目相似度计算的平均值作为整体的相似性。新算法计算项基于本体的相似性。(3)一旦生成类似的项目集群,然后删除user-item的稀疏矩阵来预测评级为活跃用户在系统中没有给出评级系统中的每一项建议。(iv)用户已经注册到系统的表示或概要文件生成基于各种功能,如LOD(相关公开数据)和社交网络图的功能。(v)然后计算用户之间的相似性不使用传统的相似性措施,他们有几个缺点;相反,修改后的技术提出了更好的结果。(vi)当新用户进入系统使用他们的Facebook ID和DBpedia ID(如果有的话),系统自动生成配置文件使用用户配置文件生成模块。(七)然后分类器训练数据,如用户的概要文件特性和类标签如“用户集群”。(八)所以,当新用户的资料给分类器预测新用户所属用户集群,集群分类器预测相应的用户。(第九)一旦我们找到新用户的“用户集群”属于,系统分析评级提供给每一个“项目集群”,只有那些用户存在在这个预测“用户集群”。(x)的平均重量评级给用户集群中每一项预测计算集群。(十一)项目集群与最高等级值建议新用户。

4.1。基于项目聚类

在这个模块中,两个项目之间的相似性计算基于特定领域的本体和基于显式的用户提供的评级。

以下4.4.1。项目基于本体的相似度计算

本体提供了巨大的信息在任何领域可以在推荐系统非常有益。大多数研究人员认为只有一个基于本体属性计算项目相似,他们在某种程度上忽略了多层次、复杂结构的本体。例如,许多研究人员只使用“类型”的电影找到类似的基于本体的电影。作为领域本体的一个抽象的示例见图2,我们定义C推荐的条目类,用作建议目标类。类包含两个属性,A1和A2和SC一个子类,它本身有其属性、A3、A4和A5。例如,在一个电影推荐系统,如果C是电影类,那么A1和A2可能表示版权和发布日期,而SC可能是“Movie_origin”有自己的属性,A3、A4、A5,代表,例如,亚洲、欧洲和北美。

本体的语义描述任何领域,所以两个项目之间的相似度计算基于他们的本体是一个非常重要的任务。在本研究中,基于项目使用二进制Jaccard相似系数计算语义相似度。两项是相似的,自己的属性以及它们的子类的属性需要是相似的。所以,为了找到相似,项目类C一个属性”在”,它的价值可能会下降米类别,每一项被认为是一个二进制向量V_c= ( , ,…, )在一个二进制变量( )定义如下:

然后,语义相似的物品x和y属性”在“提出如下(33,34]: 在哪里T₀₁,T₁₀,T₁₁分别表示类别的总数(= 0;= 1),(= 1;= 0),(= 1;= 1)。

插图。考虑这部电影有一个属性“类型”的喜剧,浪漫,小说,戏剧,和恐怖表表示1。因此,这个属性的类别属于6,因此,价值分配”“是6。


电影	类型
电影	喜剧	浪漫的	小说	戏剧	恐怖	科学

米1	0	1	1	1	0	0
米2	1	0	0	1	0	0
米3	0	0	1	0	1	0
米4	1	1	0	1	0	0
米5	0	0	1	0	1	0

因此,对于每一项,各自向量可以表示如下:米1 = (0,1,1,- 1,0,0),米2 = (1 0 0,1,0,0),米3 = (0,0,1,0 1 0),米4 =(1,- 1,0,1,0,0),和米5 =(0,0,1,0 1 0),在那里米1,米2,米3,米4,米5是电影的二进制向量1,电影,电影,电影4,分别和电影5。

之间的相似性对电影可以计算使用方程(2)如下:SSim(米1,米2)= 1 / (1 + 1 + 2)= 1/4 = 0.25,SSim(米1,米3)= 1 / (1 + 1 + 1)= 1/3 = 0.33,SSim(米1,米4)= 2 / (2 + 1 + 1)= 2/4 = 0.5,SSim(米1,米5)= 1 / (1 + 1 + 2)= 1/4 = 0.25,SSim(米3,米5)= 2 / (2 + 0 + 0)= 2/2 = 1,SSim(米2,米4)= 2 / (2 + 1 + 0)= 2/3 = 0.66,SSim(米1,米2)之间的相似性是电影1和电影2属性“类型。”相应,同样的两个项目之间的相似性本体中所有其他属性可以通过方程计算(2)。

与传统方法不同,复杂而多层次的数据结构本体如图2需要处理,也包含类的属性和属性的属性本身就是一个类(即。子类)。样本集的阶级”C”,如图2,它有三个属性,与第三属性“SC”本身就是一个类有三个属性。的公式计算的整体语义项目之间的相似度我_我和我_j拥有相同的本体包含类、子类和属性详细解释如下。

在这种方法中,所有属性对应子类SC_我和SC_j的物品我_我和我_j分别将分析它们之间的语义相似度计算的属性类C_我和C_j的物品我_我和我_j,分别。使用递归计算,计算值的平均值,获得各项目之间的相似度我_我和我_j直到达到最大深度可在开始。所以,基于本体的相似性使用下面的公式计算: 在哪里年代_本体(我_我,我_j)是基于本体的相似性项目之间我_我和我_j,如果没有属性的本体本身是一个子类, 类之间的语义相似度C_我和C_j的两个项目我_我和我_j为一个特定的属性”在”,分别n是本体的属性项的总数域。

如果有本体中的属性,也有自己的属性,一个子类年代_本体(我_我,我_j可以使用以下公式计算: 在哪里年代_本体(我_我,我_j)是基于本体的相似性项目之间我_我和我_j,如果有属性本身就是一个子类的本体, 子类之间的语义相似性SC吗_我和SC_j的两个项目我_我和我_j为一个特定的属性”在分别的子类,米子类的属性的总数在商品领域的本体1≤p≤米, 类之间的语义相似度C_我和C_j的两个项目我_我和我_j为一个特定的属性”在”,分别n的总数是领域本体的属性项,1≤k≤n。

算法1解释如何计算基于本体相似度两项由常见的特定领域的本体。它需要两个输入如下:(我)项目本体包含类、属性和关系(2)所有项目,由我。

	输入:项目本体啊(C在R),设置我的物品
	输出:语义相似度矩阵舰导弹(我,我)
	为每一个二世ϵ我
	为每一个我_jϵ我
	如果(!isEqual (我_我SC,我_j·SC))
	年代_本体(我_我,我_j)=
	其他的
	年代_本体(我_我,我_j)=
	如果
	结束了
	结束了

算法的输出语义相似度矩阵(SSM)显示两项之间的语义相似度的措施我_我和我_j基于本体。

例子。假设Movie_Origin是电影本体的类,如图3和其属性不同的大洲,大陆可以进一步认为是子类有自己的属性。

如果电影属于同一“大陆,”那么它必须匹配这个子类的属性即“国家”。的国家,这是那部电影的起源。如果电影都属于印度,那么它需要进一步匹配它们的属性,即。,which cinema it belongs to like Bollywood, Tollywood, and Punjabi, else it is not required to match their attributes.

4.1.2。项目相似性计算基于显式的用户评级

在这个模块中,项目之间的相似度计算是基于明确的评级由用户提供User-Item评级矩阵(UIM),U是一组用户和我是项目的集合,r_你,我用户提供的评级吗u对项目我如表所示2。的价值r_你,我可以在0和1之间变化。


项目	我1	我2	我3	我4	我5

U1	r₁₁	r₁₂	- - - - - -	r₁₄	r₁₅
U2	r₂₁	- - - - - -	r₂₃	r₂₄	r₂₅
U3	r_31日	r₃₂	- - - - - -	r₃₄	r₃₅
U4	- - - - - -	r₄₂	r₄₃	r₄₄	r₄₅
U5	r₅₁	r₅₂	r₅₃	- - - - - -	- - - - - -

个别项目形式给出的评级的情况下,和两个项目之间的相似性是由用户提供的他们的评级模式是多么相似。这里使用的相似性度量方法如下: 在哪里我_国际单位和我_居评级提供给项目的值吗我_我和项目我_j由用户u分别为,n的总数是用户评价项目,1≤u≤n。只有用户评级的物品用于相似度计算。

4.1.3。整体项目相似性得分

整体或全部项目之间的相似性得分将计算基于相似性得分由本体的结合使用(3)和(4)和明确的用户评级使用(5)如图4: 在哪里α+β=1,α和β是控制的值,可以调整领域的专家。在这种情况下,等于weightage给两个相似的措施,例如,α=0.5和β=0.5。相似(我_我,我_j)是两个项目之间的整体相似度评分,年代_本体(我_我,我_j)是基于本体的相似度计算,Sim卡(我_我,我_j)是基于显式的用户相似性计算的评级。

一旦整体相似度计算为每个项目与其他项目在项目集中使用(6),然后整体项目相似矩阵(OISM)如图4形成中描述了整体相似度评分项目在项目集中。在OISM,所有行和列代表总数的项目在项目集和每个细胞一个_ij代表整个项目之间的相似性得分我和项目j。

4.1.4。项目聚类技术

在这项工作中,模糊C意味着集群(35,36)已经被用于集群类似的项目,因为它和稀疏数据集执行得很好。在大部分的推荐系统,只有几个用户提供评级项目导致稀疏明确user-item矩阵。在本研究工作中,基于内容的特征提取本体和用户评级数据被认为是,由于只考虑其中一个会导致精度低、过度泛化,重叠的集群。创建集群之后,类似的项目集群中用于评价预测的任务目标项目在下一节中详细描述。因此,需要分析的项目远远低于系统中项目的总数量;因此,它可以提高系统的性能26]。

集群形成后,User-Item集群矩阵(UICM),U是一组用户和C是所有项目的中心集群生成代表用户提供的平均评级的价值u项的集群中心j如图5。

形成的新矩阵包含了每个项目集群中心和用户的评级中心。在图5,米表示所有用户的数量,一个_uj用户的平均评级吗u项的集群中心j,n意味着所有项目的数量,R_ij显示用户的评级u对项目j,k项目中心的数量。

4.1.5。评级预测

目标项目,一个排序的清单T类似的物品返回基于集群形成(4.1.3节)。然后使用这些检索值填入空细胞的目标用户User-Item评级矩阵。为每个未分级的(目标)项,评级预测是基于提供的评级活动用户的项目类似于未分级的项目(目标)。预测评级的集体和评级受到每个类似的项目之间的相似性得分加权特定的类似的项目和目标项目,除以类似项目的相似性得分的总和。的预测目标用户的评级u对于一个未分级的项目我在以下方程: 在哪里年代_你,我是一个项目的预测评级,我由用户u,r_{u, t}是类似项目的评级吗t由用户u;相似(我,t)之间的相似性得分目标项目我和项目t;和T考虑下类似项目的总数。

在某些情况下,它可能不会有等级的T类似项目的目标项目的活跃用户,在这种情况下,一些空细胞仍将出现在user-item矩阵在矩阵填充后使用(7)fd6。所以,要解决这个问题,剩下的稀疏的细胞可以预测使用一个扩展的方法。在这种方法中,一个活跃的用户,他的评级模式对其他物品被认为是随着评级提供给其他用户未分级的(目标)项目。估计目标用户的评级u对于一个未分级的项目我使用该方法可以计算如下: 在哪里α和β控制参数,在哪里α+β=1,年代_你,我是预测评级,K是其他物品的数量被u(目标用户)≤1k≤K,r_{u, k}的评级吗u其他的物品K,n是其他用户的数量,1≤问≤n,问≠u为目标提供评级未分级的项目我,r_问,我给出的评级目标项目吗我由其他用户问,除了目标用户u。

α和β是控制的值,可以调整领域的专家。在这种情况下,等于weightage给出的措施,例如,α=0.5和β=0.5。下面的算法来预测未分级的价值明确user-item评级矩阵,UIM (U,我),U是一组用户和我是项目的集合。该算法将有助于消除稀疏UIM (U,我),因此,该算法的输出密集User-Item评级矩阵DUIM (U,我)不含稀疏,如描述的算法2。

	输入:整体项目相似矩阵OISM (我,我),User-Item评级矩阵UIM (U,我)、用户组U,项目集我
	输出:密集User-Item评级矩阵,DUIM(U,我)
	为每个用户uɛU
	为每个(条目不被u)& epsiv;我
	如果(评级给出类似的项目集)
	年代_你,我=
	其他的
	年代_你,我=
	如果
	结束了
	结束了

让我们以一个例子来详细描述评级预测模块的工作。在这个例子中,user-item矩阵的样本数据集被认为是与未分级的价值观,创建稀疏问题。

例1。考虑的例子明确评级提供给每个项目的每个用户,它可以表示为一个矩阵,如表所示3。
假设这是矩阵包含评级给电影的不同的用户。”——“代表了稀疏,这意味着评级的用户并没有特定的电影。
因此,基于用户相似度计算的显式评级两项我3和我1可以计算使用(5):Sim卡(我3,我1)=√(((5−3)²/ (5²+ 3²)+ (5−4)²/ (5²+ 4²)+ (5−5)²/ (5²+ 5²)= 0.59年代_本体(我3,我1)= 0.33,如计算以下4.4.1节所以,整体相似度计算基于本体的相似性和明确用户的评级可以计算使用(6):相似(我3,我1)=年代_本体(我3,我1)+Sim卡(我3,我1)/ 2 = 0.46同样,我们可以计算两个项目之间的总体相似度我3和我2,如下:Sim卡(我3,我2)=√(((4−4)²/ (4²+ 4²)+ (5−4)²/ (5²+ 4²)= 0.15年代_本体(我3,我2)= 0.25相似(我3,我2)=年代_本体(我3,我2)+Sim卡(我3,我2))/ 2 = 0.2同样,我们可以计算两个项目之间的总体相似度我3和我4,如下:Sim卡(我3,我4 =√(((3−4)²/ (3²+ 4²)+ (5−3)²/ (5²+ 3²)+ (4−5)²/ (4²+ 5²)+ (5−5)²/ (5²+ 5²)= 0.41年代_本体(我1,我3)= 0.5相似(我3,我4)=年代_本体(我1,我3)+Sim卡(我1,我3)/ 2 = 0.45项目最相似项3项1和第四项,所以稀疏计算预测评分值项3由用户1将计算使用(7):年代₁₃= (0.465 + 0.455)/ (0.46 + 0.45)= 5,年代₁₃是项目的预测评级3由用户1删除稀疏。同样的,我们可以预测评级值提供给项目由用户给出3,如下:年代₃₃= (0.54 + 0.73)/ (0.5 + 0.7)= 3.41≥3,年代₃₃是项目的预测评级3由用户删除稀疏。因此,UIM [3 3] = 3;同样,其他值可以预测。


	第一项	第二项	项目3	第四项

用户1	5	5	- - - - - -	5
用户2	5	- - - - - -	3	4
用户3	3	4	- - - - - -	3
用户4	- - - - - -	- - - - - -	5	3
用户5	5	4	4	5
用户6	5	4	5	5

4.2。用户配置文件功能

在本节中,三个家庭的特性来创建用户的配置文件。功能是通过分析社交网络中提取特征,协作功能,和信息的特征提取来自LOD云。使用特性直接提取LOD云是这项工作的区别的一个方面。

4.2.1。准备社交网络分析功能

社会网络分析(SNA)是完成社会配置的字段或加工使用传统网络和图理论分析。网络结构是由节点(定向或单向)和边缘或链接。节点可以描述任何的人或事;项目根据需求和链接或者描述它们之间的链接关系。一个样本的社交网络图所示6。

一些有用的网络参数如下:(我)中心。在网络理论中,中心被定义为一个因素识别最重要的节点在给定的网络。群落结构描述低凝聚力和高耦合的性质在给定的网络节点的分组。节点称为更多的中央如果它有更高的学位。(2)聚类系数被定义为测量程度的集群节点可以在给定的图。一个图表G= (V,E)正式包含顶点和边集。边代表两个顶点之间的联系。例如,一个优势e_ij连接顶点与顶点。

附近N_我为一个顶点被定义为那些直接连接到它的邻国。N_我= { :e_ij·ɛ·E ·e_霁·ɛ·E}

我们定义K_我作为顶点的数量,| N_我|在附近,N_我,一个顶点。(3)度的顶点v:(一)的入度是“边的数量开始。更高的学位节点会更受人尊敬的(选择收到了)。”(b)的有关学位是“边的数量得出的结论。节点度分布是最重要的一个属性的图(10]。更高程度的节点会更中央(选择)。”

4.2.2。协作特性(c)

这类特征模型中编码的信息User-Item矩阵彻底解释协同过滤(CF)算法包含用户对特定项目(提供的评级37]。表4显示了一个示例代表协作特性建模用户的好恶。每个用户建模,提取相应的列向量。


	U1	U2	U3	U4	U5	…	联合国

《盗梦空间》	1	0	1	- - - - - -	- - - - - -	…	1
蜘蛛侠	0	1	0	1	1	…	- - - - - -
银翼杀手	- - - - - -	0	1	- - - - - -	0	…	0
一步姐妹	1	- - - - - -	1	0	1	…	1

矩阵的列代表的倾向的用户,和行表示每个项目的评级从系统中所有用户。在许多现有的研究工作,各种相似性措施如皮尔逊相关性、余弦相似性,Jaccard系数被广泛使用。但这些方法效率低下在处理数据集有更多的稀疏和非常少的评级由用户提供。刘等人。24)提出了一种新的模型找到用户彼此相似。该模型着重于本地和全球环境,分析用户的偏好。

有各种各样的缺点使用传统方法在计算相似度;例如,相似度将会更有说服力,如果两个用户评级更常见的物品。很可能不同的人有不同的倾向给予评级,一些用户总是给评级较高的一侧,尽管他们不喜欢项目太多,反之亦然。传统的相似性措施不考虑这事。许多研究人员已经编码用户评级的绝对值为1,如果用户“喜欢”项,和零,如果用户“不喜欢”项,但这一策略最终将成为复杂而寻找相似的用户。

在这工作,修改方法,从而获得更好的结果。最终的相似度值划分每个条目的求和平均评级。改进后的方法称为AWPSS(平均加权Proximity-Significance-Singularity)。

在方程(9)- (11),第一个因素,近距离的因素,只考虑两家评级之间的区别。下一个因素意义给更多的重要性评级如果两家评级之间的距离从平均评级。第三个因素是奇点;它指定其他评级是如何不同于这两种评级: 在哪里µ_p项目的平均评级吗。r_{u p}是项目的评级吗由用户u。每个因素属于(0,1)在我们的模型中。

4.2.3。有关基于公开数据——(LOD)特性

在这项工作中,所有的考虑特征来表示用户概要描述用户的众多方面,因为所有的信息从社会社区是一个社会基于图;编码协作特性的描述用户的概要文件。然而,进一步扩展这个向量通过使用LOD属性是这项工作的一个新方法来生成用户的资料。LOD云是标准和重要来源获得描述性特性模型的用户。

例如,假设的推荐系统是服装领域,然后找到用户之间的相似性,这更多的取决于他们的身高,体重,但大小而不是他们的位置,职业,等等。只有DBpedia描述和标准化这些属性定义任何用户的概要文件。尽管DBpedia包含只名人的信息,它已经与其他许多数据库进一步提供关于用户的信息。在未来,随着关联数据的增长,越来越多的信息可以覆盖用户来自世界各地,其中每个用户将惟一地标识URI(统一资源标识符)。大部分的领域目前存在封闭的领域,因为他们不会互相之间共享信息。与日益增长的福利提供的公开数据,许多领域在未来可能相互之间的协作和信息共享,LOD的进一步发展作出贡献。

在DBpedia,关于用户的信息或任何其他物品是免费的LOD云以RDF格式。使用SPARQL查询终端,这些信息可以很容易地提取只提供两种类型的信息:所需资源的URI和名称的属性来获得所需的信息。

获得信息从LOD,强烈要求了解资源的URI。提取数据到任何物品,如电影和音乐,映射需要做,确定所需的项目对应的项目在相关数据库中。这将是唯一的入口点LOD。LOD技术映射条目是这项工作的范围。

DBpedia目前包含数以百万计的用户信息,这将增加在未来,从而允许用户从其他孤立和著名的像Facebook和Twitter这样的社交网络相关公开数据计划的一部分。用户的隐私和身份验证问题发挥重要作用在链接的数据来自世界各地。同样,FOAF(朋友的朋友)文件现在已经变得普遍,作为骨干包含社会PeopleLink等各种网站和LiveJournal上的元数据。

在我们的方法中,这是非常重要的考虑方面代表用户的数量取决于域而不是分析用户的人口统计信息,比如年龄、性别和职业。为了收集LOD-based特性与每个用户相关,一个明确的要求从用户需要在系统中登记。他们必须指定DBpedia ID(如果有的话),也需要使用他们的Facebook登录应用程序ID(“像Facebook用户登录”)和需要用户访问许可的基本信息。如果在DBpedia所需的信息不可用,一些用户的基本信息可以从他的社会配置文件,如图7。

接下来,对于每一个域,定义相关属性的一个子集,最后,我们使用SPARQL或Facebook 4 j API来提取所需的数据。图8显示了如何创建“第一应用程序”,使用图形API Explorer创建用户身份验证令牌。另外,图9显示了属性的数据可以提取使用这个API,提供用户授予权限。

代表每个用户对应的功能,词汇表LOD-based特性是建立。词汇表中的每个特性的值被设置为1,如果用户通过RDF描述属性和0。

这些详细的特性用于表示用户非常有益的建议数据模型,因为不同来源提供不同方面相关的用户如有用户的评级模式,用户在社区的重要性由入度和中心,和大量的特性提供了LOD云。整个功能协作提供全面有效的表示用户的概要文件。

表5显示了一些属性代表了各个方面的用户和他们来自DBpedia LOD云。每个特性是使用两件事:(属性,值),不同的用户可以为每个实体具有相同或不同的价值。


基本LOD-based特性	用户1	用户2	用户3

dbr (dbo:出生地:德国)	1	0	0
dbr (dbo:出生地:印度)	0	1	1
dbo: birthSign dbr:蝎子)	0	0	1
(dbr dbo:学院:德里IIT)	0	1	0
(dbo:雇主,dbr:亚马逊)	1	0	0
(dbr dbo:年龄:36)	1	0	1
(dbr dbo:年龄:22)	0	1	1
(dbo:纪律、dbr:艺术)	1	0	0
dbr (dbo:性别:女)	0	0	1
(dbo:职业、dbr:赛车手)	1	0	1
(dbo:职业、dbr:舞者)	0	1	0
(dbo:纹身,dbr:湿婆)	1	0	0
(dbo: skinColor dbr:布朗)	0	1	1

4.2.4。用户聚类

在这个模块中,用户之间的相似性计算基于特性,即。通过分析社交网络的特性,从协作特性密度(DUIM User-Item矩阵),特征提取的信息来自LOD云。

每组的数量特征编码可以随项目的推荐系统和推荐系统的领域。它可以更清楚地描述表6。


美国没有。	功能分类	数的功能

(1)	社交网络功能	4
(2)	协作功能	不。在项目集的项
(3)	LOD-based特性	值随域

每个用户由二进制向量表示,包含0和1,取决于该用户属于这个特性。每个用户在用户组被认为是一个二进制向量U=(u_f1,u_f2、…u_调频),一个二进制变量u_f(f= 1,…,米)定义如下: 在哪里米的总数是协作和LOD-based功能组中包含的特性。

每个用户之间的相似性和其他相应的用户在用户设置提出了以下方程: 在哪里T₀₁,T₁₀,T₁₁分别表示类别的总数(u_如果= 0;u_{摩根富林明}= 1),(u_如果= 1;u_{摩根富林明}= 0),(u_如果= 1;u_{摩根富林明}= 1)。

例子。在本例样本,向量用户1,用户2,用户3表示协作和LOD-based功能组如表所示7。


用户	功能组
用户	协作功能					LOD-based特性

用户1	0	1	1	0	1…	0	1	0	0…
用户2	1	0	1	0	0…	0	1	1	1…
用户3	1	0	0	0	1…	1	0	1	1…

后的值社交网络图功能不能二进制值,即,0和1,so to find the similarity of users based on social network graph features, simply normalization of the vectors usingl1规范或l2标准可以执行然后欧几里得距离可以应用于找到用户基于社交图谱特征之间的相似性。

例如,如果两个用户有更多的入度和中心,这意味着他们更相似。整体相似性用户可以通过计算相似度的平均值从每个功能组获得的分数。

在这项工作中,模糊C意味着集群(35)已经被用于集群类似的物品以及用户。FCM提供软聚类中每个成员提供的数据点值,描述了多少属于特定的集群。同时,它最适合大数据集和许多特性或维度。在这个工作中,三组的特性被认为是用于生成用户群,因为只考虑其中一个会导致精度低、过度泛化,重叠的集群。在创建用户集群,集群中的相似用户用于推荐项目新用户。因此,结果在改善性能,因为集群应该分析包括所有项目的数量相比更少的用户(38]。

5。加权平均的建议框架

在这个提议研究工作,制定纯新用户本身的问题是,计算- n建议一个新用户,刚刚注册系统中,没有评级系统中的任何项目,甚至没有寻找任何物品。当用户进入系统,生成新的用户配置文件使用概要文件生成功能。一些好的执行分类算法,即逻辑回归,随机森林,和朴素贝叶斯(NB)算法(39),实现从他们每个人分析结果,找出最好的这种技术分类算法。预测模型开发的分类器使用各种属性和类标签。不同的用户配置文件功能是用作标识符属性和用户集群如UC1, UC2, UC3 UC4, UC5类标签。分类器训练数据的70%,剩余30%的数据作为测试数据。一个算法是解释,详细描述了推荐系统推荐采取的步骤相关的条目新用户中描述的算法3。

	输入:用户配置文件项集群我、用户集群U,User-Item矩阵
	输出:N项目推荐给新用户
(1)	当一个新用户登录到系统时,他的形象将会使用“用户配置文件的一代”产生的系统模块。
(2)	然后分类器将分析用户和可以预测的“用户集群”这个新用户所属。
(3)	“用户集群”一旦发现新用户所属,系统将分析评级提供给每个“项目集群”,只有那些用户存在在这个预测“用户集群”。
(4)	的平均重量评级给用户集群中每一项预测计算集群。
(5)	项目集群与最高等级值建议新用户。

6。实验结果

在本节中,两个真实的数据集是用来评估拟议的推荐系统处理纯用户本身的问题。也比较的结果与现有的先进的推荐系统。

6.1。数据集描述

MovieLens数据集:一个著名的数据集用于推荐系统的评价是MovieLens数据集上可用http://www.movieLens.org。数量有6040和3952的用户和电影,分别在数据集。评级是五星级规模。只有那些给用户选择评估至少有20个打分的项目体系。因此,该数据集包括1000年、209年匿名评级基于电影和用户的数量。

雅虎Webscope R4数据集:雅虎!研究联盟Webscope程序提供这个数据集(http://webscope.sandbox.yahoo.com),在五星级评级的规模和数据集分为两个训练和测试数据集。训练集包含了7642用户,11915部电影和211231评级。测试设备包括2309用户,2380部电影和10136评级。

在这项研究中,LOD特性提取DBpedia SPARQL端点(http://it.dbpedia.org/sparql)和Facebook 4 j API被用来收集用户信息。网络爬虫WebSPHINX (http://cs.cmu.edu/rcm/websphinx/)已经被用来抓取内容相关的物品从IMDb (http://imdb.com)。对于这些评价,随机80%的数据用于训练集,剩下的20%数据用于测试集。

6.2。评价推荐系统

提出的推荐系统是使用PHP开发(7.1)语言,在一个4 GHz处理器、8 GB RAM,微软Windows 2010和64位。该方法比较和评估等相关研究工作CF推荐引擎使用皮尔逊近邻算法,基于项目预测方法与集群、奇异值分解和本体,用户和基于项目的预测方法与集群和圣言但没有从两个角度本体的贡献包括时间吞吐量(每秒推荐)和准确性。

6.2.1。实验1(可扩展性分析)

在第一个实验中,该方法的有效性基于基于本体的相似性,集群,LOD进行求值。吞吐量是定义为每秒的建议用于评估。MovieLens和Yahoo !Webscope R4数据集被用来显示了该方法的有效性在改善整个系统的可伸缩性。数据10 ()和10 (b)显示了该方法的性能与最先进的技术;吞吐量是在y设在并绘制作为集群大小的函数。它可以清楚地从图推断方法基于本体相似性的吞吐量,集群,LOD略高于其他方法。在集群中,只有部分项目/用户推荐系统的分析,而不是系统使用近邻方法。因此,提高集群的大小并不影响他们的吞吐量,因为它需要扫描所有最近的邻居。

(一)

(b)

6.2.2。实验2(预测的准确性)

美是统计指标分析预测精度。在这个实验中,美预测和实际评级之间的测量。美提出了如下: 在哪里N用户的条目的数量吗u表达了一个观点。该方法使用美对预测精度评估和与皮尔森近邻算法相比,基于项目预测方法与集群、奇异值分解和本体,用户——与聚类和基于项目的预测方法和计算。对于这个评价,不同数量的邻居(k)被认为是(k= 10、20、30、40、50、60、70、80、90和100年)。

数据(11日)和11 (b)显示美对不同地区各种方法绘制大小两个数据集MovieLens和雅虎Webscope,分别。发现该方法基于item-user本体,集群,LOD表现很好与其他方法相比,预测精度。也可以清楚地观察到,本体的使用,系统的精度提高,美基于项目+圣言+ EM +本体低于用户,基于项目+圣言+ EM。

(一)

(b)

6.2.3。实验3(决策支持的准确性)

在混合型推荐系统中,决策支持精度指标起着非常重要的作用在分析推荐系统的整体性能。这种类型的指标比较推荐的项目与相关项目。受到这一类的度量精度,回忆,和F测量。

在方程的精度(15)计算相关项目的分数从列表中返回的结果而召回的方程(16)计算分数的相关项目检索: FN在哪里假nonrelevant预测的数量,TR的数量是正确的相关预测,和FR是错误的数量相关的预测。考虑两个值是一个度量F测量(蔡挂2012)所示以下方程: 计算的均值召回和精度。β可用于重量的影响之一,在哪里β> 1提高精度的重要性,另一方面,使用β< 1,召回的影响是增加了。所以,β= 1被认为是平衡的F测量。该方法评估基于不同数量的推荐,这样N= 10、20、30、40和50。表8和9显示了F1措施和针对不同的最高精度值N建议。从表中可以推断出来,作为近邻算法相比,该方法获得的精度是相当高的。同时,F1措施表中所示,它可以清楚地看到F1提出系统的措施处理本体和LOD优于其他方法,多半近邻。这些结果证明我们的推荐系统是有效和可伸缩的近邻算法相比。方法A =用户,基于项目+圣言会+新兴市场+本体方法B =基于项目+圣言会+新兴市场+本体、方法C =用户,基于项目+圣言会+新兴市场和方法D =最近的邻居。


前N	提出了系统		方法		方法B		方法C		方法D
前N	精度	F1度规	精度	F1度规	精度	F1度规	精度	F1度规	精度	F1度规

前5名	0.803	0.813	0.787	0.797	0.771	0.773	0.719	0.721	0.564	0.583
十大	0.806	0.817	0.796	0.807	0.782	0.784	0.736	0.739	0.582	0.601
前15名	0.822	0.832	0.816	0.827	0.802	0.804	0.747	0.749	0.592	0.615
前20名	0.833	0.844	0.821	0.833	0.809	0.811	0.757	0.76	0.601	0.622
前25名	0.846	0.857	0.833	0.844	0.823	0.825	0.769	0.77	0.628	0.65
天然气	0.839	0.849	0.831	0.84	0.819	0.821	0.757	0.762	0.603	0.605
35个	0.832	0.843	0.823	0.832	0.806	0.808	0.75	0.751	0.581	0.59
前40名	0.829	0.84	0.819	0.83	0.801	0.803	0.739	0.741	0.573	0.579
Top-45	0.821	0.835	0.818	0.827	0.793	0.795	0.733	0.732	0.556	0.558
位	0.819	0.832	0.813	0.822	0.783	0.785	0.723	0.722	0.541	0.546


前N	提出了系统		方法		方法B		方法C		方法D
前N	精度	F1度规	精度	F1度规	精度	F1度规	精度	F1度规	精度	F1度规

前5名	0.768	0.786	0.757	0.767	0.714	0.727	0.669	0.694	0.494	0.516
十大	0.786	0.798	0.766	0.777	0.737	0.757	0.683	0.707	0.517	0.534
前15名	0.803	0.814	0.783	0.792	0.74	0.764	0.688	0.709	0.528	0.549
前20名	0.808	0.817	0.786	0.797	0.747	0.771	0.692	0.711	0.536	0.557
前25名	0.802	0.817	0.788	0.797	0.749	0.776	0.697	0.714	0.542	0.565
天然气	0.824	0.832	0.789	0.801	0.757	0.779	0.704	0.724	0.551	0.571
35个	0.826	0.835	0.791	0.803	0.761	0.785	0.715	0.727	0.564	0.582
前40名	0.825	0.838	0.799	0.805	0.764	0.791	0.721	0.734	0.571	0.594
Top-45	0.827	0.839	0.809	0.814	0.772	0.793	0.727	0.744	0.585	0.608
位	0.839	0.843	0.815	0.821	0.784	0.798	0.739	0.762	0.617	0.631

6.2.4。实验4(功能,性能)

获得的见解如何设置用户配置文件功能将提高系统的精度和性能提出建议,所有功能集的性能分别测量和一些组合。表10显示了结果,考虑到LOD功能增加F1措施相比,个人特性,即。、demographic-based和社会网络。也可以看出,结合LOD + SN + D不提供任何主要提高推荐系统的性能。增加前N推荐系统,系统的性能显著增加。


前N	精度	F1度规	精度	F1度规	精度	F1度规	精度	F1度规
前N	LOD	LOD	LOD + D	LOD + D	LOD + SN + D	LOD + SN + D	SN	SN

前5名	0.68	0.76	0.4	0.571	0.4	0.4	0.4	0.4
十大	0.68	0.8	0.5	0.5	0.4	0.16	0.4	0.45
前15名	0.77	0.82	0.33	0.47	0.6	0.48	0.47	0.47
前20名	0.73	0.84	0.4	0.56	0.55	0.43	0.6	0.6
前25名	0.85	0.86	0.32	0.6	0.48	0.48	0.6	0.6
天然气	0.8	0.88	0.67	0.76	0.57	0.33	0.66	0.66
35个	0.97	0.97	0.56	0.7	0.63	0.58	0.6	0.75

7所示。比较

比较表11比较该方法与各种研究工作完成。


美国没有	出版	技术使用	优势	缺点

(1)	应用模糊地理集群解决推荐系统本身的问题(39]	数据用户的人口统计信息,他们的意见和社会标签是用来确定最好的邻居新用户	类似的用户更准确地确定	非常少的用户的人口统计信息
(2)	Semantics-aware推荐系统开发与开放数据和基于特征(40]	LOD-based功能,随机森林,朴素贝叶斯和逻辑回归	提高推荐精度框架	不考虑用户之间的相似度,和稀疏被忽略
(3)	基于协同过滤的推荐系统使用本体和降维技术(41]	EM聚类的聚类和降维nonincremental圣言,基于本体的相似性	解决推荐系统的两个主要的缺点,使用降维稀疏和可伸缩性,和本体技术	用户的人口或浏览信息没有被考虑
(4)	新用户相似度模型,以提高协同过滤的准确性(24]	确定类似的用户使用新的相似性技术聚类算法,决策树	增强用户之间的相似度,也没有要求额外的数据	需要考虑在选择最优数量的组和分裂的标准
(5)	解决新用户使用命令在推荐系统本身问题加权平均算子(42]	(i)乐观指数型的有序加权平均(OWA)算子 (2)融合CF和人口和CF和CBF分类器融合使用	改善混合推荐系统的性能在“新用户本身”的问题	未处理缺失值
(6)	建议的方法	(我)基于本体的聚类项目 (2)LOD和社交网络图功能来构建用户的概要文件	(我)测定类似用户更准确 (2)改善推荐系统的性能对“纯新用户本身”的问题 (3)缺失值处理,稀疏的预测更准确	(我)可伸缩性 (2)基于域滤波特性

详细的比较与其他技术也提出了(表12和13)。


S.no	出版	数据集	相似性度量	环境的应用程序	社交网络	本体使用	相关公开数据	技术使用

(1)	解决用户冷启动跨域协同过滤:利用项目元数据矩阵分解(5]	脸谱网	其他	书、电影、音乐(跨域)	脸谱网	没有	DBpedia	使用矩阵factorizartion跨域协同过滤模型
(2)	潜在因素表示预热将视频推荐(6]	视频情感,亚马逊产品	没有	视频(域独立)	没有	没有	没有	基于建模的视频学习潜在因素表示用户与产品之间的情感联系
(3)	使用关联数据构建开放、协同推荐系统(12]	智能广播	二进制余弦相似度	音乐	没有	没有	DBpedia, Myspace	关联数据项目用于协同过滤算法
(4)	一个有效的推荐算法在学术社交网络本身的问题(7]	MyExpert创建应用程序	其他人	学术项目	学术社交网络	没有	没有	增强的基于内容的算法使用社交网络
(5)	一个方法来解决本身的问题在推荐系统基于社交网络的子和本体决策模型8]	MovieLens	皮尔森相似	视频	任何信息	Taxanomy	没有	结合社会subcommunity部门和本体决策模型
(6)	探索解决冷启动的社交网络信息在产品推荐(9]	豆瓣网站	其他	书	豆瓣网站	没有	没有	使用社交网络文本信息模型的用户兴趣和项目
(7)	使用语义web减少预热将推荐系统中存在的问题(47]	MovieLens	组成相似,性质相似、Jaccard Jaro温克勒	电影	没有	是的	没有	使用语义web结构和本体
(8)	建议的方法	MovieLens,雅虎Webscope	新的相似性度量和欧氏距离	域独立	脸谱网	是的	DBpedia	建议基于用户和项目集群,提高本体相似度,考虑社会网络和开放数据特性有关
(9)	社会网络数据缓解冷启动推荐系统:系统回顾(32]	评论:系统结合论文发表在2011年和2017年之间在交易本身的问题使用社交网络数据


美国没有。	出版	评价参数
美国没有。	出版	精度	回忆	F1测量	美	MMR	报道	其他人

(1)	解决用户冷启动跨域协同过滤:利用项目元数据矩阵分解(5]	是的	没有	没有	没有	是的	是的	是的
(2)	潜在因素表示预热将视频推荐(6]	没有	没有	没有	没有	是的	没有	是的
(3)	使用关联数据构建开放、协同推荐系统(12]	是的	是的	没有	没有	没有	没有	没有
(4)	一个有效的推荐算法在学术社交网络本身的问题(7]	是的	是的	是的	没有	没有	没有	没有
(5)	一个方法来解决本身的问题在推荐系统基于社交网络的子和本体决策模型8]	没有	没有	没有	是的	没有	没有	没有
(6)	探索解决冷启动的社交网络信息在产品推荐(9]	没有	没有	没有	没有	是的	没有	是的
(7)	使用语义web减少预热将推荐系统中存在的问题(47]	没有	没有	没有	是的	没有	是的	没有
(8)	建议的方法	是的	是的	是的	是的	没有	没有	是的

8。结论和未来的范围

工作有助于克服各种问题等推荐系统的准确性、吞吐量、稀疏,新用户本身的问题。提高推荐系统的效率,新的方法设计了两项之间的语义相似度计算项目集项目相似性计算基于本体和基于显式的用户评级。在这个工作中,用户的相似性决定使用LOD等各种功能,社交网络和协作,可以更准确地找到类似的用户和集群。提出系统的实验结果在两个真实的数据集使用美、精度和F1措施显示系统在提高吞吐量,良好的准确性,降低稀疏,处理新用户本身的问题。在未来,工作可以进行自动选择基于不同领域的用户的功能也可以包括各种降维技术。所有的这些特性都可以评估的影响新颖性和多样性等其他评价指标(1,43- - - - - -46]。

数据可用性

使用的数据来支持本研究的结果包括在本文中。读者可以访问数据从MovieLens支持结论的研究(http://www.movieLens.org)和雅虎!Webscope R4数据集(http://webscope.sandbox.yahoo.com)。

的利益冲突

作者宣称没有利益冲突有关的出版。

引用

h·j·安,”一个新的相似性测度协同过滤缓解新用户本身的问题,“信息科学,卷178,不。1,37-51,2008页。视图:出版商的网站|谷歌学术搜索
m . y . h . Al-Shamri和k·k·巴拉”应用遗传方法推荐系统基于一种新颖的混合用户模型,”专家系统与应用程序,35卷,不。3、1386 - 1399年,2008页。视图:出版商的网站|谷歌学术搜索
r·伯克“混合推荐系统:调查和实验,”用户建模和User-Adapted交互,12卷,不。4、331 - 370年,2002页。视图:出版商的网站|谷歌学术搜索
c . W.-K。梁,张炳扬。陈,F.-l。钟,”一个横向校正的实证研究关联规则挖掘方法本身的建议,“以知识为基础的系统,21卷,不。7,515 - 529年,2008页。视图:出版商的网站|谷歌学术搜索
Fernandez-Tobias, Cantador, p . Tomeo诉w·安内尔利和t . Di厌烦,“寻址用户冷启动跨域协同过滤:利用矩阵分解,项目元数据”用户建模和User-Adapted交互卷,29号2,页443 - 486。视图:出版商的网站|谷歌学术搜索
罗伊和s . c . Guntuku”表示预热将视频推荐潜在的因素,”学报第十届ACM关于推荐系统的会议,页99 - 106,波士顿,MA,美国,2016年9月。视图:谷歌学术搜索
z . m . Vala阿里Rohani”,一个有效的推荐算法在学术社交网络本身的问题,“数学问题在工程ID 123726条,卷。2014年,11页,2014年。视图:出版商的网站|谷歌学术搜索
c .孟和y”方法来解决推荐系统本身问题基于社交网络的子和本体决策模型,”学报》第三届多媒体技术国际会议(ICMT-13),智能系统研究进展2013年11月,广州,中国,。视图:谷歌学术搜索
f . c . Li, y, z, x张,“探索社会网络信息为解决冷启动产品推荐,”网络信息系统Engineering-WISE艾德。,j . Wang,页276 - 283,施普林格,柏林,德国,2015年。视图:谷歌学术搜索
美国奥尔,c . biz g . Kobilarov j·莱曼,r . Cyganiak z .艾夫斯,DBpedia:细胞核的开放数据网络施普林格,柏林,德国,2007年。
p . Tomeo l . Rokach f·里奇,b . Shapira推荐系统手册施普林格,柏林,德国,2011年。
b .发展“使用关联数据构建开放、协作推荐系统,”学报AAAI春季研讨会:关联数据满足人工智能美国CA,斯坦福大学,2010年3月。视图:谷歌学术搜索
n . Guarino d Oberle, s,无助”本体是什么?“在手册上的本体无助和r、Eds。,pp。1- - - - - -17,年代pr我nger, Berlin, Germany, 2009.视图:谷歌学术搜索
t·格鲁伯Ontolingua:一种机制来支持便携式本体卷。27日,斯坦福大学;知识系统实验室、斯坦福、钙、美国,1992年。
Martin-Vicente, A . Gil-Solla m . Ramos-Cabrer j . j . Pazos-Arias y Blanco-Fernandez,和m . Lopez-Nores”语义的方法来改善社区形成协同推荐系统中,“专家系统与应用程序第41卷。。17日,第7788 - 7776页,2014年。视图:出版商的网站|谷歌学术搜索
c . Porcel c . Martinez-Cruz j . Bernabe-Moreno。Tejeda-Lorente, e . Herrera-Viedma”集成本体和模糊逻辑来表示user-trustworthiness在推荐系统中,“Procedia计算机科学,55卷,第612 - 603页,2015年。视图:出版商的网站|谷歌学术搜索
s·d·米德尔顿和n走,沙德博尔特“基于本体的推荐系统,”手册上的本体施普林格,页447 - 498年,柏林,德国,2004年。视图:谷歌学术搜索
t·伯纳斯·李,j·亨德,o·斯莱虽然“语义web,”科学美国人,卷284,不。5,28-37,2001页。视图:出版商的网站|谷歌学术搜索
c . biz“新兴的关联数据网络,”IEEE智能系统,24卷,不。5,87 - 92年,2009页。视图:出版商的网站|谷歌学术搜索
m d。Tomeo, p .删削,周报,穆c . f . Narducci和g . Semeraro Semantics-aware基于内容的推荐系统中,“推荐系统手册施普林格,柏林,德国,2015年。视图:谷歌学术搜索
j·魏和A .傅“电子商务推荐系统的调查”学报》国际会议服务系统和服务管理IEEE,页1 - 5,成都,中国,2007年6月。视图:谷歌学术搜索
d . Almazro g . Shahatah l . Albdulkarim m . Kherees r . Msrtinez和w·Nzoukou”调查论文推荐系统”,2010年,https://arxiv.org/abs/1006.5278。视图:谷歌学术搜索
d .地方、f . Fessant和代表,“减少本身的问题通过意见分类内容的建议,”IEEE /每各月/ ACM,学报》国际会议网络情报和Intelligenct代理技术,页204 - 207年,多伦多,加拿大,2010。视图:谷歌学术搜索
z h . Liu, m·艾哈迈德·h·田和朱x,”一个新用户相似度模型来提高协同过滤的准确性,”基于知识的系统,56个卷,页156 - 166,施普林格,柏林,德国,2014年。视图:谷歌学术搜索
g . Adomavicius和a . Tuzhilin”向下一代的推荐系统:一项调查的最先进的和可能的扩展,“IEEE工程知识和数据,17卷,不。6,734 - 749年,2005页。视图:出版商的网站|谷歌学术搜索
n . Bassiliades m . Symeonidis g . Meditskos e . Kontopoulos p . Gouvas i Vlahavas,“语义推荐算法PaaSport平台即服务市场,”专家系统与应用程序卷,67年,第227 - 203页,2017年。视图:出版商的网站|谷歌学术搜索
a . h . Celdran m·g·佩雷斯·f·j·加西亚克莱门特和g·m·佩雷斯”的设计推荐系统根据用户的行为和协作的位置和跟踪”,计算机科学期刊》12卷,第94 - 83页,2016年。视图:出版商的网站|谷歌学术搜索
答:进行中,“使用DBpedia DBREC-music建议,”2010年ISWC:语义Web-ISWC 2010施普林格,柏林,德国,2010年。视图:谷歌学术搜索
g .朴和j·布雷斯林测量语义距离与开放数据功能的推荐系统,”31届ACM学报》研讨会上应用计算ACM,页315 - 320年,比萨,意大利,2016年。视图:谷歌学术搜索
周报,穆c . g . Semeraro p .删削,m d。Gemmis, f . Narducci,“利用社交媒体来生成个性化的音乐播放列表”业务信息处理的课堂讲稿施普林格,页112 - 123年,柏林,德国,2012年。视图:谷歌学术搜索
s . Bostandjiev j . O,马路和t .叫喊,“TasteWeights:视觉互动混合推荐系统”学报第六届ACM关于推荐系统的会议页35-42 ACM,都柏林爱尔兰,2012年9月。视图:谷歌学术搜索
l·a·g·卡马乔和s . n . Alves-Souza”社交网络数据缓解本身在推荐系统:系统回顾,“信息处理和管理:国际期刊,54卷,不。4、529 - 544年,2018页。视图:出版商的网站|谷歌学术搜索
n Kermany和美国Alizadeh混合使用本体和去噪技术在多标准的推荐系统,”电子商务研究与应用卷。21日,50 - 64年,2017页。视图:出版商的网站|谷歌学术搜索
问:Shambour和j·卢”,trust-semantic fusion-based推荐方法对于电子商务应用程序,”决策支持系统,54卷,不。1,第780 - 768页,2012。视图:出版商的网站|谷歌学术搜索
A Baraldi和p . Blonda调查模式识别的模糊聚类算法。我,”IEEE系统,人与控制论,B部分(控制论)卷,29号6,778 - 785年,1999页。视图:出版商的网站|谷歌学术搜索
r . Katarya和o . Verma”一个有效的web页面推荐系统与模糊c-mean集群、”多媒体工具和应用程序,卷76,不。20日,第21496 - 21481页,2016年。视图:出版商的网站|谷歌学术搜索
j . Herlocker和j . Konstan“执行协同过滤的算法框架,”《22日国际市立图书馆年会在信息检索的研究与开发ACM,页230 - 237年,加州大学伯克利分校,美国,1999年8月。视图:谷歌学术搜索
美国锣”,基于用户聚类的协同过滤推荐算法和项目集群,”京,5卷,不。7,746 - 752年,2010页。视图:出版商的网站|谷歌学术搜索
t·米切尔,机器学习,麦格劳希尔系列在计算机科学美国麦格劳-希尔,纽约,纽约,1997年。
m . Cataldo p删削,m d。Gemmis,和g . Semeraro”Semantics-aware推荐系统利用开放数据和基于特征的联系,“以知识为基础的系统卷,136年,页1 - 14,2017。视图:谷歌学术搜索
m . Nilashi o·易卜拉欣,k . Bagherifard”基于协同过滤的推荐系统使用本体和降维技术,”专家系统与应用程序卷,92年,第520 - 507页,2018年。视图:出版商的网站|谷歌学术搜索
j . Baisiri a . Shakery b Moshiri, m .是“解决推荐系统使用的新用户本身问题有序加权平均算子,”IJICTR,卷2,不。4、2010。视图:谷歌学术搜索
c . Martinez-Cruz c . Porcel j . Bernabe-Moreno, e . Herrera-Viedma”模型来表示用户对推荐系统的信任使用本体和模糊语言建模、”信息科学卷,311年,第118 - 102页,2015年。视图:出版商的网站|谷歌学术搜索
p . Resnick n . Iacoyou m . Suchak p . Bergstorm和j·雷德尔”GroupLens:一个开放体系结构的协同过滤网络新闻,”ACM学报》1994年会议上计算机支持的协同工作教堂山,页175 - 186年,数控,美国,1994年。视图:谷歌学术搜索
l .儿子k Cuong:明,n . Canh”模糊地理位置的应用程序集群解决推荐系统本身的问题,”《2013年国际会议上软计算和模式识别(SoCPaR)IEEE,河内,越南,2013年。视图:谷歌学术搜索
m . Vozalis和k . Margaritis“协同过滤增强人口相关,”学报AIAI研讨会上专业实践的AI 18世界计算机大会图卢兹,页293 - 402年,法国,2004年8月。视图:谷歌学术搜索
o . n . Belloui”使用语义web减少推荐系统本身问题,”第二次国际会议的程序数字信息和网络技术的应用,页525 - 530,伦敦,英国,2009年。视图:谷歌学术搜索