文摘

虽然个人和群体推荐系统最近迅速发展,挑战和限制仍然存在。特别是,用户不断地探索新的项目在时间和改变他们的偏好,导致困难建立准确的用户配置文件和提供精确的推荐结果。在这种背景下,本研究解决用户首选项的时间意识,提出了一种混合推荐方法对个人和群体的建议,以更好地满足用户的偏好,从而提高推荐的性能变化。实验结果表明,该方法优于几个基线算法在精度方面,记得,新奇、和多样性,在个人和小组的建议。此外,很明显,推荐性能可以很大程度上提高了捕获用户偏好的变化的研究。这些发现是有利于增加用户动态偏好变化的理解建立更精确的用户配置文件和扩大发展的知识更有效和高效的推荐系统。

1。介绍

网络信息的快速增殖增加用户的困难找到目标信息、服务和产品在互联网上。推荐系统作为过滤服务应对信息过载(1),明确的目的的识别目标的精确定位信息,以及提供高效的资源利用率(2]。他们的主要功能是为用户提供建议,更符合用户个人喜好(3]。此外,推荐系统还可以增加业务收入(4),提高业务效率5),增强用户的忠诚度向业务(6]。目前,推荐系统已经广泛应用于各种应用领域,如娱乐、商业和社会网络,和许多流行的网络平台,包括YouTube,亚马逊,Spotify,和Facebook,主要利用推荐系统和技术在他们的业务增加商业利润和效率4),促进用户满意度(7和忠诚8]。

推荐系统越来越多的从业者和学者们的注意。从先前的研究证据表明,除了相关性、新颖性和多样性也是很重要的因素在评估推荐系统需要解决9]。事实上,小说和多样化的建议不仅可以帮助用户找到相关信息和服务,也支持用户在发现新的项目10]。此外,新颖性和多样性的推荐系统可以弥补短缺的推荐系统。例如,长尾项的问题(如不受欢迎和新增项目)可以有效地解决不同(例如,变异和广泛的特性)的建议(11]。此外,重复推荐项目的影响用户满意度和业务销售可以减轻通过考虑新奇的建议(12,13]。因此,重要的是要注重相关性、新颖性和多样性在推荐系统。

推荐系统一般可以分为个人推荐系统和组推荐系统根据他们的目标区间和用户的数量14]。个人推荐系统旨在为单个用户提供相关产品或服务的建议,而组推荐系统推荐项的用户组(15]。可以强调这两个类别之间的主要区别在系统设计方面,用户交互和业务的目的。关于系统设计,个人推荐系统通常使用协同过滤和基于内容的方法为单用户提供信息帮助他们寻求(16),而正常组推荐系统利用聚合技术来提供建议的用户组(17]。个人推荐系统对用户交互,包括显性和隐性user-item交互,每个单独用户与之交互项,而组推荐系统包括用户组和项目之间的相互作用,每一个用户都被表示为一组的一部分。为商业目的,个人推荐系统主要致力于支持和满足个人用户的目标,从而增加了利润,个人用户的满意度和忠诚度。同时,集团建议通常试图帮助和完成组织的目标来增加利润,满意度和忠诚度的用户组。

虽然两个人和组的建议已经迅速发展,挑战,如动态用户偏好的变化,精确的用户配置文件建立、数据稀疏和推荐多样性仍然存在。特别是,用户偏好会随着时间而改变的问题已经成为最具挑战性的任务之一,因为它可能导致困难建立准确的推荐系统内用户资料和对推荐性能有相当大的影响。更重要的是,用户偏好的变化是复杂的,通常分为长期和短期偏好(18,19]。可以更加稳定和长期偏好在一定时期内缓慢变化。短期偏好可以很快受到用户即时要求和近期利益。因此,为了更好地理解用户偏好的变化随着时间的推移,建立更准确的用户配置文件,提高推荐的性能。此外,用户的时间意识对个人和群体的偏好的建议需要进一步探索。

一些研究分析用户偏好的变化(例如,20.,21])和解释的作用的长期和短期偏好的建议(例如,22,23),但是有一个有限的关注用户偏好动力学。可以说,没有引起足够的重视,用户偏好动态,推荐性能可能是有限或删除相关建议,在过去可能不满足目前用户的偏好,因为用户已经改变了他们的喜好24,25]。即使是那些罕见的研究调查动态用户首选项(例如,(26)不提供一个系统的了解用户偏好的改变和缺乏相关影响的分析建议。更重要的是,毫无研究,特别是地址时间意识对个人和用户组的建议。它可能是有争议的,这可能会阻碍有效的发展缺乏理解和高效的推荐系统。因此,本研究主要调查了用户偏好的变化随着时间的推移,履行承诺。更具体地说,调查以下研究问题:(1)什么是用户偏好的影响变化对个人用户和组的建议吗?(2)用户组如何影响精度,还记得,新奇、组和多样性的建议吗?进行研究,实验研究是由提议time-aware混合方法来生成对个人和团体用户的建议。该方法包括协同过滤、基于内容的方法,聚合个人推荐的方法在本研究中。协同过滤是用于候选项的选择。基于内容的方法用于构建用户配置文件以及提供个人的建议。 The aggregation method for personal recommendations is used for group recommendations.

本研究对推荐系统的研究开发time-aware混合推荐方法为个人和群体用户的用户偏好随时间变化,重要的是解决提高推荐的性能。这种方法将帮助开发人员提高他们的理解捕获用户动态偏好的变化建立更精确的用户配置文件以及加强用户配置文件的知识建模为个人和小组的建议。我们的研究还可以帮助学者关注多个指标,包括精度、召回、新颖性、多样性,评估建议的结果,提供深入理解测量推荐系统的效率。

本文的其余部分组织如下。相关工作的部分描述了各种各样的方法为个人和小组的建议,和用户偏好的重要性变化是解决。研究方法部分中,我们介绍一个time-aware混合推荐方法用于这项研究。的部分试验研究确定评价指标和描述个人和组的设计建议。然后,详细描述实验结果和讨论的结果与讨论部分。最后,我们的结论,意义、局限性和未来的工作是结论部分中描述。

2.1。个人推荐

个人推荐系统旨在为单个用户提供相关产品或服务的建议。他们支持决策过程的个人用户,有助于实现用户的目标和满足他们的需求。各种推荐技术已经用于开发个人推荐系统,如协同过滤、基于内容的过滤和知识型和人口推荐系统。然而,大多数的这些技术挑战和局限性,包括预热将[27),数据稀疏28),和有限的内容分析(29日)问题。克服这些问题和局限性,混合推荐系统被普遍使用。近年来,混合推荐系统,结合两个或两个以上的推荐技术主要被用于个人建议。更重要的是,混合个人推荐系统可以进一步提高探索额外的信息,比如用户生成内容和补充用户信息和上下文项信息。

用户生成的内容,如用户评论、项目描述标签,和排名,可以帮助推荐系统更好地理解用户的偏好和提高推荐的性能。例如,王et al。30.)开发出一种混合协同过滤方法,结合了初步建议和用户评论的情感分析提高推荐的准确性。同样,钱等。31日)提出了一个emotion-aware推荐系统基于混合信息融合。结果表明,有一个显著的改善建议的性能通过使用更多的用户生成信息。

此外,混合个人推荐系统的性能可以通过收购补充提升用户信息和上下文项信息(32- - - - - -34]。常见的技术,用于获取这些信息包括本体和深度学习。Tarus et al。32)使用一种混合推荐方法,包括本体和序列模式挖掘技术。本体是用于描述用户利益和项目知识的特性,它可以帮助他们提出的方法来缓解本身和数据稀疏问题。同样,序列模式挖掘是用于识别用户历史顺序学习模式来提高推荐性能,提高预测的准确性。同样,Kermany和Alizadeh [33进行基于本体的研究,开发一种混合推荐系统,采用模糊多准则协同过滤和基于本体论的语义过滤方法。本研究解决用户的人口统计信息作为外部信息源,提高推荐系统的性能。此外,金正日et al。34)进行了一项研究,利用卷积神经网络和概率矩阵分解捕捉项目的上下文信息。研究结果证实使用卷积神经网络的有效性从项目获取上下文信息描述,展示了更高质量的建议。

2.2。小组建议

一组推荐系统是另一个流行的推荐系统,重点是建议用户组。提供更精确的组织建议,用户模型聚合方法很重要,整合个人用户偏好配置文件的组概要产生相关建议(17,35]。这些方法,如平均聚合和痛苦聚合,主要关注用户资料,利用用户个人偏好群体偏好产生组建议。然而,简单的用户模型聚合方法的建议可能会导致较低的性能,因为用户组可以相互矛盾的偏好和一组用户的数量可能很大。应对抵触的偏好在一群用户中,郭et al。36)开发了一组推荐方法的组建议过程转化为一个多准则决策过程(指标)。这种方法可以更好的解决矛盾的偏好组和缓解的本身问题组的建议。郭的并发工作等。37)也被认为是类似的方法基于用户模型的聚合。更具体地说,作者探索用户的偏好和聚合预测之间的异构性偏好关系的组概要利用Borda投票规则。结果证明利用偏好关系优化组概要建模和提高效率的建议。此外,为了解决大量用户群,Seo et al。35)引入了一个用户模型聚合方法,考虑偏差为集团建议提高推荐的性能甚至在大量用户的情况下在一个组。总的来说,模型聚合方法展示他们的效率建议用户抵触的偏好和大的用户群。然而,模型聚合方法的主要问题在于整合成混合推荐系统的困难,可能会限制他们的表现在组织的建议。

另一种方法,它是重要的是用于集团建议,个人推荐的聚合(38]。这种方法主要是生成建议的每个用户组,然后将生成的个人推荐转化为组建议。例如,Villavicencio et al。39]利用多边单调让步协议(MCP)结合个人建议为每个用户提供一组进组建议。作者提出了一个扩展的可替换主体方法基于一种谈判技术,提高了质量的建议。更重要的是,个人推荐聚合方法可以更好地集成到混合推荐系统达到理想的推荐结果。例如,Kassak et al。40)联合协作和基于内容的方法和建议为个人用户转换成集团建议利用连接的聚合函数。通过这样做,它可以更好地解决组织冲突的偏好和改善群体质量的建议。同样,Pessemier et al。41)相结合的混合推荐系统提出个人建议到团体建议使用两步聚合方法。在第一步中,平均没有痛苦(AvgWM)方法用于生成一个组的建议列表。平均的概念没有痛苦的方法是找到的最优决策组不冒犯任何参与者对这个决定在第二步中,用户反馈生成的列表并选择最后喜欢的建议。

2.3。用户偏好的变化

用户改变他们的偏好随着时间的流逝(20.]。Rafailidis和Nanopoulos42指出用户偏好的变化可以以不同的速率不同。这些变化对精度有直接影响,新颖性和多样性的建议43,44]。因此,用户偏好更改需要充分肯定,以确保建议的有效性。通常,用户首选项可分为长期偏好和短期偏好(18,19,22,23]。前者描述用户一般利益相对稳定或变化缓慢的随着时间的推移,而后者通常是指用户暂时的利益,他们可以很容易地受到多种因素的影响,如用户即时需求,近期利益,全球主流趋势在很短的时间内18]。

最近,用户长期和短期偏好吸引注意力从研究获得更精确和准确的用户偏好配置文件和提高推荐的性能18,22,23,45]。例如,谭和刘22)将注意力机制纳入一个递归神经网络来捕获用户偏好的变化和模型用户长期和短期偏好。同样,胡锦涛等。23]关注用户短期偏好和开发一个图形神经推荐模型,其中包括用户最近的活动与复发性神经网络注意力机制探索用户短期偏好。此外,Yu et al。18]扩展传统的递归神经网络结构解决time-aware和内容感知的控制器(它们将短期和长期用户首选项,实现性能优越的AUC F1-score措施。此外,刘等人。45复发性神经网络)开发了一个混合的注意机制捕捉用户的长期偏好和加强短期偏好。更准确地说,作者将项目描述和视觉信息,使得推荐更为明显和解释和实现更好的回忆和NDCG措施。总的来说,最近的研究证明,区分用户长期和短期偏好可能导致更精确的用户配置和实现更好的推荐性能。然而,重要的是要注意,用户倾向于改变他们的偏好。对于这一点,用户长期和短期偏好配置文件可能限制如果不充分考虑用户的偏好会随着时间而改变。

许多研究(例如,20.,21,26])已经探索出用户的偏好会随着时间而改变,以提高用户分析和推荐系统的性能。例如,Inuzuka et al。21)调查了用户偏好的变化与推荐系统基于用户交互,表明一个更好的方法来解决用户偏好的变化可以很大程度上改善推荐系统的性能。同样,Rafailidis [20.)集中在两两之间的相关性最新的偏好和前更好地捕捉用户的偏好改变偏好。林和陈26)解决用户偏好的变化随着时间的推移,通过将最近的分化和早期的用户和项目数据。本研究提出了一种基于隐马尔科夫模型的概率协同过滤模型(摘要),可以获得条目属性变化,捕捉用户偏好的变化状态。根据以前的研究的证据,用户偏好的变化是形成一个用户配置文件的关键部分,必须更好地理解。可以说,没有足够重视用户偏好的意识变化,推荐系统可能仍面临挑战,为用户提供推荐的结果更符合用户的个人需求。因此,重要的是要考虑时间意识在推荐系统。

3所示。研究方法

本研究将专注于提供精确、小说,和多样化的建议个人和团体用户的业务推荐领域(如餐馆、本地服务、酒店和娱乐设施的建议)。为了进行这项研究,提出了time-aware混合推荐方法。该方法包括5个组件。首先,神经协同过滤是用来选择的候选项目进一步的个人和组的建议。增加候选项的准确性,用户的信息超过了包括用户的性别和位置,如一个城市或国家。其次,用户的长期偏好配置文件根据用户的交互历史项目和项目的类别。衰变函数权重调整申请功能。第三,用户的短期偏好配置文件,以反映用户的最近的偏好得到基于项目的特性提取用户的评论。最后,个人建议为个人用户提供基于选定的候选项考虑用户的长期和短期偏好配置文件。高级组的建议提供的不同组的用户聚合个人推荐。

3.1。候选项选择

协同过滤是用来为个人建议选择准确的候选项。具体地说,他提出的神经协同过滤等。46)已经被合并改善用户的补充信息,包括用户的性别和位置,选择更精确的候选项,因为用户提供类似的人口(如性别和地理位置)特性往往有相似的偏好(2]。因此,用户的性别和位置得到用户性别预测模块和用户位置精度。

用户性别预测模块将用户的名字作为输入并预测用户的性别。长期短期记忆(LSTM)递归神经网络用于用户性别预测模块。学习能力的长期依赖性使LSTM有利的预测不同的序列,如文本序列或序列。LSTM神经网络由重复的模块。每个重复模块包括忘记层,输入层和输出层。

在忘记层,方程(1),乙状结肠函数决定哪些信息应该被丢弃的细胞。输出的值在0和1之间的每个数字单元格: 在哪里σ乙状结肠非线性,W是重量参数,hx隐藏的输出特征向量和输入特征向量,分别b是相应的偏见。

输入层决定哪些信息应该保存在细胞中。它有两个部分。在第一部分中,方程(2),一个s形的函数确定哪些值应该被更新。在第二部分中,方程(3),一个双曲正切函数建立新的候选矢量值, :

前面的细胞状态更新到新的细胞状态。旧的状态是乘以忘记层的输出方程(4),新的候选值补充道:

输出层决定了输出。乙状结肠函数决定的细胞状态将作为输出。函数接受细胞状态和值从−1比1,确定重要性水平(请参阅方程(5))。最后,双曲正切函数乘以乙状结肠的输出函数方程(6):

用户位置估计用户位置预测模块。具体地说,用户位置预测模块开发的基于用户和项目之间的相互作用。估计一个特定用户的位置,用户与之交互的项目集群的位置。最大的集群被选为用户的估计位置。

对于选择候选项,神经网络协同过滤,使用辅助用户信息从用户性别预测和用户位置(图提出了预测模块1)。提出了神经网络需要项目”和用户的信息,包括性别和估计位置,作为输入的输入层。这个补充用户信息有助于提高预测的准确性分数。输入层后,嵌入层是用来表示用户和项目的信息连续向量。嵌入有助于显示句法和语义特征的物品”,用户的信息以及捕获它们之间的关系。将嵌入式用户和项目的信息转换为一维,平层应用。随后,被用户和项目的信息集中在一起集中层。应对过度拟合的问题,一个辍学正则化方法中使用以下辍学层(47]。辍学层是紧随其后的是几个隐藏层辍学正规化。隐藏层,模型学习之间的交互用户和项目的潜在功能。这些层包含一个减少神经元的数量,这是每个隐层神经元减少一半。通过这种方式,可以从更多的抽象数据。最后,输出层是由一个完全连接的神经元,预测用户的分数会给未知的东西。的项目预测分数高于3.5阈值选择的候选项目进一步处理。

3.2。用户长期偏好配置文件

用户的长期偏好提取物品的描述属性(如业务名称、业务类别、业务功能)和项目的共同特征属性(例如,开放时间、地点、价格)。尽管描述属性和共同特征属性的数量是相对较小的,这些属性可以精确描述和分类项目,增加构建用户配置文件的有效性。

代表用户的概要文件,向量空间模型(VSM)的代表是受雇为一个用户模型表示方法,因为它考虑了用户配置文件中的不同属性的重要性。在向量空间模型表示,用户配置文件P被表示为一个n维向量中每个维度匹配不同的项目特点和n这些特性的总数。用户配置文件的例子中说明了向量空间模型来表示 在哪里f代表项目特性和 显示在用户配置文件功能的重要性。

在用户的长期偏好资料、用户的特性得到了基于用户与产品的交互。用户的特性的初始权重计算的频率出现在交互项。计算的初始权重的过程来说明一个特定的用户配置文件,假设用户 与两个项目, 第一项 包含的功能 , ,而第二项 包含的功能 , , 基于用户 交互,用户 从两项与四个特性。这个功能 表示在用户与之交互的物品,和它的初始重量将被设定为两个。而功能 , , ,用户 只有互动一次;因此,他们的初始权重将会设置为1。然而,为了更准确地反映用户偏好的用户概要文件,初始重量特性需要一个基于时间的调整。

以反映用户偏好的改变用户概要,用户的特征权重降低。为此,指数衰减函数,方程(8),已被应用到用户的长期偏好特征权值调整配置文件根据用户的时候与一个特定的项目。更具体地说,最近项目从用户的交互变得更加重要和有更大的影响对用户的长期偏好配置文件比之前项目从用户的交互: 在哪里 控制衰减率, 时间参数,参数 确定特定的用户倾向于改变自己的喜好经常或不(方程(9))。确定用户相似变化,用户拥有的所有项目之间的相似性与除以这些物品的数量。参数越大 少,特殊用户倾向于改变他们的偏好: 在哪里n代表所有的项的数量,用户与之交互。

此外,由于每个用户改变他们的偏好速度是不一样的,参数 从方程(9)计算出每个用户,它影响的衰变速率方程(8)。

3.3。用户短期偏好配置文件

用户的短期偏好从用户评论获得物品。用户生成内容和用户评论是一种表示在一个自由的文本形式。所有用户都可以自由表达他们的意见对项目通过评审,这可能有助于理解背后的原因用户是否喜欢或不喜欢一个特定的项目。因此,项目特征可以从用户的评论。提取项目特性,所有的用户评论对一个特定的项目已经聚合。这些项特性是通过使用语法语言模型中提取算法(48]。n元语言模型是一个序列n单词出现在一个给定的文本语料库。此外,提取更丰富和精确的特性没有指示极其罕见的unigrams,三元,三元模型被认为是n= 1,分别为2和3。最后,提取项目功能的聚合存储在项目概要文件用户的评论。

2显示的过程获得user-short-term偏好配置文件的用户评论。如图,获得用户短期偏好概要,用户评论的一个特定的项目通过语法与每个提取特性算法在项目配置文件中。比较项目的用户评论功能,用户评论和项目特性映射到实数向量。具体而言,表示从嵌入语言模型(艾尔摩)是用来表示向量的项目特点和用户评论或者嵌入49]。通过这样做,语法和语义特征的物品”,用户的特点是模仿来提高嵌入的质量。更重要的是,上下文表示的是一词多义的特点可以从语言模型中嵌入的区分。因此,项目之间的相似性可以精确的计算功能和用户评论。之后,选择最相似的特性为用户短期偏好配置文件。

此外,一个滑动窗口算法用于捕捉最新的用户首选项。滑动窗口算法通常考虑基于时间的基于滑动窗口或点滑动窗口(50]。前者依赖于用户的交互与服务从最新的固定时间间隔(最新的日、月、年等),而后者认为固定数量的最新的用户交互与服务(最新的10、20、50等)的相互作用。考虑到每个用户与系统交互的方式不同,滑动窗口算法主要用于捕捉最新的用户交互在当前的研究中。请注意,基于实证测量,过程中获取用户短期偏好配置文件,只考虑最新的二十个用户交互来降低时间复杂度,提高用户建模的速度,只抓住最近的偏好。此外,获得更精确的用户短期偏好的变化,用户短期偏好配置文件动态更新每次用户与一个新项。

3.4。最高个人推荐

处理选中的候选人通过用户长期和短期偏好配置文件前的个人建议。用户长期配置文件属性之间的相似性和项目类别属性计算从选中的候选人。余弦相似度测量是用来检查之间的相似度两个向量的内积空间。计算两个向量的余弦角: 在哪里 向量的分量吗一个B,分别。相似的输出范围从−1比1−1表明,两个向量是完全相反的,而1表示这两个向量是完全相似的。

相似性最高的项目候选人与用户长期偏好配置文件属性选择和降序排序。上一步之后,处理商品的分类是基于相似性得分(方程(10)用户短期偏好之间的概要文件和提取的项目属性的用户评论。最后一个列表顶部的个人建议,考虑短期和长期偏好形成。前给出个人建议的算法如算法1的表1

如表所示1的列表项目候选人主要是获得所选用户。用户概要文件构建短期和长期的偏好。建议数据帧,rec-df,是用来储存相似性的推荐列表的分数。的相似之处,long_simshort_sim项功能和用户配置文件之间的计算和存储在数据帧的建议。然后,建议按相似性与长期偏好配置文件。最大的项目选择相似性进行进一步处理。最后,建议前一步骤整理的相似性与短期偏好配置文件。最后从顶部形成项目列表数据的建议。

3.5。前组建议

的用户组的建议提供聚合的个人建议。的方法形成了集团的建议个人推荐是至关重要的,因为当这些建议为每个用户单独,它允许捕获组中的每个用户的个人偏好的变化和动态反映这些变化在最后的建议。算法2在表2的伪代码是建议用户组。

应该注意的是,聚合推荐列表,aggregatedRec首先创建聚合所有个人组中的每个用户的建议。前个人推荐组中的每个用户提供使用算法2。在那之后,相似矩阵,all_users_similarity之间,所有项目从聚合个人建议和创建用户组中。然后,用户配置文件的每个用户组。用户配置文件与所有项目从聚合个人建议相比,存储在和他们的相似之处聚合相似列表。因此,每个用户组和他们的相似性与每项添加到相似性矩阵all_users_similarity。平均用户之间的相似度和相似矩阵的每一个项目然后计算。最后,项目平均相似度降序排序,最后前选择项目建议的用户组。应该提到,算法2可以为任意数量的用户提供最高的建议。

4所示。实验研究

在本节中,一个实验研究进行了评估的性能提出了个人和团队建议time-aware混合的方式。这个建议的方法是测量提供了前5,10,20个人以及团体的建议用户在业务部门(如餐馆、本地服务、酒店和娱乐设施的建议)。

4.1。数据集

在这项研究中使用的Yelp数据集。数据集包含业务数据和用户数据(51]。业务数据包括精确的业务信息,如城市,州,纬度和经度,明星,评论数,业务属性、业务开放时间,和类别。用户数据含有丰富的信息,比如用户朋友映射,用户名、用户ID、评论的数量,平均给星星,审核数据,登记日期(请参阅表中的示例34)。最初,192609家企业的数据集包含6685900条评论。然而,更好地捕捉用户的偏好的变化在不同的时间点,数据集被进一步细化和数据选择,保留最活跃的用户和产生最后的313261用户评论的78138家企业。这个数据集分为两个部分:一个训练集,其中包含70%的数据和测试集,涵盖了30%的数据。

此外,递归神经网络训练LSTM用户性别预测模块,全国的数据描述个人名字的频率在美国有一个关联的社会安全号码用于这项研究[52]。数据是基于社会保障记录3月3日,2019年,包含给定名称的记录超过一百年。总的来说,这些数据包括98399独特的名字。覆盖的数据字段的名称、性别、和频率的一个名字。这个数据集分为训练、测试和验证集根据比例为60%,20%,和20%,分别。

4.2。用户更改偏好的例子

用户改变他们的偏好以不同的速率。这里,提供了一个例子来说明用户偏好的变化在很长一段时间基于用户长期偏好配置文件(从2013年到2019年)。两个用户和Yelp数据集随机选择一个条目。改变用户的偏好可以明确确定通过测量之间的相似用户的偏好和一个项目在一段时间的功能。相似度值高的差异表明,用户倾向于改变他们的偏好更频繁和剧烈。之间的相似用户的长期偏好概要文件和所选择的项目是由方程(11)在选定的时期。图3显示了两个用户的偏好变化对相同的项目。可以看出,偏好的显著差异对用户发现从2013年到2019年。此外,两个用户倾向于改变他们的偏好以不同的速率。更具体地说,似乎一个用户有更稳定的偏好在一定时期,而另一个用户的偏好变化更加频繁和剧烈。这些发现进一步证实用户的偏好不同,变化的速度,它应该在推荐过程中解决用户的个人和团体。

4.3。评价指标

评估的性能提出建议方法,各种评价指标,包括精度,还记得,新奇、和多样性指标,用于这项研究。通过关注这些指标,它可以比较突出的效率评估。所有评价指标应用于最高k排名,只有顶部k在推荐列表中被认为是结果。精度和召回评估指标在方程(11)和(12),分别为: 在哪里k推荐列表的长度;在实验研究中,k对应5、10和20。U一组是用户的集合, 的精度k对于一个给定的用户u, 的回忆k对于一个给定的用户u, 是用户的目标项目的数量,用户喜欢在推荐列表中,然后呢 是用户的目标项目的总数在测试集。

新奇的度量定义了不熟悉的和令人惊讶的建议项特定用户(13)(见方程(13))。测量项目的新颖性,的概率定义为一个函数项的排名为所有用户。因此,新奇的物品在推荐列表中被定义为平均人气排名: 在哪里R列表顶部的建议提供了对于一个给定的用户,然后呢n代表的数量提供建议。

多样性度量代表之间的平均得分不同每一个可能的特定用户对推荐项目(请参阅方程(14))。它表示推荐项目的区别: 在哪里年代之间的相似性得分是每一个可能对推荐项目,然后呢n代表的数量给定用户的建议。两个项目之间的相似性得分计算通过使用余弦相似性度量(如在方程(10))。推荐的项目之间的相似性得分越大表明低水平的多样性。

4.4。个人推荐评估设计

检查的有效性,我们建议的方法对用户偏好的变化,前提供个人建议在两个时间点(T1和T2)。作为长期偏好往往随时间变化缓慢,用户偏好变化的影响会更加明显的长时间间隔。在此前提下,两年期T1和T2之间的时间间隔被选中,代表日期11-11-2017日期(T1)和11-11-2017 (T2),分别在T2的日期更新数据集。推荐性能评估精度,还记得,新颖性和多样性。此外,最高个人推荐的结果与一组基线算法相比,包括再邻居算法(事例)53),k - means聚类算法(54],co-clustering [55),非负矩阵分解(NMF) [56],奇异值分解)算法(57]。

4.5。小组建议评价设计

进行我们组推荐方法的评价,建议提供团体与不同数量的用户,包括小型,中型和大型集团。小型、中型和大型组包含3、6和12个用户分别。每组的大小,100组随机生成的数据集。总共有300组包含2100个用户用于组推荐的评估。

该集团推荐的方法是与不同的组推荐方法相比,包括平均最痛苦,最快乐的方法基于神经协同过滤算法(46]。平均神经协同过滤方法(average-nnmf)同样认为组中的每个用户的意见和考虑预测的平均评级为每个用户组为特定项和雇佣的集团预测,项目。神经协同过滤至少痛苦方法(lm-nnmf)试图减少痛苦的用户组。主要的思想是,一样满意的预测至少满足用户的组。在这种方法中,一组对应于最低的预测预测评级组中的每个用户的特定项目。最后,神经最快乐的协同过滤方法(mp-nnmf)考虑项目中的一个用户群最喜欢但没有考虑其他用户首选项。一组对应于最大的预测组中的每个用户预测评分的特定项目。

5。结果与讨论

5.1。结果的个人建议

4描述的结果前5,10,20个人推荐的精度。总体而言,该方法有更高的分数在T1和T2,这表明,我们建议的方法在精度比其它算法有更好的性能。这意味着该方法可以识别并为用户提供更相关的物品。此外,它可以看到有T1和T2之间的推荐性能的差异。更具体地说,该方法的性能在T1达到0.8683,0.8492,和0.8331顶部5、10和20的建议。我们建议的方法T2显示出更好的性能,达到了0.8723,0.8521,和0.8340前5,10,20建议,分别。这种差异可能表明偏好在用户的概要文件是不断变化的,因此,在T1和T2有不同的权重。这些变化在时间点已经被我们建议的方法。这意味着用户偏好的变化可以适度影响推荐性能,特别是在精度。此外,有趣的是,该方法的性能逐渐下降的前5到20在T1和T2的建议。 A possible explanation may be that the increasing number of recommendations may have more irrelevant (or false positive) items, which in turn decreases the recommendation precision.

此外,推荐的结果性能对于召回如图5。图中展现的,在测量方法,我们建议的方法的性能在时间点放在顶部,显示一个更好的推荐性能。更具体地说,该方法有更高比例的相关项目在前5,10,20个建议。然而,值得注意的是,T1下的性能非常接近的性能在T2。一个可能的解释是,有关(真阳性)候选项的百分比仍然稳定在不同的时间点。这可能发生,因为用户偏好的变化对回忆有小影响性能。令人惊奇的是,结果表明,性能T1 T2比性能。这样的结果不符合的结果精度,显示推荐比T1 T2有更好的性能。这可能归因于precision-recall权衡的结果,在一个指标的增加(精度或召回)会导致别人的减少,反之亦然。我们的研究结果还表明,召回方面性能的增加逐渐从5到前20名在T1和T2的建议。 This may suggest that a positive correlation exists between the proportion of relevant (or true positive) items and the number of recommendations.

关于推荐的结果性能的新奇(见图6),总的来说,结果表明,该方法比其他算法有更好的性能。然而,值得注意的是,该方法的性能在T2稍微表现不佳的事例和co-clustering算法十大建议。这可能是指示性的用户首选项稳定在T2,导致低水平的性能对于新奇。此外,新奇的性能方面的差异被发现之间的T1和T2。这种差异反映用户配置文件的变化和特征的权重,显示新奇的性能深受用户偏好的变化。

7礼物的推荐性能多样性顶部5、10和20个人推荐。不出所料,结果表明,该方法具有更好的性能在所有测量方法的多样性。这意味着项目推荐的建议的方法更加多样化和不同。此外,值得注意的是,在推荐性能有显著差异之间的T1和T2。具体地说,该方法的多样性达到1.8038,1.7823,和1.7710顶部5、10、20建议分别为T1,。顶部的T2性能达到1.7938 5,1.7743前十,在排名前20位的建议和1.755,这低于T1下的性能。这可以解释的推荐性能多样性可能会受到更少的用户偏好改变T2。这样的性能差异进一步支持我们之前发现权重偏好的用户的概要文件在T1和T2截然不同。此外,这些结果表明,多样性指标可以更受用户偏好的变化。此外,有趣的是,多样性降低的性能从顶部5的前20名在T1和T2的建议。 Such a finding can be explained by considering that the more the items are recommended, the fewer the dissimilarities that can be found.

此外,每个测量的平均表现方法的精度,还记得,新奇、和多样性指标如表所示5。结果表明,该方法的分数高于其他方法在每个指标,表明该方法有更好的平均表现(以粗体突出显示的表)。这样的结果证实,更好的性能在精度方面,新颖性和多样性可以提高整体性能。此外,T1和T2显示了差异之间的平均表现在精度方面,新颖性和多样性。这意味着推荐性能的影响不同,进而指出用户的偏好变化的重要性。这些发现表明,捕捉用户的偏好变化不仅可以使精度的改进也增强新颖性和多样性的建议。在这一点上,我们建议的方法是有用的,有效的为用户提供建议不断改变自己的喜好或保持稳定的偏好。

5.2。顶级集团推荐的结果

集团推荐的结果的精度在小型、中型和大型组织呈现在图8。总的来说,结果表明,该方法优于其他方法在所有三种类型的组织的建议。这表明更相关的项目推荐的建议的方法比其他方法在小型、中型和大型的用户组,。关于该方法的性能,结果表明,通过媒介集团更好的性能。大群的地方下,小组执行更糟。这可能发生,因为偏好的分布在用户的媒介组相对较低,而用户的小型和大型组织高水平的偏好分布。如此低的分布介质组表明,用户也有类似的偏好,和建议的方法可以更好地识别相关的项目组织,从而达到更好的精度性能。此外,它表明,用户在组的数量影响精度性能在三组。这越来越多的用户在一组可能的挑战的推荐精度。此外,有趣的是,精度最高的小组建议保持稳定的前5的前20名建议在所有三种类型的组织。 This indicates that the increasing number of recommendations does not affect the ratio of irrelevant items, which leads to stable performance of the precision.

9描述了建议性能的三个用户组之间的回忆。如图,总的来说,该方法实现了比其他方法更好的推荐性能在三组。看来,该方法提供了更高比例的相关(真阳性)项目在所有的组。然而,有趣的是,在大群,该方法略表现不佳mp-nnmf方法在10大建议。这可能发生,因为该方法不准确识别无关项大的用户群的十大建议由于高水平的分布在一大群用户的偏好。因此,相关的速度(真阳性)项目减少,导致召回的较低的性能。此外,它可以指出,在该方法中,回忆在三组的结果相当接近对方。这样的结果表明,不同群体的用户可能小对召回的推荐性能的影响。此外,结果表明,召回的性能在每个组显著增加从顶部5的前20名的建议。这可能意味着越来越多的建议可能更相关的(真阳性)项目,这就增加了推荐召回。

10显示顶部的新奇的性能结果5、10和20个小建议,中型和大型团体。正如预期的那样,很明显,该方法优于其他方法在所有组。此外,研究结果表明,新奇的中小集团建议遵循相同的模式的性能逐渐降低从顶部5的前20名的建议。这样的下降可能是由于一个事实,即越来越多的商品推荐,更多高素质的项目都包含在建议。尽管如此,大群的新奇稳步减少从顶部5的十大建议的突然增加的十大排名前20位的建议。一个可能的解释这样的波动是偏好的用户人群的分布。这支持了我们之前发现和证明了大群包含用户广泛不同的偏好影响推荐结果的新颖性。此外,结果显示高的值之间的差异小,中型和大型团体。这种差异可能是由于用户组的大小。因此,用户数量在一组可以显著影响新奇的性能。

此外,顶部的性能结果的多样性5、10和20建议三组如图11。很明显,该方法显示出更好的性能比其他方法小,中型和大型团体。特别推荐的多样性小组达到1.095,1.232,和1.382前5,10,分别和20的建议。在中组,它达到0.979前5,1.086前10名,和1.204排名前20位的建议。类似的增加的趋势中可以看到大群的建议,达到了0.931,1.025,和1.112前5,10,分别和20的建议。此外,结果表明,多样性增加的性能从顶部5的前20名建议在所有三种类型的组织。这可能可以解释为更多的项目建议,差异更推荐项目中。然而,之间的负相关组中用户的数量和多样性表现中发现的结果。可能是由于用户的偏好的分布在不同的组。有一个增加的用户群体,更多的用户可以共享可互换的偏好。 Accordingly, the similarity among recommended items rises and consequently influences the performance of diversity.

最后,精密的平均性能,还记得,新奇、和多样性的小,中型和大型的组织,提出了表6。结果是符合我们之前的研究结果表明,该方法的性能优于其他方法在所有评价指标在不同大小的建议。此外,结果表明,性能的差异小,中型和大型团体。具体地说,召回的性能显示小的结果差异小,介质,和大型组织,这意味着用户在组只有轻微影响回忆的推荐性能。然而,结果精度的差异,新奇和多样性在所有三组是相对较高的,这意味着用户对推荐性能有相当大的影响。这些研究结果表明,考虑到用户在组能提高推荐的整体性能和提供不仅准确,而且小说和形形色色的建议。

6。结论

推荐系统作为过滤服务来对抗信息超载,这是越来越多的从业者和学者们的注意。从以前的研究的证据表明,有必要开发一个有效的推荐方法提供精确定位目标的信息,促进资源利用不仅对个人,而且用户组。特别是,有一个需要解决的时间意识,这可以更符合用户偏好的变化,使改进的推荐性能。因此,本研究旨在解决用户偏好的变化通过一段时间开发一种混合推荐方法,为个人和组织提供建议的用户。更具体地说,调查以下研究问题:(1)什么是用户首选项的影响变化对个人用户和组的建议吗?和(2)用户组如何影响精度,还记得,新奇、组和多样性的建议吗?为了回答这些问题,我们建议的方法集成神经与基于内容的协同过滤方法,个人建议,和个人的建议聚合方法是用于组织的建议。

结果在以下方面进行了总结。首先,总体的结果表明,该方法实现更好的性能比其他算法,包括基于事例,k - means, co-clustering, NMF、和圣言的个人建议和average-nnmf average-nnmf, mp-nnmf组建议。这样的结果进一步证实了我们建议的方法的验证个人和群体的建议。第二,精确的推荐性能方面的差异,还记得,新奇、和多样性之间的T1和T2在这项研究。这可能意味着用户的动态偏好变化通过时间可以捕获用户的配置文件,我们建议的方法。此外,结果表明,用户偏好的变化随着时间的推移对推荐性能有很大的影响。这些发现提供证据表明,解决用户偏好的变化随着时间的推移,提高了用户建模,因此建议增加性能。第三,集团推荐评估的结果表明,精确的性能,还记得,新奇和多样性在不同小,中型和大型的用户组,。这些发现表明,用户在组的数量有相当大的影响组织效率和有效性的推荐性能。

本研究对推荐系统的研究开发time-aware混合推荐方法为个人和集团用户提供建议。此外,调查用户不断变化的偏好之间的关系随着时间的推移和用户概要文件提供了深刻的见解建立更有效的和精确的用户配置文件,可以提高推荐的性能。拟议的方法将有利于开发商增加捕捉用户动态偏好的理解用户配置文件的变化以及加强用户配置文件的知识建模为个人和小组的建议。此外,我们的研究还可以帮助学者拓宽他们的知识的推荐评价通过专注于多个指标,包括精度、召回、新颖性和多样性,从而提供深入理解测量推荐系统的效率。

这项研究有一些局限性。例如,该方法只考虑用户的积极反馈的用户建模没有解决负面的反馈,这可能限制了建模用户配置文件和推荐性能。进一步的研究可以解决正面和负面反馈获得更全面的用户的偏好来改善用户配置文件。此外,该方法受限于忽视组中的用户之间的社会关系,这可能影响集团质量的满意度和建议(58]。未来的工作可以扩展研究的组中的用户之间的关系,包括朋友,同事,亲戚,或陌生人。结果将有利于优化和改进建议。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

本研究支持的研究经费由国家自然科学基金资助(批准号61771297)。