文摘
兴趣点(POI)建议是一个受欢迎的形式的个性化服务,用户与他们的联系人分享他们的POI位置和相关内容在基于位置的社交网络(LBSNs)。用户之间的相似性和亲缘相同的POI类型经常用于轨迹检索,但大多数现有的工作依赖于明确的特点从所有用户的签到记录不考虑个人活动。我们提出一个POI的推荐方法,试图优化推荐POI类型为多个用户服务。该方法旨在预测目的地POIs的用户和搜索类似相同的用户感兴趣的区域,因此优化为每个推荐用户验收率。该方法还雇佣了variable-order马尔可夫模型来确定用户的POIs的分布基于他或她的旅行在LBSNs历史。进一步提升用户的体验,我们也应用线性判别分析集群相关的主题“旅行”与社会联系和连接到用户或类似的利益。POIs的概率根据用户的历史访问数据和兴趣相同的主题可以计算。然后系统提供了一个列表的排名推荐目的地POIs的概率。我们证明我们的工作优于collaborative-filtering-based和其他方法使用两个真实数据集从纽约城市。实验结果表明,该方法比其他模型的精度和召回。拟议的POI推荐算法可以部署在特定网络运输系统和可以提供超过100000个用户。
1。介绍
登记行为在基于位置的社交网络(LBSNs)已成为一种新的生活方式的组件为数百万用户分享他们的兴趣点(POI)与联系人位置LBSNs和提供的带有地理标签的用户这样的帖子,照片,和小额支付1]。LBSNs的功能已成为近年来日益复杂的,包括众多的以用户为中心的服务。其中,个性化的POI的建议(2,3),如电影院、餐馆和旅游景点,这是预测个人感兴趣的用户,已成为一个日益重要的服务,可以大大提高用户的旅行体验4,5]。因此,POI建议可以极大地增强用户收到的旅行经验从行业和学术界越来越多的关注3]。然而,以往的研究通常适合POI建议模型基于所有收集到的登记数据。它不完全捕获用户的行为在不同的场景中由于interuser和intrauser差异的异构性问题6]。在这里,我们调查的趋势不同模式下用户旅行(包括空间和语义),他们也倾向于选择POIs基于自己的兴趣和社会联系。此外,现有的POI建议一般都寻求发现未知的POI类型为用户从他或她的联系人7]。然而,这些建议可以涉及非常稀疏数据和8),此外,他们无法利用POI数据的语义LBSN用户具有相同兴趣和旅行习惯的目标用户,但并不在用户的联系人。
基于上述考虑,在本文中,我们提出一个个人POI基于目的地的推荐方法预测。首先,个人的签到行为分析从用户的POIs的分布基于他们的旅行在LBSNs历史。variable-order马尔可夫模型被用来预测目的POI类型(9),考虑语义的空间布局,这是推荐的关键约束的过程。这克服了缺点与现有POI的建议,不仅与POIs联系用户访问,而且识别当前用户的位置的影响他们的未来运动和考虑的下一个目的地类型的POI类型推荐。其次,用户组(10)具有相似偏好根据用户的历史访问数据和兴趣相同的主题得到了(11]。每个目的POI的概率由用户使用社区的建议可以这样计算。最后,推荐目的地POIs的列表排名提供了可能性。
发现旅游社区缓解数据稀疏的问题(12],同时减轻现有方法的弱点根据签到数据收集联系人的用户,忽视了一个事实:许多用户喜欢与人互动的不同社会链接(13]。此外,社会互动结合使用移动相关改善建议的信息检测的社区,这增强了用户的体验。使用真实数据集的分析表明,使用活动模式为真实的社区和社会互动促进候选人POIs的数量显著增加,导致更精确的POI建议个人相对于评级POI的建议。
我们的主要贡献是总结如下。(我)我们推广POI建议通过检测社区的社会互动和语义空间运动。(2)我们解决个性化POI建议通过每个用户的历史POIs的类型作为候选人。预测模型训练的概率来计算用户的意图POIs根据离职经度和纬度和起飞时间。(3)我们评估该方法与其他现有的推荐技术在两个真实的数据集。实验结果证明我们的方法准确地发现真正的组织行为,建议最感兴趣POIs到目标用户在这两个测试用例,并优于现有算法。
本文的其余部分组织如下。相关的研究针对现有的POI的推荐技术受雇于LBSNs提出了部分2。节3POI预测模型,提出了综合旅游社区,。travel-community-based推荐算法推导出部分4。节5,数值结果验证了该方法的优点超过其他两个算法。结论给出了部分6。
2。相关工作
POI建议的数据集通常包括全球定位系统(GPS)轨迹和LBSNs的登记数据(14]。虽然许多研究[15- - - - - -17]开发了POI建议基于GPS轨迹数据,这些方法首先开采语义POIs的序列,这是由登记数据。此外,登记数据提供额外的信息标记(例如,社会互动,POI类型,或语义空间布局)特别有用的捕捉潜在的用户相同的POI类型之间的关系。因此,POI推荐基于签到数据大大地深受研究人员,并已开展大量研究[1,18- - - - - -20.]。
日益复杂的POI建议开发基于登记数据,虽然各有特点的弱点。例如Berjani和Strufe [21]应用协同过滤(CF)模型与登记数据进行POI的建议。不幸的是,用户检查的次数的差异在不同的地方被忽略,导致不能完全发现和排名基于位置的用户他们的利益。施等。22)推荐POI位置基于category-related正则矩阵使用历史位置由用户访问。然而,不考虑当前的旅游活动的用户,这个方法不建议用户应该去的地方。你们et al。23)使用提供的评级朋友与朋友之间的社会距离提供POI的建议,没有任何旅游信息用户的利益。过et al。24)扩展的CF模型用户的当前位置和社会互动,但它只建议POI的旅行距离和搜索类似的用户只考虑他们的社会影响25]。因此,它不适合稀疏数据集。贝叶斯分类被京津计算登记用户的特定位置的概率在未来使用历史签入点,基于距离的约束条件下(26]。然而,这种方法不确定影响其他用户的推荐,这相应地降低了推荐的准确性。你们et al。27)构建多个信息源(如扩散过程。,people’s interests, social influences, and spatial proximity) to improve the accuracy of their proposed recommendation. However, this method can provide a general list of the intended POIs without regard to the locations in which a user is at the present moment.
3所示。从预测语义POI旅游社区发现
3.1。语义POI预测
语义POIs的顺序访问特别有用在捕捉潜在的社区成员之间的关系28]。POI-related模型描述颞真实用户,包括所有活动模式 POIs访问用户u / 1 d期 ,在哪里代表一个点的轨迹数据库,= ( , , , , ),这是根据纬度(定义 )和经度( )入住时间( ),POI的名称( ),和POI类型( )。所有m用户你收集的历史轨迹 ,在id不同轨迹。
我们应用variable-order马尔可夫模型来预测POI目的地(29日]。历史POIs的设置用户的抽象这是作为HPOI = 。鉴于在 ,如果 ,然后n阶上下文模型的指的是一个长度为N的序列作为下一个山芋;也就是说,= 。通过寻找轨迹具有相同的长度在 ,我们可以预测的概率分布从观察到的轨迹数量基于局部匹配(PPM)的预测模型。我们计算的概率的“接下来POI目的地基于上下文模型使用
在这里,代表的数量考虑的目的地 ,S ( )表示的总数对于不同的目的地 ,和一个( )描述类型的上下文相同序列的不同的目的地在 。
方程(1)表明,给定一个在HPOI,如果有一个序列长度相同的轨迹 ,的概率的表明将会是一个未来POI目的地确定,回来 。否则,它开始减少N×1和更新背景模型预测使用 。““在(3)表示越狱凯德PPM模型控制中提供搜索直到= 0。
在哪里表明预测概率的转义代码 , 表示转义代码的频繁 ,和 。
然后,我们减少1,确定的数量在 ,和搜索的顺序相同的轨迹在 。如果没有这样的序列,继续减少转义代码的频繁,直到找到上下文模型在带有轮。然后计算概率
如果没有找到相同的轨迹与上下文模型而逃脱的频繁的代码= 1,我们分配预测概率作为
我们可以确定预测POI的类型与最大的概率。在下一节中,社会互动结合使用移动相关推荐POIs的相同类型的信息。用户之间的相似性和亲缘相同的POI类型识别与社会联系或相似的兴趣话题。与相同类型的社区POIs的最终提供建议。
3.2。社区检测
建模的社会利益。我们采用社会话题感兴趣的30.)用户定义他们的相似之处。我们定义作为一个社交媒体用户发布的数据集 。潜在狄利克雷分配(LDA) (31日,32然后应用到学习的主题)通过分词,障碍词过滤和词性。一个向量然后建立了目标主题对应用户。用户和 ,相似的社会利益来标示 ,由以下方程表示,用户u和v时也有类似的利益 :
旅游偏好建模。我们先前的研究显示建模的用户的移动相关信息使用异构信息网络(HIN) [33,34]。我们确定了两个用户之间的相似度与相同的旅游偏好欣SimRank [35在一个随机游走过程中模型36]。
LBSN首先被建模为异构信息网络 ,在旅游信息的地方LBSN指的签到行为。这里,U是用户和POIs的集合是所有POIs的集合。 表示所有无向网络中边的集合,在那里代表用户之间的关系,表明每个用户对有类似的旅游偏好,意味着用户的签到行为代表POIs相同类型的。旅游用户之间的相似性取决于两个用户能否相见,随机走在网络h .基于u和v的路径的长度满足和他们见面的次数,计算相似度
在哪里 表示两个随机漫步从u和v,分别。假设x H,他们第一次见面在节点和两个轨道的长度被定义为从各自的起源到x (t)。考虑到两个随机漫步的路径 , ,用户走的概率 , 是 和 ,分别在O ( )表示附近的位置O ( )。u和v会议通过的概率 , 然后 。 。计算 从随机漫步的角度来看,所有路径的H长度小于或等于 及其检测到用户沿着路径的概率。给定一个节点,两个用户之间的相似度有相同的目标和路径的长度是因此决定通过(8)。
直接的方式将两个社区发现的信息来源是获得一个统一的相似性 通过加权组合的相似性矩阵如下:
在哪里 , ,和 。我们可以因此获得一组社区(u) N的用户最类似于u。
4所示。Travel-Community-Based POI的建议
POI推荐算法研究中结合使用个人旅行历史数据预测POIs的候选人POIs相同类型的预测POIs发现旅游社区生成的。这样的一组候选POI然后获得。
确定潜在的POI位置最感兴趣的社区成员,它可以识别用户喜欢的位置是如何衡量用户检查的次数在给定的位置。一般来说,越是用户检查时,他或她觉得感兴趣的位置。然而,计数签到的用户在给定的位置不能感兴趣的位置,因为它的指标失败的次数占用户可能在其他地方办理登机手续。因此,我们寻求测量的相对程度对用户在各种POIs相同类型的。因此,在本研究中我们引用用户v上位置的感兴趣的程度为v签到的人数的比例 ,表示为 ,对v的签到的总数相同类型的位置 ;它是表达如下:
在哪里表示v在一些地点“签到”的平均数量在同一类型 ,和表示数量的方差签到的v位置在同一类型 。
用户在位置的感兴趣的程度 然后表示为
(7),我们可以提供一个推荐POIs的列表用户兴趣度的排名算法。1建议POIs的基础上用户的历史访问数据和社区成员有相似的社会利益。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
5。结果与讨论
5.1。数据集
我们的性能评估算法由两个登记数据库集中在纽约,即。Foursquare和Gowalla。每个数据集包括签到记录和评论。这两个数据集进行预处理,虚假登记数据被删除,这样单一的数据由用户登记期间收集的一天。然后,Foursquare数据集包含了3357用户,3543 POI的位置,和168297签到,而Gowalla数据集包含了5419用户,6742 POI的位置,总共330724签到。
5.2。评价的推荐性能
两个性能指标,表示精度和召回,被用来评估推荐TC-based POI的提议推荐标准算法的性能。这些指标比较不同的R (u)之间的关系和POI的集合地点实际上访问由用户根据实际的登记数据(即u。T (u))。POI的精度和召回建议你定义如下:
在这里,反映了推荐的准确性和指位置在推荐结果的比例,实际上用户访问在未来的总数相比POI位置推荐。揭示了全面性的推荐和指的位置推荐结果,用户访问在未来POIs的总数相比,实际上用户访问。准确性和回忆是相互制约和综合利用的两个可以提供一个客观的评价预测结果。
使用目的地推荐性能预测提出了本研究验证与其他三个典型的POI的推荐算法,相比而言,准确性和回忆。三种算法的精度和召回,在头N个(N = 5、10、15和20)POIs,如图所示1两个数据集。
(一)Foursquare的数据集
(b) Gowalla的数据集
可以看出TC-based POI的推荐算法表现好于其他两种算法对数据集的所有值N的考虑。从图可以看出,我们的算法达到更好的精度,这是15%高于基线CF-based算法的准确性。旅游社区的性能是合理的,因为使用减轻由于数据稀疏的问题,导致一种改进的POI推荐像LBSNs稀疏和复杂的网络。社会互动也集成到建议,建议更个性化。
我们也采用LSTM(长短期记忆)算法来预测目标。如表中所示1,LSTM-based POI的推荐算法的精度远低于建议的方法。原因是LSTM-based算法可能会阻碍移动识别没有潜在语义的知识两个附近的邻国之间的关系。此外,使用的各种旅游轨迹作为输入LSTM-based算法可能产生非最优预测,由于不同的旅行轨迹的长度。
研究了hyperparameter ,这是结合社会的利益的权衡术语和旅游信息。结果如图2其中N是5。我们使用的重量 结合两种信息公平的比较。这表明预测很低时(通常小于0.3) ,也就是说,依靠单个proximity-related度量。如图2(一个),当我们增加社会信息的重量,我们的算法的性能将会出现。但在达到0.5,性能也会下降。这是因为两种相似度矩阵的直接结合可能导致一个稳定的社区检测的解决方案。我们可以看到在图2 (b)当我们使用获得的最佳性能 ,在这两个目标是结合最合适。
(一)
(b)
6。结论
POI建议在吸引用户LBSNs发挥关键作用。算法在本文旨在提出优化建议POI类型为多个用户服务。首先,分析了个人的意图POIs根据他们的历史访问数据,和variable-order马尔可夫模型用于预测潜在的POI的类型为用户位置。第二,一定程度的利益被定义为发现POIs的社区和设置根据用户之间的社会联系和旅游偏好。然后结合两种类型的POI信息排名的候选人POIs头n个建议。采用真实数据集的实验结果表明,该算法提供了更好的精度和召回比其他两个典型的POI的推荐算法。然而,算法的性能将受益于进一步研究模型挖掘用户行为的时间信息。此外,加权组合(9)将导致有限的灵活性处理真实数据。由于社区检测与多个相似矩阵的问题,我们计划进行多源扩散模型来保证不同的数据集合管的最大一致性和有效的信息融合。
数据可用性
作者声明数据支持本研究的发现可以在纸上或从作者在合理的请求。
信息披露
这项工作提出了第二国际社会计算研讨会(IWSC 18)。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作由NFSC下拨款61303041,基金重点科技创新团队的山西省,中国,在格兰特2017 kct-29,国际科技合作基金项目下的山西格兰特2017 kw - 015。“Lei唐谢谢LetPub (www.letpub.com)提供的语言援助在准备手稿。”