研究文章|开放获取
黄Juanjuan Chen放置黄成梁王,Nijia郑, ”发现旅游时空模式基于顺序事件相似”,复杂性, 卷。2020年, 文章的ID6632956, 10 页面, 2020年。 https://doi.org/10.1155/2020/6632956
发现旅游时空模式基于顺序事件相似
文摘
旅行路线的偏好可以强烈相互作用的事件发生在网络旅游,这是必不可少的共同进化现象在旅游路线推荐提供理论基础和预测集体行为在社会系统。虽然大多数文献将专注于个别景点的路线推荐而不是城市旅行,我们提出一个新颖的方法命名为城市旅游路线推荐基于顺序事件相似(CTRR-SES)运用城市旅游网络的共同进化扩散动力学和我旅行时空模式的网络。首先,我们现在的事件序列相似性测量方法基于造型游客的旅行序列。方法可以帮助衡量相似性在各城市旅游路线,结合不同的景观类型,时间,和相对位置。其次,运用基于景观类型、用户偏好的学习方法我们学习从用户的城市旅游历史数据和计算出个性化的旅游偏好。最后,我们收集数据验证算法的54个城市旅客的历史时空的路线从Mafeng.com最热门的十大城市。CTRR-SES显示更好的性能在预测用户的新城市旅游序列拟合用户的个人偏好。
1。介绍
城市旅游已经成为近年来欢迎游客可能会经历各种食物,文化,习俗,和城市的观点在这个过程中,利用商业服务像好住宿和市内交通(1]。与传统的景区,地理上孤立的,一个城市旅游结合民间资源,各种设施,和风景,这些形式与时空multiplexity市内旅游网络。因素,如城市经济、社会和文化影响旅游体验。他们是共同进化通过高相关性,因此城市风景区复合属性的多个标签。此外,许多的运输方式连接这些城市,地理上集中在城市地区。因此,城市旅游规划具有个性化的特点,灵活性,和发展2,3],这个网络的共同进化传播动态多尺度结构的探索是一个很好的点适用于城市旅游推荐系统。到目前为止,由应用程序和在线旅行社的旅行建议古典路线与排名景区游客的数量或大多数旅行者的首选项。因此,建议不适合每一个游客因为缺乏个性化4]。建模和解决旅游路线规划问题时,大多数报纸调查用户偏好,给旅游路线推荐固定开始和端点(5),不把时空旅行序列,滞留时间,考虑运输方式(6,7]。
因为上面提到的这些问题,本文首先定义了用户旅行序列模型和各种元素参与城市观光旅游计划,然后基于这一模型,我们提出旅游序列相似性测量方法。方法可以帮助衡量各种城市旅游序列的相似性,结合不同的景观类型,时间,和相对位置。其次,聚类分析是进行基于历史旅游数据库。通过使用旅行序列相似性测量方法,我们计算一个人的基准模型游客的个性化的旅游偏好。最后,我们提出一个新颖的方法命名为城市旅游路线推荐基于顺序事件相似(CTRR-SES)。CTRR-SES有助于个人旅游路线推荐给用户的新目的地。推荐的路线更适合用户的偏好,因为他们计算了历史旅游的旅游偏好基准模型和序列数据的用户。
2。研究背景
旅游路线推荐系统为用户提供城市旅游路线匹配用户的喜好,满足用户的实际需求和期望。利用用户的历史数据预测未来生活的核心建立有效的推荐系统(8]。对于电子商务,一些个性化推荐策略可以促进产品的扩散(9]。然而,城市旅游是现代社会的一个新产品安排游客花时间追求娱乐,放松,愉悦在城市。城市旅游是社会媒体文章、热门城市的标志景点。许多类型的研究调查旅游偏好研究旅行者的社交媒体文章和标记数据。基于带有地理标签的照片,一些相关的几个研究地理图像与实际数量的游客(10),一些旅行者的时空行为(11),一些旅游路线推荐系统的算法(12),一些城市的印象和大事件和他们的结合对旅游决策的影响13]。然而,这些论文没有充分考虑新城市游客的特点和他们的旅游偏好序列。因此,他们无法探索城市旅客的独特特征。
大数据对旅游知识生成每天在互联网上和各种平台。大量的结构化或半结构式数据集是由游客分享自己的旅游经验,技能,通过通信技术和移动设备或反馈。在旅游路线推荐算法研究、太阳等人使用知识图来构建旅游数据库通过获取旅游信息从用户提交的内容,代表个性化旅游路线(14]。李等人提出一个新的方法来设计旅游路线供游客参观鼓浪屿通过应用偏好的方法(15]。
然而,这些论文只研究景区的建议,虽然他们不分析点的前后顺序在访客的历史旅游路线。我们认为,连续测量旅游偏好的秩序中发挥着重要作用。例如,序列1代表用户访问城市重庆市作为Ciqikou-Hongyadong-Jiefangbei-Sichuan美术学院——鹅岭公园。用户B的序列作为四川美术Institute-Eling Park-Hongyadong-Jiefangbei-Ciqikou。如果我们考虑景区为纯因素影响游客的偏好,然后很明显给A和B都相同的路线推荐序列。然而,用户A和B访问那些景点在不同的序列,这表明用户更愿意花白天点标记为购物或精美的食物和晚上时间城市景象,然而用户B更愿意访问城市景观在白天,晚上商店。我们相信,旅行路线建议应该不仅包括用户的偏爱风景类型也访问序列和时间段。然后推荐系统可以让用户个人旅游路线匹配他们的个人喜好。
本文构造的吸引力基于城市吸引力的旅游城市偏好模型知识库和用户的历史游览序列。和数据挖掘算法发现这座城市吸引标签集。旅行者的历史旅游事件分析发现集群主要反映旅客的喜好。通过比较各种旅游事件序列的相似之处,我们的目标是提供高度个性化的旅行建议,满足旅客的实际需求。
3所示。预赛
问题陈述前,我们给这些概念的定义如下。
定义1。(吸引 )。代表城市的地方游客之前访问过的或感兴趣的,它可能是一个自然景观,叉文化、历史景观,城市风景,或消耗的地方。
定义2。(吸引标签 )。鉴于作为一个城市的吸引力,我们定义的标签作为一个序列 。
定义3。(旅游历史 )。鉴于作为一个城市的吸引力,旅行史给出一组吗 ,在这随着时间到达和离开的时间。
定义4。(游览序列
)。我们将游览序列定义为一个按时间排序的用户访问多个城市景点顺序,给出
。在哪里n代表总数的景点参观。访问两个相邻景点的时间间隔不超过一个阈值,表示
。考虑到城市旅游的特点,我们设置一个合理的时间间隔的阈值为1小时。
根据上面的定义,我们定义我们的城市旅游线路推荐问题如下。考虑到用户的历史访问序列的集合
,输入历史巡演序列集合
的用户,一个表示他/她游览序列的总数。然后输入城市b。我们的目标是确定最佳个性化城市旅游路线为用户推荐旅游序列集的城市b给出的策略如下:(1)学习从用户的历史城市观光序列,识别用户的城市旅游偏好模型(2)基于所有旅游序列在特定城市和用户的旅游偏好模型,确定最佳个性化城市旅游路线为用户推荐
4所示。推荐算法
城市旅游的建议是具有挑战性的,以满足游客的偏好和实际需要旅游访问一个新城市时。迎接这一挑战,我们提出一个新颖的方法命名为城市旅游路线推荐基于顺序事件相似的相似之处(CTRR-SES)通过测量不同城市旅游路线在给定和学习从用户的历史城市游览序列。
4.1。旅游路线推荐框架
有三个构建块在我们CTRR-SES,显示在图1旅行史/序列建设,景区基于类型用户首选项基线造型,和路线推荐系统。旅行史/序列建设和用户首选项基准模型处理离线学习。通过分析用户的开放旅游的帖子,我们可以获得用户的历史城市游览序列。然后我们可以计算的基准模型使用聚类分析旅行史。路线推荐在线处理。首先,CTRR-SES计算特征向量代表用户的旅游城市旅游历史序列的特征和喜好基线模型。然后推荐游览序列最相似,匹配用户的个人偏好从现有旅游序列。
4.2。旅游知识库和旅游建设序列
我们使用数据挖掘技术,构建旅游知识库获取大数据平台和百度一样,Mafengwo, TripAdvisor和预订。景点信息由属性名称、地理位置、类型和等级,等等。每个景点也贴上以下一个或多个类别,即。,city park, garden, arboretum, natural landscape, architecture, church, temple, museum, college campus, historical sites, food and beverage, shopping site, amusement, art performance, etc. City tour transportation modes include Taxi, Bus, Subway, and Walk. Learning from the user’s past space-time trajectory, travel sequences are generated by consecutively extracting data of geographic position, attraction label, visit duration, transportation mode, and time spent in transportation.
4.3。用户偏好基准模型学习旅行
4.3.1。旅行序列相似性度量
旅游序列相似性测量是通过适当的算法就像多个序列,然后推导相似集群。在本文中,我们目前的旅游序列相似性测量方法使用Needleman-Wunsch(西北)算法。此外,我们改进了传统NW得分函数算法通过整合时间信息。
定义5。(景点游览历史相似性 )。鉴于作为一个城市的吸引力, 和 旅游中两个变量序列 。之间的相似度公式和给出如下: 表示两个POIs之间的相似性,表示时间访问这两个点之间的相似性。和不同的权重穿上吗和 ,可调节的敏感性和 。 ; 和是定制的分数。
定义6。(旅行序列相似性
)。给定两个旅行序列
和
,相似度评分
的
和
计算如下:
我们可以计算旅行序列相似性得分矩阵m .标准化的数据在过去的行和列的矩阵生成两个旅行序列的相似性得分和
。算法在算法的伪代码1。
运营使用迭代的方法来计算两个序列的相似性和通过比较序列中的每一项。那么相似的值存储在二维矩阵m .如果两个序列的长度不相等,然后添加一个空间差距让他们平等。第一个6日线路运营初始化相似矩阵,和7日18行进行相似度计算和填写矩阵。米(我][j代表两个对应项目的相似性和
,的价值是由价值决定的米(我−1][j),米(我][j−1]米(我−1][j−1]。方程(2)是一个迭代公式和提供三个路径计算的值米(我][j),其中选择最大值:(1)从上面获得的垂直线米(我][j]。序列和比较,那么假设l1′和l2在比较′生成。的细胞米(我][j从上面)相当于添加相应的项目来l2′和添加一个缺口
。因此,的价值米(我][j)是米(我−1][j)+d2。(2)获得从左边的水平线米(我][j]。(1)一样,到达的细胞米(我][j从左边)相当于添加相应的项目来和添加一个缺口
。因此,的价值米(我][j)是米(我][j−1)+d2。(3)获得的对角线米(我][j]。通过添加相应的项目来并添加相应的项目来
,我们可以计算的相似度值米(我−1][j−1)+W(l1(我),l2(j])。当我th POI标签l1是重叠的jth标签l2的计算W(l1(我),l2(j)写在10号至12号线运营;否则,该值W(l1(我),l2(j)=d1。PSA的伪代码(点相似性算法)在第十行和TSA(时间相似性算法)在11线给出了算法2和算法3,分别。
第一行的算法计算的交点风景两个POIs的标签。第二行措施的百分比加起来的所有标签的一个十字路口,它作为两个POIs的相似度值。
在第一行的算法,我们半个小时设置为一个单元,然后建立基于它的时间轴,时间范围在两POIs由两个数字序列表示。第二和第三行算法的最长公共子序列(LCS)算法应用于寻找最长的子序列存在于两个数字序列。LCS可以使用动态规划解决由最初的问题划分成子问题。相似的时间最长公共子序列的长度的比值序列的长度。
|
|
|
4.3.2。旅行序列聚类
的K算法则是一种最流行和广泛使用的聚类方法由于其简单性,健壮性和速度。它是一种迭代算法的意义,我们每次都重复多个步骤取得进展。许多聚类算法,K——也比较出名的是它的健壮性和非敏感噪声和孤立点。K则算法可以处理不同类型的数据集和发现集群与输入数据的顺序无关紧要。因此,本文采用K——旅游序列聚类分析算法。
(1)聚类算法描述。K算法则分区数据集,包括数字n数据,为K的集群。集群的定位是点,所有观察结果或数据点与最近的集群相关联,计算,调整,然后开始过度使用新的调整,直到达到期望的结果。旅游序列聚类算法(污染)中给出的算法4。
|
K集群和包含一个序列K聚类质心算法可以获得的4。因为每个序列反映了旅游者的旅游偏好,基数将大当添加这些序列。考虑质心具有伟大的解释价值的意义,所以我们设置包含数字的序列K聚类质心的旅游偏好基线模型。
(2)序列聚类的性能评估。更新平方误差的总和(SSE)和轮廓系数(SC)用于本文评价聚类的性能。指标1:上交所上交所技术旨在找到平方误差的总和质心的采样点。从理论上讲,上交所越低,那么更好的聚类性能。本文计算序列相似性度量,而不是旅行的距离测量为基础的聚类。因此,更新SSE旨在找到相似的和采样点的质心。因此,更新SSE越高,从理论上讲,集群的性能越好。指标2:SC
使用均值的星团内轮廓系数计算的距离和平均距离最近的集群为每个样本在d .澄清,是一个样本之间的距离和最近的样本不属于集群。这个计算公式如下所示:
SC值范围从−1 - 1和1意味着集群显然彼此分开,是有区别的。相反,当更新的SC值接近−1,集群的性能更好。
4.4。旅游线路推荐
旅游路线推荐需要用户输入他或她的城市旅游历史序列和一个新的目的地b用户的旅游偏好是根据历史序列之间的相对距离和首选项基准序列。我们计算城市旅游历史序列之间的相似性和偏好基线模型,最后计算K维特征向量代表用户的旅游偏好,在其中K代表聚类的数目。因此,我们定义用户旅游偏好如下。
定义7。(用户旅游偏好
)。给定一个用户的旅行史或序列
(n是旅游序列)的数量和偏好指序列
,旅游偏好的指示K维向量如下:
同样,每一个旅行史或在城市B可以表示为一个序列K维特征向量,我们可以找到匹配用户的旅游偏好的向量相似度最高的。这是说,那是旅游的建议提交给用户,因为旅游序列特征向量所代表的满足用户的旅游偏好。余弦相似度(方程(5)是一种常用的方法,我们用这个指标来衡量特征向量的相似性:
旅游推荐算法在序列的算法5。
在第一行的算法中,我们使用污染旅游历史所有用户的聚类分析。序列包含数组newMedoids商店K集群质心(K随着集群的数量)。在第二行中的第七行算法,计算用户的旅游偏好,和K维特征向量存储在一维数组userpre。从八到十二行,每一个旅行史或序列在用户的目的地城市可以表示为K维特征向量,这是存储在大小米
k二维数组cityseq (m总数的所有历史序列在目的地城市)。在14到19行,我们使用余弦相似性函数CosSim在cityseq找到特征向量匹配用户的旅游偏好向量相似度最高的。结果都是旅行的建议提交给用户。
|
5。实验和评价
有各种各样的观点基于社会网络数据的推荐系统通过考虑各种推荐算法的使用。在我们的实验中,有六个步骤生成数据集,显示在图2。从社交媒体网络爬虫收集旅游时空数据,旅行社网站,和导航应用。我们选择10个城市(重庆、成都、北京、上海、西安、杭州、南京、天津、广州和武汉)在这些城市和景区分析样本旅游者的旅游历史序列,显示在图3。我们进一步比较旅游景点的风景标签与知识库(表示TAKB)使用自然语义匹配技术和人工过滤。在每个城市,20个景点选择形成了城市旅游知识库。最后,我们把旅游序列数据集作为训练数据的70%和30%测试CTRR-SES算法。在接下来的实验评估,我们随机选择不同的用户进行测试。
验证CTRR-SES,实验设计的基础上,收集旅游数据。
5.1。旅游路线推荐算法的准确性和验证
5.1.1。的价值的影响K旅游偏好基准模型
的价值K执行K——聚类算法对实验结果有很大的影响。因此,我们运行的固定K多次值并使用更新后的上交所和SC的均值来确定最优值。显示在图4,当K值是大于4,上交所的增长率下降。增加的价值K导致增加的价值 。接下来,我们的相似程度,设置为推荐准确率。特征向量的推荐路线和相应的路线在测试数据集时使用相似性函数计算K= 2、3、4、5、6(实验结果如图所示4)。酒吧展示,推荐准确率最高的时候K= 4。因此,在接下来的实验中,我们设置的值K= 4。
5.1.2中。推荐序列和原始序列的长度比较
原来的路线的序列长度的测试数据集,推荐路线计算和比较,如图5。与序列长度的路线,一个小错误的实验结果证明,我们的算法验证其准确性。
5.1.3。命中率
命中率给出的公式:
在方程(6),在推荐的路线景点的集合,然后呢是用户的旅游景点的历史序列。命中率越高表明更好的推荐我们的算法的性能。然后我们计算路线推荐的准确性。实验结果命中率0.70,进一步验证CTRR-SES,证明该算法将提供城市旅游路线建议有效地匹配用户的偏好。
5.2。旅游路线推荐算法的鲁棒性
为了测试CTRR-SES的鲁棒性,我们设计以下实验,如表所示1。随机改变一个或多个序列在用户的历史城市游览序列,和实验结果就像最初的结果详细的图6。因此我们的算法具有良好的性能的鲁棒性和稳定性。
6。结论
现有的旅游建议研究很少分析用户行为与不同粒度计算时空序列相似性。缺乏全面了解multigranularity和multiperspective行为事件,这些研究不适合深入发展的需要城市旅游路线建议。我们采用共同进化动力学传播旅游偏好和事件的相关性在城市旅游网络和探索城市旅游推荐系统中的应用。基于定义用户的游览序列模型,首先,介绍了事件序列相似性测量方法,计算时间的加权平均数,相似性在一定粒度测量空间,活动时空序列相似性。接下来,我们设计CTRR-SES通过应用用户的旅游偏好基线学习模型来研究用户的城市旅游历史数据和计算个性化的旅游偏好。最后,我们的一系列的实验验证了算法的有效性和可行性,和CTRR-SES节目更好的性能在预测用户的新城市旅游序列拟合用户的个人偏好。我们的工作提供参考和指导研究multigranularity时空序列相似性问题城市旅游路线的建议。然而,只有54个真正的情况下选择评估CTRR-SES算法的性能,我们将包括更多的实验和数据集验证在未来的研究工作。
数据可用性
旅游历史数据用于支持本研究的发现已被存入Mafengwo.com存储库。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作是由中国国家自然科学基金支持下批准号61672115和2020号项目cdcgjsj040基础研究基金支持的中央大学。
引用
- 朱y、y . g .邹和l .陈”分析基于UGC的城市旅游流的空间特征数据采集上海作为一个例子,“旅游论坛,12卷,不。4,33-41,2019页。视图:谷歌学术搜索
- l·李和y,Android城市导游系统基于web服务,2012年。
- 郭y和h . Liu”嵌入智能城市和旅游的融合物联网在中国发展的角度来看,“酒店和旅游研究的进展,卷2,不。1,54 - 69年,2014页。视图:谷歌学术搜索
- m·d·Aswale”推荐的个性化旅行调查序列,Ijarcce》第六卷,没有。1,第113 - 108页,2017。视图:出版商的网站|谷歌学术搜索
- 陈j .黄y, y, c .贾”的动态推荐POI序列响应历史轨迹,“ISPRS国际信息杂志》上,8卷,不。10,433年,页2019。视图:出版商的网站|谷歌学术搜索
- 江,x钱、t·梅和y傅,“个性化旅游序列推荐多源大社交媒体,”IEEE大数据,卷2,不。1,43-56,2016页。视图:出版商的网站|谷歌学术搜索
- w·Worndl a Hefele d·赫尔佐格,“推荐一系列有趣的地方旅游,”信息技术和旅游,17卷,不。1,31-54,2017页。视图:出版商的网站|谷歌学术搜索
- 陆l .郑f . z, c . t . et al .,“封闭的光谱单位:造型共赢模式顺序建议,“市立卷,2019年,第1080 - 1077页,2019年。视图:谷歌学术搜索
- j·h·w·王,问:h . Liu梁et al .,“共同演化复杂网络传播,”物理的报告卷。820年,1-52,2019页。视图:谷歌学术搜索
- k·h·林,“基于用户兴趣的推荐旅游和名胜古迹的带有地理标签的照片”,2015年。
- t . Kurashima和t .岩田聪”,旅游路线推荐使用带有照片分享网站,“CIKM,10卷,第588 - 579页,2010年。视图:谷歌学术搜索
- h .阴和c .王“旅行挖掘和推荐的带有地理标签的照片”,2012年。
- m . Thenmozi和s . Harshitha“一个旅游推荐系统框架开发的带有地理标签的照片”,2016年。
- w . p .太阳,l . Chang c . z本et al。”旅游路线推荐基于知识图和频繁序列挖掘,”计算机科学,46卷,不。2,56 - 61,2019页。视图:谷歌学术搜索
- y, j·h·谢,l·c·杨”的偏好分析旅游景区的选择:偏好的方法,”旅游论坛,33卷,不。12日,第98 - 88页,2018年。视图:谷歌学术搜索
版权
版权©2020 Juanjuan陈等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。