文摘

随着信息技术的发展和智能时代的到来,旅游业也改变了从传统的情报信息服务。在这项研究中,研究了推荐系统。通过比较各种推荐方法的优点和缺点,选择关联规则算法的推荐方法在本研究中。然后,获得用户的操作行为和个性化的旅游目的地的推荐模型。这个模型是基于用户的访问操作行为数据,并介绍了用户的兴趣度作为一个参数来衡量操作行为数据,形成数据挖掘的基本数据。流行的旅游路线和体重变化的纵向用户兴趣特征引入到算法。用户侧的改变重量感兴趣特征添加到未来的预测目标用户的兴趣。与分类的推荐方法相比,用户可以很容易地找到他们感兴趣的景点信息的指导下风景区的建议。结果进一步验证该模型的研究具有一定的现实意义和实用价值。

1。介绍

随着物质条件的改善,人们对旅游的需求越来越多,同时满足他们的基本生活需求。人们不仅追求一般观光但对个性化旅游的需求也大大增加。由于旅游群体的多样性,资金和时间的限制下,如何选择景点游客感兴趣的往往是一个问题,游客或者旅游营销部门都关注和迫切需要解决1]。通常,在旅游之前,游客将通过互联网搜索旅游信息旅游景点的详细信息,但传统的旅游信息服务已无法满足公众的需求(2]。虽然传统的旅游信息服务可以帮助游客筛选出景点他们需要的信息,流行的和著名的景点经常搜索和推荐,而不受欢迎的景点感兴趣的一些用户很少发现和推荐。目前,游客获得旅游目的地的相关信息渠道多元化,和旅游消费的概念和经验更个性化的需求。受欢迎的观光旅游产品和行业逐渐不能满足游客的需要,但在追求个性化,更有经验,深情的旅游经历。旅游信息化的升级,传统旅游产业的经营模式和管理正在逐步转变为信息化、智慧,和个性化。这充分反映了计算机信息技术的核心位置智能旅游的发展。智能旅游是一个巨大的旅游服务体系,为用户带来了很大的便利,为企业创造更大的价值。无论是独立用户或企业的市场推广的经验,它会被提升。

在这样一个时代的信息和数据,如何使用个性化推荐系统(3为用户提供个性化的旅游信息和解决用户的选择困难的问题在面对巨大的旅游信息个性化推荐的重点在旅游领域的研究。如今,大数据也是一个热点问题。旅游数据符合大数据的特点,和大量的旅游数据混乱和巨大的。使用数据挖掘技术(4,5我旅游数据可以为游客推荐旅游目的地提供参考。数据挖掘的过程是指获取潜在有用的,暂时未发现的信息和价值分析的随机的,巨大的,隐藏的,不规则的历史数据。基本的数据挖掘算法分为以下几类:基于关联规则的挖掘算法,聚类分析6)、分类(7)和回归等。其中,关联规则算法是一种广泛应用于数据挖掘的算法。该算法的关键是如何寻找频繁项集和生成规则。关联规则算法发现隐含的物品从大量数据集之间的关系,及其典型案例是购物篮分析。购物篮的问题描述如下:给用户的购买记录后,有必要找出用户的可能性购买其他商品在购买某种商品。显然,这是找出用户的购买模式,探索潜在的不同商品之间的关系。其目的是为了发现交易数据库中不同商品之间的关系,理解用户的购买习惯。本研究研究旅游目的地的建议基于关联规则的算法。其创新如下:本研究构建用户偏好模型,主要表达了不同类型的旅游目的地游客的兴趣。在风景区的过程中建议,推荐算法学习用户感兴趣的景点根据用户的浏览行为的更新数据。的基础上这些景点,规则应用于形成一个推荐景点顺序与景区用户期望获得的信息。根据每个用户的兴趣变化特点,推荐算法的参数和阈值是动态和单独调整,这就增加了推荐系统的自学习能力,使更多的个性化推荐的结果。在这项研究中,加权值是用来区分不同用户的兴趣,每一个景点,使建议更准确。景区使用收集到的数据,该算法适用于模拟试验和挖掘分析。实验表明,该系统可以提高推荐的准确性和用户的满意度,为用户提供更好的个性化推荐旅游目的地。本研究拓宽旅游推荐算法的研究领域。

根据研究的需要,本研究分为五部分,每一个都是安排如下。

第一部分是介绍。这部分总结了本研究的背景和研究意义,本研究的组织结构和创新。第二部分是相关的工作。本节简要描述了研究现状和国内外旅游推荐的缺陷并导致本研究的研究内容和方法。第三部分侧重于旅游目的地的建设基于关联规则的推荐系统算法。部分3所示。1是理论基础,介绍了相关内容的个性化旅游推荐系统。部分3所示。2提出并构建一个旅游目的地的推荐系统基于关联规则的算法。在第四节中,旅游目的地基于关联规则的推荐系统算法提出了多次模拟,研究结果进行了分析。第五部分是结论。这部分总结了本研究的研究内容,期待未来。

每一个技术创新发展的旅游给我们的生活带来了巨大的变化,技术创新可以为旅游业服务提供更多的可能性。目前,互联网已经成为主要的方式让用户搜索和查询旅游信息。大多数游客通常使用的评分和评价信息在互联网上其他游客作为参考来计划自己的旅行之前。个性化推荐的研究和市场应用国内外旅游路线已经形成,有很多相关的推荐算法和相应的推荐系统。个性化推荐系统能符合现代社会发展的趋势和分析和过滤无用的垃圾信息在信息爆炸的时代,人们为人们提供准确、有效的信息,使人们的生活更方便。

肖等人设计了一个以知识为基础的旅游推荐系统。系统为用户提供他们感兴趣的旅游信息通过用户的操作行为8]。这种方法需要不断地和及时更新知识库来匹配用户的兴趣和模拟人类导游推荐。Iliopoulou等人研究了定量关联规则在大数据环境下基于MapReduce框架(9]。李等人研究了智能旅游信息推送系统基于云平台,提高了协同过滤算法使用Hadoop MapReduce模型下的平台,并最终分析结果向用户推荐(10]。系统包括用户界面,推理机、知识库、动态数据库,和其他地区,是一个典型的专家系统结构。方面的约束关联规则,Arif等人研究了关联规则考虑itemset约束和探索分类关联规则的挖掘基于晶格结构(11]。张等人提出了一个基于旅游推荐系统,逐渐获得了用户的利益,通过互动(12]。该算法提高了推荐结果的合理性和效率。然而,大多数的这些推荐技术依赖于相应领域的专家的评估,并预测用户的兴趣很容易过时,不能完全反映推荐用户真正感兴趣的方向。尤尼斯和Boukerche等人研究了有效关联规则挖掘考虑itemset约束和改善修剪算法挖掘效率的无趣的项集和规则,用户不感兴趣的过程产生频繁项集的每个订单(13]。魏等人提出的推荐方法在线旅游服务14]。Sarkar和Majumder研究时空关联规则的挖掘没有时间限制和执行一个演示应用程序在全球恐怖主义事件的矿业15]。Nitu研究网上推荐的影响消费者的消费决策。研究其他用户的评价信息在互联网上可以影响潜在用户的消费意愿,将最大化消费欲望的潜在用户产品推荐的网络(16]。Arbulu等人设计了一个基于旅游推荐系统。它与用户对话的方式,逐步定位感兴趣的用户在这个进步的地方(17]。这种基于推荐技术可以更好地定位用户的利益,但它缺乏自主学习的功能。Ahmad年代等人提出了一个基于时间框架(行程规划算法18)旅游行程具有多个约束的规划问题(如所示1)。

在线旅游和传统产业的结合已经开始进入一个稳步发展的时期。然而,目前,大多数旅游电子商务网站主要关注网站的功能开发和操作模式。面对信息过载的问题,如何为用户提供更满意的服务和更好的用户体验需要新的方法来解决这个问题。咨询和整理相关文献的基础上,国内外的研究,本研究深入理解和分析旅游业的现状的建议,提出了旅游目的地推荐模型基于关联规则的算法。数据库用户的动态建立兴趣特点和推荐算法的参数和阈值动态调整根据每个用户的兴趣特征的变化,这就增加了推荐系统的自学习能力,使更多的个性化推荐的结果。

3所示。方法

3.1。个性化旅游推荐算法

在大数据信息膨胀的时代,个性化推荐技术逐渐融入不同的电子商务系统和旅游电子商务也是如此。推荐系统在不同领域的应用,旅游推荐已经成为一个重要的研究领域在推荐系统19]。目前,大部分的旅游业是面向组织旅游,但是随着现代信息的快速发展,人们的生活节奏加快,旅游业的发展会倾向于个人旅行,而且它将个性化,以满足个人需求的游客有不同的兴趣,同时提高旅游服务的质量和管理效率。推荐算法的质量直接决定了整个推荐系统的效率,所以推荐系统的研究集中在两个方面:算法设计和算法实现。根据不同的推荐方法,推荐算法一般分为基于协同过滤的推荐、基于内容的推荐,推荐基于用户特征、基于知识的推荐,和基于关联规则的推荐和混合推荐。基于用户的协同过滤是找到类似的用户通过他们的基本信息并生成建议用户根据类似的活动。学者提出的基于内容的推荐是协同过滤的研究和改进。建议根据用户特征只考虑不同用户之间的相似性和差异不会导致建议由于不同类型的项目。知识推荐算法主要需要专家提出相关领域知识从用户的隐式信息或商品的属性。建议将各种算法结合在一起使用。结合不同算法的优势,弥补彼此的缺点,使建议更准确。 The association rule algorithm is a commonly used and classic technology in data mining, and it has been applied in many aspects, especially in the big data environment, which requires data processing and analysis, and the algorithm has been taken out and studied again.

关联规则算法是一种广泛应用于数据挖掘的算法。这个算法的重点是如何寻找频繁项集和生成规则。在关联规则算法的发展,先验的算法和FP_growth算法被认为是最经典的两个代表性的算法(20.]。基本的先验的算法实现相对比较简单,但是时间复杂度也在不断增加。先验的算法的基本思想很简单。如果我们想要发现频繁项集,我们必须先找到所有可能频繁项集的候选项集,然后我们能想到的第一件事是详尽的方法。穷举方法的缺点是明显的,和系统的成本将非常高。先验的算法找出所有频繁项集通常通过连接和修剪。生成候选项集的过程被称为连接,在修剪过程中删除不能频繁项集。先天的加入和修剪是两个步骤的算法。加入产生候选项集,和修剪不能频繁项集的候选项集。

FP_growth算法的主要思想如下:首先是发现频繁项集,然后频繁模式树构造的发现频繁项集,然后频繁模式树分为多个条件数据库,最后的联系信息是开采条件数据库中项集,分别为(21]。FP树算法是一种数据结构基于频繁模式树,直接提取关联规则从这样的树结构。这里,FP树的角色数据压缩,每个事务映射到FP树的路径。因为交易有相同的物品,有重叠的部分;如果有许多重叠的部分,可以大大减少事务的存储空间。与先天算法相比,FP_growth算法只需要两次扫描数据库,从而减少访问数据库的数量和提高一个数量级的执行效率。图1显示的过程中获取和推荐旅游用户的兴趣特征。

关联规则是一种非常重要的知识数据库。挖掘关联规则是找到协会和频繁模式在数据集之间的关系在大量数据信息或网络信息。虽然先天算法明显减少了候选项集的大小在处理数据集,及其运行效果好,和其空间复杂度相对较小,它增加了复杂性和时间无法删除一些组合元素不应该出现在生成候选项集的过程。基于聚合树的关联规则发现算法确实实现效率的改善。旅游路线的兴趣特点主要总结为游客,因为这项研究只关心旅游线路和用户的兴趣特征之间的相关性(22]。是否使用聚合树组织事务,或改善基本的先天算法根据数据挖掘的特点和规则形成的特点,它是成功的。由于随机性、多样性和变异性的推荐的旅游路线,它是主流方法引入其他技术手段和方法的研究旅游路线的建议。使推荐系统推荐旅游路线,更符合用户的实际需要,有必要综合考虑许多因素之前和期间旅游的游客。

3.2。旅游目的地推荐系统基于关联规则的算法

旅游是一个复杂的系统,它不仅涵盖广泛,还涉及很多领域。如何更好地把旅游的多方面的性质与推荐系统需要更深入的研究推荐的方法。推荐系统是矿山信息的用户的需求,然后使用相应的推荐算法找到对象,满足用户的需求,最后为用户提供有用的信息来完成推荐。推荐系统具有以下优点:它把用户变成了买家;为用户提供个性化的服务;并提高了网站的忠诚用户。目前,大多数推荐系统推荐用户基于一个分数。然而,由于项目的多样性属性,用户可以为每个项目的属性有不同的偏好,所以一个分数不能准确计算项目的用户的偏好,但只知道用户的偏好。利息期间提交的用户交互特性”明确的特点”,可以清楚地指导推荐系统,锁定,用户访问,访问时,和什么样的景点参观23]。本研究解决了传统推荐算法的问题,如冷启动、稀疏数据,实时性能低,推荐精度低,构造一个新的旅游目的地的推荐模型。一般来说,推荐系统包含三个重要模块:①用户模块,②推荐对象模块,③推荐算法模块。旅游目的地的推荐系统的结构图如图2

根据抽象的层次结构,关联规则可以分为单层和多层。前者意味着它很容易找出项目之间的相关性在原始数据集和不涉及抽象的物品;后者意味着它是不容易找到的物品或属性之间的关系在底部水平,需要挖掘和数据集在多个抽象级别。在关联规则算法做的第一件事就是寻找关联规则,这也是最耗时的和整个算法的关键。为了减少算法的难度,我们还可以使用离线分析提取规则。在关联规则生成算法,生成的规则有很大关系用户访问序列中的节点的顺序。根据这个特性,结合项目的数量减少。关联规则的算法旨在提高挖掘效率的规则。针对传统方法,提出项目合并和修剪的方法,可有效提高采矿过程的效率,然后快速生成所需的规则。

在推荐系统中,一个有效的建议通常由三部分组成:用户建模、项匹配和推荐输出。用户建模是一个过程,总结了用户模型从用户的历史行为数据和兴趣的记录。用户建模是推荐系统的基础,其模型的质量直接影响推荐结果的效率。权重的方法有两种:直接加权和归一化权重。权重的直接加权是直接添加itemset的物品,但没有规范化。归一化权重归一化在前者的基础上,计算和归一化增加了一个步骤,但最低支持的设置会更方便。产生式规则的过程中,由于大量的数据,生成规则的数量也是巨大的,和有伟大的冗余规则。模型不仅注重历史得分数据,也注重的一代时间分数。因为它实时反映出用户的兴趣偏好,充分考虑最近的邻居相似用户的兴趣偏好的最新时间,很少考虑最近的邻居相似用户的兴趣偏好在前面的时间,以便计算最近的邻居考虑实际利率变化,从而提高推荐质量。

提取游客的兴趣 在景区,假设当浏览图片和文本的风景区 在风景区集 , 是用来表示的来访时间图片和文本,分别。因为相同的吸引力可能会被游客访问多次,每一次访问的时间 ,然后

在一段时间内,如果游客从浏览图片的信息量是两倍,通过浏览文本,图片和文本的加权值可以设置为2/3和1/3,然后,分别

用户的评价计算使用以下算法:

其中, 代表低临界值和的上临界价值综合评价的区间值 th案例属性,分别。 代表的下临界价值区间值给定的文章 th的条 th属性; 代表的上临界值区间值指定的文章 th的条 案例属性。 代表用户评估的数量 指定的区间值。在这项研究中,以下算法用来计算的重量情况下属性:

其中, 代表的重量 th案例属性和 代表低临界值和的上临界价值综合评价的区间值 th案例属性,分别。

在这项研究中,游客提供的个人偏好信息结合的偏好信息挖掘系统。随着游客的行为,该系统将得到更多的反馈。然后,系统构建一个模型根据游客的首选景点信息、游客和景区之间的交互信息。建模完成后,建议根据相关算法。Multi-minimum概率较低的支持允许项目参与规则,和用户的浏览所有景点不能平等的概率。如果设置了相同的最小支持,景点浏览概率较低不能参加规则。当用户感兴趣的景点登录到网站,我们只能推荐景点有高的支持。多挖掘算法不仅满足公众的需要,也考虑小群体的特殊需要。在计算相似度时找到最近邻,系统应充分考虑用户的利益的变化和转换。推荐系统的方法将改变改变用户的利益,和推荐的内容也会相应地改变。 After determining that the user’s tourism destination preference matches the type in the tourism destination model, the cases in the sub-case base of the tourism destination type in the basic case base are extracted. The similarity between the users to be recommended and the extracted cases is calculated using the similarity algorithm of case attributes, the weight addition of case attributes, and the trust degree of case users. In this recommendation model, the recommendation process is divided into two parts: classified recommendation and intelligent recommendation.

本研究定义了垂直加权项集的支持 如下:

其中, 项集的数量吗 是谁的垂直重量 , 是总数加权后的链接: 在哪里 与垂直分量的总数吗 水平加权支持 定义如下: 在哪里 是支持度 顺序如下:

这是作为重量的水平 在这项研究中使用的公式的平均绝对误差如下:

构建聚合树的过程中,如果有相同的节点建立事务路径,节点支持程度将会增加,和附加值将新的事务支持的程度。如果没有建立事务路径中的节点和当前项一样,添加一个新节点,初始节点支持度的值将被设置为事务支持的程度。该算法的伪代码如图3

推荐的旅游路线,历史用户的兴趣特征也考虑在内,同时,当前和历史的兴趣是实现24]。属性评分预测的过程中,不仅需要考虑用户的评级项目属性还评级的用户最近的邻居项目属性,获取目标用户预测评分的未知的东西。传递性的规则,前面的扩张特性,以下术语的扩张特性,它可以发现,只要规则被发现包含相邻频繁闭项集,包含的规则可以推导出不相邻频繁闭项集之间。推荐用户后,需要跟踪他们。每隔一段时间,检查用户是否有新的游记。如果是这样,新的旅游注意内容是否匹配预处理情况下基础的情况下判断;如果匹配成功,这意味着用户采用推荐的内容,和通过的情况下,用户在预处理的情况下基础存储在基本情况基本完成更新的基础。

4所示。结果分析和讨论

历史交互信息的用户可以反映用户的特征的利益在某种程度上,和丰富的历史交互信息的用户包含了隐含的信息,用户的兴趣随时间变化(25]。,以更好地反映算法的推荐效果提出了研究智能旅游目的地,几本节进行仿真实验。案例的表示在这项研究是由旅游需求元素,目的地的情况下用户的游记,和用户级别。旅游网站的有价值的信息是由实验。通过编译的URL信息网站,设置收集规则的URL,并输入URL内容收集所在地,拦截,之前和之后的位置确定所需的内容,和信息的用户,人,天旅行,旅行模式,人均支出等,需要在实验中从指定的网页收集通过设置正则表达式和标签信息,并收集到的信息将被存储在数据库中。在测试过程中,根据景点的数量,我们不断增加景区形成一个比较在不同景点的推荐效果。同时,相同数量的景点的推荐下,系统更新规则库在特定的交易区间,并通过这种自主学习,形成在时间维度的推荐效果比较。数据来自游客的游记旅游网站,从中我们可以得到游客的景点。在获得用户和用户的旅游信息,首先,用户根据情况进行分类用户的偏好的旅游目的地类型在前一节中介绍。根据不同的类别,景区分为五类:自然地貌,历史古迹,文化展厅,民俗,休闲度假。 Five hot spots were randomly selected to study, and the minimum weighted support was set at 0.5, and the minimum confidence threshold was set at 60%. The experimental results are shown in Table2

在本节中,最低支持选为4%和8%,分别和实验效率改进算法与传统算法的比较和分析,分别。图所示的结果4是获得。

在时间维度进行比较,规则是每1000年更新一次访问记录;每次更新是基于事务数据库中的所有事务在当前许多景点,和加权关联规则挖掘算法运行一次,以取代所有的规则生成在前面的时间。验证的有效性目的地推荐算法和推荐系统在这项研究中,最小支持加权关联规则算法和传统的关联规则推荐算法相比,改进的推荐算法提出了研究。通过分析推荐景点的准确率和召回率,得出结论。不同的推荐算法的精度结果如图所示5。不同的推荐算法的回忆结果如图所示6

上述两个数据,从数据分析可以得出结论,这个建议算法的准确率高于其他两种推荐算法,和召回率的推荐算法是最高的。收购频繁项集实际上是一个迭代的过程,和条件树递归构造基于条件模式基础。其中,加权支持度递归术语作为候选频繁项集的支持度。当给用户反馈,8例的例子基本用户的首选旅游目的地类型也选择案例表形式,和推荐算法计算形成为用户推荐。然后,具体建议情况下被发送到用户的前n的覆盖率不同的算法如图7

图的分析6表明,该算法的覆盖率是在一个较高的水平。推荐景点的过程中,类似景区具有类似属性可以包含在规则根据游客的以前的旅行记录和喜好,做出更准确的推荐景点。与最小加权关联规则算法的性能支持,传统的关联规则推荐算法,并在这项研究中提出的改进推荐算法使用F1值和平均绝对误差,测试结果如表所示3

本研究采用先验方法进行处理;即相似度计算在表的例子所期望的旅游目的地类型的数据库用户,然后,总相似病例的结果在表排序和推荐给用户。通过这种方式,用户推荐可以根据自己的情况选择推荐旅游目的地的类型,他预计,为用户提供更全面的建议。来验证算法的性能在这项研究中,选择具有代表性的均方误差与该算法实验,并与其他不同的算法实验结果进行比较,结果如图所示8

从图中的数据可以看出8这个算法的均方误差是在低水平,验证该算法的有效性和准确性。游客的主观满意度获得的平均分数是游客在景点推荐的系统,和客观满意度平均各景点的游客的浏览时间。使用不同的系统推荐旅游目的地,用户满意度的比较如图9

模型的分析表明,推荐精度在这项研究是95.6%,和用户满意度高达94.8%。方法在这项研究中改善和提高传统的推荐方法的准确性和推荐质量,从而提高旅游消费者的经验。随着时间的发展,建议并不能改变太多,但建议是改善的准确性,这表明,该推荐系统可以找到更有价值的用户浏览模式越来越多的交易。随着景点数量的增加,本文推荐的效果会更好,它会表现出更多的优势而推荐类型。肯定有关系的总体评价项目和评价项目的属性。如果一个人不是很满意风景区的方方面面,然后他对风景区的整体评级不会高。只有在高情况下,总分可以很高。

5。结论

传统的推荐技术没有考虑一个分数造成的问题和兴趣迁移,所以推荐性能低,推荐的产品可能不是用户喜欢的产品。基于各种算法的深入了解和分析旅游建议,本研究提出了一个旅游目的地的推荐系统基于关联规则的算法。该算法在本研究中可以考虑不同群体的需求,为不同用户提供个性化服务。同时,本文的规则可以及时更新,并随着时间的推移,景点也将改变用户的兴趣;规则不时更新,以便整个系统符合当前大众兴趣的用户。本研究的算法可以正确地获取关联规则在给定的约束条件下,这在一定程度上提高了算法的效率。通过提出的有限子集的概念,关联规则挖掘频繁项目集的搜索需要约束可以限制在一个较小的子集。通过仿真实验,发现模型的推荐精度在这项研究是95.6%,和用户满意度高达94.8%。该方法在本研究中提高旅游消费者的体验,从而提高和改善传统的推荐方法的准确性和推荐质量。它有一定的理论和现实意义。 This study has achieved some research results and value, but this method needs to update the knowledge base in time and accurately, to match the user’s interest, and to simulate human guides to make recommendations. There are still some difficulties in the implementation process, and the function and security of the system need to be further strengthened and improved. The next step will be to study and discuss these issues in more detail.

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者没有任何可能的利益冲突。

确认

本研究支持河南省社会科学联合会的研究项目“集成开发路径研究大别山地区的文化、旅游下的河南省农村振兴战略”(skl - 2021 - 1008)。