一个智能推荐系统的数据分析使用机器学习

文摘

近年来,选择一个合适的酒店的位置和预订住宿旅客已成为一个关键问题。在线酒店搜索一直以非常快的速度增加,变得非常耗时的由于存在大量的在线信息。推荐系统(RSs)正因其决策的意义和重要性提供所需的产品或服务的详细信息。收购酒店建议在处理文本酒店点评,数值,选票,评级,和数字视频的观点变得困难。生成正确的建议,我们也提出了一个智能方法处理大型异构数据实现潜在客户的需求。协同过滤(CF)的方法是最受欢迎的RS技术生成的建议。我们提出了一种新颖的CF推荐方法经验性情绪分析是用来实现酒店由极性识别特征矩阵。我们的方法结合了词法分析,语法分析,语义分析来理解人气酒店功能和客户类型的分析(个人、家庭、夫妻等)。拟议的系统建议酒店基于个性化推荐的酒店功能和客户类型。发达系统不仅有能力处理异构数据使用Hadoop大数据平台也建议酒店类根据客人类型使用模糊规则。 Different experiments are performed over the real-world datasets obtained from two hotel websites. Moreover, the values of precision and recall and F-measure have been calculated, and the results are discussed in terms of improved accuracy and response time, significantly better than the traditional approaches.

1。介绍

在现代的时代,先进的网络技术,推荐系统(RSs)已经转向了商业社会的注意,普通人对本身由于其意义和重要性在优越的电子商务和成就客户的批准。如今电子商务被认为是强连通到客户的满意度,和一个最终的成功总是依赖于客户忠诚度。相同的在线预订,预订系统是旅游业的重要组成部分。马里安尼et al。1]讨论了最强大的和受欢迎的产业对GDP总量产生重大影响的世界经济是旅游业。世界各地的游客总是在寻找最佳酒店居留期间的旅游使推荐系统作为他们的主要选择获得最好的酒店选择网上预订之前抵达目的地,以避免任何未来的住宅问题酒店。

刘等人。2)已经讨论了,在最近的过去,一些推荐系统是为了方便游客得到酒店建议前预订的列表。最本质的互联网和网络上的数据异构成为推荐系统的障碍,因为传统的推荐系统处理的数据只有妥协酒店推荐系统的性能。复杂数据的多种形式如数字、文本和视觉效果需要开发人员的关注,开发推荐系统处理数据的异构性。李等人。3)注意到,最近市场上很少有推荐系统有能力处理异构数据中使用评级获得客户的反馈,但不包括评论、投票,排名和视频从社交媒体上可用的用户反馈意见。在建议的方法,我们也使用多样性的用户反馈的选票和YouTube视频等观点。我们建议的推荐系统给双重的新奇和优势;首先,它使用一个酒店特征矩阵推荐一个合适的酒店用户的基础上定量(数值)和定性(文本)功能通过使用机器学习分类来实现真正的建议;它矿山用户上下文信息和从评论中提取的情绪通过分析其他旅行者的评论一起,票,和YouTube视频视图来提高推荐精度。第二,模糊模块提供的建议酒店在特定类型的用户如独奏,家庭,事业,朋友,夫妇因为建议将不同的基于用户访问和用户偏好的类型。对于一个家庭来说,像“房间”,“食物”和“清洁”设施是主要的偏好为一个客人,但设施“池”“温泉”,和“健身房”可能有一个更高的偏好。类似的“无线”和“计算机”的用户可以是一个重要的特性是出差。

张与毛4)建议,推荐系统开发实现真正的和相关的建议。相关推荐意味着推荐是根据客户的偏好和选择。通常,推荐系统使用客户评级和评论从之前的数据考虑酒店的属性或特征。因此本文的主要挑战就是开发一个智能的方法流程,分析大型异构网络数据实现真正的酒店推荐相关客户的选择。

在处理不同性质的数据在我们的multifeature酒店推荐系统面临的主要挑战是意见挖掘/情绪分析用户的评论来计算一个极性的分数代表的相似程度或dislikeness酒店由用户。通常一个典型的推荐银行之前用户的评级对酒店的属性或特征,但我们建议推荐也使用评论,数值秩选票,和视频的观点采取用户的真实结果multitype反馈。极性分数提供了一个文本的用户意见的一个特定的酒店。处理异构数据的多样性提出了方法使用数字数据以及文本数据、大数据解决方案包括使用Hadoop在我们的方法,因为它有效地处理数据的异质性和数据多样性的一个更好的方法。我们有客人类型定义(个人、家庭、商业、朋友和情侣)作为本研究的主要部分。我们将不仅考虑不同等级参数,还应用功能情感分析基于用户的评论。例如,旅行顾问允许旅客对酒店等几个选项如位置、房间,清洁、服务和人员。从文本中提取的观点评论的过程称为情绪分析/意见挖掘。

目前有许多研究在文献中执行与最先进的方法来处理评论情感分析提供建议。机器学习分类是一个最有用的技术分类文本转化为积极的情绪分类,消极或中性的类别。在机器学习技术,训练和测试数据集是至关重要的。训练数据集用于学习文档,测试数据集是用于验证性能。有四个主要类型的机器学习分类评价如表所示1。


不。	机器学习方法	描述

1	监督式学习	它使用以前的数据作为输入变量来预测最可能的输出值为新数据,根据这些协会从以前的数据集。 (我)回归是一种预测建模技术对因变量和自变量之间的关系。 (2)分类的技术算法学习从数据输入给它,然后使用这个学习分类和产生新的观察。
2	无监督学习	它使用无标号数据没有历史标签训练算法。目的是找到一些在它通过研究数据结构。 (我)集群组一组对象,这样的对象在同一组更类似于对方在某些方面要比其他组。 (2)降维之前删除无用的数据分析。这是用来去除冗余数据和异常值。
3	强化学习	(我)使用这种方法,该算法通过试验和错误发现试验产生最好的回报。 (2)通常用于游戏、导航和机器人技术。
4	深度学习	(我)深学习有助于训练计算机处理不明确的问题。 (2)深入学习和神经网络在语音和图像识别应用中经常使用。

在数据分析领域中,机器学习是一块称为预测分析的一部分。机器学习算法并不是一系列流程连续执行产生一个预定义的输出。而是一系列过程旨在“学习”模式从过去的事件和构建功能,可以产生良好的预测,在一定程度的信心。

机器学习based-sentiment分析或分类用于分类和为用户提供建议。在监督机器学习技术,两种类型的数据集是必需的:训练数据集和测试数据集。自动分类器学习文档的分类因素从训练集和分类的准确性可以使用测试集评估。监督机器学习技术的关键一步是特征选择。分类器的选择和特征选择确定的分类性能。

我们的推荐系统的主要目的是提供意见和建议,是真正的根据客户的偏好和选择。科伦et al。5)都集中在质量的建议。作者建议,当大量的用户评分和评论是用来处理提供有效和正确的建议,建议质量显著重要的(6]。通过网上预订系统和推荐系统增加了近年来,和跨国组织在这一领域工作的最大优势。推荐系统(RS)不仅帮助客户找到合适的酒店,还在所有领域中,例如电影,书籍,和其他各种各样的不同的产品和项目。不同类型的数据,即。,hotels, movies, and music, can be processed by RS. The generic recommender architecture is presented in Figure1。谢长廷et al。6]详细解释,不同的推荐系统使用不同的方法和算法,使用客户的以前的数据包括评论和评级的不同的产品来获得真实的建议。伯克(7讨论了关于不同类型的推荐算法。它解释说,有两个推荐技术。首先是协同过滤(CF),另一种是基于内容的过滤(CBF)。混合这两种算法称为混合过滤。

小树枝等。8)解释说,最广泛的协同过滤推荐系统过滤技术;然而,用户的偏好和选择提出了相关点的基于内容的推荐系统。CF的作品收集用户评级项目在给定域和计算用户或项目之间的相似之处,以提供相关建议。Ekstrand et al。9精心设计,协同过滤使用一个类的方法和使用偏好的其他用户,他们表达了相同的项目推荐项目活跃用户。这种技术也可以是有益的在其他领域客户的偏好可以随机变化。

协同过滤算法的两种,即。,item-based recommender system and user-based recommender system. Item-based recommenders compare item similarities, and the user-based recommenders instead compare user similarities in the recommendation process.

据张et al。10),协同过滤(CF)为基础的方法是一个非常成功的在所有RSs技术。论文(11,12]haev报道,有三个基本CF方法如所面临的挑战(我)冷启动挑战崛起,一个项目出现之前没有额定,建议不能为它或者当一个新用户没有任何预先录制的资料出现(13,14](2)稀疏挑战出现时也有大量物品,但少评级值可用在初始阶段的推荐(11,14](3)可伸缩性挑战出现在用户和项目的数据非常大的过程(11]。

大部分的推荐系统的冷启动问题,因为用户通常不提供足够的评级酒店,使基于协作过滤推荐,这可能导致一个问题称为冷启动问题。我们提出了酒店的推荐系统,矿山上下文信息和情绪从评论和建议旅客的名字酒店根据自己的偏好,通过分析其他旅行者的评论和评级值,排名,票,和YouTube视频视图来提高推荐精度。经验性情绪分析解决这个问题通过考虑四种类型的上下文:(i)的客人类型,可以“业务”,“夫妇”“独奏”,“集团”和“家庭”;(2)酒店名称;(3)位置;并对不同的酒店(iv)评级。我们使用的方法,协同过滤技术聚合与情感分析,提供个性化的酒店推荐。经验性情绪分析计算出每个句子的极性检查发现它的分数有效解决冷启动问题,提高准确性。

同样,无法想象一个手动整理成千上万的评论,客户支持对话,或顾客评论,因为有太多的数据可用的酒店过程。情绪分析允许处理数据规模的一个有效的和具有成本效益的方式改善可伸缩性问题。基于机器学习的情绪分析或分类用于分类和为用户提供建议。在分类技术,系统学习从数据输入给它,然后使用这种学习分类的新建议。在监督机器学习技术,两种类型的数据集是必需的:训练数据集和测试数据集。自动分类器学习文档的分类因素从训练集和分类的准确性可以使用测试集评估。监督机器学习技术的关键一步是特征选择。分类器和特征选择决定了分类性能。一些研究人员介绍了另一种方法称为基于集群的方式(6,11,15]。基于聚类的协同过滤减少了计算时间和只关注时间效率改进的聚类阶段执行离线。

的主要思想是建立一个推荐系统,帮助用户找到酒店根据自己的偏好和选择使用以前的用户的评论和评级。由于广泛的web数据的可用性,主要问题在处理成千上万的项目及其相关信息的存储和时间效率。为了解决这个问题,一个睿智而有效的基于项目的协同过滤推荐系统提出了使用Hadoop平台NoSQL数据库来提高性能和效率在处理大量的酒店数据。我们也进行了各种试验的Hadoop实现性能提升改进推荐解决可伸缩性问题的响应时间(11]。

先前的研究缺乏真正的推荐的准确性。不准确的原因是使用只有喜欢和评级等定量数据,忽略了用户反馈的定性方面,挑战前推荐的精度的可靠性。这里提到的这两个方面是很重要的相似的用户可以为我们提供真实、准确的建议。因此有必要考虑定性和定量两方面multitype用户反馈的推荐。相似的定性和定量两方面可以通过使用不仅评级,而且文本评论、投票和视频的观点没有被前面的方法。其他一些差距和偏差也列在下表中2。它表示在前面的方法和我们的方法的差异。


源	Multitype反馈	评级	评论	票	视频的看法	极性的分数	Tf-Idf	模糊逻辑	多数据源

(4]	✓	✓	✓	✕	✕	✕	✕	✕	✓
(6]	✕	✓	✕	✕	✕	✕	✕	✕	✕
(16]	✕	✕	✓	✕	✕	✕	✕	✕	✕
(17]	✓	✓	✓	✕	✕	✓	✕	✕	✕
(18]	✕	✕	✕	✕	✕	✕	✕	✓	✕
(19]	✕	✓	✕	✕	✕	✕	✕	✕	✕
建议的方法	✓	✓	✓	✓	✓	✓	✓	✓	✓

该系统能够存储大量酒店有效数据,并提供改进效率的建议。本文打算提供四个主要贡献如下规定:(我)该推荐系统有助于实现真正的酒店建议通过大型异构网络数据的处理与分析,即。,both ratings (numerical) and reviews (textual) using opinion mining approach and fuzzy approach to produce relevant recommendations according to customers’ type and choice(2)开发一个基于web的酒店推荐推荐集关联数据的外部资源(酒店网站)包含酒店网上的信息(3)该方法优化了性能提出了酒店推荐系统在Hadoop环境中使用NoSQL卡桑德拉数据库(iv)从两个不同的来源获得的数据集(网站)等TripAdvisor.com和Expedia.com

我们使用经验性方法用于文本分类为三个情绪表情如“积极”“负面”和“中性”的帮助下SentiWordnet Wordnet字典。有许多挑战出现在处理评论和提取特征的文本的评论。的一些挑战如下:(我)处理大数据包含的文本评论描述酒店的人给出的意见(2)随意的非正式语言,缩写/ emoji /俚语,或使用表情符号的发信人(3)拼写错误/输入错误(iv)模棱两可的评论的一个客户,例如,我从来没有住在一个酒店很喜欢这个!模棱两可:我们无法理解是否酒店是最好的或最坏的打算(v)评论包含标签(vi)检测极性隐藏情绪的一个客户在一个给定的审查

剩下的纸是进一步组织和结构化如下。相关工作和盟军一节中描述的概念2。讨论了协同过滤推荐系统来弥补以前的工作。一般推荐模型也解释道。设计一个酒店推荐的方法是解释部分3。它解释了该酒店推荐组件。初步的实验测试的详细描述和训练数据集提出了部分结果4。系统还提供了在同一节概述。建议的方法的比较分析与先前的研究提出了部分5。结论和未来的工作提供了部分6。

之前的推荐系统相关的工作将在本节中讨论。先前的研究描述了信息过滤等相关概念的硬伤和推荐算法之前用于开发推荐系统(20.),帮助理解和实现的需要推荐系统在现代网络技术的时代。

2.1。推荐系统

推荐系统帮助最终用户发现他们正在寻找的产品和服务。谭,他(13)提出了一个物理谐振过程,叫共振相似(RES),作为一种新颖的方法。这部小说相似性提供了优越的预测精度相比传统的相似性措施用于用户的评价。Fasahte et al。21]讨论了未分级的项目可以通过使用不同的建议,并预测滤波技术,他们使用的旅行顾问的数据集进行了实验。此外,他们提出了混合方法使用额定数据和文本内容来预测用户行为。克雷斯波et al。22]讨论Sem-Fit使用客户体验的观点,以模糊逻辑方法适用于客户和酒店相关的特性,通过领域本体和影响网格表示。胡锦涛et al。(23)测量了细度评级预测和评估性能的上下文意识到个性化酒店(CAPH)推荐使用评级和评论的旅行顾问的数据。

黄等。24)使用基于语义的旅行顾问审查潜在狄利克雷分配(LDA)方法执行酒店评论酒店管理系统和获得的性能术语Frequency-Inverse文档频率(TF-IDF)方法。作者用酒店的所有类型的特征和得出结论,基于LDA方法LDA方法相比具有较高的精度。Sandeep et al。25)执行twitter社区情绪分析获得实时的情绪老百姓代表现有和潜在的客户。该方法使用twitter monthwise情绪得分散列标签的印度电信运营商成功预测增长率的订户。孟et al。26]提出的方法称为的卡萨(关键词意识到服务推荐)实现在Hadoop和云的大数据分析评论提高时间效率和可伸缩性大数据项目(27,28]。

结合跟踪和浏览的文本挖掘技术是用于开发个性化的酒店推荐林et al。29日]。一个有用的随机规划模型,运用多元回归分析的目的是降低消费者的搜索成本Rianthong et al。30.)结果表明,评估评级、价格和实用的酒店需要采取上面的序列。拉尔和Baghel31日]探索情绪最相关的和至关重要的功能分类和组分为七类,命名为基本特征,种子词特征,TF-IDF, punctuation-based特性,填空题型可以特性,字格,POS词汇。Sharma et al。17使用客户的评论和喜好booking.com确定酒店评级使用前用户的数据在多准则评论基于推荐系统的方法和NLP技巧。Chang et al。16)假设酒店周围环境的建议。CATPAC(内容分析程序)是用于分析用户的评论和评级,SPSS(社会科学统计软件包)被用来分析用户的评级与回归分析和方差分析(方差分析)来检查客户忠诚度。

Jannach et al。32)在利用回归方法和基于项目的推荐系统模型准确的建议。易卜拉欣et al。33)提出了一个个性化的智能信息模型研究酒店服务。布拉绸和Tsogkas34)使用用户聚类词网络赋能k - means算法推荐改进新闻文章。陈和壮族(18)优化无处不在的酒店推荐系统的性能通过使用非线性酒店数据集和模糊的编程方法。Fasahte et al。21)Lexicon-based方法用于识别情绪对酒店的方面定义的上下文内,他们还解释了未分级的物品可以用于推荐使用基于项目CF技术。评级数据从用户的评论和评级数据的用户的混合推荐方法用于分析用户的行为。Valcarce et al。35)使用卡桑德拉的平台分布式大数据建议应用程序和MySQL集群进行比较。

用户之前的数据在不同的产品和食品,如酒店、书籍和文章都是聚集在系统使用协同过滤算法。Rankboost算法和基于集群的协同过滤是休谟提出的用于开发一个酒店的推荐系统,就11建议根据用户自己的选择)。定量和定性的分析,从获得的数据hoteltravel.com。

有很多推荐系统是由研究人员和开发人员使用的协同过滤算法和技术(36- - - - - -42提供推荐服务。协作和基于内容的过滤使用用户的知识来计算与其他用户的关系和执行某些减免在特征空间19,43]。本文提出酒店推荐系统是高效的,有些桥梁使用酒店的差距使用自然语言观点挖掘分析特征提取。

Nilashi et al。44)使用PCA-ANFIS(主成分Analysis-Adaptive神经模糊推理系统)和EM(期望最大化)来开发一个推荐系统,实现他们在旅游领域基于多准则协同过滤技术。TripAdvisor网站进行试验得到数据,实现高精度和高时间效率的推荐酒店。Phorasim和Yu (45)使用k和协同过滤的方法则导致更精确的和更少的耗时的建议比现有的传统。Kogel [46)讨论,实时获取相关建议,使用模型驱动的软件工程方法,从不同来源收集数据并结合。做et al。47]调查常见技术实现基于模型的方法,实现高精度。等,(48)建立了一个混合的推荐模型的电影推荐使用情绪分析火花的平台上优于传统模型的各种评估标准。

3所示。提出酒店推荐系统

该系统使用数据的异构性质(文本和数值)爬在万维网(www)。数据来自所选酒店网站(数据源)包含关键字出现在活跃用户搜索查询。网络爬虫是用来下载请求的数据,并将获得的数据存储在NoSQL数据库卡桑德拉进行进一步处理。数据通常以数字的形式(如投票,排名,和数字视频视图)和文本(如评论和注释)。要得到真正的建议,我们的系统已经使用,票,和评论数据提取酒店特性。

该系统在两种并行的方式工作。数字等级和投票的酒店从每个选定的数据源都是标准化的。另一方面,评估数据处理使用自然语言处理方案审查采矿、和特征提取的特征矩阵形式的酒店。此外,数值极性分数计算这些特征提取使用SentiWordNet和极性平均分数计算。现在极性分数加权平均值计算通过聚合规范化等级分数,投票评分,极性得分。最后,通过应用模糊逻辑计算方法的建议。我们定义了一个模糊集包含某些模糊规则计算最后得分发现客人类型(个人、家庭、商务、朋友,夫妻,等等)的酒店。提出酒店推荐方法如图2。酒店的最终建议基于特定的客人类型显示在五个不同的类。

3.1。特征提取过程

首先,推导评论家的功能偏好之前,我们首先分析原始文本的评论并将其转换为结构化的形式提取经验性特征。评论任何网站通常是提取到一个Json文件,然后加载到系统数据库中。我们研究了不同类型的方法从文本挖掘基于功能的观点评论,发现NLTK包是最合适的工具来提取酒店评论的功能。自然语言工具包NLTK是一个Python库来处理自然语言的程序。图书馆可以执行不同的操作如分词、阻止、分类、解析、标注和语义推理。我们使用NLTK 3.3版本。执行以下步骤确定众多特点的酒店评论:(我)提取特征从审查和分组的特征(2)发现并将值分配给相关的意见和审查各种特性(3)分配这些特征值的归一化范围

审查数据转换在逗号分隔值可在简单易读的形式,即,自然语言数据格式。拟议的系统需要执行一个自然语言处理提取酒店功能基于前面的客人的意见。我们执行下面四个步骤来处理自然语言文本评论如下:(我)词法分析(2)语法分析(3)语义分析(iv)特征提取

3.1.1。词法分析

在词法分析,流的字符被作为输入,并生成令牌流作为输出。

(1)分。酒店评论的形式可用段包含大量的句子或字符串。这些字符串被分割成令牌或词汇。这些令牌通常单词但也可以是数字或符号。通常从句子中删除所有空白字符,字母或数字被认为是一个令牌。这些令牌进一步通过POS薄铁片演讲称为语素的不同部分。例如,一个动词“感觉”是存储为“感觉+ s”和一个名词“蔬菜”是存储为“蔬菜+ s。“后来,语素是词法分析的解析树(表3和4)。


检查字符串	酒店的房间大。食物是美味的。酒店的位置是最好的。没有互联网。

词类	的房间/ DT /神经网络/酒店/ DT /神经网络/ VBZ大/ NN. /。食品/神经网络/ VBZ美味/ JJ. /。酒店/神经网络位置/神经网络是最好/ VBZ JJ. /。没有/ DT /交货/ VBZ互联网/神经网络

(根
(年代
(NP
房间(NP (DT) (NN))
(页)
酒店(NP (DT) (NN))))
(副总裁(VBZ)
(NP (NN)))
(…)))

3.1.2。语法分析

在这一步的分析,所有的句子和短语的段落评论是认证咨询英语的语法规则定义。本文使用谷歌拼写检查纠正语法错误和拼写错误在爬的评论。拼错的单词在审查文本修正通过使用统计拼写检查器(http://norvig.com/spell-correct.html)和删除重复和不必要的句子标点符号,例如,! ?等等。我们使用了公开承认POS薄铁片删除评论文本中包含一些嘈杂的信息比如语法错误和错误。所有句子的主要部分也发现在这一阶段,即。、对象部分、主体部分和动词部分。生成解析树和类型的依赖也在这个阶段。语法依赖解析器(http://nlp.stanford.edu/software/lex-parser.shtml)也可以返回单词语法之间的依赖关系一个句子中去。(一)词引发:有许多词汇来源于实际的词称为派生的词。阻止用来减少派生单词根形式。兰开斯特抽梗机被用于我们的工作。Python NLTK提供WordNet Lemmatizer使用WordNet数据库来查找单词的前题。词性是首次检测到之前的实际根词。在这个过程中,一个词的词性是首先确定和应用不同的标准化规则为每个词性。(b)删除无关的词:评论通常包含单词没有显著意义的提取特性对于任何产品或项目如“,”“,”,”而且,“”,“”,“”,“”,”等。这些话被删除。没有任何批准全球图书馆的停止词列表出现在英语中。为了克服这个问题,我们开发了图书馆在自己的java这样的话。(c)缩短夸张的词。(d)单词具有相同字母重复超过两倍的一个词,而不是出现在词典缩短到有意义的单词的重复字母只发生一次喜欢夸张的词“NOOOOOO”变成了“不”。(e)词性标记:词的语法属性分类通过词性标注系统。每个单词的复习分离并根据词性标记它属于。标记是单数名词,复数名词,动词,形容词,副词,等。NLP包返回标签像NN代表单一的普通名词,NP代表单数专有名词等。

3.1.3。语义分析

语义分析,审查的所有标记的单词在句子中提取某种表格形式。决定在这个特殊的阶段,什么行为是执行的特定主题和一些属性相关的每个对象也确定了。语义分析器的输出如表5包含一个语义表生成的输入评论文本的基础上生成解析树在前面的阶段。


不。	标记的单词	价值

1	房间	大
2	食物	美味的
3	位置	最好的
4	互联网	不可用

如果有一个名词在句子,然后我们把它作为一个功能和存储当前句子在这个特性。提取的语义信息表是用来表达酒店的特性。找到的所有特性的极性值使用意见挖掘方法,从用户评论酒店获得特征矩阵如表6。


不。	Hotel-ID	Review-ID	位置	价格	房间	食物	工作人员

1	Hotel-1	r 1	2	2	2	1	2
2	Hotel-1	r2	1	1	1	2	1
3	Hotel-1	延长三	0	3	2	1	3
4	Hotel-2	r 1	2	0	2	1	2
5	Hotel-2	r2	1	1	3	2	1
6	Hotel-2	延长三	2	2	2	1	2
7	Hotel-3	r 1	1	1	2	2	2
8	Hotel-3	r2	0	1	1	2	1

3.2。极性检测

我们确定集合中的每个评论评论的极性使用NLTK库和计算聚合极性得分为每个特性基于每个审查每一个酒店选择的网站。我们已经开始进行基于特征的意见挖掘的审查,意见表明积极的,中性的,或评论者表达负面情绪功能基于意见的话,当有多个意见词(很好,不错,和很棒的)与相关的每个特性(位置、房间和食物)审查。我们评估每个意见词的情绪强度也被称为极性值。在这个分析,评估的价值功能和它们相关的意见在极性推导和表所示7。


不。	Review-ID	最糟糕的	伟大的	羞愧	太棒了	不错的	标签

1	r 1	2	1	2	1	1	负
2	r2	1	1	1	2	1	积极的
3	延长三	0	3	2	1	3	积极的
4	r 1	2	0	2	1	2	负
5	r2	1	1	3	2	1	中性

3.2.1之上。TF-IDF代

文本预处理后的审查和删除所有重复的条目和不必要的停止词,Tf-Idf(词频率逆文档频率)需要为每个审查生成。我们计算中的每一项的权重评估使用术语frequency-inverse文档频率(TF-IDF)技术,以确定哪些可能是最具代表性和频繁发生在文档的收集以及哪些词不代表和很少发生。TF-IDF计算为每个术语词出现在评论的集合。定义如下:

而IDF任期给出如下:

现在,我们必须权衡下频繁的术语和发现罕见的,通过计算TF-IDF重量。TF-IDF重量的产品和 :

SentiWordNet是告诉一个字典,而不是意义,回顾的情感极性。检测不同酒店评论的极性和主体性得到极性和主观性,我们使用SentiWordNet,公开分析仪的英语从WordNet数据库中提取包含的观点。我们单独收集评论提取单词(宾馆)和分配所有代表发生在适当的酒店功能解释说在之前的步骤中,发现积极(pos) -(底片),中性(neu)条款计算情绪得分。SentiWordNet包含Python的NLTK包和WordNet同义词集提供了情感极性。WordNet给不同类型的词与词之间的语义关联,用于计算情感极性。在简单的词语,情绪分析是量化的东西在本质上是定性的过程如文本的评论。情绪得分的一个术语(pos或否定)乘以TF-IDF重量来计算整体情绪评分(极性)方面的文档,并给出如下:

整体情绪极性得分(正面或负面)解释了许多特性是积极的还是消极的重要的酒店评论。有多个舆论的单词与每个特性相关的评论,加权平均值计算它充当的重量来表示整体的积极或消极的极化审查。如果一个特性的极性分值的评论酒店大于零,然后积极的偏振特性;如果小于零,那么它就是负极化;如果它等于零,那么它代表了中立。我们已经计算了酒店的所有评论的极性从不同的数据源。

评论的极性公关的酒店选择的网站可以通过计算聚合的不同极性的正面评价posr和负面评论的聚合极性分数negr特定的酒店h_n从特定选择的网站 : 在posr_米∧negr_米∈h_n和h_n∈ 。

然后,我们将聚合极性分数从每个选定文本的评论每个酒店的网站。聚合过程相结合的东西。也就是说,把那些东西放在一起,这样我们可以参考他们集体:

聚合的加权平均总评论极性的各自的酒店选择的网站和重量分数的排名和选票计算如下:

在这里,T是酒店的评论总数吗h_n从酒店网站 : 在哪里N选择酒店的总数是包含大量的酒店评论网站。在哪里F的最终值归一化平均聚合分数吗酒店的从数量N选择的网站。

3.3。类型分类和推荐

分类是通过计算最后得分。评论词匹配和词典的话,如果这是一个积极的词,然后得分将+ 1;如果消极的词,然后得分将−1,否则为0。最后的建议是通过使用模糊逻辑的方法。模糊集理论提供了一个框架的表示人类知识的许多方面的不确定性。对于一个给定的元素,模糊集理论提出了一套的隶属度。例如,如果我们有单独的客人,然后我们可以认为一个人喜欢做健身或按摩等酒店属于一组1度或喜欢的人有一个哈晚上或电影在酒店必须几个客人,属于一套在其他学位。我们推荐的目的是提供酒店建议使用模糊集根据一些专家的标准。第一步的推荐过程由知识如何选择酒店的代表。这些知识是用模糊集表示的。

在第一步中,模糊集定义基于专家知识。专家解释说酒店的特点和客户的特征模糊集。第二步包括提供建议使用之前构建hotel-feature-rating矩阵可用的基于协同过滤技术的推荐系统。

3.3.1。模糊集

代表某酒店的隶属程度在一定阶级,使用模糊集理论。最后的建议是通过使用基于模糊规则的模糊逻辑方法计算最后得分提供酒店根据客人类型的类(独奏,夫妇,等等。),如图3。模糊规则定义如下:规则1:如果F> 8然后酒店类型是“R(推荐)”规则2:如果F> 6和F≤8然后酒店类型是“BR(最好推荐)”规则3:如果F> 4和F≤6然后酒店类型是“AR(平均推荐)”规则4:如果F> 2和F≤4然后酒店类型是“LR(不推荐)”规则5:其他酒店类型是“NR(不推荐)”

4所示。实现设置

4.1。NoSQL存储

作为我们的推荐是为了处理异构类型的数据,您需要一个数据库可以存储这个多元数据的性质。我们有卡桑德拉提出了推荐系统中使用的数据库来存储数据。检查匹配查询关键词的页面下载并存储在Hadoop的NoSQL数据库。在这项研究中使用的数据集是爬在外部资源,如酒店网站的旅行顾问和Expedia。酒店的数据保存在逗号分隔值(CSV)格式。所以,它转化为JSON格式增加它的可读性。用户的文本评论和评级由现有用户记录为评级得分,喜欢,或者明星排名都存储在卡桑德拉。不同尺度之间的等级分数可以改变1到5或1到10。归一化计算排名。卡桑德拉的设计方法将减少执行时间在毫秒(女士)。 The dataset contains hotel reviews and users feedbacks in the form of votes, ranks, and YouTube video views. The data are collected in the steps shown in Figure4。

在我们的提出的应用程序中,web设计的处理推荐应用在以下步骤说明:(我)启动流程(2)活跃用户查询系统输入的搜索条件和客人类型如独奏,夫妇,和业务(3)然后,系统检查前面的用户数据(评级、排名和评论)匹配系统中从网上查询数据库(iv)系统过滤器匹配查询查询数据的外部网络资源可用(v)如果匹配与查询,那么收集元数据(vi)将元数据保存在NoSQL数据库(七)如果不匹配,那么丢弃它(八)重复,直到所有匹配的元数据(第九)结束

4.2。系统概述

该推荐系统应用程序由三个主要组件。第一个是外部资源,然后前端,另一种是后端如图5。数据集包含酒店评论、排名从外部酒店旅行顾问和Expedia的网站。评审分为训练数据集和测试来验证改进性能的方法使用Hadoop平台形式和卡桑德拉数据库。提出的完整的数据存储到系统数据库中使用网络爬虫用java编写的开发方法。

为了得到最好的建议相关用户的选择和欲望,我们酒店推荐系统开发有一定的方法和技术,也使用一些开源工具如Hadoop平台和卡桑德拉。从任何平台访问网络应用程序,它使用基于可靠的开源工具的开发环境。还讨论了在表的计算环境8。在该应用程序中,用户可以查询提供搜索条件得到他们渴望的建议。系统提供建议使用评论极性分数和评分计算使用评论用户数据存储在卡桑德拉匹配活跃用户查询。

4 -核心系统规范。i7 - 3770, 3.40 GHz, 16 GB的内存,500 GB的磁盘

它实现与CentOS 7, Hadoop 2, Apache Cassandra 3.11, java 1.8, 7.1和PHP, PHP-Cassandra扩展

4.3。计算资源

测试所需的资源提出了系统还包括一些可靠的开源工具,例如,卡桑德拉,Hadoop, amd PHP。系统规格表8。

4.4。Web服务和方法

设计酒店推荐应用程序将通过一个web页面来访问。使用HTTP连接来执行大量的web服务使用适当的行列式uri。应用程序关联数据收集由URI提交GET请求时,使用指定的方法提供用户身份验证和所需的查询参数(每秒)。相应的响应消息HTTP是JSON格式保持数据一致性和返回给应用程序,当用户需要任何数据从web页面,某些指定的uri和HTTP连接是用来连接用户。提交用户请求,并通过适当的HTTP方法使用必要的参数所需的特定方法,处理以后,被请求的数据显示在前端页面的web应用程序。uri的所有方法及其参数如表所示9。


方法	描述	每秒	HTTP方法

搜索	按给定的条件搜索可用的酒店列表数据	Searchname	得到
Topratings	显示指定的酒店以及它们的评级	评级。酒店标识	得到
Hoteldetail	为酒店的细节提供了ID和名称	hotelId	得到
Recommendhotel	提供了一个列表的推荐酒店	Id /名称	得到
Getratings	需要酒店之前带过的用户的列表和回复的评级数据	numRating	得到

酒店数据转换为JSON格式提供有关酒店的信息产生大量可用的酒店推荐。在数据传输中,web服务和方法在推荐由SSL保护的web应用程序。

4.5。实验和结果

我们使用两个可靠的数据存储库(旅行顾问和Expedia)含有大量的行列,评级和评论来表示数据的异构性,即。、文本评论和数值评分和排名。这些数据分数包含数据8000年最受欢迎的酒店和酒店评论和评级的集合是有用的在我们的实验。数据预处理后,TF-IDF生成和使用SentiWordNet极性检测,我们计算文本评论的极性分数获得每个选定的网站。我们已经说明了数据从选定的酒店和获得相应的数据源和表提出的处理方法10。


选择酒店	数据源
	旅行顾问(D1)			Expedia (D2)
	极性分	规范化等级评分	投票得分	极性分	规范化等级评分	投票得分

斯普林希尔套房,丹佛市区(H1)	31日	3所示。9	209301年	23	5	268231年
阿姆斯特丹法庭酒店(H2)	−5	3所示。4	38821年	7	4	63420年
纽约文华东方酒店(H3)	17	3所示。2	111620年	24	5	127023年
年希尔顿(H4)	−4	2.8	17023年	−3	3所示。5	35622年
Belnord酒店(H5)	16	3所示。5	29441年	22	5	41323

在表8,选择的外部数据源用于我们的工作,如旅行顾问由和Expedia表示为“D1 D2。“同样的,相应的选择表示为文华东方酒店,纽约”H1, H2“阿姆斯特丹法庭酒店”,“酒店地铁”H3,“年希尔顿”H4, H5和Belnord酒店。“我们有极性计算分数的每个酒店从选中的文本评论网站。规模标准化等级评分(1 - 5)和投票得分也计算。投票分数代表选票的数量由客户给出每个酒店。酒店名称与相应的id和数据源表中所示。

所选酒店的规范化等级分数从两个选择数据源,如旅行顾问D1和Expedia“D2”绘制在图6,它已经指出,Expedia与旅行顾问排名相对比较高。

极性的文本评论酒店从不同的数据源选择计算和汇总在表11。加权平均极性是通过添加规范化居平均极性和投票(通过计算平均聚合极性)。


酒店	评论		聚合的极性		平均极性		加权平均极性
酒店	D1	D2	D1	D2	D1	D2	D1	D2

H1	1309年	1519年	31日	23	0.023	0.015	209304.92	268236.01
H2	396年	456年	−5	7	0.012	0.015	38824.41	63424.01
H3	1189年	998年	17	24	0.014	0.024	111623.21	127028.02
H4	537年	337年	−4	−3	0.007	0.008	17025.80	35625.50
H5	971年	1117年	16	22	0.016	0.019	29460.50	41328.01

twitter等社交媒体网站,YouTube, Facebook也创建一个旅行者寻找的方式发生转变前预订的建议和技巧决定特定的酒店。视频包含酒店图片,以及现在的酒店服务,也会影响顾客的行为之前选择的酒店,也有对酒店评级的影响。这就是为什么我们使用YouTube视频的观点在我们的工作目前异构的方法。我们添加了观点的数量加权平均极性计算聚合质量加权平均极性的建议。最后的分数连同酒店类表所示12。


酒店标识	YouTube的观点	聚合加权平均极性	最后得分	酒店类

H1	331025年	569795.465	8.93234	R
H2	89023年	140147.21	3.92215	LR
H3	284230年	403555.615	7.63217	BR
H4	56056年	82381.65	2.08245	LR
H5	78124年	113518.255	3.12871	LR

这些异构数据源,如排名,选票,文本评论,和视图使用建议的方法计算,和最终的排名分数得到如图7。酒店进行分类的基础上,最终排名得分。同样的解释表12,和酒店类识别的基于模糊集应用于我们的工作。

H1的最终排名分数“F”酒店“丹佛斯普林希尔套件市中心”大于8这就是为什么放在类“R。纽约文华东方酒店“H3酒店位于“溴”类,因为“F”得分大于6和小于8。然而,H2酒店“阿姆斯特丹法庭饭店”,H4酒店“千禧希尔顿”和H5 Belnord酒店“分数大于2和小于4所以在于类“LR。”

图8代表每个酒店的类从选定的数据源对最终排名得分计算基于客人类型如独奏、家庭和夫妇。

图7代表了每个推荐标准分数对选定的数据源和拟议的系统使用异构数据。

这个设计的web应用程序提供了客户的机会来获得他们的欲望酒店大量的酒店。推荐系统搜索的基础上,根据客人类型系统定义的标准。推荐酒店由系统生成的列表显示在图中9。

5。系统性能评价

5.1。评价指标

一些评价指标用来评估该系统的准确性。这些评价指标传达结果通过该系统目标用户所接受。主要绩效评估之前发现需要改进的产品进入市场。没有性能分析,软件应用程序可能会受到运行缓慢等问题,而多个用户同时使用它或者系统不会做出迅速的反应。我们有执行性能分析表明,该系统产生有效建议;有数量的指标但是我们使用三个指标用于这项研究。

精度是第一个测量用来评估我们的系统由以下方程:

根据用户反馈系统中,我们假设一个代表的总数推荐酒店用户喜欢的和C代表酒店的数量由用户不喜欢。”C+一个”将总数的酒店推荐的系统相同的用户。精度可以通过计算的比例推荐酒店的数量由用户喜欢在酒店推荐的系统的总数。召回率定义如下按相同的假设之上: ,“B”代表酒店目标的数量但不推荐给用户B+一个包括所有用户可能喜欢的酒店。查全率和查准率比率是相反的。完美的召回率的“1”是指利率相对较低精度。精度高但更低的回忆给了非常准确的推荐。第三个使用精度测量是F-measure由以下方程:

F-measure是调和平均数的精度和召回,用于评估的准确性和效率提出了推荐系统产生的结果。

我们使用实际数据集的一个子集包含100家酒店和500个用户从每个所选的网站作为一个典型数据集测试和训练我们提出的系统。元数据分为训练数据测试数据(40%)和(60%)。根据这些数据部分,我们最初对底层的40%的数据进行计算的典型形式的元数据块20%的测试开发系统的数据表13。我们逐步包括剩余的60%的数据集的元数据到系统培训系统。精度指标精度、召回和F-measure每个增量的数据测量和记录。


增量数据更新使用欧几里得相似度(%)	F-measure	回忆	精度

20.	0.966	0.954	0.978
40	0.956	0.941	0.972
60	0.951	0.936	0.968
80年	0.938	0.921	0.956
One hundred.	0.924	0.898	0.951
平均比率	0.950	0.930	0.965

图10显示了建议的F-measure值根据该机制与模范小数据。该推荐系统支持计算评估如何影响推荐精度。NoSQL数据集,并提出了机器学习方法的系统使用情绪分析提供准确的建议,及其F-measure比率值是0.950作为初始的数据集使用包含100家酒店和500个用户非常小所以这样一个巨大的进步在精度方面,召回,F-measure。随着数据的比例增加,绩效指标的值减少。

系统初始的元数据测试后,现在的实际完成数据集使用的酒店数量从旅行顾问和Expedia包含8000家酒店和1000万用户的数据。当实际完成数据集很大,精度度量值相对下降,但仍显示承诺表中记录的结果14。这表明提出的推荐使用情绪分析方法提供了准确、质量推荐给用户。图示也显示在图11。


增量数据更新使用欧几里得相似度(%)	F-measure	回忆	精度

20.	0.825	0.791	0.877
40	0.789	0.728	0.861
60	0.771	0.726	0.821
80年	0.729	0.679	0.788
One hundred.	0.688	0.631	0.756
平均比率	0.76	0.711	0.821

5.2。系统处理时间

确保执行性能分析软件应用程序将执行远低于他们的预期的工作负载。大多数性能问题围绕着速度、响应时间、加载时间和可伸缩性。响应时间往往是最重要的一个应用程序的属性。一个缓慢运行的应用程序将会失去潜在用户。完成性能测试,以确保应用程序运行速度足以让用户的关注和兴趣。

我们有由不同模式的工作负载性能测试执行(用户数量)。我们有与不同数量的用户进行不同的实验。更好的理解,我们数据12个来自不同职业和不同年龄层次用户使用并执行实验对提出的系统。他们还使用其他的推荐系统,trivago.com,hotels.com和yatra.com让酒店的推荐列表的选择。满意度水平评估采取他们的意见关于搜索这些推荐系统。处理时间对开发系统也在这些搜索记录。参与者表现提供反馈,记录在表中15。我们有令人满意的水平分为三个长老即不满意(L)、满意的(S),和高度满意的(H)。反馈是对三个功能即时间有效(TE),建议酒店与用户选择的相关性(RoR),成本效益(CE)。

不。

职业

年龄

kayak

Hotels.com

Booking.com

建议推荐

RoR

User1

学生

年代

User2

学生

年代

User3

业务

年代

User4

医生

31日

年代

User5

老师

年代

User6

学生

年代

User7

学生

年代

User8

员工

年代

User9

学生

29日

年代

User10

医生

年代

User11

老师

年代

User12

学生

年代

结果展示在表15显示了参与者的令人满意的水平,其中大部分用户已经选择最佳类别提出的推荐系统。

当用户输入的查询建议推荐获得最好的酒店推荐提供一种客人根据他们的选择,提出的系统执行计算使用机器学习情绪分析收集所需的建议。该系统显示的有前景的结果改进响应时间比较传统的推荐系统。该系统还计算了时间戳作为加载时间,搜索时间和执行时间以毫秒(ms)表示。结果生成的响应时间被记录在表16,如图12。加载时间和搜索时间的总和在一起叫做执行时间。该系统优于和需要非常少的时间给的建议列表。


不。	加载时间	搜索时间	执行时间(女士)

1	3.0994	0.0461	3.5606
2	1.6212	0.0459	1.6712
3	1.0013	0.0488	1.0501
4	2.8610	0.0738	2.9348
5	3.0994	0.0455	3.1441
6	3.0994	0.0455	3.5544
7	2.8610	0.0727	2.9337
8	2.8610	0.0469	2.9079
9	3.0994	0.0024	3.1018
10	2.8610	0.0500	2.9069
11	1.9073	0.4583	1.9531
12	3.0994	0.0447	3.5544

总平均查询处理时间由该系统最大工作负载是2.6592毫秒。我们的方法和卡桑德拉NoSQL数据库是有效的,有助于减少总处理时间。结果表明,该系统是执行有效地使用推荐系统也改变人们的看法。

系统有效地有助于帮助用户搜索酒店。系统的目的是实现真正的建议和积极影响客户行为的准确性方面的建议与用户的需要。如果真的提供了建议,这肯定会增加客户的满意度水平帮助他们他们的商业决策。

6。比较分析

比较而言,在本节中执行时间和评价指标。它比较该方法与以前的传统方法。绩效评估指标的统计分析如F-measure、精度、执行和回忆。评估推荐该方法的准确性,我们表现的比较性能分析指标如召回、精度和F-measure我们酒店推荐系统与实际数据集的一个子集,即。,小的数据集(100家酒店和500个用户),与完整的数据集(8000家酒店1000万用户),精密,召回,F-measure tradition-related推荐系统和提供了表17。


不。	参考		精度	回忆	F-measure

1	刘等人。2]		0.56	0.60	0.59
2	谢长廷et al。6]		0.02	0.53	0.01
3	Zhang et al。10]		0.25	0.34	0.35
4	Chang et al。16]		0.43	0.29	- - - - - -
5	林等。29日]		0.62	0.51	- - - - - -
6	胆量和Virk19]		0.69	0.67	0.68
7	建议的方法	的数据集的子集	0.96	0.93	0.95
7	建议的方法	与完整的数据集	0.80	0.69	0.74

我们也比较了现有的研究方法,发现承诺改进的建议的方法的执行时间。的性能的比较分析提出酒店推荐的方法与现有的相关文献中发现的方法如表所示18展现出结果的时间改进。


不。	参考	推荐的时间

1	布拉绸和Tsogkas34]	12秒
2	Jazayeriy et al。37]	28秒
3	刘等人。2]	27秒
4	建议推荐	2.6毫秒

上述的比较评价指标和建议时间展览,该方法已经显示出不错的效果。建议时间是减少使用该方法与传统方法相比时。

7所示。结论和未来的工作

本文推荐一本小说CF方法提出了有能力处理异构数据如文本评论、排名,票,和视频在大数据视图Hadoop环境与卡桑德拉数据库保证生成的建议改进响应时间。提出系统的、经验性的情绪分析用于提取酒店特征矩阵和存储在数据库中。我们的方法结合了词法分析,语法分析,语义分析了解人气酒店功能。NLTK图书馆是用来识别文本评论的极性。该系统利用模糊规则来确定酒店类根据客人类型。欧几里得距离是用来计算项目之间的相似性,并提供准确的建议基于客人的类型(个人、家庭、夫妻,等等)。系统需要2.65毫秒产生高质量的推荐系统通过减少执行时间。合成F-measure导致0.950大约95%当我们运行系统的数据训练系统,但是当系统与完整的训练数据集获得网站,F -措施是降低了。当实际完成数据集很大,精度度量值相对减少,至0.745约74%,但仍显示出可喜的成果,记录在表中14。这表明提出的推荐使用情绪分析方法提供了准确、质量推荐给用户。

在未来,推荐系统需要设计的方式将利用动态自动更新数据包含视觉观点,票,和评论从外部网站提供建议根据动态数据发现,在同一时间的活跃用户查询。放大了推荐系统的多功能性服务,这将是由合并实现web饼干和使用客户的航海活动和新的建议项得到反馈。

数据可用性

作者将提供用于实验的数据,如果要求。

的利益冲突

作者宣称没有利益冲突。

引用

m·m·马里安尼d . Buhalis c . Longhi o . Vitouladiti,“管理旅游目的地的变化:关键问题和当前的趋势,”目的地营销和管理杂志》上,卷2,不。4、269 - 272年,2014页。视图:出版商的网站|谷歌学术搜索
w . j . h . Liu, t . Wang歌,和x Du,“结合用户首选项和用户意见准确的推荐,“电子商务研究与应用,12卷,不。1、5、2013页。视图:出版商的网站|谷歌学术搜索
m·易卜拉欣和i Bajwa设计与应用专家系统的多变量使用Apache Hadoop框架,“可持续性,10卷,不。11,4280年,页2018。视图:出版商的网站|谷歌学术搜索
j。j张和z毛”,所有酒店的形象尺度旅游博客:它对顾客忠诚度的影响,“酒店营销和管理杂志》上,21卷,不。2、113 - 131年,2012页。视图:出版商的网站|谷歌学术搜索
y科伦、r·贝尔和c . Volinsky“推荐系统,矩阵分解技术”电脑,42卷,不。8,2009。视图:出版商的网站|谷歌学术搜索
M.-Y。谢长廷,W.-K。周,K.-C。李”,构建一个移动电影推荐服务用户评级与关联数据和应用程序使用Hadoop,”多媒体工具和应用程序,卷76,不。3、3383 - 3401年,2017页。视图:出版商的网站|谷歌学术搜索
r·伯克“混合推荐系统:调查和实验,”用户建模和User-Adapted交互,12卷,不。4、331 - 370年,2002页。视图:出版商的网站|谷歌学术搜索
p .删削,m . De Gemmis g . Semeraro“基于内容的推荐系统:先进的趋势,”推荐系统手册施普林格,页73 - 105年,波士顿,MA,美国,2011。视图:出版商的网站|谷歌学术搜索
m·d·Ekstrand j . t . Riedl和j·a . Konstan“协同过滤推荐系统,”基金会和人机交互的趋势,4卷,不。2、81 - 173年,2011页。视图:出版商的网站|谷歌学术搜索
j .张问:彭,金黄色的太阳,和c·刘,“基于用户的协同过滤推荐算法的偏好来源于项目域特性,”自然史答:统计力学及其应用卷,396年,第76 - 66页,2014年。视图:出版商的网站|谷歌学术搜索
休谟和l .威力、“酒店基于协同过滤的推荐系统和rankboost算法”学报2010年第二多媒体和信息技术国际会议(MMIT),1卷,页317 - 320,IEEE,开封,中国,2010年4月。视图:出版商的网站|谷歌学术搜索
b·萨瓦尔g . Karypis j . Konstan, j . Riedl“基于项目的协同过滤推荐算法,”学报第十届国际会议在万维网上ACM,页285 - 295年,香港,2001年5月。视图:谷歌学术搜索
z谭和l .他”,一个高效的相似性度量的基于用户的协同过滤推荐系统受到物理共振原理,“IEEE访问5卷,第27228 - 27211页,2017年。视图:出版商的网站|谷歌学术搜索
c . x k, k . Wang Wang Jin, a .周,“酒店推荐基于用户偏好分析,”学报2015年31日IEEE国际会议数据工程研讨会(ICDEW)IEEE,页134 - 138年,汉城,韩国,2015年4月。视图:出版商的网站|谷歌学术搜索
l .陈和f . Wang“个性化集群提高电子商务的建议,评论”以知识为基础的系统卷,50 44-59,2013页。视图:出版商的网站|谷歌学术搜索
y z . Chang m . s . Arefin,森本晃司,“酒店推荐根据周围的环境,”学报2013年IIAI先进应用信息学(IIAIAAI)国际会议上IEEE,页330 - 336年,日本,松江August-September 2013。视图:出版商的网站|谷歌学术搜索
y沙玛,j . Bhatt, r . Magon”多评论基于酒店推荐系统”学报2015年IEEE国际会议上,计算机和信息技术;无处不在的计算和通信;自主和安全可靠,计算;无处不在的智慧和计算(CIT / IUCC / DASC / PICOM)IEEE,页687 - 691年,利物浦,英国,2015年10月。视图:出版商的网站|谷歌学术搜索
t·陈和黄懿慧壮族“模糊和非线性规划方法优化性能的无处不在的酒店推荐,“环境智能和人性化计算杂志》上,9卷,不。2、275 - 284年,2018页。视图:出版商的网站|谷歌学术搜索
Verma A, h . Virk混合genre-based电影推荐系统使用遗传算法和资讯的方法,”国际创新工程与技术杂志》上,5卷,不。4,48-55,2015页。视图:谷歌学术搜索
k . Kabassi“个性化推荐游客。”远程信息处理和信息,27卷,不。1,51 - 66,2010页。视图:出版商的网站|谷歌学术搜索
美国Fasahte, d . Gambhir m . Merulingkar和a . m . p . a . Pokhare“酒店推荐系统,”帝国跨学科研究杂志》上,3卷,不。11日,2017年。视图:谷歌学术搜索
g·克雷斯波,a . l . Cuadrado j·l·c·帕拉西奥斯r·g·卡拉斯科和i r . Mezcua”Sem-Fit:一个基于语义的专家系统提供建议在旅游领域中,“专家系统与应用程序,10卷,不。38岁,13310 - 13319年,2011页。视图:出版商的网站|谷歌学术搜索
黄懿慧胡,p . j . Lee, k . Chen j . m .冰斗湖,D.-V。见鬼,”酒店推荐系统基于审查和上下文信息:一个协作过滤appro,”亚太会议程序信息系统奶嘴p。221年,台湾嘉义城6 - 2016。视图:谷歌学术搜索
郑胜耀黄,c . y .赖s . Chang和j·j .江”的识别值得注意的酒店管理,酒店评论”太平洋亚洲协会的杂志《信息系统》第六卷,没有。4、2015。视图:谷歌学术搜索
r . Sandeep、美国Sood和诉Verma”微博情感分析的实时客户体验反馈预测印度电信公司的增长,”2018第四届国际会议上计算科学学报》(可以)IEEE,页166 - 174年,Phagwara,印度,2018年8月。视图:出版商的网站|谷歌学术搜索
孟,w .窦、张x和j .陈”的卡萨:Keyword-Aware MapReduce服务推荐方法对于大数据的应用程序,“IEEE并行和分布式系统,25卷,不。12日,第3231 - 3221页,2014年。视图:出版商的网站|谷歌学术搜索
a . Ghose用p·g . Ipeirotis, b . Li”设计排名系统为酒店在旅游搜索引擎通过挖掘用户生成和众包内容,“市场营销科学没有,卷。31日。3、493 - 520年,2012页。视图:出版商的网站|谷歌学术搜索
n·m·阿尔梅达,j·a·席尔瓦,j·门德斯和p .伯父做山谷,“营销传播的影响在旅游酒店预订过程中,“安纳托利亚,23卷,不。2、234 - 250年,2012页。视图:出版商的网站|谷歌学术搜索
k·p·林,c . y .赖,p . c . Chen郑胜耀黄,“个性化的酒店推荐使用文本挖掘和移动浏览追踪,”学报2015年IEEE国际会议系统,人,控制论(SMC)IEEE,页191 - 196年,香港,中国,2015年10月。视图:谷歌学术搜索
n . Rianthong a Dumrongsiri, y Kohda”提高酒店客房的多维序列在一个在线旅行社网站,“电子商务研究与应用,17卷,第86 - 74页,2016年。视图:出版商的网站|谷歌学术搜索
g·s·拉尔和a . s . Baghel”情绪的有效特征提取分类对比的句子,“国际现代教育和计算机科学杂志》上,10卷,不。5,54页,2018年。视图:出版商的网站|谷歌学术搜索
d . Jannach f . Gedikli z Karakaya, o . Juwig“基于多维客户评级,建议酒店”信息和通信技术在旅游业施普林格,维也纳,奥地利,2012年。视图:谷歌学术搜索
m·易卜拉欣。s . Bajwa r . Ul-Amin和b,”神经network-inspired方法改进和真正的电影推荐,“计算智能和神经科学,卷2019,不。7篇文章ID 4589060, 19页,2019。视图:出版商的网站|谷歌学术搜索
c·布拉绸和诉Tsogkas”,提高新闻文章建议通过用户聚类”,国际期刊的机器学习和控制论,8卷,不。1,第237 - 223页,2017。视图:出版商的网站|谷歌学术搜索
d . Valcarce j . Parapar, A·巴雷罗“分布式推荐大数据平台,”通用计算机科学杂志》上,21卷,不。13日,1810 - 1829年,2015页。视图:谷歌学术搜索
美国人士:马吉德,m . Maqsood和a . Javed“改进的可伸缩的推荐系统,”细胞核,53卷,不。3、200 - 207年,2016页。视图:谷歌学术搜索
h . Jazayeriy s穆罕默迪,s . Shamshirband”快速推荐系统冷用户使用分类项目,“数学和计算机应用,23卷,不。1,p。2018。视图:出版商的网站|谷歌学术搜索
k . Sudha m . Lavanya, a . Kanimozhi”基于项的协同过滤方法对于大数据的应用程序,“国际期刊的科学研究工程与技术(IJSRET),3卷,不。8,1222 - 1224年,2014页。视图:谷歌学术搜索
g·林登、b·史密斯和j .纽约“Amazon.com建议:item-to-item协作过滤,”IEEE网络计算,7卷,不。1,第80 - 76页,2003。视图:出版商的网站|谷歌学术搜索
m·马努和b·拉梅什”Single-criteria协同过滤中使用Apache Mahout实现大数据,”国际计算机科学和工程杂志》上,5卷,不。1、7 - 13,2017页。视图:谷歌学术搜索
莫洛佐夫和x钟”,在协同过滤推荐系统相似度量的评价,”《2013年夏威夷大学国际会议教育科技数学与工程技术火奴鲁鲁,嗨,美国,2013年6月。视图:谷歌学术搜索
问:Shambour m·a·胡拉尼,s . Fraihat”一个基于项目多目标协同过滤算法的个性化推荐系统,”国际期刊《先进的计算机科学和应用程序,7卷,不。8,275 - 279年,2016页。视图:出版商的网站|谷歌学术搜索
f . Cacheda诉Carneiro d·费尔南德斯,诉Formoso”协同过滤算法的比较:电流限制技术和建议可伸缩的、高性能的推荐系统,”ACM网上交易(TWEB),5卷,不。1,p。2, 2011。视图:出版商的网站|谷歌学术搜索
m . Nilashi o·本·易卜拉欣,n . Ithnin n .城镇Sarmin h和n . h .城镇Sarmin”旅游领域的多目标协同过滤推荐系统采用期望最大化(EM)和PCA-ANFIS,”电子商务研究与应用,14卷,不。6,542 - 562年,2015页。视图:出版商的网站|谷歌学术搜索
p . Phorasim和l . Yu”使用协同过滤和电影推荐系统k——,”国际先进的计算机研究杂志》上,7卷,不。29日,52-59,2017页。视图:出版商的网站|谷歌学术搜索
s . Kogel“模型驱动的软件开发,推荐系统”学报2017年11日联席会议在软件工程的基础帕德伯恩,页1026 - 1029年,德国,2017年9月。视图:谷歌学术搜索
M.-P。t, d . v .阮,l .阮“基于模型的协同过滤方法,”学报第六届国际会议信息技术教育2010年8月,越南胡志明市。视图:谷歌学术搜索
和w·w·Yibo m . Wang,“电影的sentiment-enhanced混合推荐系统推荐:大数据分析框架,“无线通信和移动计算卷,2018篇文章ID 8263704、9页,2018。视图:出版商的网站|谷歌学术搜索

科学的规划