文摘
理解满意度的决定因素在P2P托管是至关重要的,特别是在平台如Airbnb的出现,已成为最大的短期出租房屋的平台。尽管许多研究已经在这个方向,仍有差距了,特别是关于顾客考虑范畴的担忧。在这项研究中,我们采用了一种基于机器学习的方法来检查100000顾客评论留在Airbnb平台识别不同尺寸形状根据每个类别研究客户满意度(个人、夫妻和家庭)。然而,收集的数据不给任何客户所属类别的信息。我们应用自然语言处理(NLP)算法来评论为了找到线索可以帮助我们段,然后我们训练两个回归模型,多元线性回归和支持向量回归,为了计算系数作用于每个6小学成绩(精度、清洁度、签到、沟通、位置和价值)Airbnb指出,考虑到客户的类别评估他们的住宿的性能。结果表明,客户满意度指标同样不感兴趣。此外,差异被发现同样的指标根据客户所属的类别。根据这些结果,我们建议对Airbnb采用的评级系统进行改进,使其适用于每个类别的客户属于。
1。介绍
2015年,普华永道(1]指出,五个分享部门(旅游,汽车共享,财务、招聘和流媒体音乐和视频)有可能增加全球营收从150亿美元(2015年估计)到3350亿年的2025美元。通过关注旅游行业新的点对点(P2P)模型的外观如Airbnb的影响破坏经典的预订系统(2通过提供一个体验不同的消费者。
Airbnb目前最大的P2P承载平台。它包含大约400万个广告在2017年和2015年价值250亿美元(3]。
考虑Airbnb的普及,用户和主机都倾向于认为租赁共享平台允许每个人一样便宜出租财产与全球可见性,而不是使用传统的中介机构(4]虽然提供了一个前所未有的经验提供给某些属性的特殊性(如冰屋或城堡),而传统的住宿、特别是,由酒店提供5]。此外,这不同的体验刺激的享乐价值客户(6]。
然而,由于客户体验是一个决定性因素,会影响后者的建议和考虑到产品相关主机不能尝试过购买(7),消费者兴趣列表显示在P2P平台(Airbnb的一个)是影响在线用户评论(8]。更有甚者,后者对采购决策产生影响,因为它们构成主要的信息来源(9),从而导致电子口碑(eWOM)彻底重组企业和消费者之间的关系(10]。
客户满意度被认为是一个绝对优先在酒店业。它建立了强有力的联系与客户忠诚度和改进财务业绩(11]。
的上下文中理解顾客满意的住宿在P2P托管平台上展示,事实证明,现有文献,仍有影响因素评级得分(尤其是Airbnb),没有实证研究(3),所有客户的更多如果我们方法的范畴。
目前的工作试图了解Airbnb小学成绩之间的关系(准确性、清洁度、签到、沟通、位置和价值)和整体得分的类别的客户(个人、夫妻和家庭)通过检查数据关于属性位于伦敦已经收集了从内部Airbnb [12]。分数和意见收集2009年12月至2020年4月完成。
由于提供的数据是不按客户分类的类别,我们必须检查他们留下的意见进行文本挖掘。的确,收集到的数据的清洗和过滤后引发了100000年的数据可以分析,然后进行分割操作来推断出类别的客户从他们的意见使用自然语言处理(NLP)算法。由于要处理大量的数据以及它们的语义丰富,我们采用了一种基于机器学习的方法。然后使用多元线性回归进行数据分析和支持向量机回归算法。这两个算法的训练让我们计算重量每六个基本分数,这将使我们更好地包含客户满意度的决定因素根据其类别。
来验证我们的两个模型,我们训练的人工神经网络来预测总体成绩从小学成绩样本数据研究的主题。
这项研究的结果将是重要的在帮助P2P托管平台(在这种情况下,Airbnb)以及主机提供他们的产品有更好的了解顾客的需求,以便更好地发展在其逗留期间的客户体验。相反,他们将有用的Airbnb建立个性化的评分系统,考虑客户的类别。换句话说,未来的客户寻找住宿Airbnb的平台,这是相关的评分和评论将会暴露他们的类别。这将更好地帮助他们做出决定关于提供上市。获得的结果还将提供额外信息的现有文献对客户满意度的维度与P2P托管平台。
2。文献综述
2.1。经济和P2P共享平台
分享/协作消费经济近年来取得了很大的进步。这是一种消费,人们在线分享商品或服务。它代表协作活动效益,提供,或分享获得商品或服务,在线服务,协调是基于社区的用户(13]。用户之间的交互提供的这种形式的消费往往P2P网站或平台,方便联系和协调交换(14]。此外,这种新型的平台经济获得了巨大的市场份额等几段运输(Uber和Cabify)和住宿(Airbnb和CouchSurfing) (13]。尽管共享经济一直存在于紧密的社区,其转移到一个更大的规模是一定条件下的结果包括新技术的快速应用和低入口要求创业(15]。
协作消费让人们感知的好处所有权而降低成本,确保它成为替代传统的房屋所有权(16]。在协作消费服务的部分是P2P旅游业。
P2P旅游汇集了活动由游客与目的地的属性(包括美食、娱乐和访问自然和文化遗产)提供同行(17]。P2P旅游确保主机和客户之间的直接关系,具有促进真实性的影响被后者相对于他们的旅游经验15]。此外,主机可以提供当地经验他们的客人,通过与社区,发现他们住的城市生活(18]。居民本身可以通过P2P旅游,促进旅游相关业务活动。事实上,Hamari et al。14)的四个主要因素,引起愿意参与的活动分享经济作为服务提供者,也就是说,可持续性,快乐,名誉,和经济效益,尤其是在政治改革的发展有利于合作经济的某些大城市包括旧金山、巴黎、伦敦和新加坡(15]。
自2007年以来,第一个P2P旅游平台出现,除非他们不是很受欢迎。然而,他们中的一些人有巨大的成功,在这种情况下,Airbnb的活动与P2P主办,2018年3月,有超过1.5亿个用户和640000台主机17]。
2.2。Airbnb现象及其对住宿行业的影响
Airbnb短期住宿是一个领先的平台,分享经济的先驱。这是一个服务,连接空间与人分享的人正在寻找住宿。Airbnb自称是一个值得信赖的社区市场为人们提供名单,发现,和世界各地的书独特的住宿(19]。
自2008年推出以来,Airbnb迅速增长,全世界有超过200万的所有权和超过5000万用户使用他们的服务在2015年(20.]。
与其他协作消费平台,技术创新已经简化了进入市场的过程,并允许它来促进消费者的搜索列表,减少交易成本。Airbnb提供更好的达到减少消费者搜索成本作为电子市场效率低下造成的买家搜索成本降低(21]。这个显著的优势把它与传统竞争的最前沿住宿服务提供商(如酒店和宾馆)。事实上,某些保持与Airbnb可以代替某些酒店,从而影响后者的营业额。这种影响可以通过地理区域差异化,通过酒店细分市场,或季节(19]。例如,瑞士信贷(Credit Suisse)分析师估计,Airbnb导致每间客房营收下降18.6%在2015年1月在纽约(22]。
面对这种情况,连锁酒店的经理有时作轻蔑的陈述关于Airbnb等竞争对手,认为他们的言论,这些平台是一个利基市场,或目标细分市场补充那些酒店的目标。事实上,Airbnb方面宣布,70%的在其平台上提供的属性以外酒店区(19]。
可以肯定的是,P2P托管平台(在这种情况下,Airbnb)已经改变了顾客的感知他们的恐惧。后者的许多正在寻找低成本住房和直接与当地社区的互动。这种交互之前是直接与主机通过P2P平台的交互。这改变了市场,吸引了主流消费者通过给他们机会租属性作为旅游住宅(23]。
2.3。在线评论/得分和客户满意度
电子口碑(eWOM)是一种特定形式的非正式沟通,包括知识的交换和客户反馈的产品或服务。它有助于塑造产品的价值的感知和推荐它给他人的可能性24]。电子口碑传播,如在线酒店评论,正在获得越来越多的注意力从旅游营销的球员,尤其是酒店业(25]。的确,旅游和酒店服务是最昂贵的服务,这意味着相当水平的风险和不确定性与旅游相关的决策(26的影响),客户审查网上的评论和意见,以减少他们的购买决定的感知风险25),这使得依赖在线评论的水平非常高的消费份额,对房间的销售有深远的影响在不同酒店段(27]。因此,许多公司建立了平均成绩评估的总结信息旅游机构为了使他们更方便的客户,在这种情况下,星评级系统(28)的鲁棒性批评,因为大的差异分配分数和描述性的词语在不同的系统(10)或评估分数的分布在同一个系统29日]。心理和地理距离甚至发生影响评级得分。的确,旅行者与更大的心理和地理距离给评级得分高于旅行者用更少的距离(30.]。此外,当他们表达他们的意见,客户不仅影响他们的旅游经验,而且通过他们的经验使用在线平台在那里订了和写他们的审查4]。在任何情况下,大多数在线酒店评论显示非常积极的平均评级(31日),特别是在该地区的住宿分享经济的一部分,通常有一个主机和客户端之间的直接接触,从而影响后者的决定表达负面的意见(13]。
利用Web 2.0的扩散和丰富的旅游相关客户review-sharing平台,最近的研究揭示了决定顾客的满意度的因素决定在网上分享他们的评论。Alrawadieh [32),在他的书房里,看着Tripadvisor的评级系统,发现房间的质量和大小,以及员工的服务质量,是影响客户满意度的主要因素。同样的研究发现,相对年轻的欧洲旅行者是最容易在网上分享他们的经验。
朱et al。3]试图确定评级得分Airbnb的关键决定因素。结果表明,沟通和一个大空间,以及住宿的一个精确的描述,对客人满意度有积极的影响。关于房间的设计,结果是客人的人口学特征会影响后者的偏好这一标准。事实上,Bogicevic et al。33)表明,年龄和性别温和的房间风格和客人满意度之间的关系。这项研究指出,年轻的客人更喜欢现代的居室风格,而老客人对这一标准。男性更喜欢男性化的装饰风格,而女性平等满意展示男性和女性化的装饰风格。杨et al。34)发现,代X和Y优先考虑房间的设计和提供服务的质量。这项研究还指出,人都值方便和食品,和创旅游价值的安全。相反,也发现类似的结果在Brochado et al。35)的研究试图确定影响因素得分颁发的客人住在青年旅馆,氛围和员工被认为是重要的。关于客户的起源,事实证明,与目的地的文化维度,影响评估分数(36]。
旅游设施的位置也是影响客人满意度。在[37),杨等人试图确定城市酒店的位置是客人满意度的决定因素。他们的研究表明,可访问性的兴趣点(如景点、机场、公共交通,或绿色空间)是一个重要的决定因素。此外,位置满意的效果似乎是不同的根据旅游者的经验和旅行中描述的类型的评论。
包括货币因素,客户财务敏感的属性是舒适,员工,和服务(38]。至于廉价酒店,特别是胶囊旅馆吸引背包客和年轻的游客,人们已经发现,价格和便利的服务鼓励客户回购产品和分享积极eWOM [39]。然而,价格因素是不会受到主人的声誉转达了在线评论,虽然在P2P声誉的优点是非常重要的旅游体验,因为服务是密切相关的个人举办的技能(40]。
2.4。大数据和机器学习服务的客户满意度
在过去的几十年中,许多研究已经致力于客户满意度影响因素的研究使用收集的数据通过传统问卷调查和访谈,这意味着缺乏经验数据迫使研究人员专注于少量的相关信息(11]。
莫罗et al。41)指出,社交媒体和opinion-sharing平台的出现导致了一个欣欣向荣的世界大数据的消费者已成为生产者的内容分享他们的产品或服务的意见已经测试。的确,大数据已经成为一个热门的研究领域,可以增加相当大的价值,企业和社会,一般而言,无论是在空气污染监测领域,帮助在生活中,灾害管理系统、智能交通等(42]。这些数据通常需要采集、清洗、聚合建模和解释,提出新的挑战,从这些大规模数据获取有意义的结果,在这种情况下,计算能力而言,面对数量、异质性和速度数据,描述这一领域(43]。
这个巨大的大量数据,手动收集它们是不可想象的。在这方面,一些Facebook或Twitter等社交网络平台提供api,促进数据提取。相反,对于平台不提供这样的解决方案,取消似乎解决大批量的数据恢复。
这些大量的数据逐渐改变研究方法在酒店业已经做了许多其他领域的研究,主要采用新的分析工具(11]。郑et al。44)调查数据分析的有效性,以便更好地理解酒店客人体验和满意度之间的关系,发现几个客户体验维度有新的和有意义的语义成分。此外,在这个巨大的质量数据挖掘megadata可以产生新的信息变量,在现有的酒店都已经被广泛地研究过了文学。
结合其他学科形状数据科学机器学习、文本挖掘等,大数据可以通知非常具体的特性允许预测某些方面有关旅游业的发现等影响客户满意度的因素(4]或诱导因素的确定取消预订的45]。
最后,大数据的实现方法在旅游行业,特别是短期住宿部门构成Airbnb的行动,可以突出显示最相关的属性有关的服务质量,可以建议适当的战略优先考虑利益相关者的行为和决定这段来提高服务质量,让客户体验更好。例如,Ranjbari et al。46)能够映射Airbnb的服务质量进行两阶段的一项调查,之后,除此之外,一个定性的方法,他们采取数据挖掘过程应用到大数据集的Airbnb顾客评论或(47]的研究观察的属性影响Airbnb客户体验通过分析成千上万的在线评论运用层次聚类算法,从而帮助说明如何使用大数据发现,促进参与共享经济的属性。
最后,机器学习技术被广泛用于预测震级与旅游业有关。例如,Kalehbasti et al。48]试图想出表现最好的Airbnb价格预测模型基于一组有限的功能使用,其中,线性回归和支持向量机回归。研究产生了一个有前途的结果的精度给定数据集的异质性。
3所示。方法
我们的方法包含收集Airbnb的客户留下意见和成绩。然后将这些数据清洗和过滤,因此只有那些评论是用英语写的。我们接着段他们为了演绎客户所属的类别。最后,我们训练两个回归模型,以计算顾客满意度的指标上的得分表演之前使用神经网络预测的分数与以前所使用的两种算法。
3.1。数据收集
本研究的数据收集从Airbnb [12)报废数据网站,这是一个调查报告关于租赁Airbnb的财产。这些数据,传达信息相当丰富,涉及到房屋坐落在伦敦。除了住宿和他们详细的特征(如类型、地区和主机名),数据也包含日历的预订和客户订了这些属性的分数和观点在2009年12月和2020年4月收集的数据的数据集包含86357个住房单位分布在32区和1513966客户留下评论。图1举例说明了一个交叉引用和聚合后的信息检索示例包括看来,整体分数(评级),小学成绩由客户指出。
3.2。数据清洗和过滤
确保一个可接受的水平的相关性的数据收集,只有客户的意见不存在缺失或不一致的领域。然后,我们过滤评论用英语写的。要做到这一点,我们可以进行语言识别的基础上,识别使用字典的单词;然而,该方法需要一个大字典,此外,它需要一个相当大的处理时间。因此,我们使用的概率的计算方法基于发音的语言使用朴素贝叶斯算法和字符语法特征。这种方法已被证明其性能令人满意的检测速度和精度99.8% (49]。
尽管该方法用于检测语言相当快,但是考虑到数量的意见进行分析(1513966意见),所需的计算时间执行此处理仍然是重要的。因此我们保留100000评论即可使用(图2)。
3.3。根据客户类别细分的评论
我们面临的一个主要的限制是事实,收集到的数据从内部Airbnb没有传达客户的个人信息,甚至预定了住宿的人的数量才能推导出类别(个人、夫妇或家庭)所属。事实上,唯一的个人数据,数据集包含了评论家的名字。相反,关于住宿的信息非常丰富和完整。考虑到这一点,我们决定分析评论使用自然语言处理(NLP)算法找到的线索可以帮助我们推断出最合理的客户所属类别。
首先,我们孤立的顾客的意见应该是“个人”类的一部分通过使用语法依赖性分析(50,51),可以突出句子的句法结构和它的元素的关系维护。我们试图确定受试者暗指依赖树中的第一人称单数,图中的示例所示3。
最后,我们能够段38543评论所谓的客户属于类别的“个人”。
我们要注意,我们还可以治疗其他语法方面,如补充,但由于上述方法,我们估计过滤评论的数量是足够的对于我们的学习。
剩下的两个类别(夫妻和家庭),我们并没有发现NLP方法或算法允许我们进行预期的分割,所以我们继续通过正则表达式字符串的处理使用关键字,如“我的家人,我的妻子,和我。我们可以分离的家庭夫妇和10874年的5495条评论评论。
为三个类别,我们有手工测试执行通过分析随机样本的意见来评估我们的方法的性能。
剩下的评论100000年最初的选择(占一半)不包含足够的事件来确定他们的会员(图2)。
下一步是火车两个机器学习模型基本分数有关的评论选择为了计算后者使用回归算法的权重。
4所示。规范方法计算系数
基于权重的回归模型将允许我们,在我们的研究中,计算每个在Airbnb满意度指标的权重系数。
4.1。回归算法
机器学习,它是一个人工智能模拟人类认知过程的一部分,是一个学习领域,使机器自动化智能任务和从大量的原始数据中提取知识。机器学习是目前用于许多领域,如经济学、医学、气象学。根据连续性或自由裁量权模型的输出,可以使用回归和分类算法。在我们的例子中,输出定义了一个分数在100所有的中间值是可能的。因此,我们采用回归算法。
回归方法建模一个变量(称为目标)根据独立预测因子(称为特性),所涉及的算法试图找到变量之间的因果关系。回归算法中,我们找到了多元线性回归(高)和支持向量机回归(SVR)。
以下4.4.1。看不到多元线性回归(MLR)
多元线性回归或只是多元回归是一种统计方法,它使用一组变量来预测结果。其目标是模型解释变量之间的线性关系是独立和响应变量是相关的。从本质上讲,高钙是最小二乘回归的扩展,需要多个解释变量(52]。近期作品如(53)利用高钙的力量建立可靠的和决定性的模型,特别是在旅游业。
4.1.2。支持向量机回归(SVR)
介绍了支持向量机Vapnik和他的同事在1992年最初解决分类问题。它是应用在许多领域,科学,和行业分类和识别模式(54]。其原则扩展到回归为了建立预测。它依赖于内核的把戏在输入数据绘制到一个新的多维空间,它的目的是找到最优的数据适合和预测(52]。
4.2。模型规范和数据研究
考虑额定的六项基本指标由客户(准确性、清洁度、签到、沟通、位置和价值),哪些是提供收集的数据,我们计划来识别对总分的影响程度,取决于客户的类别,通过计算各自的权重。在我们的研究中,我们总结了总分使用以下模型: PRS, CLN,嗯,COM, PLC,瓦尔表示,分别精度、清洁度、值机、沟通、位置、和价值β1,β2,β3,β4,β5,β6各自的标明每一个指标的权重系数相对于总体得分。
图4说明了总分的表示(100)的规模基本分数的函数(10)的规模根据客户的类别。
我们已经训练两个回归算法,多元线性回归(高)和支持向量回归(SVR),为了计算系数作用于每一个指标,从而确定这些影响的程度总体得分。的这两个算法,进行培训/ 3阶段为了定义适当的模型为每个类别的客户。训练数据是用于部分致力于细分,即38543个人评论,评论为夫妻,5495和10874评论对家庭。输入我们的模型是6小学成绩指出由客户(准确性、清洁度、签到、沟通、位置和价值),并输出总体得分。
5。结果
数据集分为两批,训练数据和测试数据,用百分比分别为80%和20%。训练和测试数据的选择是完全随机的。
训练后我们的两个模型,我们能够获取表的精度1使用R2分。说明相当接近使用的两种算法精度的三个研究类别。
表2说明了使用高系数计算和SVR算法根据客户指定的类别。这些系数的平均值也因为我们计算估计,他们将在随后的解释对我们有用。
数据5和6分别代表的分布系数根据六小学成绩使用高钙和SVR算法根据客户的3类进行了研究。
总的来说,这两个算法给相当一致的结果对六个指标进行了研究。在下面,我们现在这些结果,把每一个指标独立;他们一直在排名重要性的顺序(从最重要到最不重要)的基础上计算权重。
5.1。精度
根据结果,精度似乎是客户满意度的最重要的决定因素。系数对计算这个指标中最高的6个指标构成的主题研究。精密分数表明客户如何找到住宿的描述以及其他相关方面如社区或便利是真实的现实,并提供尽可能多的信息。除了描述写的主机,还有照片必须更新和说明住宿的现状。使用高的系数计算精度和SVR算法有各自的意思是2.298和2.334,并指出它是给它的家庭最重要系数为2.634和2.6,分别对高钙和SVR。
精度的重要性在客户的眼中已经明确在最近的一项研究发现,提供住房和环境信息对客户满意度有积极的影响(55]。根据Guttentag et al。56),Airbnb欣赏方便顾客寻找住宿,密切关注托管环境,他们可能会做出更好的决策,如果这些信息提供了一个可靠的和详细的方式。
5.2。清洁
清洁分数表示程度的客户满意的清洁和良好的整洁住宿。对于一些客户,清洁几乎是保健因素,因为它通常是与表的状况有关,床垫、枕头、地板上,洗手间,等等,这是一种最报告客户满意度的决定因素在酒店文献[57],尽管洛克[58)指出,顾客期望对清洁经常超过住宿场所提供的性能。
总体而言,我们的研究结果结合清洁是顾客满意度的一个重要的决定因素。事实上,清洁是第二个指标,是很重要的对于整体得分系数平均为1.845和1.866,分别对高钙和SVR。这两个算法,事实证明,这是夫妻最清洁的价值观影响系数2.048和2,分别对高钙和SVR算法。
5.3。价值
分数反映出满足客户的价值是相对于price-quality回家。事实上,酒店业的一个关键维度是定价。这是一个决定性因素在住宿行业的长期成功59]。然而,价格指标中使用传统的酒店行业,如星级或加入一个品牌连锁酒店,并不适用于P2P住宿提供(23]。正是因为这一原因,研究集中在识别P2P主机提供的价格决定因素在数码市场,在这种情况下,Airbnb (59]。
在我们的研究中,我们发现,使用高钙和SVR算法的平均体重计算值为1.81和1.799,分别。这些值非常接近清洁的权重计算。此外,根据客户类别的分布系数这两个指标(价值和清洁)几乎是相同的。事实上,它仍然是夫妻最受价值系数1.959和2计算,分别使用高钙和SVR算法。
值得一提的是,主人与客人可能认为租金提前分享便宜(5),这可能证明为什么我们的研究不是排名更高的价值的指标进行了研究。此外,小王和尼克洛59]提到,结果他们发现的基础上,提出了在P2P托管price-determining关系的复杂性提到P2P托管的价格的决定因素是不同于那些确定酒店价格。
5.4。沟通
沟通分数表明多少客人享受他们的主机交互迅速和频繁的可靠和准确之前和期间的问题。关于这个指标,我们记录的平均1.44和1.4,分别对两个算法高钙和SVR,我们看到,它是最重要的人给它的系数为1.626和1.8,分别对高钙和SVR。
根据朱等人,Madalyn (55,60),这一标准通常被认为是决定性的塑造和维护主机和客人之间的关系和构成形式的酒店被后者。通信也被视为一种促进P2P住房(主机和客户之间的信任23]。然而,桑托斯等人的研究。13]提到沟通(或客户机和主机之间的个人接触,一般来说)在保持经常把客户一个尴尬的位置服务的负面评价,这可能会影响服务的价值评估,特别是关于沟通。
5.5。办理登机手续
登记分数显示用户是否满意签入过程到达。根据Ranjbari等人和太阳等。46,61年),这被认为是客户满意度的关键指标,Airbnb公司所提供的服务质量。
在我们的研究中,这两个算法高钙和SVR生成各自的平均系数为0.789和0.867。不同的结果记录在个人和夫妇根据相关系数这两个算法。然而,后者同意有关家庭的重要性系数等于0.905和1,事实证明,这是家庭最受这个指标的影响。然而,总的来说,这个指标是在第五的位置,这表明它不是那样重要的以前见过。事实上,通过引用(62年),这可以解释为在登记方面,超过三分之一的Airbnb广告让客户自己注册;这意味着超过三分之一的客户不会面临任何登记问题,包括等待时间。此外,根据程和金63年),设施如自检提供了隐私和更灵活的选择,这减轻的重量登记指标与其他指标相比已经进行了讨论。
5.6。位置
位置得分表明客户是否满意住宿的位置。这个分数可以近距离的影响和交通、购物中心、城市中心等。它也可以考虑安全或噪声等特定方面。此外,这个指标可能取决于主机提供的描述的准确性(20.]。
酒店位置是一个重要的考虑因素在选择和是一个重要因素影响客人满意度和召回的旅行经历37]。在[64年),作者得出的结论是,预期的酒店位置点由旅行者(适合客人)安全、易于运输,和接近景点。
在P2P托管行业,位置是一个严肃的考虑顾客很多关注托管环境(55]。
然而,在我们的研究中,平均系数计算,分别使用高钙和SVR算法0.499和0.599,这把的位置底部的排名影响客户满意度指标。这两种算法用于夫妻和家庭给不同的结果。为个人,相反,权重的0.38和0.398,分别用高钙和SVR表明他们是最不受住宅的位置的影响。
这些结果可以解释,客户已经意识到的位置和环境住宿的情况,他们有一个清晰的了解感兴趣的便利和邻近的地方和空间。事实上,根据Guttentag et al。56),客户一般满意如果提供了更多的环境信息,并根据这些信息能够做出更好的决策。这使我们考虑一个好的描述位置的影响,这是由Airbnb本身表明位置上的得分可能取决于分数描述的准确性(20.]。
6。合成
在探究这些结果之后,很明显,客户对P2P托管的预期,在这种情况下,Airbnb,有很大的不同。数据的概述4和5说明了这些差异,尤其是3类客户之间的研究。基本上,满意度的决定因素的一般趋势几乎是相同的这三个类别,因为虽然有差异结果发现使用高钙和SVR算法,我们仍然看到所有列出的指标依次为:精度、清洁度、价值、沟通、值机、和位置,尽管这一事实,利用SVR算法,我们发现个人比价值更重视沟通,结果发现使用反向高的算法。然而,一些指标是清晰的,一样的准确性是家庭最重要的因素,其次是清洁和价值为夫妻,然后对个人通信。
7所示。预测的分数
的结果和由计算的权重法在小学成绩,这将是有趣的进行预测的总体分数一定的收集清单。因此我们继续的选择的样本24住宿已经保留清单类提供了在伦敦和属于4(私人房间,整个家庭/贴切,酒店房间,房间和共享),和我们计算的总分是由客户根据实际基本分数分配(表3)。这一点主要取决于客户的所属类别。因此我们继续预测总体分数使用在我们的研究中使用的两种算法,即高钙和SVR。为了巩固成果,我们也计算分数使用人工神经网络(NN)。预测的结果列在表中4。
我们的神经网络与30节点有三个隐藏层。这个配置,允许我们有最好的精度(表5)。
预测的结果证实该结论来自权重的计算作用于Airbnb的满意度指标的评级。事实上,尽管成绩的差异计算使用的三个算法(推广、SVR和NN),很明显,计算总分相同的小学成绩变化的基础上根据客户所属类别。
然而,如果我们注意某些上市的成绩,例如,l24岁获得10的6小学成绩,我们可能会认为成绩的总分值我们预测等于100年,但事实并非如此。的确,虽然预测的总体得分明显高于其他上市,小学成绩较低,获得的最高得分是98.194。这是家庭的分数将基于神经网络的预测算法。这可能意味着,客户满意度的决定因素超过Airbnb的六个指标评价。实际上,年龄可以是决定性的塑造方面的满意度。此外,这个指标的研究等工作(34]。性(33,文化维度36,65年),地理和心理维度的客户30.也会影响得分。
一些研究已经进一步通过学习游戏化集成到评论网站的影响,在这种情况下,在Tripadvisor [66年),如评级系统或徽章,原来这些特性可能影响旅客的行为当写评论。
更有甚者,房间的设计(33)和WiFi等特性给客户67年在他们的满意度产生重大影响。
总之,声称会太过不公平的总分的形状是完全基于Airbnb的基本分数表示。事实上,有一个更广泛的客户满意度的决定因素,我们必须考虑这些指标,和很多人一样,阐明影响这一复杂的因素感觉客户的满意度。
8。结论
鉴于Airbnb目前最大的短期租赁平台住宿和后者大大打乱了传统的预订系统,许多研究已经感兴趣的神秘顾客满意度的维度对P2P托管领域在过去的十年。
在我们的研究中,我们试图理解哪些指标确定客户满意度,考虑他们的类别Airbnb提供的住宿。因此,我们已经收集了大量的评论用户预订属性在伦敦2009年12月至2020年4月从Airbnb内部。后清洗、过滤和细分这些意见,主要使用自然语言处理(NLP)算法,我们使用回归算法,在这种情况下,多元线性回归(高)和支持向量回归(SVR),为了计算系数法在小学成绩由客户指出,影响整体分数。然后,我们模拟全球分数通过应用人工神经网络,以及两个算法高钙和SVR,真正的小学成绩分配给一个清单样本根据客户的三个类别之一。
结果表明,这些指标都被客户按照以下顺序:准确性、清洁度、价值、沟通、登记和位置。此外,这些指标变化的理解从一个分类到另一个,例如,家庭重视精度超过其他类别,夫妻感兴趣,除了精度,清洁和价值,重视个人通信是一个指标。
然而,很明显,6个分数被客户并不是唯一影响整体分数。维度,本研究不考虑,如年龄、性别、文化和地理维度的客户可以对顾客满意度产生影响,因此成绩归因于住房。是有用的采用本研究的方法通过考虑其他指标,以便更好地根据其类别包括客户满意度的决定因素。
然而,我们认识到,有一个限制的方式我们有分段顾客评论为了获得类别。事实上,我们已经在现有文献中搜寻算法,将允许我们执行这样的操作,但不幸的是,我们还没有找到任何东西。虽然测试的样品,我们需要手动确认类别成员都是令人满意的,这将是公平地说,科学方法将批准给更相关的结果。
最后,我们相信,这项工作可以帮助P2P托管领域的贡献,特别是通过Airbnb,为了更好地理解客户的期望来逮捕他们考虑它们所属的类别的目标是保证他们最好的体验。此外,Airbnb可以考虑实现一个新的评分系统,考虑客户的类别,这将很可能帮助未来的客户更好地做出决策提供了上市。相反,目前的工作为文学提供了额外的回答客户满意度的决定因素,尤其是在P2P托管的面积。
数据可用性
本研究中使用的原始数据下载http://insideairbnb.com/。然后,这些数据都做了很多处理通过Jupyter笔记本。如果有必要,规范及其执行结果可以从相应的作者。
的利益冲突
作者宣称没有利益冲突。