文摘
近年来,“大数据”一词已经吸引了许多学者和企业管理者的关注,和大量数据的出现已经进入一个大变革的时代。服务质量和顾客重复购买意愿两个服务研究领域的热点问题。澄清这两个机制可以帮助企业与更多的客户建立长期客户关系通过服务质量的提高,增强他们的竞争力,提高企业绩效。根据实际消费者购买提供的数据,现有的数据集是视觉分析和处理消费者购买规则,构建特征,构建一个合理的消费者购买预测实验数据集。基于获得的实验数据集,一个消费者购买的目的是预测模型。根据实例的分析结果的单一预测模型,融合模型中单一模型消耗预测消费者的购买决定。为了证明提出的观点,建立了研究模型,提出研究假设,设计调查问卷,指的是文学和现场调查,和调查问卷的结果进行了实证分析。使用描述性统计分析的方法、因素分析、信度和效度检验,回归分析,假设服务质量直接影响顾客重复购买的目的是验证。
1。介绍
大数据时代的到来,信息挖掘大量数据已经成为信息技术领域研究的热点。大数据正在逐步改变人们的生活方式,工作,和思考,人们到一个资源整合的新时代1]。如果酒店想要生存和发展,就必须获得竞争优势(2]。大数据具有数据量巨大的特点,高处理速度、多样性,高价值,低密度。传统数据处理软件已经无法处理如此庞大的数据,因此云存储和云计算的出现服务器提供技术支持存储、分析、共享和传输大数据(3]。我国的酒店行业的整体竞争力相对较低。fef先生,国际酒店和餐厅协会主席曾经指出,与国外同行业相比,中国酒店业已经虚弱的自我推销意识,投资回报能力不足,技术含量高。有很多空白,如集团化程度低,缺乏市场价值的服务,等。因此,我国的酒店行业迫切需要提高整体酒店建立和发展长期关系。与客户建立长期关系可以解释如下:高服务质量可以让顾客感觉高消耗和满意,虽然高满意度可以鼓励顾客重复消费,他们不会购买竞争对手的产品,他们对价格的敏感性战争会减少(4]。
在发达国家,服务业产值在国内生产总值(GDP)的比例从1970年的53%急剧上升到2005年的66%。欧盟的47%和68%,57%和72%在美国,分别,这一趋势仍在继续。可以说,营销已经进入了服务营销的时代(5]。从理论和实践的角度来看,客户服务质量相关理论和重复购买意愿是深入探讨,以弥补缺乏酒店服务质量管理的概念在我的国家(6]。随着社会的不断进步和发展,客户感知也是动态变化的。然而,传统的酒店服务质量管理理念在中国的销售人员经常使它看起来在静态服务质量。一旦制定有效的服务标准化措施,认为这是可以做到一劳永逸,导致服务质量不能满足客户的需求。消费者和企业之间的业务活动进行直接通过互联网。这种模式下的电子商务消费群体大,基本上是没有一次性消费的平台(7]。用户具有高潜在消费者组织预测的概率高0.4 -0.8被认为是潜在的消费者,也就是说,消费者在这个范围内不会直接下订单但有很高的购买需求;用户提供一个预测概率高于0.8被认为是消费者,他们有一个高概率直接放置订单;用户提供一个预测的概率小于0.4被视为消费者基本上不需要货物(8]。过去,分析客户的产品购买行为基本上使用问卷的形式调查顾客的行为意向,但精度较低和工作负载是沉重的9]。根据客户产品购买银行记录的数据,使用数据挖掘作为一种工具来预测客户对金融产品的需求已经收到了越来越多的关注,但相关研究仍相对较少(10]。本文以活跃的豪华酒店为研究对象,和消费者数据挖掘和机器学习技术来预测高潜力的购买意愿,实现精准营销。豪华酒店提出的高潜力是区分消费群体有不同的预测概率。用户提供一个预测0.4 - -0.8的概率被视为高潜力,也就是说,在这个范围内不会直接下订单但有很高的购买需求;用户提供一个预测概率高于0.8被认为是那些有高概率直接放置订单;和用户的预测概率小于0.4被认为是那些基本上不需要这些货物。的终极目标是实现精确营销高潜力,但实际上预测所有的购买意图。
在这项研究之前,有以下营销传播平台和方法:(1)当商店或平台促销活动时,可以收到商家提供的优惠券或平台。(2)推荐产品较低的价格或相关产品根据消费者的产品添加到购物车。(3)基于内容的搜索推荐相关产品。上述营销模型是基于消费者搜索或推荐算法。在当前的背景下,企业可以在一个有利的位置在大数据经济只有通过使用大数据更好地,基于事实和经验决定。
2。相关工作
污染分析影响因素之间的关系集团采购和购买行为。特性分析的结果表明,更有可能购买商品有更多的评论和对消费者的限制,使指导建议商人的商业模式11]。帮派和Chenglin分析了网上那些购买书籍的行为特征,提出了一个协同推荐算法找到其他具有类似行为消费者下订单,从而达到推荐的目的(12]。把课程推荐在线学习环境为研究对象,杨消费者项发现项集相关内容,然后应用项目集的顺序模式。这两种方法结合推荐潜在consumerful和消费者反馈效果好(13]。Bilal等人认为,在网络平台上,消费者的行为对应页面跳转和其他反应,所以消费者的行为信息可通过分析博客获取。因此,以Ketao平台为例,本文开展数据挖掘在网络日志和提出了个性化推荐算法,从而增加消费者的粘性的平台14]。侯等人消费者RBF(径向基)神经网络对移动通信公司进行实证研究,提出了一种精确的营销策略。首先,规范数据,选择的关键要素细分通过因子分析,然后确定基本中心通过最近邻聚类算法,调整中心使用k - means聚类方法,确定RBF神经网络的中心,最后,建立客户细分模型(15]。从算法的角度优化,田和Youngsook提出一种改进的决策树算法。原算法只能实现局部优化当前的全局优化和验证该方法的有效性和消费者购买行为预测的帮助下Teradata平台(16]。赵等人提出了结合逻辑回归和支持向量机来预测网上购物行为。结果表明,组合模型具有更好的预测效果比单一模型(17]。陈等人使用基于击杀的融合算法和随机森林预测重复购买意图和获得较高的精度和效率。融合算法的预测具有一定的参考意义重复购买意向的消费者(18]。刘和白研究顾客感知未来销售的企业。研究结果发现感知价值的几个方面,即社会价值、功能价值、情感价值和程序价值,对购买意愿有积极的影响。同时,过去销售有很好的预测影响未来的销售(19]。赵等人及其他客户的感知价值是可悲的是分为两类,即享乐价值和功能价值。他们发现,客户的感知价值作为一个中型商场形象和消费者之间的回购意图,和商场形象影响顾客的感知价值,从而刺激顾客的reconsumption [20.]。
通过对国内研究现状的分析,发现消费者数据挖掘研究领域的电子商务仍处于探索阶段。仍然有很少的研究有助于商店根据预测概率。国内酒店、高端的地方,和其他平台每天都产生大量的消费者数据。研究消费者行为数据的分析和处理仍不成熟。特性工程是必要的工作从大数据中提取有价值的信息。与此同时,也应加强机器学习算法的应用研究。
3所示。方法
3.1。工程特点
工程是指酒店应用场景的背景下大数据,功能比算法更重要,数据比功能更重要,往往没有直接可用的数据。分析结果的主要影响因素的选择模型,可用实验数据集和特征的选择。数据的内在结构往往取决于高质量的特性。当模型不是最优的,大多数模型可以实现好的结果通过良好的培训与高质量特性和良好的内在结构的数据。这个过程需要大量的时间来观察和分析原始数据,并考虑潜在问题的形式和数据结构。数据的高灵敏度有助于研究人员更好的构造特性。提出了定性研究的理论模型,如图1。
从上述图可以看到,首先,提出相关假设的影响客户满意度,客户重复购买和转让的目的是全面分析。高质量的在线评论能更好地影响消费者的购买决定。根据理论的整合,它是合理相信在线评论的数量越大,就越能影响消费者的购买决定。网上评论的数量的和消费者评价产品或服务。人们普遍认为,关于产品或服务的评论越多,更多的关注产品或评论。它指的是评价产品或服务的一般趋势。如果有更积极的评论比负面评论评论,在评论通常是积极的。
研究主要包括消费者的消费数据表信息表,将产生大量的中间表中特征提取的过程。事实上,消费者信息表和消费者行为表也中间表,这是通过结合六个行为的数据表。例如,消费者的点击行为表明,获得的记录是在点击行为表中。consumer_id的表的主键,消费者登记时间是字符串格式,精确到天,和消费者年龄分为“15—18岁”“19-25岁”“26 - 35周不等岁”“36-45岁”“46-55岁”和“56岁以上”这六个年龄组,未知的年龄是由−1。例如,4月3日,2019年,它在消费之前应加工成时间戳格式;消费者的年龄、性别和年级都是枚举类型,和在一个炎热的编码在以后的数据和处理阶段被消耗;如表所示1和2。
有太多的类别下成为一个消费平台:10326总共约有3500每天实际记录的行为。因此,如果我们分析所有数据在所有类别和估计的三个行为人均6000万每天主动语态,每天大约有1.86 e12汽油的行为记录。数据分析和参与计算消耗大量的资源,和某些类别的消费者操作特征在不同类别将会完全不同,所以就目前而言,选择一个类别下的消费者行为数据进行分析。在选择数据的时间范围,尽管,原则上,完整的数据作为数据集,事实上,消费者的行为在未来五天基本上是与消费者无关的行为一年前甚至一年前的一半。因此,所有历史数据中不消耗特性工程这项研究的一部分。为了细化研究,本文首先选择关键指标,影响酒店消费者的购买决定利用AHP然后让下一个分析。分析阶段的功能是对数据进行统计分析基于一个或多个点的信息。从数据图,它可以分析功能是否有意义,同时,新特性可以开采。当消费者需要预订酒店,他们也需要获取酒店信息。获取酒店信息的一个重要参考网上的评论。 These comments are basically published by other consumers according to their own check-in experience, but not every comment can provide consumers with consumer full information, which depends on the quality of the comments. We selected several representative features for mapping and analysis, namely: the age of, the statistics of the number of placing orders within two weeks of registration, the statistics of six kinds of behaviors of five days before placing orders, the number of clicks of to buy goods five days before placing orders, and the statistics of the number of adding goods to shopping carts before placing orders. The horizontal axis of Figure2代表了年龄,纵轴代表的人数的比例相应年龄组。从图可以看出,年龄集中在26 - 35周不等岁占56.23%的总排序,其次是19-25 36-45,所以消费者的年龄可以是一个消费者的全部功能,如图2所示。
3.2。基于LR的分类预测模型
预测函数具有高速的特点,为新数据简单性和较强的泛化能力。它是一个线性二元分类模型映射的结果线性函数的折中观点函数(乙状结肠功能)。人们普遍使用的问题预测消费者是否会购买产品与消费行为。算法的预报函数公式所示。
公式的值的范围是在−1和1之间,表明结果的概率值是1。在这篇文章中,这意味着预测消费者购买概率。大于或等于0.5意味着购买,小于0.5意味着没有购买,和意味着结果的概率值为0;E是回归参数,旨在获得一组适当的0系列。中所示的示例生成概率公式。
最大似然估计被估计的参数LR,和样本的似然函数公式所示(3),这意味着米训练样本来估计处理θ。
的公式,米代表样本的数量,l(Θ)代表的概率米样品发生在同一时间,转换为对数似函数如公式所示。
消费者梯度上升的最大似然估计方法来找到(Θ)最大Θ,一些研究提出了损失函数 ,消费者的随机梯度下降法来解决这个最小值。迭代更新的过程E见公式(5),代表了步长。
体重坳消费指定重量训练集功能表中的列。这个参数的作用是平衡正负样本的比例。正负样本权重的计算方法这重量列公式所示。 重量是阳性样品的重量,Ns样本的数量;C的价值,类别的数量吗C在这项研究中是2;Nt是积极的数量样品。相应地,重量是负样本的重量Nf是负样本的数量。模型规范化培训功能。假设类的比例K对应于当前样本集记录为D表示为pK(k= 1,2,…,Y),基尼价值可以表示为宣传。
基尼指数的计算公式表示为一个公式。
模型的性能措施通常在回归问题主要包括平均绝对误差,均方差和均方误差,均方根差和平均绝对百分误差。(1)平均绝对误差(MAE) (2)均方误差(MSE) (3)均方根误差(RMSE) (4)平均绝对误差百分比(日军)
射频消费者然后构造决策树。当节点搜索功能分割,它随机选择一些特性来找到最优解,它适用于节点分裂,也就是说,它随机样本的样本和特征,以避免过度拟合。如果它是预测的分类算法,最后一类预测类别或的一个类别最多的选票T基本的学习者;如果它是由回归预测算法,模型的最终输出的算术平均回归的结果T基础的学习者。射频的施工过程,通过上述过程如图分类问题3。
它可以看到从上面的回归模型评价指标,它是广场上操作,加强大型数值误差指标的影响,从而大大提高了指标的敏感性。Becaconsumer RF算法随机选择决策树节点的功能分区,它甚至还可以训练模型有效地的高功能维度。结合数据集实例化的结果,根据混淆矩阵F计算评价模型被选中。
顾客感知的价值不仅是成本或收益,还全面权衡收益和成本的结果。也有很多研究使用这种权衡指标。品牌偏好更的表达客户的态度和倾向。这种态度超越客户满意度。不仅仅是客户的情绪反应,也表达了他们的情感爱通过这个首选品牌。从预测的目的,有必要知道至少有三个方面的信息:consumer_id信息,item_id、交互信息和消费项目,作为三个基本功能组。只有商品的特性由数据低歧视商品,所以item_category再次统计的特点根据商品所属的商品类别信息。商品类别的商品可以满足消费者的需求相同类型的购买,所以商品类别的信息可以补充商品信息。此外,由于大量的数据对大宗商品类别、商品类别特征有高度的歧视对大宗商品不同的商品类别。在以下:商品的性能特点和商品类别特征从六个方面讨论:数据稀疏,不同类别的商品的差异化,差异化的相似类别的商品,行为转化率,炎热的销售趋势,并支持计算消费者相似。
4所示。结果,分析和讨论
实验数据来自真正的脱敏JDATA算法的主题提供的数据竞争,JDATA算法是JD.com的电子商务平台。同时保持快速发展,积累了数以百万计的忠诚和积累大量的真实数据。如何找到规则从历史数据,预测未来的购买需求,让最合适的商品满足人们,谁最需要他们的应用程序中的关键问题是大数据精确营销,以及所有电子商务平台所需的核心技术为智能升级。这种竞争需要一个特定问题的精确的建议作为一个例子,希望能找到数据挖掘领域的顶尖人才和运行在顶部的波。在A / B有两个数据集列表,这是由浏览、订单,评论,大宗商品的基本信息,和一年内的基本信息。与预期目标相结合,它分为两个阶段:预测消费者是否会购买指定的商品下个月和预测消费者的第一次购买日期谁会购买指定的商品。Becaconsumer原始数据不能满足研究的两个阶段,原始数据集是进一步分析和处理。结合的统计结果浏览浏览,A和B之间的距离在图列表4预测的数量的趋势浏览指定的产品日期最后一次在这个月的第一个月。可以看出,A和B的浏览模式列表是整体一致,和浏览指定的项的数量从月初到月末正在上升。64097浏览列表的指定产品。这是总人数的64.97%。同样,有55064 B名单中浏览指定的产品。这代表的总人数的55.66%,如图4。
的具体购买日期的最后购买指定产品在图A / B列表中4对应于消费者的美分的变化趋势。结果表明,浏览数据的变化趋势图5通常是符合整体上升趋势,但变化是更大的在本月底,考虑到季节的影响消费者的购买决定。
本研究筛选45特性(212维在一热编码)从现有消费者肖像功能表,如消费者的婚姻状况、是否有孩子,孩子的年龄,是否有一辆车,上个月的单件服装/个人化妆/年级,消费者忠诚度,提升的灵敏度。训练预测结果如表所示2(2019年数据)。从表中可以看出,准确率、召回率,和F1值添加消费者特性后略有改善。当维特标志从646减少到40岁,这对模型的预测效果影响不大;新的消费者肖像特征有助于提高模型的预测精度如表所示3。
从上面可以看出,不同类别下的模型的预测效果是不同的。通过分析表3,可以看出,模型只适用于休闲鞋类数据,和其他类别的预测效果需要改善。然而,消费者的浏览和订购行为在正常几个月数据显示逐渐变化的趋势,也没有突然增加在某些行为数据。本文简单地消除这些数据如图6和7。
根据上述数据初步分析结果,并结合经验和业务理解、重建数据集。预测消费者是否会购买指定的商品下个月和第一个购买日期的消费者会购买指定的商品,重建两个预测标签,消费者是否会购买在当前月份(购买记录为1,nonpurchase是记录为0),也就是说,第一个_ _ _不买;消费者的第一次购买日期在当前月,first_buy_day。这个实验构建254新特性和两个标签。从基本功能主要完成功能建设,消费者行为特性,和时间特性;(1)基本特征:它主要提取消费水平,消费年龄,和消费区域信息,并提取商品参数信息,商品价格信息,对大宗商品和大宗商品领域信息为基本特征。(2)用户行为特征:用户行为特征:用户行为主要包括浏览、订单和评论。(3)时间特性:提取去年购买日期,平均浏览日期,最后浏览日期、平均购买日期,第一次购买日期的第一个月,平均价值的评级日期、等功能。
摘要消费者的理论知识和数学模型来分析大量的消费者数据,预测消费者的购买行为的帮助下一种机器学习算法,发现规则的历史数据和预测未来消费者的购买需求。初步实现了预期效果,模型已经应用于购物平台。的模型是优化两个方面:功能和模型。添加消费者肖像的特性和模型融合之后,预测准确率、召回率,和F1的模型提高了约0.03与优化前相比,也就是说,当前预测F1稳定在0.28左右。虽然本文不涉及产品的建设和选择特性,基于本文的研究结果,酒店可以进一步分析消费者的行为特征的产品根据产品类别数量背后的具体含义。例如,根据预测的结果信息,如接待,频率,和货币在RFM模型中,类有一个高概率的购买商品,他们可以市场中那些没有购买购买周期,而不是购买。
5。结论
通过酒店的实证研究,本文发现,顾客经常光顾酒店的收入水平主要是上述中间水平。Becaconsumer食品和饮料的质量与人们的健康密切相关,价格敏感度不高与其他服务相比,但是他们更关注收入和成本之间的权衡。依靠这些数据来发现”采购模式和选择一个合理的预测方法来解决消费者购买预测的问题,不仅提高了消费者的粘性的平台和智能指导商人”库存还带来了积极影响今天的个性化营销。酒店的理想水平的实证研究质量和渴望质量,客户会觉得酒店所提供的服务是值得的钱。他们会惊讶意外收获,所以他们提供的服务非常满意酒店,赞扬酒店的服务,逐步形成对酒店的信任,继续重复购买。更高的科技含量将加强服务质量的有形的维度,从而提高服务质量作为一个整体。就像有形商品的生产不能成为一个世界级的品牌没有一流的技术,最高的酒店技术当然可以所向无敌。在处理消费者行为数据,构建一个网上购物的过程中预测模型,逻辑回归算法的优点是,它比线性回归预测更准确,运行速度比其他算法支持向量机等。通过聚类,对预测精度的影响在一定程度上减少。因此,如果未来的研究可以结合数据驱动的机器学习理论驱动的实证研究,研究人员不仅精通算法,而且还深入高端酒店的运作,了解相关的业务背景,并结合算法与业务,使更多的实践研究。
数据可用性
使用的数据来支持本研究的发现可以从作者获得。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作是由基金支持项目1:2020年凯里学院“优秀办学特色”特殊项目(工程和实践项目):山茶油的价值认知和购买行为研究贵州东南部——基于消费者调查(项目没有。2020:2020 gkzs02)、基金项目2:凯里学院特殊项目“新冠状动脉的反应,治理和影响肺炎疫情和其他公共卫生事件”:实证调查和研究新的冠状肺炎的影响贵州重点行业(项目号:YQZX201902),和基金项目3:2019特殊项目的“博士教授服务组”凯里学院:山茶油产业调查和研究黔东南州(项目号:BJFWT201902)。