文摘
我们首先提取关键词主要目的使用文本挖掘方法,其次确定突出关键字从文本挖掘关键字提取分析,然后确认差异的影响影响公司绩效的关键字。结果如下。首先,关键词被发现显示特色。由于客户的关键词发布显示特定的趋势,相应的航空公司需要服务管理通过关键词分析识别服务属性。第二,突出关键字被发现从文本挖掘关键字提取。的一些关键字与营销绩效显著相关,但其他人没有。这意味着公司可以发现消费者的需求通过突出关键字和管理突出的关键字相关的属性将帮助改善公司业绩。第三,“推荐”应该特殊对待“满意”服务管理通过关键词。结果表明战略影响的实际商业环境分析行业使用文本挖掘关键字。我们相信这项工作,旨在建立共同点为理解这些分析跨多个学科视角,将鼓励进一步的研究和服务行业的发展。
1。介绍
随着互联网环境和移动设备的快速发展,出现了不可避免的变化的消费者的沟通方式。消费者形成自己的社区与SNS,指的是Facebook之类的社交网络服务,推特,博客等。这些网络服务被视为可靠的消息来源在大众媒体。社交网络已经变得越来越有影响力,消费者利用蠕虫通过社交网络的信息,这些信息在线交流的社交网络在购买决策中起着至关重要的作用1]。此外,当据说传统蠕虫交流是隐式或个人,网络蠕虫是更加开放和集体。由于社交网络的特点,达到信息的范围更广,信息的速度也更快。的重要性,积极响应消费者的网络蠕虫,因此,增加政府和社会组织以及企业。
在这种背景下,网上评论,消费者产生对SNS影响力意味着掌握消费者倾向蠕虫和建议。例如,消费者甚至阅读产品评论买书,属于经验产品的部分。前研究在线评论数据主要雇佣调查法或文本挖掘方法(2]。调查方法是使用,因为它会直接从消费者和明确的意见,但仅限于收集各种消费者的意见和潜在的意见。另一方面,使用文本挖掘的方法,调查方法的限制是可以克服的通过收集实际来自消费者的意见,并通过提炼数据来源于网络,它也可以帮助推断潜在消费者的潜在的意见。
文本挖掘,另一方面,是一个未知的和有价值的信息提取方法随机组织文本数据(3]。因此,它被描述为一个自动化工具,提取秘密信息从非结构化的文本数据格式,如邮件、评论、web文档、视频剪辑或图片(4]。最近,主要统计软件包和数据挖掘项目包括文本挖掘功能促进或简化这些非结构化数据的分析过程。他们提供预处理进行文本挖掘的函数和功能的总结和分类识别数据的模式,而且还提供了各种分析功能关联分析、聚类分析等。
重要的是减少数据在处理大数据。大数据并不一定需要发现重要的意义。重要的是适当的数据。我们研究的学术意义推导的办法以减少到适当的数据。当前文本挖掘方法倾向于补充这些限制,因此有助于推断管理含义在实际决策(5]。在这种情况下,首先推导出变量主要基于文本挖掘的关键字提取减少大型数据没有必要发现重要的含义,其次结合项目问卷调查,本研究将有助于显示实际的含义在航空工业的背景下。
2。相关的工作
2.1。文本挖掘
文本挖掘是指自动化的方法,从非结构化文本中提取未被发现的和有价值的信息通过分类或structuralizing文本(6]。通过在各种各样的领域从大数据中提取信息,连接在信息将被发现。这克服了限制发生通过简单的数据分析,使从大规模文本数据来识别潜在的意义。在这一点上,这些方法的重要性的增加,该方法可以用于显示实际的未来战略。
通过文本挖掘的方法,研究人员将利用不仅提取文本的概念,也要确定关系与其他概念和可视化的概念之间的关系。当前内容分析研究人员依赖项任意选择;因此,广泛收集分析数据,因此,是有限的,和外部效度也是不安全的,因为它依赖于数据的编码人员。然而,文本挖掘,一直被视为超越传统内容分析的局限性和使用在不同的领域使用大数据分析、社会网络分析、消费产品评审分析,和其他有用的方法。换句话说,文本挖掘中提取适当的变量来限制内容分析的分解。Netzer et al。7检查汽车品牌之间的关系通过文本挖掘和分析市场结构使用多维标度的方法。此外,Mostafa [8)分类的词汇通过3 d地图研究,证实了诺基亚等知名品牌的品牌情感,IBM, DHL通过社交网络文本挖掘。
文本包含单词和文本分析可以被描述为分析词语之间的关系。在这方面,文本网络分析也称为语义网络分析。也就是说,根据研究,它可以被称为网络的话,网络文本分析、语义网、网络的概念、网络中心词,文本网络分析或语义网络(9]。
文本网络分析,如上所述,补充了传统内容分析的局限性,提取潜在意义提供的文本。此外,文本可以结构分析的模式识别之间的关系意义和相应的关系可以通过分析可视化(10]。文本挖掘过程两个阶段包括数据处理阶段和数据分析阶段。数据处理阶段相关的数据收集和预处理,而数据分析阶段是相关的文本分析,从文本中提取重要的信息,从前分析和可视化信息和提取知识(6]。
通过这个过程,可以更加data-suitable大容量数据进行分析,使连续的比较实验研究。
2.2。消费者的评估标准的航空公司
航空业可以被描述为领域的互动,定制,和劳动力intensiveness相对低于其他领域11]。服务,产品相比,已经显示出无形的特色,异质性、不可分离性、非持久性(12]。换句话说,消费者无法看到或触摸购买了“服务”。此外,生产和消费同时发生,而且它不能存储,但即使熄灭后一旦闲置的生产。服务的性质,因此,感知到的服务评价或建议可以在航空工业领域是至关重要的指标。贾(13)进行了文本挖掘虽然中国众包在线评论社区,和49080对餐厅评级和评论进行检测时,发现高频单词,主要主题,次要的内容确定。文本挖掘后,多重线性回归来筛选出最有效的因素,影响口味,环境和服务评级。管理、引发协同效益的概念从客户评级和评论是参照市场从业者内外餐饮业。
在航空工业中,这些元素包括航班计划、费用,服务,守时,舒适的座位,常飞航线安全,可以在航空公司服务满意度的决定因素(国际航空运输协会:国际航空运输协会)。在研究香港和公园(14)因素决定消费者的满意度在航空公司服务包括准时、安全、礼貌的代理人,清洁设备,空间,理想的计划,该公司的盈利能力,可靠性提供的服务,和财务成本。此外,航班,登机过程中,空间和舒适的座位,航空餐,行李交付和售票过程也会影响消费者的满意度。根据研究,乘客体验航空服务往往比较和评估其总体质量的基础上提供的有形和无形服务的航空公司。这些因素将来自客户的文字在互联网?互联网评论基于匿名揭示消费者的欲望和揭示更多明确的事实。
航空工业本身可以被定义为一个交互度的服务行业,定制,和劳动力intensiveness相对低于其他领域15]。客舱服务是本研究的兴趣,然而,可以用高互动,描述高定制,和高劳动力intensiveness。因此,评估和推荐服务,消费者直接经历了将该行业的重要指标。一般来说,空中服务包括有形服务和人类服务,帮助乘客的旅行经历;舒适的座椅,空中员工服务、机上餐饮,娱乐服务,等等这些元素,在航空工业中是十分重要的,通过文本挖掘确定通过聚类分析和分类。这些研究提供了一个更现实的可能性研究通过结合文本挖掘和统计分析。
3所示。方法
3.1。研究过程
在这项研究中,我们进行了以下流程来确定核心关键词可以通过文本挖掘和发现是否核心关键词是很重要的一个公司(参见图的性能1)。首先,我们收集了客户在线评论和提取核心关键词通过文本挖掘方法。我们进行文本聚类分析探索提取核心关键词的含义。在那之后,我们进行了实证测试演示的核心关键词通过分析相关性的影响公司的营销业绩,如满意度、推荐信。
3.2。数据
本研究使用的航空公司客户的在线评论数据,这是全球航空服务评估机构提供的全在英国。本研究将在韩国和日本两大航空公司。数据的主要内容包括两种类型的数据。一种类型是文本数据包含客户使用空中服务后的经验。另一种类型的调查数据,包括评估服务,满意,推荐使用空中服务。在线问卷调查顾客最近航空公司使用。受访者被展示他们的机票确认。项目的客户满意度测量10 point-Likert规模,和建议的目的是衡量二项规模。
数据周期是3年,从2013年1月至2015年12月。在数据段,197评论朝鲜航空公司和214年评论日本航母。所以,本研究收集评审数据数据期间总共411人,用它们进行分析。收集到的数据中,文本数据被用于核心关键字提取和问卷数据被用于实证分析来验证核心关键词的影响。
的国家数量,受访者的附属,总共是32,和美国被发现是最(33.8%),紧随其后的是澳大利亚(12.7%)、英国(10.7%)、加拿大(6.1%)和新加坡(5.1%)。表1显示了前10个国家的受访者数量的基础上。
3.3。分析过程
为了分析文本数据,本研究两个进程执行。文本挖掘过程中提取词汇和文本聚类过程是基于提取的分析意义的话。
文本挖掘的过程是一个从文本文档中提取单词的过程数据和创建词。这个过程包括一步根据文本数据中提取有意义的单词。详细过程如下(6]:
3.3.1。文本挖掘的过程
步骤1(文本)治疗。这是创建词数据基于单词的过程中包含一个文本文件。 在哪里是词向量;D文件设置 ;和T是这句话 。
步骤2(提取词语)。这是提取有意义的单词通过分配权重的过程中出现频率之间的文件集。 在哪里词的频率t在文档中d。
3.3.2。文本聚类过程
另一方面,文本聚类过程是通过单词之间的距离聚类的过程。集群是集群成立后建立和调整。在这种方法中,(1)生成k初始数据域内随机种子,(2)创建k集群通过将每个观测与最近的种子的位置,和(3)调整的中心位置k集群使用的平均观察属于集群。重复这个过程,直到所有相关的观察,它可以使集群也有类似的观察相应的数量k。
步骤1(集群设置)。建立一个集群数据的随机种子,和集群分组之间的欧几里得距离每个数据基于近距离和种子。 在哪里是这句话 , 是集群组 ,和集群的平均值吗 。
步骤2(集群调整)。重置价值的集群和集群的位置调整通过使用集群中的数据的平均值。
4所示。结果
4.1。通过文本挖掘关键字提取
在这项研究中,进行一些预处理步骤来改善文本挖掘的准确性。
首先,文本数据的所有大写字母转换为小写字母统一文字。同时,我们删除不必要的特殊字符,如“@”,“\ \”,等等。和定冠词(“”)的不定冠词(“,”“一”),介词(”,“”,“”,“”,“等),和代词(“它”,“他们”,“他”等)也被删除。在这个过程中,共有3774个关键词提取。关键字是重新安排基于稀疏表示矩阵中的空白的比例,因为分析所有关键词很难解释有意义的结果。
有11个关键词基于稀疏0.8、19个关键词基于稀疏0.85、45关键词基于稀疏0.9、基于稀疏0.95和132年的关键词。在这项研究中,共计45关键词提取运用稀疏0.9,和用于分析。关键词太少不足以理解客户的行为,但是太多的关键词可以扭曲的结果那么重要的话。在这个分析中,45关键词选择考虑有用的解释而反映出顾客行为。
频率高的关键词是“好”,“座位”,“小屋”,“类”,“很好,”“舒适”“员工”等等。图2显示了这些关键字的频率分布,图3显示了这个词云关键字出现的频率的方法。
4.2。关键字分类的文本聚类
在这项研究中,我们进行了关键词分类分析的语义分析提取45关键词。结果如下。关键字分类是基于分层聚类,欧几里得度量关键字之间的距离的方法。
作为聚类分析的结果,45字分为两个集群。集群1包括服务内容如“席位”,“小屋”,“类”和“员工”提供服务。它服务evaluation-related关键词如“好”,“优秀”,“舒适”,等等。
另一方面,集群2包括更详细的服务内容,如“,”“电影”“饮料”,“检查”,“服务”,等等。也,服务evaluation-related关键词如“很大,”“很好,”“嗯,”“最好”“干净”等(见图4)。
图5显示了关键字的结果与两个集群基于可视化k——方法更好的洞察力。集群1中的关键词形成间隔除了彼此,和集群中的关键字2形成相对宽间距。和这两个组件解释61.83%的变异。
4.3。核心关键词的效果
在这项研究中,我们进行分析结合核心关键词提取的数据文本挖掘和问卷的数据来克服现有文本挖掘研究的缺点,为航空业提供实际意义。换句话说,因为核心关键词出现文本挖掘和聚类分析的结果可以被认为代表航空公司客户的在线评论,我们试图理解的意思代表关键词通过检查每个评估概念的影响在客户满意度和客户建议基于这些客户的评价。
分析,我们分析了影响的四个关键词,如“座位”,“员工”“小屋”,“和”类,“这是集群的主要关键词对应内容1客户满意度和建议。原因是形容词和副词关键词在集群1的关键词主要是关键字表示服务的结果。和关键字出现在集群2字处理集群1的服务内容的细节。所以,我们定义这些关键词在概念上包括在上面的四个关键词。
在分析模型中,问卷项目被用作变量。独立变量的问卷项目服务评价席位,员工,小屋和类。和因变量的满意度和建议在使用航空服务。
的结果分析,席位,员工,和小木屋被发现核心关键词对满意度有显著影响,但类没有(见表2)。换句话说,顾客的蠕虫(口碑)与座位直接影响客户满意度和员工服务。另一方面,航空公司的客户经常谈论类类型如头等舱和商务舱,但不影响客户满意度的类。
这意味着航空公司应特别注意座位服务,和员工的努力是需要补充他们的服务。它还表明,客户满意度可以通过关注改善服务环境因素在机舱内。
另一方面,席位,人员、客舱和类有重大影响的建议。和影响力,座位服务被发现有一个更大的影响比员工推荐服务。这些结果表明,座位服务也是一个重要因素在顾客推荐和服务的航空公司机组人员可以补充它。然而,小屋和类服务推荐(表上没有显著的影响3)。这些结果表明,尽管航空公司乘客很多谈论在客舱内的服务,他们没有真正与客户推荐推荐。因此,建议席位和员工服务尤其需要从他们的客户为航空公司提供建议。
5。结论
需要使用数据挖掘技术在航空工业理解消费者行为。也就是说,本研究利用文本挖掘开发了一个统一的理解关键字在航空行业数据驱动的方式。根据航空公司审核数据,我们提出了一个两步的过程中提取关键字的文本挖掘和分组聚类分析。具体来说,我们使用的组合指标和聚类算法进行预处理和分析文本数据相关关键词提取方法,包括文本从科学文献和新闻文章。本研究首先寻求识别突出关键字在消费者的一面使用文本挖掘方法对消费者的在线审查数据,然后确认关键字影响企业营销性能的影响。本研究不仅是研究搜索关键字(16),而且研究确定营销性能在航空工业通过文本挖掘服务类别的水平。结论和意义如下。
首先,关键字显示有独特的集群的特点。由于通过聚类识别特征的主要关键字,关键字被分为三个部分,包括航空公司提供的服务,每个服务的细节,和评估服务。换句话说,因为航空公司提供的服务,每个服务的详细信息在不同层次分化,它表明服务管理应围绕核心服务元素,可以认清为了提高服务评估。
其次,从文本挖掘中提取关键字被发现有不同与公司绩效之间的关系。换句话说,服务的席位和公司业绩的员工更重要比机舱或类。这些结果表明,舒适的关键是客户的需求在长途航空旅行和服务专注于舒适的座位或舒适的座位是企业绩效的重要因素。
第三,建议应该管理和满足特殊服务管理的航空工业。结果表明,关键字影响消费者的满意度和影响消费者的关键字建议发现差异和影响的程度也显示是不同的。换句话说,席位,员工,和小木屋是重要的因素来提高消费者的满意度和建议。座位是最重要的因素在消费者满意度和建议,但相对更多的员工和小屋是重要的消费者对消费者的满意度和座椅更重要的建议。这些结果表明,人类服务的船员,可以相对主观的,更有影响力的满意度。另一方面,座位是相对客观的建议更重要。
本研究提出了学术意义,文本挖掘的研究扩展了它的应用领域。目前专注于探索性研究,尽管这个研究已经扩展到研究领域的因果关系。此外,这项研究还提出了实际含义为企业有效管理关键词。尽管文本挖掘的意义和优势17),本研究有一定的局限性。首先,研究范围仅限于在韩国和日本两家航空公司。其次,由于审查客户自发产生的数据,收集的数据可以偏见和有限的活跃客户愿意表达他/她的经历。因此,在未来的研究中,选择需要更多的代表航空公司也减少便利的受访者需要归纳研究结果在未来。
数据可用性
文本挖掘的数据用于支持本研究的发现可以从作者要求。在这项研究中使用的数据是航空公司从Skytrax(评论和评级数据http://www.airlinequality.com)。
的利益冲突
作者宣称没有利益冲突。