文摘

移动互联网技术的出现和广泛使用,导致许多不同种类的新的移动通信服务,等微信。用户可以有更多的选择在试图满足他们的通信需求。预测的用户将使用新的移动通信服务非常有价值的移动通信服务供应商。在这项工作中,我们提出一个方法来预测用户将如何使用一个新的移动服务。我们的计划是受进化博弈理论。与现实世界大规模数据集收集的移动服务提供商,我们首先提取benefit-related特性的用户开始使用一个新的移动服务。然后我们设计我们的训练和预测方法预测潜在用户。我们评估方案使用试验和大规模的真实数据。结果表明,我们的方法可以预测未来用户的行为与令人满意的精度。

1。介绍

随着移动互联网技术的发展(1- - - - - -3)和大规模分布式系统(4,5],许多新的移动服务提供各种各样的供应商(6,7),包括传统服务提供者和网络服务提供者。用户通过数据域之间的通信通过互联网连接被称为“在顶部(OTT)”通信。这些新类型的移动服务为用户提供更大的选择范围。腾讯通过提供通信服务微信QQ,而由于4 g技术的发展,中国移动开始通过回技术提供通信服务。例如,作为最受欢迎的奥特通信服务,微信每月大约有820万的活跃用户2016年10月。超过60%的微信用户开放微信每天超过10次。微信用户每天大约5亿条消息。这些服务提供商之间的竞争正变得越来越激烈。

用户可以根据自己的喜好选择合适的移动通讯服务(8,9]。能够预测的用户可能会使用一个新的移动通信服务将是非常有用的移动通信服务供应商。这将有助于服务提供商了解消费者的需求和要求,根据用户的喜好,提供个性化服务和改善产品的特性和竞争政策。因此,预测方法的用户将使用一个新的移动通信服务,以准确和及时的方式,已经成为一个服务提供者共同关心的话题。

有很多研究都集中在预测用户的移动服务的行为。一些研究人员研究的原因和影响因素的用户移动服务。一些研究工作研究的预测应用在手机中使用。一些方法来预测用户使用移动服务的方式。然而,这些方法无法准确预测的用户将使用一个新的移动服务。主流公司,如谷歌和苹果使用信号模型考虑会话持续时间、操作每个会话、位置和设备数据预测移动服务的使用。为了预测用户行为与新的移动服务,我们增加了网络侧数据,提炼数据使用,提高了预测模型。

在这项研究中,我们首先分析用户的行为的特征并提出我们的概念预测用户将如何使用一个新的服务。我们提出一个模型来预测用户的行为当使用一个新的移动通信服务基于进化博弈论。我们提取特征的角度来看用户的动机在使用一个新的移动服务,根据用户的行为数据,训练模型来预测潜在用户和重型用户的新服务。然后,我们将用户划分为不同的组根据用户的特征,训练模型为每个组的用户获得更好的性能。我们评估我们的方法的性能与实际用户的使用行为数据集。结果表明,我们的方法可以预测未来用户的使用行为达到高水平的准确性在相对较短的时间。

本文组织如下。节2,我们将描述与移动服务相关的其他研究预测。节3详细,我们定义要解决的问题。节4,说明我们的思想和方法进行预测用户的行为对一个新的移动服务。部分5描述所使用的实验来验证我们的模型。最后,我们总结一下我们的工作6

更好的理解用户的行为具有重要意义。自移动即时消息服务成为一个重要的通讯手段,相关研究人员已经开展了许多有趣的研究分析用户的行为。例如,Oghuma et al。10]研究用户的持续的意图使用移动即时消息。通过应用一个期望确认模型,他们指出,服务质量将影响用户满意度显著,和他们(11]解释一个新用户的持续使用意图与benefit-confirmation移动即时消息应用程序模型。Ogara et al。12]研究了主要因素影响用户满意度的移动通讯服务。他们表明,经验和社会因素是主要影响用户满意度。郭和日元(13]研究了消费者的行为意图采用移动增值服务。香港et al。14]相比效率的期望确认模型和接受模型为理解正在进行的服务使用的行为。在这些研究中使用的数据从用户调查,收集这些数据直接反映用户的意图。

许多以前作品研究用户的行为是相关的移动应用程序(15]。太阳et al。16]研究了移动应用使用功能对比分析预测问题。实现一个动态的主屏幕应用程序中,胫骨et al。17)建立了一个预测模型(18,19)应用在移动情况下的使用。朱et al。20.]研究服务使用模式从用户的角度,提出了一个应用程序使用预测方法。廖et al。21]预测应用程序使用的应用程序时间特性模型,和他们(22]提出了一种预测方法,应用程序是最有可能使用temporal-based模型。徐(23)中国移动用户行为预测方法的提出了一个基于时间序列分析。Kloumann et al。24]分析了时间和社会概要文件应用程序使用预测问题。这些方法预测移动应用程序的使用,根据收集的数据从电话手机,非常有价值的预测的方式使用一个应用程序(25- - - - - -29日]。

一些研究集中在预测用户的移动服务的使用。哈达德et al。30.)提出了一种预测周期性消费行为基于毒过程模型。瓦勒拉和Gomez-Rodriguez31日)开发了一种方法来预测采用和类似产品在社会网络的使用频率。

我们的工作不同于先前的研究。我们的工作涉及的动机的预测用户的行为,当一个新的移动服务市场上提供。很难预测用户的使用行为从使用跟踪数据可用使用跟踪数据的数量是不够的。数据用于预测我们的工作获得了从移动服务提供商,因此如何充分利用这些数据来确定一个用户使用一个新的服务的动机是我们工作中的关键问题。我们的灵感来源于动态博弈论概念(32- - - - - -34]。泰勒和彼特(35]研究游戏的进化在动态情况下,由微分方程描述系统的状态。Goyal et al。36)提出了博弈论的框架来研究初始采用竞争产品。

3所示。问题定义

这项工作的主要目的是来预测用户是否会继续使用一个新的移动服务用户开始使用后,用户是否将成为一个高频的用户新的移动服务。我们所说的用户将继续使用一个新的移动服务的“潜在用户”的新服务,当用户将使用一个新的服务在高频率是一个“沉重的用户”的新服务。收集到的数据从一个服务提供者包含每个用户的活动 使用服务 在时间 。从这些数据,我们可以确定使用时间 和数据流 为用户 使用服务 在一段时间内 。当我们把两个参数水平 为用户 使用服务 在一段时间内 将方程使用水平 在哪里 体重因素和吗 是归一化的因素。当第一次的时间 使用新的服务 足够长, 可以连续使用水平 。为用户 使用一个新的服务 ,连续的方程使用水平 在哪里 用户是第一次吗 使用服务

我们首先需要识别潜在的和重型用户从我们的训练数据集。我们提取用户的使用数据的开始当用户第一次使用新的移动服务直到点当用户有足够的时间来熟悉新服务。然后我们将潜在用户标签 和重型用户标签 通过设置一个用阈值水平

随后,我们可以应用用户的标签 根据是否该用户是一个潜在的用户或用户。我们想要解决的问题是如何预测如果用户将是一个潜在的用户标签或沉重的用户一开始当用户开始使用这项新服务。这是一个分类问题,让我们来预测用户的概率 继续使用一个新的移动服务,也就是说,潜在用户的概率 和用户的概率 作为一个高频用户新的移动服务的,也就是说,重型用户的概率

我们使用的数据集收集从服务提供者。这些数据包括用户的行为和用户的连接技术参数为新服务。

4所示。方法

在本节中,我们首先提出预测用户的使用行为的概念新的移动通信服务。然后,我们介绍一个方法解决预测问题,包括特征提取和预测方法。

4.1。预测模型

我们需要预测用户的功能使用行为的准确和及时使用收集的数据服务提供商。很难预测用户的特性在初始阶段当用户使用行为仅仅是开始使用新的移动服务,因为没有足够的使用行为数据。

我们的方法是基于直觉的概念是,用户的动机导致使用他或她的行为可以通过进化博弈理论来解释。进化博弈理论研究生物物种如何选择他们的控制策略和做出更好的决策。生物物种的基本概念是将决策在面对多种选择根据他们的战略利益。当一些人尝试一种新的策略,他们将评估新战略的好处。如果新战略的好处是大于另一种策略,将会有更大的概率策略被再次使用。当的意思是一个物种的新战略的好处是大于意味着对所有的物种,新战略将成为进化稳定策略,和新策略的比例特性之间的物种会逐渐增加。

面对这个问题,用户将评估新服务的感知利益基于他或她的经验当他们第一次尝试使用该服务,和好处会影响用户的使用行为的新服务。因此,我们可以预测用户从用户的使用行为动机的视角。我们从服务提供者和分析获得的数据提取功能从用户的体验和benefit-related数据。

4.2。特征提取

通过研究影响用户体验的主要因素和移动服务的好处,解决相关工作,我们确定了四类因素极大地影响了用户的体验和福利,包括服务技术因素、服务因素的能力,互动因素和成本因素。的符号特征提取(37,38中列出的符号。

4.2.1。准备服务技术特性

移动服务的服务技术特性包括端到端延迟,连接速度和传输速度会直接影响用户的体验当使用一个移动通信服务。从用户的连接技术的数据集,我们可以提取服务技术参数,之后我们把这些参数归一化特性来表示服务技术特性包括端到端延迟特性,连接速度特性,传输速度和功能为每个用户在使用这项新服务。这些特性被计算在一段时间内,通常一天。服务技术的特性描述是列在表中1

端到端延迟特性估计的平均端到端延迟,每次用户 使用服务 在时间内

连接速度特性估计的平均连接速度,每次用户 使用该服务 在时间内

传输速度特性估计的平均传输速度为每个用户的时间 使用该服务 在时间内

4.2.2。服务能力的特性

服务能力特性表示用户可以来自一个新的服务中受益。我们比较新的服务使用相同类型的其他服务,然后估计这项新服务的服务能力特征。这些特性被计算在一段时间内,通常一天。功能描述表中列出的服务能力2

的使用频率特性估计总结用户的使用时间 使用服务 在时间内

使用数量估计通过加总为用户使用计数 使用服务 随着时间的推移,期

的使用频率比特性估计服务的比例 使用时间在同一类别的所有服务用户使用时间 在时间内

的使用数量比特性估计服务的比例 使用数量在同一类别的所有服务对用户使用数量 在时间内

4.2.3。交互功能

交互功能为用户显示一个新的服务的可用性。我们可以提取所需的适应时间用户熟悉一个新服务,并使用数量的比值在学习期间的意思是学习量(39]。适应时间特性提取从用户的使用行为通过计算时间之间的第一个使用实现稳定使用。学习比特性将从用户的使用数量在学习期间的意思是学习。表中列出的特性描述交互3

学习时间特性估计从用户之间的时间 开始使用服务 和使用的服务水平 达到长期使用的多个水平对应的学习水平 在哪里 是学习水平参数。

学习比特性估计的求和使用所需期间用户 使用服务

4.2.4。成本特性

成本特性表明使用一个新的服务的成本。我们每次提取的一个新的服务成本或使用。成本特性为某些新服务是一个相对稳定的特性在很短的时间内。这些特性被计算在一段时间内,通常一天。我们可以得到这个服务提供者的数据。成本表中列出的功能描述4

时间成本特性估计每个使用服务的平均成本 由用户 在时间内

量成本特性估计作为用户总量平均成本 使用服务 在时间内

这些特征被提取的使用行为和连接技术参数为每个用户的数据集。他们会直接显示每个用户的经验,从这些数据我们可以精确地预测为每个用户的使用行为。

4.3。预测方法

在预测步骤中,我们首先采用pretraining部分列车不同功能类别使用回归的好处,然后我们培养用户的使用行为数据四类的好处。我们设计一个分类部分单独一种不同的用户推广预测模型的性能。

4.3.1。Pretraining

训练的好处四类的特性,我们实现一个pretraining一步的4个类别的特性。的目标值pretraining模型将用户的长期使用,可以显示用户在某种程度上的好处。因此,我们想要的功能训练是利益因素四类。训练模型可以是一个回归模型。pretraining步骤后,我们可以检查每个特性的参数是否合理,测试功能的功效,并保证我们的模型的正确性;然后模型将更少出错

4.3.2。预测潜在的和沉重的用户

我们的目标是预测用户是否会继续使用一个新的移动服务后他或她开始使用它的用户是否是一个高频的用户新的移动服务。一旦我们知道每个用户的利益当他们被训练使用的新的移动服务pretraining部分,我们可以计算出四类的好处。然后,我们可以得到用户的感知利益的四个因素为每个用户。从用户的使用概率分布是一种乙状结肠符合进化博弈理论,我们使用逻辑回归模型来培训的潜在用户与用户的标签我们已经识别出的数据。图1显示了模拟使用概率变化相对感知利用进化博弈理论中受益。重用户预测是使用相同的方法,对于潜在的用户

4.3.3。预测潜在的用户组和用户分类

不同用户的偏好是不同的;上面的方法忽略了用户之间的区别。我们的用户分成几组进行分类;然后我们为每组培训上面的模型。每组的参数可能不同。预计结果将在评估部分相比。我们使用的功能的分类可以是我们从用户的功能部分4.2;其他特性,比如城市的用户或用户的年龄可用于分类。分类后,我们可以预测用户的使用行为为不同的用户组。

5。绩效评估

5.1。数据集

为了验证该方法的性能,我们收集用户的使用行为数据1048574用户的中国移动通信公司在全国14个城市。这些数据的日期范围从2012年9月到2013年3月。新的移动服务覆盖的数据集微信。我们收集了用户的行为记录,用户的技术信息,从运营商和用户的服务计划数据。检查数据完整性后,我们获得了330331用户的数据进行训练和测试。我们确定了潜在的和大量用户微信从过去两周我们的用户的行为数据。我们发现238040潜在用户和90905重的用户微信。统计信息(40表中列出的样本5

5.2。该方法的性能

我们提取特征数据,当用户第一次使用的三个星期微信。pretraining步骤后,我们检查了每个特性的功效,然后训练有素的潜在的逻辑回归模型和沉重的用户。然后,我们把用户分成几组,重新训练模型和未加密模型进行比较。基线模型使用一个信号模型训练为期三周的持续时间和频率数据用户的行为是用作比较的实验。

我们使用精度,记得,F1分,AUC的ROC测量模型的性能(41]。首先,我们把用户分成两组根据预测方法中描述的分类方法,然后重新训练参数为每个组。然后,我们比较了模型对未加密的性能模型和基线模型。表6显示了结果,1级表示未加密模型和双阶级表示模型的两个类进行分类。

然后,我们未加密用户的ROC曲线相比,两类分类用户,和基线模型。图2显示了潜在用户的对比ROC曲线的预测。图3重用户展示了ROC曲线之间的比较。

我们比较了ROC曲线为不同的类。图4显示了两个类的ROC曲线为每个分类为潜在用户。图5显示了每个类的ROC曲线的三个类归类为潜在用户。图6显示了每个类的ROC曲线分为重度用户两类。图7显示了每个类的ROC曲线的三个类归类为重度用户。

我们使用5倍交叉验证方法对模型的性能进行评估。每个折叠的ROC曲线进行了比较。图8显示了每个折叠在未加密的ROC曲线预测潜在用户。图9显示每个折叠在未加密的用户的ROC曲线的预测。

从评价结果,我们可以发现我们的潜力和重型用户预测模型提供了一个更好的性能与基准模型。预测潜在用户展品更高层次的性能由于微信的潜在用户构成更大比例的所有用户的,所以更容易预测。当我们把用户分成两组,每组的性能会更好,意味着性能将增加1%到2%。当我们把用户分成多个组,性能将提高1%至3%,但获得的区别将会很小。类用户性能不同于对方,自相似的用户分类方法可以收集到一起,让它更容易预测。不同折叠之间的差异相对较小,说明该模型是非常稳定的。

6。结论

受进化博弈理论的启发,在本文中,我们提出了一种新颖的方案预测新的移动服务的用户的使用。我们出发去理解用户的体验的新的移动服务通过提取出benefit-related特性从用户的行为数据。然后,我们设计了一个潜在的和重型用户培训和预测方法。我们分类的用户分成几组来区分用户组用户培训。最后,我们评估我们的方法使用综合实验数据来自真实世界的系统。结果表明,我们的方法可以预测未来用户的使用行为与高水平的性能在一个相对短的时间。我们希望的概念来解决我们的研究工作将有助于未来的研究在这个方向。

符号

: 服务对用户使用计数 使用服务 在时间
: 端到端延迟的用户 使用服务 在时间
: 用户连接率 使用服务 在时间
: 传输速度为用户 使用服务 在时间
: 所有服务集
: 所有时间设置为用户 使用服务
: 时间成本为用户 使用服务 在时间
: 用户成本 使用服务 在时间
: 服务使用的用户数量 使用服务 在时间

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项研究支持部分由中国国家重点研发项目批准号下2016 qy02d0202,国家自然科学基金委资助号。61370233,61422202,和61433019,全国优秀博士论文的作者的基础下批准号201345年,研究广东省基金批准号2015 b010131001。