研究文章|开放获取
你们欧阳,亚历克西斯休伊特、j . p .垫片Mantian(曼迪), ”电信数据中离群值识别潜在的聚类模型”,移动信息系统, 卷。2016年, 文章的ID1542540, 11 页面, 2016年。 https://doi.org/10.1155/2016/1542540
电信数据中离群值识别潜在的聚类模型
文摘
电信数据流量收集近年来蓬勃发展,由于4 g移动设备的发展和其他类似高速机器。能够快速识别意想不到的交通数据流对移动运营商至关重要,因为它可能是由于欺诈入侵或技术问题。聚类模型可以帮助识别问题在网络数据显示模式,可以快速捕捉异常和突出前所未有的离群值。在本文中,我们开发和比较聚类模型对于电信数据,关注那些包含时间戳信息管理。详细介绍了两种主要模式,解决,和分析:高斯概率潜在语义分析(GPLSA)和时间(time-GMM)高斯混合模型。这些模型与其他不同的聚类模型相比,如高斯模型和GMM(不包含时间戳信息)。我们执行计算样本和电信流量数据显示的效率和鲁棒性GPLSA让它优越的方法来检测异常值,并提供结果自动调优参数较低或专业知识的要求。
1。介绍
高速电信连接近年来发展迅速,已导致增加主要通过网络数据流。问题之外的存储和管理的数据流,一个主要的挑战是如何选择和使用这种材料更好地理解网络的质量。检测的行为不同于正常的交通模式是一个关键元素,因为这种差异可以降低网络效率或伤害的网络基础设施。因为这些异常可能是由于技术设备问题或欺诈性入侵网络中,重要的是要识别它们准确、及时修复它们。数据驱动系统已经开发使用机器学习算法来检测异常可以自动从原始数据中提取信息,及时预警网络经理异常发生时。
收集到的数据在电信网络中包含的值不同的特性(相关网络资源和使用)以及时间戳,这些值可以建模和加工寻求和使用无监督算法检测异常。算法利用未标记数据和假设哪些数据元素异常信息是未知的(因为异常交通数据是罕见的和可能采取多种形式)。他们不直接检测异常,而是分离和区分数据结构和模式,以集团的数据推导出“异常区”。这种方法的主要优势是能够快速检测出前所未有的或意想不到的异常。
要考虑的另一个组件了解无线网络数据行为时间戳。这些信息通常是收集数据时产生经典但不广泛应用于异常检测流程。然而,由于网络负载波动的一天,添加时间戳属性评价模型可以让我们发现周期性行为。例如,正常价值在高峰期可能是一个异常外那个时期,因此仍未被发现的算法不考虑时间戳。
在本文中,我们使用非监督模型来检测异常。具体来说,我们关注算法结合两个值和日期(时间戳),引入两个新模型。第一个是按时间的高斯混合模型(time-GMM),这是一个依赖于时间的延长GMM (1)可以通过考虑每个独立的时间。第二个是高斯概率潜在语义分析(GPLSA),源自概率潜在语义分析(查询)2值和日期处理结合起来,在一个独特的机器学习算法。后一种算法是众所周知的在文本挖掘和推荐系统领域但已很少应用于异常检测等其他领域。在这个研究中,我们全面实施这两种算法与R (3发现异常)和测试他们的能力和适应新模式样本和流量数据。我们也比较健壮性、复杂性和这些算法的效率。
本文的其余部分组织如下:在部分2,我们目前的技术来识别异常的概述,重点是无监督模式。节3,我们将展示不同的无监督异常检测模型(本节定义了两个之前引入无监督模式:GPLSA和time-GMM)。节4相比,这些模型是一组样本强调行为的差异在一个简单的背景。节5,我们将讨论计算实际交通网络数据上执行。我们最后一节6,得出结论GPLSA的适应性和鲁棒性。
2。研究背景
异常检测是一个广泛的话题与大量的先前技术使用。这些方法的一个广泛的概述,我们指的是(4]。
基于先前的研究主要集中于无监督统计方法如聚类方法进行异常检测(5- - - - - -8]。一个共同的假设基于统计的方法是,底层分布是高斯(9),尽管参数分布的混合物,normal-points异常对应两个不同的分布(10),也是可能的。在聚类方法,其目的是单独的数据点和分享相似对象分组,每组的对象被称为集群。我们通常定义对象之间的相似性分析。许多聚类算法对不同对象之间的相似性测量(使用测距、密度或统计分布)存在,但最受欢迎和最简单的集群技术K——聚类(11]。
先进的检测方法结合统计假设和聚类,如高斯混合模型(GMM) [1]。这种方法假设所有数据点生成的混合物高斯分布;参数估计通常是通过采用(EM)算法,迭代的目标是增加的可能性(集12]。一些研究GMM用于异常检测问题,如[13- - - - - -15]。选择集群的数量并不容易:尽管方法自动选择的值确实存在(比较不同算法提出了(16]),研究人员和选择通常是手动选择精制后执行不同的计算不同的值。
在电信流量数据,时间戳一个组件时要考虑寻找交通异常。这些信息,称为上下文属性(4),可以显著改变异常检测的结果。例如,一个值可以被认为是在特定的环境中正常(在高峰期),但在另一个上下文(在非高峰时期),异常和分化只能明确表示当每个值都有一个与之关联的时间戳。概述的孤立点检测的时间数据可以发现在17),包括整体的方法(例如,18,19)、时间序列模型与ARIMA和GARCH模型(例如,在20.)、相关分析(21,22]。
聚类时间异常检测方法可以自动考虑和独立的不同类型的行为从原始时间序列数据,它允许一些有趣的结果。将时间戳的方法之一是考虑原来的GMM(即。的混合物高斯分布),但权衡每个分布不同,这取决于时间。该方法首次引入了文本挖掘(2,23)的分类分布和命名概率潜在语义分析(向量)。其实际形式(高斯分布),GPLSA,用于推荐系统24]。没有发表文章,GPLSA申请异常检测被发现。
在下一节中,我们提出五个交通数据异常检测模型。前三个模型是经典模型:高斯模型,高斯时间,GMM,不结合集群和上下文检测和预计将有几个缺点。剩下的两个模型考虑集群和时间戳:第四模型是一个依赖于时间的GMM, GMM的独立决定为每个时间段;第五个模型是高斯概率潜在语义分析(GPLSA)模型,解决的优化与集群相关的所有参数和时间在一个独特的算法。
3所示。表示的模型
在本节中,五个不同的模型定义:高斯,时间高斯,GMM,时间GMM, GPLSA。我们使用相同的符号为:(我) 是一个交通数据集合,这个集合包含吗索引值与。通常是大的,也就是说,从一千年到一亿年。每个值都是一个向量的,在那里的数量特征。此外,每个特性被认为是连续的。(2) 是时间戳的一组类。这组还包含值。因为我们预计每天循环,每个值对应每一个小时,因此站在。(3) 观测数据。(iv)聚类方法中,我们假设每个值与一个固定的(尽管未知)集群,命名。它是一套“潜伏”,因为它最初是未知的。我们假设集群的数量是已知的。交通数据检索的一个示例显示如下:
对于每个模式,其目的是与极大似然估计参数。直接计算棘手时,一个EM算法找到一个局部最优的可能性(至少)。添加一个通常的假设的独立,需要在设置计算产品的可能性:(H)三胞胎的集合是一个独立的向量行吗。注意,如果模型不考虑或假设,我们删除这个组。
不同的模型如表所示1分组,根据他们的能力考虑时间戳和集群。在以下,对于每个模型中,每一个假设是上市形式(X2),其中X是当前模型段假设数量紧随其后。
|
||||||||||||||||||
3.1。高斯模型
在高斯模型中,假定整个数据集来自一个变量是一个高斯分布。因此,每天的一部分也有类似的行为,没有集群。数学(注意,相同的字母是用于设置和变量)以下发生:(A1)每个变量是高斯分布的均值和方差。在这里,是一个向量和是一个variance-covariance矩阵的大小。他们都是独立的。参数很容易与经验均值和方差估计。
3.2。按时间的高斯模型
一次组件被添加到这个模型中,而不是高斯模型,它不包括组件。每次都被认为是独立的,一个特定的高斯分布。这允许我们考虑依赖时间:(B1)为每一个,每一个条件变量这样遵循一个高斯分布的均值和方差。至于高斯模型,参数估计与经验均值和方差的每个类日期。
3.3。高斯混合模型
高斯模型相比,在GMM,数据被认为来自高斯分布的混合物,而不是一个单一的高斯分布。集群的数量提前是固定的。(C1)每条记录属于集群的概率。(C2)每个变量遵循一个高斯分布的均值和方差。
因此,每个记录属于一个未知的集群。每个集群的任务是估计这两个概率和每个高斯分布的参数。为了解决这个问题,以下进行分解: EM算法的参数可以先后更新(见[23]详情)。
3.4。按时间的高斯混合模型
结合模型中描述的部分3所示。2和3所示。3我们获得时间GMM,包括集群和时间依赖性。在节3所示。3EM算法来估计参数。(D1)为每一个这样,每个记录属于一个集群的概率。(D2)为每一个,每个变量这样遵循一个高斯分布的均值和方差。
3.5。高斯概率潜在语义分析模型
GPLSA模型是基于经典的GMM但是引入了一个新颖的数据值和时间戳之间的联系。在time-GMM,不同类型的日期被认为是独立的,而GPLSA介绍潜在的集群之间的依赖和时间戳,但只有在这两个变量。也就是说,在了解潜在的集群Z,我们假设没有更多的依赖时间。这种假设可以使问题计算处理。明确,就会出现下列情况:(E1)为每一个这样,每个记录属于一个集群的概率。(E2)每个变量遵循一个高斯分布的均值和方差。(E3)对所有我,。
为了解决这一问题,做以下分解(假设(E3)是用于第一个因子之和): EM迭代算法可以适应在这种情况下,增加的可能性,为了获得准确的更新公式估计参数。完整的计算获得这些公式在附录中给出。我们让相同密度的高斯参数和。同时,我们定义索引的集合,在那里。下面的算法描述的步骤得到最终的参数:
步骤1。在时间,让一些初始参数,,对所有。
步骤2。对所有的概率,计算知道,和参数
步骤3。对所有,计算(这里代表的长度)
步骤4。对所有、更新与
第5步。对所有、更新的
步骤6。对所有、更新(这里的协方差矩阵指的是转置)
步骤7。让和重复步骤2来7直到收敛在一个日期。在那个日期,参数估计。
步骤8。为每一个选择集群最大化。
第9步。为每一个,这一点的可能性的估计参数
4所示。模型的比较
所有五个模型中定义的部分3实现与R (3到一个框架,能够执行计算并显示集群和异常识别块(使用ggplot2 [25])。在本节中,我们应用我们的框架一组样本比较的能力来检测异常并检查方法的鲁棒性。样本集的建立是为了突出行为模型之间的差异在一个简单的和可以理解的上下文。因此,只有一个样本特性被认为是除了时间戳日期。
在这个设置中,我们观察到time-GMM和GPLSA能够检测异常组内,然后这些方法是潜在的候选人中异常检测时间上下文。此外,我们表明,GPLSA更健壮和允许更高的解释水平集群。
4.1。示例定义
样品是由基础三个随机集: 在哪里每个独立随机变量吗根据连续均匀分布采样在哪里每天有一个时期。一分之二功能的范围是24小时,而第三个是只定义0:00至15:00。
三个异常添加这个集合,定义,分别在6点,12点,和18:00值−1.25,0.5和1.65。结果如图1。
(一)高斯
(b)时间高斯
(c) GMM
(d) Time-GMM GPLSA
4.2。异常识别
所有五个模型训练和每个模型的计算每个点的可能性。因为我们希望3异常被发现在这个示例集,最低3可能性值为每个模型被定义为异常。聚类的过程中,选择集群的数量。
结果如图所示1。在(a),整个数据集建模为高斯分布,我们没有发现异常。在(b),每个时期确定高斯分布,并在18:00我们只发现了异常。在(c),整个集群,我们只发现了6点异常。最后,在(d), time-GMM GPLSA模型训练和相同的结果:3先后发现异常。
因此,time-GMM和GPLSA都能够发现预期的异常与其他方法。
4.3。对比Time-GMM GPLSA
相同的异常已发现time-GMM和GPLSA。然而,他们发现不同。我们提供一个总结的比较表2。
|
|||||||||||||||||||||||||||||||||
首先,GPLSA评估时间戳和价值观在一次;也就是说,所有参数估计在同一时间。因此,连续日期可以分享相似的集群行为。time-GMM,独立参数训练每个类的日期,也没有存在不同的类簇之间的关系。
第二,集群的数量在每个类柔软GPLSA(即。,我t can be different to the specified number of clusters for some class of dates). This allows the model to automatically adapt the number of clusters depending on which cluster is needed in the model. In time-GMM, each class has a specified number of clusters. This is shown in Figure2,前7个小时是在确定集群绘制time-GMM (a)和GPLSA (b)。
(一)Time-GMM
(b) GPLSA
第三,模型训练GPLSA的整个数据,而只有一小部分数据用于每个time-GMM计算。如果有数量有限的数据在一个类的日期,这可能会导致无法正确估计time-GMM参数。
第四,评估所需的参数的数量GPLSA和time-GMM(与类和数量数量的集群,在维度)。因此,参数估计与GPLSA也越来越少。
总的来说,GPLSA意味着一个更好的解释水平(第一和第二点)产生的集群在time-GMM,加上较高的鲁棒性(第三和第四分)。
5。结果与讨论
在本节中,在真正的交通网络数据进行异常检测。基于模型的比较中完成的部分4,我们选择与time-GMM GPLSA推断出异常和比较结果。节5.1,收集到的数据集描述和预处理;然后,我们应用GPLSA并显示结果5.2。本节5.2特别关注行为观察后应用算法。这些结果与time-GMM结果部分5.3。最后,部分5.4强调GPLSA进行异常检测的能力。
5.1。数据描述和预处理
数据收集了从中国移动运营商。他们占24流量特性的选择为无锡市3000个细胞,收集中国。相关的功能只是手机网站和不给特定用户的信息。例如,他们代表用户的平均数量在细胞或整个数据流量的最后一个季度小时。该算法训练两周以上的时间,与一个值为每个季度小时和每一个细胞。
我们丢弃的数据含有缺失值的行。只考虑值和时间戳的计算,和细胞的身份证号码被丢弃。一些功能只需要负的价值观和通常有一种错误的行为,因此,有些功能是通过应用对数预处理。维护可解释性,我们对变量不适用功能正常化。我们希望GPLSA可以管理这个集合,尽管模型的一些性质不验证,如正常的假设。
5.2。计算和结果
我们使用了GPLSA模型特征对应于“细胞内用户的平均数量”和选择集群。最低的异常值产生的可能性,计算得到(平均)2每天8警报和警告。视觉的结果在图所示3。
(一)值作为日期的函数,与集群
(b)作为日期的函数值,与类标识
(c)对数似值设置为一个函数的日期
(d)的概率是在一个集群中知道date类
在(a),三个集群被识别出来,然而,在(b),不同的颜色是用于每个类的日期。在(c)中,不同对数似值显示。最后,在(d),概率的估计在每个集群知道是绘制。
异常所示(一个),(b)和(c)和极端值与每个类的日期是正确地检测到。在(a)和(d),确定集群所示三个不同的颜色。概率在每个集群跨阶级的不同预期,概率较低在非高峰期在集群上。(一)所示,上面的集群有一个对称的形状和均值相对类似的日期。
5.3。与Time-GMM
我们在部分比较结果5.2time-GMM,使用相同数量的集群,每天相同数量的警报和警告。我们在图显示结果4。在(a),三个集群标识为每个类(1 - 24)和(b)所示的不同对数似值。
(a)值作为日期的函数,与集群标识(集群识别独立对每个时间段)
(b)对数似值设置为一个函数的日期
我们观察到time-GMM正确检测到最极端的价值观。每个类与特定的似然函数和有自己的方式来表示数据。我们看到集群相关程度最高的值也有类似的宽度对所有类图4(一)(24)。通过比较图4 (b)与图3 (c),我们看到一个更大的“凹凸”(time-GMM位于绿色在非高峰时段)。由于这些原因,与GPLSA相反,异常所占比例在一些类(例如,3警告被检测到前两天)而另一些不包含这个时期异常。这些结果支持更高级别的解释和鲁棒性的GPLSA time-GMM。
5.4。讨论
结果显示,GPLSA能够检测异常时间上下文。我们确定了全局离群值(例如,在图3 (b)在4月15日16:00时用红色)以及上下文相关的异常(例如,在4月15日5:00橙色)。考虑非高峰时期,特定的时期发现不寻常的值。
高斯假设GPLSA不是真正的约束。如图3(一个)、集群适应性强,符合高斯分布。他们是适当的代表值分布的每个类日期和集群。
集群适应如图3 (d)。的三个集群代表不同的水平值。上集群代表更高的价值,更可能在高峰时期。集群代表较低的值越低,大致不变的概率。第三个集群中获得良好的异常检测行为也很有用(结果集群无法正确检测异常)。
对异常检测本身,一个阈值指示警报的数量可以设置被发现。这种检测方法是静态的,相对简单。改善这种检测方法是可行的和直接通过计算可能性:一个细胞内,一个异常可以检测到重复的可能性低的分数。
6。结论
在本文中,我们提出并比较无监督模式来检测异常在无线网络流量和展示了健壮性、可解释性,和能力的GPLSA模型来检测异常,相比其他方法,比如time-GMM。异常检测是也表现在真正的交通数据和分析。我们强调了适应性GPLSA在这种背景下检测异常,甚至那些与新模式,手动是很难预测的。因此,移动运营商可以有一个通用的方法来识别和检测异常,这将降低成本的可能后果(例如,网络故障)。
改善这种方法可以操作。目前,一旦模型计算,异常检测只是基于准时检测通过可能性值。连续动态检测的值可能会增加可信度的警报和减少假警报。
此外,该模型仅从一个固定的训练数据集在这个研究。但这可以延长考虑在一个在线实时流数据处理上下文。因此,新的模式可以迅速更新,提高响应性和异常识别。
附录
答:召回GPLSA假说
我们回想一下,观测数据和潜在的未被注意的数据。
观察值,在那里每个流量值是一个向量的,在那里的数量特征。每个时间戳是一个整数,。在以下的水平索引有年代。
潜在的价值。他们把有限的状态,在那里是定义的集群。
我们回忆起GPLSA的不同的假设:(H)三胞胎的集合是一个独立的向量行吗我。(E1)为每一个这样,每个记录属于一个集群的概率。(E2)每个变量遵循一个高斯分布的均值和方差。(E3)对所有我,。
模型的未知参数被组合在一起
初步估计参数定义如下:所有条款吗等于,初始化使用K——集群。
我们在每个迭代定义 估计参数从更新使用EM迭代算法。算法收敛时停止相关的可能性。
我们用我们的假设来表达有用的概率使用。我们回想一下,密度的高斯参数吗和。让和。
从(E3),我们知道。应用(E2),我们推断出。总的来说,我们获得
同时,从(E1), 这个概率是成正比的离散多项式分布(为每一个,系数之和为1)。
b .回忆关于新兴市场
选择策略来估计参数是找到一些参数,最大化的边际观测数据的可能性所定义的
直接计算棘手,我们使用EM迭代更新参数:(1)设置一些初始参数。为从0直到收敛,重复以下步骤(2)和(3)。(2)执行期望的步骤(E步骤): 可以写成 (3)执行最大化的步骤(步骤): 更新期望值函数理论原因是,可能性将每一步增加或保持不变26]。然而,收敛后,参数可以在当地最大似然函数。
c .期望一步GPLSA EM的上下文
我们假设我们在一步,我们要更新对所有和。从(B.3使用假设)和(H),我们得到的
然后我们定义作为,这是显式地从(可计算的C.4)。
在整个, 最后,我们获得一个明确的公式可以最大化。
d .期望一步GPLSA EM的上下文
从形状(C.6)我们可以单独的最大化(为每一个和权重为每一个。
(1)权重 。为每一个固定的时间戳,我们更新。这些被认为是一起,因为有一个约束:求和必须是1。从(C.6),我们只需要最大化
为每一个,我们让索引的集合这样。因此
我们让所有:获得
自是固定的,所有条款除了一个常数。因此,我们只有最大化
最后,我们计算导数。在这里,我们记得。删除这个约束,我们让。我们重写这个
通过分化,
如果我们想要这个值(D.6)为零,我们得到
现在,使用约束 然后,
在此之前的所有
海赛矩阵通过计算,我们发现极值获得最大价值。
(2)均值和方差 。从(C.6),我们可以为每个固定执行计算集群。因为有些方面,这个和没有依赖k,我们必须最大化 或者减少
我们获得相同的公式对GMM然后给更新规则
相互竞争的利益
作者宣称没有利益冲突有关的出版。
引用
- g·j·克劳克兰,k . e . Basford混合模型。推论和应用程序集群”统计:教科书和专著美国德克,纽约,纽约,1988年。视图:谷歌学术搜索
- t·霍夫曼“概率潜在语义分析”美国15日会议上的不确定性人工智能,1999年摩根考夫曼。视图:谷歌学术搜索
- R核心团队,接待员:统计计算的语言和环境,R统计计算的基础,维也纳,奥地利,2016年,https://www.R-project.org/。
- 诉Chandola、a . Banerjee和诉Kumar“异常检测:一项调查,”ACM计算调查第41卷。。3、第十五条,2009年。视图:出版商的网站|谷歌学术搜索
- p . Laskov p·杜塞尔、c·谢弗和k . Rieck”学习的入侵检测:监督或无监督?“在图像分析和Processing-ICIAP 2005: 13国际会议,卡利亚里,意大利,2005年9月6 - 8日。诉讼卷,3617在计算机科学的课堂讲稿页50-57 Springer,柏林,德国,2005年。视图:出版商的网站|谷歌学术搜索
- n v·乔:Japkowicz, a . Kotcz”社论:特殊问题学习不平衡的数据集,”ACM Sigkdd探索通讯》第六卷,没有。1、1 - 6,2004页。视图:出版商的网站|谷歌学术搜索
- c . Phua d Alahakoon,李诉“少数派报告欺诈检测:扭曲的分类数据,”ACM SIGKDD探索通讯》第六卷,没有。1,对于50 - 59页,2004。视图:出版商的网站|谷歌学术搜索
- 答:Patcha和人类。公园,“异常检测技术的概述:现有解决方案和最新技术趋势,”计算机网络,51卷,不。12日,第3470 - 3448页,2007年。视图:出版商的网站|谷歌学术搜索
- 诉Bamnett t·刘易斯,离群值的统计数据,1994年。
- d·阿加瓦尔,”检测异常cross-classified流:贝叶斯方法,”知识和信息系统,11卷,不。1,突然增加,2007页。视图:出版商的网站|谷歌学术搜索
- a . k . Jain,“数据聚类:50年K——,”模式识别的字母没有,卷。31日。8,651 - 666年,2010页。视图:出版商的网站|谷歌学术搜索
- a . p .法官:m . Laird, d·b·鲁宾”最大似然从通过EM算法,不完整的数据”皇家统计学会杂志》系列B:方法论,39卷,不。1,1-38,1977页。视图:谷歌学术搜索|MathSciNet
- h·哈吉”统计分析网络流量的自适应故障检测,”IEEE神经网络,16卷,不。5,1053 - 1063年,2005页。视图:出版商的网站|谷歌学术搜索
- y欧阳,m . h . Fallah s .胡锦涛et al。”小说的数据分析和建模方法来评估LTE网络的性能,”诉讼的第13届无线电信研讨会(WTS 14)IEEE,华盛顿,美国,2014年4月。视图:出版商的网站|谷歌学术搜索
- m . j . Desforges p . j .雅各和j·e·库珀”概率密度估计的应用在工程异常的检测条件,”美国机械工程师学会学报》上,C部分:机械工程科学》杂志上,卷212,不。8,687 - 703年,1998页。视图:出版商的网站|谷歌学术搜索
- m . m . t .蒋介石和墨金,“智能选择集群的数量k——集群:一个实验研究不同集群传播,”杂志的分类,27卷,不。1,3-40,2010页。视图:出版商的网站|谷歌学术搜索|MathSciNet
- m·古普塔j .高c Aggarwal, j .汉”时态数据异常值检测,”合成专题数据挖掘和知识发现5卷,页1 - 129,2014。视图:出版商的网站|谷歌学术搜索
- Rayana和l . Akoglu“少即是多:构建选择性异常乐团,“ACM交易数据的知识发现,10卷,不。4、第四十二条,2016年。视图:出版商的网站|谷歌学术搜索
- y欧阳和t .燕”,分析无线移动应用程序通过crowdsourcing-based网络资源使用情况分析,“IEEE物联网,卷2,不。5,391 - 398年,2015页。视图:出版商的网站|谷歌学术搜索
- j .郭w·黄和b·m·威廉姆斯,“实时交通流量异常检测使用短期交通条件方差预测,“交通研究部分C:新兴技术,50卷,第172 - 160页,2015年。视图:出版商的网站|谷歌学术搜索
- a . y . Lokhov:柠檬,t·c·安德鲁说,a . Hagberg和s . Backhaus”cyber-physical故障检测和入侵从物理相关性,”https://arxiv.org/abs/1602.06604。视图:谷歌学术搜索
- y欧阳和h . m . Fallah UMTS包交换网络的性能分析基于多元kpi,”《IEEE无线电信研讨会美国佛罗里达州坦帕,2010年4月。视图:谷歌学术搜索
- t·霍夫曼“概率潜在语义索引”《第22届国际市立图书馆研究与发展会议在信息检索(99年")美国加州伯克利分校,1999年。视图:出版商的网站|谷歌学术搜索
- z, w·潘,e·w·香问:杨,l .赵和e·h·钟,“选择性转移学习跨域的建议,”https://arxiv.org/abs/1210.7056。视图:谷歌学术搜索
- h .韦翰优雅的图形进行数据分析施普林格科学与商业媒体,2009年。
- r . j ., d·b·鲁宾缺失的数据统计分析在概率论与数理统计,威利系列:应用概率论与数理统计,约翰威利& Sons,纽约,纽约,美国,1987年。视图:MathSciNet
版权
版权©2016你们欧阳等。这是一个开放的访问分布在条知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。