研究文章|开放获取
Jussi Turkka,费多尔Chernogorov、季Brigatti Tapani Ristaniemi, Jukka Lempiainen, ”从驱动测试数据库网络故障检测的方法”,计算机网络和通讯》杂志上, 卷。2012年, 文章的ID163184年, 13 页面, 2012年。 https://doi.org/10.1155/2012/163184
从驱动测试数据库网络故障检测的方法
文摘
数据挖掘框架分析细胞网络驱动器测试数据库中描述。方法旨在检测睡眠基站,网络故障,改变的优势领域的认知和自组织的方式。法的本质是寻找相似性期刊网络测量和先前已知的故障数据。为此,扩散映射降维,利用最近邻数据分类方法。该方法的认知,因为它需要训练数据的故障检测。此外,方法是自主的,因为它使用最小化驱动测试(联合化疗)功能收集的训练和测试数据。动机分类联合化疗测量报告的期刊,交接,故障类别是检测领域期刊报道开始变成类似于故障样本。此外,这些领域与估计优势地区检测到基站睡觉。在研究验证的情况下,测量分类结果在增加样本的数量可以用于检测性能退化,因此,使故障检测更快和更可靠。
1。介绍
现代无线接入网络(RAN)组成的复杂的基础设施等覆盖和合作网络的下一代高速分组接入(HSPA)和长期演进(LTE)网络,这样很容易影响的不确定性对系统管理和稳定。经典的网络管理是基于设计原则要求知识网络内的所有现有的实体的状态。这种方法已经成功地应用于网络规模有限,但它是预见在未来复杂网络的管理不足。为了保持大规模的多厂商和multi-RAN基础设施成本最低的方式,运营商采用自动化解决方案来优化最困难和耗时的网络操作程序。自组织网络的概念(1已经出现在过去的年,目标培养自动化和减少人力参与管理任务。这意味着自主配置,优化和治疗行动将导致减少操作负担和改善经验丰富的终端用户服务质量(QoS)。子概念的缺点之一是操作的必要性收集大量数据从用户设备(UE)和不同的网络元素(NE)。
保证足够的覆盖率和QoS用户在室内和室外环境中,移动运营商需要开展各种无线电覆盖率测量。在过去,手动测试被用于这一目的。然而,也有一些挑战和限制在手动测试,可以改善。首先,手动测试是一项耗费资源的任务需要很多时间,专业的设备,和高素质的工程师的参与。其次,是不可能从每一个地理位置捕获完整的覆盖率数据通过使用手动测试,因为大多数交通生成的问题来自室内位置,虽然驱动测试主要是有限的道路。手动测试的成本和可达性限制提示研究向自动化UE-assisted数据采集解决方案,可以减少手动测试的需要,允许收集更全面的数据库。如果问题定期测量无线电覆盖率和一起提供的测量位置和时间信息到网络,然后大型无线电环境数据库用户感受到的报道经验可以用来支持运行操作和优化。然而,基本问题与这些大型数据库信息溢出和维度的“诅咒”。这些问题需要解决,同时分析和转换原始测量数据在这些巨大的操作数据库转化为有意义的信息。本文描述了上述问题的一种方法提出了一个数据挖掘的分析框架UE-reported无线电测量。 This approach allows the detection of the coverage problems in a cellular network on the basis of learning the network’s prior operational behavior. The proposed framework is validated with simulations by using瑞萨移动欧洲技术发展水平LTE系统模拟器构建大型联合化疗测量数据库。
本文的组织结构如下:部分2描述了最小化驱动测试的概念,可以用来收集和构建问题测量报告数据库HSPA和LTE网络关注报道方面。部分3描述了数据挖掘的框架,用于分析联合化疗数据库,最后,部分4描述了仿真场景和故障检测的性能评价结果特定类型的网络故障引起的被称为“沉睡的细胞。”
2。最小化驱动测试
最小化驱动测试用例介绍了自组织网络的下一代移动网络运营商联盟(NGMN)在2008年[2),在写这篇文章的时候,联合化疗方案研究的网络供应商和运营商第三代合作伙伴计划(3 gpp) [3,4]。在3 gpp联合化疗研究的目标是定义一组测量,测量报告原则和程序,将有助于收集coverage-related信息问题。联合化疗的可行性研究阶段(3)在2009年底和2010年开始专注于定义报告测量实体和联合化疗用例例如,覆盖优化和QoS验证。覆盖优化用例目标检测等网络问题的覆盖漏洞,弱覆盖,飞行员污染,过度报道,和上行覆盖问题,如[3]。可行性研究后,研究集中在定义联合化疗测量、报告和LTE发布2011年10[配置方案4]。联合化疗计量和报告方案直接联合化疗和记录联合化疗。立即联合化疗方案扩展了无线资源控制(RRC)测量报告,包括可用的位置信息来测量报告问题在连接模式(4]。记录联合化疗方案,问题可以配置为收集测量在空闲模式和报告记录数据到网络后(4]。发布后,联合化疗的主要焦点工作将在详细的位置信息的可用性增强和改善QoS验证(5]。
2.1。联合化疗测量配置
联合化疗的测量可以通过使用LTE中配置管理基础或signaling-based配置程序(4,6]。在管理- - - - - -基础配置基站负责配置所有选定问题在一个特定的区域直接或联合化疗测量记录(4,6]。的信号- - - - - -基于联合化疗是一个增强signaling-based吗用户和设备跟踪功能(6)联合化疗的数据收集从一个特定的问题,而不是一组在一个特定的区域问题。激活联合化疗的详细信号流测量中描述(6]。
联合化疗测量功能允许运营商收集测量定期或在一个触发,比如网络事件的实例(3,4]。测量报告由可用的位置,时间,cell-identification数据和无线电测量数据。有不同的估计用户位置的机制。最粗的位置信息服务全球标识(CGI)和细胞在最好的情况下获得的详细位置从全球导航卫星系统(GNSS)。细胞识别信息包括serving-cell CGI或身体细胞识别(PCI)检测到邻近的细胞。服务和邻近的无线电测量细胞包括参考信号接收功率(RSRP)和参考信号接收质量(RSRQ) LTE系统和公共导频信道接收信号代码(RSCP)和接收信号质量()HSPA系统[3,4]。
2.2。记录联合化疗
记录的联合化疗计量和报告计划使数据收集的问题通常驻扎在RRC闲置状态。记录的联合化疗的配置是通过RRC信号提供给问题而在RRC连接模式问题。登录模式配置参数列出并描述了更多细节在4]。问题转移到RRC空闲状态时,联合化疗测量数据、时间、位置信息和无线测量,记录到内存问题。网络可以问问题时报告记录的数据问题返回RRC连接状态。目前只能有一个老鼠特定记录联合化疗配置每个问题仅为运行提供有效的配置。如果早期的配置存在它将会被新的取代[4]。自记录联合化疗模式是一个可选的功能问题,本文更侧重于立即联合化疗将运营商的工具收集从LTE释放10和开始测量。
2.3。直接联合化疗
立即联合化疗是基于现有RRC测量程序的扩展包括可用的位置信息来测量报告。LTE释放10 RRC规范(7)允许运营商配置RRC测量的方式RSRP和RSRQ测量报告定期从细胞和intrafrequency interfrequency inter-RAT邻近细胞和可用的位置信息。直接联合化疗原则是描绘在图测量报告1如[6]。
立即报告联合化疗可以开始之前,基地station-E-UTRAN NodeB (eNB)被激活和配置收集立即联合化疗的测量。在步骤1中,一个元素管理器(EM)发送一个细胞跟踪会话激活请求eNB包括联合化疗的配置,以便eNB可以稍后报告跟踪记录回微量元素(TCE)。细胞流量跟踪激活后,eNB选择联合化疗的问题同时考虑用户的同意,允许操作员用户收集联合化疗的测量。eNB发送RRC测量配置选中的问题例如,报告触发间隔,intrafrequency列表、interfrequency inter-RAT测量要求,问题包括可用的位置信息的测量报告作为RRC规范信息中指定的元素(即)ReportConfigEUTRA字段(7]。
例如RRC测量条件满足时,一个期刊计时器到期或一个特定的网络事件发生时,可用的问题发送RSRP和RSRQ测量eNB可用LocationInfo即添加到测量报告7]。如果详细的位置信息是可用的,包括经度和纬度测量报告。如果详细的位置信息是通过利用GNSS定位方法然后问题应当附加时间信息报告(4]。这个GNSS时间信息用于验证的详细位置信息。注意,在直接的联合化疗,问题没有发送的绝对时间信息,以防记录联合化疗。eNB负责将时间戳添加到收到联合化疗保存测量时测量报告的跟踪记录。
2.4。联合化疗的数据库
收集联合化疗的联合化疗数据库是由测量的网络。在我们的研究中联合化疗数据库包括定期测量,以及测量时收集的实例A3 (A3事件是E-UTRAN RRC测量事件时触发邻近细胞变成了一个偏移量比为细胞)事件前成功intra-LTE交接(HO)和无线连接失败(RLF)。假设每个测量样品在分析数据库中包括22特性如表所示1。
|
|||||||||||||||||||||||||||||||||||||||
联合化疗测量样本包括纬度,经度,提供细胞,和邻近细胞无线电测量报告的问题。此外,时间信息,serving-cell宽带信道质量指标(WCQI)和上行功率余量eNB (PHR)值被添加的报告。此外,报告的一个标签条件总是附加测量样本,也就是说,eNB知道联合化疗的数据样本是一个期刊,A3事件驱动的测量报告或问题(RLF报告4]。目前,释放10联合化疗规范不支持的特性收集A3事件的详细位置。然而,这一特性是被包含在发布联合化疗11。因此,联合化疗的结构测量样本中所描述的表1被认为是常见的所有这三种类型的联合化疗的报告。
3所示。故障检测数据挖掘框架
众所周知,儿子框架包括三个功能,即自我配置、自我优化和自我修复。自我配置与网络的初始步骤设置。自我优化集中监控网络状态和自动参数调优上成就最高的可能的网络性能不影响其操作的鲁棒性。对于网络故障或故障,修复尝试自主发现问题,诊断根源,并赔偿或从故障中恢复状态恢复正常操作。自我修复的一个很好的例子是cell-outage管理(8,9)用例在LTE网络,旨在提高离线覆盖优化过程检测和自动减轻停机情况。为此,自愈算法需要几个关键绩效指标(KPI)测量eNBs和问题。kpi等细胞负荷,RLF计数器,切换失败率,或者用正餐邻近细胞RSRP可能被用作测量指标的网络故障8]。在[9),中断的条件是基于接收信号强度和质量的预定义的阈值。然而,部署的几个自组织功能可以显著增加的数量测量和报告kpi从而增加网络的复杂性和儿子架构。这可能会导致新的挑战网络工程师。首先,高维KPI创建数据库的网络测量,由手工数据分析识别正确的KPI / fault-associations复杂的任务。所需的KPI / fault-associations发展良好的算法。其次,由于网络在本质上是复杂的和动态的,它不是明显的kpi应该测量和频率。例如,如何选择从几个性能指标,那些要揭示一定特性的网络行为最有意义的和有效的方式?
设想,可以解决上述挑战先进的机器学习和数据挖掘算法,依赖于网络自主学习行为和有效处理高维数据库组成的广泛的kpi。数据挖掘可以用于提取有趣的、未知的和潜在的有用的信息从大型数据库模式(10]。通常数据挖掘过程包括几个阶段如数据清洗、数据库集成任务相关的数据选择、数据挖掘和数据模式评价(10]。数据清理、集成和选择是数据预处理阶段数据准备进一步分析(10,11]。数据挖掘本身可以包含几个不同的功能分类等数据,协会的数据,聚类的数据,降维,异常检测(10]。模式评估阶段,模式是信息可视化和分析,看看小说,可以从中提取有效信息。即使发现有趣的信息模式,但这并不意味着它是自动可用或有用的数据挖掘问题的观点,因此,信息模式需要进行验证。
cell-outage家庭内的用例包括自愈的蜂窝无线网络有一个特定的问题沉睡的细胞。沉睡的细胞是一个复合名词,包括错误的网络行为从性能下降到完整的服务不可用。沉睡的细胞的特定的特征是网络性能退化但这退化不轻易可见的网络运营商,因此检测这个问题与传统的报警系统是一个复杂和缓慢的过程中描述(12]。没有定义一个网络故障,将导致出现一个沉睡的细胞,可能有以下几个原因。一种类型的细胞可以睡觉eNB射频单元的故障eNB发射和接受能力降低缓慢,传播,接收,或者两者都不工作了。这导致停机情况eNB问题不能提供服务的覆盖范围沉睡的细胞。指标可以揭示睡眠细胞退化在交接活动中,较低的呼叫建立利率和低细胞加载。不同类型的指标需要检测活细胞网络从网络包括睡觉几个重叠的频率层和无线接入技术。在[13),一个沉睡的细胞检测到通过使用统计分类技术图表由问题报道邻近细胞模式。在邻近的细胞变化模式是作为指标的中断。
的一个主要研究目标的最小化驱动测试算法的发展使网络更健壮和高效的操作,所以我们开发了一个数据挖掘框架,检测覆盖率问题,如睡眠细胞,通过使用高维联合化疗测量数据库。本文中描述的数据挖掘框架依赖降维可以简化了异常检测和数据分类过程。使用降维的动机是使框架健壮且容易扩展新的数值kpi。另一方面,期刊分类联合化疗测量报告的动机,交接,故障类别是检测领域定期报告收集的某些频率层开始显示出故障的假设。值得注意的期刊联合化疗的测量可以同时来自内部和interfrequency层(4]。因此,一些测量分类即使问题可用连接在不同的频率比睡着的细胞层。这可以发生在生活网络运营商部署了重叠频率层容量和覆盖范围。如果问题开始经验停机频率层然后交给另一个频率层无线电线路故障出现之前。
3.1。数据挖掘的框架
数据挖掘框架由学习和检测问题的阶段。在学习阶段,联合化疗数据库由收集问题报告测量网络如图2。
在学习阶段的第一步是预处理的到达联合化疗测量标记为期刊,HO-triggered或RLF-triggered。标签是必要的,因为问题检测步骤4中依赖监督式学习从训练样本的标签。标签可以在eNB TCE的样本被送到。第二步是检查是否存在一个适当的培训数据库。在我们的示例中,要求是足够多的定期测量和HO-triggered测量期间收集的网络正常运行。此外,一些RLF前停机情况下收集样本。培训创建数据库的预处理联合化疗测量描述正常网络行为没有任何中断。当培训数据库,所有新的测量样品放入测试数据库。操作员需要验证培训数据库,确保它真的像所需的网络特征例如,网络行为在其正常运行。验证可以通过使用异常检测和无监督学习技术如[12]。
在的问题检测阶段,最近收到联合化疗在测试数据库中测量与系统中的训练数据来检测异常行为,如图3。故障检测过程的第一步是准备训练和测试中的数据集。根据这一问题,并应用数据挖掘算法,预处理阶段可能包含多种操作如数据清理、数据集成、数据转换和数据扩展。在我们的框架中,每个联合化疗测量,如表所示1,被分裂打扫一个测量头部分和数据部分。后处理的标题部分包含信息的故障检测结果,如可视化和位置相关,但不是使用的数据挖掘算法。的数据部分测量样本是一个矢量10个数字组成的功能如下: 在哪里和细胞测量和服务吗和是最强的邻居细胞测量,。WCQI是医院药学部宽带测量和PHR服役的细胞是细胞功率余量报告服务。RSRP和RSRQ测量在对数刻度中指定的(14]。请注意,在我们的研究WCQI和PHR测量在3 gpp规范并不完全一样。医院药学部首先,代表了下行宽带信号干扰比使用dB范围表示。此外,PHR指标分配比例的大小导致PHR每个物理资源块指标提出了(15),因为它被视为改善上行覆盖问题的检测和上行功率控制参数化问题。因此,高维数据分类器由10个特性。此外,10-feature分类器的性能与8-feature分类器因为WCQI和PHR测量的可用性取决于eNB实现。8-feature分类器只使用问题RSRP和RSRQ测量报告。
3.2。降维
故障检测框架的下一步是降维的一步。降维的目标是在低维空间来表示高维数据集的数据挖掘更快和更少的复杂。通过降维一步使用框架,中断检测框架更加健壮,可以扩展更容易与新数值kpi。降维技术,如主成分分析(PCA)广泛应用于机器学习。
在我们的框架中,测试和训练数据集维数减少了使用非线性扩散映射方法(16- - - - - -19]。扩散映射方法允许在高维空间中寻找有意义的数据模式,代表了他们在低维空间中使用扩散坐标和扩散距离,同时保留本地数据结构。扩散坐标参数化的高维数据集和扩散距离提供了一个当地的保护距离度量的数据。不久之后,我们描述了使用降维方法最初提议在19]:(我)数据集是用来构造一个单向图,图顶点数据点之间的边缘数据点是由内核权函数。(2)扩散是由图上的随机游走。马尔可夫转移矩阵的随机游走了这可以正常化粒重矩阵与一个对角矩阵。(3)最后,如果存在的特征分解可用于推导出扩散坐标吗在嵌入空间和扩散距离度量。内核权重矩阵测量成对相似性数据点的图,它必须是对称的,积极的,和快速衰减(19]。内核是一个常见的选择: 如果重量样本之间和这意味着点小是相似的。另一方面,如果重量大点在本质上是不同的。变量可用于内核规模加权函数,另一方面当地社区尺度的大小。原则上,任何的权函数形式满足上述条件可以用来估计热内核,从而使用扩散过程(19]。高斯内核(2)是可伸缩的,衰减快,也就是说,速度比普通的欧几里得距离,因此它被选中。接下来,对角矩阵来自根据 如果使用适当的内核,那么矩阵可以增加与矩阵从左规范化的马尔可夫转移矩阵: 在马尔可夫矩阵,从样本,描述了概率样本图中有一个步骤。的随机游走图是通过提高马尔可夫转移矩阵到th权力。这给从概率样本样本在图步骤。最后,特征分解提供了一些工具来定义中的高维数据集在嵌入式领域通过构造的估计通过使用仅最大特征向量: 的变量和左和右特征向量,变量的特征值特征向量。此外,扩散距离和扩散坐标可以通过使用构造特征值和特征向量作为证明(19]: 的扩散距离之间的欧几里得距离测量吗和在嵌入空间中利用扩散坐标。使用扩散坐标构造最重要的特征向量和特征值在[19]: 扩散的坐标为测量可以获得的吗——- - - - - -扩散坐标矩阵。的列向量特征向量的吗乘以相应的特征值所示(7)。此外,扩散坐标测量被发现在扩散坐标矩阵的行向量。从(6)和(7),扩散距离样本在高维空间中对应于嵌入式空间中样本的欧氏距离。
3.3。数据分类
第三步在我们停机检测框架数据分类用来学习测试数据的特点。早在我们的论文中,我们认为是无监督学习技术来检测睡眠细胞(12)通过合并意味着集群没有考虑到期刊联合化疗测量。在本文中,我们描述的应用被称为监督学习分类算法最近的邻居搜索(NNS)。监督学习和无监督学习技术之间的区别是,在监督学习我们知道标签的训练数据和基于训练数据特征我们试图标签未知样品的测试数据。在我们的方法训练数据由样本属于3类类型,贴上期刊,交接,或RLF样本,目标是所有未知的测试数据样本分类这三个类别类型。动机的分类测试数据这三个类类型检测期刊联合化疗测量即有相似之处,属于故障样本类别。通过分类,早期故障检测可以在只有RLF报告数量不足的情况下,可用。
得到的基本思想是找到一组最近的邻居的训练数据库为每个未知的样本在测试数据库中。一个方法的确定计算距离吗培训数据库中所有点。因此,NSS的复杂性取决于训练集和测试集的大小以及数据样本的维数。在我们的工作中,最近的邻居搜索嵌入低维空间进行基于欧氏距离。这同样是一样的样本在高维空间进行分类根据扩散距离。一组用于定义所有未知样品的标签。可以有一个广泛的供应商特定的算法来确定未知样品的标签的基础上但在这里使用一个简单的算法和基于最大的类标签选择类的样本集合中。
3.4。异常检测
故障检测框架的最后一步是异常检测。在这个阶段,测试数据库已经标记,这些信息是用来检测网络中可能的中断或sleeping-cell问题。有两种不同的原则检测基站异常行为。一方面,异常可以在时域中发现通过比较目标基站的行为及时观察到的行为。这需要长时间的观察和数据采集时间每个基站创建可靠的域配置文件。另一方面,基站异常行为中可以检测到基站域通过比较目标基站周边基站的行为。在后一种情况下,更多的数据被聚集在一个较短的时间,但可以偏见如果邻近基站的数据表现不同,也就是说,由于不同的参数化。在我们的框架中,常见的假设对所有基站是在正常操作期间RLF样本的数量很小。因此,数据分类不应导致许多期刊联合化疗样品被认为是属于RLF类。另一方面,当网络中断,许多期刊联合化疗测量应该类似于RLF样本。 Since the anomaly detection criterion that is, increase of the number of periodical MDT measurements which have similar characteristics as the RLF samples, assumes similar behavior of the base stations during normal operation, the outage detection is based on the base-station domain analysis.
在我们的框架中,异常检测是通过计算每个eNB联合化疗报告贴上RLF样本数量和比较这的网络正常运行时间和基站域。检测是基于著名的标准分数指标描述了类似的观察特定eNB与正常行为的一组相邻eNBs考虑的正常偏差观察。标准分数对于eNB被定义为, 在变量eNB RLF-labeled样品的数量吗和变量和预计平均值和标准偏差eNBs RLF-labeled样本的数量的当地社区。如果远远大于1,那么eNB呢可能是一种反常现象由于RLF-labeled观测的数量不符合的正常偏差RLF观察。
4所示。仿真结果
4.1。模拟配置
我们的故障检测方法验证了动态LTE系统模拟器是用于收集大型联合化疗测量数据库。模拟器能够模拟E-UTRAN LTE发布8和下行和上行与几个无线电资源管理、调度、流动性,交接,traffic-modeling功能。仿真场景由19个站点和正六边形网络布局的57个基站与国米站点1750米的距离。7中心网站是正常细胞放置问题收集联合化疗测量和12个站点的外层是只用于产生干扰。用户在场景中移动3公里/小时的速度和回归参数选择的方式表现在正常操作被认为是好的。另一方面,被选出的无线电监测值触发RLF略高于正常,以确保一些RLF样品收集在网络的正常运行。仿真假设是基于3 gpp宏观情况3规范(20.)定义使用带宽、中心频率、网络拓扑,和广播环境中列出的表4。
模拟运动由一个参考和模拟题。参考模拟被用来收集训练数据在网络的正常运行和模拟联合化疗数据库包括148723定期测量样本,698回归样本和138 RLF样本。发送联合化疗的周期性测量报告是0.5秒。在问题的场景中,eNB减毒完全因为目标之一是沉睡的细胞模型上行和下行的故障。中断是由添加50 dBi天线衰减eNB 8。因为所有网站操作在同一个乐队和覆盖interfrequency层不存在,eNB 8停机。这邻近细胞的扩大了统治区域的图4。优势区域显示领域特定的细胞是最强的细胞。在左边的图,eNB 8优势区域显示与绿松石的颜色,和大小的区域类似于其他细胞。正确的图,eNB 8是睡觉和面积是由邻近的细胞。注意,eNB 8覆盖不到5%的整体问题的地区分布在模拟。
(一)参考模拟
(b)模拟题
描述优势区域问题是容易理解的,因此,它是有趣的,看看我们的方法能够检测优势领域的变化。联合化疗数据库收集的参考仿真提供了基础的训练数据库定义了三个类的数据结构和特点。从参考自联合化疗数据库模拟大只有一小部分数据被用于实际的训练数据集。训练数据集是由3000年期刊使用随机采样样本(21),所有样品,所有RLF样本。此外,RLF数据集的大小是采样过量4倍为了大致相同数量的HO和RLF样本在训练数据集。即使过采样会导致一定程度的过度拟合,因此可能导致分类精度退化(22),它还可以提高分类器的性能所示(11]。所有联合化疗收集的数据从模拟的问题是用于构造未知的数据库,并且每个样本在这个数据库是贴上期刊,交接,或RLF类部分中解释3。
4.2。仿真数据挖掘结果
能够检测异常网络行为,在未知的数据库中所有联合化疗测量样品标签的使用训练数据集分类器。未知样本的标签是基于7最近的邻居发现因为这表现得相当好。最近的邻居在训练集总是选择基于欧氏距离的嵌入空间,是一样的原始空间中的扩散距离。得到的分类精度算法应用于联合化疗数据如表所示2和3。分类精度评估与混淆矩阵的概率真阳性标签和假阳性标签。不同的混淆矩阵所示10-feature 8-feature分类器。10-feature分类器使用所有10个特性包括WCQI和PHR中描述的降维(1),而8-feature分类器只使用问题报道RSRP和RSRQ值。混淆矩阵的对角线细胞显示真阳性说明样本的可能性概率是正确标记属于同一个类。假阳性的可能性表明概率样本的标签错误的类。这种比较容易做到,因为我们知道真正的标签的数据。括号内的数字的类列显示不同的样本类型的总量在模拟和混淆矩阵展示这些样本标记不同的分类器。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
表2显示了所有联合化疗样品标签参考模拟精度。可以看出true-positive-labeling参考数据的可能性是80%以上为类类型不管使用的分类器。10-feature分类器性能更好,但8-feature分类器的性能也不是更糟。每个人都应该注意,我们不要试图分类精度达到100%,因为它很可能一些期刊,交接,和无线链路失败样本会在任何情况下类似的特征。期刊期刊的方式收集样品,因此,样品前交接或无线链路失败事件被认为具有类似的特征。值得注意的是,交接发生在细胞边缘,并根据回归参数和慢衰落条件下一些交接可以用无线链路失败有相似之处。
联合化疗的分类质量问题和参考样本模拟大约是相同的如表所示3。10-feature分类器的分类精度仍然是更好的问题场景。有一个小变化0.8%交接假阳性标记,但可以忽略不计,因为交接样品的数量只有683 8样本分类意义不同。一个小变化在期刊false-positive-labeling概率样本观察。问题模拟,10-feature分类标签期刊无线电线路故障样本的0.9%。这几乎是两倍参考模拟。然而,这0.4%的细微差别是重要的,因为期刊的数量样品在数据库问题模拟联合化疗是巨大的,148693个样本。这意味着1338年额外RLF-like样本发现期刊联合化疗组的样品指示故障。比210年多537%的样品如此RLFs中发现问题的场景。如果使用8-feature分类器不同的是一样的。 However, the classification accuracy is slightly lower, and therefore the total number of RLF-labeled samples is higher in the reference and the problem simulation. On the other hand, the 8-feature classifier can be applied to the interfrequency measurements directly, since it does not use CQI or PHR measurements for the outage detection.
故障检测的最终目标是将RLF-labeled样本与基站联系起来。一般来说,联合化疗和样品的详细位置信息报告与纬度和经度值和剩余的样本可以基于射频指纹联合化疗的测量。回想一下,如果只有GCI的服务将使用细胞,检测样品统治地区的故障eNB将与邻近细胞导致误判。我们的假设是,大多数样本总是可以找到至少优势区域的准确性为例,估计已知最强的服务单元为每个示例基于运营商估计的优势地区。在城市网络部署,优势区域会变得模糊的定义由于建筑物,街道布局和慢衰落。然而,由于联合化疗用于提高网络覆盖地图,假设支配区域估计可以改善城市环境。因此,假设如果联合化疗熊的详细位置,测量相关的优势领域并不是一个问题。然而,如果一个细胞缺失,射频指纹的定位和相关数据库是一个挑战,甚至可能导致错误的结论。摘要射频指纹定位不准确不考虑,联合化疗的结果依赖于可用性报告与详细的位置信息,即经度和纬度。在图5、规范化RLF-labeling结果参考模拟所有基站进行描述。RLF-labeled样本与基站根据估计的优势领域。蓝色是指期刊样本,绿色是指交接样品,和红色指RLF样品贴上无线链路失败。结果规范化RLF-labeled样本总数的参考方案。有一些无线电故障发生在参考场景和只有3%的RLF-like样本检测发生的主导区域eNB 8。这些RLFs参考场景由于长intersite基站之间的距离和慢衰落效应尤其是eNBs 6, 18岁和43岁。
基于所有RLF-labeled样品,每个基站的标准分数计算通过使用(8)。可以使用标准分数作为一个简单的指标来检测是否eNB行为是正常的,因为它考虑了统计变异性RLF-labeled样品每个基站在正常网络操作。在图6标准分数分布在参考场景显示8-feature分类器和蓝绿色与black-dashed 10-feature分类器。这两个分类器的分布是相似的,95%的eNBs标准分数小于2。
RLF-labeling导致问题仿真标准化参考仿真结果一样。触发sleeping-cell问题后,RLF-labeled样本的数量显著增加。图7显示,几乎40%的RLF-labeled样本与eNB 8优势区域,而只有3%的引用情况。此外,它是观察到的总数RLF-labeled样品以来8-feature分类器更高更多的期刊样品贴上RLFs由于稍差的分类精度。只有36%的所有RLF-labeled样本与eNB 8在这种情况下。这表明这两个分类器检测定期测量类似于收音机链接失败。此外,eNB 8标准分数是26.2 10-feature 8-feature分类器分类器和25.2。这意味着,这两个分类器检测异常网络行为自标准分数远远大于two-indicating停机。然而,10-feature分类器能够隔离问题的参考仿真标准分数以来更好的更大、更RLF-labeled与故障相关的样本eNB 8。这表明医院药学部用和PHR指标分类可以提高故障检测。另一方面,8-feature分类器可以检测到问题,但因为它不依赖于医院药学部的PHR它可以应用于interfrequency测量。然而,验证interfrequency层的故障尚未完成。
注意问题的问题场景不会检测eNB 8的存在。因此,位置信息的存在和关联优势信息有助于建立一个更好的理解问题的根本原因和位置。RLF-labeled样本在网格地图的位置见图8。模拟区域划分米的矩形网格点地图。RLF-labeled样本的数量计算每个网格点和一个热图用于可视化的可能RLF-labeled样本估计优势地区的地图。灰色表示地区热图中可能有一些故障为例,当接近一个覆盖洞,一个明亮的红色显示出故障检测领域。图8(一个)一起显示了引用的热图仿真估计优势地区,可以看到,在单元边缘确实存在一些中断地区由于慢衰落和大型ISD之间的网站。图8 (b)显示了问题模拟的热图显示明显更高的可能性的故障eNB 8区与参考模拟。可以看出RLF-labeled样本表示可能性的增加变化对统治的地区。
(一)参考模拟
(b)模拟题
4.3。异常检测的时间
由于异常检测是基于数量的增加定期测量分为RLF样本,分析了检测时间通过观察报告样本而不是实际的检测时间。报道样本的数量是一个更好的指标,由于时间需要收集足够多的样本检测取决于数量的活跃用户,用户分布,并联合化疗配置,例如,周期性的测量。平均基站具体得分指标之前和之后出现的问题eNB 8如图9。
在图9,彩色曲线描述如何分数指标表现在系统模拟,以防10-feature使用分类器。的设在表明所有收到的平均数量每eNB联合化疗的报道,而模拟。的设在表明eNB分数在(8)。的得分值每5秒钟更新一次,但平均值和标准偏差值是根据参考模拟保持不变。图9表明,如果观察窗太短,然后基站没有发现异常。前的参考仿真问题,大约需要3000联合化疗样品/ eNB直到检测到一些小故障。固体绿色曲线和点缀红色曲线表示一些停机eNB 6和eNB 18。检测时间在这种情况下将取决于问题的平均数量每eNB eNB主导地位的运动区域,并联合化疗的周期性报告。例如,如果10均匀分布问题发送联合化疗与周期性报告0.5秒,然后检测为例,3000年接收样品,需要2.5分钟。这个问题每收到eNB 4500联合化疗报告后触发。的eNB分数被清除,重新启动和检测。引发这个问题后不久,eNB 8开始脱颖而出的统计数据。蓝色曲线表示eNB 8的得分已经超过10 1500年接待的联合化疗后每eNB报告。此外,紫色曲线表明,eNB 43分数从2增加到3由于沉睡的细胞。这表明故障略有增加的优势区域eNB 43 eNB 8中的问题。eNBs 6和18日停机是相似的。
5。结论
本文描述了一种数据挖掘框架,它能够检测网络故障和睡眠细胞移动网络使用驱动测试数据库。框架是认知自适应网络配置和部署拓扑通过学习网络特点,同时收集分类器的训练数据的问题。此外,描述故障检测框架作品以自组织的方式,因为它使用E-UTRAN最小化驱动测试功能收集培训和测试数据库。方法的本质是标签未知数据通过寻找类似的特征从先前已知的网络数据。为此,扩散降维映射和最近的邻居数据分类方法利用。以来提出的方法是健壮的同样的原理利用可用于多种不同的网络问题问题的位置数据可以孤立和后来作为已知的问题分类。
在睡觉的情况下细胞的问题,检测是基于发现定期测量与收音机链接失败的相似之处。在研究验证的情况下,该算法获得537%的样本数量可用于故障检测除了真正的无线链路失败报告。这使检测更可靠和可能速度与算法相比纯粹基于RLF事件报道。虽然我们的方法显然有助于检测故障情况下考虑期刊的样本,仍有一些缺点在这框架需要解决在实际部署。首先,我们的方法检测睡眠细胞基于故障出现在优势领域的沉睡的细胞。然而,在密集的网络,故障可能那么严重,相邻基站的优势地区的用户可以睡觉没有显著增加基站的无线链路失败。此外,由于典型的生活网络由几层重叠的频率,然后无线链路失败在一层可以避免通过将问题移交给另一个频率层。在这种情况下,该框架可以扩展到考虑加载水平的细胞等附加功能,回归活动或interfrequency层测量。这些特性与优势领域的变化最终将导致一个更全面的解决sleeping-cell问题。然而,确实提出了框架的一个优点是由于降维鲁棒性的一步。 This is a stepping stone for future research allowing an easy inclusion of new features in case of different anomaly detection studies.
确认
作者要感谢阿米尔Averbuch和大卫吉尔从特拉维夫大学的支持与知识挖掘。此外,他们要感谢瑞萨移动欧洲使用以来的系统模拟器的工作不能没有它了。此外,建设性的批评、评论和同事的支持解决方案有限公司,Jyvaskylam大学和坦佩雷大学无线电网络小组的技术非常有价值的工作。
引用
- 3 gpp TS 36.902,“进化通用陆地无线接入网(E-UTRAN),自配置和自优化网络(儿子)用例和解决方案,“v.9.3.1, 2011年3月。视图:谷歌学术搜索
- NGMN联盟,“下一代移动网络用例相关的自组织网络,整体描述,“v.2.02, 2008年12月。视图:谷歌学术搜索
- 3 gpp TR 36.805,“研究驱动测试最小化在下一代网络中,“v.9.0.0, 2009年12月。视图:谷歌学术搜索
- 3 gpp TS 37.320,“无线电测量收集的最小化驱动测试,“v.0.7.0, 2010年6月。视图:谷歌学术搜索
- 3 gpp rp - 111361”,增强最小化驱动测试E-UTRAN UTRAN-Core部分批准,“诺基亚西门子网络,诺基亚,联发科,2011年。视图:谷歌学术搜索
- 3 gpp TS 32.422,“用户和设备跟踪,跟踪控制和配置管理,“v.11.0.1, 2011年9月。视图:谷歌学术搜索
- 3 gpp TS 36.331,“进化通用陆地电台访问(进阶),无线资源控制(RRC)、协议规范,“v.10.4.0, 2011年12月。视图:谷歌学术搜索
- m . Amirijoo l . Jorguseski t Kurner et al .,“细胞LTE网络故障管理”学报第六届国际研讨会在无线通信系统(ISWCS ' 09)锡耶纳,页600 - 604年,意大利,2009年9月。视图:出版商的网站|谷歌学术搜索
- m . Amirijoo l . Jorguseski r . Litjens, r . Nascimento”在LTE网络细胞中断补偿的有效性IEEE消费者通讯和网络研讨会论文集(国家气候变化委员会”11)647年,页642 -拉斯维加斯,内华达州,美国2011年1月。视图:出版商的网站|谷歌学术搜索
- 汉和m . Kamber,数据挖掘:概念和技术,2000年摩根考夫曼。
- s . b . Kotsiantis d Kanellopoulus, p . e . Pintelas”为监督学习数据预处理,”国际计算机科学杂志》上,1卷,不。2、111 - 117年,2006页。视图:谷歌学术搜索
- f . Chernogorov j . Turkka t Ristaniemi, a . Averbuch检测睡眠细胞LTE网络使用扩散映射职业训练局,春天,布达佩斯,匈牙利,2011。
- c·m·穆勒m . Kaschub c·布兰和万科,“细胞中断检测算法使用邻居列表报告,”诉讼国际研讨会上的自组织系统,第229 - 218页,2008年。视图:出版商的网站|谷歌学术搜索
- 3 gpp TS 36.214,“进化通用陆地电台访问(进阶);物理层;测量,”v.10.1.0, 2011年3月。视图:谷歌学术搜索
- j . Turkka和j . Puttonen”覆盖优化,使用LTE功率余量报告”第74届IEEE车辆技术研讨会论文集(职业训练局的11-Fall)2011年9月,旧金山,加州,美国。视图:谷歌学术搜索
- r . r . Coifman s Lafon a . b .李et al .,“几何扩散作为谐波分析工具和结构数据的定义:扩散地图,”美国国家科学院院刊》上的美利坚合众国,卷102,不。21日,第7431 - 7426页,2005年。视图:出版商的网站|谷歌学术搜索
- r . r . Coifman和美国Lafon扩散地图。”应用和计算谐波分析,21卷,不。1,5 - 30,2006页。视图:出版商的网站|谷歌学术搜索
- b•纳德勒美国Lafon, r . r . Coifman”扩散地图,谱聚类和特征函数的福克尔普朗克运营商”进步的神经信息处理系统18卷,第962 - 955页,2005年。视图:谷歌学术搜索
- A . Schclar“降维扩散框架,”软计算对知识发现和数据挖掘第四章,第325 - 315页,2008年。视图:出版商的网站|谷歌学术搜索
- 3 gpp TS 36.814,“进一步发展为进阶(版本9)物理层方面,“v.9.0.0, 2010年3月。视图:谷歌学术搜索
- h·e·a·加西亚和他“学习不平衡数据,”IEEE工程知识和数据,21卷,不。9日,第1284 - 1263页,2009年。视图:出版商的网站|谷歌学术搜索
- r·c·Holte l .涡流和b·w·波特,”概念学习和小分离的的问题,”人工智能国际联合会议,第818 - 813页,1989年。视图:谷歌学术搜索
版权
版权©2012 Jussi Turkka et al。这是一个开放分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。