复杂性

PDF
复杂性/2018年/文章

研究文章|开放获取

体积 2018年 |文章的ID 9702304 | https://doi.org/10.1155/2018/9702304

鑫刘、周烟具、陈副主任, 在移动互联网大型实时数据库中挖掘异常数据”,复杂性, 卷。2018年, 文章的ID9702304, 12 页面, 2018年 https://doi.org/10.1155/2018/9702304

在移动互联网大型实时数据库中挖掘异常数据

学术编辑器:尤拉莉亚马丁内斯
收到了 2017年5月08
接受 2017年11月07
发表 2018年1月10

文摘

挖掘异常数据保证安全和数据调度的并行数据库的访问和维护高性能实时数据库的操作。传统的采矿方法生成丰富的干扰数据准确性降低,效率和稳定性,导致严重的缺陷。提出了一种新的挖掘异常数据方法,用于分析实时数据特性,获得级的光谱模型的异常数据,建立decisional-tree信息链传播模型在移动互联网的异常数据,获取内部异常的信息流数据信息链的大型实时数据库,和集群数据。在当地的信息流的特征时间尺度参数,异常数据的相位特性之前过滤得到;采用决策树outlier-classification feature-filtering算法获得的信号进行分析和即时振幅和实现异常数据的相位频率特性。小波变换阈值去噪结合信号去噪分析数据抵消,形成正确的检测滤波器模型,实现异常数据挖掘。仿真表明,该方法检测到异常数据特性响应分布特点,减少响应时间,迭代次数,和矿业错误率,提高矿业适应和覆盖率,并展示了良好的挖掘结果。

1。介绍

快速发展的宽带无线接入(BWA)技术和移动终端,目前新兴的移动互联网整合移动通信和互联网接入。“移动互联网”这个词是一个通用术语,指的是活动,结合互联网技术,实现平台、商业模式、与移动通信技术和应用程序。随着移动互联网的发展,移动通信技术应用到大型实时数据库可以显著提高数据库的运行效率。然而,许多潜在的安全隐患可以发生在移动互联网条件下大型实时数据库的操作。因此,为了避免安全漏洞,研究如何有效地监控和我离群值数据在移动互联网大型实时数据库已成为热门的研究主题(1- - - - - -3]。

传统的采矿方法,整合集群映射扰动搜索和模糊C均值已经采用了离群数据挖掘在大型移动互联网实时数据库。然而,这些方法忽略大型实时数据库在移动互联网环境的复杂性和限制的异常数据的效率可以在这样的数据库中发现4]。基于函数余弦改善物流模型提出了在文献[5]分析了混沌时间序列使用非线性时间序列分析,构建一个在线的方法称为模糊最小二乘支持向量机(FLS-SVM),发现异常数据挖掘在移动互联网大型实时数据库。然而,时间尺度的影响必须进一步考虑这个方法,而且其置信概率需要改进提高数据挖掘的准确性。此外,所需的计算过程太复杂,采用在实践中(5]。一个决策树outlier-feature基于分类的方法挖掘异常数据在移动互联网大型实时数据库提出了在文献[6];然而,这种方法往往会受到大量的干扰数据,该妥协的信心系数和挖掘算法的准确性6]。其他提议的方法挖掘异常数据在移动互联网大型实时数据库包含一个基于支持向量机(SVM)方法(7],萤火虫算法方法[8),一个集群和快速计算的方法(9),一个关联规则发现方法(10),和一个知识granularity-based方法(11]。然而,所有的算法基于这些传统方法有缺点(例如,可怜的离群数据挖掘的准确性,大错误,和过度的执行时间),需要进一步改进12- - - - - -15]。

旨在解决这些传统方法的缺点,一个决策树outlier-classification feature-filtering检测方法提出了我的异常数据在移动互联网大型实时数据库。这种方法的优点是,它可以构造级光谱模型,通过分析实时数据的异常数据的特性。基于这个模型,初步分析了异常数据信号获取的信息链的异常数据存在。后续的异常值检测的方法提高了效率。传播模型决策树信息链使用内部的异常数据在移动互联网条件下构造精确集群移动和分散数据和获得一个信息链的异常数据,然后以有序的方式引入到数据库中,因此,支持后续的挖掘的精度提高。信息与内部异常数据流在一个大型实时数据库获得信息链和经历集群进一步提高其精度,减少采矿计算的复杂性,为以后奠定基础的置信区间。之后,使用改进的采矿方法,前置滤波器的相位特性异常数据离群值数据获得的信息流动,以及决策树outlier-classification-characteristic滤波算法用于获得一个解析信号和一个恒定的振幅。然后,决策树方法用于屏幕过滤无用的高,低频组件和实现异常数据的相位频率特性。WT阈值去噪信号去噪相结合,大大减少了响应时间,迭代频率、采矿和错误率,提高矿业适应和精度和纠正检测滤波器模型。该方法有效地提高了精确的覆盖和离群数据挖掘的可能性和实现了离群数据挖掘在移动互联网大型实时数据库。

2。构建一个信息传输模型决策树信息链的异常数据流和获取信息

2.1。构建一个信息传输模型的决策树信息链与移动互联网条件下的异常数据

假设 代表了振幅的离群值数据和信息 指的是在移动互联网条件下初始数据的频率。然后,异常数据的模型在移动互联网条件下振幅谱如下所示: 在哪里 代表的平均时间在移动互联网条件下的异常数据的检测, 是一个常数,然后呢 指的是调频斜率的异常数据在移动互联网环境下的信息。在这里, 是指分布在移动互联网条件下的异常数据的带宽,和 指的是在移动互联网环境下的数据刷新周期。

决策树的交叉项信息链采用数据在移动互联网使用以下表达式:

在上面的公式中, 代表全球的频率信息,显示了一个线性关系的斜率信息频率调制的时间范围。

公式(1)和(2)用于屏幕生僻链在移动互联网数据传输信息,去除干扰信息链,进行动态分析,并处理异常数据信息链(16- - - - - -18]。

在移动互联网环境下,假设 代表局外人的带宽和时间数据,分别 代表乐队内部频谱异常数据(19),而 代表的固有模态函数的异常数据在移动互联网。然后,公式(3)是用于建立异常数据传输模型决策树信息链(20.]。

在前面的公式, 是一个常数。在移动互联网业务,异常数据的瞬时频率显示随时间线性相关性在相同的脉冲宽度(21,22]。级描述的光谱异常数据与模型的公式(1)是反映在所需的信息链表中公式的拓扑结构(2),和信息链的异常数据传输通过公式(3)。决策树信息链的异常数据的传输模型在移动互联网如图1

2.2。收购Outlier-Data-Carrying信息流动在一个大型实时数据库

2.1,基于离群值获取和传输包含信息流动在移动互联网,离群值包含信息流动所获取的信息链传输到大型实时数据库。具体步骤如下。

首先,进行了时间域和空间域分析链传送到大型实时数据库的信息。公式(4)是用于获得线性调频信号幅频(23]离群值包含信息流的特点在信息链: 在哪里 代表离群值的属性值范围和完整性数据信息流动的信息链,分别 ,分别代表的元素和元素的异常数据的权重信息流动。

假设 代表全球的频率异常数据信息流动在大型实时数据库的信息链。然后,全球频率特性可以表示如下:

其次,基于获取全球信息流动的频率特性,C4.5决策树模型(24]介绍了信息流异常分类特征建模。此外,线性调频信号幅频特性提出了公式(4)用于信号分析模型的信息流动。然后,公式(6)是利用获得的包络特征异常数据信息流动信息链的大型实时数据库:

在上面的公式中, 代表了决策树的高频分量 振幅和短语信息干扰特性的大型实时数据库,分别。公式(7)用于获取干扰频率特性形成的离群值包含信息流动的信息链:

前面的公式描述生成的校验位离群值包含信息流动的信息链代表的大型实时数据库的数据干扰频率。在此基础上,公式(8)是用来计算重量异常的概率包含信息流动的信息链:

第三,初步数据筛选后,动态开采进行异常数据流的信息。干扰比计算每根节点的决策先生的信息内容,固定频段的时域波形得到如下:

最后,基于上面的处理步骤中,异常值包含信息流动信息链的大型实时数据库,形成了一个基础的设计决策树outlier-feature-classification算法离群数据挖掘方法。

2.3。聚类异常值包含一个大型实时数据库中信息流动

收购后的离群值包含信息流是在前面的部分中,信息流是集群,商务部算法(25)优化的评价标准两个集群使用Xie-Beni (XB) [26)指数和FCM目标函数(27] ,分别和有效的流程中包含噪声信息流设置重叠信息流聚集。因此,商务部算法采用集群离群值包含信息流。

(XB)指数措施课堂密实度和组内的分离后的离群值包含信息流集群和被定义为内部密实度的离群值的比值张包含信息流聚集 在信息流动总量之间的最小距离 (28]:

然后,优化 目标函数 表示如下:

在商务部算法的迭代过程,离群值包含信息流设置第一,之前设置的加权系数的异常数据聚合, ,和集群中心, 然后,加入模糊( )的每个集群中心的样品是按照下列公式计算:

在公式(12), 表示模糊聚类索引和 指的是加权指数。集群中心 商务部算法的计算如下:

注意,前面的公式用于计算每一个局外人的群集中心信息流聚集在聚类过程中。当集群中心下面的方差 ,所有集群中心获得商务部的新算法进行初始化集群中心 ,如以下公式所示:

总之,商务部算法用于集群离群值包含一个大型实时数据库中信息流动。需要进一步数据挖掘的集群信息。

3所示。改进的离群数据挖掘移动互联网大型实时数据库

在前一节中讨论的过程改进的离群数据挖掘方法在移动互联网大型实时数据库。决策树outlier-classification特点采用滤波算法。从本质上说,决策树outlier-classification feature-filtering是一个持续的过程,从高频滤波低频滤波(28- - - - - -30.]。根据异常值包含信息流动在大型实时数据库中,异常数据阶段特性之前过滤在当地获得的特征时间尺度参数如下:

在上面的公式中,任何异常数据信号 在系统中可以表示为

采用决策树分类feature-filtering,上述公式作为一个真正的信号正交。得到了相应的解析信号和瞬时振幅如下:

在上面的公式中, 同时,正交积分吗 代表菲涅耳积分异常数据信号的大型实时数据库的信息流动。决策树是用来过滤去除前几个高频组件的异常数据和异常数据后几低频组件固定特征。phrase-frequency特性得到如下:

引入决策树outlier-classification feature-filtering算法采用本研究结合小波变换的阈值降噪方法降低信号噪声。抵消程度进行了分析。首先,离群值的功能状态响应分布数据包含的信息流动大型实时数据库进行了分析(31日,32]。然后,设置一个阈值。一个小波系数大于阈值被认为是由一个异类数据信号。最后,公式(19)是利用获取的异常数据检测过滤模型:

此外,公式(20.)用于修改的异常数据检测过滤模型,最终实现了离群数据挖掘的信息流动移动互联网大型实时数据库:

在前面的公式, 代表了调节系数, 是小波分解的细节系数的自然振型特性的异常数据信息流的大型实时数据库,和它的值范围是什么 。提高信心系数和监测模型的准确性,降低虚警概率,并防止错过了报告,设计需要优化改进的概率范围的离群数据挖掘的信心。因为异常信息流动的大型实时数据库中的数据显示一定的唐突,抵消程度和平均计算,决策树分类feature-filtering治疗应用,利用小波逆变换,去除干扰产生的噪音。离群值的长度被认为是数据信号 , 的标准偏差吗 th层噪声包含每个固有模态函数。根据以上分析,决策树outlier-classification feature-filter离群数据挖掘算法方法是改善。挖掘精度、采矿效率,挖掘稳定,提高了离群数据挖掘方法的时间效率通过仿真实验进一步验证。

4所示。仿真实验和性能测试

4.1。仿真实验

评估的效率改进的离群数据挖掘方法在移动互联网大型实时数据库,进行了仿真实验。这个实验是基于Matlab仿真软件。一个大型实时数据库模型构建。数据在移动互联网环境下的选择信号模型是一组线性调频信号的频带频谱2 ~ 10 KHz和持续时间4 ms。的 相似之处是1.60 dB, 3.52 dB, 5.38 dB,分别和6.79分贝。提出的改进方法是采用数据挖掘。对所构造的决策树outlier-classification特性模型,建模过程的参数设置和模拟实验如表所示12,分别。


标题 解释 默认的

二元分割 二叉树方法是用来把名词属性。
信心的因素 修剪信心因素(因子小于给定值从子树修剪)。 0.25
MinNumObj 实例化的数量将修剪从叶节点。 2
NumFolds 这个值是用来减少error-pruning数据流;剩下的数据是用来构造树。 3
ReducedErrorPruning 修剪和减少错误的方法。
种子 修剪与错误降低移植方法和随机数据的子树的种子。 1
Unpruned 确定结果树被修剪。


单个节点的CPU数量 4
单CPU Core i5 3.11 GHZ
单个节点的内部存储 4 G
操作系统 Windows 7
硬件 500克
交换网络 200光网络

根据参数表12离群数据的挖掘模型在移动互联网建立了大型实时数据库作为数据挖掘的基础实验。

在实验的基础上,未被利用的方法,根据异常数据的偏移度的分析模型在移动互联网数据库,一个决策树outlier-feature分类方法是采用离群数据挖掘。传统方法的步骤如下。首先,decision-tree-based信息链传输模型的异常数据在移动互联网大构造实时数据库。然后,决策树分类特征算法用于我的异常数据。最后,在大型实时数据库模型的异常数据信号如图2

干涉项数据集被挖掘异常数据时,有大量的干扰噪声的广泛的子空间的异常数据系列,导致信心系数低的挖掘算法。很难建立一个离群数据挖掘模型在移动互联网大型实时数据库;因此,图中所示的条件2因为异常数据出现淹没在正常数据和几乎可以开采。

因此,在获得异常的传播模型包含的信息链,去噪和动态孤立点数据挖掘,信息流动所需的信息流动和集群信息链传播到大型实时数据库。只有在去噪和动态开采过程完成后,可以有效和准确的离群数据挖掘实现。

使用该方法,离群值包含信息流动在大型实时数据库获得信息链。利用线性调频信号的幅频特性来获得全球outlier-classification特性和频率特性和模型数据分析其信号。在此基础上,形成的包络特性异常值包含信息流得到信息链的大型实时数据库及其干扰频率。接下来,概率权重计算,大数据初步筛选之后,离群值包含信息流的动态挖掘的信息链获得信息内容特定频段的时域波形。

离群值数据信息流的传输过程中信息链在大型实时数据库是采样;和输入和输出数据或数据。采样频率对全球异常数据信息流动是12.58赫兹,采样间隔为32.4 s,总共有1024个采样点输出稳定(33]。时域序列形成的异常数据信息流动进行了测试。原文的时域序列波形异常数据信息流如图3

为了测试改进方法的影响,CCPSWNIDA方法(消息比例请求消息的回应。与监控的功能异常状况,一旦发现异常值的百分比变化超出正常范围,离群值将警觉,实现入侵检测的目的。)(Ni, 2014)34)是采用比较。离群值的时域序列波形包含信息流动从我们的方法和CCPSWNIDA方法获得数据所示45,分别。

如数据所示45,而原始的异常数据的时域序列波形信息流动,离群值的时域序列波形包含CCPSWNIDA方法获得的信息流动展览高误差和相对无序的波形,而离群值的时域序列波形包含本文中给出的方法获得的信息流动的时域波形序列是相同的原始异常数据信息流动,它提供了一个相对清晰的波形。这一结果表明,改进后的方法获取离群值包含信息流动的信息链的移动互联网大型实时数据库显示了一定的优越性。

后,商务部集群算法采用离群值包含信息流动从方法获得,和聚类提取结果如图6。如图6显示,商务部算法适应特性有效地反映了条件提出的离群值包含信息流动,使随后的离群数据挖掘的性能。

最后,进行了离群数据挖掘的离群值包含信息流使用自上而下的模式。进行了进一步的实验使用本文提供的方法,这是根据模型获得的局外人链传动在移动互联网和模型中包含的信息获取离群值包含信息流动在连锁店的大型实时数据库的信息。

首先,前置滤波器的相位特性的异常数据。然后,相应的分析信号和即时得到振幅值根据决策树outlier-classification feature-filtering,采用决策树滤波方法去除前几个高频组件异常数据和异常数据后几个低频组件。然后得到的相位频率特性。在此基础上,决策树outlier-classification feature-filtering算法引入和结合WT阈值去噪方法获得的最终模型的异常数据检测和过滤。这个过程确认的异常数据信号的生成,并获得的功能状态响应分布的异常数据,如图7。传统多线程动态数据调度方法采用比较法。异常数据的功能状态响应分布基于传统方法如图8

在图8,代表了离群值数据状态响应传统方法检测到的多线程动态调度信息流动,相应的功能尚不清楚;方法的性能相对较差,和大量的干扰,妥协发现存在异常数据的准确性。相比之下,本文提出的改进方法异常数据状态响应特性好,良好的反应性能,和更少的空间干扰,从而提高员工的异常数据检测精度。

异常数据的功能,多线程动态调度的时间和错误信息流动之间的传统方法相比,该方法。检测样品的最大数量设置为500,和离群值的时间和错误数据功能状态响应之间的比较两种方法在不同样本数量。实验结果如表所示34


检测样品数量 该方法
检测时间/秒 错误/ %

50 2.7 0.003
One hundred. 3.0 0.002
150年 2.4 0.002
200年 2.3 0.003
250年 3.4 0.004
300年 3.3 0.003
350年 2.6 0.002
400年 2.7 0.002
450年 3.1 0.002
500年 2.8 0.002


检测样品数量 传统方法
检测时间/秒 错误/ %

50 6.9 0.1
One hundred. 6.4 0.08
150年 7.4 0.09
200年 7.8 0.07
250年 8.0 0.06
300年 10.2 0.07
350年 6.7 0.04
400年 7.3 0.06
450年 9.7 0.05
500年 8.2 0.04

23表明,该方法检测所需的平均时间的异常数据状态响应从动态调度信息流动是2.83秒,比传统方法更短,需要7.86秒。金额减少63.99%的区别与传统方法相比,表明该方法具有更高的反应效率。该方法的平均错误率和传统方法是0.0025和0.066,分别;改进的方法降低了平均错误率96.2%相比,传统的方法。这一结果表明,该方法保证系统的检测效率和降低检测错误,显示其检测效果的绝对优势。

之后,离群值的迭代次数和健身数据状态响应检测到动态调度之间的信息流动比较传统和拟议的方法。对于这个比较,有10个试验,迭代次数和健身之间的比较两种方法在不同的样本数量。结果如表所示56


测试数量 传统方法
迭代 健身价值

1 72年 58
2 83年 89年
3 91年 116年
4 61年 159年
5 99年 82年
6 73年 85年
7 88年 64年
8 83年 73年
9 77年 151年
10 84年 82年
平均 81.1 95.9


测试数量 该方法
迭代 健身价值

1 26 62年
2 17 67年
3 19 67年
4 18 65年
5 16 64年
6 21 65年
7 19 63年
8 17 65年
9 17 64年
10 24 69年
平均 19.4 65.1

分析表56显示异常数据的迭代的数量特征状态反应所需的不同的方法是不同的。迭代的数量代表了每个方法的性能获得一个最优的解决方案。传统方法所需的迭代的平均数为81.1,而该方法所需的平均迭代次数为19.4,仅仅是传统方法的23.9%。这一结果表明,该方法快速检测的异常数据,得到一个最优解快,表现出一定的优势;这也解释了为什么异常数据动态调度所需的时间更短,该方法比传统的多线程特征信息采用的方法。关于健身价值,传统的方法健身值范围从58 - 159(平均为95.9),同时该方法的健身价值范围从62年到69年(平均为65.1),只有67.8%的传统方法。这一结果表明,从一般的角度看,该方法的调度序列健身越来越需要较少的执行此任务的总时间。

根据异常数据特性的显著特性响应被改进的基于方法的动态调度信息流动,一个异常数据检测过滤模型获得了后续实验。

通过进一步修正模型的异常数据检测过滤,提高了概率置信系数范围对离群数据挖掘,抵消程度和平均流计算离群数据的信息,和逆小波变换用于去除噪声干扰,最终实现异常数据挖掘的信息流。比较结果,异常数据置信系数和偏移程度作为衡量指标。离群值的仿真结果数据云图,如图9。图所示,该方法有效地提高了精确的覆盖和离群数据挖掘的概率和显示了应用程序的承诺。

本文提出的改进方法是扩展来实现精确的离群数据挖掘在离群值一次性传输数据信息流动信息链的移动互联网大型实时数据库。

离群数据挖掘的结果如图所示10

的波形图10表明,基于改进的离群数据挖掘方法删除interdata噪音和显示了相对较高的冲击响应特性,完整的信息内容,和优越的性能,表明当执行的方法应用到离群数据挖掘在移动互联网大型实时数据库。

4.2。性能测试

验证的有效性提出了离群数据挖掘方法,密实度和聚类结果的离群数据挖掘采用的离群数据挖掘的基本性能评价指标,以及改进的方法与传统知识粒度方法和支持向量机(SVM)方法。图11显示了紧性分析结果。然后,离群数据挖掘结果比较不同的方法。图12显示了聚类分析的结果。

11表明,在同样的异常数据传输量,离群数据挖掘在移动互联网大型实时数据库使用该方法显示了密实度通过矿业密实度远高于传统知识粒度和支持向量机方法。随着离群值数据传输量的增加,矿业密实度的方法仍高于传统方法,表明该方法具有很大的优势。在图11,该方法的平均密实度是大约3.155分贝,而传统知识的密实度值平均粒度和支持向量机方法是1.26 dB和0.698 dB,分别。该方法显示增加150%和352%的两种传统方法。

在图12,根据不同的测量尺度的数据,粉色,红色,和蓝色代表不同的异常数据的不同分类,订单,和价值观。在使用该方法时的异常数据挖掘的一个移动互联网大型实时数据库,三个数据类型是高分化和集群。尽管一些粉色的异常数据混合在红色的异常数据,低和可以接受的。因此,上述结果表明,采矿的异常数据的移动互联网大型实时数据库,该方法取得了较好的异常数据聚类结果。

进一步验证提出的离群数据挖掘方法的效率高,离群数据挖掘的准确性,采矿效率、挖掘结果的稳定性,需要挖掘的时间作为指标来评估全球的离群数据挖掘方法。传统知识的粒度和支持向量机方法是采用比较。结果如图13- - - - - -16

如图13下,相同数量的试验和不确定的数据量,移动互联网的离群数据挖掘大型实时数据库使用该方法实现挖掘精度高于传统知识粒度和支持向量机方法。随着试验数量的增加,该方法的优势越来越明显。从全球层面,当使用该方法对离群数据挖掘,挖掘精度平均约为97.74%,而传统知识的挖掘精度平均粒度和支持向量机方法约78.8%和69.7%,分别。该方法实现精度的改进方法相比,24.03%和40.22%。这个结果表明,本文给出的方法绝对是占主导地位的离群数据挖掘的准确性。

它可以通过分析人物14,相同的实验条件下的数量和不确定的数据量,数据挖掘大纲窗口在移动互联网大型实时数据库与本文的方法显示了采矿效率高于传统知识粒度方法和支持向量机方法。与实验量的增加,本文方法的优点是更加明显。从全球层面,当使用本文提出的方法对离群数据挖掘,挖掘效率平均约为96.8%,而平均开采效率的传统知识粒度方法和支持向量机方法的70.9%和76.9%。本文中的方法显示了两种方法提高36.53%和25.87%。这是证明了本文提出的方法显示了离群数据挖掘效率绝对优势。

如图15下,相同数量的试验和不确定的数据量,移动互联网的离群数据挖掘大型实时数据库使用该方法显示了矿业稳定性高于传统知识粒度法和支持向量机方法。随着试验数量的增加,该方法的优势越来越明显。从全球层面,当使用该方法对离群数据挖掘,挖掘稳定平均约为96.37%,而平均挖掘传统知识粒度的稳定性方法和支持向量机方法约69.84%和76.23%,分别。该方法给出了一个稳定性方法相比提高37.98%和26.42%,分别。这个结果表明,该方法对离群数据挖掘是主要的稳定。

如图16,不确定的数据量,离群数据挖掘在移动互联网大型实时数据库中使用该方法结果挖掘时间短比传统知识所需的时间的粒度和支持向量机方法。随着数据量的增加,该方法的优势越来越明显。从全球层面,当使用该方法对离群数据挖掘,虽然有相对较高的波动,平均开采时间的改进的基于方法的离群数据挖掘是大约15.84 s,而平均开采时间的传统知识粒度和支持向量机方法是大约31.23和27.61年代,分别。该方法提高了开采时间由15.39和11.77年代的方法相比,分别。这一结果表明,该方法对离群数据挖掘主要时间。

5。结论

离群数据挖掘在移动互联网大型实时数据库使用传统方法容易产生质量和减少干扰数据准确性,效率,和数据挖掘的稳定,这些都是严重的缺陷。为了解决这些问题,本文提出了一种决策树outlier-classification feature-filtering检测离群数据挖掘方法在移动互联网大型实时数据库。该方法用于分析实时数据的特点,获得的光谱模型级的异常数据,进行初步分析信号的异常数据。decisional-tree信息链传输模型的异常数据现有的移动互联网条件下建立了精确的集群移动和分散的数据,获取离群值包含信息链,并传输到实时数据库以有序的方式。离群值包含信息流得到从大型实时数据库的信息链,然后集群改善后续挖掘的精度,大大降低采矿计算的复杂性,并为后续奠定基础的置信区间。因此,随后采矿方法改进通过收购前置滤波器的相位特性的异常数据离群值包含信息流动。采用决策树outlier-classification feature-filtering算法获得解析信号振幅和即时,和决策树的过滤方法用于删除无用的高,低频组件和获得的相位频率特性的异常数据。WT阈值去噪方法综合进行信号去噪。然后,数据抵消程度进行了分析。仿真实验的结果表明,该方法可以显著减少矿业响应时间,所需的迭代的数量,准确挖掘的错误率,提高健身。 The formed detection filtering model is corrected and the simulation experiments indicate that the precise coverage and probability of outlier data mining are effectively improved. This approach achieved outlier data mining in a mobile Internet-based large real-time database and yielded favorable outlier data mining effects. With respect to performance, the proposed method was compared with the traditional knowledge granularity method and the support vector machine method regarding compactness, accuracy, efficiency, stability, and time of outlier data mining as well as clustering. The results showed the absolute superiority of the proposed method for outlier data mining.

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

本文中描述的研究大大支持由中国国家自然科学基金(没有。71471178)的国家重点项目和国家自然科学基金(没有。71431006)和国家自然科学基金委国际合作与交流项目(没有。71210003)和中国国家创新研究群体科学基金(没有。70921001)。

引用

  1. c . y . Latif Cadena, j . Neira“健壮的循环构成图大满贯关闭随着时间的推移,“国际机器人研究杂志》上,32卷,不。14日,第1626 - 1611页,2013年。视图:出版商的网站|谷歌学术搜索
  2. r·h·l·h . Chen蒋介石,v c层,“商业智能和分析:从大数据产生重大影响,”季度:MIS管理信息系统,36卷,不。4、1165 - 1188年,2012页。视图:谷歌学术搜索
  3. 朱x, x, g .问:吴和w·丁”与大数据的数据挖掘,”IEEE工程知识和数据,26卷,不。1,第107 - 97页,2014。视图:谷歌学术搜索
  4. h .郑y, z, l . i .昆明z Chong, f .阴,“平行矿业label-constraint邻近模式”计算机工程应用,51卷,不。9日,第141 - 135页,2015年。视图:谷歌学术搜索
  5. Y.-Z。张,j·肖,X.-C。Yun, F.-Y。王,“DDoS攻击检测和控制机制,”软件学报,23卷,不。8,2058 - 2072年,2012页。视图:出版商的网站|谷歌学术搜索
  6. w . Chun-Qiong,“基于特征选择的网络入侵检测模型。”计算机模拟卷,29号6日,页。234 - 237年,2012年(中国)。视图:谷歌学术搜索
  7. o . n . Almasi和m . Rouhani“快速和de-noise支持向量机训练方法基于模糊聚类的方法对大型真实世界的数据集,”土耳其的电气工程和计算机科学杂志》上,24卷,不。1,第233 - 219页,2016。视图:出版商的网站|谷歌学术搜索
  8. 张曾y, z, a . Kusiak”分域的预测建模和优化空调系统与数据挖掘和萤火虫算法,”能源卷,86年,第402 - 393页,2015年。视图:出版商的网站|谷歌学术搜索
  9. >,j·刘,y,“快速计算结构静态基于减少基础极端响应方法,”中国计算力学杂志》上,32卷,不。1,第98 - 94页,2015。视图:谷歌学术搜索
  10. A . Purarjomandlangrudi A . h . Ghapanchi和m . Esmalifalak”故障诊断的数据挖掘方法:应用程序的异常检测算法,”测量,55卷,不。3、343 - 352年,2014页。视图:出版商的网站|谷歌学术搜索
  11. s . g . Kim Lee和美国金,“一种新颖的混合入侵检测方法集成异常检测和误用检测,”专家系统与应用程序第41卷。。4、1690 - 1700年,2014页。视图:出版商的网站|谷歌学术搜索
  12. m·a·a .马蒙m·a·汉纳a·侯赛因和h . Basri”理论模型和实现的实时智能本状态监测系统使用基于规则的决策算法,”专家系统与应用程序48卷,第88 - 76页,2016年。视图:出版商的网站|谷歌学术搜索
  13. a·j。Tixier m·r·哈洛韦尔b . Rajagopalan, d·鲍曼“施工安全冲突检测方法:确定安全使用数据挖掘基本属性之间不兼容,”自动化建设,卷74,不。7,39-54,2017页。视图:出版商的网站|谷歌学术搜索
  14. l . Tran l .风扇,c . Shahabi“基于距离的孤立点检测的数据流,”美国养老,9卷,不。12日,第1100 - 1089页,2016年。视图:谷歌学术搜索
  15. b . s . m . Hosseini b . Amiri m . Mirzabagheri y .史,“一种新的入侵检测方法使用基于pso的多个标准线性规划,“Procedia计算机科学,55卷,不。4、231 - 237年,2015页。视图:谷歌学术搜索
  16. j·刘,h·f·邓孤立点检测的不确定数据基于本地信息,“以知识为基础的系统,51卷,不。1、60 - 71、2013页。视图:出版商的网站|谷歌学术搜索
  17. n . n . r . Ranga苏瑞,m . Narasimha Murty和g . Athithan”通过粗聚类分类数据,检测异常值”自然计算,15卷,不。3、385 - 394年,2016页。视图:出版商的网站|谷歌学术搜索
  18. m·古普塔j .高c . c . Aggarwal和j .汉”时态数据异常值检测:一项调查,”IEEE工程知识和数据,26卷,不。9日,第2267 - 2250页,2014年。视图:出版商的网站|谷歌学术搜索
  19. r·b·Torbert c·t·罗素w .磁石,et al .,MMS领域工具套件:科学目标,测量和数据产品卷。199年,空间科学评论》,2016年版。
  20. e·m·施瓦兹·e·t·Bradlow, p . s .渐变”模型选择使用数据库特点:为纵向发病率数据,开发一个分类树”市场营销科学,33卷,不。2、188 - 205年,2014页。视图:出版商的网站|谷歌学术搜索
  21. 汗n a和b Boashash”,多组分的瞬时频率估计使用局部自适应定向时间频率分布,“国际期刊的自适应控制和信号处理,30卷,不。3、429 - 442年,2015页。视图:出版商的网站|谷歌学术搜索
  22. n .阿里汗、美国阿里和m .简颂”到达方向估计使用自适应定向时频分布,“多维系统和信号处理,45卷,不。6 - 2016页。视图:出版商的网站|谷歌学术搜索
  23. m·a·b·奥斯曼,j·茨和b . Farhang-Boroujeny”性能分析的匹配滤波器检测线性调频线性调频信号,银行”IEEE航空航天和电子系统,53卷,不。1,41-54,2017页。视图:谷歌学术搜索
  24. w·戴和w·吉”的mapreduce实现C4。5决策树算法”,国际期刊数据库理论和应用,7卷,不。1,49-60,2014页。视图:谷歌学术搜索
  25. 美国Stimpson、b·柯林斯和b . Kochunas”改善transport-corrected散射稳定性和性能使用雅可比inscatter算法2 d-moc,”年报的核能,卷105,不。6、1 - 10,2017页。视图:出版商的网站|谷歌学术搜索
  26. >、h·方和h·王,“一个新的mi-based可视化辅助矿业大纵向网络试验数据,验证指数”IEEE访问,4卷,不。5,2272 - 2280年,2016页。视图:出版商的网站|谷歌学术搜索
  27. 周k和s .杨”,探索fcm聚类的统一效果:数据分布的角度来看,“以知识为基础的系统,卷96,不。3、76 - 83年,2016页。视图:谷歌学术搜索
  28. m·h·Bhuyan d . k . Bhattacharyya, j . k . Kalita“网络异常检测:方法、系统和工具”IEEE通信调查和教程,16卷,不。1,第336 - 303页,2014。视图:出版商的网站|谷歌学术搜索
  29. m·a·Ambusaidi x他和p .南达,“建立一个入侵检测系统使用基于过滤器的特征选择算法,”IEEE计算机,卷65,不。10日,2986 - 2998年,2016页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  30. r·拉蒂夫·h·阿巴斯,s·拉蒂夫和a·马苏德”EVFDT:一个增强快速决策树算法检测分布式拒绝服务攻击体内cloud-assisted无线区域网络,”移动信息系统文章ID 260594卷,2015年,13页,2015。视图:出版商的网站|谷歌学术搜索
  31. s . Patidar r . b . Pachori, n . Garg”自动间隔缺损的诊断基于tunable-Q胎心音信号的小波变换,“专家系统与应用程序,42卷,不。7,3315 - 3326年,2015页。视图:出版商的网站|谷歌学术搜索
  32. j . w .分支c . Giannella b . Szymanski r·沃尔夫和h . Kargupta“无线传感器网络中的异常值检测,”知识和信息系统,34卷,不。1,23-54,2013页。视图:出版商的网站|谷歌学术搜索
  33. r . Laxhammar和g . Falkman”归纳保形异常检测序列检测异常sub-trajectories,”上数学和人工智能,卷74,不。1 - 2、67 - 94年,2015页。视图:出版商的网站|谷歌学术搜索
  34. H.-X。倪”,基于滑动窗口的云计算平台的网络入侵检测算法”学报14 IEEE计算机和信息技术国际会议上,CIT 2014,页927 - 930,中国,2014年9月。视图:出版商的网站|谷歌学术搜索

版权©2018年鑫刘et al。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。


更多相关文章

PDF 下载引用 引用
下载其他格式更多的
订单打印副本订单
的观点971年
下载590年
引用

相关文章