文摘

数据存储和计算在云服务器可以处理许多g的数据,但是他们的网络交通也会拥挤。研究人员已经开发出几个模型预测网络流量以减少通信云服务器的压力。然而,现有的模型不够准确的应用到云服务器。解决这个问题,网络流量预测模型(NTPM) k - means算法优化本文从云服务器集群网络流量数据的k - means算法优化,然后使用支持向量机训练模型。我们的研究显示,相比之下,最近NTPM准确预测网络流量,该模型提供了更好的网络流量预测和更适合云服务器。

1。介绍

用先进的计算和存储能力、云服务器是一种新型的网络基础设施。近年来,行业从大数据到云计算和物联网,它发挥了至关重要的作用1]。云服务器上的应用程序数量的增加导致增加的用户数量,和相关的网络流量也越来越多,这让伟大的沟通到云服务器的压力。为了处理这个问题,一个可行的方法是预测网络流量。通过分析大量的网络流量数据,高效的NTPM和算法设计。因此,一个实际的网络流量调度方案构造(2]。使用模型来预测网络流量也有许多优点。例如,根据预测的模型,它可以帮助云安全应用程序检测到恶意网络流量来自黑客的攻击,并确保相关的应用程序的云服务器提供更稳定的服务。目前,有两种方法来设计网络流量模型。第一个是设计相应的算法根据传统统计理论。然而,这种方法不能实现精度高和不适合云服务器。第二种方法是使用计算机辅助NTPM。通过引入大数据和人工智能技术,可以达到较高的预测精度,也非常适合运行在云服务器(3]。

在计算机辅助NTPM,通常有两种设计方法。第一个是设计线性模型,如自回归模型和差分自回归移动平均模型。然而,随着云服务器的网络通信变得越来越复杂,这些线性模型无法实现准确的预测。第二种方法是设计非线性模型。除了支持向量机和神经网络(NN),机器学习技术越来越多地用于提高网络流量预测的准确性。刘等人。4)制定利用混沌理论和支持向量机模型在短期预测网络流量。通过引入CTSA目前,时间序列建模和预测,并在一起,CTSA目前使用和支持向量机。此外,使用延时,MLPWD和SVM,动力学等。5提出了一个NTPM。最近,越南盾(6)提出了一种基于多级NTPM SVM算法和主动学习,可以解决这一问题的不平衡NTPM的识别。盾的6]NTPM使用机器学习技术,并与线性模型相比,该模型在一定程度上提高预测精度。然而,神经网络更容易陷入局部最小值和精度下降。

为了处理这些问题,一个新的NTPM k - means算法优化的配方。在新的NTPM,首先,k - means优化算法用于集群的历史交通数据的数据集,这有助于解决这个问题,预测很容易专注于最小值点。其次,利用支持向量机,建立了预测回归模型和具体的培训模型使用文献[7),一个云服务器网络流量数据集。最后,通过对文献的分析和仿真的结果,而该计划在8],我们的方案优势等几个指标的平均绝对百分误差( )和拟合优度

支持向量机能够帮助分类研究,起到良好的辅助作用,各种数据的分类。Laref et al。9)提出了一种并行全局优化模型来优化支持向量机(SVM)的hyperparameters回归,可以训练提供准确的用水需求预测在短期内,证明其在泛化选择优势。此外,通过不断创新的技术,支持向量机已经应用于回归和预测任务,取得了良好效果。支持向量机的原理是不同的支持向量机。在回归拟合的问题,最终实现非线性问题线性化,以达到预期的目标。具体处理方法可以描述如下:非线性变换地图输入数据高维度空间。核函数理论取代了高维空间中的点产品操作解决最优决策函数。一系列有效地避免了复杂的计算步骤。为了解决非线性回归问题的样本空间,线性回归应用于特征空间。段(10)提出了一个NTPM与支持向量机技术。通过使用组来选择相应的学习参数,介绍了粒子群优化算法(PSOA)段et al。s NTPM,避免了局部最优解,并提供更好的泛化能力。

唐(11)支持向量机应用于网络流量预测的简单分类,提高预测精度,他们建议应用去噪和支持向量机的混合模型。混合NTPM SVM技术提出了由陈et al。12]。在这个模型中,经验模态分解的SVM进行降低噪声信号。SVM的参数在陈et al。NTPM与PSOA集成在一起。一个神经网络模型与量子遗传技术提出了田et al。13]。优化NTPM效率的量子遗传算法优化设计基于混沌特征的交通流量数据数据,然后验证,可以更准确地预测网络流量。一个NTPM SVM技术以及模糊层次分析法(模糊)王等人提出的。14]。模糊,参数王et al。NTPM的构造。王等人的NTOM能够轨道交通换乘,而且它也可以准确的预测条件下的小波动预测误差,提高模型的精度和稳定性。田和李15制定一个NTPM局域网。在田和李NTPM,支持向量机的参数优化采用改进自由搜索算法,它实现了更快的收敛速度和更好的健身价值,提高了预测性能,并且不增加算法的复杂性。提出了一种小时间尺度的交通预测模型由孟et al。16]。支持向量机回归模型,选择最近的数量的相邻点使用BIC邻居选择方法和实现有效的网络流量预测。最近,一个NTPM优化算法被学者提出,Bhattacherjee [17]。学者et al。NTPM,预测模块、程序和方法的制定。NTPM与组合使用长期的k - means算法和记忆神经网络构建NTPM短期2019例冠状病毒疾病提出了由Vadyala et al。18]。比较预测过去的几天里,Vadyala等的模型使用加权k - means算法基于极端梯度增强。

3所示。与k - means NTPM优化算法

一个高效NTPM与k - means优化算法和支持向量机在这一节中描述。为构建一个特定的模型,我们处理数据如下:

在实际的研究成果,有许多因素导致数据问题,比如过多的冗余信息,属性值之间的差别,所提供信息的准确性,和手动输入错误。因此,有必要处理原始数据集科学、合理,全面学习和数据挖掘。为了更有效地探索未来的数据。挖掘数据的最终研究取决于预处理的质量和水平。如果预处理是好的,它可以减少搜索数据的错误率。如果预处理不够好,会产生一个很大的噪音在数据检索,和预测精度将降低。所以,预处理数据集是一个重要的步骤在学习和分析数据。本文涵盖了数据的预处理特征提取和清洁。验证和检查数据收集后被称为“数据清洗。“移动网络流量包括的示例数据异常值和无效的值(空值,字典中没有对应值,等等)。 The integrity of the data can be guaranteed directly. Then, extract and arrange the feature data, and combine the traditional general missing value meaning that the value of one or some attributes in the existing data set is essentially incomplete, such as missing data and noise data. In order to find incomplete data in the dataset, we fill in the missing values in the following ways.(我)忽略元组:“忽略元组”的具体含义是删除不完整的数据,以保留完整的数据。这个优势是保留数据是初始数据,表明该研究结论更接近现实。缺点是如果不完整的价值元素占总数的很大一部分元素,它将被消除。这个完整的原始数据可能影响结论的正确性。(2)填补缺失值的列属性与每一列属性的平均值:这种方法的优点是,它可以用来填补缺失值的列属性,和缺失值的数量可以填充到列属性的值。整个房地产可能会影响最终的信息的准确性,导致一些错误;然而,这是一个非常受欢迎的、易操作的方法来补充缺失的值。(3)填写缺失的部分预测最大概率值:输入缺失值时,应该使用贝叶斯和回归方法,推理和决策树时应指建立估计价值。即使这个推理方法获得的结果并不令人满意,缺乏诚信的价值更好,但方法本身比较复杂,所以实际过程是相对较弱的实用性。

新NTPM的具体结构如下:

首先,在聚类的过程中,最重要的是设置一个特定的标准将数据集划分为不同的簇。这些数据集的样本数据密度通常大于所定义的阈值,所以需要反映的数据聚类样本密度。这些聚类算法通常只考虑数据集的大小之间的关系价值和没有好的解释在基站流量变化的趋势,他们不考虑水平时间关系数据集的值。有一定变化趋势的数据值之前和之后的时间点,所以基站变化趋势是引入聚类标准 在我们的方案中,原始算法的选择 提高,我们使用两个不同的吗 区域设置的规定 集群的数量和样品的组合如下: ,在哪里 , , 输入到 最优不相交的集群。让 数据集不相交的公式如下(图1):

其中, 代表误差的平方和 表示样本粒子 欧几里得距离,用来检测样本点之间的距离从一组 为了解决一个粒子的导数 ,让导数为0和集群平均值

聚类算法的核心思想是特征选择和提取。高价值功能是提取所有数据集的特性,在两个向量由所选特征编码输出新的有效的特性。然后,根据特性选择适当的距离函数形式来测量近似程度,然后进行聚类通过近似程度。完成后,聚类算法是由外部有效性评价或评估相关测试评估。

其次,考虑网络流量的多尺度特性,设计一个多尺度网络流量表示方法构造样本集不同的层。网络流量的规模从上到下,从细到粗,形成一个倒金字塔形状,如图2。这有助于处理和分析网络流量从不同层次和角度和准备随后的网络流量预测。网络流量由多尺度是进步的,可以转化为彼此。粗规模较低的层的网络流量是根据小尺度构造网络流量更高的层。同时,底层的粗尺度网络流量可以提炼成的小尺度网络流量较高的层。多尺度网络流量表示方法指的是每一层的分级粒度构建不同尺度。分级粒度的时间间隔。

在支持向量机算法,训练集被认为是 ,在这 训练样本的输入的列向量, 对应的输出值。支持向量机的算法定义如下。

其中, 代表支持向量输入到输出的重量, 反映了输入和高维特性之间的非线性映射,和 是输入和输出之间的距离。让 线性不敏感损失函数。

其中, 表示函数预测,回归函数,返回的输出值 是相应的真正价值。

计算嵌入维数和延迟变量的值需要在NTPM,重建相空间的网络流量的原始数据是必要的,因为数据是一维的和混乱的。达到较高的预测精度的目的,一个新阶段空间构造。

3描述NTPM流优化算法。具体的算法如下:7(我)输入的数字集群 ,惩罚因子 ,麻木不仁的损耗系数 ,和内核不变 (2)输入历史数据集 ,流的元素 包含两个属性值:交通 和网络传输带宽 (3)扩大 元素的属性 是: ( , 意味着没有流量的变化, 意味着带宽减小, 表明,带宽的增加), 表示时间,它用 表达的最大带宽 (iv)执行优化算法。输入 ,该算法应用于 ,并添加类别标签 得到 (v)分区训练集 和测试集 (vi)输入 支持向量机的训练(七)输入 支持向量机进行测试

4所示。模型仿真和分析

4.1。实验环境

在这一章,新NTPM模拟并与桦木模型。实验平台是英特尔的3.3 GHz处理器、32 GB内存,Win11系统,Python 3.7。采用的数据集是一个云服务器网络流量数据集(7),包括1000年的数据,每个数据包括带宽和时间特性,间隔5分钟,部门比6:4方面的训练集和测试集,使用第一个600网络流量数据提出的训练,最后提出的400网络流量数据测试。具体参数如表所示1

索引是比较实际的流量预测结果和平均绝对百分比误差。最后,制定 就像以下:

定义如下:

定义的 ,它显示了更准确的模型的预测效果,值越小

定义如下:

其中, 表示的 流量的预测结果 指的是实际的流。

2显示了比较不同模型的预测结果和实际流量连续十个数据集。

从表1,我们可以计算 新NTPM是11.32%,而桦树的模型是15.32%。的 价值的新NTPM是4%低于桦树模型,所以新的NTPM具有更好的预测精度。

预测的数据流用水平线。预测的数据流用垂直线。新NTPM用固体,桦树模型用虚线。从结果,新NTPM的最小值 值是4.47%,最大值为9.25%,在桦树模型的最小值是4.89%,最大值为15.13%。因此,新的NTPM误差小于桦树模型。

预测的数据流用水平线。预测的数据流用垂直线。新NTPM用固体,桦树模型用虚线。从结果,新NTPM的最小值 值是83.31%,最大值为99.87%。然而,桦树模型的最小值 值是6.61%,最大值为95.12%。因此,新NTPM更好的拟合程度与桦树模型相比,和网络流量预测的准确性越好。

此外,从聚类的结果,新NTPM网络流量分为更愉快的类别,和桦树的集群效应优于模型,显示了新NTPM具有更好的预测精度。

4显示新NTPM预测的性能结果。在图4,时间轴用水平线。网络流量的带宽是用垂直的线。三角形标记是新NTPM体积的预测。实际的交通量是用圆形标志。从图4,新的NTPM实现更好的性能比桦树的模型中,这意味着新的NTPM具有更好的预测精度。

总之,相比之下,桦树模型方面的准确性和集群、新的NTPM可以实现细粒度的集群效应和预测结果的方面有一定的优势,日军和r .因此,国家结核控制规划的新NTPM有更好的性能。

5演示了不同模型的聚类结果,圆形的标志表示不同的流量和流量的颜色代表聚类类别。同样,图6显示了桦树模型网络流量聚类的性能。从图可以看出,新NTPM网络流量分为更令人吃惊的类别,和集群效应比桦树模型有更好的预测精度。

总之,与桦树模型相比,新NTPM可以实现细粒度的聚类效果,所以它可以在网络流量预测的表现也更好。

5。结论

领域的许多技术,如大数据、云计算、物联网,云服务器也扮演着关键的角色,设计NTPM是非常重要的。处理前NTPMs精度不足,制定一个新的NTPM k - means算法本文可以提取聚类的网络流量数据的优化算法,使用支持向量机来处理模型。实验结果表明,与桦树模型相比,新NTPM增加的国家结核控制规划的准确性。同时,新的NTPM减少了通信云服务器应用程序的压力,所以它可以提高云服务器的效率,保证服务质量,节约计算和通信资源,降低能源成本。

数据可用性

数据集可以在访问请求。

的利益冲突

作者宣称没有利益冲突。