文摘
在网络流量建模中,许多作者提出了基于特定的分形散粒噪声表征模型。这些方法的不便是大量的假设和缺乏工具来检查它们。在本文中,我们提出一个统一的模型基于广义泊松散粒噪声累积输入过程(CIP)表示。我们提出一个过程近似的过程;然后我们给过程控制网络的带宽提供者。近似和控制CIP的泛函,通过极限定理,即上确界的过程,正确的逆,和存储映射。
1。介绍
本文的目的是提出一种近似的方法积累在互联网服务器的流量。我们假设一个独特的服务器处理一个无限大小的源发送数据独立传输到服务器根据平稳泊松过程。我们感兴趣的累计输入的服务器(也称为工作累计工作)。这个随机过程产生的流量的传输时间的间隔用,累计输入过程简要(CIP)。术语工作可以被理解为必须的带宽分配一部分为了疏散交通。我们还故意使用术语传播,因为我们将会看到,我们提出的近似可以应用的流量包上游下游和/或包,甚至更多的全局对象等相关交通从互联网上下载。近似我们建议在固定和单一类型的传输工作。不同类型的传输只是诱发相应的CIP的叠加。
在专业文献,似乎进化的规则是假设一个机制及时的CIP (1- - - - - -6]。这些假设的进化时间的不便检查是相当不可能的。
在[7),我们提出了一个模型基于广义泊松散粒噪声表示没有强加任何这样的一种机制。以最小的技术假设我们表明,CIP在某种意义上可以近似驯良的随机过程,也就是说,一个稳定的过程,只有积极的跳跃。意识的弱收敛在法律的修改版本CIP稳定过程。这种感觉是非常有用,因为它允许一些的CIP适当收敛到泛函,泛函,稳定过程。这将是中央预测通过稳定的带宽分配过程的关键。广泛的文学致力于稳定过程和强大的统计方法是可用的;参见[8]。CIP的近似恢复的过程如下:在一个时间间隔足够大,我们观察到一定数量的传输命令根据第一个到达。在网络流量可以跟踪每个传输相关的数据包和几个为每个传输数据可以提取。我们在(7与定理)1下面的陈述,CIP的很好的近似成立弱法律与限制,严格的稳定过程完全向右倾斜, 对于一些修正条款,。后者包含在这三个容易支票性质:(1)传输形成一个泊松过程的移民(最终在大时间尺度)与强度增加;(2)每个传输的大小与无限重跟踪方差。在概率术语中,正确的尾巴与指数的分布规律不同对于一些。这个参数的沉重的自相似性指数稳定的过程;(3)每个传输具有有限的期望的长度(其他较弱的假设是可行的)。比较研究与一些现有的模型还提供了我们的论文(7),说明了为什么我们的假设较弱,更容易处理。
在本文开始部分2通过提供对CIP模型。节3我们给其相应的极限定理。节4一个近似过程的泛函,CIP,即(1)上确界过程对应的最大输入工作;(2)右逆,对应于第一段时间过程关键障碍;(3)存储映射,对应于一个存储过程解决方案的方程。我们将看到我们获得极限定理获得类似于(7),不需要额外的假设来实现这一目标。以下的结果是在定理3在同样的形式比定理1,取任何先前的泛函,背后的映射。然后,存在修正条款,和一个同伴映射的这样 部分5致力于证明。我们使用的工具有专著的基础上?威特(9]。
2。该模型
通过所有的追随者,我们假设一个独特的服务器处理无限的来源。传输到服务器根据齐次泊松过程标记的点这因此i.i.d.指数分布随机变量与参数 被认为是时间的起始传输。
让计数测量和定义泊松过程通过 的数量代表的数量传输开始之间的时间和时间。我们感兴趣的是累计输入过程(CIP)生成了一个间隔的时间和用。它对应于文件传输源的大小。有很多方法来建模(从最简单的到最复杂的)。源行为的规范可以考虑添加越来越多的参数。为了避免这种错综复杂,大部分的作者(2- - - - - -6)有一个宏观的方法强烈与起始的传输的时候,他们的时间,他们的利率。我们会看到,本文证实了这种方法的针对性,我们证明它是充分的在累积输入所需的控制过程。
我们的目标是描述,在更一般的设置,法律的国际马铃薯中心和给一个近似的泛函,这个过程。注意,CIP描述工作的时间间隔内生成。时间当我们的“观察”,当我们的“观察完成。”观察到的时候开始传输是积极的还是消极的(我们的观察开始之前或之后)。的传输开始时和持续时间的间隔。
假设我们观察到,直到时间以来的传输我们想计算生成的工作传输。这项工作是在随机间隔。这个区间的长度是r.v。 我们推断出工作产生的th传输是由一个取决于长度的数量。我们将表示这项工作 在哪里是一个随机过程;随机变量是一个增加函数的消失,如果和描述的数量可以生成的工作传输时间间隔的时间长度。
如果我们只观察间隔(而不是),工作可能产生的传播应该写成的区别 请注意,相当于。因为上面的考虑,我们建议以下模型描述了CIP结束由“移动平均线类型”: 的过程是假定为一个i.i.d.序列无关的到达过程。为每一个,这个过程右连续左有限样本路径,消失在有限r.v负实轴和增加。。
我们将看到在续集的渐近分布行为的过程是一样的“有限记忆”的一个部分是一个泊松散粒噪声(见[10,11): 观察到的过程静止的增量,而还没有。这个过程的特殊利益,因为它只考虑了传输时间后开始。特殊结构的过程调用其他评论。问题是,在任何固定的时间我们不能“看到”如果th传输完成与否,更重要的是我们不能计算期间积累的工作。唯一可用的信息数量 所需的总功是什么传输。
然后自然地介绍这个过程 这是总工作所需的时间间隔内的所有传输开始。这个过程有着非常特殊的性质:它是一个莱维过程;它有独立的和静止的增量,和是一个复合泊松过程(见附录和[12]更多账户征收流程)。这个过程是主成分的过程和组件,将正确的近似稳定过程,所定理1在下面。另一个被定义为特殊过程 这个过程是特殊的,因为它是静止的。相反,它已经定义的问题。即过去的贡献(0)前会随机变量是无限的。同样的问题会发生的过程,但它实际上是有限的在我们的假设。的过程和很好地定义,因为它们是有限的资金。这就是为什么我们只会考虑过程,,。这些过程正在增加。因为这些过程是紧密连接到传输的负载,我们将调用它们加载流程。在下一节中我们将看到,当充分修改,他们满足弱极限定理和共享一个共同的极限过程就是一个完全偏向稳定过程。
3所示。预测CIP
我们现在在这里获得的主要结果7]。这个结果可能会出现高度的理论。的假设下结果作品实际上是容易检查真正的互联网数据。我们国家在其理论形式和结果给正确的迹象后最好的剥削。
3.1。近似的CIP技术假设
下一个定理表明,加载过程,或正确漂流和归一化后,近似的法律严格稳定过程完全向右倾斜(见[7,12]更多账户稳定的过程)。主键来证明这些结果(1)的无限可分性属性加载过程;(2)CIP的固定增量属性事实上,它具有相同的有限维的预期总功过程以防是有限的;(3)静止和独立增量过程的属性。
3.1.1。的假设
回想一下,过程是先验知识。 和停止时间定义为 r.v。和实际上是版本的大小和长度的传输。
3.1.2。的大小的传播行为
r.v。经常是有限的,不同的尾部指数吗,;也就是说,存在一个确定性的递增函数,这样 条件(13)等价于 在哪里是一个缓变函数(即。,尽管,)。实际上,这个函数只是分位数函数,即函数的广义逆。众所周知,对于一些缓变函数我们可以选择一个版本的增加。更多账户定期变异理论,读者被称为(13]。
3.1.3。假设在移民
注意,强度参数的泊松到达过程不一定是固定的。这可能取决于规模和可能去无穷Maulik研究和雷斯尼克(14]和Kaj [1]。通过下面的所有,我们的情况是固定的或是增加一个值当趋于无穷。
3.1.4。技术假设传输的长度:连接强度和规模
实际上,在大时间尺度,我们真的不需要区分有限强度的两种情况(或)和无限的强度(),后者显然更多的技术。我们只需要这个假设: 在大尺度上的有限的强度,或,也明显的条件(15)同样表示。此外,在这种情况下,它是隐含的。参见[7]关于假设的更多评论(15)。
定理1下面证明(7]。它概括许多现有的模型(见[7比较)和将完成无限的变化情况但还提供了更强大的近似(法律)的弱收敛与条件比以前认为的文学。状态的过程,,正确漂流和规范化,由共同non-Brownian吸引了法律稳定的过程(例对应的标准布朗运动将明确地排除在续集)。
3.2。收敛模式的重要性
的收敛定理1和3适用于弱模式的空间Cadlag功能赋予-Skorohod拓扑。我们将不进入细节Skorohod拓扑;我们只是说,根据(153.20,350页),一个序列随机过程是收敛的法律过程,我们表示 当且仅当极限的过程是确定通过有限维收敛;也就是说,和我们在分布的收敛随机变量 和序列的过程必须紧,紧张是一个技术标准(强烈相关的连续模拓扑)确保限制的存在。本文主要使用了强大的工具拓扑呈现在书中Jacod和Shiryaev [15]。这种拓扑是很容易处理,因为许多重要的泛函,是连续和保持收敛。这是下一节的目的。我们强调,所有的收敛定理3还在空间。
3.3。近似的CIP稳定极限
注意到稳定过程和他们的泛函,非常学习概率论的文学(见[8])。我们回想一下,这被定义为一个征收过程(见[12)更多的账户),没有积极的跳跃和拉普拉斯变换给出的每一个通过: 在哪里稳定和指数吗
定理1。的过程,,被吸引在法律上由共同稳定过程(7]。
假设(13)和(15)。让,,或和是一个严格的稳定的过程完全向右倾斜。定义为每一个
的函数是由(13),这个函数被定义为
和功能是由(19)。让,一个法律的弱收敛
4所示。预测的带宽
这项工作的主要想法是扩展融合(22),给其等价的泛函,过程。近似的泛函,将使预测badwidth分配以避免拥挤。为此,我们提出三个自然连续的和重要的而且weak-convergence-preserving那里。定理3提供了泛函,极限定理的过程,,。
4.1。一些重要的连续空间上的映射
让子集的过程在增加,过程的子集上面是无限的,在0和零子集的过程在的并满足。让一个过程在和考虑:(1)的正确的反或首次通过时间过程被定义为 随机变量只是第一次随机过程过一些至关重要的障碍然后描述了交通拥堵。(2)的上确界和下确界流程和是由 的r.v和分别是最大值和最小值的过程在时间的间隔然后,他们描述了极端的工作负载。(3)的反射的映射过程被定义为,在那里是由 这。
更能反映表示映射。两人的过程据说解决Skorohod问题相关的过程与,不减少的,和反射条件成立。参见[16,375页)Skorohod问题的更多细节。为了说明这个问题,考虑问题的服务器处理一个输入过程和服务以恒定速率。然后,缓冲区的内容过程用以下路径和正解存储方程与服务率 : 重写存储方程与,很容易看到 相对应的反射映射漂流过程。因为这个原因我们的电话的存储映射这正值当。
4.2。结果
有合理的泛函,CIP的重要性,我们将应用它们,,或。我们将表明,正确归一化(22),这些泛由伴侣功能近似的限制稳定的过程。当然近似取决于指数稳定。这一事实是通过定理来解释3。
回忆的功能,,分别给出了(13),(21)和(19)。当显然,我们有
引理2。限制(28)也是如此。
更多可读性,最后一个引理的证明以下定理推迟到部分5。现在,回想起首次通过时间流程是由(23),上确界是由(24)和反射映射过程是由(25)。
定理3。CIP的泛函,泛函,吸引了在法律上的稳定过程。
假设(13)和(15)。让得到下面的弱收敛。(1)首次通过时间:一个
形成的四纠正功能在哪里,,和过程是由
(2)上确界:有
(3)存储映射:选择这样承认一个极限。如果相对应的存储功能率吗,然后
在哪里
备注4。强度(i)召回允许日益依赖于尺度参数。然后,当,我们有所以它对逆。最后,取代在(29日),,作文我们同样有
(2)当相应的稳定的过程是增加,空在0,然后等于它的上确界的过程。什么时候,反映的过程也等于本身。
(3)具有类似的论点,定理3推广和所述下确界功能等大量的利益。也可以考虑交通拥堵的程度(在拥堵时间):让一个临界值修复互联网服务提供商的服务质量。由数量决定了负载达到当缓冲区内容跨越的关键值。
4.3。如何预测?
希望读者现在相信,只有三个近似CIP的有关事实。
(1)第一个假设测试是一个泊松到达传输。验证后,我们需要估计的强度。这种假设是一个预期的结果因为很多个人独立行事的行为往往是由一个泊松过程建模。这种假设可能会失败在传输由机器自动触发的存在。工作是为了完成比较人类和机器传输的比例。如果第二种是可以忽略不计的比例与第一次相比,可以验证这一假设。一些统计方法进行测试并给出了泊松假设的证据确凿的审查雷斯尼克(17]。
(2)传输的长度是明显的有界性网络流量自这个量通常一微秒级。这个验证的假设(15)。
(3)参数给提供的自相似性指数可以很容易地计算每个传输(标记的号码)捕获在一个间隔的时间观察足够大给它所需要的总功(有效负载可以从标题)用。因为这些型号形成一个i.i.d.序列随机变数那么策划山估计很简单(见[17])。
(4)的长度传输以来一微秒的大小,观察了几分钟就足够了。定理1显示大的时间分布的积累工作在时间间隔是分布式 的数量是简单的分位数函数。这个函数在(21前面的步骤和后)是可用的是一个稳定的随机变数完全向右倾斜。
(5)现在,带宽分配的问题可以解决。请注意,定理3利用泛函,如首次通过时间,相反和反射稳定过程的映射。有一个广泛的文学致力于稳定分布和流程(见诺兰的百科全书式的网页8])。我们建议Zolotarev的专著18)(为有限维属性),这本书Samorodnitsky和Taqqu [19],[之一12为进一步trajectorial属性)。
让输入过程的带宽数量(时间或临界水平取决于功能)足够大,考虑到随机变量,,。
(一)第一次交通的积累临界带宽水平是数量。它是在分布近似 的函数,(4)很容易计算的和。
(b)在这里是时候了。是输入的最大间隔的时间吗和有相同的近似分布作为适当的输入:
(c)在这里是时候了。缓冲区内容当服务交付的速度。它是在分布近似
5。的证明
引理的证明2。写 我们有和作为然后。现在,使用减少在和写 执行一个分部积分和一个变量的改变r.h.合著年代,写 由(13),和一分之二的不同术语去0。对于每一个,我们有这是一个有界量,均匀。再次使用(13),写 最后,对于任意的,到 ,让。
定理的证明3。重复这个过程通过调整一些工具可以找到的专著?威特(9]。关键是要利用Skorohod表示定理:如果弱收敛到在,然后存在其他随机的元素,,,定义在一个共同的潜在的概率空间,这样(每),,(当)。这个想法是为了考虑中心极限定理的情况(22),我们想谈谈泛的限制或在(22)。
初步的证据。有两种程序允许近似的泛函,流程,在模型中引入了。
(1)弱收敛是非常保存通过应用连续映射。这是弱收敛的定义:如果弱(分别地。几乎肯定)收敛于在和是一个连续映射,然后
连续泛函,集中的过程在(22)根据治疗过程(44)。
(2)弱收敛保存在中心极限定理运用“好”的映射。我们强调,第二个过程noncentered过程的处理而不是。假设我们有一个中心极限定理
在哪里和当。重写的极限,我们有
与的身份的过程。自,立即程序1,收敛是保存的连续映射,但这不是我们的目标。我们更进一步Skorohod表示定理:存在的一个版本的和一个版本的的这样
我们愿意学习的“好”的映射允许
有一些同伴映射。只要映射过程完成很确定。最后,“好”的映射(与同伴)将被称为weak-convergence-preserving在因为他们满足我们要求:
完成证明。回想一下,如果通过引理2(28),
证明依赖于前面两个过程和关键同质关系:第一个如果和,然后
第二,保留了身份过程由三个映射:,,。
(1)反功能
13.6.3李普希茨(推论[9])。当获得(29日)通过应用连续逆映射和使用的同质关系(51)。的功能是weak-convergence-preserving (49与同伴)(定理(9])。通过重写
和使用关系(同质性51),我们得到收敛(29日)。
(2)的上确界功能
13.4.1李普希茨(定理(9])。当,相应的稳定极限过程增加然后等于它的上确界。我们获得(31日)通过应用连续上确界的映射和使用的同质关系(52)。的上确界功能是weak-convergence-preserving (49与同伴)(定理13.4.2 [9])。重写的(55)和使用关系的同质性(52),我们得到收敛(31日)。
(3)存储功能被视为反映映射
应用于漂移过程。13.5.1反射映射李普希茨(定理。(9])。所需的存储功能的小窍门:重写在表单中
我们知道,通过定理呢1有一个稳定的极限。我们得到了收敛性(32)这两种情况。
(我):Slutsky参数(58)表明,
我们获得(32)与限制通过应用连续反射映射和使用的同质关系(53)。
(2)案例:我们用的上确界功能应用在的感觉weak-convergence-preserving (49与同伴)
(定理13.5.2 [9])的关系(同质性53)。
6。前景
正如我们所见,Poisson-like移民和重尾的假设下传输的负载,我们可以近似的许多特点和交通。作为这项工作的继续,我们的目标是研究中间的情况(秒级)和小时间(微秒级的)CIP的行为。这是另一个故事。
利益冲突
作者宣称没有利益冲突有关的出版。
确认
这个项目是在沙特国王大学的支持下,学院院长职科研、科学研究中心。作者感谢匿名裁判他们的宝贵意见,提高本文的演示。