文摘
为当前和未来的蜂窝网络、小细胞结构与许可和授权带宽,缓存内容供应和设备间(D2D)通信被认为是一个必要的体系结构。最近,一系列的控制方法已经开发应对各种挑战在下一代小细胞网络。在这项研究中,我们关注的设计新颖D2D-enabled小细胞网络控制方案通过允许缓存和无照D2D通信。出于游戏理论和学习算法,该方案自适应选择缓存内容和分裂的可用带宽许可和未经授权的通信。在动态变化的网络环境,我们捕捉的动态网络系统和设计一个新的动态Stackelberg博弈模型。基于分层和基于反馈的控制方式,小型基站和用户可以动态领导人和追随者,同时提高5 g网络性能。模拟和性能分析验证了该方案的效率,表明我们的方法可以比现有方案约5%15%的带宽利用率,缓存命中率和系统吞吐量。
1。介绍
今天,我们正在见证一个巨大的移动数据流量快速增长由于越来越多的用户和移动多媒体服务的爆炸性增长。无处不在的设备(如智能手机)推动了数据密集型应用程序的需求包括流媒体视频直播、实时社交网络和手机游戏。随着多媒体数据流量的爆炸性增长,无线蜂窝网络需要更多的带宽来提高系统容量。然而,无线带宽是一个非常宝贵的稀缺资源,它几乎耗尽。此外,经典的方法提高蜂窝网络能力遭受身体和经济的限制。因此,当前研究5 g网络是面向开发智能的方式传播的数据偏离传统网络体系结构(1- - - - - -3]。
小细胞被广泛视为一个5 g移动无线网络的关键使能技术。通过密集部署低功耗低成本小细胞基站(SBSs),网络系统可以提高当地报道,带宽效率、网络吞吐量和能源效率(1,2,4]。然而,小细胞网络不能解决回程交通拥堵的问题。随着多媒体数据流量的快速增长,回程交通开销压力变得越来越严重而危及QoS满意度在整个网络(4]。为了解决这个问题,缓存机制在SBSs是一个有吸引力的方法来提高传输速度,同时减少回程负载。cache-based操作,每个SBS配备一个本地缓存和服务用户请求使用缓存的内容。如果用户的请求内容已经存在于缓存SBSs, SBSs用户可以直接传输内容的建设没有回程。这种方法允许缓存机制转变的回程交通有效访问延迟(4- - - - - -6]。
在下一代蜂窝网络,设备间通信(D2D)最近吸引了大量的注意力从行业和学术界。D2D技术使移动用户直接沟通,当这些用户直接通信范围内(2]。最初,D2D技术提出了增强多次反射系统的性能。5 g移动网络D2D通信的关键技术之一是得到非常高的数据速率通过出售的一部分细胞交通到D2D通信。这种方法可以减少回程负载没有额外的网络基础设施的成本。而广泛的研究是针对解决许多5 g网络的挑战,我们面临各种各样的技术挑战D2D通信(7,8]。
提供D2D通信服务,SBS的带宽应该分为两部分波段,称为授权,未经授权的乐队。没有执照的乐队能够租到未经授权的用户执行D2D沟通。授权用户许可的SBS乐队受到保护而未经授权的用户寻求机会有限的传输功率。然而,由于服务请求的时间波动,固定作业许可和授权乐队的假设可能并不实用。获得全球的5 g网络性能、带宽在每个SBS应该自适应分割改善系统性能(9,10]。
设计一种新型5 g网络控制方案,我们需要一个新的控制模式。如今,rational代理之间的交互,相互冲突的目标,通常是使用博弈理论的特点。博弈论是研究战略之间的相互作用的多种智能理性决策者试图最大化自己的收益的期望值。特别是,博弈理论已经成功地应用于无线通信对网络资源解决竞争问题[11]。D2D-enabled SBS的情况下操作,SBSs和用户都是理性的个体。出于5 g网络系统的事实,我们采用了博弈论的方法来开发一个实际缓存位置和带宽分割算法。通过这种方式,我们能够减轻理论上最优的沉重的计算负担集中解决方案。
然而,博弈论也有自己的缺点。首先,经典博弈论的思想主要是在一个完美的理性视角。这种理性的玩家需要完整的信息在实际操作。然而,在现实中,这种假设很少。第二,大多数游戏理论模型寻求片面或单边稳定在一个静态设置。因此,他们不能捕捉玩家的适应改变他们的策略,达到一个有效的解决方案。最后,但并非最不重要的是,游戏理论方法需要艰苦努力解决多个高阶多项式方程。在实际情况下,它是一个复杂和困难的工作要解决的实时过程(11]。
在这项研究中,我们设计一个新的博弈模型,称为动态Stackelberg博弈,有效地适应D2D-enabled小细胞网络情况。具体来说,层次关系SBSs和用户最适合Stackelberg博弈模型。古典Stackelberg博弈,一个球员充当领袖和其他追随者,和主要目标是找到一个最优策略的领袖,假设追随者的理性反应追随者优化目标函数得到领导者的行为(11,12]。然而,在我们的动态Stackelberg博弈中,游戏玩家可以动态领导人和追随者。基于当前的角色,玩家做出控制决策逻辑上为了追求自己的利益而学习当前的系统条件。缓存位置算法,每个SBS是一个追随者,其相应的用户多个领导人。的带宽分割算法,每个SBS是一个领袖,及其对应的用户多的追随者。动态变化5 g网络环境下,这种动态和灵活的方法可以获得最好的解决方案。
保持一个均衡的网络性能,我们使用学习和讨价还价的算法在分布式的方式。通过考虑本地、全球和社会学习方式和简单的讨价还价的过程,个人SBSs做出明智的决策有效地解决缓存和分裂的问题。不同于现有的工作,我们注重可行性和自适应性等设计原则提供一个理想的解决方案。因此,我们的计划是其有效性的主要新奇5 g网络动力学。尽管几个D2D-enabled小细胞网络控制方案已经提出,很少有将博弈理论的研究和学习算法。
1.1。贡献
我们的研究概括缓存位置和带宽分割算法在以下方面。模型的每个SBS和用户之间的交互,我们设计一个新的动态Stackelberg博弈。作为一个追随者,SBS监视多个领导人,也就是说,其相应的用户来决定缓存内容。作为一个领导人,SBS分割他的带宽许可和授权服务。采用学习和讨价还价的方法,控制决策在每个算法都是在在线自适应的方式。最后,fair-balanced解决方案可以获得多元化D2D-enabled小蜂窝网络的情况。总之,本文的贡献如下。
(我)动态Stackelberg博弈模型。出于分层和反馈不同情况下,我们引入一个新的博弈模型同时捕获各种D2D-enabled网络特征。这种方法是通用的,适用于各种小细胞网络场景。
(2)缓存位置的算法。我们设计一个数位领导人single-follower Stackelberg博弈决定SBS的缓存内容。通过考虑用户的外部社会影响,single-follower SBS着重于如何利用社会关系的领导人高效的多文件传播。大多数现有的研究忽略了移动用户之间的社会关系。
(3)带宽分割算法。我们设计一个单一领导multiple-followers Stackelberg博弈自适应分割SBS的带宽。根据交互式学习和讨价还价的过程,我们的模型响应许可和未经授权的通信之间的权衡。
(iv)实现实用性。作为游戏玩家,SBSs和用户了解如何修改他们的先验知识和选择与有限理性的策略。这种方法需要控制和计算开销较低。它是实用和适用于现实世界的网络运营。
(v)解决方案的概念。动态Stackelberg博弈的主要思想在于其响应性相互结合的最优性和实用性。而不是我们动态Stackelberg博弈的均衡分析,本研究的主要目的是调查获得的潜在好处不同控制方法的实际合作。我们的解决方案是近似的概念使用本地最好的解决方案,全球和社会经验和简单的谈判方法。
(六)结论。数值研究表明,我们的动态Stackelberg博弈方法可以提高带宽利用率,缓存命中率,和系统吞吐量5%至10%在不同服务请求率,比较现有的南部非洲发展共同体(13],HSAC [14],SDWC [15)计划。
1.2。组织
本文的其余部分组织如下。在下一节中,我们回顾一些相关D2D-enabled小细胞网络控制方案和他们的问题。部分3礼物我们Stackelberg博弈模型和提出的缓存位置和带宽分割算法的细节。特别是,本节提供新的见解的好处和设计一个基于游戏的各种经验和谈判方法。为了方便起见,该方案的主要步骤然后上市。节4我们分析该方案的性能,并给出了数值结果与一些现有的方法进行比较。最后,本文的结论部分5。在本节中,我们也讨论剩下的在这一领域开放的挑战和可能的解决方案。
2。相关工作
已经有大量研究D2D-enabled小细胞网络控制方案的设计。马等人提出了一个基于合作频谱共享机制,利用传输机会D2D链接同时最大化利润的细胞链接(16]。起初,他们设计了一个合作转发算法,采用叠加编码细胞发射器和D2D发射器。该算法的数据传输速率最大化D2D链接没有细胞连接的性能恶化。其次,他们模拟了频谱交易过程,导出最优为支付合同细胞连接。最后,一些数值结果的性能提出合作提供继电保护方案和最优合同(16]。
赵等人认为社会领域的复杂的社会关系和社会关系在连续空间中引入D2D通信资源分配问题(17]。为了评估社会的联合优化性能和物理域定性,他们调查用户的支付和定义每个D2D通信用户的效用。每个D2D用户的社会群体效用最大化,社会群体效用最大化游戏制定,提出游戏的纳什均衡理论研究。最后,他们展示了数值结果,增加了整体的效用社会团体(17]。
在文献[18),新游戏理论的方法来分析用户设备之间的相互作用和相关性。然后,迭代开发了功率分配机制来建立相互偏好基于非线性部分编程。匹配D2D沟通对移动用户设备、知名Gale-Shapley算法采用;它可以获得一个稳定的和弱帕累托最优解。同时,提出匹配算法扩展到解决大规模网络中遇到的可伸缩性问题。这项研究的一个主要焦点是如何建立共同的偏好从节能的角度。纳什均衡的存在性和唯一性进行了分析从理论上通过数学证明(18]。
在[19),作者试图分析移动社交网络的影响在雾边缘缓存性能的无线接入网络。基于马尔可夫链,他们分析了边缘缓存中边缘节点。该方案在19)计算无线电接入网络带宽消耗的期望和fronthaul边缘缓存,以及相应的内容扩散比率在社会意识到在复杂场景中雾无线电接入网络。在[20.),作者提出了一种分层游戏框架研究的分布式解决方案的资源分配问题D2D-enabled小细胞网络。这个层次组成的比赛是两个后进位:重叠联盟形成游戏和Stackelberg博弈。部分波段分配问题建模为一个重叠的联盟形成游戏,D2D链接的相同部分波段行动合作最大化回报。干扰控制问题建模为Stackelberg博弈,基站作为领导者的决策和D2D链接作为追随者的领袖的举动(后最好的回应20.]。
马等。13开发了一种新社会意识到分布式缓存(SADC)方案基于分散学习自动机来优化缓存位置操作D2D-enabled蜂窝网络。南部非洲发展共同体计划是一个新的和实际反馈方案考虑三个关键因素:(i)文件请求概率,(ii) D2D发射器和接收器之间的物理距离,和(3)的社会影响力。此外,SADC方案不仅考虑文件请求概率和设备以其距离的亲密也考虑D2D通信用户之间的社会关系。最后,他们之间的相互影响特点不同D2D用户缓存的内容(13]。
智et al。14)设计了一个小说等级社会意识到缓存(HSAC)计划使移动节点缓存。为了解决激励数据缓存问题,该方案采用了分层的社会意识到鼓励缓存方法基于物理和社会关系。然后,提出了激励方法,以确保利益的最大化基于节点的自私本质。特别是,这种方法考虑了社会关系和物理距离作为成本的因素。最后,作者展示了在这个HSAC方案和纳什均衡的存在性证明,它可以显著降低总成本的移动节点(14]。
刘等人。15)制定一个新的基于Stackelberg D2D无线缓存(SDWC)方案来解决利益冲突的D2D-enabled无线网络缓存。Stackelberg博弈的基础上,系统模型的特点是层次结构,基站优化他们的策略基于价格的最优价格和最优功率封闭派生。最优价格与渠道获得有关;高信道增益导致了高昂的代价。最后,提出了权力和价格之间的权衡在仿真结果15]。
一些早期的研究(13- - - - - -20.)已经引起了相当大的关注而引入独特的挑战在处理缓存和D2D-enabled小细胞网络控制问题。在本文中,我们证明了我们的方案明显优于这些现有的南部非洲发展共同体(13],HSAC [14],SDWC [15)计划。
3所示。拟议中的D2D-Enabled网络控制算法
在本节中,我们提供了一个简要介绍我们的新博弈模型,形成的理论基础提出D2D-enabled小细胞网络控制方案。采用动态Stackelberg基于游戏的方法,我们设计缓存位置和带宽分割协议5 g适应动态变化的网络环境。
3.1。动态Stackelberg博弈模型
D2D-enabled小细胞网络操作期间,SBSs和用户设备(UE)单独做出控制决策,考虑他们的相互关系。这种情况适合使用博弈理论研究。在本文中,我们开发一个新的动态Stackelberg博弈模型为每个SBS和其相应的问题。这个游戏过程由两个阶段组成。在缓存中放置阶段,每个SBS观察文件请求的频率相应的问题和部署文件放置在有限的缓存大小。在这种情况下,我们可以假定用户多个领导人,和SBS是一个追随者,他们跟踪的缓存内容的可用性。因此,一个数位领导人single-follower Stackelberg博弈是一个适当的模型。
在带宽吐阶段,每个SBS调查置于下面的D2D通信和分裂的带宽许可和未经授权的通信服务,提高沟通能力。在这种情况下,传统的单一领导multiple-follower Stackelberg博弈模型是合适的;SBS是一个领袖,问题是追随者。在我们的唯一的领导multiple-follower Stackelberg博弈模型,不同的问题在不同的情况下。有两种类型的问题,即S-UE和D-UE SBS覆盖区域。S-UE可以连接到SBS与许可带宽直,和D-UE沟通彼此没有遍历SBS与未经授权的带宽。作为游戏玩家,SBSs和问题选择策略来最大化他们的报酬基于反馈机制的相互作用。在每个时间段的游戏,我们正式定义动态Stackelberg博弈模型 如下:(我)在 , 表示一组SBSs和 是设置的问题;他们是游戏玩家。(2) 可以分为两个子集 ;是S-UE的子集, ,是D-UEs的子集, 。(3)每个SBS的带宽容量 ;它分为授权和未经授权的带宽。(iv)每个SBS有两个策略集, 。 是缓存策略决定缓存内容和位置吗是一组授权和未经授权的通信带宽分割策略。(v)在 ,意味着为无照D2D通信带宽分裂率。如果SBS选择战略,带宽量分配给D2D通信和剩余的带宽量 分配给移动通信。(vi) 的策略是 。决定他的类型,也就是说,S-UE或D-UE通信。(七) 学习值吗的策略 ; 被用来估计的概率分布()在接下来的带宽分割策略选择。(八)在 , 收到的回报吗和收到的回报吗在D2D-enabled小细胞网络操作。(第九) 表示时间,这是由一个序列的时间步骤与不完全信息动态Stackelberg博弈的过程。
我们的动态Stackelberg博弈()是传统Stackelberg博弈的一个特例。解决共同问题的缓存位置和带宽分割,这是自然的被设计为两级游戏的方法。领导人或追随者,所有单个独立游戏玩家选择策略和自私来最大化他们的回报。在每个游戏迭代,玩家定期检查他们的回报和动态适应他们的决定在一个完全分布式的方式。逐步迭代期间,这个反馈过程反复进行,直到最佳解决方案被发现。
3.2。缓存位置算法在动态Stackelberg博弈
缓存技术可以缓存流行内容有效地服务问题,本地。否则,问题应该通过回程下载这些文件。因此,使用缓存技术,回程开销和访问延迟可以减少,同时提高系统的性能。然而,它是不可能进行缓存的所有文件在每个SBS由于有限的缓存容量。因此,受欢迎的内容是仔细缓存实现一个有效的内容分发。选择合适的协同缓存内容,我们每个SBS模型之间的交互和其相应的问题作为一个新的动态Stackelberg博弈。
缓存位置的算法,我们考虑一个商业SBSs和小细胞组成的缓存系统建设问题。采用数位领导人single-follower Stackelberg博弈模型,合作SBS缓存算法。通常,一个实际的缓存机制是加上文件位置。在我们的小细胞网络体系结构中,我们假设一个多媒体文件集 由受欢迎的文件中总多媒体文件和文件可以在每个SBS可能缓存。流行分布在由向量 经常要求的用户。一般来说,向量可以通过Zipf分布建模,这是一个离散型概率分布建模的常用罕见的事件(21]。
在这项研究中,我们考虑欧盟的社会关系和相互作用SBSs自适应获得值 。事实上,社会特征如外部影响用户的关系和关系信息传播在互联网上起到了至关重要的作用,并将继续访问形状信息的方法(22]。利用关联用户的社会关系,中心最具影响力的用户,可以用来识别那些可能作为渠道信息扩散23,24]。在这篇文章中,中心被认为是重要地估计值。在时间 ,的文件的的价值 定义如下: 在哪里 是问题的集合,谁请求文件 。 是一级的社会朋友的数量吗 。 的最大数量吗在 。在(1), 代表的偏态函数分布在 ;一个更高的结果对应于一个更高的文件重用。自适应获取的结果,我们集中在全球意识到网络的概念,吸引了显著的社会和行为的社区。通过考虑邻居SBSs的文件请求的情况下,每个SBS学习问题的全球趋势的倾向。最后, 是由 在哪里 函数的作用是:返回的价值文件在时间 。如果文件没有在时间 , 函数返回0。是局部和全局缓存信息之间的加权平均,然后呢和的上下界吗函数,分别。返回所有SBSs的中值。一般来说,最受欢迎的文件占大多数的下载请求。在该算法中,社会和小细胞网络的全局属性可以用来设计一个缓存位置协议使用 , ,和功能。最后,具有更高的文件值对应于被缓存在每个SBS (1)和(3)。
3.3。带宽分割算法在动态Stackelberg博弈
最近,介绍了交通卸载技术显著提高系统容量。它可以减少的数据量进行了细胞乐队,释放带宽为其他类型的问题。然而,由于有限的约束带宽,带宽分割需要仔细研究。在这项研究中,我们考虑这样一个场景,带宽是SBSs许可,他们愿意租赁的一部分分配带宽D2D无证问题的沟通。在系统性能的不同方面,没有执照的带宽可以提供优秀的容量和覆盖范围。因此,带宽分割技术进行最大化的关键重要性的总系统容量和QoS满意度问题[9,25]。
D2D-enabled小细胞网络,我们将面临一个双层网络结构许可的带宽细胞通讯和无照带宽分配吗是分配给D2D通信。支持这种机制,每个SBS分裂的总带宽()两种通信模式9,25]。应对带宽分割的设计挑战,我们设计一个单一领导multiple-followers Stackelberg博弈模型。在这个模型中,通过机会通信利用D2D通信流量卸载无照带宽乐队。然而,带宽分割D2D通信通常是np难问题。出于这个原因,我们的领导人multiple-followers Stackelberg博弈模型是新配方基于强化学习算法计算复杂度较低。来调整系统的性能,这是一个合适的方法。
细胞和D2D共存情况下的通信,问题应该考虑使用无照D2D通信带宽或许可为蜂窝通信带宽。从一个角度看问题,定义了两个效用函数为细胞和D2D通信。他们都是由考虑吞吐量和传输能量之间的权衡。为 ,细胞通讯的效用函数和D2D通信是由 在哪里 , 分配的带宽通道吗分别的细胞和D2D通信。( )之间的差距未编码的M-QAM和能力-编码增益。是的信号干扰加噪声比(SINR)功率向量对于所有的问题, , 是细胞和D2D通信功率级,分别。问题,每个人的目标通过选择一个策略是最大化自己的收益 ;它决定他的类型,也就是说,S-UE或D-UE。 从SBS的角度来说,效用函数的设计是基于系统总吞吐量;获得细胞的总和,D2D通信覆盖范围。为 ,效用函数定义如下: 在哪里 , 是集SBSs和D-UE类型SBSs S-UE类型的建设,分别。最大化 ,每个SBS选择他的策略,决定了大量的许可和授权的带宽。决定有效带宽分割政策(),我们开发一种新的学习算法。在该算法中,学习分为两类:本地和全球学习学习。当地学习指的是一种洞察时态学习在其本地SBS,和全球学习是指通过邻近SBSs空间倾斜。提出的主要新奇带宽分割算法是一个接头设计方式有关本地和全球学习方法。指定的全球关系SBSs,亲和力指标()之间的和被定义为(26] 在哪里 , ,和当前的交通数量、均值和标准差的交通历史,分别。(·)的预期值。学习每个SBS的当地交通状况,当前值是定期监控。基于全球()和地方()信息,我们可以估计的学习价值观SBS的带宽分割策略 。如果策略被选中时通过 , 更新策略为下一个时间步的学习价值如下: 在哪里是一个模型的学习速率如何值更新。在(9),和分别代表当地和全球学习价值。因此,是加权平均的一个控制因素之间不同的学习方法。
基于价值观、战略选择分布(为每个SBS定义)。在动态带宽分割过程中,我们确定 的概率分布的战略选择 ;它是随着时间的推移顺序修改。在 ,的战略选择的概率在时间被定义为 根据(11),随机选择策略使用他的策略选择分布()。基于所选择的战略,最后试图调整系统的性能。通过使用一个简单的讨价还价的过程中,在他的最后决定仔细研讨。特别是,从选定的结果策略被认为是现状的角度这讨价还价的过程。在时间 ,这一点是向量的细胞和D2D回报通过沟通与 ;也就是说, 在哪里 和 是和值与策略在时间 。根据选择的策略 ,通过学习的过程,选择最后一个策略来获得理想的最佳解决方案如下: 在每个游戏,讨价还价的过程将顺序。通过连续的讨价还价过程,每个SBS可以改善意想不到的结果。事实上,谈判的基本概念解决方案已经成为一个有趣的研究课题由于其许多吸引人的属性。然而,传统的谈判方法等于一个随机优化方法在一个巨大的空间,这是收敛的几乎没有(10]。因此,它是不切实际的现实世界的网络操作的实现。在这项研究中,我们有效地实现讨价还价模型采用学习过程。这是一个有前途的方法为实际网络运营,达到更好的性能在不同的系统环境。
3.4。的主要步骤,提出D2D-Enabled小细胞控制方案
近年来,重点一直放在D2D-enabled蜂窝网络系统缓存SBSs以最大化系统容量,同时保证QoS。这种方法是将起到至关重要的作用5 g网络控制分散的通信。然而,设计一个适当的缓存位置和带宽分割算法是一个特别具有挑战性的问题。在本文中,我们提出了一种新的动态Stackelberg博弈模型,它被实现为一个分布式和动态重复博弈而SBSs和问题可以动态领导人和追随者。方案,个人游戏玩家可以在本地和全球学习网络现状和确定其最佳策略来最大化他们的回报通过循序渐进的互动游戏的过程。
一般来说,众所周知的解决方案的概念提出了博弈论在封闭表达式的完整信息。然而,他们不能捕获5 g网络操作的适应问题。在实际操作的角度,基于我们的学习解决方案的概念适用于动态和未知D2D-enabled手机网络环境。此外,我们可以计算从中央系统的负担转移到个人SBSs在分布式在线时尚。是实际的真实的决策过程。该方案的主要步骤描述如下。
步骤1。控制参数是由仿真场景(见表1)。
步骤2。在最初的时候,学习值在每个SBS是均匀分布的。这开始想保证每个SBS的带宽分割策略享受相同的福利在动态Stackelberg博弈的开始。
步骤3。对于每一个SBS的缓存位置算法,数位领导人single-follower采用Stackelberg博弈模型。作为领导者,要求多媒体文件相应SBSs自由问题。作为一个追随者,每个SBS显示器最受欢迎的文件。
步骤4。SBS估计自适应选择缓存文件,每个文件的流行分布。通过考虑社会问题的特征,每个SBS计算每个文件的使用价值(3)和(5),包括社会和小细胞网络的全局属性。
第5步。在每个SBS,高的文件值缓存以分布式的方式。在每个游戏时间 ,文件的值是动态地重新计算猫了当前的网络环境。
步骤6。对于每一个SBS的带宽分割算法,single-leaders multiple-follower采用Stackelberg博弈模型。作为追随者,问题决定他们的通信方式使用(5)和(6)。基于和效用函数,问题选择最佳策略来最大化他们的回报。
步骤7。作为一个领导人,SBS分裂的总带宽()细胞和D2D通信。最大化回报(),每个SBS自适应地选择他的分割策略 。
步骤8。每场比赛期间(SBSs学习),建设全球关系通过关联指标和评估学习价值观为每个策略基于局部和全局观点。最后,概率分布()为每一个战略选择是根据获得的(8),(9)和(11)。
第9步。基于所选择的战略、现状()是获得使用(12)。然后,每个SBS最终决定了他的最终策略基于讨价还价的过程。
第10步。基于互动反馈过程,我们Stackelberg博弈的动态会引起一连串的SBS和之间的交互问题,本地和全球。作为游戏玩家,他们在在线分布式方式动态地选择他们的最好的策略。
步骤11。动态D2D-enabled蜂窝网络环境下,个人游戏玩家不断自我监控为下一场比赛过程;去一步3。
4所示。绩效评估
在本节中,我们评估的性能提出的协议和比较它与南部非洲发展共同体(13],HSAC [14],SDWC [15)计划。根据仿真结果,我们证实了该方法的优越性。确保公平的比较,下面的假设和系统使用场景:(我)模拟系统包括50 SBSs,问题的数量是1000。带宽容量()每个SBS 100 Gbps。(2)根据问题的特点,服务请求生成基于泊松过程,这是与速度(服务/ s),从0到3范围是不同的。(3)有8个不同的服务请求。他们是随机生成的问题。(iv)为了代表各种各样的应用程序服务,八个不同的流量类型的假设是基于连接的持续时间和带宽的要求。他们以相等的概率生成。(v)服务应用程序的时间是指数分布。(vi)分裂策略被定义为 , , , , 。(七)系统性能的措施获得100模拟运行的基础上绘制的功能服务请求产生率。(八)为简单起见,我们假设在实验中没有物理障碍。
为了证明我们提出的方法的有效性,我们测量带宽利用率,缓存命中率和系统吞吐量。表1显示了仿真中使用的系统参数。主要系统控制参数的模拟,提出了表1,促进我们的模拟器的开发和实现。
图1比较了每个方案的带宽利用率。在这项研究中,带宽利用率是衡量实际使用带宽的百分比,这是一个关键因素来估计D2D-enabled蜂窝网络系统的资源可用性。所有计划表现出类似的趋势。然而,该方案优于现有方法从低到高流量负载分布。作为一个领导者在我们唯一的领导multiple-follower Stackelberg博弈模型,每个SBS协商许可和授权带宽乐队的数量来提高沟通能力和自适应分割可用的带宽。该方法可以提高带宽利用率比其他方案。
图2为每个方案给出了缓存命中率。小细胞网络操作期间,毫无疑问,缓存支持SBSs可以提高系统容量和保存资源显然回程。一般来说,缓存命中率与服务产生率增加,直觉是正确的。基于我们的缓存位置算法,每个请求的文件从SBS监控智能问题和拿起最受欢迎的文件缓存这些文件。因此,该方案达到优越的缓存命中率和其他计划,从低到高流量负荷强度。
曲线在图3显示的规范化系统吞吐量D2D-enabled蜂窝网络系统。作为游戏玩家,所有问题自适应地选择他们的通信范式网上分销的方式。从的角度SBSs,主要目标是最大化系统总吞吐量。根据交互式反馈机制,SBSs有效学习当前的系统环境和试图提高系统吞吐量。特别是社会、当地和全球学习方法可以有效地解决缓存位置和带宽分割问题。在每一场比赛期间,我们学习相结合的方法可以提供协作和互补特性适应动态网络的情况。
仿真结果如图1- - - - - -3证明该方案,它使用一个学习动态Stackelberg博弈模型为基础,可以监视当前D2D-enabled小细胞网络条件和适应高动态系统情况。特别是所有SBSs和问题我们的方法获得实时信息从当前环境,以自适应的方式做出明智的决策。仿真结果表明,该方案达到一个有吸引力的网络性能,计划无法提供的东西。
5。摘要和结论
5 g移动网络、小细胞网络将是一个流行的和有前途的趋势。在本文中,我们研究一个新的D2D-enabled小网络控制原型在缓存策略。这个研究是探索的动机共同缓存位置和带宽分割问题。根据游戏的学习方法,我们制定动态Stackelberg博弈模型和配置适当的缓存文件位置和带宽分割算法来最大化系统容量。如今,游戏理论的方法是公认的实用角度实现现实世界的网络运营。基于数位领导人single-follower Stackelberg博弈,我们最受欢迎的文件缓存位置算法可以缓存重温沉重的交通负荷fronthaul链接而减少请求的延迟。基于单一领导multiple-follower Stackelberg博弈,我们的带宽分割算法研究细胞和D2D通信利用平衡系统的性能。使用基于反馈的自我监控和社会、当地和全球学习技术,SBSs和问题动态适应当前D2D-enabled小细胞网络情况和有效地最大化他们的预期利益。我们验证的有效性使用广泛的模拟方案。仿真结果给出了展示我们的方案的优越性。
对于未来的研究,开放存在的问题和实际的挑战。有趣的主题为进一步研究包括用人机制设计等博弈论模型和合作博弈模型来进一步提高系统的性能。另一个有趣的方向是解决最优问题D2D-enabled小细胞网络系统从运营商的角度。此外,我们的方法可以用来开发新的理论算法自适应游戏。控制决策的进程间通信、磁盘和内存管理、文件和I / O系统中,CPU调度和分布式操作系统也必须没有完美的信息。因此,在这项研究中使用的主要概念是适用于开发各种实时控制决策算法。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项研究得到了MSIT(科技部和ICT),韩国,期(信息技术研究中心)支持下项目由IITP监督(信息与通信技术促进研究所)(IITP - 2017 - 2014 - 0 - 00636),并支持基础科学研究项目通过韩国国家研究基金会(NRF)由教育部(NRF - 2015 r1d1a1a01060835)。