文摘
如今,无处不在的网络接入已成为现实,由于无人机(uav),获得了极度受欢迎由于其灵活的部署和更高的机会视线地面用户的链接。电信服务提供商部署无人机在偏远农村地区,提供区域网络访问受灾地区,或massive-attended事件(体育场馆、节日等),全部设置提供临时的无线覆盖率将会非常昂贵。当然,无人机是电池驱动的能源预算有限流动性方面和沟通方面。一个有效的解决方案是允许无人机交换他们的无线电模块睡眠模式,以延长电池的使用寿命。这导致临时不可用的交流功能。在这种情况下,无人机操作员的最终协议是提供一个具有成本效益的服务与接受的可用性。这将允许会议一些目标的服务质量,而拥有一个良好的市场份额给予满意的效益。在本文中,我们展示一个新的框架和许多有趣的见解如何共同定义的可用性和访问成本UAV-empowered伺机接入网络飞往覆盖目标地理区域。然而,我们构造一个双头垄断模型来捕获服务提供者的敌对行为的定价政策和各自的可用性概率。最优周期报警(UAV)广告的存在是解决,考虑到无人机充电电池容量有限,他们的约束。 A full analysis of the game, both in terms of equilibrium pricing and equilibrium availability, is derived. We show that the availability-pricing game exhibits some nice features as it is submodular with respect to the availability policy; whereas, it is supermodular with respect to the service fee. Furthermore, we implement a learning scheme using best response dynamics that allows operators to learn their joint pricing-availability strategies in a fast, accurate, and distributed fashion. Extensive simulations show convergence of the proposed scheme to the joint pricing-availability equilibrium and offer promising insights into how the game parameters should be chosen to efficiently control the duopoly game.
1。介绍
在最近几年中,无人机(uav),或无人机,吸引了大量的关注,因为他们的优势无处不在的可用性、高机动性和低成本部署。无人机,配备了导航系统和智能传感器,目前正在部署监视行动,救援任务,快速按需沟通。随着无人机技术的成熟度和有关规定,他们已经成为一个重要的市场,预计全球无人机部署。例如,注册使用的无人机数量超过200000只在美国前20天2016年1月,美国联邦航空管理局(FAA)后开始要求业主报名(1]。事实上,无人机可以充分支持蜂窝通信系统部署在地面基础设施网络损坏。此外,它支持无线通信等特殊的场景难以到达农村,节日或体育赛事,紧急情况下地面基站的安装可能太贵了。在这种背景下,无人机飞行基站已报告如有前途的方法,可以提高现有无线网络的容量和覆盖性能。使用无人机作为天线基站提供了一些好处,如高机动性和健壮性、灵活的部署和效率要求电信和移动(2]。
由于高迁移率和空气的位置,无人机可能有良好的通信通道自UAV-ground链接更可能是视距(LoS)链接3]。此外,无人机提供无限的电信应用程序的优势有效地感觉周围环境的信息。他们现在的关键技术情报、识别、搜索、检查任务,监督、公共服务,等等。无人机的另一个关键特性是物联网(物联网),这是一场技术革命,从概念到实际(4,5]。物联网使设备交换数据和互操作在互联网基础设施,提供无所不在的连接,同时减少传输的成本,为低功耗通信提供扩展范围。从技术上讲,无人机发挥重要作用在物联网的愿景。它提供了灵活的部署和重新编程任务的可能性提供许多操作解决方案和服务,为物联网的合作伙伴。
虽然部署无人机飞行基站提供了众多的优势,仍然出现一些经济和技术挑战。这些挑战包括不仅技术和物理问题,而且有效的定价和可用性管理功能。然而,对于无人机服务提供商克服这些相关的具有挑战性的问题,可用性或报警调度变得非常重要,但很大程度上未被探索的话题。为此,综合建模和性能分析无人机的设置已经成为极具吸引力。在本文中,我们提供了一个无人机联合定价和可用性问题,考虑他们的电池容量有限。我们关注可用性时间的调度的关键因素,可能会导致更好的能源效率,然后,一个更好的长期可用性(一生)以及满意的服务质量。更准确地说,我们感兴趣的联合pricing-availability问题无人机网络市场。然后,我们设计一个新方案,共同认为,解决了无人机的定价和节能问题。
为了解决这些问题,我们检查可用性和价格服务提供者之间的交互作为一个非合作的博弈。我们提出一个双头垄断的设置,一个有限的移动网络部署无人机根据齐次泊松过程(PPP)和服务的地面物联网设备。无人机正根据随机路点(RWP)模型。作为第一个提议,我们推导出覆盖概率表达式以及服务概率为每个无人机在当前场景。为了达到最大系统性能在定价政策和能源效率方面,我们的建议引入了纳什均衡分析。此外,我们提出一个学习自动机获得联合price-availability平衡。最后,我们提供广泛的数值模拟强调以price-availability为共同决定参数的重要性,从而提供重要的见解/启发式如何设置它们。
本文的其余部分组织如下。节2,我们概述提出无人机双头垄断系统模型和战略pricing-availability。节3,我们现在的博弈分析,存在和唯一性还不解决方案和定义游戏submodularity特征。此外,游戏中提供了部分定价4;supermodularity的性质讨论了数学分析。部分5认为联合availability-pricing方法与数值学习实现,我们进一步了对一些重要参数对学习过程的影响。最后,部分6总结了纸。
2。相关工作
大量现有文献调查有趣的特性在无人机技术性能和降低成本。例如,作者在6]研究节能无人机通信通过优化无人机的轨迹;为此,他们认为无人机轨迹与通用约束,根据该无人机的飞行半径和速度联合优化。无人机的避障的一个重要研究计划进行(7),作者提出的算法基于迭代区域通货膨胀通过半定为了提高战斗效率。一个有用derivative-free,滑模控制(SMC)基于理论的学习算法,提出了一种无人机的控制和指导(8]。鲁棒性,在实时应用程序和限定时间收敛,证明通过密集的模拟。另一种学习方法治疗(9),作者提供了一个全面的回顾无人机深度学习的方法,包括最相关的发展以及他们的表演和限制。讨论一个重要的问题是物联网应用程序(10]。探讨有效的部署和迁移多个无人机,为了使可靠的物联网上行通信设备最小总传输功率。另一个IoT-related工作是在11),它提出了一个无人机系统应该实现的功能无人驾驶交通管理,即空中交通控制网络,移动网络,网络。在[12),作者介绍物联网的不同分类,利用物联网技术的例子。他们指的是全球范围内物联网的概念,使用无人机提供了大范围和更大的灵活性,由于流动的方法。无人机物联网概念进一步研究摘要(13无人机上),它提供了一个全面的调查和相关的问题。它强调潜在的无人机的增值物联网服务的高度。
3所示。Availability-Pricing无人机操作员之间的游戏
3.1。飞行访问网络框架
3.1.1。覆盖概率
考虑一个圆半径的地理区域R在很多N部署的无线用户根据齐次泊松过程与密度u(每米的用户数量2)。在这个地区,一套无人机根据随机随机移动路径移动模型被用作空中移动基站为地面提供无线服务物联网设备(图1)。无人机是属于不同的运营商和订婚了提供一个有效的移动物联网用户覆盖。在此设置中,无人机高度等都有相同的特点h,总可用带宽和最大传输功率。
覆盖概率是正式定义如下: 在哪里是表达为一个设备用户连接到无人机,接收到的信号功率的无人机包括衰落和路径损耗,N噪声功率,我从现有的总干扰功率发射机,β指的是阈值。
根据(14),一个上行用户位于 ,覆盖概率是由以下方程: 在哪里r和ϕ是半径和角度在极坐标系统中,无人机是位于中心的感兴趣的领域。 ,分别分别是视线,视线范围概率。
平均覆盖率计算概率的平均值在区域半径R: 在哪里是路径损耗指数user-UAV链接,η衰减的另一个因素是由于仿真结果连接,然后呢无人机传输能量。
空对地信号传播几乎是在周围环境中受到障碍。因此,一个共同的无人机和下行用户之间的信道建模方法是基于概率视线外直接视距(LoS)和仿真结果)的链接。即每个链接可能发生与特定的概率取决于传播环境中,无人机和用户位置和仰角(在这里,θ)。
在此场景中,我们想设计一个无人机通信系统在一个偏远的农村地区全面设置提供临时的无线覆盖率将会非常昂贵。由于其高海拔和低平均高度的建筑在难以到达的农村地区,无人机具有较高的概率直接视距地面用户的链接。因此仿真结果组件发生的概率显著低于《组件。为简单起见,我们忽略了小规模的仿真结果,很明显,覆盖概率将大大简化公式如下:
3.1.2。服务概率
考虑到有限的无人机电池的容量和充电困难,定期报警是最具挑战性的问题需要解决。每一个无人机我定期发送信标时间广告存在移动物联网设备。灯塔/空闲周期是每个时间段周期性重复T在一个时间窗口:(图2)。无人机应定义报警时间战略为了最大化他们的接触率随着物联网地面用户。然而,他们应该避免电池损耗造成维护无用的指引在没有接触的机会。
第一个遇到的是一个随机参数的指数分布λ。为了使无人机我遇到第一次地上物联网的目的地 ,必须持有下列条件:(我)无人机我要报警吗 。(2)所有潜在的接触地面的目的地,之前发生的瞬间的时间 ,其他的无人机需要成功。换句话说,遇到需要无人机时发生我竞争对手是不活跃的。
因此,成功的接触概率是由以下方程:
对于数学计算,我们把注意力集中在两个操作符(和 ),这最小化数学并发症,但仍让我们分析运营商战略的重要特征。我们定义的概率报警时首次遇到目的地在[0;米]:
对于一个 ,空闲的概率是由以下方程:
的概率遇到第一个地面目的地没有占其状态(调查/空闲)表示如下:
最后,我们定义的概率遇到第一个地面目的地没有占其状态:
3.2。游戏的配方
3.2.1之上。客户的行为
大多数电信市场是寡头垄断,这意味着,由一定数量的服务提供者称为出现。为了最大化利益,服务提供商之间的竞争正变得越来越强硬。从出现的观点,增加市场份额是最重要的目标。因此,服务提供者应该定义最优定价政策,最好的QoS(由可用性)要求为了吸引越来越多的顾客。天性因为消费者是理性的,他们有可能注册经营者而不是别人或呆在没有订阅状态根据自己的满意度(服务价格、服务质量和质量的经验)。
在本文中,我们假设一个双头垄断电信市场,只有两个服务供应商互相竞争为物联网地面用户提供服务。每一个无人机我属于SP我选择其可用性时间由周期性的报警时间区间内的选择每个数据单元和服务费用 。形式上,SPs智能个人冲突,这涉及理性决策的情况。
非合作的博弈理论提供了适当的工具,以确定最优行为在这样的竞争环境。它提供了数学方法建模和分析智能理性参与者的利益冲突之间的相互作用。这个分支的博弈论主要处理如何聪明的个体相互作用,以实现自己的目标。球员是自私的,每个玩家决定独立没有形成联盟。
我们捕捉pricing-availability两无人机操作员范式之间的互动游戏。每个SP试图选择服务水平允许合理的电池寿命的同时最大化其货币利润,竞争对手的行动。非合作的游戏正式定义如下: 在哪里(我) 参与者的数量(无人机操作员)(2) 是战略空间的无人机操作员吗(3) 是回报的向量定义为各自的利润和成本之间的差异。
增加有经验的市场需求是每个运营商最重要的目标。然后,从经营者的角度来看,这个问题是定义最好的报警持续时间和最好的定价政策吸引部分用户。理想情况下,一个无人机想同时最大化提出费用和最小化总消耗能量。然而,这是两个相互矛盾的目标,因为地面用户可能是理性的。灵感来自于logit模型(15),我们的概率模型给定物联网设备与服务提供者注册我这也可以视为一个无人机的市场份额我。接下来的需求函数的指数分布参数μ。最后一个参数称为风险或温度不变,它定义了用户的合理性,因此,越高μ,用户是理性的:越少
的平均数量客户注册的无人机我是 。因为无人机在服务质量和价格竞争,这似乎是显而易见的,有经验的需求取决于这些参数。然而,它也取决于环境变量。
3.2.2。服务提供商”的战略决策
我们感兴趣的问题最优的固定翼无人机pricing-beaconing应该避免电池损耗造成维护无用的活动持续时间没有接触地面。我们提出一种新的设计模式,考虑无人机的定价和节能问题。
无人机是定期发送信标广告存在移动用户在地上。从无人机的角度来看,战略之间存在权衡参数τ和能源消耗。一方面,随着信标持续时间的增加,报道的机会以及服务概率增加。另一方面,能源消费总量主要活动时期持续时间成正比。同样的服务价格,增加定价政策价值可能会增加收入,但在同一时间,它消极地影响经验丰富的市场需求。这里的策略空间和奖励是常识;然而,选择报警时间和征税费不是因为决策是同时拍摄。每个无人机SP的实用程序是一个函数的策略以及其他的决定: 在哪里耗散的能量吗 : 在哪里是用户的归一化吞吐量u由一个 , 每槽发送信标是能量消耗,是接收能量,是传输能量消耗,是单位剩余能量转换收发器的状态,然后呢是地面的集合物联网设备由给定的无人驾驶飞机吗我。
4所示。可用性和固定费用
在文学中,定价安排几乎是关键参数影响直运营商的收入。然而,这种假设有时被质疑的现实主义16]。事实上,类似的市场价格可能会影响客户对无人机的可用性,然后他们的忠诚。由于一个粗略的竞争,可用性已经开始成为一个重要的战略工具,运营商扩大他们的市场份额。非合作的博弈框架内我们检查energy-efficient-pricing权衡。这让运营商努力在提供更好的QoS解决最优周期广告灯塔。该方法足够现实的分析可用性的相互作用对服务提供商的收入。问题是,确定每个无人机,最佳的可用性(报警时间),而竞争对手表现最佳,这代表了纳什均衡状态。
回想一下,纳什均衡策略是最好的响应每个无人机预期最好的响应行为。
命题1。可用性游戏承认至少一个纳什均衡。
证据1。显示一个均衡的存在性,充分条件的quasiconcavity效用函数。我们注意到策略集是一个凸、关闭和紧凑的间隔。此外,持续对效用函数 。此外,我们表明,二阶导数是负的。计算后,二阶导数表示如下: 在哪里 很容易证明,服务的二阶导数对概率负号,因此,对于二阶导数为负,这可能不足以确保满足以下条件: 这种情况似乎逻辑自需求是正的,而且每个运营商需要一个特定的阈值作为部署无人机的动力资源需求;这意味着要激发无人机操作员覆盖一定区域,所需的最低需求=至少会浪费的能源成本。由此,无人机的效用函数我属于经营者我是quasiconcave,然后承认一个局部最优点在哪里这是它最好的回应与其他运营商的策略。
命题2(availability-termed纳什均衡的唯一性)。可用性游戏是优势可以解决的17因此满足罗森的对角线严格凹度条件。从今以后,它有一个独特的纳什均衡。
证据2。主导地位的可解性条件是由以下方程:
在哪里
主导地位的可解性条件验证,因此凹的游戏满足罗森的对角线严格纳什均衡的唯一性的凹性条件。
无人机之间的交互在这种非合作的游戏有一个非常有吸引力的属性,如果一个无人机降低它的可用性(报警周期)和其他减少自己的无人机也有兴趣。非正式地,这种类型的游戏让我们得出结论,它是关于子模块的游戏。
引理1。这个游戏与N两个无人机移动设备和服务提供商是子模块。
证据3。为了证明游戏submodularity,我们计算的二阶混合导数对两个报警时间和
。与混合导数表达式给出了(19),这是简单有效地得出这样的结论:这是关于一个游戏子模块。
submodularity,无人机的最好的回应是另一种无人机的递减函数可用性策略(报警周期)。因此,这个游戏具有独特的平衡,最好的响应具有概率的动态学习计划可以达到1。
5。定价和固定的有效期
尽管可用性的几个优势竞争,价格仍然是更常见的在电信业务的战略决定。这激励我们调查和固定定价游戏可用性参数。在本节中,我们认为,运营商设置价格,让消费者决定他们的经验丰富的需求。即,每个运营商是最大化其利润相信它的竞争对手也在做同样的事情。从概念上讲,这种情况是一个典型的Bertrand-Nash平衡(见论文(18,19])。我们首先把数学分析平衡的存在。
命题3。定价游戏承认至少一个纳什均衡。
证据4。代表的策略集是一个凸,关闭,紧凑的时间间隔。此外,效用函数是连续的 。此外,我们表明,二次导数有一个负号。计算后, 二阶导数表示如下: 这显然是负面的。因此,每个无人机的利润函数quasiconcave对自己的费用,然后不存在。
命题4(基于价格的纳什均衡的唯一性)。定价博弈有唯一的纳什均衡。
证据5。效用函数满足优势可解性条件,因此满足罗森的条件,定义如下: 这个游戏的一个了不起的属性是,当一个球员选择更高的行动,其他人的动机跟随和做同样的事情。约,这介绍的概念supermodular游戏战略互补的特征。
引理2。这个游戏与N两个无人机移动设备和服务提供商是supermodular。
证据6。为了证明游戏supermodularity,我们计算的二阶混合导数就其提出费用和其竞争对手(和 )。用下面的混合导数表达式,它显然是一个积极的迹象,我们认为这是一个supermodular游戏: Supermodularity往往是分析有吸引力。一个有趣的特性是,它表现在各种学习规则。此外,收敛到纳什均衡是保证下最好的反应动力学。
6。联合Pricing-Availability游戏
6.1。洞察实际实现:完全分布式学习
学习是一个基本组件的智力和认知;它被定义为合成通过实践获得知识的能力,训练,和经验学习为了提高未来行为的代理。在本节中,我们介绍一个学习计划20.,21旨在理解行为的用户在交互和对纳什均衡达到最终的收敛。无人机的服务提供者的目标是学习自己的回报和确定不联合availability-pricing策略。为此,最好的响应算法是一个合适的类;它会导致一个纳什均衡状态通过利用快速单调的最佳响应函数。事实上,NE的概念是基于隐式的假设球员遵循最佳反应动力学,直到他们达到的状态没有球员可以提高他单方面实用程序通过改变策略22]。
算法1总结了每个服务提供者的最优反应动态执行为了收敛到纳什均衡的比赛。最好的回应策略被定义为其最佳球员,考虑到其他玩家的策略。一次迭代t,每个服务提供者选择最好的联合availability-pricing策略在上一轮对阵对手的策略选择 。值得注意的是,融合的最佳反应动力学是授予s-modular游戏(23]。
|
最好的回应算法表现出巨大的优势,因为它提供了一种准确、快速收敛到唯一的纳什均衡。我们说无人机学习演奏一个平衡,如果迭代一定次数后,战略轮廓收敛于一个平衡状态。
6.2。数值调查
pricing-availability最好的反应是使用MATLAB软件提供的学习结果。模拟中使用的参数设置等基于典型值 ,和 。在这里,我们将分析各种参数的影响尤其是市场温度、覆盖概率,遇到利率提供的纳什均衡价格以及QoS(以报警时间)对竞争对手。
在此设置中,人物3说明了服务提供商的行为在最好的响应算法和迭代收敛到纳什均衡价格随着时间的推移。在这里,我们考虑对称操作符与随机生成的初始点。一个更小的温度μ值意味着消费者越来越理性,因此运营商的NE价格趋向于较低的值。的确与 ,NE价格绝对是零 。然而,当μ变得更大(消费者不太合理),价格不出现,达到它的最大价值 。这同样适用于图4,我们描述了算法的收敛性1对纳什均衡报警时间和不同的价值观μ。值得注意的是,最好的准确、快速地响应算法收敛到纳什均衡。这个功能需要在现实系统有效地设计一个这样的机制。与 ,的是零;然而,增加与μ。通过链接,价格分析,我们可以说,增加可用性时间,运营商提出更高的价格。这表明更高的服务质量(与网络可用性)产生额外成本。
我们在数据描述5和6个人最好的回应价格分别报警时间两个不对称的无人机。每个无人机都有不同的覆盖概率值(例如,可能是由于高参数)。相反,图5表明NE价格并不依赖于覆盖概率。即使不同的覆盖概率,这两个竞争对手相同收敛到均衡价格;最后一个值是提高无人机的覆盖率非常直观。
图6描绘了收敛到平衡报警时间下不同的覆盖概率值和不同的理性水平。值得注意的是,无人机与更大范围收敛于一个更高的报警值,因此,提供了一个更好的QoS(可用性服务)。我们从这个分析排除的情况下与一个小值参数μ,两家运营商收敛于零值。然而,更大的覆盖(可能无人机高),时间越长是不报警可用性广告时期。
图7说明了两者的影响μ和接触率的价格在每一个无人机我在非对称的设置(一个无人机有一个遇到率优于其他)。我们的话,即使有不同的接触率,NE的价格都是一样的;然而,东北与最低温度大于对称的情况。
我们把图8最好报警响应学习进化为两个非齐次无人机(UAV有遇到率优于其他),和不报警时间直接影响μ以及λ。因此,更大的μ和λ,最好的响应收敛于一个高价值的 ;然而,不报警时间与小型无人机λ总是较低。
为了研究进化的影响参数μ学习结果,数据9和10说明了NE价格和NE报警时间和温度参数两个对称的无人机和不同的物联网人口大小,分别。结果在图9显示与温度参数小于某个阈值(例如,为 ),NE价格在其最小值,从这一点上,价格增加到最高价格值( )(例如,μ= 6N= 50)。在这个图中,我们认为,人口密度较高,但价格往往收敛速度最大值。这些发现的影响显然指引时期进化见图10。增加更大的人口,不报警和达到均衡状态在一个较小的时间窗口。
定价和指引学习进化在不同覆盖概率值见图11和12,分别。在图11,价格较低的最小覆盖,和一定的覆盖概率值(近0.6),往往最好的策略 。然而,图12显示了线性的影响明显在不报警策略。最后在增加 ,确认结果图5。
数据13和14说明了NE价格覆盖概率和不报警时间两个对称的无人机和不同的物联网人口大小,分别。这两个数据提供给研究覆盖概率学习结果的影响而考虑 。图13显示明显的“自然”影响人口密度服务价格,与更大的人口,运营商可以设置更大的价格。此外,一个有趣的发现在图14是,更大的人口,不报警持续时间最大化,从而确认结果在图吗13。值得一提的是有多快和准确的算法收敛到唯一的纳什均衡,它提供了大量的见解如何实现和衡量其有效性。
7所示。结论
在本文中,我们处理pricing-availability交互之间的敌对的无人机作为飞行基站。我们构建一个理论框架基于非合作的博弈理论和描述每个无人机的均衡策略,无论是平衡费用和平衡可用性概率。此外,获得一个特殊功能的可用性和固定价格子模块在定价游戏supermodular固定的可用性。接下来,我们检查一个简单的迭代最佳响应算法允许探索游戏的唯一的纳什均衡。绩效评估在平衡结果允许无人机的服务提供商来优化他们的能源消耗,同时最大化的货币收入。
作为一个未来的工作,我们是推广我们的建议而考虑异构移动动作。此外,一些田间试验也设想。
数据可用性
我们特此声明可用性相关的所有数据提交。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作是框架内进行的项目由摩洛哥的高等教育和科学研究和国家科学技术研究中心。