由于频谱利用率较高的非正交的多路访问(诺),它就变成了一个潜在的候选人技术未来的无线通信系统。与此同时,在新收音机,汽车(V2X)已被建议作为一个有前途的问题3<年代up>理查德·道金斯年代up>代合作伙伴计划(3 gpp)。本文研究的资源配置机制与功率控制策略充分利用车辆的移动特点NOMA-based车辆,车辆(V2V)通信系统。首先,车辆根据光谱移动特征聚类分组。然后,车辆在同一组与诺玛策略相同的无线资源分配。两个分组方法分别为高速公路和城市场景设计。之后,车辆的传动功率调整基于功率控制策略利用q学习的结果。V2V的性能仿真结果表明,系统的数据包接收率(PRR)可以明显提高了该联合诺玛资源分配和功率控制机制相比,典型的能源sensing-based资源分配方法。
一个bstract>随着智能交通系统(ITS)的发展,车辆到车辆(V2V)通信密集的中心研究好几年了。由于越来越罕见的无线频谱资源随着车辆越来越多,资源分配方案设计已经成为一个学术和工业研究的重点领域。
gydF4y2B一个在所有学术研究,图理论和优化理论应用最多。例如,资源分配问题转化为一个最大重量匹配问题(
gydF4y2B一个在NR通信系统,整个分为副载波频率带宽。在时间域,一个传输周期包括几十个时段。12副载波对应一个资源块(RB)在频域。车辆传输信号在特定的苏格兰皇家银行(RBs)在特定的时段。考虑到有限的带宽,V2V通信可以使用,例如,10 MHz,如果需要许多车辆存在或频繁的交互,在苏格兰皇家银行和时段无线资源是不够的。因此,资源冲突,一些车辆传输信号在同一RB V2V系统大大降低了通信性能。
gydF4y2Ba缓解性能下降造成的资源冲突,一种很有前途的技术,使几个汽车共享相同的资源传递信息并确保这些传输车辆仍然可以提出杰出的接收器。这种技术非正交的多路访问(诺玛)。与权力领域的诺玛,不同的发射器可以同时传输的信息在同一RB不同级别的力量,而接收器适用连续干扰消除(原文如此)解码收到的信号通道收益的递减顺序(
gydF4y2B一个当应用诺玛V2V通信系统,关键的一步是分组的车辆。车辆在同一组将分配给相同的资源。一个简单的想法是让车辆在同一组彼此远离。作为V2V通信系统是一个动态的场景中,车辆的运动应该考虑在分组,其中包括移动的特点,例如,移动方向,速度,距离和通信链接类型。考虑利用车辆的车辆分组过程中不同的特性,没有资源分配信息,无监督聚类算法是可取的。聚类后,车辆在同一集群以诺的方式共享相同的无线资源。
gydF4y2Ba根据资源分配结果,功率控制是进一步进行。功率控制的目的是最大化的接收器接收包率(PRR)发射机的覆盖范围。众所周知,q学习是一个很好的方法来学习在一个新的环境,给好的策略。一些文件到功率控制申请毫微微蜂窝通信和D2D通信(
gydF4y2B一个剩下的纸是组织如下。节
V2V广播系统,每辆车广播消息,而其他接收消息并尝试解码如图
在(
gydF4y2B一个在图
gydF4y2B一个在V2V通信系统中,安全相关消息被车辆定期播放。在3 gpp, PRR被定义为典型的性能指标,这是所有数据包的概率的统计平均得到成功。在本质上,数据包的概率取决于接收器的SINR正确解码。高等PRR、更可靠的车辆之间的通信。
年代ec>在3 gpp的规定,一个通信类型车辆发射机广播消息,而其他车辆接收器接收消息。如前所述,PRR统计平均的所有数据包解码成功的概率。因此,资源分配和功率控制的目的是最大化PRR的所有车辆。此外,因为数据包的概率正确解码基本上取决于接收器的SINR,目标提醒所有车辆的总SINR最大化。之间的关系PRR和SINR如图
假设有<我t一个l我c>N车辆V2V系统。总可用带宽分为<我t一个l我c>米我t一个l我c>子信道(子通道由几种RB)和一个传输周期分为<我t一个l我c>T槽。在本文中,一个在频域子通道和一个时间段在时间域被定义为一个资源块组(篮板)作为资源分配的基础。因此,有完全<我nl我ne-formula>
gydF4y2B一个在这个配方,集<我nl我ne-formula>
gydF4y2B一个所示的优化目标(
不容易找到最优解的约束。即使有贪婪的方法,最优解此刻并不意味着它是下一刻的最优解,因为每个两辆车之间的距离变化的时候。为了简化问题(
gydF4y2B一个在第一阶段,假设传输的所有车辆都是一样的,资源分配机制基于车辆移动的特点。在第二阶段,功率控制是进一步做根据第一阶段的资源分配结果。
gydF4y2B一个在这篇文章中,两种典型场景,高速公路和城市,被认为是,对应相对简单和复杂的车辆交通条件。在不同的交通场景,不同车辆的移动特征的重要性是不同的。例如,高速公路上运行的车辆很少改变自己的移动方向和速度等状态。在大多数情况下,发射机和接收机之间的链接类型的视线(LOS)。然而,在城市场景中,车辆可能会改变在任何交叉行驶方向和速度可以改变由于不时地,例如,交通堵塞和交通信号灯的控制。甚至两辆车之间的链接类型可能会改变,因为构建块的概率。因此,不同的用户分组方法提出了不同的场景。
<年代ec id="sec3.1">正如上面提到的,资源分配机制设计的关键一步是用户分组。在高速公路场景中,有一些设计考虑。首先,车辆尽可能远的应该选择使用相同的篮板以诺的方式。原因是,当两个发射器分配给相同的资源相互靠近,他们的邻居接收器不能成功接收和解码数据包从他们两人因为它们之间的干扰大。为了减少上述情况的发生,一个参数<我nl我ne-formula>
gydF4y2B一个在用户分组、接收器具有相似距离传输车辆也应该被考虑。原因是这样的接收器通常无法解码的信息从任何发射器;例如,<我nl我ne-formula>
gydF4y2B一个集中调度机制,组织车辆根据他们的移动特性提出了基于以上考虑。车辆在同一组中分配给相同的资源提出了资源调度算法。车辆在同一集团预计将有类似的速度和类似的移动方向。此外,它们之间的距离应大于<我nl我ne-formula>
gydF4y2B一个详细的资源分配算法描述如下:在第一步中,所有车辆分为几大类根据他们的速度和方向。车辆在同一类别相似的方向和速度<我nl我ne-formula>
gydF4y2B一个在第二步中,我们将决定哪些车可以选择在同一组。车辆<我t一个l我c>j是随机选择的算法,和假设车辆<我t一个l我c>j是在<我nl我ne-formula>
在(
gydF4y2B一个重复搜索,直到没有车辆在同一类别满足(
gydF4y2B一个车辆在同一组使用相同的资源。如果组数大于资源的数量,价值的<我nl我ne-formula>
gydF4y2B一个为了获得更好的性能和稀缺的频谱,汽车共享相同的资源之间的最小距离是由上述步骤计算,这意味着距离取决于数量的无线资源。如果车辆信息传输无线资源充足,汽车共享相同的资源之间的最小距离情况下会比小的无线资源。
gydF4y2B一个算法的详细描述
输入:
车辆的集<我nl我ne-formula>
输出:
该集团<我nl我ne-formula>
在城市场景中,车辆的运动特性是更复杂的比高速公路场景。车辆经常改变行驶方向和速度,两辆车之间的链接类型可能改变不可预知的原因,例如,阻止由建设或树。在用户分组算法,这些特征应该考虑考虑除了距离高速公路场景。
gydF4y2Ba谱聚类(SC)作为一种无监督的方法可以根据多个数据分割成不同的群体特征。在大多数情况下,SC的优越性是归因于一个度量函数的设计和关联图
gydF4y2Ba除了选择适当的运动特性,适当的重量也应该建立在每个特性的考虑影响车辆之间的通信设计度量函数。适当的分组方法在城市场景中车辆需要量化特性对车辆和建立适当的体重在车辆评估车辆的相似性。根据相似性,车辆聚集,例如,每个传输期间BS。聚类后,车辆在同一集群以诺的方式共享相同的资源。
gydF4y2Ba在第二部分,简要介绍规范化削减的SC的主要步骤。之后,特征选择和指标建立在城市场景描述和资源分配算法。
<年代ec id="sec3.2.1">当输入一个数据集<我nl我ne-formula>
gydF4y2B一个规范化降息的主要步骤如下所示:
构造相似矩阵<我t一个l我c>年代。我t一个l我c>
构造邻接矩阵<我t一个l我c>W和度矩阵<我t一个l我c>D。我t一个l我c>
计算拉普拉斯矩阵<我t一个l我c>l
做的标准化<我t一个l我c>l
计算最小的<我nl我ne-formula>
规范化矩阵<我t一个l我c>l相应的特征向量组成的<我t一个l我c>f由行和形式特征矩阵<我t一个l我c>F的<我nl我ne-formula>
集群上面<我t一个l我c>n例如,样品<我t一个l我c>k则,集群维度<我nl我ne-formula>
获取集群分区<我nl我ne-formula>
功能1:车辆之间的距离。类似于高速公路场景中,车辆之间的相对位置,即距离,仍然是重要的。在车辆分组,汽车共享相同的资源预计将尽可能远。重量计算的距离特性被设计成与距离成正比。车辆越近,就越不可能在同一个集群。
功能2:车辆的速度。速度是另一个重要的特性,因为车辆的速度动态影响它们之间的距离。当有车辆之间的速度差异,它们之间的距离不断变化大大。这带来了不确定性的距离。例如,两辆车在开始时相互远离,朝着同一个方向。如果他们被分配到相同的资源而不考虑他们的速度,他们的距离可能变小后短时间内如果后面车辆的速度比前一个。因此,体重应该是成正比的差异速度相反,确保车辆和大型速度差在同一个集群概率较低。考虑到城市的场景中大量的车辆有不同的速度,模拟城市流动(相扑)是用于部分
特点3:车辆的移动方向。类似于速度、移动方向也影响车辆之间的距离变化量,如接近或分离。
功能4:类型的车辆之间的通信链路。链接类型,我们这里指的是洛杉矶和视线范围(仿真结果)。如果两辆车之间的联系被建筑物或其他障碍,链接被认为是仿真结果。否则,它是洛杉矶。当类型的通信链路仿真结果之间传输车辆,接收车辆之间的通信链接的类型,每个发射车更有可能是不同的。因此,从不同的接收功率值传输车辆更可能有较大的差别,这是有利于接收车辆解码消息以诺的方式从发射机。因此,车辆与仿真结果链接将共享相同的资源,以减少干扰。
有几个策略来构造邻接矩阵。在所有的策略中,最常见的方法计算邻接矩阵,即权重矩阵,满是连接(见以下方程):
考虑到对V2V沟通不同的特性有不同的影响。计算权重矩阵的设计方法对不同的特性。
在(
算法
输入:
车辆的移动特性:<我nl我ne-formula>
输出:
分区<我nl我ne-formula>
构造邻接矩阵<我nl我ne-formula>
为<我nl我ne-formula>
为<我nl我ne-formula>
计算<我nl我ne-formula>
结束了
结束了
构建度矩阵<我t一个l我c>D
计算拉普拉斯矩阵<我nl我ne-formula>
做的标准化<我nl我ne-formula>
计算所有特征值的<我t一个l我c>l和各自的特征向量<我t一个l我c>f
规范化矩阵<我t一个l我c>l相应的特征向量组成的<我t一个l我c>f由行和形式特征矩阵<我t一个l我c>F
在每一行<我t一个l我c>F作为一个示例,<我t一个l我c>n样品是集群,集群维度<我t一个l我c>k
获取集群分区<我nl我ne-formula>
资源分配机制提出了通过b,这意味着b需要收集关于汽车的信息。共识已经形成,NR支持用户(问题)报告帮助信息生成节点B (gNB)后,在94年3 gpp讨论<年代up>th会议(
信令流程资源分配机制。
q学习的是一个模范自由强化学习算法,它可以找到最优通过最大化期望的奖励政策。它显示了很好的性能的复杂的系统。本文介绍了q学习解决功率控制问题。
gydF4y2Ba在q学习的状态,行动,和奖励三个主要元素。关于q学习可以在[详细内容
因为每辆车的传动功率值的上限<我nl我ne-formula>
操作集是所有发射车辆传动功率的变化使用相同的资源。为了限制元素的数量的操作集,传动功率值的变化每个传输的车辆只能减少,增加,并保持不变,这是由−1,0和1。当<我nl我ne-formula>
传输功率的上限每辆车的价值<我nl我ne-formula>
gydF4y2B一个奖励是SINR的总和,当其他车辆接收消息从发送车辆信息解码的可能性成功SINR成正比。当<我nl我ne-formula>
贪婪的搜索,达到探索和利用之间的平衡。探索率<我nl我ne-formula>
初始化Q-table为零
为<我nl我ne-formula>
如果<我nl我ne-formula>
随机选择的行动
其他的
选择行动<我nl我ne-formula>
如果
计算奖励价值(
更新Q-table (
结束了
选择<我nl我ne-formula>
学习之后,行动得到了最大Q值功率控制策略。
年代ec>在本节中,提出联合资源分配和功率控制机制是通过系统级仿真评估。
<年代ec id="sec4.1">在本节中,建议的机制下高速公路场景由3 gpp [
为了模拟路配置。
高速公路场景的模拟参数。
选择这里,传感机制的比较算法,这是一种资源分配方案由3 gpp。每辆车的感官能量在每一个篮板,等级从低到高。重新分配时,它将一个篮板的篮板对应于最低的20%能量的只要20<年代up>th最小值的能量的篮板是3 dB不到篮板现在使用的能源价值(
gydF4y2B一个图
PRR车辆之间的距离。
进一步评价资源利用效率,资源的利用率是指的篮板数已经分配给车辆的篮板数除以总可用。如图
利用篮板。
在V2V通信系统获得更好的性能,车辆的数量分配给相同的资源应该少和它们之间的距离应该消除干扰。数据
汽车的数量分配给相同的资源在传感机制。
汽车的数量分配给相同的资源在建议的机制。
联合资源分配和功率控制机制来评估城市场景下曼哈顿的真实映射图
真正的曼哈顿地图仿真。
模拟场景抽象相扑。
城市场景的模拟参数。
图
PRR车辆之间的距离。
数据
汽车的数量分配给相同的资源在传感机制。
汽车的数量分配给相同的资源在建议的机制。
图
车辆的平均数量分配给相同的资源。
在传感机制中,车辆需要收集计划任务(SA)消息,检测接收能量在每个篮板,并排除篮板基于SA的消息。每辆车平均排名根据他们自己的篮板获得能源和选择篮板。上述步骤都是由车辆本身,这意味着车辆的计算能力大大影响延迟。排名的存在过程,计算复杂度之间<我nl我ne-formula>
gydF4y2B一个车辆分组资源分配算法的复杂性对于高速公路场景提出了<我nl我ne-formula>
gydF4y2B一个在收到资源分配结果BS、车辆根据功率控制调整他们的权力利用q学习的策略。由于强化学习的学习过程,计算复杂度相对较高,这取决于每一节的步骤的数量。这种方法的优点是,可以调整发射功率以及环境的变化。在未来,可以采用一些有效的方法来减少迭代次数,降低了计算复杂度。
年代ec>在这篇文章中,诺玛引入V2V通信系统提高利用有限的频率资源和资源分配和功率控制机制提出了基于车辆的移动特征。根据不同的条件在高速公路和城市场景中移动,两个资源分配算法的设计,把车辆分成几组根据他们的移动特性。之后,功率控制策略是通过q学习获得的。系统级仿真结果表明,PRR拟议的机制可以提高比能量传感机制。
年代ec>仿真代码的数据用于支持本研究的发现可以从相应的作者。
年代ec>作者宣称没有利益冲突有关的出版。
年代ec>这项工作是支持国家科技重大特殊项目(批准号2018 zx03001024)。
一个ck>