文摘

频谱感知至关重要在认知无线电(CR)网络。本文提出了一种可靠的频谱感知方案,即使用再邻居,一个机器学习算法。在训练阶段,每一个CR用户生成一个传感报告在不同条件下,基于全球决定,传送或保持沉默。在训练阶段CR用户的本地决策相结合通过多数投票在融合中心和全球决定返回每个CR用户。CR用户传输或根据全球决定保持沉默,在每一个CR用户全球决策与实际的主用户活动相比,它是通过一个应答信号确定。在训练阶段足够关于周围环境的信息,例如,the activity of PU and the behavior of each CR to that activity, is gathered and sensing classes formed. In the classification phase, each CR user compares its current sensing report to existing sensing classes and distance vectors are calculated. Based on quantitative variables, the posterior probability of each sensing class is calculated and the sensing report is classified into either representing presence or absence of PU. The quantitative variables used for calculating the posterior probability are calculated through K-nearest neighbor algorithm. These local decisions are then combined at the fusion center using a novel decision combination scheme, which takes into account the reliability of each CR user. The CR users then transmit or stay silent according to the global decision. Simulation results show that our proposed scheme outperforms conventional spectrum sensing schemes, both in fading and in nonfading environments, where performance is evaluated using metrics such as the probability of detection, total probability of error, and the ability to exploit data transmission opportunities.

1。介绍

认知无线电(CR)提出了解决频谱稀缺问题造成低效率的利用频谱资源(1,2]。CR用户未经授权访问约束下的频谱主要用户(PU)通信不受影响。为了确保这一点,PU的频谱连续监控活动。频谱感知也可以用来探测光谱洞和启用CR用户机会主义式的传播。CR系统的性能得到进一步提高了合作频谱感知(CSS),在多个CR用户合作检测光谱洞。

在匹配滤波优于其他技术,如周期平稳检测和能量检测用于频谱感知,其复杂性使得它适合大多数系统。能量检测是最简单的技术,考虑到有限的资源(例如,能源和计算能力)的CR用户。常见的频谱感知问题,如多径衰落和阴影可以克服使用CSS利用空间的多样性,从而确保聚氨酯约束得到满足(3]。在CSS,个人CR用户分享他们的数据融合中心(FC),结合当地报道全球的决定。CR用户可以报告收到的实际数量的能量,即,the not quantized into different levels and then reporting the quantized level which can be represented by fewer bits than the number of bits required for representing the actual amount of energy received. This is called soft-decision combination and results in optimal detection performance but theoretically requires infinite bandwidth [4]。另外,CR用户可以根据接收到的能量作出艰难的决定和报告一位代表的存在与否的PU FC (5]。报告可以节省带宽但产生劣质结果相比软报告。线性软几乎相同的性能结合似然比检验(6]。

平衡性能和带宽效率两者的结合软、硬决策可以使用的能量范围可以量化,如(4,7]。在[4),作者使用了所谓的软化硬组合方案,观察到的能量是量子化的用两位分为四个区域,每个区域由一个标签。这之间达到一个可接受的协议改进的性能造成软报告和量化过程中信息丢失。FC使用CR用户报告的决策组合规则结合的决策,使全球的决定。CR用户以量化的形式的决策;即。,我nstead of reporting a one-bit decision or the actual amount of energy received to the FC, the CR users quantize the received energy into multiple levels and send multiple bits denoting the quantization zone. This is called quantized-hard decision combination [8]。

以及其他因素,如参与CR用户的数量,传感环境,和传感功能的CR用户,FC的全球决策组合规则决定了CR系统的检测性能。例如,PU的或规则产生了良好的保护,但最低的光谱洞勘探能力(9),而一个和规则提高光谱孔检测,但降低了聚氨酯保护能力。同样,可怜的传感和/或恶意CR用户减少k-out-N决定的性能组合规则。更复杂的组合规则如贝叶斯分析和序贯概率比检验(SPRT)有更好的聚氨酯保护和光谱洞勘探但需要先验信息可能并不总是可以在给定的CR环境(10]。

学习环境的概念是嵌入在认知无线电的概念。CR用户是为了监测环境和适应他们的操作特征(操作频率、发射功率等)变化的条件。使CR用户能够从环境中学习,一些作者认为是机器学习算法(11- - - - - -16]。在频谱感知成为机器学习的任务从一个模式中提取特征向量分类到相应假设类没有或聚氨酯活动的存在。衰落和阴影可以估计信道条件困难,因此频谱感知不能可靠地确定聚氨酯地位只基于当前传感槽(17]。然而,基于机器学习频谱感知是隐式地学习周围环境的能力。基于机器学习的频谱感知的另一个优点是它可以可靠地检测聚氨酯活动不需要任何先验知识的环境。

机器学习算法分为两种类型:监督和非监督。再(资讯)是一个监督机器学习算法。在资讯、培训实例(光谱遥感特征向量)被用来形成K邻域类。一个测试实例然后分为基于多数表决K的一个邻居。投票是基于统计信息获得的发现之间的距离测试实例和训练实例。距离计算准确,真正反映分类类(18]。然而,最简单的机器学习算法,不仅适用于低CR用户的需求。然而,也是最稳定的机器学习算法(19]。

作者在20.- - - - - -22)考虑频谱感知的资讯。在[20.]作者视为一个二元假设检验,提出了优化两个类之间的距离。他们的方案的缺点是,他们认为不痒的决定组合和使用一次性光谱遥感不能与地面的现实。在[21),然而,使用传统方法作为计算机制来填补这一空间电视白色空间数据库建设。资讯的使用仅限于重建丢失的光谱传感点,因此,然而作为分类器的全部能力不是剥削。在[22),作者发现了一个全球能源组合不同常规的检测阈值决定。这些规则结合使用不同的分类方案进行分类测试实例将信号强度作为特征向量。作者在22)也使用资讯作为计数机制,此外,全球决策组合规则不考虑个人的重量CR用户和他们的表现历史。

作者在23)使用多个天线集中光谱遥感在[24方案基于多个能量探测器和自适应多阈值提出了合作频谱感知。地区区域网络,提出了一些改进的能量探测器(25,26]。作者在25]提出了一种两级能量探测器,探测器的决策融合在决定设备在[26多个天线是用于光谱遥感在地区区域网络。在[27)固定能量检测器和自适应双阈值被用于合作频谱感知。在[28]基于多个天线能量探测器光谱遥感提出了利用自适应双阈值在[29日)比较周期平稳检测技术和基于自适应双阈值的能量检测方案。

在本文中,我们提出一个基于机器学习的可靠的频谱感知算法FC使用体重依赖型剂量决定组合规则。在训练阶段,CR用户执行光谱传感、基于一个应答信号(ACK)和全球的决定,检测报告是分配给一个传感类。传感类对应一个CR用户的行为在一个变化的环境是由于改变聚氨酯的活动。这些传感类可靠地反映PU的活动和CR用户的行为反应。后对周边环境收集足够的信息,分类阶段就开始了。在训练阶段CR用户形成一个本地的决定。当地quantized-hard形式决定。CR用户发送的地方决定足球俱乐部和足球俱乐部需要一个全球的决定。CR用户保持沉默或根据全球传播的决定。如果CR用户发送和收到ACK下次槽然后传输成功。 Based on the global decision and the status of ACK signal sensing classes are formed. The training phase is over when enough training data for the sensing classes is gathered. In the classification phase, the KNN algorithm is used, where the sensing classes obtained in the training phase are treated as neighbors for the test instance, which is the current sensing report. The Smith-Waterman algorithm (SWA) is used to accurately find the distance between the current sensing report and the neighboring classes. Based on quantitative variables like the conditional probability and posterior probability, which are calculated through KNN, the current sensing report is classified into one of the sensing classes, corresponding to either the absence or presence of the PU. The local decision is then reported to the FC, where the local decisions of all CR users are combined to make a global decision, taking into consideration the reliability of each CR user.

该方案使用量化的信息而不是不痒的决定组合方案,提出了(30.]。频谱是感觉到多次传感槽,使得该方案更可靠因为时间多样性频谱感知过程是根据无线信道变化迅速。该计划提出了(30.)是基于一次性光谱遥感虽然我们添加一个验证机制的频谱感知的决定是没有聚氨酯活动。该方案的分类问题是一个multilabel当前频谱感知报告分为八个不同的类。这八个不同的类属于要么假设。但二进制假说到子类的划分使该方案更准确地分析聚氨酯活动。此外,该计划提出了(30.)使用传统方法的资讯作为计算机制。另一方面,我们在该方案使用后验概率来找到最近邻和利用资讯来计算先验概率和条件。

(参考的31日),然而,只是用于白色空间数据库中数据恢复机制多数投票。的分类问题31日也是一个二进制和资讯决定一个标签基于多数相邻数据点的标签。提出的频谱感知方案不同于(31日]在量子化的能级是用来训练分类器,然后检测报告是用来找到类标签当前传感的报告,发现它们之间的距离。而不是多数投票,我们使用一个有效的测距算法,均为算法(SWA)来计算当前传感报告的相似性和培训报告。

Mikaeil等。提出了不同的分类方案,通过不同的融合规则[工作阈值计算22]。在本文中,我们使用一个不同的融合规则融合中心考虑的重量不同的CR用户前一个全球的决定。的焦点(22)是找到不同的方案和资讯的阈值作为一个分类方案。另一方面,方案,融合规则利用之间的距离测试报告和培训报告本质上在CR用户级别和FC每个CR用户的历史准确性也考虑在内。通过这种方式,全球融合规则的FC利用培训报告以及历史的每一个CR用户的性能。因此,全球融合规则是更加健壮和可靠的。

光谱遥感已纳入卫星通信,5 g以及再分配方案。频谱日益增长的需求使得光谱传感新一代的通信技术的关键。作者在32未来宽带satellite-terrestrial通信]采用CR更广泛的框架下对5 g,而作者在33)采用联合频谱感知和通道选择优化基于认知无线电的卫星通信。聚氨酯作为受雇于CR的概念网络用于卫星集群通信的存在主要卫星系统是检测使用光谱遥感的概念j . Min et al。34]。MIMO系统的频谱效率的混合架构进行了(35)通过调查系统中最优的用户数量在[36下行的上限频谱效率和能源效率进行了大规模的咪咪系统与混合架构。

剩下的纸是组织如下:部分2描述了系统模型;部分3描述了资讯的频谱感知方案由算法,SWA、培训阶段,并详细分类阶段;部分4描述了合作频谱感知和全球决定组合的细节;部分5讨论了结果;和部分6总结了纸。

2。系统模型

在本节中使用的能量检测方法和使用的量化方法进行了讨论。本节处理形成的检测报告是用于训练阶段和分类阶段的频谱感知方案。我们考虑 CR用户不断意识光谱报告当地决定俱乐部通过专用控制信道(4]。CR用户传送信息是否存在一个光谱洞是由俱乐部决定。CR用户可以在给定的时间传送或接收;即。,they operate in half-duplex mode. CR users are assumed to be close to the PU and outside the range of other PUs. The system model is presented in Figure1

CSS介绍空间的多样性,而颞多样性介绍传感除以minislots槽。我们考虑一个开槽时间框架结构,第一个槽用于光谱传感和第二槽用于传输CR用户数据。作者在37]研究了最优感知槽持续时间。在这工作一个次优的传感槽持续时间被认为是。遥感的结果可能会改变当衰落和阴影现象。时间计数器这些影响的遥感光谱多样性 次感应槽。在这部作品中,传感槽进一步分为minislots。在每个minislot,感觉到独立频谱。可以提高传感性能如果minislots因此传感的数量持续增加,但结果在较小的时间传输插槽。作者在37]研究了最优数量的minislots crn sensing-throughput权衡。根据(37),介绍了分集接收传感过程传感通道在minislots独立在同一个感应阶段。在我们提出的方案这些minislots的结果组合起来形成一个传感报告后用于分类阶段,鉴于部分3所示。2。检测报告以前用于(8)计算每一个CR用户的信任CRN由恶意攻击用户。在这个工作传感报告是用来训练分类器,然后用于当前遥感分类报告。半双工CR用户系统被认为是在传感槽CR用户保持沉默。如果在传感位置决定,PU不在那么CR用户传输传输插槽;否则CR用户保持沉默。当一次性的时间框架,它由传感位置和传输插槽,又在CR用户感知频谱。每个minislot能量检测中使用。接收到的能量 th传感槽的 th CR用户的 th minislot, ,可以表示为 在哪里 , minislots总数, jth能源样品收到了kth minislot的 th传感槽的th CR用户N0是样品的总数,由 TB在赫兹检测时间和信号带宽,分别。样品收到的数量在一个特定的minislot取决于感知频谱的带宽和感知时间。接收到的信号 在缺乏PU ( )和聚氨酯的存在( )给出如下: 在哪里 是为加性高斯白噪声(AWGN)和 jth PU信号收到的样品kth minislot的 th传感槽的th CR用户。

这是所示(37),如果没有主信号的概率密度函数的接收信号的能量th CR用户( )是一个中心卡方分布的意思 和方差 ;否则它是一个非中心卡方分布的意思 和方差 ,可以估计 在哪里 是信号噪声比(信噪比)的接收信号th CR用户。

当样品的总数,N0收到了,很大,能量信号, ,在两种假设都 可以用一个近似高斯随机变量。在我们的方案中,能量信号在每个minislot量化成离散的区域。多个比特代表相应的区域被传输到俱乐部,而不是传输连续能量变量(软决定)或一个(一个艰难的决定)。M-level量化器的一个输入变量是由一组量化和一组量化阈值水平。这些量化阈值确定的准确量化水平代表实际的接收信号。

摘要slotted-frame结构被认为是一个框架是一个单位的访问范围。第一个槽,称为感应槽,在每一帧用于光谱决定是否感觉PU是否活跃。如果决定在传感槽PU不在,CR用户传输的传输插槽。否则,他们保持沉默的时间传输插槽。传输插槽的持续时间结束后,CR用户将重新开始遥感光谱。

因为无线信道变化迅速,频谱是感觉到多次,而不是只有一次,考虑改变行为的通道。为此,本文分为minislots传感片。在每个minislot,频谱是感觉到独立并根据结果,形成感应报告。检测报告是根据每个minislot的量化决策,形成了(4),稍后将用于分类阶段。对频谱感知,能量检测是利用样本收到了能量在哪里总结并与阈值和基于比较结果决定,PU是否存在或缺席。

在这个工作量化水平的数量是4,也就是说, 。这些水平或量化区域代表Z1,Z2,Z3,Z4。区Z1Z2代表低能量或缺乏PU,Z3Z4代表高能或聚氨酯的存在。给出量子化能量区 在哪里 代表的量子化能量kth minislot的 th感应的槽th CR用户和 , , 是区分不同的阈值量化区域。量化的集合区 和阈值的集合 , , 方程(4)表明,以防H0,平均能量th CR用户的kth传感槽( )可以被量化成Z1Z2在的情况下H1, 是量子化的到Z3Z4。根据我们的量化方案Z1Z2代表H0Z3Z4代表H1

在每个传感位置,检测报告形成,包括符号属于。的报告th CR用户的wth传感槽称为传感报告和由 ,它包含n元素属于(检测报告形成进一步解释部分3所示。1)。这个报告作为特征向量的机器学习算法。在训练阶段,这个报告是分配给一个传感类基于ACK和全球的决定,这将在详细讨论部分3所示。1。下一节描述了频谱感知算法在CR用户级别。

3所示。频谱感知

提出的频谱感知方案旨在改善聚氨酯检测功能在不同环境下提高频谱孔检测。第一目标保护聚氨酯的有害干扰的数据,是最重要的约束指定的IEEE 802.21标准的访问电视空白(38]。第二个目标有效利用频谱访问机会,使CR用户传输数据。为th CR用户的wth传感槽、通道可用性是决定的基础上能量向量( )。正确的地图 聚氨酯活动,PU的行为是习得的。因此能量向量在我们的案例中是类似于一个特征向量中机器学习。

构造一个分类器,即。,to classify the current sensing report into channel available (H0)或信道忙(H1)类,一个训练阶段是必要的。每一个CR用户存储能量向量的大小W,在那里W的长度是培训或训练阶段。在训练阶段,slotted-frame结构用作解释部分2。节中解释2,一次性插槽有感应阶段和传播阶段。在训练阶段有W插槽。这些向量的输入分类器在分类阶段,在目前的检测报告是与以前相比存储感应之间的报告来决定H0H1

在我们的方案中,首先是CR用户学习PU的行为通过映射生成的量子化能量向量,称为感应报道,PU的准确状态。发现的真正地位聚氨酯通过ACK和当地的可靠的组合决策的CR用户由俱乐部决定。CR用户培训阶段的功能不同于它的功能在分类阶段。在训练阶段,遥感报告根据实际活动被分配到传感类聚氨酯和相应的行为的CR用户。在分类阶段,检测报告使用资讯分为传感类之一。准确地计算电流传感报告之间的距离和现有传感类的成员,SWA使用。部分3所示。1描述了训练阶段,而部分3所示。2描述了分类阶段。

3.1。培训阶段

在这个阶段,通过测量学会操作环境的行为CR用户活动的改变聚氨酯。的th CR用户生成检测报告 ,使当地的决定的基础上平均收到能在当前传感槽,发送本地决定FC和基于FC和ACK的状态的结果赋值给一个传感检测报告类。本节将详细介绍这些步骤。

让能源收到 th传感槽的th CR用户为代表 这是作为 在哪里 是由(1)。

当地的决定的th CR用户的 th感知训练阶段是由槽 ,是由(3]

当地决定发送到FC,结合当地决定所有CR用户和呈现一个全球的决定。在训练阶段,使用简单多数规则决定的规则组合。符号(量子化区)报告的大部分CR用户决定了全球决定FC。我们可以看到从(6在训练阶段),当地决定quantized-hard形式,因此,俱乐部也在全球决策quantized-hard形式。CR用户的检测报告,如图2。当地的传感报告是高于前一节中解释。在图2,第一个六minislots构成当地检测报告。我们可以看到报告的每一个元素属于。每个CR用户,每个传感位置传感(当前遥感报告表示 )是形成,当地的决定是根据(6)。

接下来,全球决定返回到CR用户。CR用户传输或基于全球决定保持沉默。如果全球决策是CRH0这可以通过随调ACK CR发送的信号接收器的CR CR接收机接收传输后发送者。覆盖认知无线电网络被认为是,所以,没有干扰的PU通信。应答信号的影响聚氨酯沟通只有当频谱感知结果是错误的,事实上,现实的H1。基于当地的决定和全球的决定,可能有8例CR用户和传感类根据我们的系统模型。下面给出这些可能的情况称为观测。

观察1。当地的决定( )是Z1也和全球的决定Z1。CR用户传输数据。如果收到ACK,这意味着感应的结果是正确的和实际地位的聚氨酯H0。通过应答信号,PU的真实状态。相对应的传感报告这一决定( )存储在一个类贴上R1在的情况下它存储在没有应答信号R2

观察2。当地的决定( )和全球决策Z1或全球决策Z2和当地的决定Z1。CR用户传输,但ACK是没有收到,这意味着传感决定是错误的,聚氨酯是可用的。CR用户将存储 在一个类标签R2。如果接收到应答信号存储在R1。如果当地的决定Z1和全球的决定Z3Z4,然后 也将存储在这个类中。

观察3。当地的决定( )是Z2也和全球的决定Z2。CR用户遵循过程中解释的观察1。如果收到ACK,传感的决定是正确的,PU不存在。 存储在一个类标签吗R3,否则它存储在R4

观察4。当地的决定是Z2和全球的决定Z1 CR用户传输,如果没有收到应答, 被分配到类标签吗R4,否则在R3如果当地的决定Z2和全球的决定Z3Z4,然后又 将存储在类贴上吗R4

观察5。当地的决定是Z3也和全球的决定Z3。在这种情况下就没有传播。的真实身份PU因此不能被人知道的。 将分配给一个类贴上是哪一个R5。检测报告也将存储在类R5如果全球的决定Z4和当地的决定Z3

观察6。当地的决定是Z3但全球决策Z1Z2。CR用户将传输。如果收到ACK, 将存储在一个类标签吗R6,否则它将存储在R5

观察7。局部和全局决策Z4。就没有和传播 将存储在类贴上吗R7 也将存储在吗R7如果当地的决定Z4和全球的决定是Z3

观察8。当地的决定是Z4,但全球的决定Z1Z2。CR用户将传输。如果收到ACK, 将存储在类R8。如果没有收到应答, 将存储在R7

在上面的观察中可以看出ACK信号是在全球决策时使用H0。当全球的决定H1CR用户不传送,因此ACK信号不能被用来确定地面现实。所以,当H1是全球决定FC CR用户存储当前传感类报道R5R7与当前传感决定不能以任何其他方式验证比PU造成干扰的传播风险。

观察图给出了决策树形式3。观察不来自一组的决定,没有统一的决策树的根。给出了决策树在四个分区取决于当地的决定。当地的决定是缩写为LD和全球决策,GD图3。图3(一个)对应的当地的决定Z1和观察12得到了。图3 (b)对应的当地的决定Z2和观察34得到了。数据3 (c)3 (d)分别对应于当地的情况下决策Z3Z4和观察5,6,7,8得到了。

这些观察帮助CR用户了解周围的环境和应对环境和其行为也给CR用户历史数据,可以使用与当前传感行为更可靠地预测PU状态。这个过程可以看作是合作学习,不仅是个人CR用户考虑,而且其他CR用户的影响是通过全球注册的决定。这增加了学习过程的空间多样性,接收器有更好的信号噪声比(信噪比)的条件下可以驱动CR用户提供贫穷的信噪比条件下的行为。

训练阶段运行直到CR用户充分训练在周边环境的行为,包括改变信噪比条件和改变聚氨酯的行为。衰落也可以暂时影响信号,从而接收到的能量由于传感环境不断变化。培训计划开发考虑的衰落,因此存储感应的结果报告,可能是褪色或坏感应相应的类别。随着学习是基于FC ACK和可靠的决策相结合,基于类的培训更可靠地反映传感环境和聚氨酯的活动。褪色或坏的结果传感在CR用户级别以上的观察中发现,地方决策不同于全球决策或没有收到ACK时。

培训本地数据被收集在每个CR用户培训阶段。机器学习技术的性能取决于大小的训练阶段。随着培训规模的增加,性能也得到了提高。增加数量的CR用户聚氨酯覆盖下的面积更大。因为我们的培训模型包含全球代理根据决定,还通过应答信号地面现实,训练阶段能够准确地知道PU CR用户的行为活动。与大量的CR用户,每个CR用户可以反映现实的培训课程通过全球的决定。拥有大量训练阶段,CR用户的行为性质不同聚氨酯活动也可以准确地知道。在传统的机器学习技术,培训阶段可以收集足够数量的训练数据环境。知道的确切性质PU活动实际上是不可行的,因为无线信道的随机性质和聚氨酯的活动。但是当将显示在模拟,给定一个训练阶段的规模足够大,系统检测性能可以收敛即使在信噪比很低。

4(一)介绍了框架结构在FC聚氨酯在训练阶段存在的决定。CR用户在这种情况下保持沉默在传播阶段。不同的操作在感知阶段发生第一次当地的决定,然后发送本地感知决定通过CCC FC。FC结合本地感知决策和决定是否聚氨酯存在或缺席。如果俱乐部决定,PU不在那么CR用户传输和听到应答信号在同一信道上传输已经完成。CCC不用于建立CR用户之间的联系。而是CR用户之间的通信发生通过授权的频谱的聚氨酯和访问的CR用户如果PU缺席。图4 (b)礼物当PU缺席的时间在训练阶段。应答信号传感的基础上报告的传感槽被分配到类所定义的上面的观察。框架结构不同训练阶段的分类阶段。在训练阶段传感类的基础上更新状态的应答信号有助于训练CR用户准确地反映了现实。

3.2。分类阶段

在前一阶段,信息收集关于CR用户行为的操作环境和应对变化的环境。学习环境是特别困难的CR网络的性质。因为吵闹的传感环境,CR用户只获得部分的观测环境变量。此外,CR用户也必须传输数据。这导致感知时间和吞吐量之间的一种权衡:感应时间越高,越准确的感知结果,从而更高效的学习。因此,部分可观测性和限制感应时间复杂的学习过程。第三个限制是聚氨酯被认为是自主的。CR用户可能没有任何先验信息的PU行为,其操作特点、RF环境、干扰水平,或噪声功率分布。

我们的学习计划能解决这些问题。部分可观测性是通过将其他CR用户的行为纳入学习过程通过全球的决定。ACK使CR用户更好地了解操作环境和把遥感观测到各自的类更准确。学习计划不需要先验信息,可以有效地映射传感性能的改变聚氨酯的活动,从而使CR用户更可靠地检测聚氨酯。

提出了一种框架结构在分类阶段在图5。在当地的决策阶段,频谱感知和创建一个检测报告。前六minislots在当地决策图的一部分5代表当地的检测报告。第二部分是分类阶段讨论的部分3.2。3。的最后一部分本地决策槽报告阶段,当地决定报道的FC,全球决定返回和CR用户相应地采取行动。传播阶段遵循当地的决策阶段。

在本节中,我们将详细的当前传感报告分为一个培训课程。资讯,机器学习算法,用于准确分类当前实例的感应,从而可靠地检测聚氨酯类活动。部分3.2。1介绍了资讯的算法。

3.2.1之上。再算法

资讯传播变为免费机器学习算法,将观察分为几类基于定量变量之一。资讯传播变为免费的方法,适用于认知无线电的背景。资讯分类一个测试实例,在我们的案例中当前传感节中描述的报告3所示。1成的邻国之一类,多数投票。投票可以修改计算任意两个之间的距离传感报告。在CR的背景下网络,它是非常不可能的,任何两个传感报告是完全相同的,所以我们必须测量它们之间的相似性。

分类平面分为许多邻居和当前的距离传感报告每一个邻居发现。为了简单符号让我们表示感应电流传感槽的报告th CR用户 起。让 的距离, 代表了邻居,或获得的传感类部分3所示。1,由 计算到每个邻居的距离代表H0H1。基于计算距离,当前传感报告是机密H0H1。部分3.2。2显示距离计算和部分3.2。3显示了分类使用资讯的过程。

3.2.2。均为算法

均为算法(SWA) (39)是一种局部比对算法,计算出一个精确的两个向量之间的距离。检测报告在我们的案例中可以不同于彼此由于空间和时间的多样性,所以投票方法通常用于资讯,这是找到一个匹配或不匹配的基础上,在这里不适用。相反,我们专注于测量传感报告之间的相似性,利用SWA计算电流传感报告之间的距离和传感类。

SWA包含三个阶段:培训、矩阵填充和追溯。这三个阶段简要描述如下。

培训:一个传感报告水平和其他垂直排列。最上面一行,最左边的列都初始化为0。

矩阵填充:让传感报告安排垂直 水平和传感报告安排 的每个元素 相比之下,每一个元素的吗 和分数 根据矩阵填充方程计算如下: 在哪里 指数的元素的报告吗 和报告 ,分别 pth元素的报告 , th元素的报告 , 是两个字符之间的相似度奖励, 点球的差距(不同)决定不匹配的程度 处罚。不同的奖励和惩罚值定义为不同类型的序列和应用程序。在这里,我们使用直观的值基于实验结果。处罚决定的差距 和相似性计算奖励

重要的是要注意这一点 ,这意味着相似的奖励和处罚有差距交换性质。两个感应之间的相似性得分报告 获得通过的最大元素得分矩阵( 的相似性得分 th感应报告相比jth传感报告给出

SWA的追溯:第三阶段叫做追溯和对齐序列执行基于分数计算在“矩阵填充”阶段。因为我们的目标是找到相似性得分,追溯阶段不需要在我们的工作。

3.2.3。分类

作为传感解释报告n元素属于。检测报告(x)必须分为传感类之一,作为邻居的x。候选人的邻居x 和包含所有类部分3所示。1这样 和每一个CR用户有自己的版本的传感类。

当前传感报告相比,每个传感的每个成员属于类 会员数向量是由 的每个元素 是比较的结果吗xj届的成员lth传感类计算的(10)。让 是感应的事件报告x属于类l 是感应的事件报告x不属于类l。此外,让 的事件 元素 大于一个阈值。那么后验概率( ),目前的检测报告x属于类l发现是 基于后验概率,当地决定的th CR用户的rth传感槽,为代表我右,给出 在哪里P0是感应类的后验概率的总和代表H0和给药 是感应类的后验概率的总和代表H1和给药

4所示。合作频谱感知

FC收到当地的决定D在哪里 。在CSS, CR用户的感知能力不同导致不同的本地感知结果(40]。在该方案中,我们使用一个体重依赖型剂量决定在FC组合。每个CR用户分配一个重量是基于其有效性。

部分全球决定俱乐部,为代表 ,是由不含的结果吗th CR用户 在哪里 CR用户报告的数量吗H0不包括当地的决定th CR用户和给药 在哪里 指标函数为 ,是由

另一方面, CR用户报告的数量吗H1不包括当地的决定th CR用户和给药 在哪里 指标函数为 ,是由

部分全球决策是发现所有CR用户。当地的决策是通过多数决定原则,然后结合 并且可以表示为 在哪里 CR用户报告的数量吗 CR用户报告的数量吗 基于(15)和(20.),重量为每个CR用户, ,是计算

累计重量为每个假说 在哪里 然后计算 在哪里 是由 最后用全球的决定 和计算

全球决定回到CR用户和CR用户传输或根据全球决定保持沉默。

在哪里 主要用户之间的信道增益,th CR用户中kth minislot和 是指从PU接收信噪比。如果假设系统的系数是已知的,则系统给出概率nonfading渠道下的假警报(37] 在哪里 是免费的标准高斯分布函数,也就是说, 系统的目标检测概率。检测的概率和概率的假警报方案都取决于传感的概率陷入特定的量化区域和报告的数量minislots传感槽。目标检测概率和目标概率的假警报的数量取决于量化区域,可移植性,在一个特定的假设传感的决定将会在一个特定的量化区域和每个量化带的重量。调整量化阈值的最优量化阈值。的基础上量化参数目标检测概率和虚警进行了优化。合作频谱感知目标检测概率,如果量化区域的重量是相同的,即,每个量化区域同样有助于最终决定组合,可以作为41] 在哪里 是CR用户在本地传感的数量决定区 , 是最大的整数比m, 的概率是有本地传感决定量化区域

系统检测概率可以作为(37] 在哪里 是假警报的系统目标的概率,是由(41] 的概率是有本地传感决定量化区域

5。结果和分析

在本节中,我们观察到的行为,我们的方案,比较其他方案通过的概率等系统参数检测、错误的概率,概率谱漏洞剥削。在[8),引入多个比特的影响报告和遥感光谱多次在同一感应阶段研究的方案利用报告显示多个比特和多个minislots是健壮的各种攻击。作者在3,37)也表明可靠性获得使用多个minislots带来的。CR用户的数量是5,迭代的数量是1000,传感槽时间是1 ms,采样频率是300千赫,能量样本在每个传感插槽的数量是600。聚氨酯的空闲的概率是0.5。信噪比范围从-25到-10分贝。当CR用户的数量很大,集群形成的光谱传感降低开销。作者在42)考虑集群感知频谱CR用户的数量在每个集群是五。当集群被认为是,簇首的CR用户把他们的本地决策减少直接报告发送到FC。考虑更多的CR用户,需要采用集群的概念。然而,它是超出了本文的范围。然而,根据(42]随着集群的数量,因此CR用户的数量增加传感性能也得到了提高。使用空闲的概率为0.5在文学为了公平([8,42])。如果空闲PU的概率增加,它将提供更高的传输CR用户的机会。因此,聚氨酯在报纸上的空闲概率为0.5 CR对维护公平和聚氨酯系统。聚氨酯的空闲的概率是相等的概率PU的活动,目标探测概率通道没有衰落将0.8在-20分贝的信噪比。本文探测概率的设置具有更高活性的概率0.5的PU(作者在37)被认为是低活性的概率聚氨酯0.3)担保的保护聚氨酯数据。我们测量性能的方案也在AWGN信道和衰落信道通过观察我们的计划的行为还有其他计划行为通过不同信噪比条件不同的系统参数。强烈影响系统性能的训练阶段,在这个阶段,传感类发展。更大的这个阶段,更大的训练实例的数量,这意味着当前的传感报告更多类似的报告来配合。我们把该方案有两个变种。在一个训练阶段是100次迭代和其他330次迭代。这些计划与方案的CR用户一比特的地方做出决定和当地的决策相结合的FC通过使用传统的或规则。

在这篇文章中,误差的概率(体育)给出 在哪里Pd检测的概率是Pf的概率是假警报,P(H0)的先验概率H0,P(H1)的先验概率H1。检测的概率(Pd)被定义为 和假警报的概率(Pf)被定义为 H的真正地位PU和= 0和1的随机生成的流大小等于迭代的总数。一个代表PU的存在,而零代表了PU缺乏。的符号 意味着在下标的次数条件满足。光谱洞开发为代表的概率Pnf并且可以表示为

不痒的决定给了最优组合传感性能(4]。在[4],它也表明,艰难的决定组合给劣质结果只有一比特开销而柔软的组合会增加很多开销。一比特的困难的组合方案,传感信息被丢失在当地的决策,因为只使用一个阈值。通过使用多个阈值,遥感信息可以减少损失,导致更好的性能,更多的开销。在[7],它也表明,使用两位报告当地的决定可以显著提高传感性能。使用两个比特的有效性(4量子化水平)展示了完美和不完美的报告渠道。在[43),h . Sakran et al。利用三位报告当地决定FC。性能改进被证明是比使用两位报告当地的决定。总之,很明显,取舍之间存在频谱感知性能和开销,当我们设计量化水平。因此,本文我们主要关注应用机器学习算法为均为算法不痒的决定光谱传感通过考虑四个量化的情况下的水平。考虑量化水平超过4水平,整个问题公式化观测等部分3所示。1和分类类必须被改变和重新设计。因此,仿真结果是有界的情况下四个量化水平。

在训练阶段检测该方案的概率等于多数决定原则,使用量化。在机器学习技术,该方案的性能依赖于分类阶段。在模拟、检测的概率是由训练和分类的阶段。同样,训练数据的方案需要培训资讯分类器,分类器的性能是取决于训练数据的大小。该方案利用训练数据多数决定原则。因为恶意用户或异常并不认为,多数决定原则通过多数投票和相应的性能将取决于当地传感CR用户的决策。训练阶段结束时,分类器将有充足的数据可用于聚氨酯的改变人们的行为,并将训练。

6显示了在AWGN信道系统检测性能。更大的训练阶段的方案优于其他两个方案。该方案与一个较小的训练阶段具有相同的检测性能在低信噪比或规则制度。原因是检测报告在低信噪比的政权没有大彼此距离。接收到的能量在两种假设都在低信噪比政权相互变化小,因此,用更少的训练实例方案失败学习环境更可靠。随着信噪比的提高,该方案与较小的训练阶段的结果更可靠的频谱感知比传统方案。图7显示计算的误差性能(29日)。在这个图中,也可以看到,该方案更大的训练阶段误差的概率很低,即使在低信噪比的政权。较小的方案培训阶段收敛于一个更大的训练阶段更好的信噪比条件下,这表明,即使有一个较小的训练方案的大小会导致更可靠的频谱感知比传统方案。

8显示该方案利用光谱洞的能力被定义为(28)。利用可用的传输数据的机会是最高优先级从CR用户的角度。即使在糟糕的信噪比条件下我们的方案使CR用户利用数据传输的机会。较小的方案培训阶段落后于更大的信噪比条件差,但训练阶段收敛于该计划好的信噪比制度更大的训练阶段。

在该地区的高信噪比、检测报告,形成更好的反光PU的活动。可以提高传感性能在高信噪比的地区政权以来,聚氨酯信号将接收信号的较大的部分,而添加的噪声。也就是说,当信噪比变大,较少的训练样本,进一步训练窗口的小一号需要训练分类器。因此,当信噪比提高,培训规模较小导致同样的性能。另一方面,该地区较低的信噪比,更大的培训规模和较高的大小需要准确地反映PU的活动。所有这三个方案显示性能趋势相同,但是在不同的信噪比水平。或规则的常规方案中最佳的检测性能,最放松标准声明,它使用聚氨酯存在与否的传统规则。然而,这意味着数据传输或规则不能有效地利用机会。这些数据显示,我们的方案可以更有效地保护聚氨酯数据以及数据传输提供更多的机会。

9显示了检测方案的性能在衰落环境中。衰落影响接收信号的力量,从而有效能源所需样品的数量决定PU的状态。nonfading环境中振幅增益通道的确定性在信道的衰落信道振幅增益变化(17]。因此检测的概率依赖于瞬时信噪比。衰落的影响在详细调查了频谱感知的性能(17]。而不是后(2)和(3)建立一个模拟环境,我们沿着一条路径损耗模型将消失了(44]。我们假设路径损耗模型的信号衰落成正比 ,在哪里 是聚氨酯和CR用户之间的距离 。聚氨酯和CR用户之间的平均距离为20米。我们与更大的训练方案的性能优于阶段或规则5%时,信噪比是-23分贝,但当信噪比提高至-16分贝,提高约为20%。该方案的检测性能优于或规则的一个更大的利润,当信噪比情况有所改善。从图可以看出,或规则有一个非常可怜的检测性能在衰落环境中尽管它有最佳的检测性能在传统的融合规则。图10显示了错误衰落环境中方案的性能。可以看出,随着信噪比增加,错误减少。在-25分贝,错误概率是0.1以上。由于褪色,或规则的错误概率为0.35,这是非常高的相比,我们的方案。

11显示的数量的影响CR用户合作频谱感知的性能在衰落信道下一些CR用户经历深衰落,因此训练数据不可靠。反映的影响越来越多的CR用户衰落条件需要在nonfading通道性能随着CR用户的数量是相同的,因为训练数据少CR用户也可靠和准确地反映了PU活动。图中为每一个CR用户信噪比是不同的从-25年到-10年,然后平均概率的检测。例如,当CR用户的数量是6检测信噪比的多个值的概率不同,然后计算在-25年到-15年之间的均值计算概率是平均概率的检测。检测的平均概率为代表 显示的值是平均值 不能收敛于1。为每个值信噪比方案的系统运行1000次训练大小为100和300倍的方案培训大小为100。可以视为CR用户数量的增加超出了限制,在这种情况下超过10的改善意味着检测概率并不突然。因为的原因在本节第一段解释说,利用引入的获得可以通过增加集群的CR用户数量需要形成。而不是变FC结合了遥感决策时的CR用户的感知决定许多CR用户可能相似距离范围以外的计算部分3.2。2因此他们的报告将被拒绝。从图11可以看出,该方案的平均检测概率与更大的培训规模超过其他方案的性能。平均概率检测当用户的数量= 20达到0.8目标探测概率是在我们考虑本文在信噪比的-20分贝nonfading频道当CR用户的数量是5我们已经考虑。该方案达到最高意味着检测概率的0.7附近,或最高可以达到检测的概率小于0.6。

6。结论

本文提出了基于机器学习可靠的频谱感知方案。该方案从环境中学习,考虑到聚氨酯的真实状态。传感报告存储在合适的传感类然后当前传感报告分为传感类之一。基于分类的结果,PU声明现在或缺席。地方决策相结合的FC小说的一个组合方案,决定考虑CR用户的可靠性。机制同时在CR级别和FC级确保可靠的频谱感知。仿真结果表明,我们提出的方案具有更好的检测性能和光谱洞开发能力比传统的或规则。衰落影响检测性能,但是我们的计划成功检测到80%的次-10分贝信噪比甚至衰落环境中。

数据可用性

通过Matlab进行仿真。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项研究受到了基础科学研究项目通过韩国国家研究基金会(NRF)由教育部(2015 r1d1a1a09057077)以及韩国政府(MSIT) (2018 r1a2b6001714)。