使用gpu三重选择性MIMO信道模拟器

文摘

的方法实现三重选择性多输入多输出(MIMO)模拟器基于图形处理单元(gpu)。结果模拟器的实现是基于多个double-selective对于单输入通道发电机的输出多个输入和接收到的多个信号已经转化为了供应相应的考虑空间相关性的通道。这种方法的一个直接后果是提供的灵活性,它允许不同的传播统计指定每个输出通道,从而更复杂的环境中复制。结果表明,在某些特定的约束,三重选择性的统计MIMO模拟器是一样的那些报道的艺术。仿真结果表明改进实现,计算时间为8 650倍8 MIMO信道模拟器相比,顺序的实现。除了计算改进,该模拟器提供了灵活性为测试各种场景vehicle-to-vehicle (V2V)和vehicle-to-infrastructure (V2I)系统。

1。介绍

与日益增长的用户需求的快速传输大量的数据,有必要开发新的传输策略,因此,以验证他们的表现为了实现既定的目标。从这个意义上讲,多输入多输出(MIMO)模拟器近年来被认为是一个基本组成部分的新通信标准所接受长期evolution-vehicle (LTE-V)和vehicle-to-vehicle (V2V)技术。这是由于这样的事实,那可以利用空间的多样性和多径散射大大提高数据传输速率相比,对于单输入(输出)通信系统1]。因为它的相关性,几个通道的数学模型,因此提出了不同信道模拟器/模拟器为了证明MIMO-based通信系统的性能。

从这个意义上讲,所总结的2],MIMO信道模型可以分类以不同方式;最广泛的分类考虑物理模型和分析模型。物理模型考虑到电磁传播和环境下研究获取信道模型。此外,这些模型可分为确定性模型(3),geometric-based随机模型(4),或随机模型(5,6]。分析模型,另一方面,抽象复杂的电磁传播机制驯良的信道脉冲响应对MIMO信道建模。此外,分析模型可以分为propagation-based模型和correlation-based模型,在著名的克罗内克模型(7)和Weichselberger模型(8)符合后者的分类。这些模型是最常用的模型模拟MIMO信道由于其简单性和概念化的传播环境。

本文认为基于相关性分析模型,假定一个三重选择性;即每一对发射机和接收机天线的传播渠道提出了时间和频率选择性和空间相关性。这个模型被选中来捕获传播通道的性质和更高的精度。正如所料,这个三重选择性信道模拟器的实现非常复杂;例如,如果一个分布式天线系统组成发射机天线和接收机天线被认为是,那就是必要的实现独立的输出通道并行模拟器。这个数字输出通道的增加以及天线的数量增加。因此,图形处理单元和GPU-accelerated计算技术可以帮助管理MIMO信道模拟器的计算复杂度。

GPU-accelerated计算技术使用GPU与cpu,可用在负担得起的计算机或服务器。目的是为了加快科学计算和工程计算,等等。结果,一些工作相关的无线信道模拟器已经提出为了处理计算复杂度信道模拟器的实现(9- - - - - -12)和高要求的数字信号处理算法(13,14]。

在[9),作者提出了基于gpu实现,它使用的过滤方法开发一个双重选择性输出信道模拟器(频率和时间选择性)。在[10),一个完整的3 d基于gpu的beam-tracing传播建模方法在复杂的室内环境。同样,研究[11)提出了一种改进的路径损耗仿真将一个三维地形模型使用并行协处理器或gpu。此外,在[12)和引用,提出了选择了基于gpu实现,提高了计算处理时间和报告基于gpu实现的加速效果。然而,尽管许多基于gpu实现已报告在艺术的状态,一个完整的三重选择性衰落信道模拟器尚未在公开文献报道。完整的MIMO衰落信道模拟器和仿真器的例子可以发现在15- - - - - -17),但这些架构不利用三重选择性同时,或者他们的硬件配置较低数量的天线。

本文提出一种三重选择性MIMO信道仿真方法使用GPU技术;提出的方法将基于发电机的输出通道(9]。这个模拟器包括现象学的传播环境(时间、频率和空间选择性),已排除本模拟器由于计算复杂度。同样,介绍了实现信道模拟器的方法表现出足够的灵活性与不同的MIMO信道配置。

1.1。符号

大胆的上(下)情况下字母用于表示矩阵(向量); , , ,表示转置,复杂的转置(埃尔米特),装天花板函数,分别和期望算子。表示的元素th行和th列。的重新排序的列到一个列向量。是一个对角矩阵的元素是那些来自向量。表示长度的单位矩阵。最后,代表两个矩阵的克罗内克积。

1.2。组织

本文的组织结构如下:在部分2三重选择性通道的数学模型进行了分析。使用gpu实现这个数学模型的方法中描述的部分3。实现结果假设提出了不同的场景4。最后,一些结束语部分5这篇论文。

2。三重选择性通道模型

假设一个基带离散时间MIMO通信信道,提出了时间,频率,和空间选择性(triple-selective通道)。此外,考虑到这个通信系统是符合的发射天线和接收天线如图1。这个系统可以被设想为一个数组输出通道,包括发射机和接收机相关阶段提供相应的空间相关性的统计数据。不失一般性,如果是说的所有输出通道建模为FIR滤波器系数,然后MIMO系统在时间指数可以用数学表达如下: 在哪里与是一个向量包含每个天线收到的样品, 是矩阵提供了空间相关性由于接收天线,然后呢 , 相关的传播样本根据相关传输天线。

此外, ,在那里是一个向量组成的实际和过去的样品每个发射器,在哪里。矩阵定义如下: 在哪里从发射机离散时变信道脉冲响应的接收机。的值是选为 ,在那里是相对应的最大延迟子通道从发射机对接收机 , 的脉冲响应时间是发射机和接收机滤波器相结合,然后呢象征。

因此,可以考虑的MIMO信道的自相关函数可以表示如下:

这个通道模型可以解释为一种克罗内克模型综述(7,18),时间和频率选择性也被认为是。为了简化计算,自相关的分析相反,不影响通道下的统计分析。因此,自相关是它已经用在哪里事实上, ;此外, 的自相关函数是。如果它是假设所有的子信道是(我)不相关的,(2)大范围固定不相关散射(WSSUS),(3)瑞利,

然后,可以表示为从(6), 是为圆对称的复杂的高斯随机向量的自相关函数: 在哪里和都是对角矩阵,这样吗的力量吗从天线子通道的路径对天线与延迟和自相关函数评估在即时的区别为 ,在那里子通道的路径的数量吗来。

让是一个块对角矩阵,每一块的元素是由在哪里带限制滤波器的脉冲响应,例如,sinc或提出了余弦滤波器时间 , , 。

从(6), 是由在哪里都是块对角矩阵。

用(9)(5), 是

函数(11)是该模型的自相关函数(3)。可以观察到该模型提供了极大的灵活性,允许子信道有不同的统计数据,例如,不同的功率延迟概要(PDP)和能量多普勒谱(PDS)。作为一种特殊的情况下,如果所有路径的所有子信道被迫有相同的PDS, ,在那里自相关函数的路径。特殊情况下,如果厕所的模型被认为是,不同方位平面散射传播,到达接收器之间的到达角分布均匀 ,然后 ,在那里的贝塞尔函数0和订单吗是最大的多普勒频率。如果它也被认为是所有子信道具有相同的PDP组成的路径,然后和 ,在那里是一个对角矩阵包含路径和收益在计算(8)。然而,假设所有子信道的路径都有相同的延迟,然后(11)转变为(12),它伴随着模型提出了(16]:

3所示。GPU实现

模拟器的实现利用GPU通用计算的并行功能(GPGPU)和VexCL库的使用19]。VexCL是OpenCL / CUDA库由丹尼斯Demidov c++开发的。它支持正如,多平台计算和提供浮点矢量/矩阵操作的功能。VexCL使用向量表达式,自动并行处理所有设备。

仿真过程包括两个阶段:信道系数生成和数据帧的处理。这些阶段是描绘在图2。第一阶段对应的生成矩阵的元素(2);第二个阶段代表(1)。

3.1。复杂的操作

GPU的框架,比如OpenCL和CUDA,不提供复杂数据类型;最近的数据类型是2向量类型cl_double2OpenCL。因此,实施执行定制的烦恼功能复数的加法和乘法。这些函数被用于矢量表达式。实现的代码来执行提出了复数乘法和加法的清单1和2,分别。前面的函数接受两个向量用作复数。

VEX_FUNCTION(cmul cl_double2
(cl_double2) (cl_double2, b),
double2 c =
a.x b.x- a.y b.y,
a.x b。y+一个。y b.x
;
返回c;
);

VEX_FUNCTION(csum cl_double2
(cl_double2) (cl_double2, b),
double2 c =
a.x+b.x,一个。y+b。y
;
返回c;
);

3.2。信道系数代

过滤的信道系数需要随机数,生成频道水龙头与特定的PDS和相关性。

3.2.1之上。随机数生成

VexCL提供模板来生成随机数;他们是基于Random123 (20.,21]。模板支持Philox发电机家庭(基于整数乘法)或Threefry家族(基于Threefish加密)。可以生成均匀分布随机数随机模板。此外,有RandomNormal模板使用Box-Muller变换生成正态分布随机数。在这个实现中,烦恼:RandomNormal < cl_double2,烦恼::随机::threefry > random_numbers

作为一个c++函子。两个随机数生成向量噪音= random_numbers(烦恼::element_index (),123年),

在哪里噪音是一个向量的对双精度的浮点数,烦恼:element_index ()函数来得到吗随机数,和123年的种子是发电机。而不是使用双打,矢量噪声组成cl_double2数字;例如,一对双精度数字用作复数。

3.2.2。多普勒滤波器

生成复杂的随机数是通过一个过滤器,它提供了相应的时域统计数据。这种滤波器的传递函数的根在时域自相关函数为每个路径。作为一个特定的情况下,所有的路径在厕所的所有子信道跟踪模型中,这种滤波器的脉冲响应 ,在那里是伽马函数,滤波器的长度, 是一个指数,列举了系数(22]。为了执行噪声过滤,一个自定义函数,卷积,编码;它接收指向数组的2个向量对应噪声和多普勒滤波器系数,分别。清单中的代码用于此提出了卷积3,在那里我OpenCL的元素索引,x是噪音,y过滤器,特遣部队滤波器的长度,fS样品的数量是过滤、nS样品的数量,nP是路径的数量。并行卷积函数过程完整的噪声向量。它执行每个噪声样本的函数体。

VEX_FUNCTION_D(cl_double2卷积,
(我)size_t (cl_double2 ,x)
(双 ,y) (int,tF) (intfS)
(int,nS) (int、nP)、(csum)
(cmulscalar),
double2金额= 0.0,0.0 ;
inttmp1 =我+ (i / fS) (nS-fS);
inttmp2 =特遣部队 (我/ (fS nP) + 1) - 1;
为(size_t j = 0;j <特遣部队;j + +)
和= csum(和,
cmulscalar (x [tmp1 + j] y [tmp2-j]));
返回总和;
);

3.2.3。路径的收益

他们被实现为一个矢量和标量的乘积。每个路径都有自己的收获。

3.2.4。Upsampling

upsampling是二次插值法所需的值的数量的噪声向量。

3.2.5。利用代

由此产生的噪声向量,表示路径,与一个矩阵(例如,提出了余弦)。这种关系被实现为一个矩阵乘积。分布式天线系统有多个渠道;每个通道的相关性做了。

3.3。数据帧的处理

本节描述图的实现1和(1):一个发射机和接收机相关阶段和发射机的离散时变信道脉冲响应的接收机。

3.3.1。发射机的相关性

相关发射机一侧被实现为一个产品的数据和相关矩阵 ;后者的系数矩阵包含关联数据帧传输天线。

3.3.2。冷杉过滤器

通道的传输数据帧过滤系数, ,节中描述3.2。为了实现这一目标,实现卷积。清单中的代码用于此提出了卷积4,变量我OpenCL的元素索引变量x处理是一个指向数据的指针,该变量y是生成的信道系数,指针变量曾经是阀门的数量提出了余弦的变量nD是数据帧大小,变量我们是路径的大小,变量nT发射器的数量,变量nR是接收器的数量。

VEX_FUNCTION_D(convolution2 cl_double2
(size_t,我)(cl_double2 ,x)
(cl_double2 ,y) (int,曾经)(int,nD)
(int,我们)(int,nT)(int,nR),(cmul)
(csum),
double2金额= 0.0,0.0 ;
inttmp1 =我 nD;
inttmp2 =我/nD;
intext=我们委员会;
intlimt=曾经;
如果(tmp1 <曾经)
limt= tmp1 + 1;
为(size_tk = 0;k <nT;k + +)
为(size_tj = 0;j <limt;j + +)
和=csum(和,cmul(
x [tmp1-j + k nD),
y [tmp1 + j 我们+ ext (k nR + tmp2))
));
返回总和;
);

3.3.3。接收机相关

相关性在接收端被实现为一个产品接收的数据和相关矩阵 ;后者的系数矩阵包含关联数据帧,接收天线。

4所示。结果

在本节中,该模拟器性能的评价。为了实现这一目标,再分配通道被认为是,所有的子信道PDS厕所形状和相同赫兹。如果考虑载波频率为5.9 GHz,然后假定对应于一个场景,移动的速度是360公里/小时。同样,每个输出的PDP子通道是固定的如表所示1。pdp选择以证明模拟器的功能,pdp的和车辆对应测试环境通道和通道B中定义的(23分别)。矩阵的值和他们是固定的,这样做吗和分别为(24]。假设发射机和接收机过滤器是一个平方根余弦滚边系数为0.5和卷积的持续时间 ,这段时间是固定的象征 μ年代。根据表中给出的最大延迟值1的值,以及和 ,的参数等于水龙头。最后,米姆模拟器生成渠道假设1024个符号组成的数据帧。


子通道	延迟(nsec)






	获得(dB)

图3显示了一个使用提出了基于gpu的并行实现每米姆子通道模拟器,在每个subfigures提出相应的滤波器系数的实时变化,这与分配的PDS相关联。此外,可以观察到每个子通道满足PDP指定的规格。因此,pdp大延迟对应滤波器系数,观察到的通道实现和 ,分别。

绩效评估是使用个人电脑(PC)以下规格:(我)Fedora 25岁的64位(2)英特尔酷睿i7 - 920 (2.66 GHz)(3)12 GB DDR3内存(iv)显卡华硕GTX泰坦黑色6 GB内存和2880 CUDA内核。

为了评估时间性能,15个不同场景的三重选择性那通道被认为是: , , , , , , , , , , , , , , 。所有的情况下,假定所有的子信道配置相同的PDP(车辆测试环境通道B)和PDS(厕所赫兹)统计数据;此外,矩阵和有相同的价值观使吗为和。其余的模拟参数具有相同的值如前所述。

模拟进行超过100帧,每帧处理时间平均获得的所有帧。表2显示所需的时间来执行每个模拟器的街区。


模块	时间(%)

多个矩阵与矩阵的乘法	74.23
模拟	19.55
Upsampling	3.62
高斯随机数生成器	1.25
多普勒滤波器	.92
路径增益	点

图4介绍了执行所需的时间的比较时所有的考虑情况下使用基于gpu的模拟器,以及顺序这模拟器使用C语言的实现。为了更好的升值,结果绘制在对数刻度。

表3总结了时间消耗,也介绍了倍时间获得。这个增益系数的计算所需的时间顺序实现除以GPU实现。可以观察到的情况下来模拟器的复杂性增加,增益也增加。这是由于这样的事实:越来越多的业务需要,更好的利用GPU的并行资源。在剩余的情况下,获得约680;开始情况下,模拟器设备同时使用可用的资源。事实上,随着GPU考虑测试模拟器, 情况下是最复杂的MIMO信道,可以模拟;然而,如果硬件升级,然后可以解决此不便,开放的可能性的模拟更复杂的场景,例如,大规模的再分配。


米姆	GPU	顺序	倍
大小	实现(ns)	实现(ns)	获得

	1703年	504223年	296年
	2456年	1139590	464年
	3719年	2037134	547年
	5318年	3176655	597年
	7049年	4578364	649年
	9096年	6266204	688年
	12542年	8160310	650年
	18854年	12726565	675年
	26093年	18376942	704年
	35766年	25051177	700年
	50766年	32819589	646年
	62645年	41863632	668年
	75303年	51563394	684年
	91884年	62385816	678年
	110943年	74266271	669年

4.1。讨论

最近,几个信道模拟器的方法介绍了开放的文学。然而,这些实现是基于现场可编程门阵列(FPGA)的设备,他们被限制使用单一配置发达模拟器;也就是说,时间和频率选择的相关性是固定的。结果,设置新的渠道统计在模拟器上(新渠道传播条件)意味着实现硬件的设计。例如,在引入信道模拟器(16),生成时间选择性利用正弦曲线之和,这接近一个厕所PDS。这个模拟器使用随机数生成器来定义这些正弦曲线的参数的配置。因此,如果一个人希望生成一个通道有不同的PDS,那么这将意味着改变随机数生成器的概率密度函数。相比之下,改变模拟器在本文提出的统计数据有必要只有升级系数的过滤器,它允许快速设计的模拟器。

至于性能,即使报道FPGA实现实时操作,它们的数量限制的操作执行。例如,在[16)据报道,可以模拟MIMO信道的应该是有限的总阀门。与此同时,在该模拟器上执行的测试选择的GPU设备显示,最复杂的通道,可以模拟包含118656个总阀门( )。此外,在公开文献给出的实现实现PDP的性能考虑报道,路径发生在符号周期的倍数和所有的子信道共享相同的PDP。这与我们的基于gpu实现,可以处理具有任意位置的路径为每个子通道和不同的pdp。这一点值得注意,因为通信标准推荐pdp的路径分配时期独立的象征,而每个子通道的设置不同的pdp的灵活性使得它可以模拟更复杂的场景。如果限制报道模拟器被认为是假定,然后该模拟器可以产生更多的总阀门,因此MIMO信道与大量的天线。

5。结论

本文提出一种方法实现了三重选择性文中模拟器基于gpu。该模拟器认为多个输出模拟器的使用,也用gpu实现,以及输入和输出相关矩阵以提供相应的空间选择性。这种方法有很大的灵活性,因为每个输出子通道可以设置不同的统计数据,因此,可以建模更复杂的环境。结果表明,在某些考虑,该计划符合更具体的模型提出了艺术的状态。此外,在gpu上实现大幅减少执行时间与顺序的实现。实现结果表明上涨688倍。文中相比,顺序的实现。这表明这种方法将使更复杂的模拟输出通道是在更多的天线和最低刑罚执行的时间;通过这种方式,通信系统可以在更少的时间进行测试。同样,考虑模型允许不同场景的模拟,不被迫在每个子通道有相同的统计数据。因此,就有可能传播环境的模拟,并使其更适合V2I V2V通信系统。

附录

实现代码

参见清单1- - - - - -4。

的利益冲突

作者宣称没有利益冲突有关这篇文章的出版。

确认

这项工作是由墨西哥科学技术理事会(CONACYT)通过SEP-CONACYT基础研究计划(没有。241272)。

引用

a·戈德史密斯无线通信,剑桥大学出版社,纽约,纽约,美国,2005年。
g . l .存根移动通信原理施普林格,纽约,纽约,美国第3版,2012年版。视图:出版商的网站
m . Patzold移动广播频道威利奇切斯特,英国,第二版,2011年版。视图:出版商的网站
b .现场和m . Patzold mobile-to-mobile合作通信系统信道模型:一个国家的艺术评论,”IEEE车辆技术杂志》第六卷,没有。2,33-43,2011页。视图:出版商的网站|谷歌学术搜索
j·巴斯克斯卡斯蒂略,l . Vela-Garcia c·古铁雷斯和r . Parra-Michel”的可重构硬件架构下的瑞利衰落信道仿真任意散射条件下,“AEU -国际期刊的电子和通信,卷69,不。1,1-13,2015页。视图:出版商的网站|谷歌学术搜索
l . Vela-Garcia j·v·卡斯蒂略,r . Parra-Michel和m . Patzold”准确的硬件sum-of-cisoids衰落信道模拟器为各向同性和各向异性的移动无线环境中,“建模和模拟在工程文章ID 542198卷,2012年,12页,2012。视图:出版商的网站|谷歌学术搜索
j . p . Kermoal l·舒马赫彼得森k . i . p . e . Mogensen f . Frederiksen,“随机MIMO无线电信道模型与实验验证,”IEEE在选定地区通讯》杂志上,20卷,不。6,1211 - 1226年,2002页。视图:出版商的网站|谷歌学术搜索
w·Weichselberger m .去放羊,h . Ozcelik带领和e . Bonek“随机MIMO信道模型,联合相关的链接结束,”IEEE无线通信,5卷,不。1,第99 - 90页,2006。视图:出版商的网站|谷歌学术搜索
r . Carrasco-Alvarez j·巴斯克斯卡斯蒂略,A·卡斯蒂略Atoche和j . Ortegon Aguilar”衰落信道模拟器的实现基于GPU的计算技术,”数学问题在工程ID 237061条,卷。2015年,8页,2015。视图:出版商的网站|谷歌学术搜索
j . Tan z苏,y长,“一个完整的3 d基于gpu的beam-tracing复杂的室内环境传播建模的方法,”IEEE天线和传播,卷63,不。6,2705 - 2718年,2015页。视图:出版商的网站|谷歌学术搜索
z . b .厕所,p . k . Chong刘贤美李,W.-S。废话”,改进路径损耗仿真结合的三维地形模型使用并行协处理器,”无线通信和移动计算卷,2017篇文章ID 5492691, 11页,2017年。视图:出版商的网站|谷歌学术搜索
z Yun和m·f·伊斯坎德尔,”无线电传播建模:射线追踪原理及应用,”IEEE访问,3卷,第1100 - 1089页,2015年。视图:出版商的网站|谷歌学术搜索
罗杰,c .男友a·冈萨雷斯诉Almenar和a . m .维达尔,“完全平行的GPU实现fixed-complexity soft-output MIMO探测器,“IEEE车辆技术,卷61,不。8,3796 - 3800年,2012页。视图:出版商的网站|谷歌学术搜索
d . c . Zhang l . Liu Marković,诉Owall“异构可重构单元阵列对MIMO信号处理,”IEEE电路和系统I:普通文件,卷62,不。3、733 - 742年,2015页。视图:出版商的网站|谷歌学术搜索|MathSciNet
y Karasawa, k中田宏、g .太阳和r . Kotani”MIMO衰落模拟器开发与FPGA及其应用移动无线电系统性能评估,”国际期刊的天线和传播卷,2017篇文章ID 4194921, 15页,2017年。视图:出版商的网站|谷歌学术搜索
f .任和y . r .郑”小说模拟器为离散时间{MIMO}三重选择性衰落信道,“IEEE电路和系统I:普通文件卷,57号9日,第2551 - 2542页,2010年。视图:出版商的网站|谷歌学术搜索|MathSciNet
A Alimohammad s . f .胭脂,“一个紧凑的结构模拟的时空相关MIMO衰落信道,“IEEE电路和系统I:普通文件,卷61,不。4、1280 - 1288年,2014页。视图:出版商的网站|谷歌学术搜索
k . Yu和b . Ottersten模型。文中传播渠道:审查。”无线通信和移动计算,卷2,不。7,653 - 666年,2002页。视图:出版商的网站|谷歌学术搜索
d . DemidovVexCL——OpenCL / CUDA的矢量表达式模板库,2017,https://github.com/ddemidov/vexcl。
d . e . s .研究Random123,2017,https://www.deshawresearch.com/resources_random123.html。
j·k·鲑鱼,m·a·莫拉r . o . Dror d . e . Shaw,“并行随机数:简单的1、2、3”学报2011年国际会议为高性能计算、网络、存储和分析页,16:1-16:12 ACM,纽约,纽约,美国,2011年。视图:谷歌学术搜索
C.-D。伊斯坎德尔”,基于matlab的面向对象的多径衰落信道仿真方法,”Hi-Tek多系统,2008年。视图:谷歌学术搜索
“TR 101 112 V3.1.0”,技术代表。,2008,http://www.etsi.org/deliver/etsi_tr/101100_101199/101112/03.01.00_60/tr_101112v030100p.pdf。视图:谷歌学术搜索
“3 gpp TR 36.817 V10.0.0。”技术代表。,2011,http://www.qtc.jp/3GPP/Specs/36817-a00.pdf。视图:谷歌学术搜索

无线通信和移动计算

车辆通信信道建模与仿真

文摘