基于深度高斯过程模型的天线优化设计

摘要

采用高斯过程(GP)机器学习作为代理模型结合全局优化方法进行电磁问题快速优化设计时，需要进行大量的协方差计算，计算量为样本数的立方，效率较低。为了解决这一问题，本研究利用卷积神经网络(CNN)的结构形式，并将其与GP结合，构建了一个深度GP (DGP)模型。在这个网络中,医生是用来取代CNN完全连接层,CNN卷积层和池层是用来减少输入参数的维数和全科医生是用来预测输出,而粒子群优化(PSO)算法用于优化网络结构参数。本文提出的建模方法可以压缩问题的维数，减少训练样本的需求，在保证建模精度的同时有效提高建模效率。在本研究中，我们将所提出的建模方法用于移动终端多频带微带天线(MSA)的优化设计，并获得了良好的优化结果。优化后的天线可以工作在0.69-0.96 GHz和1.7-2.76 GHz频段，覆盖无线LTE 700、GSM 850、GSM 900、DCS 1800、PCS1900、UMTS 2100、LTE 2300、LTE 2500频段。结果表明，本文提出的DGP网络模型在优化过程中可以替代电磁仿真软件，在保证设计精度的同时减少了优化所需的时间。

1.介绍

目前，天线问题的解决大多依靠全波电磁仿真软件。然而，使用电磁仿真软件对天线进行分析不仅复杂，而且计算费用昂贵[1］.因此，许多文献已经提出了人工神经网络（ANNS）[2]、支持向量机[3.]和高斯过程（GP）[4，5可以用来分析天线问题。ANN可以实现并行处理、自学习和非线性映射，但其结构相对复杂，需要大量的电磁仿真数据，且难以确定，泛化能力较差[6］.支持向量机在解决小样本和非线性问题方面有许多独特的优势[7]并且还具有许多缺点，例如困难选择的核参数，容易过度装备和预测输出而没有概率的意义[8］.由于机器学习（ML）方法近几十年来迅速发展，GP具有良好的适应性，可以处理复杂的问题，例如高尺寸，小样本和非线性，这也比SVM和ANN更容易实现。否则，可以自适应地获得其超参数，并且其预测的输出值也是概率的显着性[9］.因此，GP模型可以用作快速替代物，以获得天线设计中精确的全波分析，这可以大大减少天线设计中精确模拟所需的时间，同时确保模型精度[10］.然而，对于GP建模方法，最大的限制是它对训练数据具有相对高的要求。因此，它通常使用高精度的离散数据集来确保模型具有足够的预测精度。同时，对于用相同数量的培训数据计算，GP需要更多时间[11］.

卷积神经网络（CNN）是一种馈电神经网络（FNN），包括卷积计算并具有深度结构，也是深度学习（DL）的代表性算法之一。在DL中，CNN可以被理解为可以减少数据的维度的深神经网络（DNN）[12]否则保留数据的价值，这在计算机视觉中广泛应用于[13]及自然语言处理[14]，因为卷积层可以对数据进行特征提取，传递到池化层的数据也可以对数据进行特征选择和信息过滤。在整个CNN中，完全连通的层可以看作是一个“分类器”。如果我们说使用卷积层、池化层和激活函数将原始数据映射到隐层的特征空间，则全连接层可以将CNN网络学习到的“分布式特征表示”映射到样本标签空间，这与GP将非线性复杂问题映射到高维空间的能力是一致的。然而，由于传统的GP需要大量的协方差计算，一旦有较大的输入数据维，GP模型的训练效率就会非常低。而CNN的卷积层和池化层可以在保留数据特征值的同时降低数据的维数。基于上述情况，提出了一种结合CNN和GP模型的深度GP (DGP)网络建模方法。同时，采用粒子群优化(PSO)算法对DGP网络模型进行训练时的参数优化。考虑到目前的研究现状，PSO算法在CNN和GP优化中的应用已经非常成熟[15，16］.与传统的CNN误差反向传播(BP)优化方法相比，PSO在优化模型参数方面具有很强的灵活性[17］.因此，本文选择PSO对DGP模型进行优化，采用模型预测输出与训练输出差值的均方误差作为PSO的适应度函数。本文将所提出的DGP模型应用于多频带天线的设计[18，并取得了良好的优化效果。

2.深度高斯过程网络模型

2．1.卷积神经网络

CNN的基本结构由输入层、卷积层、池化层、全连接层和输出层组成，其中卷积层和池化层根据实际问题通常有多层。传统的神经网络由前向传递和后向传播两部分组成，利用BP对神经网络的参数进行优化和训练。利用粒子群算法对参数进行优化。数字1是一维CNN中卷积层和池化层的结构示意图。在图中，顶层是池化层，中间层是卷积层，底层是卷积层的输入层。卷积层中的神经元构成每个特征面，每个神经元通过一组卷积核与下一层特征面的局部区域相连。然后，计算局部权值并将其转化为非线性激活函数。另外，同一特征面的权重值是共享的。通过权值共享和局部连接，降低了模型的参数和复杂度，使网络更易于训练。为了与GP相结合，我们使用粒子群算法对参数进行优化。因此，我们需要找出需要优化的参数的数量，并对它们在CNN中的位置进行排序。

take1作为一个例子。特征面由1 × 3卷积核连接。如果我们想用一个方程来表示连接权值我输入特征面上的Th神经元米和j输出特征面上的Th神经元n，则可得权值共享方程为: ．通过平移一个固定大小的卷积核，将输入特征面映射到相应的输出特征面，对输入特征面上的所有神经元进行卷积运算，加权激活后映射到输出特征面。由于平移卷积核的性质，相应位置的相邻神经元可以共享权值，实际上它们在卷积核中使用了相同的权值。通过卷积运算，卷积层特征表面的神经元数量或特征表面的大小满足以下公式: 如果Outsize表示输出特征表面上的神经元数，则Insize表示输入特征表面上的神经元数，CSize是卷积核的大小，并且Cinterval表示卷积核的滑动平移步长。可以由卷积层培训的参数的数量如下[19]：如果CPN是训练参数的数量，并且1是阈值的数量，通常只为每层设置一个共享阈值。CNN中的激活函数通常使用Sigmoid函数，Tanh功能等。

池化层通常构造在卷积层的下一层上。它还由多个特征面组成，每个特征面对应于前一层的唯一特征面。池化层的特点是不改变特征面的数量。池化层输出特征面的神经元数计算如下: 其中DSize是池内核的大小。池化层输出特征面上任意神经元的数值输出公式如下: 在哪里是k的第Th神经元n池化层的输出面，是p的第Th神经元n输入面，和根据不同的池化方法可分为平均池化和最大池化。需要优化的参数通常在卷积层和全连接层。在pooling层中，我们选择最大的pooling或平均的pooling，并且没有训练参数[20.］.最后，我们用GP模型替换了传统CNN的全连接层，所以这里我们不讨论全连接层的参数。

２.２.高斯过程

GP描述了一个功能性分布。它是一个无限随机变量的集合，这些变量的任何子集都符合高斯分布。它的性质可以由平均值函数决定还有协方差函数．所以，GP的定义如下: 在哪里是指任何d维向量。

假设数据集是有限的包含将观测值作为高斯模型的训练样本，将观测目标值作为高斯模型的训练样本t被添加剂噪声污染这符合正态分布。则模型可表示为: 在哪里代表了由训练输入向量组成的维训练输入矩阵;表示对应的训练输出向量n培训输出标量;和指遵循正常分布的随机变量，即，

联合高斯先前分配组成n训练输出t和测试输出如下: 在哪里是训练输入和测试输入样本之间的顺序协方差矩阵是测试输入样本本身的协方差矩阵。

在测试点的前提下训练集d，贝叶斯预测概率的目的是计算概率．根据贝叶斯后验概率公式，可以得到其中的预期价值和方差如下:

GP的协方差函数必须满足Mercer条件，即对于任何点集，可以保证非负正定的协方差矩阵。本研究选择ARDMATERN52协方差函数作为GP的协方差：在哪里在哪里信号方差是信号方差。GP的平均函数和协方差函数的属性由一组超参数确定，这也是需要为GP确定的唯一参数[21］.

２.３.粒子群优化

我们采用PSO算法进行优化。PSO算法易于实现，简单，参数较少，可以有效地解决全局优化问题[22］.在标准粒子群算法中，粒子群由粒子组成，假设每个粒子的位置是问题在维搜索空间中可能的拟解。粒子根据惯性、最优位置和群最优位置更新其飞行轨迹。

粒子群算法的基本思想是加速每个粒子接近自身和群的最佳位置。在解空间中，粒子的起始位置和速度是随机设置的。在迭代搜索过程中，算法将记录单个粒子和群所经历的最佳位置和对应的适应度函数值。粒子群算法的速度和位置更新公式如下: 在哪里和为学习因子和加速度常数;Rand()是(0,1)之间的随机数;和指的是d-粒子的维度速度和位置我在kth迭代;指粒子个别极值的位置我在dth维度;和是指群的全局极值的位置d维度。本文在模型的训练过程中，采用PSO算法对所提出的DGP模型的参数进行全局优化，使模型训练完成后的预测精度可以替代传统的电磁仿真软件。然后，基于训练模型再次使用粒子群算法对天线进行优化。

２.４.提出的深度高斯过程

深度高斯过程（DGP）网络模型是CNN和GP的组合，如图所示2．GP替代了CNN的全连接层，同时保留了CNN的输入层、输出层、卷积层和池化层。卷积层用于保留输入数据的特征量，池化层用于降低数据维数，GP用于预测对象的输出。模型的整体结构由LeNet-5演化而来[23]（CNN的常见常规结构）。然而，它比LENET-5更灵活，因为其整体结构已经改善了两层或更多层卷积层和汇集层。否则，可以根据实际需要设置特定数量的层，或者可以根据数据的大小来执行多个卷积，或者可以改变卷积和汇集的顺序。

在DGP网络建模方法中，可以通过电磁仿真软件HFSS获得模型训练所需的样本，即训练输入和训练输出。本文采用VBScript语言实现了MATLAB软件与HFSS软件之间的数据交换，使训练数据的获取更加简洁、自动化。获得训练数据后，对其进行统一归一化。假设每组输入数据为大小为1 ×n大小是1×（n−1)通过卷积核为1 × 2的卷积层后。然后通过激活函数输入池化层，将线性数据转化为离散数据。加入非线性因素后，网络模型对问题的理解能力得到提高[24］.因此，本文采用s形作为激活函数。另外，利用卷积和池化完成的输入数据作为DGP的输入，利用DGP输出和训练输出的均方误差作为基于pso的训练的适应度函数。最后，对模型的输出进行反归一化，得到模型给出的真实预测输出值。

经过训练的DGP网络最终可用于天线优化设计。优化设计过程如图所示3.．

3.多波段微带天线应用

３．１．多频带天线设计

近年来，LTE的4G系统在全球范围内成熟发展，5G通信技术也逐渐得到广泛应用[25］.在此背景下，天线的性能要求越来越高[26］.为满足多种无线通信标准的要求，移动终端的天线应覆盖多个频带或宽带[27］.此外，随着超薄手机的普及，天线的空间有限，所以从小尺寸和频段的角度设计天线具有研究价值[28］.

天线[18从T形单极天线改变，FR4基板的尺寸为75（宽度）mm×120（长度）mm×0.8（厚度）mm。T形天线的右侧是寄生开口条，左侧是在地面蚀刻的槽。整体结构如图所示4．通过HFSS电磁软件的仿真，我们知道天线有4个共振频带。本文利用DGP网络对微带天线(MSA)进行了优化设计，使其在S₁₁小于6db，覆盖270mhz (0.69 ~ 0.96 GHz)和1.06 GHz (1.7 ~ 2.76 GHz)的阻抗带宽，从而覆盖LTE 700、GSM 850、GSM 900、DCS 1800、PCS1900、UMTS 2100、LTE 2300、LTE 2500频段。

3.2。模型培训和预测

在建模过程中，天线的20个尺寸参数（如表所示）1）用作变量，随机组合成200组不同的天线参数作为DGP网络的输入数据。HFSS被转移以进行仿真，并且所获得的仿真结果被视为培训DGP网络模型的训练输出。平均平方误差用作训练过程中PSO的健身功能。如果模型预测精度不符合要求，那么我们将继续通过PSO迭代地训练，直到模型符合精度要求。


变量名	可变量程(单位:mm)	变量名	可变量程(单位:mm)

l32	8.5∼10	PL4	3.5∼4.5
l33	15∼22	PL5	12 ~18
l35	6∼12	PL6	5∼7
W1	1∼2	PL7	7∼12
W2	3〜4	PL8	5∼7
W3.	1.5∼2.5	PLG1.	3.5∼4.5
l1	27日∼29	LSG1.	1∼3
l2	21日∼24	LSG2.	1∼3
PL1	50∼54	LSG3.	40∼45
PL2	4.5∼5.5	WSG.	1∼2

这里所使用的所提出的DGP网络模型具有3个卷积层和2个池层。每个卷积层的卷积仁的尺寸为1×2，卷积层1的通道数为3，卷积层2的通道数为1，卷积层3的通道数为3，并且每层的汇集层的尺寸为1×2.图5给出了用于多频带天线的DGP网络模型的具体结构。将1 × 20的输入数据输入模型后，池化层2后的每个通道尺寸为1 × 4，大大减少了GP的训练时间，提高了GP的训练效率。GP经过一系列的卷积和池化处理后，此时输入的训练数据大小为1 × 12，输出数据为S₁₁在该频带内采样的频率点对应的振幅。具体频带范围为0.5 GHz - 3 GHz，采样间隔为0.04 GHz，每组63个频率点。

经过培训，我们使用粒子群算法对设计进行优化。PSO算法中的粒子数为20，最大迭代次数为500，加速度常数为，惯性权重是1，频率范围为0.69-0.96 GHz和1.7-2.76 GHz的健身功能小于-6 dB。优化尺寸参数如表所示2．为了验证模型的有效性和准确性，图6给出了S₁₁仿真结果与电磁仿真软件HFSS的仿真结果相比较7为天线在4个频率点上的场图。以上结果表明，优化后的天线能够满足优化目标。


变量名	可变量程(单位:mm)	变量名	可变量程(单位:mm)

l32	9.66	PL4	4.02
l33	17.96	PL5	17.66
l35	10.05	PL6	6.27
W1	1.09	PL7	11.79
W2	3.26	PL8	6.75
W3.	1．65	PLG1.	3.74
l1	27.56	LSG1.	1.58
l2	22.32	LSG2.	2.34
PL1	52.11	LSG3.	43.47
PL2	4.95	WSG.	1.068

4.结论

提出了一种基于深度高斯过程网络的建模方法。在深度学习的框架下，本文首先利用了卷积神经网络和高斯过程的优点，并创造性地将它们结合起来。然后,我们利用卷积神经网络来减少输入数据维度不丢失数据特征,最后使用非线性问题的高斯过程适应性预测天线频率,以保证准确性和减少计算时间,从而提高工作效率。同时，采用所提出的深度高斯过程网络模型结合PSO算法进行优化设计。优化后的结果与HFSS高保真模型仿真结果非常接近，说明该建模方法具有足够的可靠性。优化后的天线尺寸满足指标要求，表明该方法在天线优化设计中具有实用价值。

数据可用性

用于支持本研究发现的数据可由通讯作者要求提供。

的利益冲突

作者声明他们没有利益冲突。

致谢

基金资助:国家自然科学基金面上项目(no. 20141201);江苏省自然科学基金资助项目(61771225);BK20190956，江苏省高等学校青蓝工程。

参考

S. Koziel和A. Bekasiewicz，“天线结构的低成本设计导向约束代理建模”，IEEE天线和无线传播信，第16卷，1618-1621页，2017。视图:出版商的网站|谷歌学者
y . Chen Y.-B。田,F.-Y。基于粗网格的KBNN优化EBG结构国际天线与传播杂志，卷。1，不。4，PP。155-164,2017。视图:谷歌学者
胡国宝，孙凤英，“基于支持向量机集成的方位估计方法”，国际数值模拟期刊:电子网络，器件和领域，第32卷，第2期5, p. 2614, 2019。视图:出版商的网站|谷歌学者
“基于差分进化的流形高斯过程机器学习算法在微波滤波器参数提取中的应用”，IEEE访问， vol. 8, pp. 146450-146462, 2020。视图:出版商的网站|谷歌学者
“基于半监督学习的高斯过程微波天线谐振频率建模，”复杂，第3485469号，12页，2020年。视图:出版商的网站|谷歌学者
l .元,X.-S。杨，C. Wang和B.-Z。Wang，“multi - branch artificial neural network modeling for inverse estimation of antenna array directivity，”，天线与传播学报第68卷第2期6, pp. 4417-4427, 2020。视图:出版商的网站|谷歌学者
陈志强，“基于粒子群算法的微带天线谐振频率建模与分析”，“基于粒子群算法的微带天线谐振频率建模与分析”，国际数值模拟期刊:电子网络，器件和领域，第29卷，第2期6, pp. 1129-1139, 2016。视图:出版商的网站|谷歌学者
N.T. Tokan和F. Gunes，“基于测量的微带天线的传染媒介表征”，“电磁研究进展B，卷。5，pp。49-61,2008。视图:出版商的网站|谷歌学者
y。徐和Y.-B。田，“基于粗糙网格GP模型的圆锥喇叭天线优化设计”，伊朗科技学报，电气工程交易号，第43卷。4，第717-724页，2019。视图:出版商的网站|谷歌学者
J. P. Jacobs和S. Koziel，“天线输入特性高效高斯过程建模的两级框架”，天线与传播学报第62期2, pp. 706-713, 2014。视图:出版商的网站|谷歌学者
“基于粒子群算法自更新适应度估计的多频带微带天线优化设计，”国际天线与传播杂志，第2019卷，文章编号2176518,9页，2019。视图:出版商的网站|谷歌学者
Xu J.， B. Xu, P. Wang et al.，“Self-taught convolutional neural networks for short text clustering，”，“china，”神经网络， vol. 88, pp. 22-31, 2017。视图:出版商的网站|谷歌学者
N. Tajbakhsh, J. Y. Shin, S. R. Gurudu等，“用于医学图像分析的卷积神经网络:完全训练还是微调?”IEEE医学影像汇刊第35期5, pp. 1299-1312, 2016。视图:出版商的网站|谷歌学者
沈涛，周涛，龙国栋等，“基于rnn/cnn-free语言理解的定向自我注意网络”，出版全国人工智能会议论文集，第5446-5455页，美国新奥尔良，2018年8月。视图:谷歌学者
X. -h。风扇，Y.-B.田和Y. Zhao，“基于健身估算的粒子群优化算法的微波器件最优设计”，“应用计算电磁学学会期刊第33卷第3期11，第1259-1267页，2018。视图:谷歌学者
“基于pso- p优化的多臂手术机器人的术前规划”，《机械工程学报》2017 IEEE机器人与自动化国际会议论文集，新加坡，新加坡，2017年5月。视图:出版商的网站|谷歌学者
F. Chen和Y. b。田，“基于CUDA的PSO训练的神经网络，用于计算循环微带天线的谐振频率”，“国际计算科学与工程杂志第14卷第2期3，页211-221,2017。视图:出版商的网站|谷歌学者
邓建云，刘世勇，孙德强，“移动终端多频带天线”，国际RF和微波计算机辅助工程学报，第29卷，第2期第11页，745-754页，2019。视图:出版商的网站|谷歌学者
顾建军，王志军，“卷积神经网络的研究进展”，《中国神经网络》，模式识别，卷。77，pp。354-377,2017。视图:谷歌学者
H.-C。Shin, H. R. Roth, M. Gao等人，“用于计算机辅助检测的深度卷积神经网络:CNN架构、数据集特征和迁移学习，”IEEE医学影像汇刊第35期5, pp. 1285-1298, 2016。视图:出版商的网站|谷歌学者
M. Raissi, P. Perdikaris，和G. E. Karniadakis，“使用高斯过程的线性微分方程的机器学习”，计算物理学杂志， vol. 348, pp. 683-693, 2017。视图:出版商的网站|谷歌学者
玉博田，粒子群优化算法与电磁应用，科学出版社，北京，2014。
A. Krizhevsky, I. Sutskever，和G. E. Hinton，《基于深度卷积神经网络的图像网络分类》，ACM的通信，第60卷，第2期6，页84-90,2017。视图:出版商的网站|谷歌学者
P. M. Long和H. Sedghi，“激活函数对深度网络中隐藏节点分布的影响”，神经计算第31卷第1期12页2562-2580,2019。视图:出版商的网站|谷歌学者
M. Lauridsen, L. C. Gimenez, I. Rodriguez和T. B. Sorensen，“Mogensen从LTE到5G的连接移动，”IEEE通讯杂志，第55卷，第55期3, pp. 156-162, 2017。视图:出版商的网站|谷歌学者
高清。莫仑，H. -W。杨和c.-y.-d。SIM，“LTE / WWAN Smartphone Application的单开槽天线”，天线与传播学报，第65卷，第5期8, pp. 4278-4282, 2017。视图:出版商的网站|谷歌学者
R. Wu和Q.-X.楚，“2G / 3G / LTE / 5G无线通信的多模宽带天线”，电子信件，卷。54，没有。10，pp。614-616，2018。视图:出版商的网站|谷歌学者
S. Verma, L. Mahajan, R. Kumar, H. S. Saini，和N. Kumar，“用于未来5G应用的小型微带贴片天线”2016年第五届国际可靠性、信息通信技术与优化会议论文集(趋势与未来方向)，第7-9页，印度诺伊达，2016年9月。视图:出版商的网站|谷歌学者

国际天线与传播杂志

摘要