文摘

这项工作提出了一种metaheuristic (MH)称,自适应teaching-learning-based优化,接受飞机参数估计的概率。逆优化问题提出了飞机纵向参数估计。带来的问题是找到纵向气动参数通过最小化错误之间的实际飞行数据和计算的动态方程。HANSA-3飞机用于数值验证。几个建立肉类以及该算法用于解决该优化问题,而他们的搜索性能研究相比,传统的输出误差法(OEM)。结果表明,该算法是最好的表演者的搜索收敛性和一致性。这项工作被认为是纯粹的基线肉类申请飞机参数估计。

1。介绍

飞行控制是最重要的一个部分在发展中一个新飞机或改善现有的一个。时更为关键的应用介绍了无人机(UAV)。传统上,飞机运动模型是基于运动方程和牛顿第二运动定律,导致一个非线性方程组。通常,这样的一个系统是线性化,导致一个线性状态控制模型。以达到可能的最高飞行控制的性能,识别飞机的气动参数和动态模型需要准确。虽然飞机气动参数包括空气动力学、稳定性和控制金融衍生品可以是评估从一个经验模型(1),数值模型(涡格法)(2),计算流体动力学(CFD) [3])和风洞试验,测试数据和真正的飞机数据之间的误差仍然是不可避免的。飞机设计和制造的飞机总是不同的,尽管它是更糟的是当飞机实际飞行结构的灵活性。这意味着准确系统识别真正的或制造飞机总是必需的。在这方面,参数估计技术是必要的,一个最受欢迎的飞行动力学与控制领域的研究主题。传统的参数估计技术,可用于评估稳定和控制衍生品从航班信息已经提交4]。然而,传统技术适用于估计稳定衍生品在一个稳定和线性调整条件严格的飞机。他们为一个高度机动的不足或不稳定的飞机,还有昂贵的估计需要计算大量参数的全阶模型飞机。同时,一些更有效的参数估计方法开发了基于一个涉及函数结合优化技术。这些包括方程误差法(EEM) [5- - - - - -8),输出误差法(OEM) [9- - - - - -11),滤波误差法(FEM) (12- - - - - -15]。然而,这些方法仍然需要一个预定义的初始/飞机模型。在这方面,开发更高效的飞行参数估计从飞行试验数据没有预定义的飞机模型是一个具有挑战性的话题。

最近,高效的飞行参数估计技术基于人工智能(AI)已经提出和优化工具,例如,人工神经网络(ANN)和模糊集理论(16- - - - - -18]。人工智能的结合和MH搜索也被提出19,20.]。然而,即使不能使用所有这些技术没有预定义的飞机模型。安和模糊需要大量的训练数据,也依赖于有效的参数设置。使用独立的MH等问题逆优化问题解决者,如果成功的话,可能会是一个很好的工具,飞机飞行控制。

MH)(也称为进化算法可以分为全球和nongradient优化器的优化方法。由于这种优势,他们可以处理任何类型的设计变量,目标,和约束功能,虽然在某些情况下他们可能就没那么有效。他们还可以探索一个帕累托在一个运行,在这种情况下的多目标优化问题。因此,他们是目前最常用和流行的真正优化工程设计优化问题21- - - - - -24]。为优化应用于一个逆问题,全球肉类报道的成功使用,如损伤诊断问题[25,26),一个机器人的逆运动学设计(27),机器人轨迹规划优化(28),合成机制(29日),和光伏模型的参数识别30.,31日]。反问题优化飞机参数估计使用MH,据我们所知的研究很少。一些肉类发现被用来解决这样的问题是一个经典的遗传算法(GA) [32]。因为调查使用的肉类飞机控制系统识别是有限的,因此这个工作的动机。到现在的时间,因为第一个算法GA发明之一,已经有超过一千肉类及其变体在文献中提出的。比较性能研究的建立和新发明的肉类在飞机系统的参数估计是一个有趣的话题,更有挑战性的任务是开发一个新的强大的MH或提高现有的MH的性能对于这样一个逆问题。在现有的肉类,teaching-learning-based优化(TLBO)是一位杰出的MH,这是发现的一个最强大的算法通过优化求解逆问题[25,29日- - - - - -31日,33]。然而,它的性能参数估计的反问题从未被飞机系统的测试。此外,虽然TLBO被发现最好的优化器通过优化,求解逆问题的原始版本的开发一般优化问题。因此,加强TLBO算法基于一种新型技术为这个特定的优化问题是具有挑战性的,将导致飞机参数估计的有力工具。

因此,这项工作提出了一个高效的MH算法称为“自适应teaching-learning-based优化接受概率(SaTLBO-AP)”求解反问题的飞机参数估计。该算法是基于使用TLBO作为主要算法结合多样性存档。中使用的接受概率自适应方案利用模拟退火的多样化和强化之间的平衡。逆优化问题HANSA-3飞机纵向飞行参数识别的(20.提出了]。然后由该算法解决优化问题以及一些新发明和完善的肉类,包括蚁狮优化器(氧化铝)34),鲸鱼优化算法(WOA) [35樽海鞘,群算法(SSA) [36(MFO) [], Moth-Flame优化37(拥有)[],灰太狼优化38),蚱蜢优化算法(果)39],蜻蜓算法(DA) [40(WCA)[],水循环算法41),Multi-Verse优化器(微血管)[42],正弦余弦算法(SCA) [43(MBO)[],帝王蝶优化44(SMA)[],黏菌算法45),大象放牧优化(EHO) (46),人工蜂群算法(ABC) (47(萨德)[],自适应差分进化算法48),改善Teaching-Learning-Based优化(ITLBO) (31日),和原Teaching-Learning-Based优化(TLBO) [49]。获得的结果进行比较和讨论。

本文的其余部分包括了该算法、SaTLBO-AP,配方逆优化问题的纵向飞行,参数估计,数值实验,结果和讨论,以及结论。

2。制定逆优化问题

刚性飞机飞行动力学由运动方程和牛顿第二定律。刚性飞机有6个自由度旋转3翻译和其他3。传统的north-east-down坐标可以用作一个惯性参考系。它也方便使用身体轴,如图1。运动方程导致非线性飞行动力学模型。为了简化模型,一个小扰动方法是采用线性化模型。然后,随着飞机的左右对称,模型可以分为纵向和横向/定向运动。这导致容易处理飞机动态控制模型。

为了检验该参数估计方法的性能,提出了纵向飞行控制模型的参数估计。纵向运动的非线性飞行控制模型在本研究中使用的传统的飞机可以表示为(4]

空气动力学参数 被假定未知和被识别。

逆优化问题申请纵向运动参数估计,提出的设计问题是找到一组空气动力学参数,以减少错误之间的纵向响应一个真正的飞机从纵向动力学方程和计算响应。优化问题可以表示为

在哪里 是一个向量的设计变量lbUb上下边界。设计变量的详细信息如表所示1。的参数 分别是th真正的和纵向运动参数估计的时间响应,而l是纵向参数的数量。四个纵向参数包括 的参数t0t结束最初的也是最后一次模拟,分别。

有几种类型的物理参数与完全不同的单位,例如,飞机速度和角位置,每个估计误差(7在总结之前)因此正常化。这一步可以很容易地通过除以实时响应的绝对值。

在这项研究中,实时响应从飞行测试是模拟使用HANSA-3飞机的飞行模型如表所示2,而空气动力参数的目标值 如表所示3。模拟飞机飞行数据的电梯偏转3-2-1-1阶跃输入。执行模拟六秒钟的时间长度( )时间步长( )0.025秒。与零均值高斯噪声添加到系统响应与噪音的程度为0%,5%,10%的时间响应的振幅。纵向运动的时间响应 可以基于数值解决(9),而 可以根据计算(1)- (6)。国家时间响应作为真正的飞行数据如图2

3所示。基于自适应教学的优化与接受概率

TLBO是一个简单但有效的MH Rao等人提出的2011年(49]。算法受到教学在课堂上的行为。的主要搜索过程TLBO由种群初始化、繁殖,和选择,同时,在繁殖过程中,主要有两个阶段称为教学和学习阶段。每个人群中首先是更新教学阶段的关系。 在哪里x=的个人在人群中。x老师=最好的个人。x的意思是=其他成员的人口的平均值。兰德=一个随机数在[0,1]。TF=教学因素,也可以是1或2。

子女和父母然后放在一起,最好的选择和发送到学习者的阶段。在学习者生殖阶段,可以创建一个特定的后代 在哪里x1x2是两个人群中随机选择的个体。然后以同样的方式执行贪婪的选择与教学阶段。给出了算法的计算步骤1

输入:最大迭代次数(麦克斯特),人口规模(nP)。
输出:x最好的,f最好的
主要算法
(1) 初始化人口和他们的目标函数值。
(2) = 1,麦克斯特。
(2.1) 确定最佳的解决方案,x最好的,f最好的和定义x老师=x最好的
(教师阶段)
j= 1,np
(2.2) 更新人口使用(10)。
(2.2.1) 评估目标函数值。
(2.2.2) 执行贪婪的选择。
结束
(学习者阶段)
j= 1,np
(2.3) 更新人口使用(11)。
(2.3.1) 评估目标函数值。
2.3.2 () 执行贪婪的选择。
结束
(3) 结束

从算法1执行,原TLBO教学阶段使用一个老师(当前最佳解决方案),在学习阶段执行利用两个随机选择的学生(个人)。在某种程度上,这导致限制在TLBO搜索勘探和开发。因此,这项工作提出了一个改进的版本TLBO通过引入几个数值方案。提出了基于自适应教学优化器的接受概率算法,教学和学习阶段都升级。多个老师被分配在老师阶段三个学生学习计划添加到学习者阶段提高收敛速度。一些新的数值方案是补充道,一些控制参数利用新算法。据说原来的TLBO derivative-free MH,该算法自适应策略适用于添加控制参数。

在教学阶段,多样性档案是用来防止一些有前途的解决方案,具有良好的勘探开发之间的平衡。这些解决方案和教师分配。创建存档和更新使用nondominated排序技术分类归档解决方案。同时nondominated排序操作基于最小化原始目标函数(f(x))和多元目标函数(fD(x))(29日]。多样性函数值计算的基础上结合当前迭代的人口和人口从几个以前的迭代。然后,这些个体的多样性功能可以计算 在哪里 权重系数的条件 + = 1, 的范围内随机生成[0,1]。这个函数f2可以根据计算(11)

的变量Dij是欧拉距离个人j,而 是0.0001和之间的最大价值Dij用于避免奇点发生在计算。nP是池中个体的数量。(11)仍然是用于教学生殖阶段,但是老师可以选择最佳解决方案与多样性之间的档案与给定的概率。的选择x老师执行基于选择的概率可以表示为哪一个 在哪里pT的概率是选择最好的解决方案,而 是个体中随机选择的多样性存档(档案nondominated解决方案获得的fDf2)。选择的概率教学繁殖的最佳解决方案是由自适应基于积累的数据在每个优化运行。三个小区间产生pT被定义为[0.4,0.5],[0.5,0.6],[0.6,0.7],选择的时间间隔进行使用轮盘赌选择技术。例如,如果子区间选择的价值pT生成的是 在兰德∈[0,1]是一个随机数。的jth子区间的概率被选中pwj,可以计算

最初,两个1×3向量pT_successpT_fail创建的元素都是0。在教学繁殖,如果jth子区间的值用于生成pT和繁殖后代更好的或与其父一样好,的价值pT_success j应该增加通过添加一个指向它的jth元素。另一方面,如果不能超越其母公司的价值pT_fail j应该是增加了一个点。这样一个概念,的价值pwj取决于使用的历史被成功或失败。然而,仅计算成功或失败可能导致局部最优发展的陷阱pwj;结果,接受概率概念采用类似玻耳兹曼的概率采用模拟退火。因此,在这种情况下,jth子区间使用导致后代x教学的更新方案pT_success jpT_fail j可以表示为 在哪里pacc最初是一个接受概率设置高值,减少了优化运行过程。尽管它已经失败,pT_success j仍然有机会增加得分0.5,如果接受概率传递。在这个工作,简单的概率调度作为显示在图3使用,t马克斯最大迭代数。

学习阶段,二学生学习(11随着3-student)仍然使用学习策略(33]。两种学习策略的选择依赖于二学生学习定义为选择的概率pl。3-student学习是通过随机选择三人在目前的人口,那么搜索方向计算以这样一种方式,另外两个学生指向是最好的学生。新学习者繁殖可以写成 在哪里xi1,xi2,xi3是随机选择从当前人口和最后一个是最好的。的变量pl以类似的方式生成pT。这意味着有三个小区间的随机生成pl,而1×3向量pL_successpL_fail是用来记忆的成功和失败记录使用吗jth子区间。同样,轮盘赌选择的概率计算使用(16)。

搜索SaTLBO-AP始于种群初始化的过程,一个时间表 ,和最初的(零)组pT_success,pT_failpL_successpL_fail。当前的人口是评估目标函数后,多样性创建存档。然后,教学和学习者的繁殖过程阶段执行,和pT_success,pT_failpL_successpL_fail集和参数 更新。重复的搜索过程,直到满足终止条件。的计算步骤提出SaTLBO-AP算法所示2

输入:最大迭代次数(麦克斯特),人口规模(nP)。
输出:x最好的,f最好的。
主要算法
(1) 初始化一组人口,pL_success,pT_success,pT_fail,pL_fail
(2) = 1,麦克斯特。
(2.1) 确定最佳的解决方案,x最好的,f最好的和定义x老师=x最好的
(教师阶段)
j= 1,np
(2.2) 生成pT基于pT_success j,pT_fail, j。
(2.3) 更新人口使用(10)的基础上,x老师从(14)。
(2.2.1) 评估目标函数值。
(2.2.2) 执行贪婪的选择。
(2.2.3) 更新pT_success j,pT_fail j使用(17)。
结束
(学习者阶段)
j= 1,np
(2.4) 生成pl基于pL_success j,pL_fail, j。
(2.5) 更新人口使用(18)。
(2.5.1) 评估目标函数值。
(2.5.2) 执行贪婪的选择。
(2.5.3) 更新pL_success j,pL_fail j基于(17)。
结束
更新
(3) 结束

4所示。数值实验

研究该算法的搜索性能求解飞机参数估计,提出了飞机纵向截面的参数估计问题2是使用。随机噪声在0%、5%和10%的水平被添加到实际飞行数据,导致测试的三个案例的问题。许多建立肉类以及算法是用来解决这样的问题。在这项研究中使用的肉类包括以下:

蚁狮优化器(氧化铝)33],蜻蜓算法(DA) [40),蚱蜢优化算法(果)39(拥有)[],灰太狼优化38),Moth-Flame优化算法(MFO) [37),Multi-Verse优化器(微血管)[42],正弦余弦算法(SCA) [43樽海鞘,群算法(SSA) [36(WCA)[],水循环算法41),鲸鱼优化算法(WOA) [35(MBO)[],帝王蝶优化44(SMA)[],黏菌算法45),大象放牧优化(EHO) (46),人工蜂群算法(ABC) (47(萨德)[],自适应差分进化算法48),基于教学优化(TLBO) (49),改善Teaching-Learning-Based优化(ITLBO) (31日),该算法(SaTLBO-AP)。

每个优化器是用来解决问题的20个独立运行。人口规模和最大迭代次数将于200年和250年,分别。对于任何优化器使用不同的人口规模,他们将终止在相同数量的函数评估(菲斯)的200×250 = 50000菲斯。

此外,传统的OEM已经被用于与MH的方法。OEM在这项研究中的应用是基于飞机的默认代码从系统辨识程序(SIDPAC)来自美国宇航局50]。由于一个预定义的初始解的要求OEM的实际情况很难确定,20000年最初的解决方案的生成是基于拉丁超立方体抽样研究中。结果,20000年从20000年最初的解决方案进行OEM和获得的结果进行了讨论,提出了MH。相比情况下的解决方案不能收敛,OEM搜索过程终止在3000000菲斯。应该注意的是,通过MATLAB进行数值实验与AMD Ryzen 9 5950×2020推出这种处理器3.40 GHz处理器、32 GB内存。

5。结果与讨论

在执行20独立运行的所有肉类求解优化的三个案例对飞机控制参数估计,结果被发表在表4。表4显示了均方根误差(RMSE)之间的纵向响应真实飞机和纵向动力学方程的计算反应的最佳点。平均的RMSE值(平均)用于测量肉类搜索收敛,而标准差值(Std)是用来衡量MH搜索一致性。结果表明,针对每种情况的设计问题,提出SaTLBO-AP算法是基于弗里德曼表现最好的排名,搜索收敛,和搜索一致性,而第二个最佳和第三最佳算法萨德WCA,分别。

4显示了搜索历史情节的四大算法的迭代和平均目标函数值。发现WCA显示最快的收敛萨德从一开始是最慢的。后来,WCA被困在一个局部最优10000菲斯。拟议中的SaTLBO-AP似乎比最初WCA收敛较慢,然而,30000年菲斯后,提出SaTLBO-AP优于全球最佳WCA和稳定的方法。最后的优化运行,萨德设法达到全局最小值点附近,但仍SaTLBO-AP后面。它可以得出结论,提出SaTLBO-AP显然是最好的这个问题,算法是最健壮,具有良好的搜索集约化和多元化之间的平衡。

5显示了从20000年十大最佳解决方案获得初始解的OEM。从表中,见过的参数估计问题,没有噪音,只有7 20000年最初的解决方案在rms低于1。20000年只有4和9 20000初始解决方案与RMSE低于1 5%和10%噪声的情况下,分别。当比较获得的最佳解决方案基于RMSE OEM和提议SaTLBO-AP, OEM似乎稍微更好的RMSE所有情况下,由于基于使用梯度优化器。然而,这样的解决方案可以发现只有20000年第4 - 9次试验。当比较的平均RMSE来自20个独立运行提出SaTLBO-AP和平均RMSE从从20000年十大最佳结果分类获得解决方案通过使用OEM,清楚地看到,提出了所有情况下SaTLBO-AP更好。虽然OEM优越的收敛速度梯度信息的使用,它需要一个良好的预定义的初始解以获得一个可接受的解决方案,这是很难确定在一个真实的情况。基于这项研究,可能低于10/20,000获得良好的结果。然而,对于该SaTLBO-AP基于解决提出逆优化问题的飞机参数估计,得到一个可接受的解决方案对所有试验没有预定义的屏障初步解决方案。

6显示了比较获得的空气动力系数和衍生品使用的三个最好的肉类,例如SaTLBO-AP,萨德WCA和目标值。获得的最佳值(最好运行)和标准偏差(在括号中)为每个气动参数表中给出。结果表明,空气动力系数和衍生品从提出获得SaTLBO-AP和萨德是所有情况下接近目标值。大多数的所有空气动力系数标准差值和衍生品从SaTLBO-AP获得最低的所有情况。输出响应获得最好的运行提出SaTLBO-AP与目标输出响应数据绘制56

总的来说,发现该SaTLBO-AP是表现最好的飞机参数估计的案例研究。应用多样性技术,参数自适应和接受概率的概念可以提高MH的搜索性能。获得值的空气动力系数和衍生品可能稍微不同于实际的或预期的值;然而,如果使用一个鲁棒控制器,可以应对这种不确定性。

6。结论

在这个工作中,提出了一种新的自适应TLBO飞机参数估计。方法是基于整合多样性存档和3-student分别学习计划到教学和学习阶段。一种新的自适应策略提出了使用接受概率。逆优化问题提出了飞机纵向参数估计。带来的问题是找到纵向气动参数通过最小化错误之间的实际飞行数据和计算的动态方程。几个建立肉类以及该算法用于解决该优化问题。结果表明,三大最佳算法SaTLOB-AP萨德,和WCA,而提议SaTLBO-AP是最好的表演者在搜索收敛性和一致性。当比较提出SaTLBO-AP与传统OEM, OEM提供更好的结果,如果使用一个好的初始解。然而,根据这项研究,只有1 20000次试验的初始解的OEM导致略比SaTLBO-AP提出更好的结果,同时提出SaTLBO-AP可以获得可接受的解决方案,而不用担心一个初始猜测。然而,该算法证明是适合飞机参数估计的反问题,而其性能在其他逆问题仍需调查。 This work is proposed to be the baseline of an investigation that only applies MHs for aircraft parameter estimation. For future work, performance enhancement of the proposed MH for solving the problem and for full model aircraft system identification should be studied.

命名法

, , : 阻力、升力、俯仰力矩系数
, , : 削减阻力、升力、俯仰力矩系数
, , : 在辊角速度、音高和偏航轴
, , : 横滚、俯仰和偏航角
, , : 在x,空速组件y,z
, , : 对x惯性矩,y,z
: 向量的未知参数
: 攻角
:
, , : 滚动、俯仰和偏航力矩
: 动压
: 空气密度
: 真空速
: 发动机推力。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

作者感谢皇家金禧博士的支持项目(批准号博士/ 0153/2561)和泰国国家研究委员会(NRCT5-RSA63003-06)。