文摘
本文给出了一个健壮的pseudospectral方案解决一类非线性最优控制问题((ocp)由微分夹杂物。的基本思想包括两个主要阶段。在第一阶段,我们线性化的非线性动力系统通过一个有趣的技术叫做线性组合性质的间隔。这个阶段之后,线性化动力系统转化为一个多域通过计算区间动力系统分区。此外,积分形式的多畴的动力系统。配置这些约束的勒让德高斯Lobatto (LGL)点一起使用高斯Lobatto勒让德正交规则近似相关积分使我们能够基本(ocp转换成相关的非线性规划问题(nlp)。在这个过程中,相关的控制和状态函数是分段常数和分段多项式近似,分别。一个说明性的例子是提供确认的准确性和适用性提出的想法。
1。介绍
最优控制问题((ocp)得到了相当大的关注在过去的四十年里,因为他们的应用程序。这些问题的出现在许多科学与工程领域,发挥着重要的作用在现实生活中的现象的建模科学的其他领域。学习的主要困难(ocp通过传统和古典方法在于他们的特殊性质。显然,大多数(ocp由著名的间接方法无法解决(1,2]。因此,它是非常可取的设计准确直接数值方法来近似的解决方案(ocp [3]。
在所有的数字技术为解决光滑(ocp,正交函数和多项式已经应用于一个巨大的规模的研究工作。精度高和易于应用这些多项式函数(ocp是两个重要的优势,鼓励许多作者使用了不同类型的问题。为解决光滑(ocp,存在广泛的类的方法提出了基于正交多项式等著名科学家应用数学(4,5]。这些方法的基本思想是基于pseudospectral(或光谱搭配)操作矩阵的区别。然而,勒让德光谱操作使用矩阵的区别在6)(用于其他应用程序谱矩阵操作的区别[7])。最好的财产光谱微分运算矩阵是稀疏,而pseudospectral的比较矩阵。另一种计算方法求解(ocp基于高阶高斯求积规则提出了在8]。然而,高精确度可能通过这种方法,但是合适的预处理应该探索由于其相关的代数系统的病态。
在许多实际的数学模型,控制器应该受到限制。换句话说,(ocp的控制功能是在许多情况下有界。根据经典理论的最优控制9),如果控制函数是有界的,出现线性泛函,成本和动力系统,由此产生的问题是棒棒(OCP。在这种情况下,控制功能是不连续的。因此,我们应对非光滑(OCP。处理这种非光滑(ocp,文献中提出了一些新的数值方法,如(10,11]。这些方法都是基于有限差分方法(fdm)。简单的离散化fdm通常是容易处理,但是低阶精度可能使他们成功。因此,我们应该看看高阶数值方法如光谱或pseudospectral技术。但是,因为它是在文献中提到的,光谱方案是最好的工具只是光滑的问题解决方案和数据。换句话说,如果我们应用这些方法逼近非光滑函数我们通常观察吉布斯现象。下面的例子说明了这个事实。
示例1(见[9])。我们认为以下(OCP:
由于计算时间间隔,我们应该改变它通过一个简单的转换如下:
给出了上述问题的最优控制在以下形式:
控制函数的逼近这个问题,我们使用古典谱方法(6]。它描述了数据1和2所需的最优控制,不能获得良好的方式。从这些数据可以观察到,不仅开关点的精确值(即,)不是检测精度高,而且获得的解决方案有其他跳在域的边界。这些缺点的应用古典谱方法求解非光滑问题。
删除这些提到的缺点,提出了一种健壮的谱方法(12)为解决一类非光滑(ocp有根本区别的经典谱技术。首先,计算区间划分的小区间,每个子区间的大小是一个未知参数,这使我们能够更有效地计算切换次数。第二,与经典谱方案相比,动力系统的积分形式。这种等价形式被发现通过积分微分动力学和添加初始条件。
本文的基本目标是扩展一个新的想法在引入12)的控制和状态函数近似非光滑(OCP如下: 在哪里是一组连续函数和是一组包含状态变量的边界点吗。同时,,,。根据讨论(11),我们可以假设 在哪里是一个紧集,是一个连续函数。因此,(OCP (4)可以改写形式
应该指出的是,动力系统(6)是非线性的控制。处理(OCP (6以适当的方式),我们第一次线性化的非线性动力系统通过一个有趣的技术叫做线性组合的间隔(LCPI)的属性。这个阶段之后,线性化动力系统转化为一个多畴的动力系统通过计算间隔分区。配置这些约束的勒让德高斯Lobatto (LGL)点一起使用高斯Lobatto勒让德正交规则近似相关积分使我们能够基本(ocp转换成相关的非线性规划问题(nlp)。
本文组织如下。部分2致力于通过使用LCPI线性化非线性动力系统。节3,我们设计的基本思想是基于相关的控制和状态函数的近似分段常数和分段多项式,分别。应该注意的是,勒让德高斯Lobatto点用于配置线性动力系统。节4,我们给出一个数值例子,说明建议的数值算法的效率。结论给出了部分5。
2。动力系统线性化
自是连续的,是一个紧凑,连接的子集,然后是一个闭集。因此,为是封闭的。现在,假设的上下界限是和,分别。因此,
换句话说,
通过使用LCPI,首次介绍了(10),可以近似为一个凸线性组合的最小和最大在以下形式: 在哪里和。应该提到的所有新的相关控制变量。现在,主要的问题(6通过以下(OCP)近似: 在哪里,,=。请注意,问题(10)是一个砰砰的枪声(OCP,因为在这个问题上的新控制有较低的0和1范围和线性出现在上部的动力学方程。一旦控制是假定为砰砰的枪声,找到所需的控制问题成为发现切换时间。
3所示。离散化的新(OCP包含线性动力系统
续集和离散化过程为简单起见,我们假设(换句话说,)和假设的问题(10)有一个最佳的解决方案切换点用。如果我们设置和,然后间隔优惠到小区间。也就是说, 在每个子区间,是恒定的。我们表示在th子区间与常数。自,我们有
此外,我们采取的限制到th子区间的。通过考虑(11),动力系统(10)是转达了
应该注意的是,(15)为保证状态函数的连续性。积分(13)产生动态方程如下: 在哪里和
最后的条件对只在作为
因此,问题(10)转化为如下优化问题: 离散化(19),我们假设,,LGL节点转移到子区间;也就是说,。利用拉格朗日插值,我们近似通过 在哪里和
应该注意的是,是拉格朗日基函数。自是近似,因此可以近似th子区间如下:
从(17)和(20.),我们有。现在,如果我们设置,然后我们获得
配置(23),,,收益率
现在,我们通过一个简单的线性变换,转换时间间隔成如下:
因此,勒让德高斯Lobatto正交规则可以应用于以下表格: 在哪里,,=为LGL重量和吗是度的勒让德多项式。
所以通过考虑问题(19)离散NLP如下:
在这里,,,,和参数NLP是未知的变量。请注意,是已知的,。
在上面的离散化过程中,切换点的数量,,被认为是一个已知的参数。首先我们应该想切换点的数量。这是该方法的缺点。应该注意的是,如果切换点的数量,选择正确,那么结果的价值等于它的低或上界;此外,每个开关点的变化。
4所示。数值例子
我们现在提出的想法申请解决非线性(OCP由微分包含。这个例子中被首次引入[11]。提到工作,作者用fdm的最简单的形式。的优点之一(11)是我们最后解决线性规划(LP)的问题。然而,这种方法需要更高价值的近似等缺点(例如,),这将导致相关的离散问题的病态。我们提出的想法不包含经典谱方法的困难和fdm求解非光滑(ocp并取得卓越的成果对至少3其他方法。这些优势证实这个现代光谱近似的效率。下面的示例使用数学建模软件包枫树,和相应的非线性规划问题是使用命令NLPSolve解决。应该注意的是,如果NLP是单变量和无约束除了有限的范围,可以使用二次插值法。如果问题是无约束和目标函数的梯度是可用的,条件共轭梯度(PCG)方法可以使用。否则,序列二次规划(SQP)方法可以使用。根据我们的NLP的结构,SQP方法使用。
例2。我们认为以下非线性(OCP由微分包含:
根据讨论(11),上述(OCP可以写成以下形式:
在这个问题上,控制出现非线性函数,我们应该线性化初始动力系统。根据LCPI的想法,可以减少上述(OCP线性(OCP砰砰的枪声。在这里,。因此, 因此,。因此,可以近似如下:
应该注意的是,是新的控制功能,即控制有关。通过考虑这个近似通过以下砰砰的枪声,基本(OCP是近似(OCP:
根据我们的经验(11),我们假设切换点的数量。自通过应用这种假设我们到达的确切结果新的相关的控制切换之间的上下边界,数值结果与切换点和目标函数的值为不同值的吗提供在表1。此外,相关的控制、控制,最佳的状态在数据描述3,4,5,分别。此外,在表2该方法的数值结果的比较对的方法6,10,13]。从这个表可以看到的效率和适用性的建议方法解决非线性(ocp由微分夹杂物。
5。结束语
在这项研究中,一个健壮的数值技术已被用于解决一类最优控制问题((ocp)由微分夹杂物。提议的想法包括线性化的动力系统产生的问题是棒棒(OCP。在获得这种非光滑(OCP,我们使用的总体想法(12]以最好的方式来处理这些问题。作为观察到的数值例子,该方案有优越的结果对至少3方法,证实了该方法的适用性。的缺点之一,我们的方法更敏感的初始猜测与经典谱相比方案。然而,我们的想法是终止成功通过考虑一个初始猜测从传统的光谱技术的解决方案,即使是小的值。
利益冲突
作者宣称他们没有任何利益冲突在他们提交的论文。
承认
作者感谢裁判他或她宝贵的意见和有用的建议导致论文的改进版本。