深Graph-Embedded LSTM机场延迟神经网络方法预测

文摘

由于机场之间的强有力的传播延迟的因果关系,提出了一种延迟神经网络预测模型基于深度图研究延迟预测从机场网络的角度。我们把机场作为图的节点,网络和使用有向图网络建设机场的关系。邻近机场,边的权重由球面测量它们之间的距离,而飞行对它们之间利用连接机场的航班。在此基础上,构造一个扩散卷积内核来捕获延迟机场之间的传播特点,并进一步融入sequence-to-sequence LSTM神经网络建立深度学习框架延迟预测。我们的名字这个模型的深度graph-embedded LSTM (DGLSTM)。验证模型的有效性和优越性,我们利用325个机场的历史延迟数据在美国从2015年到2018年的模型训练集和测试集。实验结果表明,该方法优于现有的主流方法的准确性和鲁棒性。

1。介绍

航空运输行业的快速发展,空中交通流量迅速增加之间的矛盾和有限的空域资源日益突出,导致频繁的航班延误。从VariFlight统计报告显示,全球机场出发的航班的实际数量在2019年是3712万年,按时离职率为75.58%,平均延误为26.47分钟1]。航班延误带来了许多负面影响乘客,航空公司,民航行业。对乘客来说,航班延误干扰乘客的行程,造成很大的不便。对于航空公司,航班延误影响旅客旅行的经验,所以乘客可以选择其他航空公司或运输方法,导致客流下降和航空公司巨大的经济损失。此外,由于每个飞机都有多个飞行腿每天,迟延到达之前的飞行腿会影响后续航班的正常的腿。从长远来看,航班延误会影响整个航空业的发展。因此,如何合理的安排有限的资源来处理延迟和减少延误造成的损失已成为学术和民用航空行业的焦点。

针对航班延误问题,大量的研究人员进行了研究并提出了许多有效的方法和措施从战略和战术水平。例如,在战略层面,优化机场地面和空域结构或采用先进协作操作概念在战术层面改善整个机场和空域网络的运营效率,减少航班延误(2- - - - - -4]。此外,航班延误后,有效的控制措施(如地面等)来减少航班延误的程度和范围(5- - - - - -7]。在本文中,我们专注于机场延误预测的问题。预测机场延误不仅可以提供决策依据机场、航空公司、和空中交通管制部门解决延迟问题,还发出早期预警的乘客,这样乘客可以重新安排他们的行程提前,从而减少航班延误造成的损失。

在过去的二十年里,研究者们进行了大量的研究在机场延误预测。早期的研究主要是使用概率模型来估计延迟分布(8- - - - - -11]。你等。8)开发了一种基于采用概率模型和遗传算法预测的分布离开丹佛国际机场的延误。穆勒和Chatterji9)使用密度函数来模拟出发,路线,到达延误。结果证实,正态分布更适合描述离职延迟,而泊松分布可以更好地描述路线和到达延迟。bloom和陈10)提出了一个方法开发一个短期的延迟预测模型。第一次weather-influenced交通指数(WITI)和预测WITI被用于实时空中交通延误预测。本研究有助于交通流量管理指导流控制决策和确定战略,减少航班延误,取消,在各种操作和成本。同样,克莱因et al。12]开发了多个机场延误预测回归模型使用一个全面weather-influenced交通指数(WITI)工具和指标和使用机场的性能和实际天气/计划交通历史数据训练模型。之后,它已成功应用于预测和预测的时间和程度的影响,对流和nonconvective全年天气,造成的延迟。

与大数据挖掘和机器学习技术的快速发展,越来越多的研究人员转向研究近年来数据驱动的延迟预测模型13,14]。丁和李15]认为机场航班运营的特点,提出了一个延迟预测模型基于危险模型理论和灰色模型理论。该方法采用加权组合模式基于均方误差的估计占用率。Rebollo和Balakrishnan16]提出了用随机森林算法来预测一个特定的起飞延迟叫做一对(或机场)在接下来的2到24小时。他们调查了网络延迟的作用在预测未来延迟。周et al。17延迟)构造决策树模型预测从航空公司的角度。通过考虑航空网络的拓扑特性,结合节点属性K聚类算法分类则忙碌的机场和改善延迟预测的准确性。

只要数据充分,神经网络模型比经典预测方法有更强的特征表征能力如决策树和支持向量机(18,19]。Khanmohammadi et al。20.]介绍了多级输入层人工神经网络(ANN)模型,它可以很容易地看到不同的输入变量和输出变量之间的关系。他们用这种方法来预测的延迟航班抵达肯尼迪国际机场。技术优于传统的梯度下降法反向传播人工神经网络模型在预测精度和训练时间。戴安娜和Feiteira21)针对Hartsfield-Jackson国际机场的延误预测问题,利用采样技术解决数据不平衡的问题,和评估和比较多种方法如决策树的性能,随机森林,多层感知器。Chandramouleeswaran et al。22]在美国使用公共飞行数据提出一个方法来预测的延迟状态在美国机场的航空运输网络。他们设计了一个网络延迟指标降低特征空间,使用经典的神经网络模型和逻辑回归模型来构建一个延迟预测模型,并发现预测性能大大地预测区间的影响而延迟阈值。以北京首都国际机场为例,余et al。23)提出了一个深刻的信念网络方法我航班延误的内部模式和集成支持向量机模型在预测架构实现监督微调。除了使用前馈神经网络(fnn)预测延迟上面所描述的那样,一些研究者也试图利用递归神经网络。李等人。24)考虑航班延误序列的时间序列相关性,这是困难的模糊神经网络来捕捉这一特性,提出了一个基于长延迟时间预测方法短期记忆模型(LSTM),并选择相关特性和分裂延迟级别。同样,金等。25]研究深度学习的有效性模型空中交通延误预测任务。通过结合多个模型基于LSTM,准确和可靠的预测模型已经建立,使一个复杂的空中交通延误的分析模式。

尽管一些研究人员考虑空间相关性和时间依赖性,没有研究人员研究了飞行预测神经网络从图形的角度。由于机场的不均匀分布,每个机场都有不同数量的相邻机场和机场之间的影响程度是不同的。因此,从机场网络延迟的角度来研究预测,数据可以被视为从非欧几里得的生成空间。传统的深度学习方法表示欧几里得空间数据都取得了极大的成功,但是他们不非欧几里得的空间中表现良好。从网络的角度来看,这个图神经网络构造多个节点和边组成的图形。通过描述不同节点之间的关系,它可以捕获节点之间的相互依存关系,可以代表非欧几里得的空间数据。

本文将以机场为节点和使用有向图网络构造节点之间的关系。的重量优势代表了两个机场之间的影响程度。邻近的机场,它们之间的权重由球面测量距离,而机场航班连接的决心根据飞行对的数量。此外,我们把机场之间的延迟传播扩散过程,使用扩散卷积来捕获延迟传播特征,并将其集成到深LSTM神经网络模型来提高机场延误预测的准确性。本文的主要贡献如下:(我)作者的知识,本文研究的问题是第一次机场延迟神经网络预测从图形的角度来看,这可以更好地捕捉时空依赖机场之间的延迟。(2)机场之间的延迟传播被认为是一个有向图的扩散过程。网络图表示方法提出了基于扩散卷积描述整个机场网络。(3)我们提出延迟预测模型、深graph-embedded LSTM (DGLSTM),继承优势网络图和sequence-to-sequence LSTM,从而提高延迟预测的准确性。(iv)在美国机场网络为例,验证了该方法的有效性和优越性通过比较实验与主流延迟预测方法。

本文的组织结构如下:部分2描述了机场延误问题。部分3定义了加权邻接矩阵,包括空间距离加权邻接矩阵和加权矩阵的需求。拟议中的DGLSTM机场延误预测模型提出了部分4。部分5以美国为例,通过实验验证该方法。最后,一些结论和未来的研究方向进行了总结6。

2。机场延误预测问题

本文研究机场延误的问题预测从机场网络的角度来看,使用历史延迟数据的所有相关机场预测预见性的平均延迟时间所有机场。假设有在整个机场机场网络。机场网络定义为一个加权有向图 ,在哪里是一个全球性的属性,代表整个空域的状态,也可以被视为节点关联的机场; 是一组机场节点图; 边的集合,在哪里边缘设置由邻近机场的空间,边缘设置由机场连接的路线;和代表了加权邻接矩阵: 在哪里是机场之间的重量吗和。如果它们之间存在一条边,然后 ;否则, 。因为机场网络是一个有向图,对于任何节点图中,其学位被定义为条边权重的总和,和入度是在边缘权重的总和。出度和入度计算公式如下:

使用单个节点的出度和入度的定义,我们可以获得学位的矩阵和入度矩阵的大小。这两个矩阵是对角,主对角线对应于每个节点的值。

表示作为输入信息与机场延误观察图上的和作为输出信息,代表的数量输入信号特性(如起飞延迟,延迟到来,离开飞行,到达航班体积,和空域状态)代表输出信号特征的数量(如起飞延迟和延迟到来)。让和代表输入和输出图像信号在时间t,分别。机场延误预测是学习一个函数机场网络地图上几个历史时期的输入图像信号到输出图像信号的几个先行的时代: 在哪里和是时间的数量的输入和输出步骤,分别。

机场延误预测的难度在于复杂的时空依赖性和长期预测:(a)机场的延误有很强的时域依赖。例如,特定的机场航班的延迟将影响后续航班正常起飞,导致航班延误的蔓延;(b)之间的空间距离邻近机场有一个健壮的空间相关性(图1:机场在红色虚线圆圈)。通常,邻近机场共享相同的空域资源,如部门、路线,或锚点,离开航班很容易受到邻近机场的航班。(c)机场连接的航班也有一个强大的空间相关性(图1:机场与总经理汇报黑色虚线箭头)的两倍。虽然机场连接航班之间的距离较长,即将离开的航班目的地机场很容易受到影响。例如,恶劣天气在目的地将导致广泛的抵达和起飞航班延误在目的地机场,这将影响相关的机场。

摘要延迟预测的目的是预测未来多个时期的平均延迟时间延迟数据的基础上多机场网络的历史时期。它属于一个类的问题,输入和输出都是连续的。因为每一个机场都是受其他机场和不断改变其状态,越接近机场的关系,更重要的影响。因此,我们研究的问题延迟预测从机场网络的角度。换句话说,除了延迟机场本身的地位,需要考虑其他机场的影响。本文将集成图像卷积嵌入模块的框架下sequence-to-sequence LSTM神经网络(26),并构建一个机场图卷积嵌入式LSTM预测模型在一个统一的框架下实现高精度预测机场航班延误。图2的原理图DGLSTM延迟神经网络预测方法,分为两个阶段:编码和解码。编码阶段是由图表示实现模块和一个LSTM模块,和另一个LSTM模块实现解码阶段。下面将介绍如何定义加权邻接矩阵,特征空间相关性的图表示网络模块,和sequence-to-sequence LSTM特征时间的关系。

3所示。定义加权邻接矩阵

一般来说,一个图的网络结构随应用程序场景,并区别主要表现在连接模式和节点之间的权重。从图可以看出1邻居的机场网络中的每个节点分为两种类型:机场相邻的空间由航线和机场联系。邻机场节点的设置是固定的,和节点连接的航班是随时间不断变化的。因此,我们首先构造space-weighted邻接矩阵和加权邻接矩阵的需求分开,然后整合这两个邻接矩阵。

3.1。空间距离加权邻接矩阵

由于共享空域资源(航空公司、中转地点,部门,等等)相邻机场之间的空间距离,他们会互相影响。一般来说,两个机场越近,它们之间的相关性越强,反之亦然。因此,对于机场与相邻空间的距离,两个机场的影响大约是相同的;也就是说,积极的和消极的边缘有相同的重量。本文以经度和纬度作为输入,计算球面距离机场,然后使用不同的内核函数定义边的权重。常用的核函数包括多项式核函数,高斯核函数和乙状结肠内核函数。鉴于高斯核函数的对称性,我们把它作为内核函数。对于任何两个机场和 ,机场网络边缘的重量是按照下列公式计算: 在哪里表示的球面距离和和和 ,分别代表标准差阈值参数。显然,从(3),也就是说,空间距离邻接矩阵是对称的。

3.2。需求加权邻接矩阵

对于任何两个机场航班相连,他们之间的亲密程度,可以表现为传入和传出flights-the机场之间飞行,它们之间的相关性越强,反之亦然。如果有更多的航班从一个到另一个机场,机场将产生更大的影响其他机场。例如,从9点到10点,从南京到北京的航班的数量是4,在从北京到南京的航班的数量是2。然后,北京机场有更重要的影响比南京南京机场机场在北京机场。同时,机场的航班,航班数量随时间不断变化的。假设有总时间间隔(如果每小时平均延迟预计,一整天可以分为24时间间隔)。根据以上分析,对于任意两个机场和 ,在tth时间间隔,机场的重量计算公式到机场是在哪里是航班的数量将从机场飞吗到机场。由于飞行计划包含出发机场,到达机场,起飞时间,到达时间,和其他航班信息,公式(5)可以计算从飞行计划提前。

部分3.1和3.2讨论如何构造空间距离邻接矩阵和邻接矩阵的需求。因此,如何将这两种类型的矩阵呢?本文采用最直接和简单的方法之一,也就是说,两种类型的矩阵的加权组合,如下: 在哪里和 ,分别代表了空间权重加权邻接矩阵和邻接矩阵和需求是权重参数。

4所示。DGLSTM延迟预测模型

4.1。网络图表示

网络图表示的目的是提取拓扑图形的特征信息。网络图表示方法分为两个表示在空间域和频率域的方法。它们之间的区别在于理论基础。空间表示方法的理论基础是信息扩散理论27- - - - - -30.),而频域方法的理论基础是卷积理论。虽然理论基础是不同的,一些研究人员已经证明,这两种类型的技术几乎是一致的,除了空间时,他们依靠解决是不同的。在本文中,我们描述的空间特征在频域图网络。

图卷积网络表示使用图论来执行卷积操作拓扑图形,实现网络的特征表示图。从研究的角度思想,学者研究图像信号处理首先定义的傅里叶变换图,然后定义卷积操作图,最后结合深度学习提出图卷积神经网络。图卷积神经网络的最关键的问题是如何构造卷积运算符。自基函数的傅里叶变换是拉普拉斯算子的特征函数,研究人员提出使用拉普拉斯算子矩阵(离散拉普拉斯算子)构造卷积算子。大量的研究表明,二阶导数的拉普拉斯算符是一种操作,一种添加大量的信息传播方程。

研究人员已经做了很多研究在无向图神经网络(31日- - - - - -38),只有少数研究人员注意到有向图神经网络(39]。对无向图网络,最具代表性的一个是布鲁纳和纽约大学的Szlam提出的(38]。他们提出了一种光谱卷积方法解决卷积问题的非欧几里得的空间。然而,这种方法有可怜的空间位置和需要功能分解,导致较高的计算复杂度。解决卷积谱方法的不足,Defferrard [31日)提出了切比雪夫卷积谱卷积方法用更少的参数,并且它不需要eigendecomposition和直接使用拉普拉斯算子的矩阵变换,已更好的位置。拉普拉斯算子矩阵由光谱卷积法和切比雪夫卷积谱方法是一种半正定对称矩阵,可以执行eigendecomposition,由所有特征向量和矩阵是正交的。加权有向图的邻接矩阵通常是不对称的,和卷积算子构造基于拉普拉斯算子的矩阵不再适用于有向图。意识到有向图的卷积,李和Shahabi39)针对交通流预测问题,建模的空间依赖交通流扩散过程的有向图,提出了扩散卷积算法很容易理解和高效的计算操作。鉴于延迟机场网络的传播特性,本文概括和扩散卷积算子适用于机场网络特性表示。

让和 ,分别表示正向和反向扩散过程的转移矩阵:

有向图的信号 ,k一步一步扩散的卷积米th特性被定义为在哪里是一个过滤器参数。

假定扩散卷积层,是输入层和第0个层lth 层卷积层。图3显示了一个示意图表示图的特性有两个卷积层。对于任何回旋的层 ,的输出lth 卷积层使用以下公式计算: 在哪里表示特性的数量层; 是图像信号在层, ; 中的卷积过滤器吗层;和是激活函数,如ReLU函数和s形的函数。

4.2。建模时间依赖性

除了容易受到相关的机场,机场航班延误也容易受到之前的航班。如果当前航班延迟了值得注意的是,它将影响后续航班的离开,导致后续航班的延误。换句话说,航班延误有特定时域依赖。因此,构建一个航班延误预测模型时,也需要考虑时间关系实现在时域特性表示。LSTM递归神经网络有很强的能力来表示长期和短期信息,已广泛应用于各领域如能源、金融、和运输(40- - - - - -44]。为了实现多步预测,我们使用一个sequence-to-sequence LSTM模型来捕获时域特性。该模型包括两个过程:编码和解码(图4)。编码阶段需要网络图表示模块的结果对于每个时间间隔作为输入,和解码阶段需要最终的输出作为初始输入的编码阶段。编码和解码采用不同LSTM处理单元和深刻的网络结构。

为了方便起见,无论是解码模块的编码模块,细胞状态和隐藏的状态t由和 ,分别。在编码阶段,DGLSTM模型执行状态更新根据以下公式: 在哪里和双曲正切表示乙状结肠激活激活函数和双曲正切函数,分别;是细胞的比例从以前的时刻到当前的信息;是比以前的隐藏信息和当前输入信息存储在细胞状态;显示的留存比率通过双曲正切函数激活细胞更新状态信息; , , , , , , , , , , ,和神经网络参数在编码阶段;和卷积滤波器参数。

在模型训练阶段,每个样本的实际产出,但在线预测阶段,有必要对输入输出整个序列预测序列。每次生成预测价值,进步一步的时候了。当最后的预测价值,整个序列生成结束。预测价值t,该模型需要使用输出值的时间t−1作为输入。然而,在线预测过程中,我们不能上一步获得的实际产出,只能使用在早些时候估计的输出作为下一个时间。如果前一时刻的预测值误差很大,我们使用预测价值估计价值在接下来的时刻,这将导致预测误差变得越来越大。

提出了一种采样机制(26),以减少之间的差距模型训练和在线预测。在模型训练阶段,真正的价值和预测价值前一刻是随机选择下一时刻的输入。真正的价值不再是完全用作输入下一时刻通过随机抽样机制。实际值和模型的输出,分别选中的概率和。应该注意的是,p在培训过程中变化,就像学习速率。从最初的网络训练不足,尝试使用这样的真正价值p应该尽可能大。随着训练的进行,模型训练越来越充分。在这个时候,的价值p也应该相应减少。尽可能选择模型的输出,这样模型训练和在线预测是一致的。因此,在抽样的概念机制下,解码阶段更新状态按照下列公式: 在哪里表示一个选择函数,选择一个值与实际值和估计值有一定概率的。其他变量的意思类似于编码阶段。

鉴于训练样本 ,在哪里和代表了我- - - - - -输入和输出序列,分别。离散状态的问题,如分类、样本类别的最大概率(26[]或叉45)通常是利用培训损失函数。连续值预测问题,然而,平方误差通常是作为损失函数。机场延误预测属于一个类型的连续问题,和损失函数如下: 在哪里的输出是什么我- - - - - -th样本时t。以最小化(12)作为优化目标,我们采取小批量的随机梯度下降法来解决模型中的参数。

5。案例分析

本节需要美国机场网络为例来验证预测结果DGLSTM延迟从不同的角度预测模型。首先,我们描述了实验数据,通过实验确定最佳模型的参数。然后,从预测的角度持续时间,DGLSTM模型的性能和鲁棒性进行了分析。此外,DGLSTM方法与主流延迟预测方法来验证它的优越性。最后,DGLSTM的空间相关性和时间依赖模型进行了讨论。平均绝对误差(MAE)和平均相对误差(绝笔)是用来评估模型的预测精度。美和绝笔的计算公式如下: 在哪里代表实际的延迟时间,代表预测延迟值,代表总数的预测价值。

本节实验由Python编程实现;运行环境是英特尔(R)的核心(TM) i5 - 8300 h CPU @2.30 GHz处理器、96 GB内存,运行64位Windows操作系统。

5.1。数据描述

本文中的实验数据来自美国运输统计局(BTS),它提供了美国主要机场的航班操作数据(https://www.bts.gov/)。数据从2015年1月1日,12月31日,2018年,包括325个机场和2412598件。在本文的实验中,我们预测的平均每小时每个机场的航班延误下10个小时。因此,分为一天24小时的时间间隔。我们计算的平均延迟时间每小时每小时,机场获得35040块的数据。每一块数据包含六个属性:时间、机场名称、起飞延误,延误,起飞航班体积,体积和到达航班。输入信号特性出发,到达延迟,离开飞行体积,体积和到达航班。输出信号特性起飞延误。数据集分为训练集、验证集和测试集的比例根据8:1:1。建设机场网络图,得到的坐标位置每个机场和飞行距离机场,计算加权邻接矩阵使用方程(4)- (6),并进行归一化处理。

5.2。实验装置

DGLSTM模型提出了本文需要确定图网络表征参数和LSTM网络结构参数。图网络参数包括权重参数和扩散步骤。重量参数是选择从0到1,步长为0.05。扩散步长选择从1到6,步长为1。本文详尽的方法确定最优参数,和最优权重参数和扩散步长是0.45和3,分别。对于LSTM网络结构,有必要确定输入层的大小、隐藏层的数量,和相应的神经元的数目。隐藏层的数量更重要对预测精度的影响。层太少不能完全代表训练数据集的特性;相反,太多的神经元会增加模型的复杂性,容易overfit。为输入层,时间间隔确定输入层结构k小时的历史作为输入。的隐藏层,层数的选择范围是大于或等于1和小于或等于7。在每一层神经元的数量从集合中选择(40、80、160、256、320、512、640、768、1000]。在学习阶段,迭代的数量也是很重要的原因。如果迭代的数量太大,该模型将overfit。最大迭代次数设置为10000。本文使用一个随机的方法从每个参数选择值的集合,进行1000次实验,并选择最好的配置参数。在数据规模和服务器配置中使用的纸,离线训练模型需要4小时12分钟,和在线预测需要3分25秒。

接下来,我们测试的输入序列长度的敏感性和扩散步长。图5显示了这两个参数的实验结果。当输入序列的长度是5,预测误差达到最小值,表明增加输入序列不能改善模型的性能。图5(b)显示了绝笔的变异和梅扩散步长。随着扩散步长增加,误差先快速下降,然后略有增加。当扩散步骤3,模型性能是最优的。实验结果表明,一个更大的扩散步长模型可以获得更广泛的空间依赖性的增加学习的复杂性。

(一)

(b)

5.3。实验结果和分析

本节将从不同的角度评估模型的预测性能和比较它与主流的方法来验证它的优越性。

DGLSTM的优势在于它的长期记忆能力。它使用一个内部循环方法同时实现多步预测。在模型训练,介绍了随机抽样机制来提高在线预测的准确性。检查不同的预测时间的预测效果,人物6显示所有测试样品的箱线图的美值。从图可以看出,当将来预测一个小时的延迟,相应的梅约5,预测波动幅度相对较小。随着预测时间的长度增加,预测误差逐渐增加,和预测误差的大小逐渐增加。这是进一步发现,当预测时间超过7小时,梅的中值超过10。实验结果表明,随着时间的增长预测,模型逐渐恶化的影响,预测结果的波动幅度比较大。

图7显示DGLSTM的预测性能在不同的机场。球的颜色表示机场的延误水平,和球的大小意味着美价值和绝笔价值。从图可以看出,机场延误,高美价值更重要,而绝笔值小。原因是延迟越高,越繁忙的机场,这种类型的机场航班延误的原因是复杂的。一旦发生这种类型的机场的航班延误,推迟的传播将是严重的,这将影响后续航班和相关机场。机场的球面半径更大,更轻的颜色,通过分析这些机场的飞行计划,发现他们中的大多数机场和少量的航班。这种类型的机场用更少的航班,航班延误有相对较大的随机性。通常是具有挑战性的捕捉周期从数据统计规律,预测误差是相对较低。高延迟和低延迟的机场相比,medium-delay机场的总体预测精度较高。

(一)

(b)

经常有机场之间的显著差异,以及机场的地理位置很大程度上决定了繁忙的机场。忙碌的一个重要指标来衡量一个机场航班的数量。航班的数量越大,越忙机场。图8显示了飞行卷上绝笔与美之间的关系。图8(一个)显示飞行体积和梅之间的关系。它表明,大多数在美国机场有每月不到10000个航班。这种类型的机场之间的低延迟和预测错误2和6分钟,但绝笔波动很大。图8(b)显示飞行体积之间的关系和绝笔。机场有很多的航班有绝笔在0.05和0.1之间,而与少量的机场航班,绝笔值可达0.3。可能的原因是,在机场飞行容量小、常规操作的航班经常受到邻近的机场或延迟传播因素的影响,具有更大的随机性。与大量的机场航班,绝笔值和波动很小。其结果是,在机场与大量的航班,航班延误是正常的。从历史运行数据,潜在的延迟法律可以独木舟。

(一)

(b)

图9显示了典型的天的延迟预测结果在亚特兰大机场(ATL)和大西洋城机场(ACY)。ATL属于机场较严重的延误,而ACY属于机场相对较小的延迟。图9(一个)演示了ATL的历史延迟的置信区间。从图可以看出,预报值的总体趋势是符合真正的价值。图9 (b)大西洋城机场的实验结果。1点和6点之间,延迟是零,因为没有飞机原定于这一时期。与ATL相比,整体延迟ACY水平较低,但最大延迟点的预测误差是更重要的。主要原因是航班的数量很小,和延迟是随机的。

(一)

(b)

验证该方法的优越性,DGLSTM相比LSTM [25),随机森林(RF) (16摘要利用),BP神经网络(20.),和马尔可夫方法。LSTM只使用相关信息在当前机场延误。摘要考虑的影响机场航班连接,但忽略了邻近机场的影响。射频考虑延迟的特点,整个机场网络状态,从而考虑了空间信息在某种程度上,但没有测量相关机场精炼的方式的影响。马尔可夫方法在许多预测问题是一个广泛使用的方法。图10显示了不同方法的预测误差。马尔可夫方法的预测性能差,绝笔约0.4,美是超过20分钟。随机森林方法用于预测时,预测时间变得更长,预测性能逐渐降低。BP神经网络的整体效果要比前两种类型的模型。虽然预测精度波动,在0.2绝笔。LSTM DGLSTM方法继承了长期记忆的方法,和整体效果比前面的三种方法。一般来说,DGLSTM预测精度最高。绝笔比LSTM低0.01 - -0.03,0.05 - -0.07低于BP神经网络,比随机森林,低0.0 - -0.12和0.3低于马尔可夫平均水平。虽然准确性逐步降低随着时间的增长预测,它仍然比主流方法。DGLSTM受益于继承的优秀性能的长期记忆特征LSTM神经网络和全球的特征图。

(一)

(b)

5.4。模型的讨论

探索的影响性能的加权邻接矩阵DGLSTM,空间加权邻接矩阵,需求加权邻接矩阵,结合加权邻接矩阵分别进行了讨论。(a)的DGLSTM模型只使用空间加权邻接矩阵可以更好地描述相邻机场空间之间的延迟传播特性。这种模式被称为“DGLSTM空间加权邻接矩阵”;(b)的DGLSTM模型只使用demand-weighted邻接矩阵可以捕获延迟特性通过传播路线。这种模式被称为“DGLSTM需求加权邻接矩阵”;(c) DGLSTM模型使用加权邻接矩阵相结合,考虑到延迟传播的空间距离和路线,是表示“DGLSTM加权邻接矩阵相结合。”

图11实验结果显示DGLSTM使用不同的加权邻接矩阵。从图可以看出,DGLSTM与空间加权邻接矩阵的效果优于DGLSTM加权邻接矩阵与需求。它表明,相邻机场之间的影响是更重要的比机场航班连接。这背后的原因可能是邻近机场空域资源,分享和空域资源有限的能力。延误航班在机场将推迟使用空域资源,导致延误由于邻近机场的流量控制。进一步发现DGLSTM模型,只考虑距离或需求快速增加美随着预测时间的增加,尤其是当天气预报时间超过5小时,误差水平迅速提高。然而,随着预测时间变得更长,DGLSTM的美结合加权邻接矩阵生长缓慢,表明综合考虑距离和需求因素能够更好地捕捉航班延误特性和提高模型的预测性能。

DGLSTM使用sequence-to-sequence LSTM捕获时间特性和使用在解码阶段抽样机制来提高模型的鲁棒性。这个实验将考察采样机制对模型性能的影响。图12实验结果显示DGLSTM有或没有一个采样机制。使用抽样机制模型的预测效果优于不使用采样机制。随着预测时间的增加,其优势更加明显。当预测时间是1小时,它们之间的差距在2分钟。随着预测时间的长度增加,美之间的差异值的两个约6分钟时,预测时间是10小时。主要原因是当使用采样机制模型的训练,它是随机选择来自前一时刻的估计值和实际价值。随着迭代次数的增加,选择的概率的估计价值逐渐增加不使用抽样机制。然而,而不是使用一种机制来训练模型,使用真正的输入,导致可怜的在线预测的鲁棒性。

6。结论

提出了一种深DGLSTM延迟预测模型从机场的角度看网络。关于机场与机场网络作为有向图网络节点,空间距离加权邻接矩阵和加权邻接矩阵构建的需求,和两个整体获得联合加权邻接矩阵。在此基础上,我们在机场使用扩散卷积来描述图机场之间的网络捕获延迟传播特性。此外,提出了用sequence-to-sequence LSTM模型我的时域特性,包括编码和解码模块。编码模块以网络图表示模块的输出为输入,和解码模块以编码模块的输出作为输入。在模型训练过程中,我们使用采样机制选择估计价值和实际价值根据一定的概率提高鲁棒性的在线预测阶段。实验需要325在美国主要机场为例,使用历史运营数据的所有航班从2015年到2018年,并使用美和绝笔来评估模型的性能。实验结果表明,本文提出的方法具有较高的预测精度和鲁棒性,优于目前的主流方法。在未来的研究中,我们将尝试使用一些高级特性表征或预测的方法来提高模型预测精度(46,47)和并行计算方法加速模型训练(48]。

数据可用性

使用的数据来支持本研究的发现来自运输统计局的数据,美国(https://www.bts.gov/)。研究人员可以从这个平台下载这些数据。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

本文是由中国国家自然科学基金(62076126和62076126号)和中央大学(没有基础研究基金。NS2018044)。

引用

VariFlight,全球机场和航空公司准时报告VariFlight,合肥,中国,2020。
k . g . Zografos创作、m·a·马达思班和k . n . Androutsopoulos”增加机场容量利用率最佳槽调度:对当前发展和未来需求的识别,”杂志的调度,20卷,不。1,3-24,2017页。视图:谷歌学术搜索
p . Pellegrini t Bolić、l·卡斯泰利和r . Pesenti”SOSTA:一个有效的模型的同步优化机场槽分配,”运输研究E部分:物流和运输审查卷。99年,34-53,2017页。视图:谷歌学术搜索
c . s .彼此和d .太阳,“优化机场地面操作的不确定性,”《航空运输,24卷,不。3、84 - 92年,2016页。视图:谷歌学术搜索
r . Arnaldo Scarpel和l . c . Pelicioni”的数据分析方法预测拥挤的日子在圣保罗国际机场,“航空运输管理杂志》上卷,72年,页1 - 10,2018。视图:谷歌学术搜索
a·s·埃斯蒂斯和m . o .球”,股票和强度的随机整数规划模型动态单机场地面等待问题,“交通科学,54卷,不。4、944 - 955年,2020页。视图:谷歌学术搜索
n .该a Jebali, a . Diabat”集成的飞机航班可选路由问题和延迟方面的考虑,”运输研究E部分:物流和运输审查卷,118年,第375 - 355页,2018年。视图:谷歌学术搜索
y, m . o .球,和w·s·闪避,“估计航班延迟分布是统计方法与长期趋势和短期模式,”美国统计协会杂志》上,卷103,不。481年,第125 - 112页,2008年。视图:谷歌学术搜索
e·r·穆勒和g·b·j·a·j·Chatterji”分析飞机抵达和起飞延迟特性,”张仁学报的飞机技术,集成和业务技术论坛(比例)2002p。5866年,洛杉矶,美国,2002年10月。视图:谷歌学术搜索
b . bloom和n . y .陈”短期国家空域系统延迟使用天气影响交通指数预测,“杂志的指导、控制和动力学,32卷,不。2、657 - 662年,2009页。视图:谷歌学术搜索
答:斯特恩伯格,j·苏亚雷斯、d·卡瓦略和小笠原群岛,“航班延误预测评估,”2017年,https://arxiv.org/abs/1703.06118。视图:谷歌学术搜索
a . Klein c . Craun r·s·李,“机场延误使用weather-impacted交通指数(WITI)模型,预测”学报》第29届数字航空电子系统会议美国盐湖城,UT, 2010年10月。视图:谷歌学术搜索
z . j .汉利主要美国航空网络的延迟特性和预测、麻省理工学院、剑桥,妈,美国,2015年。
一个。Rodriguez-Sanz, f . g . Comendador r·a·巴尔德斯j . Perez-Castan r·b·蒙特斯和s . c . Serrano”评估机场到达拥堵和延误:预测和可靠性,”交通研究部分C:新兴技术卷,98年,第283 - 255页,2019年。视图:谷歌学术搜索
j·丁·h·j·p·p·李,“航班延误的预测模型基于DMT-GMT模型,”物理Procedia33卷,第402 - 395页,2012年。视图:谷歌学术搜索
j·j·巴拉科瑞斯南Rebollo和h,“空中交通延误的描述和预测,”交通研究部分C:新兴技术,44卷,第241 - 231页,2014年。视图:谷歌学术搜索
陈t·周问:高,x, z,“航班延误预测基于特征的航空网络,”《MATEC Web会议。电子数据处理科学美国,芝加哥,2006年11月。视图:谷歌学术搜索
x, y邹,j . Tang j .梁和m . Ijaz“短期评价高速公路速度预测基于周期分析使用统计模型和机器学习模型,”《先进的交通工具卷,2020篇文章ID 9628957, 16页,2020年。视图:出版商的网站|谷歌学术搜索
赵w .曾庆红,z, z, c .谢和x,“深学习方法在终端空域飞机轨迹预测,“IEEE访问,8卷,第151266 - 151250页,2020年。视图:谷歌学术搜索
s . Khanmohammadi s Tutun和y . j . p . c . s . Kucuk”一个新的多层人工神经网络输入层预测在肯尼迪机场航班延误,”Procedia计算机科学卷,95年,第244 - 237页,2016年。视图:谷歌学术搜索
r·戴安娜和Feiteira,“预测模型:航班延误和相关因素,hartsfield-Jackson亚特兰大国际机场,“Procedia计算机科学卷,138年,第645 - 638页,2018年。视图:谷歌学术搜索
k·r·Chandramouleeswaran d . Krzemien k .烧伤和h t . Tran“机器学习预测美国机场延误的航空运输网络,”诉讼的2018航空技术、集成和业务会议,张仁航空论坛美国航空航天学会,洛杉矶,CA,美国,2018年。视图:谷歌学术搜索
b . Yu z郭、美国亚洲h . Wang和g·陈,“航班延误预测商业航空运输:深度学习的方法,”运输研究E部分:物流和运输审查卷,125年,第221 - 203页,2019年。视图:谷歌学术搜索
李z h·陈,j .通用电气和k .宁基于LSTM机场场景延迟预测方法施普林格,柏林,德国,2018年。
y . j . Kim崔,美国,和d . Mavris“航班延误预测的深度学习方法”张仁学报2016年IEEE / 35数字航空电子系统会议(DASC)美国CA,页1 - 6,萨克拉门托,2016。视图:谷歌学术搜索
s . Bengio o . Vinyals: Jaitly, n . Shazeer”计划抽样序列与递归神经网络预测,”学报》第28届国际会议上神经信息处理系统加拿大蒙特利尔,页1171 - 1179,,2015年12月。视图:谷歌学术搜索
通用汽车Scarselli和a·c·Tsoi”图神经网络模型”,IEEE神经网络,20卷,不。1,第80 - 61页,2009。视图:谷歌学术搜索
t·d·李和m . Brockschmidt“封闭图序列的神经网络,”2015年,https://arxiv.org/abs/1511.05493。视图:谷歌学术搜索
戴秉国k . z和b·戴“学习迭代算法的稳态图,”机器学习的国际会议,页1114 - 1122,斯德哥尔摩,瑞典,2018年7月。视图:谷歌学术搜索
y z汉密尔顿和j . Leskovec“归纳学习大型图表,表示”31日学报》国际会议上神经信息处理系统长滩,页1024 - 1034年,CA,美国,2017年12月。视图:谷歌学术搜索
b . x Defferrard“卷积神经网络图与快速局部光谱过滤”先进的神经信息处理系统麻省理工学院出版社,页3844 - 3852年,剑桥,妈,美国,2016年。视图:谷歌学术搜索
w·m·Kipf“Semi-supervised分类与图像卷积网络,”2017年,https://arxiv.org/abs/1609.02907。视图:谷歌学术搜索
k . s . i Parisot和大肠,“疾病预测使用图卷积网络:应用自闭症谱系障碍和阿尔茨海默氏症,”医学图像分析48卷,第130 - 117页,2018年。视图:谷歌学术搜索
黄懿慧Yu和z朱时空图卷积网络:深入学习框架交通预测,”2018年,https://arxiv.org/abs/1709.04875。视图:谷歌学术搜索
胡锦涛和b g·c·杨,“随机重量道路网络使用图像卷积网络,完成”学报2019年IEEE 35数据工程国际会议(ICDE)2019年4月,北京,中国。视图:谷歌学术搜索
n s·k·舒曼和p . Frossard新兴的信号处理领域图:高维数据分析扩展到网络和其他不规则域,”2013年,https://arxiv.org/abs/1211.0053。视图:谷歌学术搜索
f·k·李和z,“多任务学习旅行时间估计表示,”《24日ACM SIGKDD国际会议,页1695 - 1704,伦敦,英国,2018年8月。视图:谷歌学术搜索
z . w .布鲁纳和a . Szlam谱网络和本地连接网络图”,2014年,https://arxiv.org/abs/1312.6203。视图:谷歌学术搜索
y . r .李和c . Shahabi扩散卷积递归神经网络:数据驱动的交通预测,”2018年,https://arxiv.org/abs/1707.01926。视图:谷歌学术搜索
c .徐j .霁,p . Liu”station-free分享自行车需求预测与深度学习的方法和大规模的数据集,”交通研究部分C:新兴技术卷。95年,47-60,2018页。视图:谷歌学术搜索
f . Altche和a . De La Fortelle LSTM公路轨迹预测,网络”《IEEE 20国际会议在智能交通系统中,页353 - 359年,日本横滨,2018。视图:谷歌学术搜索
t·费舍尔和c·克劳斯”深度学习与长期短期记忆网络金融市场预测,“欧洲运筹学杂志》上,卷270,不。2、654 - 669年,2018页。视图:谷歌学术搜索
李x l .彭x姚明et al .,“长期短期记忆神经网络对空气污染物浓度预测:方法开发和评估,”环境污染卷,231年,第1004 - 997页,2017年。视图:谷歌学术搜索
问:胡、张r和y周,“转移学习对于深层神经网络的短期风速预测,“可再生能源卷,85年,第91 - 83页,2016年。视图:谷歌学术搜索
b . v . l·克莱恩,”回顾平方误差和熵函数训练神经网络分类器,”神经计算与应用,14卷,不。4、310 - 318年,2005页。视图:谷歌学术搜索
陈x, s . Wang施c, h . Wu j .赵和j .傅“健壮的船通过视点跟踪学习和稀疏表示,“期刊导航,卷2019,不。1,第192 - 176页,2018。视图:谷歌学术搜索
陈x, x, y, h . Wu j . Tang和j .赵”增强船从海上监视跟踪遮挡条件下视频,”IEEE访问,8卷,第42897 - 42884页,2020年。视图:谷歌学术搜索
h . k . j . Chen Li荣,k . Bilal k . Li和p . s . Yu”periodicity-based并行时间序列预测算法在云计算环境中,“信息科学卷,496年,第537 - 506页,2018年。视图:谷歌学术搜索

《先进的交通工具

文摘

1。介绍

2。机场延误预测问题

3所示。定义加权邻接矩阵

3.1。空间距离加权邻接矩阵

3.2。需求加权邻接矩阵

4所示。DGLSTM延迟预测模型

4.1。网络图表示

4.2。建模时间依赖性

5。案例分析

5.1。数据描述

5.2。实验装置

5.3。实验结果和分析

5.4。模型的讨论

6。结论

数据可用性

的利益冲突

确认

引用

版权

更多相关文章

相关文章