raybet雷竞app|雷竞技官网下载|雷电竞下载苹果

贾特人

《先进的交通工具

2042 - 3195 0197 - 6729

Hindawi

10.1155 / 2021/6616800

6616800

研究文章

动态网络交通流时空的因果关系分析基于传递熵和滑动窗口的方法

https://orcid.org/0000 - 0001 - 7524 - 784 x

杨

Senyan

¹ ²

https://orcid.org/0000 - 0002 - 2353 - 1117

宁

Lianju

https://orcid.org/0000 - 0003 - 4660 - 2085

蔡

Xilong

https://orcid.org/0000 - 0001 - 9491 - 3211

刘

明宇

³ 张

音

学校现代邮政(自动化学院)

北京邮电大学

北京100876年

中国

bupt.edu.cn

经济与管理学院

北京邮电大学

北京100876年

中国

bupt.edu.cn

土木工程学系

清华大学

北京100084年

中国

tsinghua.edu.cn

2021年

18 1 2021年

2021年 15 10 2020年 29日 11 2020年 22 12 2020年 18 1 2021年

2021年

这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

传感器和通信技术的迅速发展,大量的时空累积流量数据,提供大数据的特点。潜在的信息和规律的交通状态进化可以从巨大的交通流时间序列中提取数据,并应用于智能交通系统。本研究提出了一种动态时空的因果关系建模方法分析交通大规模道路网络的因果关系。传递熵算法是用来检测网络流量状态的时空的因果关系的基础上,广泛的流量时间序列数据,可以测量的数量和方向信息的传播。结合高斯核密度估计和滑动窗口方法提出了计算熵和构造动态时空转移因果关系图基于因果关系的显著性检验。指标的影响系数,影响系数,定义输入学位,和输出程度来评估不同路段交通状态的因果相互作用和识别的关键道路和现有道路网络的潜在瓶颈。实验结果基于现实世界的交通传感器数据表明,时变交通因果关系图的结构;不同路段交通因果之间的互动在高峰时间比,在非高峰时间的时间;和关键路段可以被识别,主要是位于主干道的路口,进行大流量的收敛性和色散。

中国博士后科学基金会

2019年m660566

中国国家自然科学基金

72001029

北京市自然科学基金

9182012

1。介绍

交通传感和通信技术的快速发展促进了积累巨大的多源时空交通数据,由回路探测器,收集车辆GPS,和手机 1),提出交通大数据的特点。巨大的,可以提炼出有价值的知识观察时空交通数据,可以应用在数据驱动的智能交通系统(ITS) [ 2]。

多样性、不确定性和大量的交通大数据给其带来更大的挑战。潜在的交通演化特征可以通过数据挖掘技术从大量的历史数据中提取,如相关性分析和关联规则挖掘。一些研究综合交通联系或关联规则采掘到交通流预测模型,提高预测精度( 3- - - - - - 5]。然而,定向因果相互作用不能被这些数据挖掘技术。的事件一个和 B关联关系可以提取基于统计规则” 一个现有的方法 B现有的”,但它仍然是不清楚的一个导致的发生 B或其他因素一个和 B同时出现( 6]。同样,相关分析可以确定一个有关 B但不能验证它们之间的因果关系。

不同对象之间的因果关系、事件或变量普遍存在于自然科学和社会科学( 7]。因果关系可以从观察被检测到非平稳的时间序列数据,和优势还需要合格的 8, 9]。许多因果模型提出了基于概率理论、图论、贝叶斯网络等。 10]。时空交通复杂的因果关系可以发现网络流量状态。例如,如果一个交通堵塞事件发生在一个特定的路段 r 一个在时间 t ,上游相邻路段的交通状态 r b 下次可能会拥挤吗 t + 1 由于交通流量的冲击波,然后 r 一个可以被视为导致的 r b 。

除了交通波的传播在物理网络,交通信息的传播也会导致时空的因果关系。例如,如果在路上发生了严重的交通事故 r 一个 ′ 交通管理部门将发布的交通事故信息导航平台,指导司机避免拥挤的部分 r 一个 ′ 。然后,更多的司机更愿意选择另一条路线,导致严重的交通堵塞段 r b ′ 。虽然 r b ′ 是远离 r 一个 ′ 在太空中,实时交通信息共享加强时空它们之间的因果关系。

然而,很少有研究关注时空交通因果关系建模。先前的研究在交通因果关系定义了基于先验知识的因果关系,如交通堵塞事件的时间顺序,不能量化的潜在因果强度( 11, 12),或使用数据驱动的贝叶斯网络方法,不适合大规模的公路网络,因为复杂的参数估计( 13- - - - - - 15]。交通因果依赖关系通常是结合网络流量评估、交通异常值检测、交通状态预测( 11, 16]。

出于缺乏交通研究因果关系和交通的挑战大数据分析,本研究发展一个动态时空交通因果关系研究框架来捕获网络流量的潜在因果知识状态的决策。主要的科学贡献包括以下:(i)传递熵算法首先利用提取交通因果相互作用的广泛的交通时间序列数据;(2)时空交通因果关系可以通过滑动窗口技术动态地、有效地计算;(3)动态时空的因果关系图可以揭示交通因果结构和识别关键路段和现有道路网络的潜在瓶颈;(iv)该方法可以应用于实时交通管理系统,结合实际应用,如网络流量站评估和预测。

本文的其余部分组织如下。部分 2提供了一个关于交通的因果关系分析文献的总结。部分 3描述了研究框架和传递熵法。部分 4描述了时空的因果关系网络交通流建模。部分 5介绍了基于现实世界的交通传感器数据计算实验。总结了结论部分 6。

2。文献综述

时空数据挖掘方法已经广泛应用于交通拥堵传播和预测。井上et al。 17]提出了频繁模式挖掘方法从交通传感器数据和提取交通堵塞模式展示了交通拥堵产生的过程,从一个数据驱动角度扩散和耗散。乔et al。 18)提出了一个优化的挖掘算法框架推断异常的根源从大型出租车GPS数据。熊等。 19)开发了一种传播图的方法来预测交通堵塞模式在不久的将来基于大型实际车辆轨迹数据。

先前的研究在时空交通因果关系主要采用简单的先验知识方法和定义因果关系根据交通堵塞或异常条件的顺序。刘等人。 11]提取交通异常值的时空因果相互作用通过构造异常值因果关系树根据时间顺序和空间的连续性检测离群值。卡普尔et al。 12]研究了交通拥堵的因果关系在各个路口,交通拥堵传播如何从一个点在各个方向的道路网,并预测可能的传播模式。

此外,动态贝叶斯网络方法用于时空交通因果关系建模。楚et al。 13)提出了一种时变动态贝叶斯网络流量因果关系建模,研究了区域宏观结构基于车辆轨迹数据,并提取道路连接依赖结构从传感器数据。皇后和阿尔伯斯( 14)提出了一种多变量动态贝叶斯网络模型来捕获条件独立性和交通流时间序列的因果关系。贝叶斯网络中变量之间的因果关系和滞后时间序列之间的因果关系的动态贝叶斯网络可以被设置外部干预。阮et al。 15)确定交通拥堵传播模式从时空的交通数据和估计拥堵传播概率动态贝叶斯网络。潜在的因果关系结构,可以提炼出基于动态贝叶斯网络建模,但大量计算资源的消耗来估计参数,尤其是大规模的公路网络。

上述时空交通因果关系建模方法要么过于简单,无法完全捕捉潜在的时空的因果关系和非线性特性或计算复杂,不适合大规模路网交通状态分析。

最近,信息理论休闲方法吸引了太多的关注,它可以衡量和量化的因果关系 7]。格兰杰因果关系检验是一种有效的方法来识别潜在的因果关系的时间序列数据( 20.- - - - - - 22]。格兰杰因果关系原则的描述如下:如果变量 Y 可以更好地预测使用的历史价值 X 和 Y ,而不是唯一的历史价值 Y , X 变量可以被视为格兰杰原因 Y 。李等人。 16)开发了一种格兰杰causality-based因果依赖采矿方法进行交通预测和发现道路网络结构之间的关系和交通流时间序列之间的相关性通过因果图的依赖。变量之间的线性或非线性关系需要以为格兰杰因果分析。

传递熵是一个相对新兴的信息理论方法,可以评估因果关系相关,因为它不对称。格兰杰因果方法相比,传递熵不需要假设变量之间的因果关系的形式,适合长时间序列分析的非线性系统,并已广泛应用于神经科学( 23)、化学( 24)、金融( 25),工业过程( 26),等等。传递熵可以测量方向和数量的信息传输,适合网络交通流的非线性因果关系时空建模。

3所示。方法 3.1。研究框架

本研究提出了一种动态时空因果建模框架,如图 1。首先,传输采用熵检测时空交通因果关系的巨大流量时间序列数据的大规模的公路网络。合并后的高斯核密度估计和滑动窗口方法提出了计算熵转移矩阵,可以表示的动态非线性因果关系不同路段的交通状态。其次,因果相关系数矩阵计算基于熵转移矩阵。受影响的系数和影响力系数定义,以确定潜在的瓶颈和关键路段在不同时期的道路网络。最后,动态时空的因果关系图建立了基于因果关系的显著性检验。输入和输出度提出了评估网络流量状态的时空的因果关系。

图1

研究框架。

这一研究框架的优点如下:(i)的非线性因果互动关系可以从巨大的交通流时间序列中提取数据,有助于深入理解复杂网络流量状态;(2)因果关系的方向和强度可以确定基于熵的不对称转移;(3)滑动窗口方法可以保证转让熵的计算效率大规模道路网络;(iv)的动态时空交通因果关系图可以显示出时变交通因果结构。

3.2。信息熵的基本概念

香农提出的信息熵的基本概念( 27简要解释。 x 我我 = 1、2 , … , n 是设置为离散变量的状态吗 X。的信息我 x 我为变量 x 我被定义为( 1), 我 x 我 ≥ 0 。更大的概率 x 我 ,越小的信息我 x 我 ,小的不确定性 x 我。相反,概率越小 x 我 ,更大的信息我 x 我和更大的不确定性 x 我。当的概率 x 我 1,信息我 x 我是0。 (1) 我 x 我 = − 日志 p x 我。

信息熵 H x 数学期望的定义为信息我 x 我为 X计算( 2)。信息熵 H x 能反映的平均数量的不确定性和信息 X。信息熵越大 H x 信息量越大,变量 X;信息熵越小 H x ,为变量的信息量越小 X。 (2) H x = E 我 x 我 = − ∑ 我 = 1 n p x 我日志 p x 我。

互信息米 X , Y 提出了量化两个相关变量之间的公共信息,如(所示 3)。更大的互信息米 X , Y ,变量之间的相关性越强 X和 Y。然而,互信息是对称的,不能代表信息传递的方向。 (3) 米 X , Y = ∑ 我 = 1 n ∑ j = 1 n p x 我 , y 我日志 2 p x 我 , y j p x 我 p y 我。

3.3。传递熵

2000年,施赖伯[ 28]提出转移熵来衡量的信息量传输和基于信息不对称之间的交互系统理论。传递熵 TE Y ⟶ X 两个离散系统 X , Y 计算( 4), x 我和 y 我代表国家的价值 X 和 Y 当时我 ,分别。 x 我 k = x 我 , x 我 − 1 , … , x 我 − k + 1 表示的值 X 在时间期间我 , 我 − k + 1 代表过去的状态 k 的时刻。 y 我 l = y 我 , y 我 − 1 , … , y 我 − l + 1 表示的值 Y 在时间期间我 , 我 − l + 1 代表过去的状态 l 的时刻。 p x 我 + 1 , x 我 k , y 我 l 是联合概率。 p x 我 + 1 | x 我 k , y 我 l 和 p x 我 + 1 | x 我 k 条件概率。传递熵一直被视为一种因果关系的指标由于其不对称的性质。 (4) TE Y ⟶ X = ∑ x 我 + 1 , x 我 k , x 我 l p x 我 + 1 , x 我 k , y 我 l 日志 p x 我 + 1 | x 我 k , y 我 l p x 我 + 1 | x 我 k 。

传输信息熵的熵代表了不同 x 我 + 1 与之间的情况 x 我 k 和 y 我 l 知道,只有 x 我 k 已知的。如果 X 在特定的时间完全由它的历史状态,未连接 Y ,将熵是0。的参数 k , l 的采样周期吗 X , Y 传递熵的计算。的增加 k , l ,需要更多的计算资源和数据来估计的联合概率密度。考虑到信息传播时间延迟的影响,鲍尔et al。 29日)修改传递熵的计算通过嵌入预测地平线 h,见 (5) TE Y ⟶ X = ∑ x 我 + 1 , x 我 k , x 我 l p x 我 + h , x 我 k , y 我 l 日志 p x 我 + h | x 我 k , y 我 l p x 我 + h | x 我 k 。

施赖伯传递熵的定义是基于假设系统应该近似平稳马尔科夫过程,以及当前系统状态只取决于过去的状态在有限时间内。如果不满足马尔可夫过程的假设,把熵可能不是合适的测量系统的因果关系( 24]。交通流的演化一直被视为是符合“马尔可夫过程”的本质 30.]。因此,熵是适合转移时空建模网络交通流的因果关系。

随着预测地平线不同,参考 x 我 k 会改变。本研究采用提出的修改传递熵蜀和赵 24)( 6)。 x 我 k 取而代之的是 x 我 + h − 1 k ,这是更适合评估转让熵考虑时间延迟。 (6) TE Y ⟶ X = ∑ x 我 + 1 , x 我 + h − 1 k , x 我 l p x 我 + h , x 我 + h − 1 k , y 我 l 日志 p x 我 + h | x 我 + h − 1 k , y 我 l p x 我 + h | x 我 + h − 1 k 。

3.4。计算方法传递熵

的联合概率密度( 5)估计的核密度估计函数。的概率密度估计( 7)。 K x − x 我核函数的值是在哪里 x 我。概率密度 p ^ x 内核函数值的平均值在一定范围内。核密度估计方法不依赖于数据的先验分布,也适用于非高斯分布的数据。高斯核函数是用来估计为每个路段交通状态的概率密度( 8)。的参数 θ 表示窗口的宽度的计算核函数的值。 (7) p ^ x = 1 N ∑ 我 = 1 N K x − x 我 , (8) K x − x 我 = 1 2 π θ e − x − x 我 2 / 2 θ 2 。

联合概率密度 p ^ x , y 为 x , y 所示( 9),和相应的联合高斯核函数计算( 10)。 (9) p ^ x , y = 1 N ∑ 我 = 1 N K x − x 我 , y − y 我 , (10) K x − x 我 , y − y 我 = K x − x 我 K y − y 我 = 1 2 π θ 2 e − x − x 我 2 + y − y 我 2 / 2 θ 2 。

不同变量之间的相互作用随时间。滑动窗口技术是利用动态计算沿时间轴之间传递熵变量,它可以减少采样数据大小和提高效率的因果关系分析。滑动窗口描述靠窗的宽度 w 和移动步长 l。原始状态空间分为 n连续的子空间年代我。每个窗口由 w 时间间隔。移动步长 l小于 w 。窗口的宽度 w 不应该太小;否则,小窗口中的采样数据会影响核密度估计的准确性。移动步长 l不应该太大;否则,它不能及时反映信息传输过程的变化。如图 2对于时间序列数据的长度 l时间间隔,滑动窗口开始以一个固定的步长 l。对于每一个窗口,计算概率密度,然后传递熵向量的维度可以获得 p = l − w + 1 随着时间的推移,这可以反映出时变传输信息。

图2

滑动窗口的原理图。

道路网络组成的米公路段是用来说明熵转移矩阵的计算。每个路段的交通状态可视为一个变量,从而为这个交通系统变量的总数米。之间传递熵计算任意两个变量,然后二维熵转移矩阵 T 米 × 米获得对于每个滑动窗口,如图所示( 11)。考虑到转移的方向熵, T 米 × 米不是一个对称矩阵,每一对的公路段, t 我 j ≠ t j 我。对角线上的元素都是0。 (11) T 米 × 米 = 0 t 12 ⋯ t 1 米 t 21 0 ⋯ t 2 米 ⋮ ⋮ ⋱ ⋮ t 米 1 t 米 2 ⋯ 0 。

在消除对角线零元素后,传递熵矩阵 T 米 × 米每个滑动窗口转换成一个行向量 t e 我 = t 12 我 , t 13 我 , … , t 1 米我 , t 21 我 , t 23 我 , … , t 米米 − 1 我。窗口的幻灯片后开始结束的时间序列, p 传递熵向量可以获得。然后,所有传递熵向量集成在一起,形成一个转移熵矩阵的维度 p × 米 2 − 米路网交通状态,这可以表示不同路段之间的信息传输。滑动窗口可以提高转移熵的计算效率利用有限的数据在每个窗口中,这使得它适用于实时交通管理系统。 (12) t e = t 12 1 , t 13 1 , … , t 1 米 1 , t 21 1 , t 23 1 , … , t 米米 − 1 1 t 12 2 , t 13 2 , … , t 1 米 2 , t 21 2 , t 23 2 , … , t 米米 − 1 2 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ t 12 p , t 13 p , … , t 1 米 p , t 21 p , t 23 p , … , t 米米 − 1 p 。

4所示。时空的因果关系网络交通流建模 4.1。因果关系的显著性检验方法

因果推论,假设因果关系之间存在任何两个不同的交通状态变量 X和 Y因果关系,然后需要基于实测资料的验证。原因变量和结果变量可以通过因果关系分析歧视。传递熵是不对称的,因为相反的方向传输的信息量是不同的。确定因果关系的方向和强度,因果相关系数 ρ X , Y 定义模型的因果强度( 29日]。因果关系的方向和强度是衡量之间的区别 TE Y ⟶ X 和 TE X ⟶ Y ,见 (13) ρ X , Y = TE Y ⟶ X − TE X ⟶ Y 。

当传递熵 TE Y ⟶ X 的方向 Y ⟶ X 大于 TE X ⟶ Y 的方向 X ⟶ Y , Y是原因变量的 X,信息传递的方向 Y ⟶ X 。相反,当 TE Y ⟶ X 小于 TE X ⟶ Y , X是原因变量的 Y,信息传递的方向 X ⟶ Y 。当 TE Y ⟶ X 等于 TE X ⟶ Y , ρ X , Y = 0 ,之间没有因果关系 X和 Y。由于数据噪声或干扰,因果相关系数 ρ X , Y 一般不等于0。如果 ρ X , Y 太小,因果相关性不显著。然后,有必要设置一个因果相关系数阈值来定义重要的因果关系,即因果关系的显著性检验。如果 ρ X , Y 超过阈值,之间的因果关系 X和 Y是显著的。

因果关系的显著性检验可以被视为一个假设检验问题确定因果关系。零假设是如果 ρ X , Y 很小,之间没有因果关系 X和 Y。如果 ρ X , Y 足够大,零假设被拒绝,和之间存在因果关系 X和 Y。鲍尔et al。 29日)使用蒙特卡罗方法来重建一个新的替代时间序列的因果关系显著性检验,这应该满足以下假设:之间的因果关系 X和 Y完全摧毁,统计分布的 X和 Y保持不变。本研究利用段提出的方法等。 31日破坏的原始时间序列 X和 Y与 l时间间隔。新的时间序列 X ′ 和 Y ′ 构造,见( 14)。重建的时间序列的统计分布 X ′ 和 Y ′ 与原时间序列是一致的吗 X和 Y。 (14) X ′ = x 我 , x 我 + 1 , … , x 我 + 米 − 1 , Y ′ = y j , y j + 1 , … , y j + 米 − 1 , 在哪里米的长度是 X ′ 和 Y ′ ; 我 , j 是随机选择的 1、2 , … , l − 米 + 1 ;和我 − j ≥ e ,在那里 e 远远大于预测地平线 h 确保几乎没有因果关系 X ′ 和 Y ′ 。然后,因果相关系数 ρ = ρ 1 , ρ 2 , ρ 3 , … , ρ N 计算为 X ′ 和 Y ′ 。表示因果关系的显著性检验进行( 15), μ ρ 和 σ ρ 的平均值和标准偏差 ρ 1 , ρ 2 , ρ 3 , … , ρ N 。意义阈值 ε 是设置为 μ ρ + 3 σ ρ 。当因果关系系数 ρ X , Y 小于 ε ,之间没有因果关系 X和 Y;当因果关系系数大于 ε 之间存在显著的因果关系 X和 Y。 (15) ρ X , Y − μ ρ ≥ 3 σ ρ 。

4.2。网络流量状态评估

评估网络流量状态,影响系数和影响系数定义为每个公路段。道路段我的影响系数 R 出我表示把熵从道路段的总和我其他道路段在网络( 16),它可以描述道路段的影响我另一方面公路段。同样的,受影响的系数 R 在我表示转移熵之和其他路段道路段我( 17),它可以描述其他道路段目标道路上的影响我。

数据驱动的方法识别潜在的瓶颈和关键路段提出了从时空的因果关系的角度分析。道路段大 R 在我可以被视为潜在的瓶颈环节,这是最有可能受到网络中其他路段的交通状态。道路段大 R 出我可以被视为关键路段,最有可能影响其他路段的交通状态。 (16) R 出我 = ∑ j TE 我 ⟶ j , (17) R 在我 = ∑ j TE j ⟶ 我。

4.3。动态时空交通因果关系图

时变网络流量状态会导致动态时空的因果关系图。由于熵的不对称转移,时空交通因果关系图是有向图,代表动态交通状态变量的因果结构,如图 3。道路网络组成 n 公路段所表示的节点 r 1 , r 2 , … , r n 。导演边演示显著因果关系两个路段的交通状态。时空的因果关系图在不同的时间片的结构有很大的不同。例如, r 我引起的吗 r j 在时间 t − 1 ,而他们之间没有联系 t 和 t + 1 。任意两个路段之间的因果强度定义为定向边的重量。因果关系系数 ρ r 我 , r j 道路段 r 我和 r j 在 t − 1 , t 基于传递熵计算 TE r j ⟶ r 我和 TE r 我 ⟶ r j 根据( 13)。因果关系矩阵 W t 传递熵在时间 t计算( 18)。定向边缘,并有很强的因果关系相关的重量设置为1时,体重是设置为0且没有明显的因果关系。然后,可以删除冗余连接建设的因果关系图。因果关系矩阵的计算过程如图 4。 (18) W t = w 我 , j t = 1 , TE 我 ⟶ j t > TE j ⟶ 我 t , ρ 我 , j t ≥ ε , w 我 , j t = 0 , 其他人。

图3

动态时空交通因果关系图。

图4

因果关系矩阵的计算过程。

基于动态时空的因果关系图,提出了四项指标来评估道路网络中的任何道路段的影响从因果关系的角度依赖性。输入学位 D 在 t 我被定义为( 19),表示其他的交通状态的影响 n − 1 道路段的 r 我在时间 t 。输出的程度 D 出 t 我被定义为( 20.),表示道路段交通状态的影响 r 我另一方面 n − 1 公路段。输入度的总和总和 D 在我和输出度的总和总和 D 出我定义量化道路段之间的因果关系 r 我和其他道路段时间期间 T 所示( 21)和( 22)。 (19) D 在 t 我 = ∑ j n − 1 w j 我 t , (20) D 出 t 我 = ∑ j n − 1 w 我 j t , (21) 总和 D 在我 = ∑ t T ∑ j n − 1 w j 我 t , (22) 总和 D 出我 = ∑ t T ∑ j n − 1 w 我 j t 。

5。实验和讨论 5.1。数据描述

上海在中国的高速公路网络是利用测试提出的因果关系分析方法。交通流回路探测器收集数据的分布式网络,如图 5。详细说明了数据预处理过程在我们之前的研究中,包括数据聚合,缺失的数据估计和数据降噪( 32]。交通速度数据在2014年5月6日,432年公路段高速公路网络是用于验证拟议中的时空交通因果关系的方法。交通流数据的时间间隔为10分钟。

图5

上海高速公路网络( 32]。

5.2。敏感性分析转移熵

在这项研究中,考虑到有限的计算资源,参数 k和 l设置为1。最大延时设置为40分钟,和参数 h预测地平线是设置为 1, 4]。熵可以计算任意两个部分之间转移的不同的方向。例如, r 220年上游段路吗 r 223年和的变化 TE r 220年 ⟶ r 223年和 TE r 223年 ⟶ r 220年如图 6。

图6

传递熵的变化在不同的方向:(a) TE r 220年 ⟶ r 223年 ;(b) TE r 223年 ⟶ r 220年。

(一) (b)

熵在不同的方向转移 r 220年和 r 223年表所示 1。例如, TE r 223年 ⟶ r 220年大于 TE r 220年 ⟶ r 223年在晚上高峰时间18:30, TE r 223年 ⟶ r 220年大于 TE r 220年 ⟶ r 223年在非高峰时间的时间13:30。因此,下游段 r 223年有更明显的影响在上游段吗 r 220年在晚上高峰拥堵期,而上游段 r 220年有更明显的影响在下游段吗 r 223年在非高峰时间的时期。

表1

在不同的时间段传递熵值。

	早上高峰时间8:30		非高峰时间的时间13:30		晚高峰时间18:30
	TE r 220年 ⟶ r 223年	TE r 223年 ⟶ r 220年	TE r 220年 ⟶ r 223年	TE r 223年 ⟶ r 220年	TE r 220年 ⟶ r 223年	TE r 223年 ⟶ r 220年
h= 1	0.0169	0.0120	0.0205	0.00722	0.0173	0.0250
h= 2	0.0133	0.0485	0.0205	0.00749	0.0172	0.0247
h= 3	0.0152	0.0459	0.0112	0.00749	0.0173	0.0234
h= 4	0.0137	0.0567	0.0205	0.00751	0.0172	0.0228

除了参数 k, l, h因果关系系数阈值 ε 还需要设置。当构建时空因果图,因果关系的阈值 ε 剩余的数量增加,减少边缘显著的因果关系。熵和因果关系转移系数计算任意两段之间基于交通速度为整个道路网络数据集在5月6日,2014年。中值 μ ρ 和标准偏差 σ ρ 将熵的干扰序列 X ′ 和 Y ′ 分别是0.0151和0.0116,然后阈值 ε 将根据 ε = μ ρ + 3 σ ρ = 0.05 。不同的设置 ε 会影响时空因果图的结构。定向边的数量与不同交通因果图 ε 表所示 2。

表2

总导演边交通与不同的因果关系图 ε 。

ε	总导演边缘
0.01	5081635
0.05	184323年
0.06	39318年
0.09	33

考虑计算复杂度,三个关键参数设置为 k = 1 , l = 1 , h = 1 。时变传输熵在不同的方向, TE r 220年 ⟶ r 223年和 TE r 223年 ⟶ r 220年 ,如图 7。交通的变化因果关系系数 ρ r 220年 , r 223年如图 8。相邻路段之间的传递熵随时间变化很大。信息传输的方向和数量不同时期有很大的不同。例如,10点之间信息传输的方向和18:00主要 r 223年 ⟶ r 220年 ,18:00之间信息传输的方向和晚上九点是主要的 r 220年 ⟶ r 223年。因果关系系数的分布网络交通流集中,如图 9。

图7

传递熵的变化在不同的方向。

图8

交通的变化因果关系系数。

图9

因果关系系数的分布。

5.3。时空交通因果关系分析

转移不同路段之间的熵值与时间和空间波动很大,反映了信息传递的变化。每一段路都可能是潜在的原因或结果。的影响系数 R 出我和影响系数 R 在我所有的道路段早上高峰时间,晚高峰时间,非高峰时间的时间如图 10。网络中的每个道路段由一个泡沫。泡沫的大小表示道路段的平均速度。气泡的分布是由 R 出我和 R 在我 ,它可以定量描述的交互网络交通流状态。早上高峰时间的泡沫是最分散的。表 3列出了潜在的瓶颈段最大的 R 在我和最大的关键路段 R 出我。潜在瓶颈段的空间位置和关键路段的道路网络图所示 11。的关键道路段主要分布在中部和西部地区的上海城市。

图10

分配系数影响的影响系数和道路网络:(a)早上高峰时间;(b)非高峰时间的时间;(c)晚上高峰时间。

(一) (b) (c)

表3

潜在的瓶颈部分和关键路部分。

	潜在的瓶颈部分	关键路段
早上高峰时间	r 35 , r 328年 , r 70年	r 123年 , r 36 , r 30.
非高峰时间的时间	r 341年 , r 323年 , r 251年	r 22 , r 348年 , r 61年
晚高峰时间	r 429年 , r 318年 , r 95年	r 16 , r 226年 , r 224年

图11

空间分布的关键路段:(a)潜在瓶颈段;(b)关键路段。

(一) (b)

并不是所有的交通因果相关性显著。在本节中,阈值 ε 设置为0.05的因果关系显著性检验。输入度的总和总和 D 在我和输出度总和 D 出我计算的早上高峰期(7:00-10:00),非高峰时间的时期(13:00-16:00),和晚上高峰期(17:00-20:00)。的分布总和 D 在我和总和 D 出我如数据所示 12和 13,分别。输出度分布更集中输入度分布。总的来说, 总和 D 在我在早上高峰时间比的大晚上高峰时间。的分布总和 D 在我在非高峰时间的小时值较小的分散,因此道路段更有可能影响其他路段交通拥堵的交通状态。同样的, 总和 D 出我在早上高峰时间比,大晚上高峰和非高峰时间的小时。道路段更有可能影响其他路段的交通状态。一般来说,不同路段之间的因果关系在高峰时间段是更重要的比非高峰时间的时间段。

图12

分布的总和 D 在我对不同时期:(一)早上高峰时间;(b)非高峰时间的时间;(c)晚上高峰时间。

(一) (b) (c)

图13

分布的总和 D 出我对不同时期:(一)早上高峰时间;(b)非高峰时间的时间;(c)晚上高峰时间。

(一) (b) (c)

5.4。时空交通因果关系可视化和评估

上海高速公路网络的时空交通因果关系图在早上8:30高峰时间,在非高峰时间的时间13:30,18:30在晚上高峰时间显示在图 14,它可以代表输入和输出度的空间分布特征。此外,圆圈表示的输出度高速公路段。圆越大,输出程度越大,展示更重要影响网络中其他路段的交通状态。直接因果边缘描述因果关系两个部分之间的关系。每个导演的头箭头边缘连接到公路段的影响,而每个导演边缘连接到引起公路段。箭头在每个圆的密度可以将其他道路段的影响目标段。

图14

的可视化时空交通因果关系图:(a)早上高峰时间;(b)非高峰时间的时间;(c)晚上高峰时间。

(一) (b) (c)

圈的分布和直接因果边缘是不同时期不同。公路段的输出度峰值的时间通常比那些非高峰时间的时间。在早上高峰时间,输出度较大的路段主要是位于南北高速公路,东西向的高速公路,内环道路,和南部的中产。在晚上高峰时间,道路段与更大的输出学位主要位于东部内环高速公路。一般来说,这些关键道路段主要位于主干道的路口,进行收敛性和分散的大流量,并且更重要的对其他道路交通状态的影响。

圆分布在东外环区域小于其他领域,和直接的因果也比其他领域,稀疏的边缘尤其是在非高峰时间的期间,表明道路段在这方面没有明显的因果互动与其他道路段。这一现象的主要原因是,东部地区发展相对较晚网络可访问性较弱,这是不太可能影响到其他地区的交通状态。此外,东部地区的交通状况通常是光滑,减少对交通流的影响在其他地区。

关键路段的空间位置 r 302年 , r 391年 , r 286年 , r 181年大上午8点30度可视化在图输出 15。特定的空间结构 r 302年 , r 391年 , r 286年 , r 181年如图 16。黄色部分都是关键路部分,绿色部分是入口和出口坡道或交换坡道。公路段 r 302年 , r 391年 , r 286年位于附近的十字路口和高速公路进出口与复杂的交通流。 r 181年位于中间的东西高速公路,这是主要的走廊和熊在上海最大的交通量东西方向。这些关键道路段通常是拥挤的,这可能会影响到交通道路网络中的其他部分。

图15

空间位置的关键路段。

图16

空间结构的关键路段:(a) r 302年 ;(b) r 391年 ;(c) r 286年 ;(d) r 181年。

(一) (b) (c) (d)

一般来说,确定关键路段符合公路网络的空间结构和交通条件,从而证明转让熵是适合评估因果网络交通流的相互作用。实时交通控制措施可以采取的时变关键路段或潜在的瓶颈,以防止交通拥堵,提高交通运行效率。此外,道路网络结构的潜在缺陷在未来可以优化。

6。结论

本研究提出了一种新颖的动态时空的因果关系建模框架,它可以代表网络交通流的信息传输和识别潜在的瓶颈和现有道路网络的关键路段。高斯核密度估计方法用于计算熵不同路段之间的转移。揭示交通因果关系的动态变化,滑动窗口技术是用于传递熵的计算。因果关系的显著性检验进行构造时空的因果关系图。本研究可以有效地从大量的交通数据中提取潜在的非线性因果关系并提供一个数据驱动的研究框架来确定关键路段道路网络和潜在的瓶颈。检测到动态时空交通因果关系可以结合交通预测实时交通管理系统。

实验结果的基础上,为上海高速公路网络交通传感器数据表明,传输网络交通流熵是不对称的,与时间和空间波动明显。输出和输入学位高峰时间通常比那些在非高峰时间的小时和更多的信息传递和更强的因果相互作用网络交通流。输出度较大的关键道路段主要位于十字路口,轴承的收敛性和色散大流量和有重大影响的交通道路网中其他部分的状态。因果关联路段的畅通情况在非高峰时间的时间低于峰值的时间。

这项研究没有考虑道路网络的连通性。在未来,我们将网络拓扑结构集成到时空交通因果关系分析,然后制定交通拥堵传播模式识别模型。此外,交通因果关系分析可以进一步结合交通拥堵预测。

数据可用性

使用的数据来支持本研究的发现并不公开。详情请联系相应的作者。

的利益冲突

作者宣称没有利益冲突有关这篇文章的出版。

确认

这项工作得到了中国博士后科学基金会(2019号m660566),中国国家自然科学基金(72001029),和北京市自然科学基金(9182012)。

爱死

G。

道路交通数据:收集方法和应用,论文工作的能量

交通和气候变化 2008年 1 1 55

张

J。

王

F.-Y。

王

K。

林

W.-H。

徐

X。

陈

C。

数据驱动的智能交通系统:一个调查

IEEE智能交通系统 2011年 12 4 1624年 1639年

10.1109 / tits.2011.2158001

2 - s2.0 - 82455210975

唐

J。

李

胡

Z。

刘

F。

短期交通流预测考虑时空相关性:一个混合模型梳理2型模糊c和人工神经网络

IEEE访问 2019年 7 101009年 101018年

10.1109 / access.2019.2931920

蔡

P。

王

Y。

陆

G。

陈

P。

丁

C。

太阳

J。

一个时空相关再短期交通多步预测模型

交通研究部分C:新兴技术 2016年 62年 21 34

10.1016 / j.trc.2015.11.002

2 - s2.0 - 84947982812

温

F。

张

G。

太阳

王

X。

徐

X。

混合交通拥堵预测的时态关联规则挖掘方法

计算机与工业工程 2019年 130年 779年 787年

10.1016 / j.cie.2019.03.020

2 - s2.0 - 85063047117

西尔弗斯坦

C。

布林

年代。

Motwani

R。

Ullman

J。

可伸缩的矿业因果结构的技术

数据挖掘和知识发现 2000年 4 163年 192年

10.1023 /:1009891813863

Hlavackovaschindler

K。

Paluš

M。

Vejmelka

M。

巴塔查里亚

J。

因果关系检测基于信息理论方法在时间序列分析

物理的报告 2007年 441年 1 1 46

10.1016 / j.physrep.2006.12.004

2 - s2.0 - 33947524701

黄

B。

张

K。

龚

M。

针对

C。

因果关系的发现和预测与状态方程模型在不稳定的环境中

机器学习研究的程序 2019年 97年 2901年

黄

B。

张

K。

张

J。

因果关系的发现来自异构/非平稳的数据

机器学习研究杂志》上 2020年 21 1 53

珍珠

J。

因果关系:模型、推理和判断 2000年

英国剑桥

剑桥大学出版社

刘

W。

郑

Y。

乔拉

年代。

元

J。

兴

X。

发现时空因果相互作用在交通数据流

第17届ACM SIGKDD学报》国际会议上知识发现和数据挖掘

2011年8月

圣地亚哥,加州,美国

1010年 1018年

卡普尔

V。

Saxena

D。

Raychoudhury

V。

库马尔

年代。

实时构建和维护因果堵塞图智能交通管理

学报2018年IEEE国际会议上普适计算和通信车间(PerCom研讨会)

2018年3月

希腊雅典

IEEE

770年 775年

10.1109 / PERCOMW.2018.8480324

2 - s2.0 - 85056462030

楚

诉W。

黄

r·K。

刘

W。

陈

F。

时空数据的因果结构的发现

数据库系统高级应用程序 2014年

柏林,德国

施普林格

236年 250年

女王

c . M。

阿尔伯斯

c·J。

干预和因果关系:使用一个动态贝叶斯网络预测交通流量

美国统计协会杂志》上 2009年 104年 486年 669年 681年

10.1198 / jasa.2009.0042

2 - s2.0 - 66549102138

阮

H。

刘

W。

陈

F。

发现在时空交通拥堵传播模式的数据

IEEE大数据 2016年 3 169年 180年

李

苏

X。

王

Y。

林

Y。

李

Z。

李

Y。

强大的因果依赖挖掘大数据网络及其交通流预测中的应用

交通研究部分C:新兴技术 2015年 58 292年 307年

10.1016 / j.trc.2015.03.003

2 - s2.0 - 84940460996

井上

R。

Miyashita

一个。

杉

M。

矿业的时空模式拥挤的交通在城市交通传感器数据

学报2016年IEEE 19国际会议上智能交通系统(ITSC)

2016年11月

巴西里约热内卢

IEEE

731年 736年

10.1109 / ITSC.2016.7795635

2 - s2.0 - 85010063129

乔拉

年代。

郑

Y。

胡

J。

推断在道路交通异常的根本原因

学报2012年IEEE国际会议12日在数据挖掘

2012年12月

比利时布鲁塞尔

IEEE

141年 150年

10.1109 / ICDM.2012.104

2 - s2.0 - 84874085057

熊

H。

Vahedian

一个。

周

X。

李

Y。

罗

J。

预测交通拥堵传播模式:传播图的方法

第11届ACM SIGSPATIAL学报》国际计算交通科学研讨会

2018年11月

美国西雅图,华盛顿州

60 69年

20.

格兰杰

c·w·J。

研究因果关系的计量经济模型和交叉谱方法

计量经济学会》杂志上 1969年 37 3 424年 438年

10.2307 / 1912791

格兰杰

c·w·J。

测试的因果关系

经济动力学与控制杂志》上 1980年 2 329年 352年

10.1016 / 0165 - 1889 (80)90069 - x

2 - s2.0 - 0011046885

布瑞斯勒

s . L。

赛斯

答:K。

Wiener-Granger因果关系:一个完善的方法

科学杂志 2011年 58 2 323年 329年

10.1016 / j.neuroimage.2010.02.059

2 - s2.0 - 80051715130

Wibral

M。

韦森特

R。

林德纳

M。

传递熵在神经科学

指示信息在神经科学的措施 2014年

施普林格,德国柏林

3 36

蜀

Y。

赵

J。

数据驱动的因果推论基于修改转移熵

计算机与化学工程 2013年 57 173年 180年

10.1016 / j.compchemeng.2013.05.011

2 - s2.0 - 84883459683

腾

Y。

商

P。

传递熵系数:量化级别金融时间序列之间的信息流动

自然史答:统计力学及其应用 2017年 469年 60 70年

10.1016 / j.physa.2016.11.061

2 - s2.0 - 84997080495

杨

F。

Sirish

l S。

肖

D。

签署了有向图的工业流程建模和验证的基于数据的方法

学报2010年会议上控制和容错系统(SysTol)

2010年10月

不错,法国

IEEE

387年 392年

10.1109 / SYSTOL.2010.5676059

2 - s2.0 - 78751652880

香农

c, E。

通信的数学理论

贝尔系统技术杂志 1948年 27 3 379年 423年

10.1002 / j.1538-7305.1948.tb01338.x

2 - s2.0 - 84940644968

以下两

T。

测量信息传递

物理评论快报 2000年 85年 2 461年

10.1103 / physrevlett.85.461

2 - s2.0 - 12944275674

29日

鲍尔

M。

考克斯

j·W。

Caveness

m . H。

波动

J·J。

Thornhill

n . F。

发现扰动传播的方向在化学过程中使用转移熵

IEEE控制系统技术 2006年 15 12 21

30.

余

G。

胡

J。

张

C。

壮族

首歌

J。

短期交通流预测基于马尔可夫链模型

《IEEE IV2003智能车辆研讨会

2003年6月

美国哥伦布,哦

IEEE

208年 212年

10.1109 / IVS.2003.1212910

2 - s2.0 - 84908258002

31日

段

P。

杨

F。

沙阿

s . L。

陈

T。

熵为零转移和它的应用程序用于捕获变量之间因果关系

IEEE控制系统技术 2014年 23 855年 867年

杨

年代。

吴

J。

徐

Y。

杨

T。

揭示异构时空的城市道路网络交通流模式通过张量decomposition-based聚类方法

自然史答:统计力学及其应用 2019年 526年

120688年

10.1016 / j.physa.2019.03.053

2 - s2.0 - 85064732347