文摘

总结的结果努力旨在改善武广高速铁路列车运行时刻表(WG-HSR)。real-record列车运行和旅客订票业务的记录WG-HSR火车上用于统计分析服务质量和乘客分布。更具体地说,每个车站的列车服务频率和间隔时间进行了分析。在此基础上,产能利用率的时间和空间分布的每个部分。为了得到一个全面的视图的客流特征,不同时期期间的客流量和几个来源和目的地之间(OD)对研究旅游者的时空特征的偏好。一些长途列车上乘客分布显示的数量和比例的横条线乘客乘坐WG-HSR。此外,为更好地了解火车的座位产能利用率,列车在各部分的负载率和时间调查。具体来说,列车的平均负载率之间的关系和列车运行距离是探索,发现non-cross-line火车旅行的时间越长,平均负载率越高。这项研究提供了深刻的发现帮助理解高铁运营和开展进一步的研究。

1。介绍

中国的高铁运输需求快速增长。到2021年底,中国的高铁运营里程累积到40000公里,居世界第一(1]。到2021年4月30日,客流量已经超过10总共花掉几百亿美金,占所有的乘客乘火车旅行的40% (2]。高铁已经成为首选的运输方式与舒适的特点,迅速,方便,准时率。例如,京广高铁2011年开始运营以来,航空客运量从北京到武汉已经下降了23.8% (3]。

WG-HSR,最繁忙的铁路走廊之一在中国的高铁网络,运输大量的乘客已经自2009年以来13年。中国高铁网络的快速扩张,WG-HSR逐渐成为高铁网络的骨干线路之一。它连接其他高铁线路;因此,很多火车最初离开其他行可能对WG-HSR收敛,导致产能瓶颈。另一方面,不断增长的旅游需求意味着连续高压对现有铁路基础设施的能力。铁路运营商需要不断提高列车操作在指定行和最好的利用的潜在能力,考虑到可接受的水平的训练性能,守时,和安全。扩展的能力在火车站和线部分,有必要理解当前列车运行质量,包括列车服务模式,产能利用率,乘客分布和负载率的火车。在此基础上,更高效的车辆使用情况,列车运行,智能交通管理策略。

系统分析列车运行和客流WG-HSR基于真实记录数据可以导致更好的理解高铁运营的现状,如车站的列车服务频率,火车出发和到达之间的间隔时间,乘客的时空分布,火车的座位容量率。这些测量是重要的高速铁路运营商提供有效、高效和可行的火车时间表和服务。

在最近的十年中,铁路运营提供可靠、准确的数据给铁路规划过程的重要机遇。性能,可用于评估时间表提供洞察铁路业务的随机过程,评估能力,检测瓶颈,分析客流量分布。列车运行的可视化数据与计算机和信息技术的意义,这将帮助运营商更好地识别问题在实践中操作。

高铁列车的性能可以从列车运行的角度,评估乘客分布和负载率。根据列车运行数据和票务中心数据来自中国铁路公司,本文综合分析的结果在中国铁路运营的高铁。本研究的目的是提出综合分析的结果在中国铁路运营的高铁,通过分析大规模列车运行数据,从WG-HSR票数据,真实记录时间表。因此,我们可以理解概述列车服务频率,产能利用率,乘客对各种培训服务的偏好和列车荷载率分布。本文的贡献和创新可以分类如下:(1)提出了一个真正的记录数据驱动的分析框架和声明清楚如何进行量化研究高铁运行的性能。这些提供理论参考和见解对其他研究或设计。统计分析和数据可视化方法应用于框架来检查列车运行的基本机制,乘客分布和负载率。目前,数据驱动的方法广泛应用于交通运输研究领域基于观察记录和摘要是一个很好的尝试对数据分析进行研究。(2)统计分析结果的记录数据可以提供理论补充能力评估、机票预订,乘客和短期预测。列车运行的详细描述质量、产能利用率,乘客分布特征。列车运行中的弱点和潜在缺陷。这些问题的结果有利于从各个方面提高高铁运行的性能,如产能瓶颈识别、铁路规划、评估列车运行趋势,门票的分配。(3)本文尝试第一次尝试全面说明WG-HSR操作的特点,从长期的角度来看,它可以调查WG-HSR操作的演化过程。WG-HSR实际操作分析是进行长期实际记录来自多个数据源的数据,包括火车时刻表,机票预订,和乘客卷。统计分析结果可以反映进化WG-HSR操作。(4)列车运行优化分析可以受益时间表,给洞察如何提高产能利用率。列车服务模式,列车的间隔时间分布事件,并详细提出了产能利用率。特别是操作的时空分布火车,列车到达间隔频率直方图,以及产能利用率的不平衡在不同时期采用统计分析方法和可视化方法解决。(5)客流分析有助于重新安排时间表,铁路规划优化和乘客预测。增强对客流的研究就是从不同的角度进行了分析。特别是时空乘客分布在一天站和部分解决。长途列车上的乘客的比例和乘客的不均匀分布在假日的识别和可视化。沿着WG-HSR OD乘客的特点是专门调查。源基于数据的乘客分析方法是一种创新的尝试估计客流进化机制的深入和全面的探索,这是一个理论补充客运高速铁路的分析。(6)负载率的比较关于不同的火车了。一般负载率之间的关系,探讨了列车的旅行距离,可以探测到的弱点在火车产能利用率和训练能力分配问题提供科学依据。

本文的其余部分组织如下:部分2提出了当前研究的简要回顾关于列车运行数据,乘客出行特征、客流预测,和席位分配问题。部分3轮廓的布局WG-HSR和描述了真实记录铁路公司收集的数据,并提供了本文的分析框架。节4列车运行的统计分析和产能利用率。节5,我们得到系统认可的客流特征,包括乘客的时空分布和客流的成分在一些长途火车。节6显示列车的负荷率,火车负荷率和旅行的距离之间的关系进行了探讨。节7、结论和进一步的研究进行了讨论。

2。文献综述

在最近的十年中,可能实际记录数据的访问允许各种各样的机会来分析铁路业务。数据驱动的方法广泛应用于交通运输研究领域基于观察记录。一些相关研究如下所示。

至于研究关于列车运行数据,型和汉森4]分析了日常使用一个工具叫TNV-Prepare列车运行数据。TNV-Prepare数据包含信号和联锁信息整个交通管制的区域。每列火车事件时间包括火车描述步骤,部分条目和许可,信号,开关点。一些研究人员致力于基于行车记录的数据驱动的可视化。Ushida [5]提出的方法称为彩色图,理清拖延是在哪里发生的,它们是如何传播。Graffagnino [6画一些图形通过数学方法和图形数据可视化方法,以不断优化时间表火车交通历史数据的广泛使用。落等。7)可视化火车交通从基于web的火车交通信息收集的记录数据的彩色图。Kecman和型的8]提出了基于事件数据记录的过程挖掘工具从荷兰火车制图者系统托派分子,包括到达和离开的时间在车站、列车路径跟踪部分,阻挡时间的水平。纳什和Ullius [9)使用开放的时间表来分析实际和计划时间表数据之间的差异和呈现这些信息在各种图形和统计格式改进时间表。孟和周10)描述火车从时间和空间维度通过使用累积流量变量。普拉萨德和Shekhar11)评估印度铁路的客运铁路服务质量发展RAILQUAL仪器基于SERVQUAL和铁路运输质量。汉森(12)描述了计划线网络的主要特点,火车服务,客流量和火车操作基于经验数据的质量。温家宝et al。(13)使用的真实记录列车运行数据WG-HSR目前主要延迟分布,模型主要延迟时间分布,显示列车分布的影响。陈(14WG-HSR)进行了可持续性分析,关注效率和公平方面的铁路直接运输的影响和间接nontransportation影响。程和陈15)进行了一次实证分析以评估高铁影响货运的操作能力和常规铁路客运服务,通过检查运输能力的时空变化特征不同的铁路系统。Ghofrani et al。16)提供了一个全面审查最近的大数据应用三个地区的铁路运输,操作,维护,安全,通过小说分类框架提出的娃(17]。Eltved et al。18)提出k——基于智能卡数据聚类分析的影响长期计划中断铁路客运旅游行为。

票务代理数据而言,许多相关研究真实记录客运票务代理数据集中在乘客出行特征、客流预测,和席位的分配分析。至于旅客出行特征,李et al。19)利用WG-HSR票务代理数据分析乘客从时间和空间方面的不均衡。基于乘客经验数据,章子怡和彝语(20.)定义比例因素呈现客运车站分布的统计特征。青木和Toshiyuki21]分析了在每个车站到达和离开的乘客流。Hetrakul和Cirillo22]调查乘客行为的异构特点在铁路市场基于互联网预订数据有限的个体变量。Celikkol-Kocak et al。23]讨论了当前高铁的旅客出行特征用户从不同方面在土耳其。杨et al。24)不同高铁车站之间的乘客的偏好特征详细分析的基础上从中国高铁走廊客票数据。太阳et al。25)有各种培训服务的旅客的选择行为和他们的机票购买时机决策分析大规模门票销售数据。Cirillo et al。26)提出了一个动态离散选择模型的机票取消交易铁路乘客根据票数据。江et al。27]估计微观分析模拟模型解决既定时间表评价问题基于大乘客的数量的数据,和登机的乘客下飞机,火车负载因素,乘客的等待时间的火车,和等待平台上的乘客的数量考虑在内。

在客流预测方面,蔡et al。28)建造两个新颖的神经网络结构对短期铁路客运需求预测。江et al。29日)提出了一种混合方法结合EEMD和短期预测高铁GSVM流基于乘客经验数据。郑et al。30.)提出了一个两阶段的时间变异勘探方法,一个真正的客流数据集收集从台北捷运公司,为了调查该方法的可行性。赖et al。31日]估计混合短期客流预测模型考虑列车服务频率的影响;京沪高速铁路的运营数据从2012年到2016年被用来验证模型的有效性。

关于座位的分配问题,程32)显示,台湾高速铁路的发展,列车的载荷因素从1月到7月。Ongprasert [33]研究席位的分配问题对城际高速铁路服务在日本,包括收入最大化,乘客平均负载因素,和乘客的数量被拒绝。Hetrakul和Cirillo34]估计乘客选择模型来解释基于票务代理机票购买时机的客运专线信息和解决联合对收益管理定价和座位分配问题。李等人。35]显示列车的培训出勤率和负荷系数WG-HSR然后探索培训出勤率和负荷因素之间的关系,可以导致一个更好的座位分配。Yazdani et al。36]提出了一种实时的座位分配算法来控制乘客的分布与免费席位门票旨在最小化整个路线和登机/降落时间估计仿真系统和性能指标来评估该席位的分配算法的有效性。

尽管上述文学的突破,缺乏系统和详细的高铁列车运行和乘客分布的统计分析基于真实的记录数据。除此之外,很少文献关注负荷率的火车,受限于实际记录数据访问的难度。特别是,当前研究的局限性如下所示。(1)相关的一些文献进行研究的高铁列车运行系统的观点。一般来说,大多数研究评估高铁的性能从一个角度来看,如列车运行质量,主要的客流结构和分布延迟,和产能利用率。然而,很少有研究评估高铁的运行质量同时从不同的方面。(2)目前的研究不能反映列车运行的演化过程相当长一段时间。列车运行与时间表,时间表在中国是编程和经常更新由于显著的乘客需求的变化或基础设施的改善。通常,当前研究时间表评价奉献努力,只专注于一个特定的时间表,一些研究集中在不同的时期不同的时间表。(3)当前研究铁路客流通常以一天为研究单位和使用调查数据,这太粗糙,说明客流的微观特性。有必要考虑出发地和目的地(OD)乘客的时空偏好在一天与列车调度决策线规划阶段,和几个研究OD乘客的出行行为在不同时期(24]。(4)很少有研究关注的时空分析负载率。负载率是一个关键的指标来衡量列车的输送产能利用率。负载率在很大程度上取决于乘客需求,火车路线,训练能力,和起飞时间。分析负载率和影响因素之间的关系是有价值的对列车运行计划延期。

从现有的研究,不同的行车记录WG-HSR线收集从2015年到2016年。首先,基于长期实际记录数据,本文试图进行一个系统分析操作WG-HSR全面质量,关于列车运行,乘客分布,和负荷率,从而提供了一个全面综合的概述高铁的运行质量。然后,以反映列车运行的进化过程在很长一段时间,本文评估时间表在不同时期与多个事实,包括服务频率的火车,火车事件之间的间隔时间,产能利用率的高铁。同时,描述客流的时空参数,探讨乘客的出行行为在不同的时间段和分析旅客OD分布的几个来源和目的地之间对,基于从WG-HSR走廊票务代理数据。此外,为更好地了解列车荷载率,探讨横条线列车的负载率分布和non-cross-line列车,分别。负载率是影响列车的运行距离和起飞时间。负载率的曲线变化与火车的路线和出发时间。

高铁列车运行质量和乘客分布的分析基于长期实际记录数据对进一步的研究和实践有积极意义,特别是对于中国技术,可以对高铁的优化操作。

3所示。数据描述和分析框架

3.1。数据描述
3.1.1。描述WG-HSR布局

在中国南方,WG-HSR直接连接武汉和广州1069公里。图1显示的布局WG-HSR和站在直线上。有17个站和表1列出每个站的缩写。注意,乐昌东车站(特性)WG-HSR没有为乘客服务,直到5月1日,2017年,在日期:站就像火车通过操作站和超车站(37]。火车运行记录和客运票务数据用于本文收集2017年之前。因此,对于列车运行分析,如冰站以来考虑列车运行如冰站,通过影响产能利用率。相反,如冰车站客流分析是进行不考虑,因为站在2017年之前没有为乘客服务。

中国高铁网络的发展,WG-HSR Kunming-Shanghai在长沙南站高铁(HK-HSR)相交而WG-HSR和Chengdu-Shanghai高铁(HHR-HSR)在武汉车站相交。Nanning-Hengyang高铁(NH-HSR)连接到WG-HSR衡阳火车站。分析列车运行质量和乘客分布是一个典型的例子来了解中国的高铁列车和乘客需求。

3.1.2。列车运行数据

的日常行车记录WG-HSR线收集。只有火车相关数据赤壁14站和13个部分从广州北北从广州铁路公司获得。这些站在图颜色的橙色1。注意:站可以处理的出发和到达这个车站的列车和列车运行记录应该被考虑。收集的数据来自2015年2月24日,29662年11月30日,2016年,包括记录为下行列车up-direction火车和29662条记录。使用的数据,我们可以制定并找出每个车站的停顿时间和各自的分布。表2展示了几个样品的行车记录。

此外,列车运行记录包含以下信息。(我)火车ID,包括列车类型区分GD(2)车站的名字(3)到达时间、起飞时间、到达时间计划,并计划起飞时间格式的“年/月/日和小时:分钟:秒”(iv)列车在车站事件之间的时间间隔,包括先后到达列车之间的间隔和之间的时间间隔在每个车站先后离开火车。

注意,统计分析主要侧重于g字火车和原因如下。(1)g字火车占更大比例的总数的火车。大约有100 g字每天火车和5 d型列车。(2)型列车与舒适的卧铺包厢一夜火车运行在广州和北京之间。d型列车的离职时间主要集中在时间从20:00至21:00。晚上也没有g字列车。(3)晚上WG-HSR足够的能力,在夜间火车操作简单。

3.1.3。客流量数据和票务中心数据

客运量和客运票务数据获得的铁路客运Transport-Decision支持系统(RPT-DSS)广州铁路公司。RPT-DSS铁路客票数据库,收集和处理的客票联机分析处理(OLAP)。该系统可以帮助政策制定者客流信息的全面了解,火车座位占用,其他旅客列车的运行技术指标。

每日客流量数据段中不同站点之间从广州火车站到WH站收集从1月1日,2012年,2015年12月16日。

有限管辖权的广州铁路公司,只有广州铁路公司的票务信息是可用的。票从广州火车站到CSS站的信息收集从10月1日,2015年,2015年10月31日。

机票上的信息的旅行路线在管辖广州铁路公司还收集,仅一天,2015年12月2日。表3显示了票务代理记录的一些样品。注意:站没有服务为乘客在5月1日之前,2017年,没有车站客运票务代理数据。摘要:车站的客流分析不考虑。

从RPT-DSS客运票务代理收集的数据包括以下元素。(我)出发日期的乘客(2)起源站和目的站的乘客(3)火车ID,包括列车类型区分GD(iv)起源站和目的站的列车(v)分类的席位,包括软座椅和备用席位(vi)乘客的数量在不同的席位。

3.2。分析框架

了解列车运行和乘客分布,我们提出一个实际记录数据驱动的分析框架由四部分组成。图2概述了分析框架和方法对列车运行和乘客分布。首先,数据清洗和准备进行识别列车运行数据中离群值,以获取有效数据进行统计分析。其次,根据列车运行数据和票务代理数据准备,数据处理和挖掘提取评价指标进行。然后,各种图表有关评价指标设计的列车运行和乘客流数据可视化的手段。这是一个方便的方式呈现列车运行的特点和客流。最终,图形分析与列车运行,乘客分布、构造和负载率给一个详细的评估WG-HSR操作的性能。数理统计、数据分析、数据可视化方法,采用图表分析方法框架来演示WG-HSR的列车运行质量和乘客分布。

3.2.1之上。数据清理

数据清理的目的是发现和处理“脏数据”的原始数据。由于原始数据用于本文从独立系统在广州铁路公司在长期内,原始数据的质量很低。数据清洗是必要的消除故障数据、噪声数据,和不一致的数据或恢复丢失的数据中包含的数据集。有三个问题需要解决在数据清洗过程。(1)时间戳的格式表示列车在车站的到达和离开的时间不统一。一些时间戳记录在几分钟内,如“65230分钟”;虽然一些时间戳的格式记录在“年/月/日和小时:分钟:秒,”如“2015/12/31 22:12:30。“在数据清洗过程,所有时间戳记录在“第二”一致。(2)订票业务数据中的异常值,特别是在客流时间序列数据。故障数据、噪声数据潜在的离群值,这些数据应该被识别并恢复从原始数据集。本文使用distant-based的孤立点检测方法,检测到异常值删除或恢复原始数据集。(3)数据丢失和数据复制在原始数据库收集从RPT-DSS很常见。由于客流数据来源于票务代理数据,应该恢复丢失的数据和异常值。插值法应用于修复丢失的数据和异常值。德重复进行删除重复数据从原始数据集。

3.2.2。数据处理

数据处理的目的是获取准备数据的基本属性根据研究目标。本文处理原始数据准备数据通过数据抽取、数据转换和数据集成。准备数据关于列车运行,列车的客流和加载速率可以描述如下。

列车运行数据包含下列事项:(我)每天在每个车站列车到达间隔(2)每天的up-direction火车高铁(3)在每个车站列车的服务频率(iv)火车的服务频率在不同时期在每个车站(v)产能利用率在不同的时期。

产能利用率可以计算公式(1)和(2), 一个小时,期间段的产能利用率 是段到达火车的数量在一个小时, 是最大的可运行的列车数量每小时段,然后呢 研究中是最低的进展(5分钟)的火车。

客流数据包含下列事项:(我)的乘客总数转达了所有高铁列车(2)每天客流在工作日和假期(3)乘客离开每个车站的数量(iv)在每个车站的乘客数量到达(v)火车的乘客数量转移在不同时期(vi)不同来源和目的地之间的客流量对乘客(OD)(七)OD客流在不同时期。

负荷率的列车包含以下项目:(我)火车在不同部分的负荷率(2)列车的平均负载率在整个旅行。

负载率和平均负载率的火车可以通过公式计算(3)和(4), 是火车的负荷率火车运行在部分 , 在火车上的乘客数量的火车运行在部分 , 是火车的座位容量, 是火车的平均负载率在整个旅行,然后呢 部分的总数是火车经过。

上面列出的所有调查指标可以分为宏观指标和微观指标。微观指标指的是物品与时间特性,通常按小时,包括列车的服务频率在不同时期在每个车站,产能利用率在不同的时间段,OD客流在不同时期。微观数据显示列车运行和乘客分布的波动的时间属性,可以标记根据高铁的时间表。所有其他项目的宏观指标,通常是测量。由于原始数据记录,宏观的数据可以很容易地通过增加计算每个单独的日期在真实记录的数据集。

3.2.3。数据可视化

数据可视化是一个词经常用来描述多元数据。摘要等软件MATLAB,触摸屏,Python应用可视化准备数据。通过这种方式,线路图,条形图,散点图,提出了直方图,可以直接演示准备数据的特点。

3.2.4。图表分析

图表和图形是有效的方法来显示列车运行的性能和客流的分布。根据图表和图形、图表分析结果提出从以下角度:(1)列车服务频率,列车的间隔时间,和WG-HSR的产能利用率;(2)时空分布的乘客离开每个车站和OD乘客之间不同的电台;(3)负载率的火车和负载率的分布在WG-HSR随着距离的变化。分析结果和结论提高列车运行质量非常重要。

4所示。在列车运行统计分析

在本节中,列车运行质量提出了处理列车运行数据,包括服务的总数火车,火车的频率,事件之间的时间间隔,每个部分的产能利用率。

4.1。火车上的服务频率WG-HSR

up-direction列车运行的数量WG-HSR每天从2015年3月到2016年10月。箱线图如图3显示列车运行在WG-HSR的时空分布,从GZN站CBN站。

3(一个)显示列车的平均数量每天在每个月,可以指示列车运行在WG-HSR的时间分布。水平轴是月序列,纵轴是列车的平均数量每天在一个月。每个箱子图中说明了火车的散射区每月数量。红线显示列车每天每月的平均数量。在调查期间,红线与剧烈波动上升,表明列车的平均数量每个月都显示了一个增加的趋势。这意味着WG-HSR要随着时间的推移,由于乘客的需求增加和扩大在中国的高铁网络。同时,上下列车的数量在不同的月是显而易见的。也有一些异常值在图3(一个),这意味着这些天运营列车的数量尤其低。波动是受假期影响或调整时间表。例如,列车的数量在2015 - 10和2016 - 10高于大多数其他个月年。因为国庆假期,列车数量的增加来满足乘客的出行需求。

在图3 (b)水平轴是车站的名字,纵轴是每日平均数量的火车离开车站。很明显,部分列车的数量从惠站到CSS站大于其他电台,而列车从大中型企业站CBN站更低。不均匀分布的不同车站的列车数量是影响高铁网络的布局,以及横条线列车的运行。铁路网络,惠站连接Nanning-Hengyang高铁同时CSS站连接沪昆高铁。火车离开Nanning-Hengyang高铁遇到WG-HSR惠站;因此,列车的数量部分从惠站到CSS站超过的部分从广州火车站到惠站。同样,一些横条线列车离开WG-HSR跑进沪昆高铁在CSS站,导致列车的数量的减少部分从企业站的CBN站。它可以包含的布局铁路网络在列车运行中发挥着重要作用。

火车停止的分布频率图所示4。图4(一)显示了在每个车站列车停止频率的统计结果。纵轴是停列车的平均数量每天在不同的电视台从2015年3月到2016年10月。很明显,在SG火车站火车停止的频率,CZW站,惠站,和CSS站远高于其他电台,表明这一事实乘客在这些站更高的要求。停止在ZZW车站列车的数量和YYE站火车停止使中等水平,而其他电台的频率很低。由于特性站没有为乘客服务,没有在车站客运列车停止。

4 (b)显示了不同的列车停止频率。横轴是频率的列车从广州车站停下来CBN站,纵轴代表的平均数量每天火车停止不同频率。很明显,停止训练集中的频率范围从3 - 5所示。5停止的列车数量排名第一,而很少火车停下来WG-HSR 13倍。也就是说,很少火车每站都停在旅行期间。

这一部分对列车旅行速度进行了研究。图5(一个)显示了直方图的列车旅行速度。统计结果表明,移动速度从109公里/小时到385公里/小时,平均旅行速度为256.2公里/小时。大多数火车的旅行速度集中在从240公里/小时到270公里/小时。图5 (b)的散点图显示列车旅行速度和列车停止频率。线代表的平均列车旅行速度列车停止频率不同。行显示了一个下降的趋势,它可以得出的结论是,普通列车旅行速度减少火车停止频率增加。自平均值火车的旅行速度为256.2公里/小时,可以画,一列火车的旅行速度将低于平均值,如果火车停WG-HSR超过2倍。

4.2。火车事件之间的时间间隔

6显示列车的到来时间间隔的时空分布。箱线图,如图6(一)提出了分布在每个车站的列车到达间隔。列车到达间隔时间平均是10分钟。列车的间隔到达车站可以分为3个层次。首先,列车到达间隔时间平均段从HSW站的CSS站是最低的,这意味着这段很忙。up-direction列车源自Nanjing-Hangzhou占领这段高铁,导致较低的列车到达间隔时间。其次,段的平均列车到达间隔时间从QY站惠站不断在媒体层面;在这部分,大多数火车来自广州车站。第三,列车到达间隔时间平均段从大中型企业站的CBN站增加和仍然较高,和部分不太忙,因为有些列车在CSS车站可以旅行到Kunming-Shanghai高铁车站。

6 (b)显示了火车的到达时间间隔的时间分布在每天不同的时间段。箱线图显示了分散在每小时的列车到达间隔线代表平均列车到达间隔时间的小时。三种主要的时间间隔可以获得:(1)清晨时间(通常05:00-7:00):列车在这个时期开始运作。火车的服务频率在这个时期WG-HSR低和火车的到达时间间隔会更高。(2)高峰时间(通常08:00-18:00):在此期间,火车的到达间隔减小,然后保持相对较低,这意味着服务在此期间火车的频率会增加,在高铁列车的密度很高。(3)晚上,晚上的时间(通常19:00-23:00):在此期间,火车的到达时间间隔期间显示略有增加然后减少23:00。

6 (c)代表一个直方图列车到达间隔的持续时间。水平轴是列车到达间隔时间,纵轴是每个区间的频率。蓝色的条形图6 (c)表明不同的到达时间间隔的频率。大部分的到达间隔时间集中在范围从0到25分钟。图中的红线代表列车的累积比例不同的列车到达间隔时间。很明显,大多数列车到达间隔时间小于20分钟,当列车到达间隔时间的百分比小于13分钟约为81%。

4.3。分析WG-HSR的产能利用率

预定在中国铁路时间表设定和更新每年或每赛季由于客运需求或基础设施的变化,尤其是在新行开始运作。预定的时间表在2015/07/01 WG-HSR经修订,2016/01/10,2016/05/15,导致四个时间表。统计分析的基础上,进行真实记录时间表显示列车到达不同的时空分布。每个时间表期间,列车的运行遵循预定的时间表;因此,不存在大的差异的实际记录数据每天火车”操作。火车到达一个车站的平均数量在每天不同的时间计算,如图7。在这种热度图,横轴代表车站,纵轴是一天的时间;列车到达车站的数量是衡量彩色区域图。

火车的时空分布不均是显而易见的。空间分布不均,火车到达企业的数量,YYE,和CBN站不到其他站,导致产能利用率低段从CBN的大中型企业。相反,火车抵达惠的数量,HSW, ZZW, CSS站更比其他站因为Nanning-Hengyang高铁连接到WG-HSR惠车站和列车运行到WG-HSR从惠Nanning-Hengyang高铁车站。因此,从惠站的列车运行段到CSS站是忙,导致潜在的产能瓶颈。

时间分布不均,有些时间/小时火车到达或离开密集,导致列车的紧缩。上面提到的时间可以被称为火车高峰时间。在图7较暗的颜色,更密集的火车。因此,深颜色的矩形图7可以被看作是高峰时间,这也是一个潜在的瓶颈。首先,由于火车出发/到达车站的数量在不同时期是不同的,火车高峰时间的分布在不同的电台是多样化和分散。然后,从铁路网络的角度,在不同的车站高峰时间的传播特性可能聚集在一些街区,这可能会导致一个严重的瓶颈在铁路运营。

在图7(一),期间从11:00至12:00,高峰小时可以看到GZN, YDW,惠站。随着时间的流逝,高峰时间随时间的变化在不同的站列车的移动。很明显,在17:00高峰时间可以找到惠,HSW, ZZW和CSS。这表明不同电台的高峰时间是不同的,时间分布不均造成的列车,以及会众的火车路线不同的操作。

在图7 (b),在早期的时间从7:00 - 9:00,列车到达的数量段从GZN SG站高于其他时期一样,因为它们是第一站,火车离开或经过,和早上这些电台正忙着。段从惠的CSS,高峰小时开始出现在11:00并持续很长一段时间,终止于17:00,这可能导致产能瓶颈。

在图7 (c)可以发现,高峰小时段从惠CSS站在12:00和13:00。运行的列车数量WG-HSR图7 (d)不仅仅是在图吗7 (c),但是火车到达分布在图7 (d)显示了一个类似的趋势如图7 (c)

检查WG-HSR产能利用率的时空分布,不同段的产能利用率和时间段进行,如图8。中国高铁的进展5分钟时,马克斯的列车数部分在一个小时是12。在此基础上和真实记录列车运行数据,各个部分的产能利用率在不同时间可以计算。每个部分的产能利用率是每三个小时计算,从6:00至23日:00。在图8水平轴代表段和垂直轴是产能利用率。

从整体的角度来看,产能利用率在时间期间从2016/01/10 2016/05/14远低于其他时间表时期,如图8 (c)。时间分布不均,产能利用率在时间从9:00至17:00大约是60%,高于其他时期。更多列车将运行在这些时间段来满足旅客的需求。产能利用率从18:00至20:00显示了一个中等水平,约40%。在每天凌晨从6:00到8:00,很明显看到产能利用率下降趋势从GZN站up-direction CBN站,因为大多数的火车来自GZN站。同样,有一个增加的趋势在产能利用率从GZN站到大中型企业站在时间期间从18:00至21:00自少火车离开GZN。

在产能利用率的空间分布不均,部分的产能利用率从惠站到大中型企业站是高于其他段大部分时间期间除了从6:00到8:00。段很容易成为一个瓶颈由于高容量的利用率。有明显降低产能利用率在车站的程序,从大中型企业和产能利用率段CBN较低和更多的列车可以安排在这段。

5。乘客分布WG-HSR

9描述了每日客流量转让WG-HSR从1月1日,2012年,2015年12月16日。橙色的线代表移动平均线的值(windows移动= 7)。客流显示了一个增加的趋势以及周期性特征。每年乘客流的波动是相似的。的客流量一般来说,从第一个几天时间1月2月最后几天显示了一个增加的趋势,这是1月春节假期的影响,春节假期时间期间。通常每天乘客2月份的平均数量是高于1月春节高峰以来被认为是最大的人们迁移和许多人之间来回家乡和工作的地方。在3月,乘客需求低。然后,客流量达到高峰时,分别在4月和5月由于清明节,劳动节的几个月。期间从7月到8月底,客流量礼物的形状影响,这是暑假,很多学生在学校和家庭之间来回。9月客流量低然后达到峰值前几天由于10月国庆假期。国庆假期后,客流量减少并保持稳定的11月和12月。

5.1。乘客的空间分布

每日客流量不同站点的数据段从广州火车站到WH站收集从1月1日,2012年12月16日,2015,然后每天不同部分的平均客流量可以了。热点图在图10 ()介绍了乘客的空间分布不同。水平轴代表离开站在垂直轴到达车站,车站之间和乘客的数量是衡量彩色区域图10 ()。乘客离开或到达广州,CSS和WH电台大于其他电台,占很大一部分。自广州,长沙,武汉是繁荣的城市,这些城市的客运需求更强烈。

10 (b)介绍了精确的每个部分的乘客数量降序排列。首先,乘客流的分布的对称性up-direction和下行是显而易见的。例如,大up-direction客流量可以发现部分GZS-CSS和GZS-WH而较大的下行客流量中可以看到部分CSS-GZS WH-GZS。这时,一个大的变化找到不同部分之间的乘客需求。乘客的数量部分GZS-CSS居第一位,其次是部分GZS-WH。很明显,客流量在大城市更大。例如,乘客要求在广州,CSS和WH电台更大,因为这些站是重要的终端站和他们都是大城市吸引乘客。

11显示的分布于不同的车站。在数据(11日)11 (b),乘客从广州出发站的数量远远大于其余的电台。因为广州是一个大城市,一个强大的经济体,乘客需求是伟大的。乘客离开CSS站的数量排名第二,因为CSS站是一个重要的高铁网络中终端。乘客离开WH CZW,和惠站更大,因为城市上面站位于大城市。小城市的客运需求,如QY YDW,大中型企业低。

5.2。时间分布的乘客

12显示颞WG-HSR乘客分布不均匀。数据的限制,我们只关注下行乘客乘坐2015/12/02线从长沙到广州。可以发现,乘客的数量达到峰值的时间9:00-12:00和另一个峰值出现时间15:00-18:00,而期间客流量下降6:00-9:00和18:00-21:00。

5.3。乘客波动在假期和周末

(13日)显示了一个每天在每个部分time-spatial乘客分布不均匀在2015年10月。乘客分布在大多数部分显示了峰值在10月份第一个几天,除了下行WH-CSS乘客的部分。然后,从10月9日客流量减少,保持稳定的10天。乘客分布在不同的方向相同的部分是对称的,但它并非如此在国庆假期期间(从10月1日,10月8日th);下行乘客的数量部分WH-GZS和CSS-GZS远远超过部分GZS-WH和GZS-CSS相反的方向。广州是一个更具吸引力的城市比武汉和长沙的乘客。与此同时,部分CSS-WH up-direction乘客的数量是远远超过部分WH-CSS下行乘客的数量。人们喜欢去武汉比长沙度过他们的假期。在国庆假期期间,广州火车站之间旅行的乘客数量和WH站排名第一,其次是广州站和CSS站之间的客流量部分CSS-WH和WH-CSS是最少的。

13 (b)显示分布的乘客离开和到达站WG-HSR每天2015年10月。乘客离开或到达广州的数量远远超过其他电台。在CSS车站客流量排名第二,紧随其后的是WH站。在惠站和YYE车站乘客也更低。拥有国庆假期,客流量在前几天(2015/10/01-2015/10/08)在每个车站远高于以往任何时候。

5.4。乘客分布不同

14显示不同的平均乘客流在工作日和周末月2015年。乘客的数量大于2月期间,剩下的几个月,由于春节假期。春节假期从2月18日持续了七天th,2015年2月24日th,2015年。春节假期是中国最重要的假期,很多人工作地点之间的家乡旅行通过火车来庆祝假期。乘客的数量更大,因为4月是4月清明节的节日。清明节是一个重要的假期在春天。去远足等活动、植树和彻底的坟墓是流行的节日期间,导致大量乘客需求在清明节。通常,乘客需求在周末比平时高,这是明显的在1月和4月。2月期间,乘客需求没有显著差异在工作日和周末,只是因为春节高峰居住者大部分的天的2月和持续很长时间。

6。负载率的火车

6.1。Non-Cross-Line列车的负荷率

在中国,高铁列车分为两种类型根据离开和到达站。至于WG-HSR,如果两个来源和目的地车站火车WG-HSR,火车叫做non-cross-line火车。否则,火车叫做横条线火车。

负载率WG-HSR non-cross-line列车从3月23日的数据理查德·道金斯,2015年3月29日th2015年,收集。基于数据,比较之间的负载率部分GZS-CSS GZS-WH如图15。负载率波动更显著部分GZS-CSS GZS-WH比部分。节GZS-CSS,峰值负载率可以看到在9:00和15:00,而槽可以看到19:54。GZS-WH部分的负载率降低到最低水平在8:00然后波动从10:00至17:40峰值。

6.2。横条线列车的负荷率

有135上行列车运行在WG-HSR 12月2日nd,2015,其中81是横条线列车和54 non-cross-line火车。几个横条线列车在图16作为一个例子来分析负载率在每个部分训练。横条线列车在WG-HSR分为四种类型根据运行路线和运行方向;这些火车的负荷率分别在四个人物图所示17

火车运行在WG-HSR和HHR-HSR成都(图的方向(17日)),列车的负荷率变化趋势是相似的。火车的负荷率在CSS-WH部分达到高峰,然后显示一个戏剧性的减少因为WH站,导致严重的席位的能力浪费。G1032的平均负载率和G1312方法CSS-WH部分的80%。的平均负荷率G312和部分GZS-WH G1316大约是50%。

火车运行在WG-HSR和HHR-HSR上海(图的方向17 (b)),在部分列车的平均负荷率GZS-WH是高于其他部分。有一个稳定的车站WH后负载率下降。G276的平均负载率和G280高于G294 G288。

火车运行在WG-HSR和HK-HSR怀化(HHS)南站的方向(图17 (c)),一节火车更高的负载率从深圳北(SZN)站CZW站,然后保持稳定。列车的平均负荷率G6142排名第一,约70%的负荷率火车G9666排名最后,约35%。其他三个火车的负载率几乎领带,约40%。

火车运行在WG-HSR和HK-HSR上海虹桥(SHHQ)站的方向(图17日(d)),加载速度列车与车站波动。列车的所有负载率显示在南昌西(NCW)车站大幅减少。在部分列车的平均负荷率SG-NCW NCW-SHHQ高于部分。

总之,负载率随火车和部分。火车的负荷率的部分WG-HSR高于其余部分在火车的路线。现有的列车运行计划需要改进,因为在某些部分负荷率低,导致座位的能力浪费。

6.3。加载速率分布随距离和时间

上运行的列车荷载率数据WG-HSR收集2015年3月,基于负荷率相关散点图,运行距离,和时间周期,如图18。距离而言,大部分的散射点集中在距离350公里和550公里,这意味着大多数乘客的旅行距离WG-HSR范围从350公里到550公里。之间存在着正相关负载率和运行的距离。散点图证明了负荷率增加旅行的距离,与执行的负荷率crossing-line列车运行距离增加的负载率降低。负载率接近100%,当旅行距离超过850公里。在9点之前,负载率相对较低,但一个明显的增加趋势。从9点到晚7:00,负载率保持稳定,然后有一个减少在晚。距离相比,加载速度不会改变太多的时间。

散点图关于负荷率的横条线列车,运行距离,和时间,如图所示19。负荷率相关图和运行距离,大部分的散射点集中在从100公里到1200公里的距离。当列车的运行距离超过1200公里,散射点的数量减少。趋势线绘制显示负载率和运行距离之间的关系。趋势线证明了负载率保持稳定在100公里,700公里的距离,然后降低运行距离超过700公里,这意味着大多数横条线列车上的乘客的旅行距离是100公里和700公里之间。的图与负载率和时间有关,散射点分布散乱地在时间从6:00至24:00。时间从6:00 - 7:00和时间从22:00至24:00,散射点的数量低于一天的休息时间。给出了趋势线来显示火车随时间变化的负载率。很明显,行了一个增加的趋势从6:00至12:00然后减少12:00至24:00。趋势线的波动可以反映出不同时期期间旅客的旅游偏好。

7所示。结论和进一步的研究

摘要提出了一种基于高铁列车运行和客流量统计分析在火车上操作实际WG-HSR记录和票务代理数据。列车运行的时空分布、产能利用率和客流进行了分析。可以得到如下一些结论。

列车运行,运行的列车数量的部分从衡阳东站到长沙南站大于其他部分,而列车从赤壁汨罗东火车站北站较低。停止列车集中在频率范围从3到5和大多数列车停止WG-HSR的5倍。列车的运行速度范围从109公里到385公里/小时,平均旅行速度为256.2公里/小时。可以画,一列火车的旅行速度将低于平均值,如果火车停WG-HSR超过2倍。有高峰小时火车到达集中,随着时间的推移和高峰小时利差在不同站。从铁路网络的角度,在不同的车站高峰时间的传播特性可能聚集在一些街区,导致铁路运营瓶颈。

客流的时空特征进行了分析。这表明之间的客流量等大城市广州,武汉,长沙,上海是更高。乘客喜欢旅行期间9:00-12:00。横条线乘客乘坐WG-HSR占很大一部分,而且大部分的横条线乘客从广州到上海旅游。

最后,本文得到荷载率之间的关系,运行距离,根据实际运行时间记录数据负载率。负载率之间的相关性和non-cross-line列车运行距离是积极而负载率之间的相关性和横条线列车运行距离是负的。列车运行距离相比,负载率并没有改变太多的时间。列车在不同部分的负荷率是不均匀的,和现有的列车运行计划应该改进基于实际的乘客需求。

这项工作是我们研究的一部分中国高铁的能力评价。一些限制应该在未来解决工作。例如,一些应该有更多的横条线火车票务代理数据相关分析WG-HSR乘客分布,和客流特征和产能利用率之间的关系应该探索。在未来的研究中,一个更新的列车运行计划和时间表应该提出考虑到乘客需求和产能利用率。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称他们没有利益冲突有关的出版。

确认

这项工作是支持的成都大学信息技术基础研究基金(大不。KYTZ202262),中国国家自然科学基金会(赠款U1834209号和71871188)和中央大学的基础研究基金(批准号2682021 cx051)。作者感谢贡献他们的项目合作伙伴。