文摘
在一个多通道的公共交通网络,转移是不可避免的。规划和管理一个高效的传输连接是这样重要的和需要了解这些转移的因素影响。现有研究预测乘客转移流动主要使用基于路径选择的交通分配模型,需要大量的计算和基本行为假设。灵感来自研究使用网络属性来评估公共交通(PT)的需求,本文提出了使用多通道的网络属性PT系统解释传输流。一个统计模型估计识别传输流和网络之间的关系属性联合巴士和地铁网络。除了传输时间,停止,和公交线路,最重要的网络财产在这项研究中我们建议转移可访问性。转移易访问性是一个新定义的指标为地理因素转移的可能性在一个车站,鉴于其位置在多通道PT网络中,基于一个适应解措施。它假设可访问性在每个车站换车可及的数量成正比的兴趣点在网络和依赖于成本函数描述距离的影响。回归模型提出的平方是0.69,基于智能卡数据,PT网络数据,和感兴趣的点(POIs)数据的城市北京,中国。这表明该模型可以提供一些决策支持为泰党的规划者特别是复杂网络分配模型是计算密集型校准和使用。
1。介绍
在一个公共交通(PT)网络中,是不可能提供所有乘客之间的直接和单峰PT服务所有的电台和停止。乘客有时不得不转移不同线条和经常不同模式。通过PT可以旅行,因此,涉及到一个或更多的转移从一个模式到另一个(1,2]。与上门服务,方便转移可以扰乱乘客旅行和降低PT的竞争力(3,4]。更好的转移模式之间的联系已经被证明可以提高服务水平的PT一般,从而刺激其整体使用(5- - - - - -7]。提供更好的传输连接,需要能够量化传输流,从而使智能传输规划和管理(8]。例如,如果工党计划和管理当局想要了解行人行为在一个传输通道,进一步提高连接效率,他们需要评估和预测乘客的传输流(9]。因为公共汽车和地铁的结合是一个典型的在许多城市,许多研究都集中在如何提供一个让公共汽车和地铁系统通过传输连接(10,11),这也是本文的重点。
研制了许多基于规则的算法来估计基于智能卡数据传输流(12,13),但他们只能估计历史流现有的车站换车。预测转移流动的新计划的车站,交通分配模型基于交通用户的路线选择使用(1,14,15]。离散选择模型被用来解释旅行者基于效用最大化的路径选择16]。这样的模型搜索路径选择的旅行者和计算每种选择的概率,导致广泛的校准和计算时间17]。也有研究只使用网络属性(18分配PT旅客流,提供一个吝啬的替代现有的客运任务模型(19]。然而,这种类型的方法还没有被用于模型传输流和没有研究试图检查传输流和网络性能之间的关系。在本文中,我们的目标是通过建立一个模型来填补这一缺口地铁和公共汽车之间的传输流基于网络属性。
一些网络指标可以直接获得的数据(20.,21),如传输时间和公交线路的数量在一个地铁站(22]。除了这些相对简单的指标,最重要的就是我们所说的网络属性介绍了研究转移可访问性。这是一个新定义的指标的辐射转运站双峰PT网络中的地位。直观地说,这个指标代表的可访问性一个换乘站,这是成正比的和潜在的所有可获得的地铁站和之间的相互作用可以到达公交车站,旅客广义出行费用成反比的交互。方面的潜在的相互作用是衡量公共汽车站的潜在生产(或一个地铁站)+一个地铁站的潜在吸引力(或一个公车站)。生产和吸引力,我们使用的数量的兴趣点(POIs)在每个车站(或停止)作为代理,这是一个数据集,通常是可用的。应该注意的是,一些研究提到的健壮性连接在一个车站换车也转移可访问性(23),应区别于我们的概念。
我们的方法计算转移可访问性基础上的和潜在的相互作用非常类似于解易访问性的测量24),它可以被视为一个类比牛顿引力定律(25]。即两个城市之间的人交换成正比的产物人口和成反比这两个城市之间的距离的平方(24]。在本文中,我们提出这样一个解模型来估计转移可访问性,然后使用它作为解释变量建立回归模型的警所一级的传输流。
本文组织如下。首先,描述的方法,包括转移的定义可访问性和传输流预测的回归模型。然后,PT的数据在我们的研究中使用的北京进一步解释道。下,我们目前的应用程序模型的数据。在最后一节中,我们得出结论,并建议未来的研究方向。
2。方法
我们假设相关的网络属性站可以转移两种模式之间流动的交通工具。在这项研究中,我们的目标是测试这种假设。因为并非所有单一特性通常是分布式和可能存在非线性关系之间的独立和依赖的变量(26),取对数的变量建立回归模型,如果必要的。给出的模型如下: 在哪里流车站换车吗 , 代表误差项,是不同的解释变量,表示网络属性。
接下来,我们选择一组网络属性被认为是相关的传输流。基于现有文献的回顾,选择以下网络属性(更多细节部分2.2)。(我)传输可访问性(新指标)(2)传输时间(27](3)公交车站的数量在每个地铁站(28](iv)每个车站的公交线路数量(22]
总结,如图1建立回归模型,发现之间的关系传输流和上面提到的4个网络属性,其中易访问性需求转移到基于引力模型计算。每个车站的重力模型假定转移可访问性取决于可获得的POIs的数量,PT停在这个车站,一个成本函数描述距离的影响。其计算过程包括五个步骤:车站,(1)找到所有OD对连接到这个车站,(2)计算潜在的旅行代理每OD对之间的相互作用,特别是周围POIs的数量的一个起源站+目的地周围的一个车站,(3)每个OD对交互乘以一个成本函数来描述每个OD站对距离的影响,(4)过滤掉那些OD对连接直接运输,如直接地铁或公交线路、(5)和计算结果对所有可及OD站对计算解的可访问性。的方法可以应用在PT网络,包括公交车站和地铁站。
2.1。因变量
在这项研究中,因变量是传输流。为了计算从智能卡数据传输流,必须首先确定什么是转移。当乘客旅行在PT网络使用智能卡[29日从每个旅行),以下数据可以通过智能卡数据:匿名用户身份(id), IDs的寄宿和降落电台,和时间戳。
在过去的十年中,人们提出了不同的方法来识别基于智能卡数据传输(30.),其中很多都是基于规则的方法。例如,不同的固定时间阈值设置连续观察时间之间的差距腿/段[旅行31日]。传输时间阈值从30分钟到90分钟用于伦敦识别与智能卡数据传输(12,32]。否则,转移步行距离也可以应用。750米的最大阈值传输距离被用来估计在伦敦转移(33),和400米在海牙,荷兰13]。一些方法进一步区分转移和短的活动,将拒绝登机的影响,转移到车辆的同一行13),和路径轨迹的电路34]。
在这篇文章中,我们还确定转移使用基于规则的方法。传输时间和传输距离设置的阈值来检测基于智能卡数据传输。我们的研究区域是北京和我们关注的城市公共汽车和地铁之间的转移。首先,北京PT的复杂性网络类似于伦敦和上海。根据伦敦的传输数据12)和上海(35),我们可以初步确定传输时间通常为这些大型城市大约30分钟。的最大传输距离是设定在2.5公里,基于假定最大步行速度(33]。其次,为了测试30分钟是否合理的北京,我们分析了两个相邻的时间间隔所有乘客的旅行,他们的旅行时间间隔内大约30分钟,距离2.5公里,基于北京智能卡数据。如图2,95%的旅行的时间间隔小于25分钟。因此,我们设置的阈值传输时间为25分钟,最大传输距离为2.5公里。遵循这些规则,可以估计转移流过每一个地铁站,基于智能卡数据。
有许多类型的转移,包括内部转移等的地铁系统,和外部的公共汽车和地铁之间的转移。我们认为内部转让不同地铁线路一次段因为通勤者只需要刷他们的卡当他们得到的一个地铁站,不刷他们的卡当他们不同地铁线路之间的转移。联合网络的巴士和地铁,地铁和巴士组成之间的一次性转移大部分转移,占91%的地铁和公共汽车之间的转移,基于北京智能卡数据(图3)。因此,一次性的地铁和公共汽车之间的转移是我们的研究重点。
2.2。独立变量
在我们的回归模型,预测转移流动,总共有四个独立变量。第一个自变量之间的传输时间旅行的巴士和地铁,决定根据旅客的时间间隔刷信用卡。基于中值传输时间的转移旅行通过一个地铁站,转移时间从地铁站到汽车站(反之亦然)。我们使用的所有经验的中值传输时间在一个地铁站代表本站的一般性转移时间。对于一个新计划,传输时间可以初步估计基于传输距离和估计的等待时间。
第二个自变量是公交车站的数量在一个地铁站,这反映了潜在的通勤者转移的机会。我们设置了半径一公里和计数的数量从每个地铁站公交车站在这个范围。第三个自变量是每个公交车站的公交线路数量,它反映了公交服务强度在公交车站旁边的地铁站。的假设是,如果有更多的线在一个巴士站,会有更多转移旅行。我们前三的解释如下,并将指定的最后,本文提出的新的。之前已经介绍了,提出了一种解模型测量传输的可访问性。这个模型假定传输每个车站的可访问性取决于可获得的POIs的数量在一个城市,现在数据容易获得,成本函数描述距离的影响。
我们用一个玩具PT网络结合一个总线网络和一个地铁网络来解释我们的定义。如图4,每个节点代表一个地铁站(蓝色节点)或公共汽车站(黑色节点)。有四个地铁站(一个,B,C,米)和五个公交车站(b1,b2,b3,b4,b5)。两个公交车站或两个地铁站之间的联系存在如果有PT服务连接。虚线代表转移汽车站和地铁站之间的联系。例如,上班族可以走b1汽车站和地铁站之间米转移,继续他们的行程。
在这个解模型中,我们专注于一个转运站和找到所有的OD对可以连接。在我们的案例中,一对OD应该包含一个公交车站和一个地铁站。当我们关注一个地铁站,所有可能的链接从一个地铁站转移到不同的公交车站,位于在这个地铁站将搜索。在PT玩具网络(图示例4),我们专注于地铁站米,一个可能的转移与汽车站b1。我们假设一次转移从公交车到地铁;因此,源节点可以是汽车站b2或b3,通过总线连接到公共汽车站b1。目的节点可以是地铁站一个,B,或C,因为所有地铁站是紧密联系在一起的,乘客可以从地铁站旅行米任何其他地铁站。有6 OD对连接到地铁站米,包括b2 -一个,b2 -B,b2 -C,b3 -一个,b3 -B,b3 -C。
转让一个地铁站,我们寻找所有潜在的OD对通过本站连接。我们使用的数量POIs周围一个地铁站和一个公车站作为潜在的代理访问生产或景点。在地铁站米在上面的PT玩具网络中,需要计算周围POIs 6 OD对的数量通过本站相连。例如,代理潜在之旅互动地铁站米OD对间”b2 -一个“是POIs的数量的总和在汽车站b2和地铁站一个。公司POIs的总数和住房POIs计算半径500米内(35从每个地铁站和公交车站。
一对OD可能由单个PT直接连接模式。如果是这样的话,这个OD对间传输流的数量将会减少。因此,如果一个人想要估计传输需求36)更准确地说,直接运输的影响应该被删除。地铁站,公交线路,乘公共汽车旅行时间(37),和旅行时间的标准偏差会影响乘客的选择。我们把上述四个因素获得转让需求影响因子 : 在哪里当前的转运站,是通过电台OD对相连接 。 表示传输需求的影响系数在车站OD对转移 。 和是地铁线路和公交线路的数量,分别可以连接吗OD对直接。的总旅行时间吗OD对当上班族选择在车站换车 的平均巴士旅行时间吗OD对直接当上班族选择坐公交车。公共汽车旅行时间的标准差在吗OD对直接当上班族选择坐公交车。
如果一些地铁线路可以直接连接OD对,= 0,如果有地铁和公车线之间OD对车站j,设置 。否则,是由多个参数的影响,包括 , , ,和 。公交车运行时间和运行时间的变化会影响服务的可靠性和乘公共汽车将进一步影响旅游的吸引力(22]。因此,我们可以假设下公共汽车旅行时间的标准偏差,更准时的和稳定的巴士旅行时间,这将激励通勤者使用它(22]。越高之间公交线路OD对的数量,有好的总线连接的概率越高;这也促使通勤者直接使用公共汽车,而不是转移。
我们使用总成本函数模型通勤者不愿长途旅行。这个函数有以下形式(25]: 在哪里是旅行距离的广义阻抗函数有两个参数校准,然后呢旅行距离穿越地铁车站换车吗之间的OD对。这个函数的形状不同的值的参数如图5。
的值和应校准计算传输基于代价函数的可访问性。在图2,如果我们专注于地铁站米,b2-A是所有潜在的OD对通过本站相连。在这种情况下,疏散距离“b2-A”OD对间的距离之和b2-M和必备的距离。基于估计 , 和这次旅行的距离 ,可以获取OD对间的成本函数“b2-A”,这并不总是减少。先上升,然后逐渐下降,直到稳定与流动距离的变化接近于零。
通过加总计算结果的可访问性在所有潜在的OD对通过本站连接,可以获得可访问性的车站换车 。地铁站的转让可访问性的定义给出如下: 在哪里是OD对的数量将在车站吗 。 代表了在车站OD对转移 。是潜在的旅行交互在车站OD对转移 。 表示需求转移的影响因素在车站OD对转移 。 是一个成本函数描述距离的影响。
3所示。北京PT的网络应用程序
3.1。数据
案例研究进行的北京,中国的首都。北京和其网络的一些基本信息如表所示1。
我们使用网络数据,智能卡数据和POI数据在我们的研究中。公交车站的数量在一个地铁站是计算从每个地铁站半径一公里内。在图6节点代表地铁站,颜色代表的数量的深度公交车站附近的地铁站。
智能卡可以通过北京的旅客登上地铁,公交车、公共自行车。根据国家城市客运发展报告(39),67.4%的旅客使用智能卡由工党于2017年在北京旅行时。因此,智能卡数据能被用作一个代表性样本的PT乘客人口。值得注意的是,我们的方法也可以应用到最新PT分享服务数据获得的新的支付方法,如NFC和QR码,只要他们记录相同类型的信息。持卡人需要签入和签出旅行时在所有PT系统(40]。如表所示2本文使用的数据来自2017年9月4日至9月11日(8天)。它包含的记录所有的交易完成智能持卡人在此期间。旅客不需要查看时地铁系统内的转移,但它们确实需要先检查再检查,如果他们之间转移地铁和公共汽车。
本文中使用的POI数据提取的高德牌地图服务,这是中国相当于谷歌地图41]。大约120万POIs的20个类别可以获得在北京。POI数据的信息包括名称、坐标和类别。20个类别包括住宅和公司。三种类型的信息从原始POI数据集提取每个地铁站和巴士站,包括周围POIs的总数,周边住宅POIs的数量,和周围的公司POIs的数量(35]。在地铁站POIs的数量由颜色的深度图表示7。
3.2。数据预处理
我们使用数据从2017年9月4日,作为一个例子来说明原始数据的预处理。公交卡交易的数量在这一天是141192280,地铁卡交易的数量是534,1597。首先,异常数据删除,包括下列情形:(1)当行号不可用;(2)当有错过登机或降落停止的记录;(3)当降落时间早于登机时间;(4)当登机和降落在同一站在同一行;(5)当有重复的数据;(6)当车站ID是错误的。数据预处理后,得到5070457个有效总线记录和5300593个有效地铁记录。因此,公共汽车和地铁记录的总数是10371050。 Secondly, the data of users with two consecutive travel records are detected in the combined transit and metro records. We connect two adjacent trip records of the same user into one trip record, leading to three types of travel including a transfer: bus and bus trip, metro and metro trip, and bus and metro trip. We focus on bus and metro trips and obtain 1,082,269 records. Thirdly, the transfer time and transfer distance are calculated for these bus and metro trips. If the transfer time is less than 25 minutes and the transfer distance is less than 2.5 km for one trip record, we consider it to be a transfer trip. We obtain 566,978 transfer trip records. Similarly, we analyze the remaining 7 days of data to calculate the average transfer flow.
4所示。案例研究的结果
4.1。确定传输和计算变量
所有地铁站的传输流图所示8,它可以观察到,站有更多转移流动不一定是位于市中心。
如图9,传输时间从3分钟到25分钟。大部分的转移需要8分钟左右。公交车站的数量在每个地铁站的一公里半径范围从1到25。平均而言,大约有8每个地铁站附近的公交车站。每个车站的公交线路数量差别从1到13日同时3到5似乎更常出现。
在计算转移可访问性之前,两个参数和成本函数的解模型需要确定(3)。使用(1),我们使用真正的PT数据估计模型在北京。不同参数的平方,结果的准确性表示颜色的深度图10。当 和 ,评价结果是最好的;因此,我们使用这些值。
有300个地铁站和30000多个公交车站,理论上会有大约900万OD对。根据这个公式,我们可以计算每一个地铁站的转让可访问性表示的颜色深度图11。它可以观察到,一些地铁站离中心非常方便,因为有些人是唯一连接很多遥远的公交车站。
4.2。变量的相关分析
独立变量之间的相关性分析表3。将易访问性等指标之间的相关性弱,除了每个公交车站的公交线路数量,略高。我们仍然保持这两个变量,因为它们都有重大影响模型精度(详细表4)。
4.3。模型的估计
我们建立了回归模型的四个独立变量和传输流去探索每一个预测属性的影响。我们展示每个自变量和因变量之间的关系图12。这四个属性都有一个对传输流产生重大影响。
(一)
(b)
(c)
(d)
在我们最后的数据集,我们有306个地铁站。数据分割在70%,作为训练集,和30%,作为测试集。该模型估计结果的基础上总结了训练集表5。所有的系数都有他们的积极或消极的假设和迹象都意义重大。
一般来说,三个属性的系数包括转移可访问性,公交车站的数量,每个车站的公交线路数量是积极的和重要的在解释传输流。更多的公交线路和公交车站也会导致更多的传输流。传输流随传输时间的增加而减小。
我们使用交叉验证来评估模型的R广场“(5)”。K倍的方法(42被选做交叉验证。在K倍交叉验证,原样品是随机划分K次级样本。的K次级样本,单个子样品保留作为测试的验证数据模型和剩余的K1次级样本作为训练数据。然后重复交叉验证过程K*(折叠),与每一个K次级样本完全使用一次,验证数据。的K折叠的结果可以组合在一起以产生一个估计。这种方法在重复随机二次抽样的优点是,所有的观察都是用于训练和验证,和每个观察是用于验证一次。我们测试了不同k值,最后设置= 6。 在哪里预计的价值使用我们的模型,的实际价值 ,和的平均实际价值吗 。 - - - - - -广场上反映了波动的程度可以被描述为独立变量的波动模型。的值范围 - - - - - -广场从0到1。越接近 - - - - - -广场是1,更精确的模型。
我们测试的预测结果有或没有该变量在表4。模型的精度是0.6032没有变量“转移可访问性”和0.6935提出变量。我们提出的四个变量的组合可以获得更高的精度。提出的模型我们表现良好,不仅解释还预测转移的数据流。
此外,我们使用一个残余阴谋显示残差纵轴和横轴上的独立变量。如图13,剩余图中的点是随机分散在水平轴,这证明我们为数据线性回归模型是合适的。
我们也计算F以及(43评估模型的准确性。我们的测试方法是说明如下。我们从两个假设开始。零假设,lagged-variable模型并不能解释方差的传输流比intercept-only模型。是替代假设lagged-variable模型更好。我们在两个模型应用野生。在我们的示例中,值是1.11 e - 80,这是一个非常小的数字。有不到1%的几率,188.6的f统计量可能是偶然因素 。因此,我们拒绝零假设,接受替代假说复杂的模型可以解释因变量的方差比intercept-only模型。
5。结论
在这篇文章中,我们已经开发出一种回归模型来解释网络相关属性可以用来传输流在多通道PT网络模型。我们进行了案例研究联合在北京公交车和地铁网络,几个属性被证明影响这两种模式之间传输流,即转移可访问性,传输时间,每个车站的公交线路数量。其中,我们提出的最重要的属性是可访问性转移,这是定义为代表一个车站的辐射传输枢纽,鉴于其位于一个多通道PT网络。
我们相信我们的方法不仅可以用于解释传输流现有车站还预测传输流的新计划。它提供了一个简洁的替代现有的乘客分配模型,这大多是昂贵的,因为所需的建模以及数据荒漠。我们的模型可以直接应用于传输流的评价在新车站在北京。模型还可以用于其他城市,只要他们有与我们有相同的数据,包括智能卡数据、网络数据和POI数据。我们研究的创新在于新的建模方法乘客转移流基于网络属性。转移易访问性是一个新的概念,这可能是有用的其他PT的研究。
这项工作仍然可以在几个方面改善。首先,一些特性可以被添加到现有的方法在未来。城市与大小不同,因此可以使用不同的PT网络规模,进一步验证本文的研究结果。其次,乘客的数量取决于时间和周期。一个可以考虑时间影响传输流在未来的研究。最后,一次性的地铁和公共汽车之间的转移是我们的研究重点,因为它占大多数的地铁和公共汽车之间的转移,但它将会是很有趣的探索我们的模型的可转让性和其他复杂的传输类型。
数据可用性
学院内的数据只能在内部共享,第一作者的作品。
的利益冲突
作者宣称没有利益冲突。