抽象性
度假期间城市铁路交通客流通常显示不同于正常日的不同特征。为确保高效运营管理,必须准确预测节假日客流分布依据自动收费数据,本文探索客运目的地对正常日和节日的不同选择,单向票和公交卡支持建模变量选择并推荐度假分配预测模型,其中为代表本地和非本地乘客建立目的地选择模型并引入解释变量,如土地匹配度、景点仿真值和服务级变量处理度假旅客旅行行为的特殊性使用从中国广州市收集的数据,用经改进加权外采样最大似然法校准参数应用预测不同节日客流分布并逐年改变地铁网络结果显示,拟议模型有效并比其他可比模型在预测精度方面表现优于其他可比模型所拟模型有能力为不同节日假变换网络的城市铁路交通提供更加普及和精确的客流分布预测法
开工导 言
随着经济水平的发展,城市居民旅行活动和频率继续增加,导致城市居民对城市公共交通需求快速增长城市铁路交通近些年来快速发展,交通量、速度和守时性之优越性为人们所欢迎,这有助于刺激城市铁路建设的兴旺[一号..近些年来,大量新线路开通并连接地铁网络,使网络运营效果特别明显,严重影响地铁网络区域无障碍和客流分布此外,关于节日,由于离港时间特殊灵活度和目的地多样性,客运特征与正常日大相径庭,假日旅行需求时空分布复杂特征[2,3..
快速变换地铁网络后,运算经历了质和量变化4..特殊节日还加重旅行需求复杂性,这对地铁系统构成重大挑战。此外,同一节日每年只发生一次,这不利于研究缺少数据源特征。因此,为有效组织大型客流并缓解节假日交通拥塞,必须准确预测节假日客流分布,这是合理的火车运营规划制定和开发客流引导策略的基础。
传统四步方法及其修改模型已广泛用于客流分布预测模型主要包括基于历史数据统计规则的综合模型法和基于行为分析分解模型法
在聚合模型方法研究中,许多研究人员通过在不同背景中改进重力模型来调查重力模型Grosche等[5提议两个重力模型估计城市间航空客流引进地理经济变量,描述一般经济活动和地理特征为独立因素王等[6重力模型综合考虑距离自由流时间和Fratar预测O-D高速矩阵最近Ren等[73类型土地使用功能补充指数引入空间交互作用以改进重力模型在这些研究中,引入适当的变量修改模型况且受限重力模型还被用作研究点sekeris和Stathopoulos8使用双重约束重力模型并用周期内演化预测动态行程分布Jin等[九九提议O-D估计模型基于双重约束重模型,对单倍约束模型进行比较综合重力模型往往高估距离确定函数小时,变量通常不那么简单,无法客观反映客流和旅行行为分解机制
分解模型通过建立可定义变量从行为判读角度显示客宿选择内部机制具体地说,先前对分解模型的研究侧重于旅行行为分析与需求预测举例说,Tsirimpa等人研究旅行行为的影响因素[10多名登录模型和混合多名登录模型研究信息获取对切换旅行行为的影响Yang等[11推荐多名嵌套登录模型分析电动驱动电车充电和路由选择行为Nguyen-Phuoc等[12采行多名登录模型探索影响重大公共交通中断时变化的因素此外,离散选择建模技术随机实用基础主要用于目的地选择建模Faghih-Imani13使用多名登录模型研究判定车站目的地的决策过程Kelly[14建多名登录模型分析全区内行人选择行为欧文15随机参数潜在分割日志模型 调查无码头单车分享用户选择目的地行为研究显示个人属性和替代因素影响旅客行为和决策过程,帮助转口机构获取管理指导
聚焦需求预测Timmermans16建模综合交通模式选择和目的地选择与预测面向购物旅行增强预测力Jovicic和Hansen17搭建嵌套登录模型,日志集成生成、分布和模式选择模型为子模型Ashiabor等[18号开发嵌套混合登录模型估计县间旅行需求旅行时间、成本和旅行者家庭收入用于解释变量最近研究19号多级需求预测模型建议考虑离散选择方法,如二元和多元登录模型,供每一决策级使用况且Li20码显示一个新的非线性需求估计器 估计需求分布基于嵌套登录模型这些研究有助于精确预测旅行需求并改进分类模型然而,通常有必要使用表单,如公开显示优先度调查,以获取数据,包括个人属性和替代属性以研究行为特征应用预测很容易受数据条件限制并难有效使用
此外,许多新兴数据挖掘技术方法用于研究交通或客流需求叶温21号建算算法观察部分链路检测到的数据Wang等使用数据挖掘[22号开发手机定位跟踪算法跟踪跨区域交通活动并推导O-D流量和旅行需求机器学习方法中Wang等[23号设计网格嵌入网络图卷积并搭乘多任务学习网预测OD对需求数据驱动方法预测精度视长期收集而定可能更高,但由于地铁缺少新加站数据,很难应用网络结构变化通常黑盒过程无法说明内部行为机制
一般来说,由于节假日每年只发生一次,持续收集稳定长期数据并不容易。并快速开发地铁系统 网络节日结构 通常每年变化, 这使得很难使用统计模型预测先前相关研究侧重于正常日对客流的研究探索客运选择行为以构建特殊变量以有效预测地铁系统节日假此外,由于分类数据源限制预测应用,新数据源被视为取代本文中传统调查问卷
目前城市铁路交通系统广泛采用自动收费系统(AFC),这是本文中主要支持数据在确保有效性的前提下,本文将AFC获取的汇总数据应用到分解模型中,修改最大似然估计法,克服获取分解模型数据的困难基于充分利用乘客旅行规则并计及不同票类乘客选择行为差异,本文搭建度假乘客流分布预测模型,介绍一些新解释变量(如土地匹配度)。拟议的模型结构不仅可适应城市铁路交通网络结构的改变,还可考虑节日独有特征以便有良好的解释性
本文余下部分组织如下:下一节分析节日数据收集努力和客流特征并描述建模法和解释变量实用函数之后,估计并应用拟议模型预测节日分布并比较其他传统方法最后,结束语见上一节
二叉数据客流特征
2.1.数据类
城市铁路交通局系统实施管理方法,如开票、验票和计费数据收集并传送到中心并自动存储客运信息数据类型显示于表一号.在有限数据条件和类型下,如何使用数据构建适合节日假想的预测模型是首要目标数据处理清理数据的方法是识别外围点,例如判断进出境站是否前后不一,进出境时间和内排时间是否合理此外,站点被视为城市铁路交通系统运输分析区客运登机站(原机站)和客运启程站可直接从AFC系统获取
2016年初广州市有8行140站每日平均原始数据达400万以上需要进一步处理超过100万乘客每日单程票 新元近1.84倍与2016年1月1日相比,2017年1月1日有17个新站和3条新线连接网络公路网结构发生巨大变化
2.2.客流特征
广州市AFC数据收集新元节期间2016至2017年每个站的客流,并发现一些旅行特征客流与土地使用性质和环站开发强度密切相关
图中显示一号自2015年12月30日至2016年1月4日的四个典型站的入站客流由办公区支配的朱江兴站客流在新年日显著下降相类似地,达沙东站客流也下降,因为住宅区环绕广州站和北京卢站的客流在节日期间大幅增加,主要区域分别环绕着景点和商业区。
类似地,从始发站到目的地站(O-D站)的客流节假显示与工作日不同特征图中显示2O-D站与土地使用类型不同的客流趋势不同,其中一些节假日大幅增加,而其他一些站如住宅站对办公站则大幅下降。
从另一个角度讲,在节假日使用单向票和公共交通卡者分布上也有很大差异。通常,许多单向客非本地客,他们往往去景点、商业区和枢纽站相形之下,交通卡客多为当地居民,其旅行目的多种多样。特征选择行为在节假日特别显眼图中显示3单向票客流和广州站公共运卡增加,单向票增速显著提高,显示单向票客的吸引力增强
(a)
(b)
此外,还可以分析客流获取其他特征举例说,同行O-D客流通常大于不同行的O-D流并满足客运目的时 优先前往目的地 短时间传递时间但这些特征受多种因素影响应在某些解释变量中反映这些变量,分析各种因素如何联合影响行为并改进随后建模时预测性能下一步详细介绍客流特征法
3级方法论
考虑到地铁网络规模正在快速发展,O-D站空间客流分布也快速变化新站转移老站客流并不容易获取时间序列内所有OD配对开发数据,特别是新加站开发数据因此,基于上述客流特征分析,本文搭建目的地选择模型描述客运特征开发度假客流分布预测模型,适合网络结构变换,不依赖长期数据采集同时,考虑到不同的客运特征,使用单程票和公交卡的客运工具函数分离构建
3.1.模型结构
随机实用最大化理论指交通行为决策人选择特定条件选择集中最有效对象的替代方法如果目的地选择站上客集一系A级一并使用替代N级华府市U级内中,要求乘客选择目的地j大全发自A级一华府市 .其中包括实用函数U级共分两部分:确定性词 和差错词 .工具函数 可写成如下: 去哪儿 可估计属性参数k; 可观察属性解释变量; 报错词处理影响乘客选择的非观察因子
研究者观察决策人所面对并贴标签的替代特征X级JI测试,并可以指定函数将这些观察因素与决策人的实用性关联24码..词名 随机处理,并捕捉影响实用性但未列入的因素 .何时出错词 执行独立的 Gumbel分布式,多名登录模型可导出发源站一概率选择j大全计算方式如下:
方程分解2)是目的地选择模型概率客运选择另一站为目的地可计算从每个站制作行程后根据概率选择分布到所有其他站即客流分布 发源站一目的地站j大全计算中公式显示如下: 去哪儿 进站客流一.
考虑到不同类型旅客旅行特征的不同敏感度(节假日特殊性),拟建模型中的两项实用功能由使用单向票和公共运输卡代表本地和非本地乘客的乘客组成。行程分布单对有特征旅行行为并有不同模型参数的各类客票应用后两种票分配结果加在一起公式显示如下: 去哪儿 单向票客分布预测 公交卡客分发预测
方程分解4)是客流分布预测模型但它迄今是一个单受限模式无法保证客运总和从每个站流到目的地站j大全等于吸引站行程j大全.因此,有必要修改旅行流以强制实施总发源地和目的地之间的约束。Fratar法由于其快速聚合速度和高计算精度而广泛用于分配调整Fratar法概念分布区间地平线年程,与基年行程分布模式成比例,并按审议区生长因子修改25码,26..本文使用Fratar均衡处理法方法显示如下: 去哪儿 客运站一待站j大全; 即进站客流增速一; 运出站流速增速j大全; 调整系数站一; 调整系数站j大全; 进站客流一; 即出境客流站j大全;m算法m-迭代
3.2模型规范
个人特征影响目的地选择,但无法直接从AFC获取个人属性数据7个索引作为特征变量的实用函数可以从城市铁路中转网提取,在目的地选择模型中加以考虑,包括车内旅行时间、转移时间、站位关系和匹配程度土地利用类型七大变量主要用来描述三大类解释属性,即目的地无障碍性、目的地吸引力和OD站匹配度,通过此度可描述乘客选择行为机制
根据单向票和公交卡客选择行为特征,并通过模型多校准经验,实用函数 并 目标选择模型构造,如方程显示6)和(b)7),分别: 去哪儿 参数为每个变量校准; 运出目的地站j大全万人行程 匹配程度土地使用类型; 车内往返原站一目的地站j大全二等化 表示发源站传输时间一目的地站j大全二等化 假变量,或原创站之和一并吸引目的地站j大全大于特定尺度,值为1; 假变量,或原创站一和目的地站j大全在同一行中,值为1; 是一个假变量,如果使用类型目的地站j大全观光、商业或枢纽值为1
一方面,介绍这些变量是为了方便数据采集;另一方面,则考虑节日特征以便进一步提高模型可解释性和预测效果应当指出,旅行费用是一个敏感变量,影响选择行为,它包括在起始变量集中然而,当检验变量多义性时,旅行成本显示与旅行时间有强连通度因此,在实用功能中消除了旅行费用与单向票客相比,公共运输卡实用功能没有变量 ,添加此变量会降低模型精度
此外,获取匹配程度土地利用类型 景点站变量 需要额外解释站间客流分布与站内土地使用性质密切相关,特别是节日和正常日之间的巨大差值有必要量化土地使用交互作用正因如此 构造描述不同类型站间吸引度基于此,地铁站需要聚类确定先站类别
因土地使用特性相对稳定指标,通常显示与客流特征有某种关系K级均值聚类法用于划分广州市全网站K级对象量化法对数据挖掘集群分析最受欢迎27号..通过分析客流特征,日晚峰流与车站用地性质关系更大单向票和全时客流综合交通枢纽通常较大,商业站和景点客流在节假日往往大幅增加5变量因此用作表格显示聚类输入2.地铁站聚类研究中,电站通常按周游数据划分五类28码,29..研究场景以节日为对象, 我们根据模型土地使用和应用需求, 将八组数设为预置类别集群结果显示于表3括号内图表示集群站和数),并具有代表性并匹配预设类型
正因如此 值 可直接通过集群结果获取相匹配程度土地利用类型 需要进一步处理基于以上聚类结果,可计算不同聚类类型O-D平均客流并用对数函数实现各种类型值正常化,以更好地区分客流公式如下: 去哪儿 土地匹配度类型一切换类型j大全; 平均O-D客运站类型一切换类型j大全.
案例结果 显示表4垂直列表示原站类型,横向行表示目标站类型),从类型1到类型1值为零即客流在所有类型中最低值,主要是因为所有类型对度假期间住宅站之间的吸引力小相形之下,运输枢纽之间的连接增强,反映为从8型到8型最大值
3cm3参数估计
面向参数 方程中一号个人旅行测量通常使用简单随机采样法获取个人选择分解类型数据,从而使用最大似然估计法校准参数但在本论文中,AFC获取的汇总数据应转换成分解表以应用目的地选择模型应用时需要方法处理原创汇总数据姚和高树30码提议综合模型综合多数据源估计,如SP、RP和聚合数据最大似然估计法通过引入权因子提高,实现AFC数据应用目的地选择模型标定
曼斯基和里曼31号取加权外采最大似然法(WESML),将权值引入日志相似性函数以校准样本与群量数据之间的偏差可表述如下: 去哪儿 一等客N级选择所选分支一视向和0 is weights; 表示选定分支比例一人口中; 表示比例一样本中
提高方法实用性,科斯莱特研究32码证明它可转换如下: 去哪儿 表示选定分支的数据量一; 和相选分支的数据量
然而,从城市铁路交通看,始发站和终点站的乘客有相同的特征即,他们都为目的地做相同的选择因此O-D客流量可表示个人选择结果权值因子适合调整数据集概率函数因此,根据可提取数据特征,方程11)更正如下: 去哪儿q二维一表示所选分支O-D客流一;R个人数,即OD对接和
4级结果分析
4.1.模型估计分析
建设选择集时,2016新年日有140个站即139站应置入替代集中,然而,对通用分类模型而言,替代体大小过大,会影响模型估计速度并不利于应用Ben-Akiva和Lerman三十三显示模型参数一致性在选择集提取子选择分支以估计参数时没有损耗因此,本文随机从替代集提取九站构建子选择集它可以减少校准难度并增强可操作性,同时确保模型校准参数一致性
参数标定过程7变量值与广州城市铁路交通网络布局和火车运营计划并发通过使用前段描述的参数估计法,非定值实用函数校准特别是,经过数次测试后,尺度模拟变量 7 000人出行数设为1新年校准结果显示于表5学习案例全绝对t级值大于1.96,表示统计意义和变量验证外加调整华府2模型大于0.2,可视为满意适配34号..
估计参数提供实用意义和预期标志,即单向票模型或公交卡模型解释客运目的地选择行为显而易见的例子就是目的地吸引变量参数为正数,表示目的地站吸引度越高,客选越多。
关于旅行时间和转移时间负参数,旅行时间和转移时间越长,选择目的地站概率越小,这与常识一致并逆向与目的地选择偏好成比例单位不变 估计参数不近 表示旅行者有不同感知往返时间取舍显示转移时间增加10分钟相当于单程票客旅行时间增加68分钟和公交卡客新年增加55分钟显示旅行者对长转移时间有重大负面影响公交卡客的绝对时间参数均大于单向票客,表示使用卡护理的客更多时别变量不变
土地匹配度参数为正值,表示O-D站土地使用类型关系强时,目的地站更有可能选择尺度和线性变量参数为正值,显示当源站和终点站旅行规模更广泛或O-D站站在同行时,选择目的地站的概率更高
单向票模型中显微变量的参数为正数也符合乘假旅客特征, 因为观光客多使用单程票总体估计结果具有统计意义,并在一定程度上解释新年选择行为机制值得强调的是,参数应重新校准,以便在应用其他不同节日时恢复旅行行为
4.2模型应用比较
测试预测模型预测效果时,校准结果用于预测2017年1月1日广州元新元17个新站和3条新线连接网络同时,传统统计模型单约束重力模型、支持向量机、反向传播神经网络和机器学习模型中的双基神经函数网络选择在相同的数据源和条件下比较流量阻抗函数以指数函数形式使用引力模型,如方程显示13)最小平方法用于转换成线性参数估计表35码: 去哪儿 并 旅行时间和从原站转接时间一目的地站j大全分别; , ,并 系系数确定
图中显示4(a)-4(e),预测值与实际客运数据比较,预测偏差图绘制单受限重力模型和另外三种机器学习模型的误差波动大于本文中建立的拟议预测模型重力模型中整个网络的绝对误差为130.2人次,SVM模型为140.9人次,BP神经网络为139.1人次,RBF神经网络为157.3人次,而拟议模型为54.6人次则远优
(a)
(b)
(c)
d)
e)
此外,表5显示五模型的详细预测误差统计6.与其他四种模型相比,拟议模型平均绝对误差分别减少58.05%、61.21%、60.72%和65.26%。绝对误差比例50人行程达73.1%,相对误差小于50%为66.83%,差错优于其他四种模式
图中详细比较绝对误差及其累积百分比5.统计还显示,模型拟精度优于常规重力模型SVM和两个神经网络模型整体然而,拟议模型相对误差性能略微弱,主要是因为多OD站流小,导致大误差相对误差比200%以上为6.78%,平均绝对误差为41.0人次行程相对误差超过500%为1.70%,平均绝对误差为35.40人次行程,低于总平均绝对误差因此,它不表示相对差错越穷,绝对差错越大,预测性能越差仍可保证所拟模型的预测效果
除此以外,新行与模型中现有行间不同类别出错结果显示于表7.模型平均绝对误差结果预测新线时相对较低,即只有23.14人次和23.26人次现有线对原线预测性能时,误差比其他差错大,主要是因为现有站间基本流量大
新年节选择分析客运模式和选择行为在某些方面会有所不同拟目的地选择模型可用以反映选择行为特征和客流规则,因此方法适用于所有节日考虑到拟议方法的验证和可移植性,本研究补充了国庆日案例(七天假),以进行相对全面的实验设计2014国庆节一天随机选择模型估计(即2014年10月2日),并使用拟议方法预测下一年同一天客流分布
表显示校准参数小差5上图显示不同节日旅行特征微微分然而,所有绝对t级值仍然大于1.96并调整华府2大于0.2表示模型仍然适用和可靠预测偏差图还绘制显示整体误差,图中显示6.为了方便阅读,分布图显示7与图中表示值一致6.图图图值建模预测沿Y级轴和相应的实际计数沿X级轴心如果所有预测都匹配实际值,图上点数与图上绘制的红线(45度线)匹配模型预测结果大都接近红线,说明预测效果良好国庆日比较模型误差统计见表8.简言之,预测效果和精度仍比其他模型理想仍然可以保证验证并应用其他节日假并可以更有效地应用到实用工程
5级结论
论文使用AFC数据建议城市铁路交通客流分布预测模型,该模型适合网络结构及节日独有特征加权外部采样最大似值估计法用于校准参数从AFC提取的汇总数据转换成分解表单,实现参数有效标定它可以减少数据采集难度并增强模型应用性,同时确保可接受的精度
在拟议模型中,目的地选择模型定义目的地吸引度、土地匹配度等变量作为解释变量这是模型可解释和预测能力的主要优势模型显示合理性能t级值均大于1.96,中度调整华府2超过0.2此外,标定结果显示,旅行和转移时间对旅客目的地选择有重大负面影响,而目的地吸引度和土地匹配度等其他变量则有正面影响。结果还显示,公共运输卡客更多关注旅行和转移时间,而其他变量则保持不变。假变量描述目的地的吸引力和可访问性也具有合理的可解释性和意义所拟模型用于预测二例广州元元元和国庆日与重力模型SVM、BP和RBF模型相比,拟议模型误差大为减少,证明预测模型在网络变化的不同节日假设中验证和适用性
更多城市依赖地铁系统,精确预测乘客流分配可提供重要初级数据,供地铁操作管理部开发节假前实用组织机制,这有助于缓解拥塞并增强节假日应急能力
由于很难获取实用站数据,本文聚集客流特征相似站并定义描述土地使用连接模型的新变量尽管如此,难以准确捕捉土地利用重大改变对客流的影响此外,流量分布动态特征可是一项扩展研究,本文尚未予以考虑。未来研究中,可考虑更多土地使用属性和动态流量分布开发分布预测模型
数据可用性
广州大通根据许可提供数据支持这项研究结果,因此无法免费提供相关作者应请求经广州市许可,考虑访问这些数据
利益冲突
撰文者声明,本论文的发布不存在利益冲突问题。
感知感知
这项研究得到了中央大学基础研究基金的支持(no.2020YJS080和中国自然科学基金会71931003