文摘

共享自行车的需求预测直接决定了车辆的利用率和项目操作的好处。准确的预测基于现有的操作数据可以减少不必要的交付。由于共享自行车的使用容易时间依赖和外部因素,大多数现有的工作只考虑一些属性的自行车共享,导致建模和令人不满意的预测性能不足。为了解决上述的局限性,本文建立了一个新颖的基于卷积递归神经网络预测模型的命名为CNN-GRU-AM注意力机制。有四个部分提出CNN-GRU-AM模型。首先,卷积神经网络(CNN)和两层用于从多个数据源中提取局部特征数据。第二,封闭的复发性单元(格勒乌)是用来捕捉CNN的输出数据的时序关系。第三,注意机制(AM)系列的介绍挖掘潜在的关系特性,不同的权重将被分配到相应的功能根据它们的重要性。最后,一个完全连接层与三层添加到学习特性和输出预测结果。评价该方法的性能,我们进行了大量实验在两个数据集包括一个真正的移动自行车数据和公共自行车共享数据。 The experimental results show that the prediction performance of the proposed model is better than other prediction models, indicating the significance of the social benefits.

1。介绍

不断加速的城市化和城市规模的扩张,交通的压力正在增加。为了减少道路交通的压力,解决日益严重的交通问题,各地提出了旅游模式的“铁路+公交+缓慢旅行。“公共自行车开发由于其自己的特点包括绿色、无污染,能耗低,占用空间小,近年来已有力地推动了各国政府(1]。作为一个扩展的公共自行车,自行车共享已经广泛使用和发展在世界各地的许多城市2]。然而,随着自行车共享的快速发展,时间和空间需求的波动导致了城市车辆的不均匀分布,如“供过于求”在某些地区和“供过于求”在其他领域(3]。

为了解决上述问题,有必要预测共享自行车的每个操作区域需求,并合理地安排车辆调度领域中。目前,很多研究自行车需求预测的准确性进行了。他们可以分为两类:一是用户选择的旅游模式,另一个是关键影响因素。研究用户的出行选择,坎贝尔et al。4]调查用户的旅游模式和智能卡数据识别的重要因素,影响用户的出行频率。El-Assi et al。5]运用分布滞后模型来评价建筑环境和天气的影响在多伦多自行车共享的需求。这个模型的链接数量的日常公共自行车旅行网站与土地利用、建筑环境和天气条件。弗尔涅et al。6)使用一个正弦模型来预测季节性自行车共享需求。另一方面,在关键影响因素的研究7),Eren和乌斯8)提出了一个框架,全面显示共享自行车旅游需求的影响因素,这是用来评估各种因素的影响,在汽车贷款的需求。实验结果表明,天气和地理位置因素在预测结果中发挥关键作用。Gebhart和诺兰德(9)使用每小时天气数据来评估天气条件的影响在共享的自行车旅行模式。寒冷的天气和高湿度会减少对自行车租赁的需求。上述结果提供有价值的见解分析关键影响因素对自行车共享的需求。

最近,深度学习是广泛应用于时间序列预测10- - - - - -16]。bicycle-sharing需求预测是预测问题的时空数据包含空间和时间属性。的空间属性,康et al。10充分考虑空间的复杂性、非线性和不确定性的运输网络和提出了卷积神经网络预测模型。该模型有效地利用交通的空间信息数据,但它忽略了时间的属性。因此,Zhang et al。11)综合考虑时间和空间信息,提出了一种基于卷积和残余网络预测模型,使预测结果更加准确。的时间属性,傅et al。12]使用长期短期记忆(LSTM)及其变体的网络封闭的复发性单元(格勒乌)短期交通流预测。此外,Yu et al。13]应用LSTM和autoencoder捕获的时间依赖交通预测在极端条件下,提出了交通流LSTM神经网络预测模型。徐et al。14)大数据分析和LSTM模型用来预测要求自行车共享。上述研究分析了共享需求自行车从时间和空间的角度。CNN和LSTM有优势在提取特征信息,但他们的缺点弱的可解释性。近年来,注意机制已广泛应用于各个领域的深入学习。结合注意力机制,深度学习模型的训练速度和精度大大提高。例如,Bahdanau et al。15]介绍了注意力机制的过程中获取语义特性,提高了翻译的准确性。徐et al。16)建立了两个注意力机制,即“软”和“硬”,解释了生成模型权重的过程。上述研究表明,注意机制对学习任务序列有巨大的影响。因此,注意机制应用于自行车共享的需求预测,在不同的权重分配给不同的因素,可以帮助减少误差值和提高自行车的性能需求预测模型。

总之,克服不完整的考虑和预测算法不足的问题在传统的自行车需求预测,也就是说,只考虑时间和空间属性的一个方面(17,18),本文提出了一个共享的自行车需求基于卷积递归神经网络预测模型的命名为CNN-GRU-AM注意力机制。我们不仅考虑用户的历史旅游数据的波动性也分析用户的旅游特点和外部的影响因素对自行车共享的需求。

剩下的纸是组织如下。节2数据处理和影响因素的分析介绍。介绍了该方法在部分3。节4广泛的两个数据集进行实验,评价该方法的性能。最后,我们研究的结论和进一步的工作描述部分5

2。数据处理和影响因素的分析

2.1。操作和数据处理领域

深圳位于中国的南部海岸,与地理坐标之间的113°46′,东经114°37′和22°27′,北纬22°52′。根据地理位置信息操作的区域,图中的阴影部分1可以分为五部分。其中,一个是南山区,包括四个操作领域如南山,蛇口街道,粤海街道,街道和商人。B是龙华区,其中包括三个操作领域的谭办公室,观澜办公室,龙华办公室。C是福田区只有Fubao街操作区域。D是龙岗区,其中包含Henggang街,龙岗中心城,和Minzhi办公室操作区域。E是屏山区,其中包括屏山街和中心街操作区域。

共享扫描返回的自行车只能租来的,通过应用程序的代码在任何操作区域。截至2018年12月,深圳推出了6720共享自行车每天使用约4353倍,把重要的社会和环境效益。结合波面理论,我们提出了一个可访问性指标能力潜力评价模型选择关键节点(19]。关键节点,用户的需求很大,问题的节点“供过于求”和“供过于求”通常发生在早晚高峰。三个操作领域的数据集是真正的数据从2016年7月到2017年7月在深圳,所获得的硬件设备上传到城市bicycle-sharing系统。然而,系统有时遇到问题等设备电源故障和网络断开,导致部分数据丢失。同时,由于人工调度和用户日常使用前检查,将生成大量无效数据。他们主要包括以下。(1)借款时间小于或等于1分钟,可以推断出车辆检验数据。(2)数据与自行车持续时间超过24小时可以视为不正常的借贷数据如自行车被盗和修理。(3)大多数的自行车用户睡凌晨0 am-5,生成和借来的自行车的数量很小,所以这个时期的数据对模型预测结果几乎没有影响。因此,上述不合理数据需要消除。 The results of data preprocessing are shown in Table1

2.2。分析影响因素
2.2.1。时间和空间特征的分析

从时间维度,我们可以发现共享自行车的使用在不同的时期决定了是否会在很短的时间内短缺。如图2,对自行车的需求周期性变化在工作日和休息日。很明显,早上和晚上在工作天达到高峰,和使用的车辆数量高峰期间大幅增加,而其余的天平面相对,没有明显的高峰期。

从空间维度,共享自行车的热点主要集中在工作日期间高密度和高强度的旅游活动。同时,沿着地铁或公交车站,住宅小区,和商业区高频骑车自行车共享领域,表明城市共享自行车主要是解决城市问题的“最后一英里”旅行。

2.2.2。天气特征因素的分析

除了上述因素外,天气条件也有更大的影响在共享自行车的需求(20.]。表2在这项研究中显示了天气组件。数据来自于国家气象中心。

皮尔逊相关系数来衡量两个变量之间的关系是一个数值(21]。其范围从−1比1,1表示完全同意和−1表示完全不一致。系数值越大,相关性越强。计算方法是两个变量的协方差除以两个变量的标准差,及计算公式如下:

解决天气数据和历史数据共享的自行车旅行,借了自行车的数量之间的皮尔逊相关分析和上述指标,结果如表所示3

从表3,共享自行车借款是强烈的数量与用户的数量和与其他因素显著相关,表明用户的自行车需求与天气条件有很大的相关。因此,考虑到时间特征和天气条件,它将提高需求预测的准确性的自行车共享。

3所示。该方法

一般来说,公共交通的状态有很强的时间依赖性(22]。共享自行车可以被视为一个公共运输,所以自行车借贷的需求也是现有的与时间有关的。在正常情况下,与时间有关的趋势将会遵循一定的历史模式。在相同的模式中,天气条件也有很大的影响对自行车共享的需求。因此,为了提高预测精度和车辆调度效率,提出了一种CNN-GRU-AM网络预测模型。总体框架图如图3

如图3输入数据包括三个部分,包括历史数据共享的自行车旅行,时间特征数据和气象数据。该模型主要由四个部分组成。首先,输入数据发送到两层CNN网络提取特征。其次,cnn网络的输出被视为格勒乌网络的输入数据,可以通过大量的训练数据来找到合适的参数。因此,格勒乌可以学习这些特性之间的时序关系。第三,注意机制引入上述特性的重要程度,从而获得加权网络中的特性。最后,一个完全连接网络三层是用来获取共享自行车需求的预测结果。

3.1。CNN网络

卷积神经网络(CNN) (23)有较强的特征提取能力,可以提取多维时间序列数据的空间结构之间的关系。在CNN,当地可有效提取关键信息通过设置不同的卷积核。然后,使用本地连接共享和重量可以减少训练参数和模型的复杂性,以提高模型效率(24]。典型的卷积神经网络结构如图4

CNN取得了很大的研究成果在二维图像的处理;也可以广泛用于处理一维数据(25]。在我们的方法中,我们只使用卷积层提取的特征数据。在回旋的层,输入数据需要执行卷积和激活操作。计算公式如下: 在哪里 滤波器的权重系数, tth输入数据 输出的结果吗

3.2。格勒乌网络

在未来一段时间,用户的自行车需求将受到当前和以前的地位的自行车。因此,为了记住很久以前的自行车状态,本文研究了影响不同的时间步长下自行车的需求。长期短期记忆(LSTM) [26)是基于递归神经网络(RNN) [27)架构,旨在解决的问题RNN的长期依赖。它可以更好地反映时间序列数据的复杂非线性的关系(28]。封闭的复发性单元(格勒乌)(29日)是一种变体的LSTM组成的一个更新zt和一个重置门rt。更新门是用来确定被丢弃的信息和新信息需要添加。重置门决定的程度之前的信息就会被丢弃。LSTM的网络结构和格勒乌图所示5

与LSTM相比,格勒乌结构简单,利用两个封闭的开关比LSTM实现更好的性能。由于门的数量小于LSTM的参数的数量减少,所以过度拟合的风险降低。Theerawit et al。30.)应用CNN-GRU CNN-LSTM情感识别和发现他们的性能是相似的,但CNN-GRU更快的训练时间。因此,本文选择格勒乌进行建模。

CNN的输出层X= { }格勒乌时间序列作为输入。H= { }是隐层的输出,这是需求预测的结果。隐层单元ht格勒乌可由以下公式计算: 在哪里 代表的权重矩阵 ,分别 是训练参数矩阵,xt当前时间间隔的时间序列数据吗t, 是内存单元的输出在前面的时间间隔t- 1,σ是乙状结肠函数和双曲正切是双曲正切函数。计算公式如下:

在本文中,我们添加了一层格勒乌64背后隐藏的神经元CNN的两层。乙状结肠激活函数,用于学习的时间序列数据之间的关系。因此,有效的动态建模可以执行的时间序列数据共享的自行车。

3.3。注意机制

注意机制(AM) (31日,32)是源自人类的视觉的研究,它主要包括两个方面:(1)决定关注输入部分和(2)分配有限资源的重要组成部分。近年来,注意机制已广泛应用于建模预测的任务,可以给不同的权重分配隐藏层根据不同特性对输出的影响。为了关注不同的输入特征对预测结果的影响,注意机制引入共享自行车需求预测模型,提高预测精度。是保持之前的网络层的中间输出结果首先,然后将它们与产出的价值序列。通过这种方式,该模型训练选择输入需要聚焦的特性,赋予更高的权重高的输入特性的相关性。图6是一个关注机制的原理图。

重量计算公式如下: 在哪里 是权重矩阵, 是输出向量的隐层格勒乌, 的激活向量 , 是分配的权重值。

一次 了,最后向量 可以得到如下:

4所示。实验分析

这个实验是进行PC机与英特尔(R)的核心(TM) i5 - 8265 u(电子邮件保护)10 GHz 1.80 GHz和16 GB的内存和Windows操作系统。的编程语言是3.7.4 Python的版本号。PyCharm集成开发环境(IDE),和机器学习库包括Tensorflow(魅惑和Keras(2.3.1)是用于实现算法。

4.1。数据集

一个真正的自行车共享数据集在三个操作在深圳地区和华盛顿公共自行车共享数据集用于实验。每个数据集包括共享自行车旅行历史数据,时间特征数据和气象数据。表45显示数据集的描述和特性描述,分别。

数据的预处理是需要的。在这部作品中,一个炎热的编码是利用编码工作和时间特征。共享自行车的历史旅游数据和气象数据归一化[0,1]通过最小和最大归一化法。转换公式如下: 在哪里x是最初的特性,X是归一化向量的x,x最小值x马克斯最小值和最大值的电流向量x,分别。

4.2。模型评价指标

为了定量分析模型的准确性和优越性,均方根误差(RMSE),平均绝对误差(MAE)和平均百分误差(日军)[33)是用来衡量不同的性能评价指标在不同的预测模型。更具体地说,RMSE和梅测量的绝对星等的真实值和预测值之间的偏差,和日军的相对大小偏差的措施。此外,美和日军不容易受到极端值的影响。RMSE由误差的平方计算,但它是更敏感的离群数据。大多数方法采用这些指标由于自身优势。那里,上述指标来衡量预测值和真实值之间的差异数量的自行车共享。计算公式如下: 在哪里 分别是实际值和预测值,然后呢n是样品的数量。需求预测的自行车共享,RMSE越小,美,和日军值,预测误差值越小,更准确的预测结果。在本文中,我们主要使用日军值来训练神经网络,也指其他两个值的变化。

4.3。模型训练参数设置

该模型有四个部分,即,CNN层,格勒乌层,层,完全连接(FC)层。格勒乌层的激活函数模型是乙状结肠,和其他三个层的激活函数都是ReLU。优化器选择亚当,学习速率设置为0.0001,模型训练了70发(时代)。卷积层参数的设置将影响模型的性能。我们进行了实验的层数卷积层,过滤器的大小,内核参数的值。表6表明卷积层的数量是1。当过滤和内核的大小设置为128,该方法的实验结果在三个数据集是最好的。表7表明卷积层的数量是2。从这个表中,当两层CNN层的大小的过滤器设置为128年和64年,和kernels_size设置为1时,该方法的实验结果在三个数据集是最优的。

在我们的模型中,其他两个主要参数,即。,time_step and batch_size, are affected by the prediction performance. Table8显示的平均误差值三个数据集当time_step batch_size取不同的值。

从表8,当time_step设为10,batch_size设置为256,实验预测误差值最小的精度是最高的。因此,这些值将用于随后的模型对比试验。

4.4。实验结果
4.1.1。实验结果在深圳真正的自行车共享数据集

为了验证提出的预测性能CNN-GRU-AM方法,我们使用以下预测模型进行比较。(1)LSTM [15]:LSTM认为时间序列特性的数据集(2)格勒乌(33]:格勒乌是LSTM的一个变种(3)美国有线电视新闻网(34]:CNN认为空间information-weather特性的数据集(4)GRU-CNN [35]:GRU-CNN是一个混合模型,格勒乌首先是用来提取时间序列信息的输入数据,然后,CNN应用于提取天气特征(5)CNN-GRU: CNN cru是一个混合模型,用于提取CNN的天气特征,然后,格勒乌应用于提取时间序列信息

CNN-GRU-AM的预测结果和上述预测模型在三个领域如表所示9

从表9,CNN-GRU-AM模型具有最佳性能三个方面,从而大大提高了模型的预测性能。LSTM是一个深度学习网络,可以有效地获得长输入序列的时序特征。但是,它不包括卷积单位,不能获得空间关系。格勒乌是LSTM的变体,对一些较小的数据更好的性能。因此,格勒乌比LSTM的预测结果。由于数据有很强的相关性与时间特征,CNN只能提取当地关键信息空间,也未能考虑的时间特征。此外,与GRU-CNN模型比较,CNN-GRU模型可以更好的预测性能。CNN-GRU模型利用CNN首先提取局部特征数据,然后使用格勒乌提取时间序列预测功能,可以把天气的特征与时间序列特性。更重要的是,该CNN-GRU-AM CNN-GRU模型引入了一个注意力机制,分配不同的权重,计算每个特性的关注分数。因此,它可以识别出有影响力的特性,产生更大的影响预测结果有效地分配更大的重量。 Compared with the CNN-GRU model, the three prediction error values (RMSE, MAE, and MAPE) of the proposed model have been reduced in the three areas, especially the MAPE values have been decreased by 9.48%, 1.94%, and 2.22%, respectively. In summary, the prediction error values of the CNN-GRU-AM model are less than that of other prediction models, which improves the prediction accuracy. In order to show the performance more clearly, 300 data values randomly selected from the test results are shown in Figures7- - - - - -9。在这个图中,红色曲线的实际需求价值共享的自行车,和蓝色的曲线预测价值。横轴是选定的测试值在不同的时间段,纵轴是共享自行车借贷的需求。从这些数据中,我们可以清楚地看到的表演提出CNN-GRU-AM优于其他方法相比。

然后,剩余网络(ResNet)可以提高精度通过增加一定的深度。内部残留块ResNet能有效缓解梯度消失的问题导致深层神经网络通过增加深度。我们取代了卷积网络中残留的神经网络模型。实验结果如表所示10。从这个表中,我们发现错误值已经发生了重大的变化,但整体预测误差值没有改变太多。本文数据和模型层的数量很小,所以预测误差值较小,预测结果更加准确。比较表9,CNN-GRU-AM模型的性能优于ResNet-GRU-AM模型。

10/24/11。实验结果在华盛顿的公共自行车的数据集

由于我们的数据没有公开,没有相关文献引用我们目前研究的数据集。为了验证本文提出CNN-GRU-AM模型的预测性能,介绍了在华盛顿的公共自行车共享数据集,数据集是一个典型的公共领域的公共自行车。大量的研究人员已经研究了这辆自行车的需求预测数据集。我们比较前面的研究成果和方法,并在实验中数据集的特征选择与三个方面是一致的。实验是较典型的交通流量预测方法:(1)哈[36]:历史平均法是一种典型的时间预测方法。在相同的时间间隔,它使用历史流入和流出的平均值进行预测。(2)华宇电脑(37]:ARIMA是一个流行的时间序列预测模型。它是简单的,不需要其他外生变量。(3)LSTM: LSTM通常用于时间序列预测问题,从而获取长期的与时间有关的问题。(4)ASTRCNs [38]:全称是时空循环卷积网络模型基于注意机制。结合注意力机制,它可以调整历史数据动态预测目标的重要性。

以上实验结果预测方法在华盛顿数据集如表所示11

上述方法的实验结果在深圳三个数据集如表所示12

从上面的表中,可以获得该模型的实验结果比经典的时间序列预测模型,所以CNN-GRU-AM模型提出了可以减少预测误差值,提高预测的性能。

5。结论

本文以深圳共享自行车为研究对象,提出了一个卷积递归神经网络预测模型基于注意机制。在这个模型中,CNN是用来学习和提取地方特色。这些特征作为输入的格勒乌用于捕获时间序列特征。然后,注意机制应用于提取注意分数CNN-GRU的输出信息,及重要特征因素被赋予更大的权重。最后,输出层与三层完全连接集成预测需求的自行车共享。实验结果表明,该提议CNN-GRU-AM模型的预测性能也比在两个数据集模型进行了比较。此外,不同的实验参数对模型的影响也在探索。验证结果表明,输入特性和注意力机制是有效改善模型性能,表明时间特征和外部因素在预测的重要性对自行车共享的需求。

在未来的工作中,我们将探索其他相关因素(如。,the population, the borrowing and repayment requirements of neighboring key stations, the public transportation connections around the stations, etc.) that affect the use of vehicles furtherly and continue to research more effective neural network methods. Furthermore, we will apply them to solve the time-series data and provide a theoretical basis for the scientific scheduling of time-series data.

数据可用性

网络代码和数据可从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究是由中国国家自然科学基金支持,在格兰特号。62062040,62006174,61967010,和71661015,江西省自然科学基金杰出青年项目批准号下20212 acb212003,江西省主要学科学术和技术领袖资助项目,在批准号20212 bcj23017,江西师范大学研究生创新基金项目,在批准号YJS2020045,江西师范大学的青年人才培养计划。