文摘

汽车共享系统中一直发挥着重要的作用作为替代传输模式,以避免交通堵塞和污染由于快速增长的私家车的使用。在本文中,我们提出一个新颖的车辆搬迁系统三倍的一个重大的改进:(i)数据预处理,(2)需求预测,(3)搬迁优化。给出了数据预处理以自动删除假要求搜索失败,应用程序错误造成的。然后,使用深度学习真正的需求预测方法,双向封闭的复发。最后,最小费用最大流算法部署到最大化预测需求,同时最小化搬迁。此外,系统部署在真正的用例中,题为“铜丰田哈:钼,”这是一个在朱拉隆功大学汽车共享系统。它是基于一个web应用程序通过线与基于规则的通知。实验进行了基于2019年真正的车辆使用数据。通过比较在现实环境在2019年11月,结果表明,我们的模型甚至优于手动迁移由经验丰富的员工。它实现机会损失减少3%,减少3%搬迁旅行,减少人类努力17工时/周。

1。介绍

人口和经济的增长,汽车共享系统成为一个选择公共交通,缓解道路交通拥堵1]。交通领域的专家预测,汽车共享可以大大增加在接下来的十年里,尤其是在亚太地区(2],可以成为私家车之间可能的桥接模式和传统的公共交通工具,比如公共汽车和火车。此外,汽车共享用户的数量预计达到3600万账户,和价值的全球汽车市场预计将在2024年110亿美元(3]。

从过去到现在,有两个主要的汽车共享系统的设计选择。第一个设计是一个往返汽车共享的系统。在这个设计中,客户需要提前预约车辆并返回车辆在车站他们选。其他设计是一个单向的汽车共享的系统。多个车辆可供客户在多个电台。客户可以选择一个汽车从站和返回的车辆在任何车站操作区域。如果单向拼车系统运作效率,更有利于客户和运营商,而往返汽车系统(4]。然而,在单向汽车共享系统,汽车的数量在每个车站会变得不平衡,太多的车辆可以在瓦电台,而高需求站包含很少的车辆(5]。这种情况会导致汽车共享系统的机会损失。为了减少损失的机会,一个有效的车辆搬迁策略需要考虑。

几个战略解决方案提出了车辆单向汽车共享系统的搬迁,可分为两类。第一类是基于用户的策略,鼓励客户/用户的营销活动,然后帮助搬迁车辆6- - - - - -11]。这种策略容易尺度与用户的数量和从车辆运营商不需要努力。不过,不能保证用户将始终遵循车辆搬迁计划。第二类是运营商战略,车辆运营商预测每个车站的要求,然后发送操作人员搬迁车辆根据需求预测结果。这一策略确保了车辆搬迁所需的完成任务,而且需要经验丰富的人员,为车辆搬迁工作(8,12- - - - - -18]。在[12,15),解决方案基于数学模型,提出了基于规则的算法。在[13),电池消耗和充电问题被认为是为了优化转移操作。最近,在14,19),深层神经网络在汽车需求管理系统。尽管所有上述解决方案显示改善搬迁业务基于真实数据,没有一个是真实的汽车共享系统实现。

在本文中,我们提出一个新颖的车辆搬迁系统在数据预处理与重大改进,需求预测,搬迁优化。我们建议的系统是专为单向汽车共享系统运营商的策略。首先,数据预处理自动删除假要求搜索失败,应用程序错误造成的。然后,每个车站的实际车辆需求预测使用深度学习方法被称为双向格勒乌。我们已经描述了使用BiGRU部分的原因4.2。最后,最小费用最大流算法部署根据预测车辆可用性最大化的要求,同时最小化搬迁。此外,我们提出了系统部署在真正的用例标题为“铜丰田哈:钼”,这是一个汽车共享系统在朱拉隆功大学,曼谷,泰国。监视仪表板和搬迁通知操作人员也在我们的系统中实现。在实验中,模型是2019年训练使用使用日志。结果表明,搬迁计划由我们的模型比计划由人类专家。它可以减少人类的努力很大程度上。此外,系统已经部署在真实的场景中。结果表明,我们的系统能够成功运作和取代现有的人工流程在操作空间。

总之,我们的贡献相比之前尝试如下:我们的工作的主要目的是提出整车关系系统的真实情况。提供一个合适的搬迁计划,,关键是要有在未来车辆的要求。因此,我们是第一个研究工作包含车辆需求预测和搬迁计划优化的实际情况。然而,所有之前的尝试(9,10,12- - - - - -15,17只是基于一个模拟环境,和没有人提出这两个模块作为一个完整的解决方案。在需求预测,我们是一个先驱者的应用和比较各种深度学习网络。此外,新的损失函数提出了考虑离职的需求和目的站。同时,车辆作业过程的后处理步骤提出了我们的需求预测模型。从一个密集的实验中,我们的结果表明,Bi-GRU比前面的方法,LSTM [14,19]。重新优化,优化的方法称为“最小费用最大流”应用以达到最好的搬迁计划,而另一些人(11,16)是基于一个简单的规则在一个模拟的环境。

本文的其余部分组织如下:部分2讨论了相关的工作。部分3解释了整个系统和现有的铜丰田哈:操作。我们建议车辆搬迁系统包括数据预处理、需求预测和搬迁优化部分中描述4。讨论了绩效评价部分5。结论部分阐述了6

车辆搬迁策略可以分为两大类:基于用户的策略和运营商策略8]。基于用户的策略是基于可用的用户或舒适的帮助执行所需的搬迁任务。基本上,一些折扣或免费旅行等激励措施提供给用户。Febbraro et al。6)提出了一个折扣的用户自愿执行车辆搬迁。巴斯et al。7]介绍了两种基于用户的迁移方法叫做旅行加入和分裂。当系统发现它变得不平衡,它将分裂用户有多个乘客重新安置多个车辆到终点站。相反,如果两个用户在相同路线的同时,系统会要求两个用户合并成一个用法。此外,Cepolina和淀粉9)调查了一个完全基于用户车辆搬迁汽车共享系统在城市地区。为了处理不平衡需求,提出系统通知用户感兴趣的运动目标停车场的车辆。这不仅是对系统管理,也有利于用户。最近,Angelopoulus et al。10]介绍了基于用户e-motorbike共享的策略。背后的想法是将公共交通信息和图论为用户授予的折扣。此外,评估这个想法,他们应用策略的自由浮动汇率体系的威托利亚-加斯泰兹,西班牙。这些以前的研究表明,有多种解决方案基于用户的策略。在本文中,我们的场景基于一个汽车共享系统在一个大学校园。所以,运营商的策略更简单,更有效,因为它适用于小面积(校园)。

基于用户的策略相反,运营商的策略是基于车辆搬迁由操作人员执行。赫et al。12)确认车辆搬迁是一个np难优化问题并提出汽车共享系统的进化算法。算法评估在实际汽车租赁和分享公司公布的数据“car2go。“他们还调查了系统适应不同的参数,如最大允许时间。Gambella et al。13)考虑车辆搬迁从服务提供者的角度。目标是最大化利润与旅行相关的由用户执行的。他们引入了一个数学模型来管理人员分配在一个大规模、汽车系统通过考虑电池消费和充电过程。他们的解决方案是开发和测试一组真实的数据来自现有的汽车共享系统。根据其结果,解决安置在汽车系统价值,使服务提供者实现更大的利润。考虑到操作人员的努力和成本,Kek et al。15)提出了一个决策支持系统来确定一组算法人力和操作参数的车辆搬迁问题。评估和测试系统,模拟使用一个数据集进行商业运营数据在新加坡从汽车共享系统。关于电动汽车(EV), (13,16检查电动汽车),适当的解决方案,因为需要考虑充电站等约束。陆et al。17]介绍了解决方案基于用户请求之间的匹配和电动汽车的剩余数量的电模拟。马丁et al。18应用马尔可夫模型,一个随机模型,模型时间序列数据,在单向搬迁任务。深度学习的日益普及,et al。20.)使用一个简单的前馈模型与历史交通流数据和上下文因素数据每日长期交通流量预测。Yu et al。14]介绍了一个分析系统,部署长短期记忆(LSTM)预测短期的汽车需求。他们还使用了多个时间特性,包括一天的时间,一天的星期,和天气条件。进行评估,他们使用了真实的数据从一个汽车系统在成都。然后,他们展示了汽车市场的反应对操作策略基于两个服务提供者的数据。宁等。19LSTM)也用于需求预测,仿真结果证实使用一种称为“格兰杰因果”的统计假设检验。Zhaowei et al。21]M-B-LSTM使用,一个端到端的混合深度学习模型,对短期交通流预测。马等。22)聚类技术应用于基于深层神经网络创建多个子模型。然后,他们(23]提出了上下文卷积复发性神经模型提取inter-and-intra-day交通模式在日常交通流预测。出于这些研究的结果,我们调查了递归神经网络使用各种体系结构类似的目的。在我们的场景中,必须计算优化算法高效自搬迁时间表应该经常运行(每小时)由于数量有限的共享汽车;因此,进化算法不适合我们的场景中,因为它的高计算成本。也更深度学习算法的变化,例如,格勒乌和双向格勒乌,在我们的工作除了LSTM调查。我们不仅只是使用这些网络还设计专为汽车共享系统模型。

尽管先前的研究基于用户和运营商策略显示杰出的表现,他们大多是评估通过喂养真实数据离线解决方案,在实际部署的结果没有公布。这不仅激发我们评估我们的解决方案通过使用真实数据,还通过部署在汽车系统操作在现实世界中。此外,最之前的作品集中在交通预测在一个开放的环境,它允许无限数量的车辆在开放区域。这是完全不同于我们的车辆搬迁,在车站和车辆的数量是固定的。

3所示。铜丰田哈:钼体系

自2017年以来,朱拉隆功大学和丰田合作推出了拼车系统名为“铜丰田哈:钼”(从今以后称为Hamo),如图1。Hamo的系统中,大学人员,如学生、教师、和工作人员,可以去任何地方很快在校园里。这个系统提供一个环保的选择运输方式,补充一个大学内的公共交通工具。系统处于早期阶段表现良好,但是,它不能避免机会损失问题时更多的用户。处理这个问题,Hamo人员采用手动relocation-based解决方案的近似汽车的数量在每个车站的经验。然而,这种解决方案是耗时和昂贵的,同时也要求员工的经验是有效的。

这部分组织如下:部分3.1描述数据集和数据收集过程,以及区分成功和失败的用法。部分3.2解释Hamo现有的操作和它目前面临的问题。

3.1。数据集

我们的数据集包含的历史Hamo服务共享车辆预定和用法。这些数据是通过收集Hamo的移动应用程序,在用户需要挑选和使用车辆前预约。如图2,每个条目包含用户的访问信息,例如,离开车站,终点站,预订时间。这些预订记录可以用来预测未来需求在给定的时间。根据数据,我们定义了一个成功的使用作为一个可行的预订也可以提供一个完整的旅行,和一个没有使用作为一个成功所需的旅行预订不能实现。失败的用法可能发生由于缺乏出发站和/或不可用的车辆在目的地车站停车场,导致系统中损失的机会。

提供Hamo为客户的服务,有22台和30车辆可以从平时早上7点到下午7点。服务被关闭在周末和国家法定假日。图3显示了服务区在大学校园。在我们的研究中,我们使用的数据记录从2017年12月到2019年10月。可以根据数据、用户行为分析。例如,它可以看到很多使用记录创建9点前30分钟。,这是第一节课的起始时间。此外,它可以看到,只有少数使用记录是在讲座的持续时间。

4显示的数量失败的用法由电台2018年11月。可以看到,最多的三大电台站4失败的用法,12日分别和2。这是因为这些站附近的购物中心和/或高的教师数量的学生。另一方面,电视台13日17日和20的最低数量的前三站失败的用法。这是因为这些站附近的教师较低的学生人数和/或难以到达。根据这些结果,我们可以知道哪个车站有很高的需求,和电台的需求很低。因此,在给定的时间,我们可以设计汽车基于需求在每一站搬迁。在我们的设计中,这些信息将被视为与其他重要因素,如两个站之间的距离和员工的工作负载。

3.2。Hamo现有的操作

传统上,Hamo人员已经解决了机会损失的问题通过执行以下统计分析。首先,操作人员操作时间划分为多个时段,然后手动评估要求在每个站在每一个时间段。站的排名最高的需求的最低需求提出了一个表。接下来,车辆将被分配到每个车站下令其预测需求,所以车站与更高的需求将被分配第一。同时,我们要离开至少一个在每个车站停车场传入的车辆。相比之下,低需求将被分配几站车辆或没有。最后,基于表,操作人员会安置适当数量的车辆每两个小时。

我们调查的数据存在很多虚假的需求。这发生在数据记录由于用户/系统错误。例如,一些用户重复预订几次后他们的第一次尝试失败。这导致预订记录的数量不再反映了实际使用的数量。另一个例子是当系统创建多个预定记录用户在驾驶车辆。这是一个系统错误,系统中不应该发生。然而,由于这些假的要求实际上出现在数据,操作人员手动删除它们。这要消耗大量的时间和精力。

4所示。我们建议的系统

搬迁系统提出了如图5和包括四个模块:(i)自动数据预处理,(ii)汽车需求预测,(3)搬迁优化和(iv)的web应用程序。鉴于预订服务的历史,我们的系统的任务是自动确定最优车辆搬迁员工旅行。首先,假的要求与自动删除数据预处理算法根据员工的经验。第二,每小时的操作时间,我们正常离职需求分数和目标需求的一部分,这样的总和所有站在每个时间步。在我们的数据集,数据每小时的间隔。我们的目标是预测提前一天,所以有12预测时间代表12个步骤操作小时/天。输入窗口前30天预测(360时间步),和输出是一个时间步推进滚动预测的策略来完成整个的时间步骤。模型的架构是基于递归神经网络,适合处理时间序列数据。排名然后转换成合适的车辆,每个车站应该。第三,最小费用最大流算法应用于现有的和适量的车辆在每一个车站,找到最优车辆搬迁员工旅行。 Finally, the relocation plans are deployed in our web application and they are automatically notified to all staff.

4.1。自动数据预处理

人工预处理减少员工的工作压力,我们实现了以下自动数据预处理的基础上所描述的程序人员为了消除虚假的需求。我们的预处理是如图6。首先,我们把预订数据,真实和虚假需求,作为输入。然后,基于实际使用记录,我们认为每个用户的额外预定使用期间是假的需求,并丢弃它们。

主要有两种错误的要求:(我)异常搜索日志成功预订后,(2)重复预订的尝试。搜索日志异常可以用一个例子来解释;对于一个成功的使用用户持续7:00点到7:30点。任何预订,用户在这段时间里应该是假的需求。重复预订尝试,只有第一个预订了被认为是真正的需求,并根据员工的经验,在接下来的15分钟内发出的预订是假的要求。

4.2。交通需求预测

深层神经网络选择的方法由于其高性能计算机视觉等各领域,自然语言处理,和交通管理24- - - - - -26]。特别是,递归神经网络(RNN)是一种深层神经网络适用于可变长度的时间序列问题,允许使用过去的信息来预测“未来”价值观。流行的RNN模型之一是Gated-Recurrent单元(格勒乌)的性能,可以较长短期记忆(LSTM)在使用更少数量的参数(27]。自格勒乌计算输入只有在前进方向,双向格勒乌(BiGRU)来处理数据在两个方向上实现。我们也比较这三个模型,由专家手工模型,然后选择模型与最小均方根误差(RMSE)和最好的仿真结果作为最终的模型。本节提出了一种基于BiGRU深层神经网络结构对需求预测。

该模型的体系结构如图7。每个站的需求规范化是一个分数,所有电台的总和是一个在每个时间步,分别离开和目的地之间的要求。BiGRU被用来提取特征应该捕获每个车站的离职和目的地之间的相关性需求在时间。改进精度、时间特性是包含在我们的模型中。然而,时间的顺序应该周期性治疗,例如,每日、每周、每月、等等。因此,我们添加一个辅助输入周期性的时间特性,组成的表征的小时的天,天的周数、和月份。提取的特征和周期性的时间特性是连接,最后在未来完全连接作为一个输入层,分别预测未来的目标和需求出发时间步。在实践中,来预测第二天,我们的模型预测这一天的第一个小时使用过去30天的数据作为输入窗口。然后,预测接下来的一个小时里,我们丢弃最老的数据,而不是前一小时的预测添加到输入。重复这个过程,直到我们获得天的预测。我们描述的每一部分模型如下:(我)BiGRU:这是一个递归神经网络已经被证明是有效和快速探索在先前的研究中,特别是在言论领域和生物信息学28- - - - - -30.]。BiGRU有优势单向格勒乌,它结合了从向前格勒乌,向后单元输出,允许它捕获来自过去和未来的时间步骤的关系。在我们的网络中,我们使用两层BiGRU,每32神经节点,从离职提取特征和目标需求输入。(2)完全连接层:获得提取的特征后,我们给他们完全连接层预测目的地和起飞时间步的需求目标。所有隐藏的,完全在我们的模型中有256个神经连接层节点。每一层的权重是根据初始化他et al。31日因为他们的策略适用于层与ReLU激活函数,我们在后面一节中描述。(3)激活功能:解决线性单元函数(ReLU)被选为一个激活函数来缓解消失梯度问题[32,33]。我们用这个激活函数隐藏,完全连接层。(iv)正规化,提高神经网络的数值稳定性,我们执行批处理标准化后每一个完全连接层(34]。这是做过应用激活函数。每个激活层后,我们也使用辍学层,防止过度拟合,迫使模型不依赖于相同的模式所有的时间35]。(v)编码时间周期性特点:正如我们期望在我们的数据是周期性的大多数时候,我们需要这些信息编码到模型的输入,这样模型可以以同样的方式对待所有的时间点(36]。例如,我们希望该模型地址之间的边界12月和1月以同样的方式与1月和2月。通过将数值分配给每个月(0,1,1 2月…12月11日),12月和1月之间的差距将会连续几个月的不同。相反,我们编码所有周期性时间特性与正弦和余弦变换。计算每个循环的时间特性如方程所示1)和(2), 的数字表示时间和吗 是最大值的时间特性。例如, 一周一天的特性将7日 1周一表示。

我们的模型有两个输出,一个需求出发,另一个用于目标需求。他们都是分数,总之,我们使用softmax作为输出层的激活函数。从初步调查,我们发现利用softmax给出了模型倾向于分配高分数只有几站;剩下的电台的分数不能正常学习。来处理这个问题,我们使用温度定标,添加一个hyperparameter将softmax可以校准功能,消除这种趋势并允许模型学习分数的低级的站(37]。将softmax温度与函数扩展定义如下: 在哪里 需求预测站吗 , 站的总数, 温度比例hyperparameter。

训练模型,我们使用一个损失函数(l),或目标函数,基于分类叉。通常,直言叉用于分类的任务,只有一个正确的标签。然而,在这项研究中,我们应用这种损失模型的输出收敛向地面真理分数。因为我们的模型有两个输出,最终损失函数是对需求的预测分类叉的总和。因此,损失函数定义如下: 在哪里t,离开t,桌子是离职的地面实况分数和目的地需求输出站 ,分别年代,离开年代,桌子需求预测分数, 站的总数。

预计需求将用于排名,和车辆分配表将创建为目标的时间。更具体地说,车辆分配过程必须遵循一定的规则,如最低要求,几乎所有电台必须至少有一个车和一个空的停车场。在这里,我们描述车辆作业程序,遵循这些规则:(1)我们指定一个汽车每一站,除了一些车站,因为他们只有一个停车场和附近的地区不像其他车站拥挤。(2)排名排序模型的输出后,我们将车辆分配给排名最高的车站,直到剩下只有一个停车场。例如,3车辆被分配到一个站4停车场如果站在高排名的范畴。(3)重复这个过程,直到没有更多的车辆。最终的输出是一个列表显示在每个车站所需数量的车辆目标小时。

在实践中,我们的系统删除虚假需求,通过模型一周一次。这通常有助于减少计算成本,使系统能捕捉任何变化的需求。

4.3。重新优化

获得车辆分配表后,下一步是为操作人员根据生产搬迁旅行可用车辆目前的数量在每个车站了。为了确保生产旅行有效距离而言,能源消耗,和员工的努力,我们应用搬迁的最小费用最大流算法优化。这个算法是众所周知且广泛使用的云资源分配38,能源共享管理39)、资源管理(40,41),和网络流量管理(42,43]。目标是最小化所需的成本提供最大的流动可能的网络中。在我们的实验中,网络中的节点代表站和边缘代表它们之间的距离。

最小费用最大流算法如图8。输入网络结构(G),其中每个节点指的是一个站的最大容量(汽车的数量),以及节点之间的链接指的是他们之间的距离。首先,算法执行“最大流”找到一个可行流通过能力,获得最大流量(k)。其次,算法执行“最短路径”找到路径(t)在成本总和最小。然后,每个节点的容量减去最小容量(最短路径的)(t),而累积流(f)补充道。算法重复,直到累积流量等于最大流量(k)。最后,我们获得最低成本的路径列表。在这项研究中,我们使用了最小费用最大流算法实现Aric et al。44]。

我们的搬迁优化可以表示为一个网络,如图9。在我们的场景中,这种优化算法是定制的数量最大化搬迁车辆,同时最小化这些车辆移动的总距离;因此,操作计划是有效的减少员工的努力。源节点(年代)的节点开始流动,而目标节点(T)是该节点所有流终止。在这种情况下,流代表车辆服务的总量。我们可以看到,有两组源节点和目标节点之间的节点,出发站和目的站。每一个离开车站节点边出站终点站节点。每条边表示路径从出发站到终点站。这些边缘成本相应的出发站和目的站之间的距离,和有能力的可用车辆在每一个离开车站。同时,边缘连接源节点出发站零成本和容量,等于汽车的数量可以在当前时间。同样,边从目的地站到目标节点零成本和容量,等于在预测时可用车辆的数量。

通过这个网络上运行的算法,我们可以得到优化的搬迁为操作员工旅行。每个目的地的流从每个离开车站站显示的车辆搬迁旅行这两个站之间。通过优化车辆需要旅行的距离,我们可以确保我们车辆的最小能量和时间消耗搬迁任务。

4.4。拆迁管理和通知系统

为了完全部署我们的车辆搬迁系统在实际使用的情况下,有必要实现一个应用程序,该应用程序可以自动通知操作人员搬迁旅行时是必要的。图10显示了监视仪表板和行通知,我们为我们的系统实现。所示的监视仪表板,出具车辆搬迁旅行我们的模型分为三种类型:积极的旅行,操作旅行,和完成旅行。活动发布的旅行是旅行模型但尚未接受任何员工。操作的旅行是旅行接受操作人员和仍在搬迁过程中。完成旅行是旅行已经由工作人员完成。员工领导人通常监视仪表板,也有一个权威手工添加或删除旅行。这是可以做到的,为了增加拆迁管理的灵活性。一次新车搬迁旅行发出积极旅行,所有的操作人员将通知行应用程序,如图10 (b)。然后,员工可以按“接受”接受这个新的旅行。当员工完成车辆移动到目标站,员工将按“完成”通知系统,这次旅行已经完全完成。

更多的澄清,图11描绘了车辆搬迁过程的序列图。当需求预测模型把一个新的优化车辆搬迁去系统,该系统将通知所有操作人员通过行应用程序。只有第一个操作人员接受旅行会为这个搬迁工作旅行。其他操作人员按接受后将收到失败的反应和细节显示操作员工的名字为这个搬迁工作旅行。手术后员工完成搬迁工作的旅行,操作人员必须报告给系统使用行应用程序。

12说明了我们的部署图。我们的计算服务器运行三个过程包括共享数据库、模型服务,核心服务的后端。另一个服务器,名叫CU-HAMO.COM,服务管理仪表板网站前端的核心服务。我们用Cloudflare的服务来证明我们的域名“cu-hamo.com”和使用HTTPS协议。HTTPS协议要求线服务当通信与应用程序服务器。

5。绩效评估

在这一节中,有三个实验报告。首先,我们的目标是证明我们的数据预处理可以消除虚假需求相比,经验丰富的员工。第二,搬迁的许多变化模型进行比较。最后,获胜者模型相比,有经验的员工在现实环境中显示,它真的可以改善措施。

5.1。实验装置

在这项研究中,使用的模型训练基于历史日志。使实验更现实,模拟一个场景基于真实数据在2019年9月至11月为了检查我们的系统的性能。仿真环境设置如下:(我)汽车的数量和车站是30日和22日分别(2)一天的服务时间从早上7点开始,下午7点结束(3)每一个使用在服务历史顺序处理(iv)每个用户的书籍的车辆不超过15分钟(v)系统每小时运行一次,它的输出将被用于搬迁车辆

在此设置中,有两个主要的性能措施:机会损失(预订搜索失败)和搬迁旅行(员工工作)的数量。第一个指标是用来衡量机会损失减少,这是我们的主要目标,而第二个指标被选中来衡量员工的工作负载在我们的系统。

使结果更可靠,采用时间序列的交叉验证使用滚动基础方法由于订单序列的车辆使用。因此,没有未来的数据可以被用于训练数据。如图132019年,整个数据形式使用日志。有一个三倍交叉验证时间序列。在第一次迭代中,数据被视为9月测试数据为模型的训练,从1月到8月的数据。(在第二个迭代)之后,9月份的数据集成到训练集,再重新训练模型,然后10月测试数据。最后(最后迭代),这个过程也适用于11月的数据作为测试集。

5.2。数据预处理的结果假的使用需求

由于模型训练基于车辆使用日志,删除假至关重要的要求搜索失败和来自同一个用户的多个搜索日志。在本节中,我们相比未处理的日志2019年9月和10月清洗使用日志(i)手册数据预处理由经验丰富的员工和(2)我们的自动数据预处理。表1表明,有很多假的要求没有可用的车辆,没有造成停车场可提供50%以上假专家要求清理数据相比。同时,我们的数据预处理能减少那些假平均50%以上的要求,这是与专家如何清理数据。消除员工可以在许多方面受益:降低人类的努力,数据清理一致性,由于更好的质量和更精确的模型的训练数据。

总之,数据预处理是非常重要的,需要在任何真正的部署场景。没有消除虚假需求,预测结果可以被高估了。同时,其他搬迁系统可能会遇到同样的问题就像Hamo用例,这样他们就可以直接我们的数据清理策略适应他们的系统。

5.3。重新定位算法的结果

这个实验的目的是比较各种迁移算法基于两个措施。第一个措施是均方根误差(RMSE)的评价模型的精度。第二个措施是机会损失,这是搜索失败导致更少的服务的数量。第三个措施是搬迁旅行的数量,由员工的努力为了搬迁车辆车辆可以在车站有更多的要求。

有四个方法比较:三种模型都是基于不同的预测技术(BiGRU、格勒乌和LSTM)最后一个是一个由专家搬迁。实验进行三个月的实际使用数据(9月、10月和11月)。注意,11月的结果是基于数据后我们部署系统。表2通过RMSE显示了三种模型的模型精度。结果表明,一个平均的RMSE BiGRU略高于LSTM和格勒乌。图14分别显示了每个月的结果,而图15显示了三个月的总体结果。在图(14日),结果表明,BiGRU胜利者的机会的减少损失在所有三个月一致。总数量的减少损失是6778或4.10%相比,手动迁移由专家(7068损失)。在图14 (b),结果表明,LSTM赢家总搬迁7102发的旅行;然而,BiGRU还提供了一个类似的结果与总搬迁旅行7142轮或搬迁的努力减少5.43%相比,由专家手动迁移(7552轮)。它可以得出结论,BiGRU-based搬迁是胜利者的机会损失和搬迁成本。此外,我们所有的变化自动重新定位算法一致优于流程管理专家在这两个机会损失和更少的搬迁工作。

5.4。实际部署的结果

除了贡献算法发展而言,我们还实现一个web应用程序通过线与基于规则的自动通知员工。我们的模型训练的基础上从2017年12月至2019年10月的历史数据。然后,部署在真实的场景中是在2019年11月进行的。11月上半年(1 st-11th)手动控制专家从手术室,而另一半)(12日至26日于被我们的模型自动操作(没有任何努力的专家)。有三种措施,包括机会损失(搜索失败),搬迁旅行(成本)和车辆使用(更高意味着更多的服务)。前两个措施相比,最后测量(车辆使用)为了显示损失/收益之间的比率。

在图(16日),结果表明,有89个(63%)用法和53例(37%)损失的总需求142专家在搬迁期间,有86(66%)用法和45(34%)损失超过131的总需求在搬迁期间我们的应用程序。这表明该系统可以提供更高的用法(+ 3%)较低的损失(−3%)相比,专家。

在图16 (b),结果表明有64(42%)搬迁旅行(成本)的总需求142搬迁期间由专家,还有54(39%)搬迁旅行(成本)的总需求131搬迁期间,我们的应用程序。这说明了搬迁工作的系统也会减少3%。此外,报告的员工,他们的工作的数量可以减少大约17每周工时每周根据储蓄小时手动Hamo人员花在这个任务之前,我们的系统。

总之,我们的应用程序不能仅仅增加使用的数量,但是它也可以减少损失和搬迁工作的机会。这是一个最大的贡献我们的论文以来,这一结果是基于真正的用例,而大多数之前的工作在一个模拟的环境中进行评估。虽然我们的算法是专门为Hamo汽车共享系统,它们可以应用于其他搬迁与大规模用户系统,车辆和电台。需求预测和搬迁优化在每个搬迁系统公共模块。因此,这些系统大规模设置可以受益于我们建议的方法。

从我们的经验在这个真实的使用情况,得出应该有最小数量的车辆在每个车站为了保证所有站的服务。如果没有限制搬迁车辆的数量,它会导致缺乏可用的车辆在某些电台。要解决这个问题,我们已经实现了最小数量的车辆条件在每个站在我们的系统。

6。结论

在本文中,我们的目标是提出一个自动车辆搬迁平台一个拼车的场景。的贡献所示条款deep-learning-based算法和真正的生产系统。算法,数据准备,提出消除虚假需求,然后将复发性神经网络应用于预测需求,最后是最小费用最大流算法(Min-Cost最大流)被用来优化搬迁旅行。实验是在真实的场景中,题为“铜丰田哈:钼,”朱拉隆功大学2019年的泰国。结果表明,我们的数据准备可以减少50%以上的假要求,这是由人类专家与手工处理。另外,最好的定位算法是双向格勒乌连同Min-Cost最大流;它优于较低的操作由人类专家损失4.10%,搬迁旅行数量少5.43%。真正的web应用程序已经完全取代了系统由人类。相比前面有人驾驶的系统,结果是如此引人注目,使用它增加了3%(从86%到89%),同时减少机会损失和员工努力3%(从37%到34%)和3%(从42%到39%)。有一个报告的员工,他们的工作的数量可以减少大约17工时/周。

如我们的搬迁解决方案Hamo案例研究中,整个系统可以集成到其他汽车共享系统搬迁由操作员执行的地方。此外,每个模块可以单独应用提出解决这一问题,增加其他系统的性能。首先,数据预处理模块可以用来处理虚假需求问题。第二,汽车需求预测模块可以帮助组织提前我们的供应。最后,重新优化模块可以减少运营成本而获得最大的利润。

在未来,我们计划我们的解决方案扩展到更大的区域,如地区或城市。如果汽车共享系统覆盖了整个城市的区域,它可能是不可行的车辆只有通过员工实现平衡。如此大的地区,应该有另一种策略,如用户的搬迁。

数据可用性

由于商业机密对数据的访问是受限制的。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项研究受到了铜丰田:Hamo。作者还要感谢Attawit Chaiyaroj和Amornpong Trakarnkulphun,计算机工程系,朱拉隆功大学,他们的宝贵意见。下这个研究资助项目”2019年铜丰田:Hamo”。