研究文章|开放获取
托马索Bosi,安德里亚·D 'Ariano, ”线性规划模型和在线算法以客户为中心的培训日历的一代”,《先进的交通工具, 卷。2021年, 文章的ID4664010, 18 页面, 2021年。 https://doi.org/10.1155/2021/4664010
线性规划模型和在线算法以客户为中心的培训日历的一代
文摘
列车运营公司的一个重要目标是让用户,特别是上班族,直接查询ICT系统对列车的可用性日历、基于网络的方法,并给他们明确和简单的信息,通过“智能”表达短语,而不是一些地图。本文提供了这个问题的线性规划模型和一个快速和灵活的启发式算法来创建描述性的句子从火车的日历。算法的方法,基于“分而治之”的方法,把日历时间查询的整个分裂成子集,先后处理一个接一个。以前的方法的主要限制是他们强烈的依赖于实例的大小和复杂性。相反,我们的计算结果表明,该在线算法具有非常有限和常数计算时间,即使增加了问题的复杂性,保持其处理时间0 - 16毫秒,而生产优质解决方案相比,相差0.13平均剩余subsentences基准技术发展水平的解决方案。
1。介绍
欧洲铁路部门面临的重要挑战,一起构成严重的障碍的增强吸引力和竞争力在全球市场。这可以通过一个全面和协调方法研究和创新,不仅关注铁路系统提供商的需求,也对用户的需求。
因此,作为报道Shift2Rail总体规划(1),其中一个是服务质量的挑战:铁路仍然没有遇到友好的传输模式,有19%的欧洲人只是避免乘坐火车,因为可访问性问题。在当今这个高度互联的社会,铁路客户服务需要一个彻底的反思是适应质量的持续和快速发展预期的旅客。
到Shift2Rail框架,我们可以确定五个主要asset-specific创新项目(IPs),覆盖所有不同的铁路系统的结构和功能子系统,如图1。这五个“诱导多能性”并不是相互独立的,他们每个人,客户满意度代表主要的关键之一。通过这种相互依存,在技术演进的一部分系统可以在另一部分导致性能发生变化。从这个新观点,优化覆盖铁路组织过程的每个阶段向铁路客户感知的服务质量。
这项新的研究方法的许多例子可以识别在文献中:改善旅游安全,阴等。2]提出一个数学公式来减少拥挤的站在高峰小时同步生成最优协调火车时刻表;“等待还是等待?”is the question submitted by Schanchtebeck and Schöbel [3)延迟管理问题,以满足两种不同类别的客户;分析和重新排序的优化选择之间寻求一个平衡点的列车调度员和乘客的路径选择铁路运输网络的可用的服务相当的目的科曼(4];香港et al。5)定义一个方法来解决培训延期和乘客方便实时re-ticketing同时进行分配;一些研究论文旨在提高质量服务经历了由用户选择由特刊D 'Ariano et al。6];像李et al。7)智能卡数据交易转换为路径选择的模型,在整个网络,提高洞察的旅游者的行为;D 'Acierno et al。8地铁系统)旨在提供操作的参数,以支持节能战略的规划和实施,同时维护一个目标服务水平;一个可扩展的动态分析方法引入的蟾蜍et al。9),旨在发现知识,喜欢旅游的习惯,从运动中的数据,并提供更快的分享移动服务在动态环境中;Botte et al。10)关注的邻域搜索算法优化干预策略的地铁系统故障的目的保持一定的服务质量水平;欧洲期刊本身开始积极推动一个持续的特刊,以“提供最高质量最低的旅行成本和时间满足客户的最终需求”(杂志的征稿启事所先进的交通:模型和数据驱动的进步优化城市交通和物流)。
问题的研究属于IP2 Shift2Rail和IP4项目。这两个IPs旨在增加准时和准确和实时数据的使用改善乘客信息,以减少乘客的不便。根据用户的喜好,个人和安全移动旅行的同伴将在一个钱包存储和分享他们的个人喜好,提供个性化的旅程和消息传递的帮助。
最重要的一个,关于铁路的基本信息为用户服务的可用性是火车日历,被旅客视为最终结果的几个不同的和复杂的组织过程,从训练路由调度,时间表,等等(11- - - - - -14]。基本信息,如到达和离开的时间,第一个数据,用户需要知道的是哪一天提供服务。由于现代生活节奏,它可能是太多的努力一个人检查火车日历,如果是用数值表示形式。这可能会带来错误,健忘,导致旅游者的不便。因此,我们希望生成一个更可读的方式沟通列车的可用性,以缓解其用户理解和记忆。实际上,铁路公司,如铁路公司。,already use web services to provide trains availability information related to predetermined time-lapse through bit maps accompanied by descriptive sentences. Nevertheless, this time-lapse is defined by the company, so the customer cannot directly query the ICT system about a specific period of interest. Our purpose is to develop an online train calendar generation tool that permits, especially commuters, to ask when service is offered into an arbitrary period. Even if the problem is a niche one, the little previous literature has approached it mostly through linear programming, developing mathematical models that give optimal solutions based on assumptions made, but with temporal complexity strongly depending on the sizes and characteristics of the instances. To avoid this negative scalability feature, we propose to solve the problem with a new fast algorithmic method, developed throughC编程语言,展示了不断的复杂性和生产高质量的解决方案。为了测试该方法的有效性,我们相比其性能在264实例,大大地激发了一个数学模型提出的第三个也是最有效的一个Amorosi et al。14),并指出如何算法返回类似的解决方案,同时减少平均处理时间从381毫秒到2.32 ms。
此外改善时间表演,这种新方法提供的灵活性使得它打印出更详细的和合适的句子,基于特定的运输领域考虑,通过调制算法的身体核心代码但没有改变计算复杂度。在应用这种方法的自然延伸可以的文字描述城市轨道和公交系统的日历,一个周期性服务可用性也存在。在这种情况下,考虑到规模较小的情况下,可以丰富的句子描述通过考虑,除了天的时间表,小时的,为了与乘客和分享更紧凑的可用性信息,以更好地满足客户需求,这是列车运营公司的最终目标。
本文的主要贡献在于一种新的解决方法适用于快速生成描述性的句子从事件日历表达了一些地图,更快、更具有适应能力的方式比早些时候的,为了被应用作为一个在线工具。因此,提供的技术可以扩展到任何应用程序的在线文本描述服务可用性,也在其他运输领域如飞机、渡轮,长途旅行巴士。但这种技术也可以用来描述任何事件的频率有一定的周期性喜欢体育活动,开放天的商业活动,等等。
总而言之,本文认为从培训日历生成描述性的句子的问题,尤其是对通勤者。艺术的状态提出了一个线性规划模型,激励我们创建一个改进的模型,可以很容易地转换成一个在线工具。这种建模方法的主要挑战是处理时间的强烈依赖于复杂的实例。为了填补这一空缺,我们提出一个快速启发式算法基于“分而治之”的方法,用C语言实现。这是264年测试实例。结果报告处理时间明显短于最大化策略来解决所需要的模型,从而证明更好的倾向作为一个实用的在线工具。
我们接下来介绍简要概述论文的结构:部分2回顾了大多数相关文献,特别是Amorosi等提出的第三种模式。15),这是唯一可用的研究论文(我们所知),认为特定的培训日历一代问题的背景下,意大利铁路;部分3描述了ICT系统是如何工作的以及什么时候插入过程的分享我们的算法,并提供了整数线性规划(独立)模型引入到模型研究问题,而在部分4与发达的在线算法(即方法。,the heuristic algorithm) and outlines the proposed method in all its key phases through a high-level flowchart; Section4显示数值模拟执行,说一些关于性能的观察值通过启发式算法和独立工党模型和定义每种方法的优点和缺点;部分5总结总结了论文的主要研究结果,提出方向改进启发式算法,并通过总结其他可能的应用程序的工具。
2。文献综述
本节主要关注的第三种模式Amorosi et al。15]。原因是相关的三个不同方面的考虑:首先,问题是一个利基市场,所以很少有材料可能的解决方法(16]);其次,本文是唯一一个认为意大利铁路的背景下,以其特定的乘客时间表;第三,第三个模型是最快的三个模型在他们的论文中提出的。此外,模拟研究了Amorosi et al。15铁路)创建的积极参与,这样他们就可以被视为实际情况下,在现实世界的特点被认为是为264年的实例用于我们的数值实验。
提出的方法背后的理念Amorosi et al。15包括几个阶段。首先,该方法需要作为输入周期性,这是一个二进制向量表示在时间窗口查询火车的可用性,和同事的每个条目进步指数(我们将详细讨论这些输入数据部分3)。然后,周期性的,只有一些天,服务是可用的,提取。周期性分解是基于46类型学的二进制向量,调用集群指一个特定的可用性频率,如“所有的星期一”、“所有的星期二”,“…假期“等等,目前采用的主要铁路的ICT系统。一个例子相关通道火车日历图中可以看到2,只考虑到“周末”和“Wednesdays-Thursdays“集群。
(一)
(b)
一旦所有的集群创建的周期性输入,一些为每个集群复制副本。这些副本最终集群中使用一个特定的情况下,用于表示不止一个周期性的亚纪。模拟显示,大量的5份为任何类型的实例应该足够了。输入数据是给数学模型解算器的实现IBM ILOG最大化策略的最小数量,它返回sub-vectors clusters-copies选择提取。
选择cluster-copy sub-vectors必须提取,定义以下信息:(我)质量阈值 ,迫使那些sub-vector必须包含的最小百分比是可行的(2)最小的长度sub-vector提取的(3)开始日期sub-vector提取的集群复制 这是一个整数变量(iv)最后的日期sub-vector提取的集群复制 ,这是一个整数变量吗
从每个集群采用解算器生成复制所有可行的subvectors基于前两个参数和 。然后,定义开始日期和最后的日期 ,集群的解算器决定复制提取最适合每个sub-period sub-vectors周期性。如果sub-vector选择填充一些零,这些都是在相应的句子描述为例外。
没有最初的实现,建立一个比较尽可能准确和直接检查这种方法的优点和缺点,我们强烈个人建立了一个数学模型受Amorosi et al。(15)模型(详细描述这个模型将得到的部分4)。这个模型有三个根本性的差异与工作Amorosi et al。15]:(1)我们的模型是通过Python实现,进口和使用docplex模块,它可以被认为是一个独立的工具,实现成一个单一的环境。相反,Amorosi et al。(15)被美联储通过生成的数据模型Microsoft . net,解决了IBM ILOG最大化策略和数值解被翻译成列车日历由外部脚本。使用docplex模块,我们与优化模型的预处理和后处理阶段,有效地使它一个在线工具,它接收输入数据周期由用户查询并返回相应的描述性的句子(图3)。(2)给任何输入数据之前Amorosi et al。(15)模型,前面的方法预处理功能,允许他们的模型应用于知道在特定的一天与集群和无关。相反,在本文提出的新模型所表达的信息是一个二进制数据 。当一天 ,集群 ,复制等于 ,这意味着那一天否则是cluster-copy覆盖,0。这些额外的输入数据,我们的模型可以避免使用预处理阶段,直接传递的信息是否属于集群的一天。(3)在我们的模型中,参数认为Amorosi et al。15)提取sub-vectors删除,以及约束(1)。删除此参数可以减轻的模型约束,集群和吗使用的clusters-copies模型的集合。
(一)
(b)
在约束(1),考虑单分散的天,我们需要设置的参数等于 ,导致的权利被设置的参数等于零。这个设置,唯一的情况下,任何的约束(1)可以违反的区别和是负的,也就是说,什么时候与日期前联系在一起呢 。然而,这种情况下是不允许通过约束(4)和(5在我们的模型中。因此,没有理由强制约束(1),我们因此删除它们从我们的模型。
模拟在Amorosi et al。15]显示四个主要限制的方法:(我)处理时间是强烈依赖于实例的大小和复杂性的输入,这是一个在线工具不太好。在图4的散点图,我们可以看到264年处理时间为每个实例,用毫秒表示。图表显示显著变化的分布值,与峰值4.5秒。这些峰值对应实例填充了单分散天。这一事实是一个弱点的方法以及一些实例相关联的低质量的解决方案。(2)使用阈值百分比(基于sub-vector考虑的大小)可以是一把双刃剑,如果周期很长,解算器不能提取最适当的集群,并添加许多例外这句话印在输出。在模拟过程中,我们尝试了值等于80%和90%,指出:在第一种情况下,解算器不倾向于提取最合适的描述性的集群和/或添加几个例外,当周期性大小特别长。这种趋势如下图所示5;在第二种情况下,减少异常允许的数量,他们的模型在处理困难情况下,它的特点是单分散的日子,无论是质量和计算时间。例如,如果周期性的简短的描述“服务是提供从星期一至星期六x / y z / w”但时间窗口认为足够宽,他们的模型解决方案可能需要sub-vector cluster-copy“Monday-Friday”,而相应的解算器输出”提供的服务从周一到周五从x / y z / w除了周六t / y,周六h / y…”。然而,对于不同的方法之间的比较,我们固定阈值为90%,以防止解算器使用太多的例外,降低质量相关性能。(3)的参数 ,是一个固定值,必须等于 ,为了弥补周期性的一天。由于这种必要性,他们的模型有几个困难的及时处理和协会的句子与实例与单分散的天。当他们的模型来处理这些类型的情况下,我们观察到大量增加处理时间和下面的解算器的决定必须提取任何cluster-copy覆盖那些日子里,仅仅通过调节sub-vector的开始和最后的日期。例如,如果在一周内服务只能在周三,他们的模型可能需要集群的一个副本“工作日,”而相应的解算器输出”从13个工作日内提供服务th5月13日th可能。”即使最后一句话是正确的,这句话显然不是如此有效,可能会混淆用户。(iv)他们的模型不考虑插入新集群的可能性没有涉及显著增加处理时间和存储和subsentences添加额外的一天,而不是使用一个或多个额外的集群。在周期性的亚纪,例如,如果服务提供周一,周二和周六,输出将句子”提供的服务是周一和周二从x / y z / w;周六从x / y z / w,”即解算器将考虑两种不同的clusters-copies。相反,我们可以插入新的集群等“Monday-Tuesday和周六只使用一个集群,使句子更加可读的和有效的。为什么这不是表现在文献中提出的方法吗?可能是因为考虑到所有可能的组合在工作日会显著增加计算复杂度的方法。否则,如果关于集群相关的额外的一天一周一个,我们可以打印”提供的服务是周一和周二从x / y z / y包括周六t / y“在输出。
分别这些限制和新特性可以消除,实现了通过我们的算法方法的速度和灵活性,这是基于C编程语言,如部分所述3。
3所示。材料和方法
正如我们在前一节中,预期从一列火车日历表达通过地图(图6),我们想查询定义的时间窗口和生成最清晰和简洁的句子描述火车的可用性。在ICT系统,日历都是用二进制向量表示,0对应的天不提供服务,它提供的。
二进制向量基于感兴趣的时间窗口和提取从这个日历形式周期性。图7是一个周期性的例子指的是时间窗口中引入图吗6。由于数学和自然语言领域之间的交叉路口,有很多不同的方式表达相同的周期性。
在这种情况下,例如,通过一个句子表示周期性,我们可以用积极的方式,
“在工作日1提供的服务圣5月30日th6月。”
或- 1,
“在周末从1不提供服务圣5月30日th6月。”
然而,在这篇文章中,使用积极的方式。积极的方式本身,不同的表达同样的信息可以实现相同的实例。我们可以说“从周一到周四从提供的服务是1圣5月30日th除了6月1圣5月8日th5月,…”等等,或者,正如我们上面的报道,“在工作日1提供的服务圣5月30日th6月。”
其中最可读的第二个。出于这个原因,我们想开发一个快速工具,可以自动识别哪种表示更好并打印出来。根据我们的研究和以往的研究,最聪明的描述性短语是简短的,可读性更强,并且存储。
很明显,如果一个服务总是或周一全年,没有必要为优化。然而,使用启发式算法或数学规划方法是出于复杂的服务可用性的情况下,一个可行的句子很长,不容易理解。因此可以在某些情况下甚至是无用的客户。服务可用性的实践情况下考虑分布年内取决于许多变量,如客户需求,假期,火车的数量,有限的资源和操作约束(5,17]。
后的实际情况(如图8),我们可以看到一个更有可能培养日历查询,连同它的周期性,居住着不同的火车可用性和异常和亚纪天盈余。
最简洁的描述性短语下面的周期性可以:
”提供的服务是在周末从3理查德·道金斯7月18th除了周六7月17th7月;周三和周四从21圣7月5th包括周五8月6th8月;在工作日9th8月20th8月”。
我们生成这种类型的句子插入火车日历的周期性作为输入,这是一个二进制向量。节2,我们提到的独立工党模型实现解决研究问题,以比较文学的方法和本文提出的算法。在下面,我们提供它的描述。
3.1。符号和数学公式
我们考虑下面的输入数据: =组操作天与周期性(提供服务)。 =的集群。 =k -th集群副本 。 =(日期的位置在 )+ 1。 =最低比例的那些sub-vectors必须是可行的。 =周期性的基数。 =大整数。
我们定义以下决策变量。(我)整数变量: =整数代表的开始位置sub-vector从副本中提取的集群c =整数代表sub-vector从副本中提取的最终位置的集群c(2)二进制变量:
通过这些输入数据和决策变量,我们独立存在以下模型: 受
我们可以看到在数学模型(2)- (7),目标函数最小化sub-vectors提取的数量,为代表 ,二进制与集群相关的变量和复制(2)。分别下列限制解释,变成一个可行的比例sub-vector必须大于或等于阈值(3);约束(4)和(5)实施这两个整数变量,和 ,可行的sub-vector进步指标,分别后的第一个日期和最后日期前由sub-vector相关联;每个服务是可用的日期必须覆盖至少一次(6);如果一个集群和复制选择的解决方案覆盖至少有一个周期性的日期,该变量这必须被激活(7)。基于preliminar数值模拟,我们设置阈值等于 。原因是,如果我们设置这个阈值降到一个较低的值,解算器将生成一个少配件sub-vector连同许多异常;相反,如果我们将它设置为更高的价值,解决者会花太多的时间在处理测试实例。
我们将下一个将这种数学模型称为“模型”,为了得到阅读流畅。
在这一点上,我们可以描述提出的启发式算法。首先,作为一个在线工具,它与用户接受输入数据查询:开始和最后日期的时间窗口。为了避免使用外部一次性填充日历,就像在以前的文献,第二步计划通过数学公式来生成一个内部日历。然后,生成的周期性ICT系统被分为周弥补这个缺点。我们可以看到算法方法是完全不同于前一个,确实;虽然整个模型认为周期性,算法遵循“分而治之”的方法(18):把问题全部划分成更复杂的子问题。这里的想法来自于工作分解结构(19)活动,用于大型项目划分为项目段,称为叶子分配给每个操作单元。
我们的算法的实现方法C语言。决定使用一种编程语言,就像C,与两个不同的原因:这是一个特定请求的火车运营公司;一个编译,因此速度比编程语言解释(20.]。我们的第一个目标是减少处理时间的可变性和期间受雇于过去文献,为了发展一个更实用的工具。此外,我们希望可能插入更多集群基于特定铁路上下文提高句子简单的印刷和机会来创建有用的功能,比如相关的额外的一天。但启发式算法是如何工作的呢?代码分为两个macro-phases:预备一个操作周期,和下一个处理周期本身。主要阶段提出了启发式的流程图,如图所示9。
我们已经仔细操作输入数据后,我们需要一个工具,将亚纪的初始周期性转换成句子。这是一个经典C数据结构称为盒子。盒子里就像一台机器,接收在制品的数量,这是周,通过传送带和做一些和拿出最终的产品,是句子。传送带是由一个while循环,这是第二阶段的核心。while循环的退出条件与输入的数周周期性:while循环继续,直到上周并没有被处理。
机器主要做什么工作来生成一个解决研究问题?入禁区,周存储三个。一个描述性的集群的天,提供的服务是,分配与周在第一的位置。之后,周存储在第二和第三的位置与一个在第一个位置,根据情况,检查它们是否不同,相似或相等。
这种比较是基于一周内的服务是可用的:(我)如果两周有相同的天,这意味着提供的服务是在同一个天所以相比周可以被视为平等的。第二周是“整合”到第一个。这意味着集群与第一周也涉及第二个,这句话的时候,它描述了这两个周的服务可用性(基于相关的集群)打印出来,特定的时间窗口将被认为,从第一天开始的第一周第二周的最后一天的可用性。(2)如果两周不同于彼此只有一天不可用或可用性,这意味着这一天,分别一个异常或额外的一天。如果是这样的话,这周可以被认为是相似的。检查,如果是真的,我们也比较第一周,第三个,如果他们都是一样的,相似的确认。第二周就合并到第一个,和天分开贴上一个额外的一个或一个异常,根据情况。(3)如果两周内由两个或两个以上不同于彼此的日子不可用或可用性,我们认为这些是不同的。在这种情况下,我们不包含与第一个,第二个星期,我们代表了两个星期,和与他们的合并,不同集群。因此,该算法将从这两个亚纪打印不同的句子。
针对每种情况的一个例子是图所示10。一旦我们知道本周第二框的位置不同(c), (b)相似,或等于()的第一个位置,一个函数卷轴周以顺序的所有周周期性过程。
(一)
(b)
(c)
一旦所有的周已经处理和相关的句子亚纪已经打印出来,退出while循环的代码。然而,对于实际使用这个工具,我们将考虑一个无限循环的实现,例如而真正的,包含整个代码和休息条件。(另一个重要功能,解决了以前的方法)的一个重要限制是,感谢的灵活性C编程语言,我们插入其他集群除了46开始,如集群“Monday-Tuesday和周六和在每周的不同时间之间的所有可能的组合,在不改变计算复杂性,至于他们只搜索字符串的代码。这个添加特性使我们能够减少集群用来打印出一个解决方案。正如我们将在下一节中,讨论这种方法确保良好的建设性的解决方案是在恒定的复杂性和集群生成适应特定的铁路火车运营公司是上下文。
为了更好的解释我们的算法的工作流程操作,一步一步的描述执行的活动试验实例。我们假设周期由用户查询只包含四个星期,从1圣3月28th3月(图11)。
首先,算法需要输入数据,开始和最后日期的时间窗口,连同相关的周期性的培训要求,并创建内部日历,这是一个矩阵。然后,周期性分为基于其周工作日分配给每个进步指数通过下面的数学公式。这个公式中的变量描述表1。
|
||||||||||||||||||
例如,图10星期对应的哪一天th2020年1月,我们会考虑 和 ,获得等于6,星期五。
数据结构的“盒子”的前三周,本周将集群“Monday-Wednesday”与在第一个位置,并开始比较后者和一个第二位置(图12)。
因为它们不相等但只相差一天,星期三10th三月,该算法检查他们是否可以通过比较相似或不同的星期在第一位置在第三的位置。后者等于本周在第一个位置,相似性是证实。因此,周在第二个和第三个职位合并的第一个位置。周三10th3月存储为一个异常和集群的延时Monday-Wednesday更新,从周一开始1圣3月的最后一天星期第三的位置,这是周三17th3月。周的滚动第二和第三的位置,第四个星期进入”框。”The latter is compared with the week in the first position and, as they have only two days on in common, they are classified as “different.” The cluster associated with the week in the first position is then printed out as a subsentence of the periodicity, the fourth week is inserted in the first position of the “Box,” and a new cluster is attached with it, that is, the cluster “on Weekends” on Saturday 27th和周日28th3月。
因为所有的周处理,柜台符合出口条件和while循环的结束。句子连接到周期性因此显示出来,我们可以看到在图13。
一旦被描述算法,一些不同的文学方法可以确定:(我)完整的建模方法是在实例和创建clusters-copies总体时间窗口查询。这将导致增加计算工作量计算最好的可能的解决方案。相反,启发式算法的实例每周,生成和关联,在需要时,一周七天的集群在第一盒(图的位置14)。这个集群相比之下,未来几周,没有新的集群生成直到两周之间存在着显著的差异,在天的服务可用性。这种权衡的视图和分割周期性允许大幅减少处理时间。(2)通过建模方法,引入一种新的集群提高解决方案的质量会导致在整个集群实例的计算和复制的拷贝。不同,提出了启发式算法实现集群通过字符串和,因此,最可观的压力在于协会每周与一个集群,通过排序数组的长度为7。这允许轻松地插入新的集群相比大大减少计算工作模型,为了提高质量的描述性的句子。(3)另一个相关模型和算法之间的区别是引入一个函数,考虑额外的天周之间。让我们假定,在感兴趣的时期,提供的服务是相同的频率,除了一些零星几周,有一个额外的一天,庆祝活动的情况。在这种情况下,建模方法将将至少两个集群与周期性,因此,两个subsentences。通过多天的函数实现的算法,这些日子将存储作为额外的天,添加到单一集群选择描述周期性。这个样本函数的一个例子这种类型的工具,其潜在的灵活性是适应不同的公共交通环境,提高服务质量感知的用户。
4所示。结果与讨论
为了比较介绍了这两种方法是如何工作的,我们测试了他们264个实例从. csv文件导入。模型开发和执行在IDE Pycharm 2020.3.3,我们使用的启发式算法代码:20.03块。所有测试都是Windows操作系统上执行英特尔i7处理器2.6 GHz和16 GB的RAM。整个264年创建实例的基础上,提出了研究的Amorosi et al。15),在每个方法的潜在弱点,,分别描述的有效处理集群“每一天,”当它被用作由启发式算法解决方案;穷人表演,在效率和效果方面,生成的模型方法在处理周期的研究由单一分散的日子。
我们测试独立工党模型和启发式算法对各种可能的情况下以定量评估他们的潜力。我们也调查指数时间和使用的高数量的集群模型部分3处理周期性的一天。这就产生了“小概率事件”,明显改变使用的性能指标。因此,周期的研究中描述的全部或部分的集群“每天”占了24%,而密集的单天4%的所有测试用例。
实验包括三个不同的周期的研究,更新为2020:第一个是由62个实例从13th9月24th2020年11月;第二个包含88个实例从3理查德·道金斯5月2nd2020年8月;最后一个由113个实例从2nd2月至20th2020年5月。集覆盖,分别段长度等于2,3,几乎四个月。
我们认为时间和质量指标,准确地说应该是:平均值,最大值,最小加工时间;平均、最大和最小数量的描述性的集群使用。获得的值为每个索引表表示2。
|
|||||||||||||||||||||||||||||||||
|
注:时间是用女士表示。 |
|||||||||||||||||||||||||||||||||
另外两个重要的指标,我们可以考虑:每个方法所使用的许多不同的集群时输出两种不同的解决方案;异常的数量每个方法的解决方案时所使用的不同集群的数量。最后一个指数是重要的由于限制使用比例阈值确定的模型。事实上,什么是可能发生的,模型可以使用更少的集群,但随着更多的例外。
我们可以看到在图15的比例周期的研究,这两种方法将不同数量的集群是30%的整体测试。百分之八十二的相差一个集群解决方案的30%,9%相差两个集群,另外9%由三个或三个以上不同集群。
(一)
(b)
然而,后者9%可以追溯到模型流程实例的困难的一天。下图(图5),相反,代表的数量异常的百分比插入的句子时打印出来的模型两种方法使用不同数量的集群来描述每个周期。
下面的情节(图16)考虑,分别处理时间的周期性测试,和集群的数量用于打印出每个方法的解决方案。
结果在图16说明提出的启发式算法解决了我们最初的研究问题,并从过去文献确定的限制。首先,我们正在寻找一个在线工具,可以与铁路用户交互。由于这个特定的特性,该工具必须非常快。为了实现这一目标,过去的文献利用外部工具,如。净和脚本除了他们的模型,从而增加产生的处理时间。本文提出的模型和启发式算法都是独立的工具。图17说明了处理时间的分配到特定的时间框架,我们可以看到,40%的人超过了4.3秒。这可能是一个问题在实践中,保持快速的响应时间,同时考虑转让所需的时间信息和从服务器。与模型,启发式算法复杂性保持不变,证明了图16和表2,这是独立于的长度或复杂性考虑实例,处理时间从0到16女士和平均处理时间为2.32毫秒。一个常数计算复杂度意味着开发一个在线工具基于我们的算法不会受到重要的变化对用户的查询响应时间。
第二,集群的数量每个实例使用的模型是6,而我们使用的一个启发式算法5每个实例。尽管这是一个微小的区别,正确评估的质量提供解决方案,我们应该考虑集群用来打印出描述性的句子。的确,看着图18集群的数量的分配,在通信解决方案,超过三个集群使用的模型,有实例填充了单分散天,解算器往往提取任何集群的覆盖相应的一天,无论这是最合适的一个,通过调制端点和 。这导致降低解决方案的质量和增加用户混淆的可能性。不同,该算法与单一天效果很好,因为这并不需要使用任何阈值,可以插入许多例外,最小化目标函数进行了研究。此外,我们的算法返回最有效的描述性的集群,可以与这些亚纪,保持远离调制开始和最后日期的任何集群覆盖它们。例如,如果服务提供的一天是周三,该算法会将集群“星期三”与周而不是使用集群,因此选择“工作日”和值对应于特定的星期三。
当看着表的质量性能度量2和图18,0.13的启发式算法利用额外的集群模型相比,计算最优解。此外,即使两个集群的分布的实例是高提供的解决方案的启发式算法来计算的模型相比,该算法避免了超过三个集群解决这些基准实例。这意味着该算法表现更加一致,避免罕见的事件,导致重要的伤害,而与用户共享信息。此外,该算法识别更具描述性的集群和引入了新的和更灵活的功能(例如,信息在额外的天)不增加整体处理时间。这额外的灵活性降低了集群的数量与每个解决方案和改善最终解决方案的质量。不同的建模方法,这些额外的功能可能会导致新的约束和变量,因此潜在地增加了计算复杂度。
然而,有两个主要的局限性,我们见过:“每一天“集群模型更有效的工作,同时该算法往往将每个周期的开始和结束时间。例如,如果解决方案生成的模型”提供的服务是每天从x / y z / w,“启发式算法,每周工作,可以把它分成两个不同的集群;第二个限制是与列车运营公司本身所要求的特征。事实上,虽然模型可以在一个周期性的工作这些年来,该算法只能考虑一年一次。这是因为火车运营公司请求一个工具,将从6个月到六个月的工作。
5。结论
在本文中,我们开发了一个快速和灵活的替代方法的方法先进的培训日历的文本生成,主要让我们保持一个常数计算时间,返回优质的解决方案,并介绍新功能来增强句子的有效性被打印出来。理论和实践贡献在于一个新的独立模型和快速启发式算法解决在线培训日历一代的问题。独立工党模型有三个主要的差异与Amorosi et al。(15)模式:我们认为一个新的数据模型目的是避免预处理功能使用的Amorosi et al。15]过滤输入数据;的参数在他们的模型中,用来定义一个键的长度subsentences提取,不被认为是在我们的模型的涉及该参数的约束;模型嵌入在Python中,允许集成这两种预处理阶段的输入数据和输出数据的后处理阶段到一个单独的环境,从而提高网络与用户的交互和生成的速度训练日历描述性的句子是由一个外部脚本Amorosi et al。15]。
关于该启发式算法的贡献,在我们的论文提出利用“分而治之”的逻辑控制整个周期通过日复一日的生成解决方案。从计算实验,我们的算法介绍,平均而言,一个强大的(= 99.8%)处理时间减少建模方法相比,同时保持低于1.32 subsentences周期性。由于其快速响应时间和计算能力高质量的解决方案,该算法可以被认为是最好的选择来开发一个有效的在线工具,培训日历的一代。
有可能在这个方向上走得更远吗?当然,也有一些开放的问题。我们可以改善的第一件事是“每一天”的处理集群,给预测算法的可能性。我们的意思是允许算法智能理解如果亚纪可以有效地描述了“每天”集群已经开始。这将进一步降低集群使用的平均数量。
另一个重要的方式来改善目前的结果可能会重新考虑初始假设我们考虑一个句子可读和智能基于一个更现实的用户感知质量,例如,通过感知服务质量模型提出的(21]。如果集群不是一个质量参数的最小数量的句子,好吗?在我们开始开发当前算法之前,我们打算开始一项调查活动在大学通勤的学生,但是这并不是完全可能由于covid-19限制的情况。这可能允许我们确认我们的逻辑假设或重塑他们基于新考虑感知的服务质量。
此外,证明了该算法的灵活性使得它能够被采纳为事件日历的描述开发在线工具在其他公共交通环境问题不同规格和描述性的句子被打印出来。从地面到航空运输,程序性方法表达的算法的主体可以通过附加功能,填充和解决不仅外部用户也为内部员工信息的传输,如货物运输部门的情况。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突有关这篇文章的出版。
确认
作者要感谢蒋禄卡博士Giacco博士(铁路高级经理)和拉维尼娅Amorosi (Sapienza大学研究员)他们的反馈的问题和慷慨的分享铁路数据。
引用
- 战略的总体规划,Shift2Rail合营企业战略的总体规划,布鲁塞尔,比利时,2015年。
- j .阴a D 'Ariano, y, l·杨和t . Tang”时间表在轨道交通网络中协调乘客需求随时间变化,“欧洲运筹学杂志》上,2021年。视图:谷歌学术搜索
- m . Schachtebeck和a . Schobel”等与否还要谁先?与优先级决策延迟管理”,交通科学,44卷,不。3、291 - 428年,2010页。视图:出版商的网站|谷歌学术搜索
- f·科曼,”重新安排火车交通和路由之间的交互和平衡的乘客微观延迟管理:一个游戏理论研究,“交通科学,54卷,不。3、565 - 853年,2020页。视图:出版商的网站|谷歌学术搜索
- 孟x, l ., a D 'Ariano et al .,“集成优化的生产培训延期和乘客分配中断下,“交通研究部分C:新兴技术,第125卷,第103025页,2021年。视图:出版商的网站|谷歌学术搜索
- a . D 'Ariano f·科曼,t .富士山,l .孟和p·佩莱格里尼,“铁路运营管理、仿真和优化”《先进的交通工具卷,2018篇文章ID 4896748, 3页,2018。视图:谷歌学术搜索
- w·李,问:罗、问:Cai和x张“使用智能卡数据削减乘火车时间表与同步集群,分析地铁乘客路径选择”《先进的交通工具卷。2018年,13页,2018。视图:谷歌学术搜索
- l . D 'Acierno m . Botte m·盖洛和蒙特拉,”定义储备时间地铁系统:一种分析方法,”《先进的交通工具卷。2018年,15页,2018年。视图:谷歌学术搜索
- 蟾蜍,A . Moawad t·哈特曼,f . Viti“数据驱动的可伸缩的方法分析和动态分析,共享移动解决方案,“《先进的交通工具卷。2021年,15页,2021年。视图:出版商的网站|谷歌学术搜索
- m . Botte c . Di齐鸣,A .平静的蒙特拉,和l D 'Acierno,“附近搜索算法确定最佳干预策略在地铁系统故障的情况下,“国际运输杂志》的开发和集成,1卷,不。1,第73 - 63页,2017。视图:出版商的网站|谷歌学术搜索
- m .央行'Ariano A D, f·科曼,D . Pacciarelli,”一个变量附近寻找高速列车调度和路由在铁路交通干扰的情况下,“电脑和操作ResearchComputers &操作研究卷,78年,第499 - 480页,2017年。视图:出版商的网站|谷歌学术搜索
- 诉Cacchiani和p·托斯,”名义和健壮的火车时间表问题,”欧洲运筹学杂志》上,卷219,不。3、727 - 737年,2012页。视图:出版商的网站|谷歌学术搜索
- 柳明桓x, y, y高中情局汉森和j .苗族“高速列车单元路由问题的优化模型,”计算机和工业EngineeringComputers &工业工程卷,127年,第1281 - 1273页,2019年。视图:出版商的网站|谷歌学术搜索
- f·科曼,a . D 'Ariano公元马拉,D . Pacciarelli和m .央行“整合列车调度和延迟实时管理铁路交通控制,”运输研究E部分:物流和运输审查卷,105年,第239 - 213页,2017年。视图:出版商的网站|谷歌学术搜索
- l . Amorosi p .戴尔'Olmo, g . l . Giacco”数学模型对在线培训日历的一代。”电脑和操作ResearchComputers &操作研究卷,102 - 2019页。视图:出版商的网站|谷歌学术搜索
- h . Bachraty、大肠Krsak和m . Tavac”算法生成文本的描述有些日历,“通信,11卷,不。3,54 - 62年,2009页。视图:谷歌学术搜索
- n Kumar和A . Mishra”有效的多目标和词典检查重新安排火车,”亚历山大工程杂志,60卷,不。3、3233 - 3241年,2021页。视图:出版商的网站|谷歌学术搜索
- n . Dethlefs A Schoene h . Cuayahuitl,”神经自然语言生成的各个击破的方法从结构化数据,”Neurocomputing卷,433年,第309 - 300页,2021年。视图:出版商的网站|谷歌学术搜索
- 依a·e·莱斯特“工作分解结构,”项目管理、计划和控制53至59页,2017年。视图:出版商的网站|谷歌学术搜索
- c·伍顿,“编译和解释语言”,在发展中质量元数据:建筑创新的工具和工作流程解决方案,第308 - 299页,2007年。视图:出版商的网站|谷歌学术搜索
- i . g . m . y . Bakti t . Rakhmawati s Sumaedi和s Damayanti“铁路通勤乘客的感知服务质量:享乐主义和功利主义的框架”,交通研究Procedia48卷,第217 - 207页,2020年。视图:出版商的网站|谷歌学术搜索
版权
版权©2021托马索Bosi和安德里亚·D 'Ariano。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。