列车运营公司的一个重要目标是让用户,特别是上班族,直接查询ICT系统对列车的可用性日历、基于网络的方法,并给他们明确和简单的信息,通过“智能”表达短语,而不是一些地图。本文提供了这个问题的线性规划模型和一个快速和灵活的启发式算法来创建描述性的句子从火车的日历。算法的方法,基于“分而治之”的方法,把日历时间查询的整个分裂成子集,先后处理一个接一个。以前的方法的主要限制是他们强烈的依赖于实例的大小和复杂性。相反,我们的计算结果表明,该在线算法具有非常有限和常数计算时间,即使增加了问题的复杂性,保持其处理时间0 - 16毫秒,而生产优质解决方案相比,相差0.13平均剩余subsentences基准技术发展水平的解决方案。
欧洲铁路部门面临的重要挑战,一起构成严重的障碍的增强吸引力和竞争力在全球市场。这可以通过一个全面和协调方法研究和创新,不仅关注铁路系统提供商的需求,也对用户的需求。
因此,作为报道Shift2Rail总体规划(
到Shift2Rail框架,我们可以确定五个主要asset-specific创新项目(IPs),覆盖所有不同的铁路系统的结构和功能子系统,如图
的五个IPs Shift2Rail框架(来源:Shift2Rail主计划)。
这项新的研究方法的许多例子可以识别在文献中:改善旅游安全,阴等。
问题的研究属于IP2 Shift2Rail和IP4项目。这两个IPs旨在增加准时和准确和实时数据的使用改善乘客信息,以减少乘客的不便。根据用户的喜好,个人和安全移动
最重要的一个,关于铁路的基本信息为用户服务的可用性是火车日历,被旅客视为最终结果的几个不同的和复杂的组织过程,从训练路由调度,时间表,等等(
此外改善时间表演,这种新方法提供的灵活性使得它打印出更详细的和合适的句子,基于特定的运输领域考虑,通过调制算法的身体核心代码但没有改变计算复杂度。在应用这种方法的自然延伸可以的文字描述城市轨道和公交系统的日历,一个周期性服务可用性也存在。在这种情况下,考虑到规模较小的情况下,可以丰富的句子描述通过考虑,除了天的时间表,小时的,为了与乘客和分享更紧凑的可用性信息,以更好地满足客户需求,这是列车运营公司的最终目标。
本文的主要贡献在于一种新的解决方法适用于快速生成描述性的句子从事件日历表达了一些地图,更快、更具有适应能力的方式比早些时候的,为了被应用作为一个在线工具。因此,提供的技术可以扩展到任何应用程序的在线文本描述服务可用性,也在其他运输领域如飞机、渡轮,长途旅行巴士。但这种技术也可以用来描述任何事件的频率有一定的周期性喜欢体育活动,开放天的商业活动,等等。
总而言之,本文认为从培训日历生成描述性的句子的问题,尤其是对通勤者。艺术的状态提出了一个线性规划模型,激励我们创建一个改进的模型,可以很容易地转换成一个在线工具。这种建模方法的主要挑战是处理时间的强烈依赖于复杂的实例。为了填补这一空缺,我们提出一个快速启发式算法基于“分而治之”的方法,用C语言实现。这是264年测试实例。结果报告处理时间明显短于最大化策略来解决所需要的模型,从而证明更好的倾向作为一个实用的在线工具。
我们接下来介绍简要概述论文的结构:部分
本节主要关注的第三种模式Amorosi et al。
提出的方法背后的理念Amorosi et al。
“周末”的例子(a)和(b)“Wednesdays-Thursdays集群从实际案例中提取。
一旦所有的集群创建的周期性输入,一些为每个集群复制副本。这些副本最终集群中使用一个特定的情况下,用于表示不止一个周期性的亚纪。模拟显示,大量的5份为任何类型的实例应该足够了。输入数据是给数学模型解算器的实现
选择cluster-copy sub-vectors必须提取,定义以下信息:
质量阈值
最小的长度
开始日期
最后的日期
从每个集群采用解算器生成
没有最初的实现,建立一个比较尽可能准确和直接检查这种方法的优点和缺点,我们强烈个人建立了一个数学模型受Amorosi et al。(
我们的模型是通过Python实现,进口和使用
给任何输入数据之前Amorosi et al。(
在我们的模型中,参数
结构区别以前的模型(a)和(b)的新开发的模型。
在约束(
模拟在Amorosi et al。
处理时间是强烈依赖于实例的大小和复杂性的输入,这是一个在线工具不太好。在图
使用阈值百分比
的参数
他们的模型不考虑插入新集群的可能性没有涉及显著增加处理时间和存储和subsentences添加额外的一天,而不是使用一个或多个额外的集群。在周期性的亚纪,例如,如果服务提供周一,周二和周六,输出将句子
散点图的运行时间为264年的实例Amorosi et al。
分别这些限制和新特性可以消除,实现了通过我们的算法方法的速度和灵活性,这是基于
百分比的数量异常时打印出来的模型的解决方案是不同的。
正如我们在前一节中,预期从一列火车日历表达通过地图(图
火车日历的例子。
二进制向量基于感兴趣的时间窗口和提取从这个日历形式
周期性的例子从火车的日历。
在这种情况下,例如,通过一个句子表示周期性,我们可以用积极的方式,
“在工作日1提供的服务圣5月30日th6月。”
或- 1,
“在周末从1不提供服务圣5月30日th6月。”
然而,在这篇文章中,使用积极的方式。积极的方式本身,不同的表达同样的信息可以实现相同的实例。我们可以说
其中最可读的第二个。出于这个原因,我们想开发一个快速工具,可以自动识别哪种表示更好并打印出来。根据我们的研究和以往的研究,最聪明的描述性短语是简短的,可读性更强,并且存储。
很明显,如果一个服务总是或周一全年,没有必要为优化。然而,使用启发式算法或数学规划方法是出于复杂的服务可用性的情况下,一个可行的句子很长,不容易理解。因此可以在某些情况下甚至是无用的客户。服务可用性的实践情况下考虑分布年内取决于许多变量,如客户需求,假期,火车的数量,有限的资源和操作约束(
后的实际情况(如图
一个实际的案例。
最简洁的描述性短语下面的周期性可以:
”
我们生成这种类型的句子插入火车日历的周期性作为输入,这是一个二进制向量。节
我们考虑下面的输入数据:
我们定义以下决策变量。
整数变量:
二进制变量:
通过这些输入数据和决策变量,我们独立存在以下模型:
我们可以看到在数学模型(
我们将下一个将这种数学模型称为“模型”,为了得到阅读流畅。
在这一点上,我们可以描述提出的启发式算法。首先,作为一个在线工具,它与用户接受输入数据查询:开始和最后日期的时间窗口。为了避免使用外部一次性填充日历,就像在以前的文献,第二步计划通过数学公式来生成一个内部日历。然后,生成的周期性ICT系统被分为周弥补这个缺点。我们可以看到算法方法是完全不同于前一个,确实;虽然整个模型认为周期性,算法遵循“分而治之”的方法(
我们的算法的实现方法
提出了启发式算法的流程图。
我们已经仔细操作输入数据后,我们需要一个工具,将亚纪的初始周期性转换成句子。这是一个经典
机器主要做什么工作来生成一个解决研究问题?入禁区,周存储三个。一个描述性的集群的天,提供的服务是,分配与周在第一的位置。之后,周存储在第二和第三的位置与一个在第一个位置,根据情况,检查它们是否不同,相似或相等。
这种比较是基于一周内的服务是可用的:
如果两周有相同的天,这意味着提供的服务是在同一个天所以相比周可以被视为平等的。第二周是“整合”到第一个。这意味着集群与第一周也涉及第二个,这句话的时候,它描述了这两个周的服务可用性(基于相关的集群)打印出来,特定的时间窗口将被认为,从第一天开始的第一周第二周的最后一天的可用性。
如果两周不同于彼此只有一天不可用或可用性,这意味着这一天,分别一个异常或额外的一天。如果是这样的话,这周可以被认为是
如果两周内由两个或两个以上不同于彼此的日子不可用或可用性,我们认为这些是不同的。在这种情况下,我们不包含与第一个,第二个星期,我们代表了两个星期,和与他们的合并,不同集群。因此,该算法将从这两个亚纪打印不同的句子。
针对每种情况的一个例子是图所示
三种可能的比较结果的例子。
一旦所有的周已经处理和相关的句子亚纪已经打印出来,退出while循环的代码。然而,对于实际使用这个工具,我们将考虑一个无限循环的实现,例如
为了更好的解释我们的算法的工作流程操作,一步一步的描述执行的活动试验实例。我们假设周期由用户查询只包含四个星期,从1圣3月28th3月(图
培训日历和周期性的试验实例。
首先,算法需要输入数据,开始和最后日期的时间窗口,连同相关的周期性的培训要求,并创建内部日历,这是一个矩阵。然后,周期性分为基于其周工作日分配给每个进步指数通过下面的数学公式。这个公式中的变量描述表
列表中使用的符号数学公式(
| 象征 | 描述 |
|---|---|
|
|
值从0到6,0与星期的日子“星期六”和6“星期五”。因此,对于“周一”这个值就等于2。 |
|
|
今年。的模拟,我们认为这个值等于2020。 |
|
|
商的整数部分 |
|
|
今年天的数量,从1开始圣1月我们关联值1。 |
|
|
其余部分的模运算符,它返回圆括弧内的部门。 |
例如,图10星期对应的哪一天th2020年1月,我们会考虑
数据结构的“盒子”的前三周,本周将集群“Monday-Wednesday”与在第一个位置,并开始比较后者和一个第二位置(图
说明数据结构的“盒子”。
因为它们不相等但只相差一天,星期三10th三月,该算法检查他们是否可以通过比较相似或不同的星期在第一位置在第三的位置。后者等于本周在第一个位置,相似性是证实。因此,周在第二个和第三个职位合并的第一个位置。周三10th3月存储为一个异常和集群的延时Monday-Wednesday更新,从周一开始1圣3月的最后一天星期第三的位置,这是周三17th3月。周的滚动第二和第三的位置,第四个星期进入”框。”The latter is compared with the week in the first position and, as they have only two days on in common, they are classified as “different.” The cluster associated with the week in the first position is then printed out as a subsentence of the periodicity, the fourth week is inserted in the first position of the “Box,” and a new cluster is attached with it, that is, the cluster “on Weekends” on Saturday 27th和周日28th3月。
因为所有的周处理,柜台符合出口条件和while循环的结束。句子连接到周期性因此显示出来,我们可以看到在图
这句话打印出来的试验实例。
一旦被描述算法,一些不同的文学方法可以确定:
完整的建模方法是在实例和创建clusters-copies总体时间窗口查询。这将导致增加计算工作量计算最好的可能的解决方案。相反,启发式算法的实例每周,生成和关联,在需要时,一周七天的集群在第一盒(图的位置
通过建模方法,引入一种新的集群
另一个相关模型和算法之间的区别是引入一个函数,考虑额外的天周之间。让我们假定,在感兴趣的时期,提供的服务是相同的频率,除了一些零星几周,有一个额外的一天,庆祝活动的情况。在这种情况下,建模方法将将至少两个集群与周期性,因此,两个subsentences。通过多天的函数实现的算法,这些日子将存储作为额外的天,添加到单一集群选择描述周期性。这个样本函数的一个例子这种类型的工具,其潜在的灵活性是适应不同的公共交通环境,提高服务质量感知的用户。
为了比较介绍了这两种方法是如何工作的,我们测试了他们264个实例从. csv文件导入。模型开发和执行在IDE Pycharm 2020.3.3,我们使用的启发式算法代码:20.03块。所有测试都是Windows操作系统上执行英特尔i7处理器2.6 GHz和16 GB的RAM。整个264年创建实例的基础上,提出了研究的Amorosi et al。
我们测试独立工党模型和启发式算法对各种可能的情况下以定量评估他们的潜力。我们也调查指数时间和使用的高数量的集群模型部分
实验包括三个不同的周期的研究,更新为2020:第一个是由62个实例从13th9月24th2020年11月;第二个包含88个实例从3理查德·道金斯5月2nd2020年8月;最后一个由113个实例从2nd2月至20th2020年5月。集覆盖,分别段长度等于2,3,几乎四个月。
我们认为时间和质量指标,准确地说应该是:平均值,最大值,最小加工时间;平均、最大和最小数量的描述性的集群使用。获得的值为每个索引表表示
基于性能指标测量值为每个方法考虑。
| 时间 | 独立模型 | 启发式算法 |
|---|---|---|
| 平均 | 1000年 | 2.32 |
| 马克斯 | 4334年 | 16 |
| 最小值 | 300年 | 0 |
|
|
||
| 数量的集群 | ||
| 平均 | 1.19 | 1.32 |
| 马克斯 | 6 | 5 |
注:时间是用女士表示。
另外两个重要的指标,我们可以考虑:每个方法所使用的许多不同的集群时输出两种不同的解决方案;异常的数量每个方法的解决方案时所使用的不同集群的数量。最后一个指数是重要的由于限制使用比例阈值确定的模型。事实上,什么是可能发生的,模型可以使用更少的集群,但随着更多的例外。
我们可以看到在图
方法论的差异模型(a)和(b)启发式算法。
然而,后者9%可以追溯到模型流程实例的困难的一天。下图(图
每个方法使用的比例不同的解决方案,以及所使用的许多不同的集群。
下面的情节(图
运行时间和集群用于264年的实例。
结果在图
处理时间的分配模型。
第二,集群的数量每个实例使用的模型是6,而我们使用的一个启发式算法5每个实例。尽管这是一个微小的区别,正确评估的质量提供解决方案,我们应该考虑集群用来打印出描述性的句子。的确,看着图
使用的集群的数量百分比分布模型。
当看着表的质量性能度量
然而,有两个主要的局限性,我们见过:“
在本文中,我们开发了一个快速和灵活的替代方法的方法先进的培训日历的文本生成,主要让我们保持一个常数计算时间,返回优质的解决方案,并介绍新功能来增强句子的有效性被打印出来。理论和实践贡献在于一个新的独立模型和快速启发式算法解决在线培训日历一代的问题。独立工党模型有三个主要的差异与Amorosi et al。(
关于该启发式算法的贡献,在我们的论文提出利用“分而治之”的逻辑控制整个周期通过日复一日的生成解决方案。从计算实验,我们的算法介绍,平均而言,一个强大的(= 99.8%)处理时间减少建模方法相比,同时保持低于1.32 subsentences周期性。由于其快速响应时间和计算能力高质量的解决方案,该算法可以被认为是最好的选择来开发一个有效的在线工具,培训日历的一代。
有可能在这个方向上走得更远吗?当然,也有一些开放的问题。我们可以改善的第一件事是“每一天”的处理集群,给预测算法的可能性。我们的意思是允许算法智能理解如果亚纪可以有效地描述了“每天”集群已经开始。这将进一步降低集群使用的平均数量。
另一个重要的方式来改善目前的结果可能会重新考虑初始假设我们考虑一个句子可读和智能基于一个更现实的用户感知质量,例如,通过感知服务质量模型提出的(
此外,证明了该算法的灵活性使得它能够被采纳为事件日历的描述开发在线工具在其他公共交通环境问题不同规格和描述性的句子被打印出来。从地面到航空运输,程序性方法表达的算法的主体可以通过附加功能,填充和解决不仅外部用户也为内部员工信息的传输,如货物运输部门的情况。
使用的数据来支持本研究的发现可以从相应的作者。
作者宣称没有利益冲突有关这篇文章的出版。
作者要感谢蒋禄卡博士Giacco博士(铁路高级经理)和拉维尼娅Amorosi (Sapienza大学研究员)他们的反馈的问题和慷慨的分享铁路数据。