文摘
货运车辆的安全旅行社会关注和高的关键问题是城市经理有效地监督和评估可能的社会安全风险。基于运动不断改进技术,货运车辆的轨迹是现成的,他的不寻常的变化可能表明城市风险隐患。此外,高时空分辨率的增加轨迹提供了机会的实时识别异常或危险的车辆运动。然而,现有的研究主要集中在空间异常检测,并很少有研究实时时间异常检测。本文基于网格的算法,它结合了时空异常检测,提出了城市货运车辆轨迹跟踪的风险通过考虑当地时间窗口。车辆历史轨迹的旅行时间概率分布分析,以满足实时异常计算的时间复杂度要求。发达的方法应用于一个案例研究在北京来演示其准确性和有效性。
1。介绍
对城市安全、物流轨迹安全起着重要的作用,值得进一步研究。特别是,典礼等重大活动期间,音乐会,和游戏、实时监控和异常检测的物流车辆轨迹吸引了大量的安全问题,因为悲剧好(86人死亡,458人受伤)1)和巴塞罗那(15人死亡,100人受伤)。现在的车辆轨迹数据可以方便地收集数字传感器,如各种导航系统、智能手机、和射频识别设备,研究人员可以研究轨迹的可靠性和被调用的运输风险问题,即。、驾驶行为检测(2,3)、旅游模式识别(4- - - - - -6),和异常跟踪在实践中(4- - - - - -10]。
实时轨迹的不寻常的变化可能表明时空维度的潜在风险。异常轨迹检测的目标是找到一个明显的轨迹不同于大部分的历史轨迹与相同的来源和目的地。主要反映在货运车辆驾驶的过程从车站分配点。由于司机的行为习惯和城市交通的周期性,货运车辆行驶路径相似相同的开始和结束点在同一时间。异常检测领域的发展轨迹,许多研究已经从不同的角度研究[11- - - - - -13),其中一些是用来检测假出租车司机的驾驶行为。然而,这些研究主要集中在空间异常检测,还有一些有关时间异常检测。现有的研究方法,研究空间异常轨迹检测可以被划分为三个主要类别。第一类是基于距离和密度(14,15]。这类方法通常需要计算指标基于整个历史数据库,从而导致较高的时间复杂度。第二类是基于体系结构,主要是神经网络架构和强化学习架构(16,17]。这种方法需要大量的标签,和它的准确性直接关系到数据的质量。第三类是基于模式(11,13]。这种类型的方法主要研究了共存的轨迹点,这样不正常的轨迹与低概率可以检测到在一个预置窗口。
然而,很少有相关研究实时时间异常发现,可以帮助发现的异常位置车辆从时间的角度来看。这可能是由于以下原因:(1)城市交通网络流动态和复杂,从而导致不同的时间安全评估阈值对应于不同的空间位置,这样的十字路口停车路段停车是不同的;(2)可以判断空间异常孤立的轨迹点,虽然时间异常检测需要检测窗口合作多个连续的轨迹点;(3)实时检测,选择一个适当的检测窗口大小是至关重要的,和不合理的选择可能导致完全错误的判断。在极端的例子中,只有一个轨迹点的窗口,一个轨迹点的旅行时间异常可能是轻微的。然而,随着时间窗的扩张,有可能超过设定的阈值检测窗口的历史轨迹。
的,孤立的窗口时间基于网络异常轨迹检测(WT-iBOAT)算法在本文完成实时异常检测异常物流轨迹。研究可以帮助监督物流车辆的司机安全驾驶、可靠,使货运车辆轨迹的实时异常检测,通过考虑空间和时间变化。主要贡献如下:(我)首先,我们从不仅空间中提取不同的限制,但也时间维度全面解决动态的异常检测问题(2)其次,提出了一种基于网格的异常检测方法从一个新的角度利用当地时间窗口,这是有利于提高计算精度和减少计算复杂性的实时检测(3)第三,本文提出了一个框架,用于检测实时风险城市货运车辆的轨迹,和一个真实的数据集是用来验证其可行性
本文组织如下。节2,相关的研究工作。节3,本文提出了相关的体系结构和算法。节4,结果三个轨迹数据集使用本文算法进行了分析。节5,该算法的性能进行了分析。节6,讨论了算法的调整机制。节7整个论文中,我们总结并讨论。
2。相关研究
轨迹数据已被广泛应用于流行的路由发现和异常检测。领域的流行路由发现,Zaiben et al。18)提出了一种相干扩展算法和最大概率产品算法发现最受欢迎的路线。贾尼et al。19)使用的快速地图服务器,生成和可视化在线热的地图热路线从大规模的运动轨迹数据根据客户的偏好。罗等。20.]发现,suffix-optimal length-insensitive和bottleneck-free方法反映常识性的概念和提出有效的搜索算法确定最常用的基于时间的路径。语义特征主要来自其他移动物体具有相似的行为。Treerapot et al。21)提出了一种统计方法来估计和货运卡车活动从全球定位系统(GPS)数据分析的卡车和应用方法在评估活动中,活动模式,商品链,旅行和旅行的腿从收集到的卡车GPS数据的状态。魏et al。22]研究不确定的轨迹的特点,提出了一个基于集体知识算法推理框架路由到找到top-k流行路线。异常检测是重要的工作在挖掘轨迹23,24]。李和曹et al。24)提出了一个基于网格的局部离群值因素异常检测算法。该算法减少了计算时间和可以接受的折衷显著错误。克诺尔et al。23)研究了基于距离的离群值的概念,发现异常值在多维数据集。发现受欢迎的路线总是用于城市交通量的日常管理和操作。有时,它有助于发现异常轨迹,但它缺乏直接而异常检测,并可能导致错误识别的常规轨迹(不是最受欢迎的)。
领域的异常检测,王et al。25]应用改进的健壮Rrincipal成分分析(RPCA)介绍客流异常的检测和空间Temporal-Density-Based空间聚类的应用程序与噪声(ST-DBSCAN)算法组发现警所一级的异常。铃木et al。26)应用隐马尔科夫模型(HMM)和k - means,和贝拉et al。7)使用贝叶斯学习技术来检测异常行人轨迹。其他受欢迎的领域与GPS跟踪包括社会社区的检测(27和驱动程序行为异常28]。阴et al。27)提出了一个概率模型,用来推断用户的社会社区通过整合他们的时空数据和语义信息。阿里和伊斯梅尔28]调查司机行为通过GPS车辆轨迹数据,主要考虑速度限制的特点,速度突然变化,和车辆横向位置不断变化,他们使用这些特性来检测异常驾驶行为。
许多研究人员对异常的轨迹检测进行了相关研究。在歌曲等。16),为了解决问题,即。,the traditional anomaly trajectory detection method cannot adequately capture the sequence information of the trajectory, and focusing only on the given source and target may lead to data sparseness. They proposed an algorithm that used an Anomalous Trajectory Detection using Recurrent Neural Network (ATD-RNN) to represent the trajectory by learning a trajectory embedding and then found the risk trajectory. Liping et al. [15)提出了一个轨迹分割策略基于multimotion特性和基于轨迹的相似性度量方法的结构。提出的策略和方法,分布式轨迹聚类算法设计,以提高聚类算法的效率。解决该问题的计算距离和轨迹附近密度异常检测算法,数据集被修剪轨迹聚类结果,提高了算法的效率。尽管如此,歌曲等。16和李平et al。15)需要人工标签异常轨迹为提高有效实时异常检测算法和无法执行。
吴et al。17)提出了一个概率模型车辆异常值检测方法、驾驶行为轨迹异常值检测(DB-TOD),这是用来模拟驾驶行为的历史轨迹。他们设计了异常值检测算法完全和部分异常值,而解决这个问题提供早期预警的异常值只有部分被观察异常值。李等人。8)等人旨在解决这一问题,追踪异常值的检测算法在检测异常值的跟踪能力有限。局外人检测算法,时间流行的基于路径轨迹异常值检测(TPRO)。该算法分为两个阶段:分区和检测。第一阶段,一个两层的轨迹分区策略确保subtrajectory分区的高质量和高效率。在第二阶段中,混合基于距离的孤立点检测的方法和密度聚类改进轨迹异常检测算法的准确性。大庆et al。11)提出了一个isolation-based异常轨迹(iBAT)方法基于隔离。首先,最初的轨迹是映射到网格序列,网格和历史轨迹建立索引。然后,iForest算法被用来检测孤立的轨迹。然而,这种方法只能支持完整的轨迹。太阳et al。29日]提出了基于轨迹iBOAT算法,类似于实时检测方法,这是一个有影响力的方法。该方法从iBAT算法开发。这个方法的主要改进是它与iBAT针对整个行离线,因为它是利用实时对比的方法改进。它更实用,因为它可以是一个拥有高可靠性的快速检测算法。Yu et al。30.]定义的反常行为的移动对象根据neighbor-based轨迹异常值的概念并提出了最小考试框架来有效地发现新的异常。Yingyi et al。31日)提出基于距离的方法监控异常轨迹流。这种方法主要用于当地集群和分段优势树与相应的修剪方法减少计算时间。这些研究可以有效检测轨迹异常同时保护效果。但是这些算法只研究空间异常检测,不涉及颞异常检测。
杰et al。12)使用历史轨迹数据集和普遍检测到异常的轨迹。然后,他们修改了TPRO算法的步骤划分成离线处理和在线检测和添加适当的模块适应检测。本文提出了一个名为轨迹异常值检测的算法(TPRRO)。TPRRO是一个实时的异常检测算法,构造短时间传输指数(创科实业)和短时间转移图(TTG)进行时空异常检测。虽然提出了一个时间异常检测算法,它没有详细分析颞异常检测。与此同时,杰et al。12)使用时间传输图(TTG)计算了旅行时间从一个顶点到另一个在公路网络,所以该算法不能反映即时时间异常信息的轨迹。
总之,我们提出一个实时时间异常检测算法对物流车辆,防止潜在的安全事故。不同于之前的研究(在表1,我们总结以前的研究和贡献我们的研究),我们专注于实时时间异常检测方法和设计为时空异常检测算法框架的城市货运车辆。我们进一步进行分析收集数据和解释可能的异常行为的动机和原因。
3所示。方法
在本节中,介绍了本文的算法框架,包括数据预处理(DP)、离线处理(游戏),数据管理器(DM)和在线处理(OLP)。DP的目的是获取原始GPS数据的有效装卸位置。游戏的目标是获得的可用subtrajectories装载(起源)和卸载(目的地)从DP获得职位和subtrajectories映射到一个预设的网格。OLP是啮合所测试的目标轨迹点。DM主要用于提取的时空经验限制的历史轨迹和检测异常轨迹。图1显示的子模块。
3.1。概念的关系
本节首先介绍相关概念之间的关系。异常检测轨迹,轨迹点和时间之间的关系/加载/卸载位置是多对一的位置,因为许多轨迹点与此同时装入位置/卸货位置。同样的装卸位置,不同时期的轨迹是不同的。加载位置可能与轨迹不同的道路,不同的时间,不同的卸货位置。此外,轨迹穿越一个特定路段可能涉及不同的加载位置;轨迹交叉特定路段和不同卸载位置还可能涉及到类似的关系。
3.2。啮合的时空轨迹点
产生很多的车辆的运动轨迹数据。我们需要把现有的历史轨迹检测轨迹的时空异常之前有效。时空轨迹的粒度划分轨迹时是至关重要的。不同的网格大小适合不同轨迹的粒度问题。这就是为什么我们使用网格的方法,不需要我们知道所有的时空坐标,避免大量的计算。轨迹点映射到网格单元(图的二维空间2)。这是一个二维欧几里得空间的定义x设在和y设在。每个网格的中心是用来代表所有GPS点的网格单元。如果网格单元太大,异常检测的准确性可能还不够。然而,规模较小的网格单元可能导致计算。因此,我们必须找到一个最优的网格大小,可以识别轨迹没有不必要的计算。基于二维网格划分,轨迹查询从特定加载位置坐标到特定的卸货位置坐标成为轨迹查询从一个网格单元到另一个。
我们的最低范围网格定义为(COLNmin、ROWNmin COLNmax, ROWNmax)和一个网格的长度范围k。X和Y网格的行和列的数量在研究区32]。
3.3。粗糙的轨迹
在异常检测测试轨道之前,我们首先需要过滤的历史轨迹,拥有相同的装载和卸载点测试轨迹。我们将这个过程定义为查询的历史轨迹。相关概念定义如下:
定义1。(轨迹)。轨迹tr = {P1,P2、……PN}收集GPS记录。每个GPS记录P我指定瞬时时间、位置(经度和纬度),和车辆的ID。
定义2。(subtrajectory)。subtrajectory反映了不同的驾驶偏好不同的驾驶员对汽车用同样的运输目的不同时期。我们使用有效的停车时间作为部门subtrajectory的因素。所以,subtrajectory轨迹的一部分。
定义3。(可伸缩的装载和卸载点的轨迹)。为了消除不相关的轨迹,装卸点是用作过滤所有轨迹空间约束。为了实现这一目标,我们首先找到加载点subtrajectories subtrajectories并保持。之后,我们在保持subtrajectories找到对应的卸载点。与常见的输入方法相比,这种方法有一个巨大的优势:一个轨迹用于异常检测当这个轨迹的中间部分有相同的装载和卸载点测试轨迹,如图2。
3.4。提取时空约束
定义4。(全球空间约束)。不同的驱动程序有特定的道路选择偏好在一定时期内;这种差异来自于驾驶员的感知道路交通系统。然而,也有一些不确定性感知。有经验的司机,可选的旅行在固定时间是定期的和可搜索的。具体来说,旅行用同样的装卸位置通常遵循最佳的驾驶环境。例如,司机可能需要的最小距离,时间和出行路径的燃料消耗。示例图中可以看到3:O是加载的位置,和D是卸货的位置。紫色的线代表了历史的轨迹,红色虚线表示测试轨迹。蓝色的盒子代表在线地图的网格。黄色框显示的坐标网格。
为了提取轨迹的空间限制,我们使用一部分IBOAT算法的思想。具体方法如下。假设有三个紫色的轨迹图3,T= <t1,t2,t3 >,t1 = <(1,1),(2),(7,2),(10,3),(13日3),(17日,3),(21日3),(24日3),(27岁,4)>,t2 = <(1,1),(2),(8,2),(11日3),(3),(19日3),(23岁,3),(26岁,3),(27岁,4)>,t3 = <(1,1),(2),(7,2),(11日3),(13日3),(19日3),(21日3),(25日3),(27岁,4)>,和测试轨迹t= <(1,- 1),(2),(2),(11日3),(19日3),(27岁,3)>,然后hasPath (T,t)= {t2,t3}。所以,hasPath被定义为一个函数,返回的轨迹T(历史轨迹),其中包含所有的点t(测试轨迹)以正确的顺序29日]。
测试的支持轨迹计算如下:在网格坐标(5,2),红色的轨迹和紫色的轨迹是相同的网格,和支持测试轨迹是100%的价值。网格坐标(9日5)只包含红色的轨迹。支持值测试的轨迹是0%29日]。
不仅支持有很大影响的空间异常检测轨迹,而且时间异常检测。实时时间异常取决于空间的建模异常检测结果。换句话说,执行时间异常检测时,空间是正常的。因此,这种情况是暂时的强约束异常检测。
定义5。(本地spatio约束)。支持认为全球空间轨迹的特点,但缺乏当地的空间特征。轨迹点的轨迹是由不同的影响当前轨迹点的异常。简而言之,越接近轨迹点是当前测试轨迹点,对异常的影响就越大。相反,越小的影响。针对这一特点,本文增加了两个参数,即t2(最大持续时间长度异常窗口)t1(警告时间窗长度),正确的空间异常的结果。(在部分6.2,我们将更详细地解释。) 方程(4)是计算模型(风险值的轨迹)。最大数量的异常测试的GPS点轨迹t1。是所有GPS点的数量的测试轨迹t2。的时间越长t1模型的公差越低,而越短t2是,灵敏度越高。
定义6。(全球颞xonstraint)。由于道路网络和交通条件是动态的,轨迹也是动态的,取决于交通状况。因此,装卸位置相同的轨迹可能完全不同的高峰时段,一天的其他时间。在时间方面,我们把轨迹在不同时期根据交通状况。以北京为例,早晚高峰从上午7点到9点,下午5点到8点。在此基础上,我们把时间分为四个时期:am-9:00 7点,9点am-5:00点,下午5:00 pm-8:00, 8:00 pm-7:00。我们寻找的同时测试轨迹。
定义7。(本地时间窗口约束)。全球暂时约束分类的总时间的轨迹,但这是不够的实时异常检测的轨迹。自全球暂时约束跨度太大,以满足实时精度要求的轨迹,提取当地暂时约束小跨度将实时异常检测的关键。
一个窗口时间是用于方程(4),它使用滑动窗口的思想启发颞异常检测。不同的窗口大小提供不同的信息,这是有益的时间异常的判断。有两种类型的滑动窗口。有一个固定的时间大小,但是网格在窗口的数量是可变的;另一个窗口中有一个固定数量的网格,但时间是可变的。本文采用第二种方法,即定位窗口,因为它是更直观的比较历史轨迹的旅行时间和测试轨迹在同一个窗口中。
定义8。(构造经验当地时间窗口约束基于历史信息)。根据旅游时间偏好获得所有历史轨迹,旅行时间分为正常时间和不正常的时间。基于检测异常值的方法在异常检测中使用盒子情节,灵感来自于这一点,我们用分位数统计推理工具来决定旅游时间窗口的异常。在历史的轨迹,轨迹满足定义的条件4和6下的所有历史轨迹构成了旅游时间频率预置大小窗口。
让函数c (t)的旅行时间频率窗口,通过计算确定旅行时间窗口的长度符合上述条件的轨迹。
让米(r窗户的数量满足c(t)=r。让Y windows的总数。然后,这个公式可以写成
让f(问)的累积分布函数r。
让问k(T我,t我)的k分位数旅行时间概率分布的历史轨迹我th窗口。我们用概率统计方法模型的旅行时间分布的历史轨迹检测时间异常测试轨迹。
定义9。(调整机制:当地时间窗口约束提取基于冗余信息)。在异常检测问题,真实的数据可能发生,历史轨迹(HT)旅行时间大于或小于新测试轨迹(特种加工)的旅行时间我th窗口。在这种情况下,旅行时间(我−1)th的旅行时间窗口的影响我th窗口。因此,我们要消除这个错误。我们定义这种情况如下:测试窗口有冗余信息的轨迹。这对时间异常检测效果是显著的,这将导致不足或超负荷的历史信息的窗口。这两种情况下的失败直接导致约束提取。因为旅行时间(我−1)th窗口影响第i的旅行时间窗口,因此,我们要消除这个错误通过使用一个线性方程和定义8。
具体来说,当HT大于特种加工,如果HT值在第i个窗口不调整,信息(我−1)th窗口可能带入我th窗口。这使HT价值我th窗口大于所需的HT。一个调整系数(rp在这种情况下)是必需的。
HT小于特种加工图4。这是对上面的情况,但它也将导致错误由于引入冗余信息。因此,同样的需要调整。
公式如下:
旅行时间之间的差异的历史轨迹和测试的旅行时间轨迹
在方程(10),HT我显示的值kth分位数的旅行时间我th窗口。
技巧(放松HT不到特种加工):如果HT大于或小于HTW对异常的判断有不同的影响。更准确地说,当HT大于特种加工,这意味着测试轨道是正常的,但是多余的价值将影响的异常判断下一个点。当HT小于特种加工,测试轨迹是不正常的。这是一个情况我们需要检测时间异常。这时,冗余值的估计精度是致命的异常判断的结果,所以我们尽量放松约束。图4显示了这个技巧方法。一个例子说明上述方法。图4显示了该方法的计算结果,当窗口大小是3。
在图4,HT代表了旅行时间的历史轨迹。HT的数字值代表了时间让一个时间步是10秒的听证程序——网格代表车辆的位置。特种加工是测试的旅行时间轨迹的窗口。太瓦我是我th窗口;之间的区别是特种加工和HT代表测试的旅行时间轨迹之间的差异和历史轨迹。之间的区别是和
。在图4,太瓦8是一个特殊的窗口。第四步是紧随其后的是时间在TW步骤78在测试轨道,这意味着时间步(5、6、7)在同一网格。之间有30秒的时间步骤4和步骤7。第四步是紧随其后的是时间在TW步骤58的历史轨迹,这意味着只有10秒过后。如果特种加工和HT TW直接比较8,这将会导致一个不正确的结论。通过观察,我们发现这个错误的结论是由时间步骤5、6、7太瓦8在特种加工。然而,通过比较
,这个问题可以解决。的价值的值是0,是(−20)。最后,我们获得的地点的规则大于0是不正常的,用红色标注;的地点小于或等于0是正常的和被标记为蓝色。黑色表示正常价值。
定义10。(建设经验平均速度比约束)。平均速度的变化可以表达旅行时间的变化。因此,引用的速度帮助过滤时间异常在方程(6),一个是速度比阈值,WTR的速度比吗我th窗口。当WTR大于一个的旅行时间我th窗口是不正常的。公式如下:
定义11。(测试的旅行时间轨迹)。特种加工是测试的旅行时间轨迹,等于窗口的长度- 1。
基于上面的描述称为窗口时间的隔离网络异常轨迹检测(WT-iBOAT)算法,增加异常时间检测方法iBOAT [29日]。算法1。
WT-iIBOAT算法的伪代码如下:
|
4所示。结果
4.1。数据描述
城市货运车辆检测异常轨迹,在北京物流公司提供的历史轨迹被用于本文。
收集到的数据从2019年的大约35车辆在北京(2019年9月至10月)。主要领域是车辆状态,经度,纬度,抵消维度,城市代码,工作条件,GPS时间,累计里程、定位状态、车辆速度、车辆ID等。需要注意的是,这些数据被记录每10秒。我们首先需要段原始轨迹根据物流的业务需求。因此,装卸点常见车辆位置加载和卸载货物作为分割点的轨迹。装载和卸载点是通过有效的车辆的停车时间。有效的停车时间取决于员工的经验。车辆轨迹可以发现的规律装卸位置获得有效的停车时间。集群是一个不错的选择来获得这个规律。DBSCAN [33)是一个基于密度的算法,假设类别可以由样本点距离的密实度。
DBSCAN是常用的装卸位置。算法的参数是最小数量的字段(MINPTS) = 60和域半径(EPS) = 150米。总共有151装载位置类别和151卸载位置分类。聚类结果基于ArcGIS平台如图所示5。左边是加载的位置,右边是卸载位置。装卸位置在中部城市相对集中,符合城市物流的要求,表明聚类结果反映了共同的工作区域。
通过筛选上面装卸位置,三个相对优质的轨迹数据集是最后选择测试算法。图6描述了数据,包括轨迹的可视化数据,旅行时间分布、出行距离分布。
(一)
(b)
(c)
分析空间的异常检测算法的性能,我们手动标记所有轨迹,然后计算算法的准确性。性能分析的异常检测使用的方法比较不同窗口大小。
数据7和8使用热地图显示的可视化时空异常。炎热的地图,它使用不同的颜色来表示统计异常值,通过计算生成异常网格的数量在一个测试窗口轨迹。红点是GPS点,这代表车辆的旅行路线。图8只会显示nonabnormal路线。
4.2。空间异常检测的结果
在图7,不同的空间异常突出。正常的轨迹几乎是装卸位置之间的最短路线。每个图片下面的分析。在图7(a),与更严重的空间异常路线选择东4环高速公路而不是东五环高速公路。在这个数据集有106轨迹,6在这条路线。通过地图匹配,发现这些轨迹不离开东四环高速公路。因此,这些异常可能是由于司机的疏忽,导致未能及时变换车道和错失的机会进入五环高速公路。在图7(b),有些地方有严重异常和集中区域。这可能是由于车辆交通临时任务。在图7(c),保证车辆的目的可能是为了避免大的十字路口。然而,图8(c)表明,没有很多时间异常的十字路口。相反,附近有一个时间在街上异常目的地。因此,它是合理的车辆避免可能会出现交通堵塞的街道。
4.3。时间异常检测的结果
在图8,红色代表异常严重的区域异常,和蓝色代表异常温和的地区。从图8,可以得出结论,大部分的异常区域接近十字路口,和接近的地区更有可能开始点和结束点不正常。
在图8(a),颞异常主要发生在北京沈阳路的交叉路口,Huosha十字路口的道路和北京沈阳公路和机场高速公路。路上几乎没有时间异常是东五环高速公路。颞异常图8(b)主要发生在河北和北京之间的城市和郊区的十字路口在廊坊市光明西路和西昌路。在郊区河北省和北京之间,通过定居点的道路,和时间异常发生在密集的居民区。光明西路和西昌路的交点在廊坊城市交通量大,容易交通堵塞。图8(c)显示了Shangqing大桥在北京城市。图显示时间异常主要发生在路上接近邻近居民区和交换(如十字路口Shangqing桥),这与实际情况是一致的。
上面的分析描述时空异常在不同条件下的原因。这是证明了本文提出的异常检测算法可以解决实际情况。
4.4。异常轨迹检测的结果
最后,一个轨迹用于定性分析目前所有算法的结果。图9显示了一个ID为27636的轨迹。这个轨迹的空间形状如图9(一个)。蓝色的点是正常的,和红点是不正常的。
(一)
(b)
(c)
(d)
数据9 (b)- - - - - -9 (d)显示时间异常,空间异常,分别和风险价值的轨迹。图9 (d)表示所有的时空异常信息。颜色的变化表明颞(图的密度的变化9 (b))和空间(图9 (c))异常t1方程(1)。从图9 (d),我们可以识别异常轨迹段和确定的风险等级警告潜在的安全风险。图9 (d)风险价值的概念计算根据方程(4)。用户可以根据自己的需要定义风险水平根据不同的风险值。在方程(4),t1和t2可以根据不同的需求调整不同的场景。
5。分析
这部分全面分析了不同参数对精度的影响,分析方法之间的差异和iBOAT TRAOD算法。之后,三种方法的结果在我们的数据解释。
环境:我们的算法主要是在Python中实现。用于实验的机器9日一代i7 CPU和32 G内存。操作系统是Windows 10 x86_64,编译器4.15世爵。
5.1。空间异常参数分析
汽车空间异常检测的重点是对网格大小对准确性和处理时间的影响。图10显示这些结果。在图10,蓝线代表网格大小对精度的影响,和红色线显示了网格大小的影响程序的处理时间。的x设在网格大小。左边y设在是正常的轨迹。正确的y设在处理时间。代表数据集选择考虑城市货运车辆的长传输距离。在这个数据集有106轨迹,其中99是正常的和7是不正常的。图10表明,当使用250 m×250 m网格,最正常的轨迹被发现,和处理时间是在一个较高的水平。因此,250是选择空间异常检测。
5.2。时间异常参数分析
时间异常检测,没有使用手工方法,因为它是手工方法很难找到一个合理的标准来判断何时何地GPS点是不正常的。因此,我们观察到其他窗口的影响大小,结果窗口大小= 2为基准,我们进行对比分析,说明本文提出的算法的可行性和优势。图(11日)显示了方法,x设在表示时间和y设在代表空间。空间5 - 3(窗口2)作为一个基准来判断算法的性能在不同的参数,如空间5比1(4)窗口。接下来,我们将分析WT-iBOAT的性能和精度。
(一)
(b)
性能:图11 (b)显示WT-iBOAT和iBOAT的处理时间。WT-iBOAT的处理时间是大约iBOAT的2.5倍。它不会改变的历史轨迹。这表明处理时间是稳定的,和每一个GPS点的处理时间约为0.006秒。因此,该算法可用于实时检测。
准确性:轨迹的旅行时间将分为四个案例之一:真阳性(TP)的数量异常旅行时间的轨迹被归类为异常;假阳性的数量(FP)正常旅行时间的轨迹分类为正常;真正的底片(TN)异常数量的旅行时间的轨迹分类为正常;和假阴性(FN)的数量正常旅行时间的轨迹被归类为异常。我们报告这些情况和计算精度的共同的标准,真正的阳性率(TPR),定义为 ,和真阴性率(TNR),定义为 。一个完美的分类器将TNR = 1和TPR = 1。
在图12(一个)分位数= 75,窗口大小≤6日,TPR > 0.75;在图12 (b)分位数> 75年,窗口大小= 4,TPR > 0.825。这反映了参数设置,只要是合理的,我们的算法可以实现相对优秀的结果。更具体地说,在考虑窗口大小对精度的影响,确定了分位数为75。这是因为当分位数是75,有更高的要求,旅游时间,这是方便比较算法的结果。第75分位数和2窗口选择作为目标的价值观。图12(一个)阴谋的结果对于不同价值观的窗口大小。TPR随窗口大小的增加而迅速减小,这表明窗口尺寸越大,旅行时间越长所允许的窗口,所以积极的样本检测的比例减少。量化TPR,当窗口尺寸3,4,5,6,7,8,9,10,TPR计算的算法是87%,82.5%,78%,77%,75%,74%,72%,和71%的基准,分别。
(一)
(b)
然而,TNR几乎没有下降,这表明窗口几乎没有影响的判断负样本,这实际上是在算法调整机制的作用。前一时刻的调整机制有效地减少了影响我th窗口。
研究分位数精度的影响时,窗口大小选为4,因为这是一个明显的转折点,如图12(一个)。这表明足够的信息被认为是在4窗口。图12 (b)表明,TPR和TNR增加与分位数增加。这意味着宽容是越高,时间越少发生异常检测。具体来说,TPR 4 windows和70分位数2的窗口和第70分位数的82%;4窗口的TPR和75的82%分位数的2 windows和第75分位数;4窗口的TPR和80的85%分位数的2 windows和第80分位数;4窗口的TPR和85的87.5%分位数的2 windows和第85分位数;4窗口的TPR和90的91.5%分位数的2 windows和第90分位数;4 windows和95分位数的TPR 2 windows和第95分位数的95%。
5.3。异常轨迹检测和分析
为了说明算法更有效,我们比较算法TRAOD算法和iBOAT算法的案例研究。TRAOD离线算法,可以通过聚类异常轨迹不同轨迹的段(8]。TRAOD算法具有较高的效率发现更多巷的变化轨迹。结果如下:212年的轨迹,我们的方法发现所有48个异常轨迹,而iBOAT算法只发现13个异常轨迹、和TRAOD算法发现39异常轨迹。其中,11 48轨迹异常发现的我们的方法是一样的11 TRAOD 39轨迹异常发现的,其中4属于空间异常和7属于颞异常。iBOAT和TRAOD有相同的四个空间异常轨迹。所有13个异常轨迹iBOAT发现算法在48轨迹由我们的方法发现的。结果如表所示2。
等得到不同的结果的原因是TRAOD算法的原理不同,我们的算法。TRAOD算法需要轨迹切成段,然后分类轨迹段。然后,TRAOD算法利用垂直距离的加权和,并行距离和角距离来计算轨道区段之间的距离。这使得算法对参数非常敏感,不同参数的结果将会截然不同。
离群值通过我们的算法主要由车辆的旅行时间的时间窗口,而离群值通过TRAOD算法主要是由轨迹段之间的距离决定。这导致我们的算法更加关注旅游车辆的速度,和TRAOD算法更加注意车道造成的异常变化。
同时,TRAOD算法的一个严重的缺点是,它需要很长时间来调整参数,需要不同的参数对不同的数据。在我们的三个数据集,我们使用三组不同的参数来判断的轨迹异常TRAOD算法。这可以突出我们的优势方法对TRAOD算法在实际使用。
6。讨论
在本节中,我们将讨论算法的调整机制的作用。然后,一个例子用来解释方程(1)提高空间异常检测的结果。
6.1。整体调整机制的讨论
调整机制的整体讨论,速度比可以解释信息的窗口。如果速度比> 0,旅行时间是不正常的。如果速度比< 0,旅行时间是正常的。速度比越大,时间越严重异常,和速度比越小,时间异常温和。下面的案例需要解释说:当测试轨迹立即变成一个空间异常时间异常,历史轨迹的旅行时间是零,和速度比是无限的。检测,计算速度比时,需要更大的敏感性。因此,历史速度为50 m / s,第一速度比率=(50-250/10)/ 50 = 0.5,和随后的速度比也将大于0.5。
图13是异常的核密度图速度比所有的数据集。绿色,黄色,黑色,蓝色区域是第75分位数的核密度图4一个窗口,窗口的第90分位数4,第75分位数的一个窗口,窗口和第90分位数为8,分别。第一行是没有调整机制的核密度图,第二行是核密度图与调整机制。
注意,不同颜色的区域在第一行比同行更不同的第二行。这表明调整机制使得异常速度比率在不同的情况下更为合理。调整后的结果更倾向于集中在较小的地区速度比率,和更大的区域相应减少,调整的合理性的体现。
6.2。改进的空间异常分析
法官是否测试轨迹的算法通过计算空间异常值的支持。然而,仅仅使用支持的值导致错误由于网格。图14显示的结果和改进的问题。左边的图的不同颜色代表不同的价值观的支持。红色代表值更大的支持,和蓝色代表值较小的支持。在绿色的盒子,当网格大小为250×250米,一个正常的空间点可以判断为异常点。部分4方程(1)可以用来解决这个问题。正确的使用这个公式时,图中显示的结果是10分钟,是3分钟。正确的图反映了修正计算结果很好。蓝色表示异常低,红色代表高异常。
7所示。结论
以轨迹安全为研究背景,本文提供了一种有效的探测异常轨迹的实时风险监控计划物流车辆。主要的思想是将时空异常检测用的时间概率分布的历史轨迹和以固定位置窗口为检测片段。
结果表明,该算法可以达到更高的精度,和风险检测达到82.5%的基准数据集上,优于传统的iBOAT算法(60%)。同时,iBOAT的假阳性率(玻璃钢)是0.031,0.044和玻璃钢的方法。比较这两种方法的玻璃钢值,较高的玻璃钢价值我们的方法是由补充时间引起的异常检测。然而,我们成功地发现,22.5%比iBOAT算法通过调整机制异常在时间异常,所以时间异常的分布结果计算了我们的方法是更可行的解释部分6.1。相当可以接受的玻璃钢只增长了0.013 22.5%的异常正确检测到。因此,结果证明,我们的算法可以有效地检测出异常轨迹的城市货运车辆实时不仅精度高,而且较低的误警率。这可能提供更有效,更快,更安全的物流快递服务解决意想不到的轨迹异常事件。
目前的研究仍存在一些不足。例如,当历史轨迹数据集很大,历史数据的实时查询,将花费大量的计算,和概率模型将有助于解决这个问题。进一步的研究可以为不同的数据建立概率模型和神经网络来提高的速度发现从不同的开始点和结束点。
一般来说,(1)我们使用的框架可以合理,广泛应用于城市货运车辆安全服务的场景。(2)时间异常,我们提出一个简单,快速,高效的实时时间异常发现的方法。(3)该方法为进一步的研究提供了思路。
数据可用性
轨迹数据用于支持本研究的发现可能会发布在应用北京交通大学和合作的物流公司,可以联系谁(电子邮件保护)。
的利益冲突
作者宣称没有利益冲突。
确认
本文研究报告支持由中国国家自然科学基金(批准号中国91746201)和国家重点研发项目(2018 yfb1601600)。