研究文章|开放获取
杰黄Fengwei朱、黄Zejun剑湾Yongjian任, ”研究实时异常检测的渔船海洋边缘的计算环境”,移动信息系统, 卷。2021年, 文章的ID5598988, 15 页面, 2021年。 https://doi.org/10.1155/2021/5598988
研究实时异常检测的渔船海洋边缘的计算环境
文摘
渔船监控系统(vms)发挥重要作用在确保渔船的安全操作。传统的vm使用云集中式计算模型,存储,处理和可视化的所有渔船数据监控中心完成。由于海上通信的限制,由渔船不能充分利用,生成的数据和通信延迟导致警告不足情况下的渔船异常。在本文中,我们提出一个实时异常检测模型(RADM)基于边缘计算渔船。模型运行在边缘层,充分利用附近移动节点和边缘节点的信息,并结合历史轨迹提取检测模型与一个在线异常检测模型来检测异常。历史轨迹的检测模型提取矿山频繁模式在历史轨迹multifeature集群和识别不同于频繁轨迹模式作为异常。网络异常检测算法检测异常行为在特定情况下基于时空邻域相似性和减少异常演化的影响。实验表明,RADM比传统方法更有效的实时异常检测的渔船,它提供了一种新方法的技术改造传统的vm。
1。介绍
目前,渔船监控系统(vms)广泛应用于渔船安全管理。在vm,每个渔船的位置和状态信息被收集和记录的船载传感器在一定的时间间隔,然后传回监控中心,从而将形成一系列时空数据点轨迹数据集。轨迹数据集的核心数据vm和有非常重要的应用前景。例如,在航行的过程中,渔船可能面临不可预知的和/或异常条件。在设备故障的情况下(雷达、定位装置等),坏天气(台风,等等),甚至恐怖事件(如被海盗劫持),监控中心可以及时识别异常条件使用轨迹数据,然后提取必要的信息来采取措施,维护和保证渔船的安全。
近年来,许多新技术被应用于虚拟机,包括大数据轨迹计算和可视化1- - - - - -3),虚拟机数据挖掘(4- - - - - -6),机器学习(7- - - - - -9),和海洋物联网(10- - - - - -13]。然而,有以下缺点的异常检测海洋渔船通过监控中心使用传播轨迹数据:(1)传统虚拟机使用一个集中的云计算模型,存储,处理和可视化的所有渔船数据监控中心完成。虚拟机监控中心和之间的交互通过海洋渔船进行通信,但海洋通信的带宽远远落后,土地沟通,影响异常检测的实时性和准确性。(2)传统的血管异常检测方法提取频繁模式通过空间位置轨迹,序列的特性,和异常行为,他们根据这些频繁模式检测异常。他们需要大量的数据从所有船只。当历史轨迹数据集很小或轨迹数据在某些领域是稀疏,很难满足检测精度的要求,因此它不适合计算模型。
为了解决上述问题,在本文中,我们提出一个基于优势的实时异常检测模型计算框架。首先,渔船异常检测根据渔船的行为特征。异常主要分为空间位置异常和异常行为模式。其次,渔船的频繁模式通过multifeature集群、提取和轨迹,偏离了频繁的集群被认为是异常。当忽略轨迹流数据的时变演化特征,使用足够数量的全球特性模型构建历史轨迹异常检测精度高。然而,当考虑到正常的轨迹模式基于历史轨迹训练集作为参考标准,新的异常模式和异常行为在特定场景中可能存在的最新的轨迹流数据不能准确检测。因此,在本文中,我们使用边缘节点之间的通讯功能获取其他节点的轨迹数据实时的邻近海域,然后是时空的最近邻相似相结合来检测网络异常的轨迹数据集收集。最后,加权计算检测结果确定是否存在异常。即建立高精度和低延迟异常检测模型的边缘层边缘节点之间通过合作,结合在线异常检测算法和历史轨迹提取算法。最后,实验验证该模型的可行性。
通过本文,我们的目标是,让下面的贡献的艺术:(1)设计一种新型实时异常检测模型(RADM)渔船基于优势计算框架来改善传统虚拟机的实时性能和准确性。(2)提出一个渔船轨迹基于multifeature聚类的异常检测算法(VAD-MFC),不仅可以结合历史全球轨迹特性模型也更新模型逐步在边缘层。(3)提出船舶异常检测算法基于时空邻居相似(VAD-SNS),这不仅可以识别现有模式还检测新模式和异常行为在一个特定的场景。这个模型适用于运行在边缘节点。
2。相关工作
海上异常检测最近已获得了高度的关注,基于轨迹的前提,如果没有出现频繁或任何集群,那么它可能是不正常的。轨迹异常的影响因素不仅反映在异常位置还隐藏在动作的顺序(14,15]。在这种背景下,我们认为一艘渔船的行为是不正常的,如果是不同于大多数渔船在同一海域。
一般来说,有三种类型的异常、空间位置异常,序列异常,和行为异常15]。空间位置异常是指基于船人口密度异常,也就是说,当船位于低密度区域,这被认为是一个异常。异常状况的原因可能是该船已经进入了一个禁止区域或不是在指定的区域移动。一个序列异常基于序贯模式指的是一个例外。异常行为意味着这艘船的行为模式不同于其最近的邻居的轨迹对一些特征比如方向,速度,等等。有许多原因异常行为;例如,一些船只进入港口后可能不会减缓提高效率。
目前,有很多研究轨迹异常检测(16]。根据所使用的检测机制,方法可分为四类:基于分类,基于距离,历史轨迹相似性,和基于网格的。
轨迹异常检测方法基于分类主要分为两个阶段:训练阶段和检测阶段。李等人。17)提出了一个基于异常之间的相关性的异常检测算法模式和时空属性。该算法使用k——集群subtrajectory-related属性的主题,构建一个基于规则的分类器。轨迹异常检测方法基于分类可以实现高精度时提供一个精确的训练集(18]。除此之外,许多异常行为是未知的和随时间变化,因此研究在线异常轨迹检测提出了(19,20.]。然而,它是昂贵的为实际应用获得准确的标签数据。
基于距离的异常检测方法旨在检测偏差的轨迹数据集通过距离模型。克诺尔et al。21)首次提出的算法来识别异常轨迹通过全球等特征轨迹,速度,方向,和距离。然而,该方法用于检测异常的完整轨迹,所以它只适用于检测异常行为的位置和行为特征是完全不同于其他的轨迹。李等人。22)提出了一个两阶段的异常检测算法基于分割检测框架。Yu et al。23)提出了一个策略基于时空最近邻相似。王等人。24]提出difference-and-intersection设置距离度量评估任何两个轨迹之间的相似性。这些异常检测方法遭受高复杂度和检测精度差。基于距离的异常检测方法通常只关注异常行为对位置但忽略异常轨迹偏离其行为特征在空间和时间最近的邻居。因此,这些方法很难使用实时轨迹异常检测。
异常检测方法基于历史轨迹相似性制定一个全球性的特征模型,从大规模的历史轨迹数据,然后提取频繁模式识别轨迹偏离模型异常。刘等人。25]提出了确定时空异常值的异常检测算法,可以及时发现异常值之间的因果关系。荣et al。26)提出了一种数据挖掘方法的概率描述海上交通和异常检测。Belhadi et al。27)提出了一个深刻的学习算法,学习历史数据的不同特性来确定组轨迹离群值。雷(15)构建一个异常检测框架基于轨迹的空间和行为特征数据。在这个类的方法,异常检测的准确性影响的历史轨迹。当历史数据集很小或跟踪数据在某些领域是稀疏的,检测的效果实际应用的精度是不够的。
轨迹异常检测方法基于网格分区指定的区域划分为网格细胞的大小来检测异常行为,交通领域的广泛应用。彭日成et al。28)提出了一种基于似然比检验统计模式识别方法,它可以检测“持久”和“新”有效轨迹数据中的异常值。统一的网格被用来代表出租车的轨迹空间和检测异常行为实时(29日,30.]。基于网格的异常检测方法的检测精度差的轨迹与非正态的分布。除此之外,这些算法只适合使用地理空间信息异常检测。
然而,上面的方法都是基于传统的中央计算架构,和他们不是边缘节点的优化,所以他们很难在边缘计算场景中直接应用。此外,在海洋渔船管理领域,只有少数研究人员研究了边缘vm的计算模型,建立了边缘计算框架(31日,32),但没有轨迹异常检测研究在此基础上。在本文中,我们提出一个实时异常检测模型基于边缘计算渔船,和我们的模型实验验证比传统方法更有效。
3所示。研究区域
本研究的范围是东经120年和130年之间的海域和北纬25 - 35,舟山附近,浙江省,中国。钓鱼vm的轨迹数据集用于实验如图1。系统使用北斗卫星导航和通信技术实现实时监控渔船的地位。其功能包括查询,船航行统计,轨迹审查,报警和救援,等等。2016年5月22日,11月8日,2018年,220艘船跟踪和记录。
自渔船的异常状态密切相关的序列轨迹,在这项研究中,我们只关注相邻轨迹段的检测在某一时刻一个渔船的异常状态轨迹检测。给定一个渔船轨迹段 ,表示为 ,我们定义一个轨迹的空间和行为异常。
一个空间异常认为相邻轨迹段之间的相关性。当前轨迹段和其他部分之间的距离计算使用轨迹距离度量,然后当前轨迹段的比例计算相邻轨迹段使用相邻轨迹距离阈值。如果异常比例小于阈值,那么当前轨迹段可以认定为一个空间异常。
一个行为渔船是一种异常的异常血管的多维轨迹特性,如瞬时角加速度、角加速度,平均瞬时速度、平均速度和加速度。每个组件接收一个轨迹异常通过计算异常轨迹的比例分总轨迹点的轨迹段。然后,组件的异常分数集成得到最终的行为异常分数。如果分数超过一个预定义的异常的阈值,那么当前轨迹被确定为一个行为异常。
上述轨迹异常定义主要是为了确定海上渔船的异常行为。渔船在海上的航行行为非常不同于普通货物和乘客的血管。后者决定出发前发射和目的港信息。航行的路线航行按照建立贸易路线。基于这个前提,尽管在海上没有物理限制城市道路网络流量的情况下,一个正常的船不太远从这些既定的路线。当工作人员发现船已经偏离了路线,他们正确的船的相应课程。因此,因为他们需要遵循确定航线网络,货运和客运船舶在海上航行时就像陆地车辆。异常检测等血管可以依赖于路由信息,异常的定义和异常检测是相对简单的。与其他船只,渔船没有定义目标区域在海上的时候,他们也不遵循一个特定的路线,所以他们在导航中表现出很大的随机性。渔船的航行行为主要分为两种类型,即航行和捕鱼。 Therefore, in this paper we make special distinctions for behavioral anomalies, as defined above. Thus, the aspects of position and behavior are considered to obtain the degree of anomaly suspicion of the fishing vessel’s current state, while fishing vessel behavioral anomaly detection specifically is further classified according to whether it pertains to fishing or sailing.
4所示。方法
4.1。使用边缘计算框架的实时轨迹异常检测
的three-module RADM框架如图2,由历史轨迹建模、异常评价和边缘计算应用程序。
历史轨迹建模提取正常和异常行为的特点差异,然后集群的历史轨迹找到频繁模式,被认为是正常的行为。异常评价模块首先识别不同于轨迹模式作为异常频繁,而实时轨迹是集群逐步优化全局特性模型。同时,输入轨迹数据从附近的渔船是用来检测新的异常模式和反常行为在一个特定的场景。最后,RADM使用组合算法来计算综合异常指数。边缘计算模块接收的输出RADM和它适用于各种应用程序,如渔船的安全保护和导航。
4.2。渔船轨迹基于Multifeature聚类的异常检测
首先,全球功能模型是制定基于历史轨迹数据集。监督和非监督学习算法是两个常用的建模方法。渔船的轨迹研究包括两个部分:(1)与少量的无标号数据异常轨迹和许多正常的轨迹和(2)一个小数量的标签异常轨迹。因此,它更适合使用非监督学习算法。本研究是基于计算框架的优势,也就是说,一个框架,需要实时异常检测的渔船在边缘层(33,34]。轨迹数据的持续流入,同样的轨迹可能对频繁模式在不同的时间,因为全球变化实时特性模型。因此,有必要逐步更新模型,识别异常。
解决上述问题,在本文中,我们提出一个容器基于multifeature聚类的异常检测算法(VAD-MFC)。该算法提取的特征量明显的正常和异常行为之间的差异和集群的历史轨迹根据这些特征量找到正常行为的轨迹特征。然后,收集的轨迹之间的最小距离的边缘节点计算当期和正常行为模式,这被认为是当前轨迹的异常值。最后,集群实时轨迹逐步找到新的轨迹特征和优化全局特性模型。应该注意的是,VAD-MFC算法是基于两个前提:(1)正常轨迹的数量远远大于异常轨迹和(2)之间有明显的差异渔船的正常和异常行为。
4.2.1。准备频繁的面积公式
传统的基于网格的聚类方法将监测海域划分为网格的大小,然后计算每个网格的轨迹点密度(35,36]。如果是大于一个预定义的阈值,那么该地区电网的位置被标记为一个频繁的区域。然而,上面的方法确定网格密度通过计算网格中的轨迹点的数量,因此频繁地区的结果可能会丢失当物体移动得太快或采样间隔太大。这是显示在图3(37,38]。为了避免这种缺失的数据问题,在本文中网格密度的定义是通过使用轨迹段的数量方法在之前的研究中(15]。每个轨迹段代表了线段由相邻轨迹点 。
4.2.2。Subtrajectory部门
怀疑的渔船的轨迹偏差测量通过轨迹和历史路线之间的区别。因此,在异常检测之前,历史轨迹需要集群获得历史轨迹模式。然而,由于本文获得的轨迹是一个完整的轨迹与多个阶段,没有标记,有必要把它划分为subtrajectories建模之前,确保只有一个行为是分配给每个subtrajectory。如果历史轨迹包含subtrajectories导航阶段 ,钓鱼期subtrajectories ,subtrajectories和锚定阶段 ,然后太阳轨迹划分的结果可以表示如下:
在这项研究中,轨迹点的时空距离模型和density-based空间聚类的应用程序与噪声(DBSCAN)聚类算法用于渔船的轨迹进行分类。分类的基础是渔船的行为在时间和局部空间是连续的。算法首先定义了一个基于特征的时空距离模型的渔船的行为,然后DBSCAN聚类是根据模型应用于轨迹点形成subtrajectory段。轨迹点和 ,时空的距离定义如下:
(我)的时间距离。轨迹的时间点的距离反映了他们的时间相关。因为渔船行为持续的时间,时间间隔越小,大的概率相同的行为。距离的定义和及时给出以下方程:
(2)空间距离。轨迹点的地理距离反映了他们的空间相关性。由于渔船的行为空间本地化,即轨迹落在同一地区,然后轨迹的概率相同行为的结果是更大的。空间距离的定义和给出了以下方程:
(3)速度距离。因为在导航渔船的速度是不同的,钓鱼,和锚定,速度差异越大,越小概率对应的行为是一样的。之间的距离的定义和对速度以下方程:
(iv)方向的距离。由于行为在时间上的连续性,距离的方向 被定义为给定的方向变化的次数间隔。
将渔船的轨迹时,应考虑上面定义的四个距离。轨迹之间的距离和被定义为
4.2.3。轨迹时空距离模型
渔船是连续的异常行为,这是由多个异常轨迹点的轨迹数据。因此,我们不应该只考虑轨道的属性点自己也注意相邻轨迹点之间的差异。本文描述了如何提取多个轨迹的特征值;在此基础上,定义轨迹之间的时空距离模型。
当一个渔船的行为是不正常的,它的速度和方向会发生戏剧性的变化。渔船的方向也在钓鱼阶段不稳定。因此,减少捕捞阶段对异常检测的影响,在本研究中我们使用的平均加速度,平均角加速度和平均速度的三个特征的行为。在空间位置、渔船等位置因违法行为可能出现入侵的禁区,因此本文选择频率。总之,异常指数的轨迹 在四种方法中定义如下:
(我)的频率。的频率轨迹显示区域的密度通过当前轨迹。频率越低,表明一个不活跃的捕鱼区,和异常的概率更大;相反,假定异常的概率相对较小。具体定义中给出了方程(7)。在这里,表明轨迹在频繁的区域,1对应于频繁的地区,和0,表明它是远离经常面积:
(2)速度。速度可以用来区分渔船的行为,和它在集群正常行为起着重要的作用。因为瞬时速度是随机的,它不能反映当前的总体状态轨迹,因此,选择平均速度作为特征值,如下:
(3)加速。加速度反映了渔船的稳定性。加速度越大,越不稳定的渔船的行为和异常的概率就越大。摘要平均加速度作为渔船数量、特征如下:
(iv)角加速度。角加速度反映的变化方向。与上面类似,角加速度均值作为特征量的渔船,按照以下方程:
摘要渔船的异常指数评估通过计算当前轨迹之间的区别和正常的轨迹模式。因此,一个模型需要定义轨迹之间的时空距离。因为不同的特征值的不同的数据大小会影响距离的计算,数据需要先规范化,如方程所示(12)。时空距离的轨迹和然后计算,见方程(13)和(14):
4.2.4。异常检测过程
当移动到边缘层实时异常检测的渔船,轨迹数据继续在“轨迹流流。“提高异常检测的性能,用于表示一个基本时间单位,因为信息包含在单独的轨迹点不足。一个包含不止一个轨迹点。在这项研究中,异常检测进行的轨迹数据在当前 。比较之间的差异和正常的轨迹模式在当前收集 ,差越高,渔船的行为异常的概率就越大。因此,在异常检测之前,需要通过正常行为模式的历史轨迹建模、轨迹异常检测的基础。
(我)建模历史轨迹。历史轨迹集群基于选定的特征值在建模阶段发现隐藏在轨迹数据集的频繁模式,详细的算法1。
|
VAD-MFC历史轨迹建模分为四个主要步骤如下:
首先,确定频繁的地区。本研究认为轨迹的空间位置特征,也就是说,他们是否发生频繁的地区。因此,在这一步算法构造频繁地区主要从历史轨迹,这样有利于频率的提取。其次,划分成Subtrajectories。这个阶段主要组连续轨迹点相同的行为,确保每个subtrajectory只包含一个行为来优化聚类的效果。这一阶段主要使用部分中提到的方法4所示。2,即集群轨迹点基于预定义的时空距离模型。这是DBSCAN使用的聚类算法。第三,提取Subtrajectory特性。subtrajectories划分后,空间位置(频率)和行为(平均速度、平均加速度和平均角加速度)所有subtrajectories提取的特征。最后,构建一个正常的轨迹模型。在这个阶段,subtrajectories集群基于轨迹之间的时空距离模型,和轨迹的频繁模式,也就是说,正常的轨迹模式,提取。因为DBSCAN能迅速有效处理噪声点和集群,它再次用于集群的历史轨迹在这个阶段。
(2)轨迹异常检测。异常指数轨迹数据TR收集的电流计算基于预先构建的正常轨迹模型 。如果大于阈值异常 ,那么当前渔船的行为被认为是不正常的。给出了算法的详细步骤2。
|
使用VAD-MFC轨迹异常检测主要是分为四个主要步骤,如下:
首先,提取电流轨迹的特点 。特征提取包括平均速度 ,平均加速度 ,平均角加速度 ,和频率 。其次,动态更新正常轨迹模型。逐步增量DBSCAN算法用于集群轨迹流数据收集在当前 ,以更新全球动态特性模型,提高异常检测的准确性。第三,计算之间的距离和所有的正常轨迹模式。计算方法给出了方程(13)和(14)。最后,获得最低的区别和正常的轨迹模式,异常指数 。
4.3。船的轨迹异常检测基于时空邻居相似
异常检测方法基于multifeature集群使用正常的历史轨迹模式作为参考标准。他们可以检测现有模式更好,但很难检测到新的异常和异常行为模式在一个特定的场景。要解决这些问题,我们提出VAD-SNS。
VAD-SNS算法是基于渔船行为的相似性在一定时空范围内(例如,返回的渔船在风暴),因此,如果有船轨迹之间的显著差异在一个区域和船的轨迹在邻近区域,被认为是不正常的行为。下面详细描述了如何在渔船检测异常行为在线使用时空近邻相似。
本研究建立在一个框架边缘计算从先前的研究32),渔船实时收集定位信息通过车载导航终端设备。定位信息收集在当前 正式,它可以表示为一系列的轨迹点按时间顺序,也就是说, ,在哪里在时间戳的渔船吗的位置坐标和 。同时,附近的渔船将位置信息发送给节点通过计算边缘节点,这样可以获得每个边缘节点邻居轨迹 ,在哪里表示在当前位置信息收集的节点 。
因为只有在邻近海域渔船的位置信息可以收到被动地通过自动识别系统(AIS),可能会有丢失的数据轨迹。为了提高轨迹异常检测的准确性,渔船的异常行为可以通过综合评估所有轨迹段的异常程度 。即每个轨迹段的段组相邻轨迹得到基于轨迹之间的距离模型,然后当前轨迹段的异常程度评估是基于行为的区别特征在当地社区。最后,当前的异常指数轨迹是通过结合所有的轨迹段的异常程度。
4.3.1。邻居轨迹分割
VAD-SNS算法首先需要时空邻居轨迹段设置。时空的本地邻居包括暂时当地邻居和空间邻居因为每个轨迹点收集当前和所有的轨迹段属于时间的邻居。对于任何轨迹段 ,空间的邻居表示的分段轨迹间距不大于给定的阈值 ,作为
在这里, 代表轨迹段之间的空间距离和 。摘要Hausdroff距离(39使用),见以下方程:
4.3.2。当地异常评价
当地的离群值因子(LOF)是一个density-based异常检测机制(40]。它被广泛用于检测附近异常数据,因为它认为数据样本的密度相对于他们的空间邻居和不需要先验知识的数据分布。基于LOF,在这种方法中,我们使用当地的密度差(LDD)来评估当前轨迹段行为差异的程度和它的邻居轨迹段集 ,作为
在这里,表示轨迹段中包含的数量和 表示程度的行为轨迹段和之间的区别 。在本文中,我们主要考虑方向和速度的特点,
渔船航行时,常常发现有显著差异的行为所有相邻海域的渔船。在这个时候,它会认为包含了一个例外,不符合事实。它只能被视为一种异常如果在附近其他渔船的行为是相似的,当前的渔船之间的显著差异。因此,基于LOF,当地异常因素(LAF)是用来评估每个轨迹段的异常程度在其附近(41]。LAF较大值对应于更大的轨迹段的异常的可能性
LAF的描述轨迹段的异常程度在当地社区,虽然收集在当前包含多个轨迹段。因此,异常的轨迹可以被定义为
鉴于时变的进化轨迹流数据,相同的渔船的行为特征可能在当前异常但在未来变得正常 。因此,我们不仅要关注laf的电流但也考虑的影响历史laf的渔船。滑动窗口模型广泛应用于实时数据流,因为他们可以处理持续流数据有效地消除过时的和无效的数据。在本文中,我们使用一个基于时间衰减的滑动窗口模型(42确保数据新鲜度。
基于时间衰减的滑动窗口模型如图4。滑动窗口的大小是一个新的n .每次数据处理,滑动窗口移动向右移动,从而消除LAF的最远的 。时间衰减函数减少历史laf的影响。渔船,LAF的历史前获得的乘以一个衰减时间函数,然后laf由当前累计获得在线异常指数吗的渔船。正向衰减时间函数的值是当前之间的距离和最左边的滑动窗口的定义在以下方程:
在这里,是当前 , 是最左边的滑动窗口的是一个单调nondecaying时间函数。
VAD-SNS算法给出了算法3。
|
4.4。实时异常检测
RADM设置在边缘层提高异常检测的实时性和准确性,如图4。它可以检测出电流在实时轨迹数据。如果检测到异常行为,那么它将警报并将结果发送到监控中心。
RADM使用在线异常检测算法和历史轨迹提取算法。首先,正常模式隐藏在历史轨迹设置提取基于multifeature集群、和距离正常模式被认为是历史上的异常指数 。然后,结合社区移动节点的动态信息,在线异常指数获得基于时空邻域相似性。最后,综合异常指数通过结合加权两种异常检测算法:
在这里,代表在线异常指数和的重量代表了历史的重量异常指数。主要因为移动边缘节点接收船通过AIS数据从附近的海域,当一个渔船前往稀疏的地区,太少的轨迹可能收到的数据,这将影响的准确性索引。此时,价值可以适当减少,主要通过历史轨迹提取轨迹异常检测。相反,可以增加价值。
5。结果与讨论
5.1。实验装置
研究海域划分为0.01°(纬度)×0.01°(经度)电网1000×1000的方格。我们边计算节点安装在船只使用舟山渔业vm (32]。使用渔船轨迹数据收集使用舟山渔业vm从2016年5月到2018年11月,频繁的地区。网格与轨迹密度大于100被标记为频繁的地区,和轨迹点之间的采样间隔30秒。结果如图所示5,黑色代表频繁的地区和白色代表罕见的地区。实验运行在Windows 10系统为4.8 GHz的英特尔酷睿i7处理器和32 GB的RAM。
核实RADM的有效性,我们进行了比较实验使用VAD-MFC VAD-MFC, RADM选定数据集组成的50个正常轨迹和八个异常轨迹。我们使用上面提到的异常指数和常用的接受者操作特征(ROC)曲线异常检测的评价标准。
模拟计算环境更好,我们插入真正的轨迹数据。插值后的取样间隔2秒,以下六个可能的异常被随机补充道:稳定的方向和大的波动速度,稳定的速度和大的波动方向,大的波动速度和方向,速度大于15节,避免频繁的地区,和异常行为在一个特定的环境(例如,快速运输通过港口地区)。
插入数据如图6。
在实际环境中,正常轨迹的数量远远大于正常轨迹的数量。因此,基于数据集的统计数据,比正常与异常轨迹的实验设置是42195:1005。边缘节点播放显示动态数据更新时间(如表所示1)和AIS设备的通信距离。为了简化计算模型,实验的通信距离设置为5海里;即每个边缘节点可以接收AIS信息从任何地方在周围5海里。最后,异常检测接收到的轨迹流数据上执行。
|
||||||||||||||||||||||
5.2。实验结果
为了确保每个subtrajectory只包含独立的行为特征,以构建一个正常的轨迹模型,VAD-MFC第一分区根据时空轨迹距离模型,然后提取subtrajectories和集群的行为特征。subtrajectories由于时间跨度大,后者被分成五分钟间隔轨迹段产生更好的聚类效果。轨迹段被集群。聚类结果如图7,那里的x设在代表速度的变化y设在代表的变化方向,z设在代表了平均速度。如图表所示,对应的轨迹段被分成三类三渔船的正常行为(绿色为导航,橙色系泊,钓鱼和蓝色)。每个类的集群质心代表当前行为的频繁模式的特点。
图8比较正常和异常的频率轨迹。正常和异常轨迹大多位于频繁的地区,但也有低频率(如6号异常轨迹)。因为在这个实验不正常轨迹的数目明显小,异常行为特征稀疏,渔船远离频繁的地区可能会表现出异常行为。频率作为轨迹的空间位置特征在接下来的实验;,渔船,远离频繁的地区可能被认定为异常。
数据9和10显示的异常检测结果VAD-MFC RADM,分别。横坐标代表不同的轨迹序列,纵坐标代表电流的异常指数轨迹。如图所示,VAD-MFC不能检测单个异常轨迹,和比VAD-MFC RADM的检测效果。
(一)
(b)
(一)
(b)
评估的有效性RADM在边缘计算框架32),在本节中,我们比较了异常检测的准确性VAD-MFC, VAD-SNS, RADM。与其他异常检测指标相比,中华民国曲线有更大的公差正负样本的不平衡,因此我们使用ROC曲线作为异常检测的评价标准(44]。
图11显示了VAD-MFC和VAD-SNS ROC曲线。VAD-MFC和VAD-SNS有某种异常检测的准确性,在area-under-curve VAD-MFC (AUC)值达到0.79,VAD-SNS的AUC值达到了0.8,远高于0.5通过随机分类。假阳性的VAD-MFC 0时,真正的积极率接近0.6;因此,VAD-MFC比VAD-SNS场景的正常运行没有假警报。等于错误率点的横坐标VAD-SNS算法小于VAD-MFC,因此VAD-SNS比VAD-MFC当检测正常和异常样本的概率是相等的。
RADM结合VAD-SNS和VAD-MFC的优点。结果规范化和加权图12显示的准确性RADM异常检测在不同体重指数,横坐标代表VAD-SNS的重量,纵坐标代表RADM的AUC值在当前的体重。的AUC值RADM VAD-SNS算法体重的增加而增加,然后逐渐下降。AUC值达到最大时,体重指数为0.29。
数据13和14显示RADM异常检测结果加权指数为0.29。图13显示异常的分布指数的红”X”代表的异常指数异常轨迹,蓝色的点代表异常指数正常的轨迹。虽然异常指数正常的轨迹是偶尔大,异常轨迹的异常指数普遍高于正常,和整体检测效果更好。
图14显示了一个VAD-MFC ROC曲线的比较,VAD-SNS, RADM。蓝色曲线RADM加权指数为0.29,其AUC值为0.92,远高于VAD-SNS VAD-MFC 0.79和0.8。此外,平等错误率点的横坐标的模型也小于VAD-MFC VAD-SNS。因此,RADM异常检测精度较高。
6。结论
在这项研究中,我们设计并实现了一个实时异常检测模型基于优势的渔船轨迹计算范例。首先,轨迹基于multifeature聚类的异常检测算法的设计是根据渔船的行为特征。然后,针对问题,该算法不能有效地检测新模式可能存在的异常轨迹流数据和其脆弱的实时性能,提出了RADM通过引入计算框架的优势,结合它与时空的近邻相似。最后,在对真实数据集进行了实验。实验结果表明,RADM在检测异常检测精度高的连续轨迹流。RADM可以提供一个轨迹异常检测服务的边缘层不与地面监控中心;因此,它可以提高轨迹的实时性能异常检测没有海洋通信的限制。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突。
确认
这部分工作是由中国国家自然科学基金(没有。61972358)和浙江省重点研发项目(没有。2017 c03024)。
引用
- 傅x, z肖l . Zhang et al .,“大数据驱动的船轨迹和导航状态预测自适应学习,运动建模和粒子滤波技术,”IEEE智能交通系统9卷,页1 - 14,2020。视图:出版商的网站|谷歌学术搜索
- 张黄y, y, z, r·w·刘”GPU-accelerated压缩和可视化大规模船的轨迹在海上物联网行业,“IEEE物联网,7卷,不。11日,第10812 - 10794页,2020年。视图:出版商的网站|谷歌学术搜索
- m . i Marzuki·加斯帕r . Garello诉Kerbaol和r . Fablet”从vessel-monitoring-system-based渔船渔具识别轨迹。”IEEE海洋工程》杂志上,43卷,不。3、689 - 699年,2018页。视图:出版商的网站|谷歌学术搜索
- 吴黄h . f .香港z, et al .,“FVRD:渔船关系通过vm的跟踪分析,发现”海洋学报2018 - MTS / IEEE科比Techno-Oceans (OTO),页1 - 4,神户,日本,2018年5月。视图:谷歌学术搜索
- Sunarmo、a . Affandi和s . Sumpeno”聚类空间时间分布的渔船朗vm数据使用k - means, "学报》2020年第3信息和通信技术国际会议(ICOIACT),页1 - 6,日惹,印尼,2020年11月。视图:谷歌学术搜索
- 香港,y, y宗庆后et al .,“捕鱼区分离和关系通过vm的跟踪分析,发现”海洋学报》2017英国阿伯丁,页1 - 6,2017年6月。视图:谷歌学术搜索
- m . Terayama c Nishizaki t .冈崎,“基本的交通预测研究在东京湾使用机器学习”学报2020年第59届年会上日本仪表和控制工程师学会(马夫),页536 - 541,清迈,泰国,2020年9月。视图:谷歌学术搜索
- x Liu w . j .谢,他和x楚,“预测船舶使用机器学习的轨迹,”学报2020年第五届国际会议上控制、机器人和控制论(CRC)武汉,页66 - 70年,中国,2020年10月。视图:谷歌学术搜索
- h . Susanto g中,“海洋船舶遥测数据处理使用机器学习,”学报2019年6日电气工程国际会议,页128 - 135,计算机科学和信息学(EECSI),伊斯坦布尔,土耳其,2019年9月。视图:谷歌学术搜索
- z, f·杨,李z, k . Liu和n .熊”挖掘通道从IoT-based大水深信息自动识别系统数据安全的航道导航”IEEE访问》第六卷,第75608 - 75598页,2018年。视图:出版商的网站|谷歌学术搜索
- m . s .米拉和s . n . Rao”比较分析物联网协议对于海洋物联网系统,”学报2018年国际会议上的进步计算、通信和信息(ICACCI),页2049 - 2053,班加罗尔,印度,2018年9月。视图:谷歌学术搜索
- j . r . w . Liu聂s Garg z, y,和m . s .侯赛因,“数据驱动的轨道质量改进促进智能6 g海上船舶交通服务物联网系统中,“IEEE物联网,8卷,不。7,5374 - 5385年,2021页。视图:出版商的网站|谷歌学术搜索
- f p . Lousa Moreira l . m .对峙”Micro-VMS:手工渔船的vm移动单位,”学报》2018年16日国际会议上智能交通系统电信(ITST),页1 - 7,西安,中国,2018年10月。视图:谷歌学术搜索
- c . Iphar c射线,a .那不勒斯“海上异常检测数据完整性评估,”专家系统与应用程序文章ID 113219卷,147年,2020年。视图:出版商的网站|谷歌学术搜索
- P.-R。Lei,“一个框架,用于异常检测在海上轨迹行为,”知识和信息系统卷,47号1,第214 - 189页,2016。视图:出版商的网站|谷歌学术搜索
- m·古普塔j .高c . c . Aggarwal和j .汉”时态数据异常值检测:一项调查,”IEEE工程知识和数据,26卷,不。9日,第2267 - 2250页,2014年。视图:出版商的网站|谷歌学术搜索
- x, j·汉、s . Kim和h·冈萨雷斯,“漫游:规则——在巨大的移动物体和motif-based异常检测的数据集,”数据挖掘学报2007年暹罗国际会议;程序;工业与应用数学学会的284年,页273 -费城,宾夕法尼亚州,美国,2007年10月。视图:谷歌学术搜索
- d . a . Herrero d s Pedroche j·g·埃雷罗,和j·m·m·洛佩兹“AIS轨迹分类基于IMM数据,”学报2019年22日国际会议信息融合(融合)加拿大渥太华,页1 - 8,2019年7月。视图:谷歌学术搜索
- y汉、r .谢霆锋和m·坎贝尔,“使用非参数轨迹聚类行人运动模型和离散过渡点,”IEEE机器人与自动化信件,4卷,不。3、2614 - 2621年,2019页。视图:出版商的网站|谷歌学术搜索
- k . y . Liu赵、g .琮和z包,“在线异常轨迹检测与深度生成序列建模,”学报2020年IEEE第36届国际数据工程会议(ICDE)达拉斯,页949 - 960年,TX,美国,2020年4月。视图:谷歌学术搜索
- e·m·克诺尔·r·t·Ng,诉Tucakov,“基于距离的离群值:算法和应用程序”,VLDB日报国际期刊非常大的数据基础,8卷,不。3 - 4、237 - 253年,2000页。视图:出版商的网站|谷歌学术搜索
- j·李,j·汉,李x“轨迹异常值检测:partition-and-detect框架,”学报2008年IEEE 24日数据工程国际会议149年,页140 - 2008年4月墨西哥坎昆。视图:谷歌学术搜索
- l . y . Yu曹,e·a·Rundensteiner问:王,“大规模轨迹流异常值探测移动物体,”20 ACM SIGKDD国际会议的程序知识发现和数据挖掘,页422 - 431,计算机协会,纽约,纽约,美国,2014年8月。视图:谷歌学术搜索
- j . Wang y元,t .倪et al .,“异常轨迹检测和基于不同分类和交集距离,”IEEE车辆技术,卷69,不。3、2487 - 2500年,2020页。视图:出版商的网站|谷歌学术搜索
- w·刘,y, s·乔j .元,x星,“交通数据流,发现时空因果相互作用”第17届ACM SIGKDD学报》国际会议上知识发现和数据挖掘,页1010 - 1018,计算机协会,纽约,纽约,美国,2011年8月。视图:谷歌学术搜索
- h·荣、a . p .特谢拉和c·古埃德Soares”航运路线描述数据挖掘方法和基于AIS数据异常检测,”海洋工程文章ID 106936卷,198年,2020年。视图:出版商的网站|谷歌学术搜索
- a . Belhadi y Djenouri, d . Djenouri t .旧事,j . C.-W。林,“深度学习与传统解决方案组轨迹异常值,“IEEE控制论26卷,1 - 12,2020页。视图:出版商的网站|谷歌学术搜索
- l . x彭日成s·乔w·刘,和y郑,“发现新出现的异常交通模式使用GPS数据,”数据与知识工程卷,87年,第373 - 357页,2013年。视图:出版商的网站|谷歌学术搜索
- d . c . Chen, p·s·卡斯特罗et al .,“IBOAT: isolation-based在线异常轨迹检测,”IEEE智能交通系统,14卷,不。2、806 - 818年,2013页。视图:出版商的网站|谷歌学术搜索
- n Taniarza和s·阿克巴异常轨迹检测从出租车GPS使用IBAT和DTW痕迹,”学报2017年第六届国际会议在电气工程和信息学(ICEEI),页1 - 5、兰卡威、马来西亚,2017年11月。视图:谷歌学术搜索
- j·c·费雷拉和a·l·马丁斯”边缘计算方法对船舶监控系统,”能量,12卷,不。16,3087年,页2019。视图:出版商的网站|谷歌学术搜索
- f . j .黄j . Wan j . Yu朱,和y任,“边缘computing-based适应轨迹传播政策的海洋渔业船舶监控系统”IEEE访问,8卷,第50695 - 50684页,2020年。视图:出版商的网站|谷歌学术搜索
- h·高、w·黄和y段,“cloud-edge-based动态重新配置的服务工作流为移动电子商务环境,”ACM网上交易技术,21卷,不。1,1,2021页。视图:出版商的网站|谷歌学术搜索
- 曹殷y, z, y, h .高,r·李和z麦”QoS服务推荐特性的预测学习在移动计算环境中,“IEEE认知通信和网络》第六卷,没有。4、1136 - 1145年,2020页。视图:出版商的网站|谷歌学术搜索
- t . p . Lei沈、w·彭和苏,“探索时空轨迹预测模型位置,”学报2011年IEEE国际会议12日在移动数据管理58 - 67页。吕勒奥,瑞典,2011年6月。视图:谷歌学术搜索
- a . y .雪r·张y郑,x谢,j .黄和z,“目的地预测sub-trajectory合成和隐私保护这样的预测”学报2013年IEEE 29日数据工程国际会议(ICDE),页254 - 265,布里斯班,澳大利亚,2013年4月。视图:谷歌学术搜索
- h . Jeung h·t·沈和x周,“挖掘轨迹模式使用隐马尔科夫模型,”《数据仓库和知识发现,即y的歌,j·埃德尔,t·m·阮Eds。,pp. 470–480, Springer, Berlin, Heidelberg, 2007.视图:谷歌学术搜索
- y阴,问:黄、h·高和y,“个性化api推荐与认知知识挖掘工业系统中,“IEEE工业信息,1卷,不。1,2020。视图:出版商的网站|谷歌学术搜索
- a . v . Arutyunov s a . Vartapetov s e .转场,”豪斯多夫距离的一些性质和应用。”优化理论与应用》杂志上,卷171,不。2、527 - 535年,2016页。视图:出版商的网站|谷歌学术搜索
- b, c .周旷w、l .郭和x或者“高光谱图像噪音标签检测的光谱角局部离群值的因素,”IEEE地球科学和遥感信,15卷,不。9日,第1421 - 1417页,2018年。视图:出版商的网站|谷歌学术搜索
- c . j .毛t . Wang Jin, a .周”功能grouping-based异常值检测流轨迹,“IEEE工程知识和数据卷,29号12日,第2709 - 2696页,2017年。视图:出版商的网站|谷歌学术搜索
- g . Cormode诉Shkapenyuk、d·斯利瓦斯塔瓦和徐,”前锋衰减:流媒体系统的实际时间衰减模型,”学报2009年IEEE 25日数据工程国际会议,第149 - 138页,上海,中国,2009年3月。视图:谷歌学术搜索
- Dahana和r . o . s . Gurning“海上空中监视:集成人工识别系统,自动识别系统”IOP会议系列:地球和环境科学文章ID 12014卷,557年,2020年。视图:出版商的网站|谷歌学术搜索
- h·高,c . Liu和杨x, y . Li”V2VR:可靠hybrid-network-oriented V2V数据传输和路由考虑限制和连接概率,”IEEE智能交通系统13卷,页1 - 14,2020。视图:出版商的网站|谷歌学术搜索
版权
版权©2021杰黄等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。