文摘
与越来越多的应用程序和实用程序自动识别系统(中特别有指导性,大量的AIS数据收集记录船舶导航。近年来,船舶运动轨迹的预测已经成为最热门的研究问题。与现有的研究相比,大多数研究人员都集中在船只的single-trajectory预测。本文提出了一种multiple-trajectory预测模型,使两个主要贡献。首先,我们提出一种新颖的轨迹特征表示方法,使用层次聚类算法分析和提取多个轨迹的船舶导航行为。与经典方法相比,例如,Douglas-Peucker (DP)和最小二乘三次样条曲线近似(LCSCA)算法,轨迹特征提取的方法的平均损失大约是0.005,这是减少50%和30%相比,DP和LCSCA算法,分别。第二,我们设计一个综合模型,同时多个轨迹的预测使用该特性,采用长短期记忆(LSTM)的神经网络和递归神经网络(RNN)追求这时间序列的任务。此外,对比实验证明根的平均值和标准偏差均方误差(RMSE)使用LSTM使用RNN低于4%和14%,分别。
1。介绍
自2007年以来,国际海事组织要求国际船舶超过300和noninternational船只必须附加超过500吨自动识别系统(AIS)发射器和接收器(1]。AIS已成为最重要的一个广播系统船舶导航信息,例如,经度,纬度,通过甚高频和速度。AIS不仅可以传播的消息从船到岸上中心但也可以之间交换的船只。因此,AIS一直支持海上交通的跟踪和避碰等管理和风险评估2- - - - - -4]。AIS的广泛应用,大量的AIS数据生成和存储。同时,它正日益成为一个具有挑战性的问题,从而高效地利用AIS数据并提供船舶运营商更有效和方便的导航服务。尤其是信息化AIS船轨迹数据起到关键作用的交通研究领域的重要指导导航行为分析(5- - - - - -9]。
近年来,相关的研究主要可以分为三类。在第一类,大多数研究集中在避碰和事故分析,他们利用AIS数据来确定船舶避碰模型中的参数(2- - - - - -4]。在第二类,简要研究AIS数据用于导航行为分析和分类,再等几种分类方法(资讯)算法和其他新方法被用来分类的轨迹5,6]。赵和施关注行为分析基于AIS数据,提出一种改进的Douglas-Peucker (DP)船的轨迹数据压缩算法7]。最后一类,学者大多关注轨迹重建,prediction-based AIS数据用回归分析方法(8- - - - - -10]。一些学者也专注于先进的机器学习技术轨迹预测(11]。在上述研究中,轨迹预测是船舶最关键技术的智能导航系统,可以为船舶提供导航指导和支持运营商基于历史AIS数据。然而,现有的研究主要是追求一个轨迹预测模型泛化能力的缺乏,单独和一个培训过程需要每个轨迹(5- - - - - -11]。
为了解决这个问题,本文提出了multiple-trajectory预测模型。实现多个轨迹预测,提出了一种新的轨迹表示方法能够提取共同特征的多个使用一系列AIS数据点的轨迹。该方法是基于层次聚类的方法(12,13]。在这项工作中,我们使用欧几里得度量来衡量两个点之间的相似性(集群)使用经度和纬度从AIS数据和顺序相结合两个点(集群)使用一个贪婪的它们之间的最小距离。使用我们的方法,可以表示为多个轨迹共同特征点具有相同的最优数量。自从新轨迹仍然是一个经典的时间序列数据,本文采用长期短期记忆(LSTM)的网络和递归神经网络(RNN)训练预测模型的基础上,新特性。在数值实验的第一部分,我们比较提出的特征与传统的特征提取的DP (LCSCA)和最小二乘三次样条曲线近似算法。失去我们的功能与原来的轨迹是0.005,这是减少50%和30%与DP和LCSCA算法相比,分别。在数值实验的第二部分,我们训练轨迹预测模型基于我们使用LSTM和RNN的特性。的措施均方误差(RMSE)还用于估计不同预测模型的性能。我们发现使用LSTM和RNN的预测模型可以获得显著的低RMSE当提出的尺寸特性设置为13。特别是,该模型使用LSTM和(激活函数的最优参数线性整流函数(Rectified Linear Unit),辍学是0.2)可以获得最小均方根误差为0.0009,显著优于使用RNN的模型。实验结果还表明,均值和标准偏差的RMSE使用LSTM使用RNN低于4%和14%,分别。因此,本文对轨迹预测领域的两个主要贡献。首先,该表示方法可以提取更多的近似功能用更少的AIS分原始轨迹。其次,这项工作解决多个轨迹预测的主要限制占共同的特征提取。模型基于我们的功能显示轨迹预测效率,特别是使用LSTM的预测模型。
本文的其余部分组织如下。部分2介绍了导航行为的文献回顾分析和轨迹预测模型。部分3描述了对比实验来评估该轨迹的性能表征方法和轨迹预测模型。最后,结论提出了部分4。
2。材料和方法
2.1。文献综述
2.1.1。回顾轨迹表示
DP是一种特征提取算法,使用一系列线段近似曲线。在海洋工程领域,DP已广泛用于基于AIS数据轨迹表示。最初,DP始于一个阈值来表示的最大距离,和轨迹的简化结果可以根据以下步骤14]:(一)画一条直线从起点到终点的原始轨迹(b)这条线设置为初始简化(c)计算每个点的距离的简化(d)考虑最大距离的点作为特色点(e)分离简化线分成两线段的新观点(f)重复步骤(c) (e),直到所有的点的距离的简化行小于阈值
一种改进方法,该方法使用基于稀疏表示集群迭代获得显著特征提出了在15,16]。该方法应用近似依赖分析,进一步保持互补性,而消除冗余在选择的特性是非线性正交匹配追踪。
LCSCA也是一个有效的方法来表示轨道使用功能点(15]。当原始轨迹的点的数量N点可以安排 以升序排序的时间。原来的轨迹可以被描述为
我们代表点的数量p节点矢量 ,和参数向量 。节点矢量可以计算为 在哪里 和 。如果所有的代表点的坐标表示 ,代表点可以形成一个矩阵
控制点可以根据方程(3),j选择是4立方样条函数。因此, 的矩阵代表点的最终结果。
2.1.2。审查的轨迹分析
在本节中,我们回顾几个相关研究船轨迹分析。他们可以分为两大类轨迹分类分析和轨迹预测分析(17]。轨迹分类是建立经典模型分类轨迹根据它们的属性和特征。刘等人设置类别根据历史轨迹的方向,然后应用资讯的方法识别新的轨迹由于正确的类别,这被认为是未来趋势(5]。在[18- - - - - -20.),研究人员专注于建立一个船轨迹分类模型与回归方法和统计方法相结合,如逻辑回归和概率评估方法。这些研究包括轨迹表示流程训练分类模型之前,这不仅可以大大节省消耗的时间也提高轨迹分类的准确性。轨迹预测分析是另一个热门研究课题领域的船舶导航行为分析,主要关注轨迹重建和近似(21,22]。张等人提出一种基于轨迹结构模型三个部分的一个轨迹(9]。它们轨迹划分为三个部分基于船舶导航状态,然后样条模型和线性回归模型应用于重建轨迹。唐等人应用历史轨迹训练LSTM模型预测未来的位置(11]。然而,有一个缺乏上述中的多个轨迹预测研究。
2.2。导航行为分析和轨迹预测模型
本文的目的是使用一个共同的实现同时对多个轨迹的预测模型。自个人轨迹提出了不同长度和还含有不同数量的点,它是一个具有挑战性的问题训练预测模型基于不同尺度数据。因此,本文提出了一个集成框架包括两个任务。首先,我们提出一个新颖的轨迹表示方法来解决数据的可伸缩性问题,可以提取共同的特征与相同数量的点。其次,我们采用RNN LSTM解决时间序列问题,同时可以培养模型预测的基础上,提出了功能。
2.2.1。该方法对轨迹表示
AIS数据提供了许多属性的轨迹,如导航,经度,纬度,和方向。在本文中,经度和纬度是典型的属性。如果一个船的轨迹给出方程(1),表示位置的经度和纬度 。我们使用欧几里得度量作为测量两点之间的距离在方程(6)和(7): 在哪里表示之间的距离和 ,和表示集的距离原来的轨迹。然后,该方法的简化过程可以描述如下:(一)计算距离每个社区点之间(b)保存所有的距离在作为初始设置(c)合并两个点(集群)的最小值到相同的集群(d)重新计算的距离双方的附近点(集群)(e)更新设置新的距离和(f)重复步骤(c) (e)到集群的数量是收敛的
因此,最初的轨迹可以表示为一系列的集群,我们使用每个集群的平均值作为特色点(见图1)。
表示轨迹的特色点的数量决定基于损失从原来的轨迹。本文使用动态时间规整(DTW)方法来衡量两个时间序列之间的相似性的数据集。因此,最初的轨迹之间的变形路径和代表性的轨迹可以被描述为 ,可以被描述为的距离 ,和距离 轨迹的损失表示(23]。
2.2.2。该模型为多个轨迹预测
RNN和LSTM基于神经网络和广泛使用的进行时间序列预测。LSTM可以视为一种改进RNN的类型,长期记忆的能力。multiple-trajectory预测的模型图所示2。LSTM单元中,输入门使用棕褐色h函数,忘记门使用乙状结肠函数,输出门也使用乙状结肠函数。如果号码是轨迹米的内存模块LSTM选择性地记忆和忘记输入信息,和它的公式如下:
轨迹,可以描述为代表表示 在哪里表示t -th的M -th表示轨迹作为输入。符号在(隐层的输出t−1)点。符号是乙状结肠激活函数,和符号 , , ,和的重量,输出吗 ,的重量 ,分别和偏见的被遗忘的门。的乙状结肠层决定了更新后的值如下: 在符号 表示的重量 ,的重量 ,分别输入门的和偏见。棕褐色的h层为细胞提供了一个候选向量,可以描述如下: 在符号 表示的重量 ,的重量 ,分别和偏见。忘记门的输出值和输入门更新细胞状态可以描述如下:
最终的输出使用新的细胞状态输出内容: 在符号 ,和表示的重量 、体重的 ,偏见,和隐层的输出,分别24]。如果输入的是(我−1)点的数量米表示轨迹,轨迹的点的数量表示K,是我数量的点,符号可以被描述为
然后,我们使用根均方误差(RMSE)作为预测模型的评价指标。如果表示实际点的轨迹和表示实际点的轨迹,预测的RMSE值和实际价值可以计算如下: 在哪里 表示的坐标 ,和 表示的坐标 。
3所示。实验和结果
3.1。实验设计
在这篇文章中,该船轨迹收集使用中特别有指导性,位置是大连港如图3。与400年轨迹数据集包含33艘,频点包含在每个轨迹从20点到380点。
首先,我们追求原始轨迹与该方法提取的特色点,DP, LCSCA。的损失表示与DTW轨迹进行了计算和比较。使用该方法提取的点的数量优化根据损失DTW率下降。其次,我们使用90%的400表示轨迹作为训练数据,其余10%为测试数据。RNN和LSTM用于学习预测模型,对参数进行了调整和比较实验提高预测精度。
3.2。比较轨迹表示
测量性能和该方法的有效性,DP和LCSCA用作比较。图4显示所有轨迹在不同值的平均损失的简化率(点的数量的比率表示轨迹的点在原来的轨迹)三种方法。发现平均损失低于使用我们的方法使用DP和LCSCA方法在所有情况下。简化率低于0.14时,该方法的平均损失近50%低于DP和LCSCA方法。可以看出该方法的偏差总是低于其他两种方法。
然后,讨论了最优数量的提取点在图5。图5显示了线情节的损失和损失递减率变化点的数量表示。它可以观察到,损失下降率会首先获得最小值的15%的数量表示分= 13。为了减少预测模型的复杂性,我们使用13-dimensional轨迹特征的表示。
3.3。轨迹预测的比较
根据参数调优,我们选择线性整流函数(Rectified Linear Unit)0.2积极功能,辍学,和100年的时代。RNN和LSTM最初考虑输入的数量设置为80,和两个隐藏层神经元的数量设置为80,40岁,分别。从第三个隐层神经元的数目设置为之前的一半。表1显示的平均值(装),最大值(Max.V.s),最小值(Min.V.s)和标准偏差(美国)400轨迹预测RMSE使用LSTM RNN和不同数量的隐藏层,RNN的箱线图图表和LSTM在数字6和7。图6显示,当RNN包含五个隐藏层,显示最佳性能的预测模型。同时,图7使用LSTM表明,模型包含四个隐藏层可以获得最佳性能。我们还发现,地方s.d RMSE最佳模型使用LSTM低于4%和14%的模型使用RNN如图8。
然后,我们画箱线图图表使用LSTM RMSE值模型与不同批量大小如图9和总结表的数值结果2。然而,最好的Min.V。,Max.V。,S.D. of RMSE can be obtained when the batch size equals 2. The minimum M.V. of RMSE can be dramatically improved when the batch size equals 4.
4所示。结论
在本文中,对多个轨迹预测模型演示了基于一种新型轨道表示方法。该方法使用了层次聚类的方法提取了基于AIS数据从原始轨迹点,和多个轨迹的共同特征可以通过一系列简化线段。与传统方法相比,比如迪拜和LCSCA,我们的方法从原始轨迹,展示了低损耗和最低的损失可以获得递减率13-dimensional特性基于DTW的措施。调查提出的性能特性,我们使用一个真实的大连港口和收集从33船舶AIS数据包含400轨迹。在实验中,LSTM和RNN用来学习轨迹预测模型,和LSTM和RNN高性能在多个轨迹预测。尤其是LSTM可以获得最高的性能和参数调整。
在未来的工作中,我们计划改进我们的方法两部分。首先,我们将设计一个自动的过程特征提取和模型建设结合起来,可以同时获得最优预测模型基于最优特性。其次,基于上述自动过程中,我们将实现我们的模型实时轨迹预测在线模式中特别有指导性。
数据可用性
本文的数据可按照客户要求定制相应的作者。
的利益冲突
作者宣称没有利益冲突有关的出版。
作者的贡献
他妈和易建联左贡献同样这项工作。
确认
这项工作是支持部分由中国国家自然科学基金(批准号。52131101,51939001,61976033,和U1813203),辽宁振兴人才计划(格兰特XLYC1807046号,XLYC1908018),辽宁省自然科学基金(批准号。2019 - zd - 0151、2020 - hylh - 26),和大连的杰出青年科技基金(批准号2021 rj08)。