文摘
预测行人运动范围广泛的应用程序中是至关重要的。最近,数据驱动模型收到越来越多的关注在行人动力学研究中,展示一个巨大潜力提高模拟性能。本文提出一个行人运动仿真模型基于人工神经网络,两个子,分别用来预测速度位移和速度在每个时间步方向角。目的地信息,行人的历史运动信息,周边行人和环境障碍semicircular-shaped感知区域内被用作输入学习行人运动行为规则。速度方向角的子模型,一个新的划分方法对行人的感知区域采用。具体来说,感知半径分为几个乐队,和感知角度范围分为若干领域,建立加权空间矩阵来表示不同的影响邻近的行人和障碍物。实验两种典型场景,单向流动和双向流连续长走廊,进行获取行人运动数据集。然后,进行了一系列的模拟情况下调查的关键参数的值,包括感知半径,感知角度划分,空间的权重矩阵,采用历史运动。相比行人轨迹的仿真结果和实际数据之间,平均轨迹误差(MTE)和平均目的地错误(身边),分别为0.114米和0.171米的单向流动的情况下,,分别为0.204米和0.362米的双向流场景。此外,基本代表ρv和密度流关系图与实际数据仿真结果吻合较好。 The results demonstrate great capacity and credibility of the presented model in simulating pedestrian movement in real applications.
1。介绍
走路是一种最基本的运输模式。在行走过程中,人类有能力驾驭他们的方式通过一个拥挤的空间。他们遵守一些常识性的规则和动态与环境中的障碍和其他人类互动。是很重要的和有价值的建模规则和预测行人运动范围广泛的应用程序。例如,指导和改善建筑的行人流量,提高行人的安全环境中无人驾驶车辆,和优化机器人路径规划。
在过去的几十年里,数百名行人运动模型已经建好了。通常情况下,这些模型可以分为两类,即知识模型和数据驱动的模型。前预测行人运动到明确的规则从现有的知识或行人的共同经验,部队和基于网格模型的两种主要类型。在部队模型方面,最著名的一个是社会力量(SF)模型(1),行人是自励的粒子牛顿力学。行人的社会互动是由各种各样的驱动力。细胞自动机(CA)模型(2)和晶格气体(LG)模型(3)是基于网格模型的典型例子。在这些模型中,模拟环境和统一的网格离散。行人运动是由预定义的更新规则(4]。此外,基于主体模型也发展迅速,近年来被广泛应用。行人在这些模型被视为自主实体与自适应能力,和优化的方法通常是采用模型在运动过程中他们的决策。由于行人行为的异质性可以明确认为,基于代理模型显示极大的灵活性和能力来表示行人运动以自然的方式(5]。以知识为基础的模型,他们通常验证如果集体行为,功能,和现象可以模拟和反映,包括基本图和自组织现象的关系,如车道形成逆流,放牧,拉链效应,faster-is-slower效应和瓶颈(6]。然而,由于行人行为的内在复杂性,综合建模规则不能代表所有他们的社会交互背后的知识。因此知识模型受到限制。例如,不切实际的反向运动引起的不必要的排斥力在部队模型(7],对角运动轨迹的空间和时间离散化引起的网格模型(7,8]。在预测个体行人运动的细节,特别是移动速度和方向在每个时间步,知识模型的精度仍不足(6,9]。
为了克服这些缺点,介绍了数据驱动的模型来解决行人运动建模问题。一般来说,数据驱动的模型使用真实数据,引入人工智能方法预测未来轨迹的人(10]。在这些模型中,历史运动的一个个体,他的邻居、预期目标的位置,使用环境障碍物的位置。例如,马等。11)提出了一个基于人工智能模型模拟行人在人行横道上逆流,收集真实的数据被用来学习微观行人运动行为的反向传播(BP)算法训练。同时,提出了一种基于神经网络的数据驱动模型由魏et al。12)学习行人运动规则来源于真实的数据。结果显示良好的行人运动的准确性和真实性。歌等。13]提出了行人运动但是神经网络建模、规范化行人之间的相对位置,移动方向转移,和路径平移算法被用来增加模型的可靠性和适应性,当应用于各种场景。最近,马丁和帕里(14)提出了一种数据驱动的方法利用广义回归神经网络(GRNN)模拟行人动力学与一个固定的障碍。这个模型只有一个自由参数;因此,相对较少的(输入/输出)模式是必要的。此外,深入学习相关方法介绍了预测行人运动行为。开创性的工作Social-LSTM Alahi等提出的模型。15),每个行人都是由单个LSTM建模。LSTMs社会连接池系统,代表其他行人运动行为的影响的一个行人。受这一研究中,几个相关的模型,如SS-LSTM [16甘)、社会(17],SR-LSTM [18],RAI(经常性的关注和互动)模型(19)开发了预测行人轨迹。尽管LSTM模型强大的时间序列预测,行人sequence-to-sequence预测轨迹生成的这些模型,和现有知识和常见的行人几乎被认为是经验。
在回顾以前的工作,我们注意到,人们越来越关注数据驱动模型包含行人的知识和经验。ANN-based行人行走行为模型由马et al。9],目的地,行人运动的状态,邻居,障碍,个人特征,和其他外部环境信息中指定的输入层,和网络训练与大量的真实数据。通过学习现实的人类知识,仿真结果表现出伟大的准确性和现实的行人的行为。在卷积LSTM模型开发的歌曲等。20.),一个多通道张量是用于表示空间信息的人群,包括场景地图,邻近的行人、固定障碍,在人群中相对位置和目的地。网络是深化和训练预测时空轨迹序列。
灵感来自于这一点,我们开发一个ANN-based行人轨迹预测模型将知识和经验的行人。此外,微观行人运动特征,如运动位移和方向变化是显式地考虑。本文的其余部分组织如下。部分2介绍了ANN-based行人运动仿真模型。部分3介绍了数据集和网络培训。节4关键参数的影响进行分析,通过一系列模拟典型场景和模拟结果的比较和实际运动轨迹和基本数据图是在单向和双向流的场景中进行的。部分5总结了纸。
2。ANN-Based行人运动行为模型的发展
一般来说,行人轨迹由顺序在不同的时间步骤。因为走路是一个时空的活动,每个行人的决策有关当地的运动主要是受以下信息的影响。(1)目的地信息:每个行人行走时通常倾向于方法特定的目的地。(2)邻近的行人:在行走,行人需要与其他行人。在现实生活中,行人感知信息的周边行人在一定的范围内。(3)环境障碍:当遇到环境障碍,行人需要采取行动以避免碰撞,如调整走方向,减慢速度。(4)行人的历史运动信息:行人不会改变他们的移动状态,例如移动速度突然或者频繁,反映出惯性行为。
在人工神经网络的行人运动模型中,上面的信息作为输入,可以根据不同的环境调整。在以前的作品,轨迹位置(15)和速度在水平和垂直方向上(13,20.行人在下次的步骤通常被选为输出。在赵的研究等。21),两个子开发学习行人运动速度的大小和方向,分别。灵感来自这两个子提出了预测的速度位移和速度方向角行人在每个时间步,分别。目的地信息、周边行人、环境障碍,行人的历史运动信息为每个子模型作为输入。
2.1。速度位移子模型(VDSM)
速度位移子模型主要用来预测基于BP神经网络的速度位移。确定行人和交流障碍,通常使用空间周围的行人。在以往的作品中,空间为中心的圆形或矩形的行人(11- - - - - -13]。然而,一个行人主要由视觉感知环境信息,也就是说,邻近的行人和障碍物向前在他空间运动决策更重要。因此本文采用semicircular-shaped感知区域,与他平分线电流行走方向,如图1。
选择一个三层BP神经网络作为子模型的基本框架。网络的输出是行人的速度位移当前时间步。输入和输出参数的细节见表1。
具体来说,距离沿着和轴之间的行人和邻近的行人在他感知的区域是用来代表周边行人的影响在这个子模型,如图2。不同于现有的固定数量的最近的邻国行人的研究,如5或7被用于神经网络模型的输入(11,20.];这个子模型输入参数的数量是不固定的。它是由邻居的数量和障碍的数量在每个时间步行人的感知区域。来反映主题的影响行人的历史运动,主体的位移速度步行过去五次步骤包括在输入。
神经网络模型的具体结构如图3。输入层神经元的个数和输出层神经元的数目 ,由系统和等于输入和输出参数的数量,分别。由于研究问题的复杂性,隐藏层中使用的网络模型。如果隐层神经元的数量相比较少的复杂性问题,那么可能发生“underfitting”。如果中不必要的更多的神经元网络,那么可能出现“过度拟合”(22]。其次是“拇指规则”用于研究赵et al。21),隐层神经元的数量估计以下方程:
例如,如果有5个邻居和2障碍行人感知区域的时间 ,神经元的数量在输入层、输出层,每个隐层和28日1,分别和15。
2.2。速度方向角子模型(VDASM)
速度方向子模型主要用来预测基于BP神经网络的速度方向角。速度方向角 指的方向矢量的旋转角度的行人在时间的位移矢量 的行人 。行人前进时的价值范围在 。为了便于计算,不等 这个子模型中使用。当行人穿过走廊从左向右移动,计算的角度旋转矢量(0,−1)方向向量 。而行人穿过走廊从右到左移动,从矢量角度旋转方向向量(0,1) ,如图4。
量化的空间分布,邻近的行人、方形网格通常被用在先前的研究[20.,21]。在这个子模型,我们采用径向基方法划分一个行人的感知区域。感知半径由带宽度为0.3米,分为半圆角范围部门。让每个部门的面积相同的情况下,第二个乐队,每个部门的重叠区域进一步分为3部分。同样,第三个乐队的重叠区域,每个部门都是进一步分为5部分。的重叠区域th乐队,每个部门都是进一步分为部分。因此,部门在空间分布矩阵的数量 。例如,如果一个知觉领域包括7乐队和4个部门,即感知区域的半径2.1米,每个扇形部门45°角,空间矩阵的划分数量是196。感知区域的示意图如图5。如果有行人在相反的方向移动或一个障碍定位分工,分工的价值将−1。如果部门被一个行人方向一致,其价值将1。否则,一个部门的价值将是0的矩阵。如果一个部门的环境边界,其价值也将−1。
在社会交往中,行人和障碍物在前面的主题区域行人有更高的影响当地的运动比位于区域前向右或向左前方。此外,行人和障碍物接近主题行人对当地的运动(更大的影响力23]。使用不同的权重来表示空间分布的影响。因此, , ,和 。最终的重量为一个特定的部门 。重量对模型性能的影响将在节中详细讨论4.2。
类似于VDSM,采用三层BP神经网络作为子模型的基本框架,如图6。网络的输出是行人的速度方向角当前时间步t。它可以由目标,邻近的行人和障碍物的空间分布在主体的看法是行人和他的历史运动。输入和输出参数的细节见表2。
3所示。数据集和网络培训
数据集用于模型训练和评估来自行人行走在上海海事大学的实验。单向流动和双向流场景被认为在实验中,每一个都进行了三次。
3.1。数据集
行人流量实验场景是连续长走廊的长度12米和3米的宽度,如图7。共有106名大学生参加了实验。两个摄像机被安装在4楼的学生公寓,离地面约10.5米。分辨率是1920×1080像素,帧速率是30 fps。一开始的实验中,参与者站在等候区中的有序的行,一行四人。当一个语音指令,106名参与者沿着走廊从右到左的单向流动的场景。对于双向流场景,53个参与者从右向左沿着走廊走,和其他53个参与者从左向右沿着走廊走。
录像是首先分为帧,可以检测到行人,他们的运动轨迹在图像空间中可以提取使用PeTrack软件(24),见图8(一个)。然后,行人从图像空间的坐标(Uo网上坐标,见图8 (b))可以转化为真实空间(XOY坐标,见图8 (c))利用直接线性变换法25]。
(一)
(b)
(c)
3.2。数据处理
在行走过程中,行人走出他的左右腿转向前进;因此,自然振荡通常可以观察到。消除身体摇摆的影响和减少数据提取错误,行人轨迹被抚平。由于身体摇摆的方向是垂直于一个行人的行走方向,协调处理。均值滤波器是采用数据平滑方法,也就是说,一个行人在当前时间步的坐标被替换的平均值坐标在最后一步 ,当前时间步 ,和下一个时间步 。因为行人运动在走廊的两端是不稳定的,行人的运动轨迹在走廊部分 被用于网络培训。
3.3。网络训练
录像中30帧的帧速率,连续两帧之间的时间间隔是只有1/30的年代,这是太短暂观察行人的运动。由于每一帧的提取误差、速度位置坐标计算的两个连续帧的行人可能是不准确的。因此,0.4年代通常采用的时间间隔计算个人的瞬时速度26,27),也就是说,一个行人的位置坐标 和 用于获取他的瞬时速度时间吗 ,和是0.4秒。在本文中,我们选择了一个时间步(约0.4秒)每12帧的视频生成训练样本。训练样本的数量在单向流动场景和双向流场景是14861和9673,分别。
训练样本分为训练集,验证集和测试集。比例是75%,15%,和15%,分别。BP网络训练采用优化算法和激活函数来调整连接权值。连续修改网络的连接权值的目的是实现最小均方误差(MSE)的平方和的预测值和真实值之间的差异。这个培训过程停止时执行预定义的时代或MSE低于某个阈值。摘要时代的预定义的数量是1000,梯度的阈值是0.00001,验证检查的阈值是6。其他关键训练参数和功能如下。(1)优化算法:弹性反向传播。(2)学习速度:它控制学习的速度模型。如果它太大,学习速度快,到达一个次优的成本最终的权重集。相反,如果它是太少,该模型允许学习一组更优的重量,但是学习或收敛速度太慢。基于这些考虑,本文使用的是0.01。(3)激活功能:乙状结肠函数(Logsig)采用输入和第一个隐藏层以及第一和第二隐藏层和线性传递函数(Purelin)用于输出层。
4所示。结果与讨论
训练ANN-based模型应用于模拟行人运动行为在单向流动的情况下,双向流场景。模拟,每个行人的初始位置和时间进入走廊是一样的实验。然后,每个行人的未来地位在每个时间步的预测模型。具体来说,速度位移和速度方向角预计VDSM和VDASM分别。仿真时间步长是0.4秒(12帧),并使用并行更新更新行人的位置。
4.1。评价指标
为了评估模型的性能和精确量化仿真结果和实验数据之间的轨迹误差,下面两个评价指标。(1)计算平均轨迹误差(MTE)由以下方程: 在哪里代表着行人的位置坐标当时从实验中获得的数据,代表了行人的预测位置坐标当时从仿真结果代表的总时间的步骤。的均值计算MTE由以下方程: 在哪里代表了行人的总数。(2)意思是目的地错误(身边)由以下公式计算: 在哪里代表着行人的位置坐标在最后时间步从实验中获得的数据,应该在走廊的一端,和代表了行人的预测位置坐标当时从仿真结果。
4.2。参数敏感性分析
感知到的信息对运动决策是至关重要的。的感知区域,由半径带宽度为0.3米,分为角范围部门。因此,VDASM的性能可能受到以下因素的影响:乐队感知半径确定的数量,数量的行业认知角度划分,和重量矩阵确定相邻的空间分布影响行人和障碍物。此外,历史运动也是一个重要的参考预测行人运动的未来。分析了这些因素对模型性能的影响如下。
4.2.1。准备感知半径和角度
感知到的信息对运动决策是至关重要的。的感知区域,由半径带的宽度 ,和角度范围分为部门。因此,VDASM的性能可能受到以下因素的影响:乐队感知半径确定的数量,数量的行业认知角度划分,和重量矩阵确定相邻的空间分布影响行人和障碍物。此外,历史运动也是一个重要的参考预测行人运动的未来。分析了这些因素对模型性能的影响如下。
在VDASM,感知半径设置0.6米到2.1米0.3米的增量每个仿真案例。空间矩阵,体重的第一个乐队1,增加从离乐队远乐队是什么 ,也就是说,第二个乐队的重量是0.85,等等。同样的,行业的重量接近中央线是1,也就是说, ,和相邻的增量从中央部门外的 。
表3目的地列表平均轨迹误差和平均误差在每种情况下的单向流动的场景。我们可以发现当感知半径设置 ,模型的性能是最好的。这可能是因为行人在实验是在文件中。也就是说,当地的行人之间的交互主要是纵向,行人的运动深受前任是有限的(特别是空间进展28]。如果行人移动文件与一个更大的进展,最好安装感知半径应该是更大的价值。认知领域的角度而言,仿真结果与感知的角度分为两部门(即。,每个部门角度是90 )或6部门(即。,each sector angle is 30 )比那些其他知觉角度划分的方法。
此外,模型仿真性能的每种情况下双向流动情况还在调查中。结果表明,0.6是最好的感知半径和22.5是最好的行业角度对行人的双向流动。从行人在双向流需要考虑行人在逆流避碰的目的,更好的感知角度部门将促进决定速度方向角。
4.2.2。空间分布的权重矩阵
单向流动的场景中,感知半径设置为0.6,和部门角度设置为30在仿真案例。感知距离的增加体重范围(−0.9−0.1)和认知角度的重量范围(−0.4−0.1)。每种情况下的仿真结果如表所示4。一个简短的感知半径采用以来,模型具有最好的性能 和 ,从前面展示的主要影响提出区域步行运动。
4.2.3。历史上的运动
当使用不同数量的历史运动信息,预测运动路径的长度可以不同。具体来说,如果时间步骤用作参考的历史运动最初的模拟,预测路径的实际长度可以计算使用以下方程: 在哪里代表了预测走廊的长度,在这篇文章中,代表了行人的速度位移在第一个时间的步骤。因为MTE和身边只能反映在轨迹预测绝对误差,另一个叫两个评价指标平均轨迹错误率(MTEA)和平均目标错误率(MDEA)提出,计算如下:
对于单向遵循和双向流场景,不同数量的历史研究的步骤。对于单向流动场景,感知半径知觉的角度分为6个部门,获得最佳性能的空间矩阵部分4.2.2在每个模拟情况下使用。对于双向流场景,感知半径设置为与知觉角度分为8个行业, ,和 。仿真结果表表示5。
4.3。行人运动的模拟在单向和双向流场景
4.3.1。单向行人流量情况
在单向行人流量的情况下,行人从右端进入走廊,走左边的走廊尽头。由于实验数据位置坐标提取行人轨迹每隔几帧,这些离散点的曲线由直接连接不能重现真实的轨迹。提高预测的自然性行人轨迹,预测离散位置坐标插值,如图9。
使用参数值调查部分4.2,并给出了模拟行人轨迹图10。我们可以看到,预测行人轨迹基本上是符合真正的轨迹在相应的实验。
(一)
(b)
图11代表速度位移分布和速度方向角的直方图分布的单向流动的场景。的仿真结果可以看出,速度位移与真实数据基本上是一致的,但仿真结果速度方向角对左前锋表现不佳的速度朝着正确的前进方向角。
(一)
(b)
(c)
(d)
平均轨迹误差是0.114米,约1.43%的走廊部分的长度预测(8米)。误差为0.171,平均目的地 ,这是走廊的长度约2.14%的部分预测。图12显示了MTE-frequency和MDE-frequency直方图的单向流动的场景。
(一)
(b)
此外,基本图呈现基本密度和速度或流量之间的关系是一种普遍采用评价行人仿真模型的性能。模拟结果和实验数据的ρv关系和单向流动密度流关系场景呈现在图13。具体来说,密度和速度数据在模拟和实验提取2 m×3 m的矩形测量区域如图7。密度和速度计算中使用的方法(29日]。数据点的总体布局模拟基本上由的实验。应该注意的是,行人站在等候区中的有序行实验开始时从右到左,沿着走廊走在四个文件。因此,相对集中分布的数据的图可以观察到ρv的关系。
(一)
(b)
4.3.2。双向行人流量情况
在双向行人流量的场景中,53行人走在三个文件中从右到左,和其他53行人走在从左到右三个文件。预测行人轨迹基本上是符合真实数据,如图14。
(一)
(b)
在双向行人流量的情况下,平均轨迹误差 ,这是大约2.55%的预测走廊部分的长度吗 。错误的意思是目的地 ,大约4.53%的预测。图15显示了MTE-frequency和MDE-frequency直方图双向流的场景。
(一)
(b)
此外,行人运动数据双向流中的场景中提取测量区域。仿真结果ρv和密度流关系的双向流场景同意真正的数据,如图16。
(一)
(b)
5。结论
本文提出一个行人运动基于人工神经网络的仿真模型,包括两个子,分别用来预测速度位移和速度在每个时间步方向角。semicircular-shaped感知区域采用在每个子模型;只有行人和知觉障碍在这个区域被认为是运动决策。的速度位移子模型(VDSM),选择一个三层BP神经网络的基本框架。距离目标点距离的障碍,距离的和轴之间的行人和邻近的行人在他感知区域,邻近的行人在最后时间步的速度,位移和速度的行人过去五次步骤作为模型输入学习主体的速度位移行人在当前时间步。由于邻近的行人的数量可以在不同的时间变化不同的行人和步骤,输入参数的数量不是固定的。速度的方向角子模型(VDASM),采用径向基方法将行人的感知区域。感知半径由带宽度为0.3米,分为半圆角范围行业,建立在一个空间的矩阵中包含分歧。考虑距离和方向社会互动中扮演很重要的角色,不同的权重是用于表示空间分布的影响。目标方向之间的角度和方向行走,邻近的行人和障碍物的空间分布,速度方向角的主题作为行人过去五次步骤输入学习速度方向角的行人在当前时间步。
行人行走实验两种典型场景,行人流量单向和双向人流在连续长走廊,进行,和模型训练数据集提取,验证和测试。此外,进行了一系列的模拟情况下调查关键参数的影响,包括感知半径,感知角度划分,权重矩阵确定空间分布的影响,采用历史运动。适当的参数值的单向流动和双向流场景识别。最后,仿真结果与实验数据相比,在行人运动轨迹和基本图显示ρv和密度流的关系。两个评价指标,平均轨迹误差(MTE)和平均目的地错误(身边),采用。单向流动的情况下,模拟结果的两个子速度位移分布和速度方向角的直方图分布基本上是与真实的数据一致。此外,MTE ,走廊的长度约1.43%的部分预测 。身边的是 ,大约2.14%的长度的预测。在双向行人流量情况下,MTE ,大约2.55%的长度的预测。身边的是 ,大约4.53%的长度的预测。矩形测量区域的尺寸×用于提取密度和速度数据。它可以观察到ρv和密度流关系在仿真结果与实际数据吻合较好。结果表明,提出的模型具有良好的性能模拟行人运动行为在单向和双向流动流场景。
基于行人感知面积的空间矩阵提出了速度方向角的决心,和影响不同的部门和重量分配模型模拟的方法性能进行了研究。然而,数据集和实验场景仍然是有限的。更多的场景包括行人流量与障碍和交叉流将在我们未来的研究工作。
该模型的潜在应用可能包括以下方面。(1)使行人轨迹的实时预测和为群众安全管理提供早期预警(2)预测周围行人的运动,避免碰撞安全高效的服务机器人运动规划(3)了解未来行人对无人驾驶车辆的轨迹
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项研究受到了中国国家自然科学基金(71904116)和上海市科学技术委员会、中国(19 dz1209600 18 dz1201500, 19511105002)。