文摘

初始化过程的性能有很大的影响单眼视觉惯性同步定位和映射(VI-SLAM)系统。最初的估计通常是通过最小二乘法解决诸如高斯牛顿(()算法,但大型迭代增量可能导致收敛缓慢甚至发散。为了解决这个问题,提出了一种改进的迭代策略,初步估计。我们初始化的方法可以分为四个步骤:首先,纯视觉ORB-SLAM模型是利用所有可观察到的变量。其次,IMU preintegration技术采用IMU-camera频率对准在同一时间和关键帧的一代。第三,一种改进的迭代策略基于信赖域介绍了陀螺仪的偏差估计以及重力方向是雅致。最后,加速度计和视觉偏差估计的基础上先前的估计。公共数据集上的实验结果表明,该估计的初始值可以聚合速度,以及速度和姿态传感器套件可以更准确地估计比原来的方法。

1。介绍

随着人工智能(AI)的发展,单眼视觉惯性同步定位和映射(VI-SLAM)技术已经成为一个活跃的研究课题在机器人和计算机视觉的社区。周围的摄像头图像包含丰富的信息环境,它可以用来估计相机姿势,以及重组稀疏或密集的地图。艾莫斯提供测量角速度和局部线性加速度,可以用来估计刚体运动在短时间内。补充功能使visual-inertial组合适合许多应用程序如自治或半自治驾驶(1,2),无人机机器人(3,4),增强现实(AR) [5,6),和3 d重建(7,8]。目前,紧密耦合的非线性优化方法被广泛应用于视觉/ visual-inertial大满贯,如ORBSLAM和ORBSLAM 2/3 (9- - - - - -11],OKVIS [12),VINS-MONO / VINS-FUSION [13,14],VI-DSO [15],VI-ORBSLAM [16]。初始值的估计对上述VI-SLAM系统有很大的影响。具体地说,乌兹别克斯坦伊斯兰运动的初始值估计初始化过程具有重要意义;一旦获得成功,这些参数的测量惯性测量单元(IMU)可以用来改善连续跟踪的准确性和鲁棒性,以及找到的米尺三维(3 d)可视映射。

在早期的研究中,一些研究了初始化方法,如代表联合方法[17- - - - - -19和分离方法16,20.,21]。(我)联合visual-inertial初始化方法是由Martinelli开创17],它假定所有功能正确跟踪框架。虚假的铁轨导致可怜的实时性能。在后来的研究,提高了皇帝等人用一点牺牲的精度(18]。该方法在19]遭受低初始化召回;它只在百分之二十的工作轨迹点,这可能是一个问题的机器人应用程序的系统需要立即启动(2)不相交的方法是首先介绍Murartal和缓慢的16),后者由秦和沈和阳和沈20.,21具有良好的性能。在这两种情况下,IMU的参数估计在不同步骤通过求解一系列线性方程的最小二乘方法如高斯牛顿(()和Levenberg-Marquardt (l m) [22,23]。(方法是建立在牛顿法的基础。它执行局部收敛速度高,但一些限制依然存在,例如大型迭代增量可能导致全局收敛速度慢(24,25]。在后来的研究中,Levenberg [26和马夸特27)建议使用阻尼(方法,迭代步的大小和方向的影响阻尼参数。它使这个方法没有一个特定的线搜索保证全局收敛性能(28]。然而,解一组复杂的方程为每次迭代需要几次,这可能会导致减少的速度解决方案

总之,初始化的速度收敛VI-SLAM系统是很重要的。本文的贡献在于,提出一种改进的迭代策略基于信赖域方法加快初始估计。

我们初始化方法的流程图如图1。它可以分为四个步骤:首先,采用纯视觉ORB-SLAM模型中的所有变量的初步阶段。其次,IMU preintegration技术采用IMU-camera频率对准在同一时间和关键帧的一代。第三,迭代策略基于信赖域介绍了陀螺仪偏差估计,而重力方向是雅致。最后,加速度计和视觉偏差估计的基础上先前的估计。在实验中,定性和定量分析在公共数据集(29日]给出演示我们的改善效果。结果表明,初始值估计可以聚集在一个更快的速度,以及速度和姿势传感器套件可以更准确地估计比原来的方法。

本文的其余部分组织如下:部分2描述了IMU最初估计的过程。然后,改进的迭代策略中所描述的部分3。中所描述的实验部分4。结论是在一节5

2。IMU初始估计

在本节中,IMU的初始参数估计。IMU身体的关系框架{B}和摄像机坐标系与比例因子C{}定义 考虑;它是描述如下: 在哪里 分别代表旋转矢量和翻译。

乌兹别克斯坦伊斯兰运动preintegration技术(30.,31日)采用IMU-camera频率对齐。为了使所有的变量可观测的,纯单眼视觉大满贯系统(9,10)启动几秒钟生成关键帧。乌兹别克斯坦伊斯兰运动参数估计的详细过程描述如下。

2.1。估计陀螺仪的偏见

陀螺仪偏差估计可以获得连续两个关键帧的已知的取向。首先,我们假设偏差的变化可以忽略不计;即。,the bias 是一个很小的常数值。然后,区别preintegration陀螺仪测量和方位估计的纯视觉大满贯是最小化: 在哪里 表示关键帧的总量, 计算的取向 和校准 , 表示preintegration陀螺仪测量连续两个关键帧之间, 表示指数映射 ,在哪里 代表一个旋转矩阵, , 是一种相应的向量, , 代表了雅可比矩阵。分析可以找到类似的表达式的雅可比矩阵(31日]。

2.2。估计重力方向

重力方向加速度的估计有很大的影响;之前应该是精制加速度计参数估计的偏差和规模。特别是,一个新的约束,即。,重力大小 ( ),介绍了。{女}的框架,重力方向可以计算如下:

旋转 可以计算的角度吗 之间的两个方向向量:

,重力向量可以表示如下: 在哪里 可以通过计算两个角在吗 轴和 轴在坐标系{我}和旋转 轴在没有影响

2.3。估计加速度计的偏见和规模

一旦准确陀螺仪偏见和重力向量得到,位置,速度和旋转可以通过积分计算操作。考虑加速度计偏差,造成的影响 也调整,可以在两个自由度的干扰 ;;方程(5)可以改写如下: 考虑加速度计的偏见的影响,它可以获得

时可以消除速度连续三个关键帧之间的约束条件考虑在内。获得了线性关系如下: 在哪里 , , , 参数化如下: 在哪里 表示矩阵的前两列。叠加所有连续三个关键帧之间的关系(8),就可以形成一个线性系统为下列方程 它可以解决奇异值分解(计算方法。在这种情况下,它包含 方程和6个未知变量,需要至少4关键帧来解决系统。

3所示。改进的迭代策略

方程(2)是一种典型的非线性最小二乘问题,常见的解决方法(算法采用(16]。(方法提供了一个高的局部收敛速度,但大型迭代增量可能导致全局收敛缓慢甚至发散。为了解决这个问题,介绍了一种改进的迭代策略。特别是,我们的方法是一个信任提出方法相结合(和最陡下降算法;真理的模型如图2

类似于l m算法,目标函数是近似的信任模型,而模型的解决方案被认为是最小函数在当前点。然后,在每个迭代步骤:最小化子问题解决后 在哪里 是目标函数,方程(10)的近似模型 在当前点 , 的梯度 , 代表了信赖域半径, , 的类路径, 海赛矩阵的吗 , 表示正常。在每个迭代步骤中,信赖域半径的调整 改变: 在哪里 被定义为获得比例分母: ,和分子: ,分别是预测和实际下降值。更新的台阶 介绍了算法1

输入: , ,
输出:
步骤1:如果 ,然后把: 在哪里 ,
步骤2:如果 ,然后把:

在这部作品中,充分减少全局收敛性条件假定至少减少了步骤执行广场柯西步骤的减少(32),描述如下: 在哪里 代表了雅可比矩阵;它包括残差的梯度,可以发现在22]。

假设 方程解(10),由于我们方法相结合(和最陡下降算法,解决方案 的基础上获得的两个步骤的选择吗 的关系两个步骤描述如下: 在哪里 最陡下降算法的步骤和吗 的步骤(算法。

根据方程(13),有两个国家发生 :(1)(点以外的信任区域

的路径迭代策略包括两种情况,第一种情况是一个线段从当前的指向 第二个病例是一个线段延长 具体地说,它可以制定 : 在哪里 可以从下列公式计算: (2)(点在信赖域

因此,解决的方法是获得近似路径模型函数的最小值点;所示的过程(算法2)。

输入: , ,
输出:
步骤1:如果 ,然后输出:
步骤2:如果 ,然后输出:
步骤3:其他输出: ,在哪里 通过方程计算(17)。

4所示。实验

在本节中,提出了初始化算法集成到VI-ORBSLAM框架(16),和几个测试评估EuRoC数据集(29日]。为了显示性能优良,我们比较方法与原VI-ORBSLAM VINS-MONO,单眼的版本ORB-SLAM3框架。

4.1。EuRoC数据集

EuRoC数据集有11个序列是由一个微型飞行器(飞行器)收集与视觉惯性传感器套件组装平台。的环境数据采集图所示3,包括厂房场景和人造实验室房间。

根据纹理,照明、运动模糊、快/慢运动序列分为简单,中等,困难组(33]。双目相机(表示CAM0和CAM1)和IMU记录在20到200 Hz硬件时间同步,分别。此外,数据集不仅提供了准确的地面移动轨迹的真理也加速度计和陀螺仪的偏见,提供身体和IMU的速度。在这项工作中,我们只使用单眼相机(左)和乌兹别克斯坦伊斯兰运动测量。所有的实验都在电脑上进行16 gb的RAM, i7 - 9700 CPU(8核@3.00GHz),在Ubuntu 18.04 +旋律操作系统。为更方便分析,性能参数收敛速度的估计,利用定位精度评估V2_01_easy序列EuRoC数据集,加速度计偏差和陀螺仪偏差约(-0.0236,0.1210,0.0748)m / s2(-0.0023,0.0250,0.0817)和rad / s,分别。稀疏的映射结果V2_01_easy与关键帧序列轨迹如图4。初始参数的收敛性能,速度估计错误,关键帧绝对轨迹误差(吃)整个11的序列也进行了分析。详细描述如下所示。

4.2。初始化参数收敛

最初估计的时变特性曲线:加速度计的偏见 ,陀螺仪的偏见 ,重力 ,和视觉范围 ,如图5。我们比较两个文中针对的收敛性能方法:高斯牛顿法和方法。可以看出,所有参数收敛成功地在这两个方法;基于高斯牛顿-(()方法在9秒内收敛,而我们的基础方法在6秒内收敛。特别是,如图5(一个)5 (c)重力,加速度计的特性曲线偏差和遇到严重的振荡在4秒。这是因为飞行器平台没有足够的激励传感器套件在舞台上的静止和轻微的扰动,使加速度计偏差和重力矢量很难区分。此外,陀螺仪偏见收敛于稳定值的估计在很短的时间内(在我们的2秒),如图5 (b)

它证实了提出的迭代策略部分中描述3达到良好的性能。视觉尺度的估计是绘制在图5 (d),应该注意的是,比例因子的最优值是通过手动缩放和校准估计提前IMU的身体真实轨迹的轨迹。结果表明,我们的方法也以更快的速度收敛于最优值比G-N-based方法。

4.3。速度估计

的时间特性曲线估计速度 , , 方向如图所示6。它吸引的比较结果VI-ORBSLAM(红线),地面真理(蓝线),我们的算法(绿线)的测试V2_01序列EuRoC数据集。由于估计和地面事实表达在不同的参考系,估计速度需要提前与地面的真相。它可以知道速度估计遭受不同的漂移 , , 方向,但我们的误差小于VI-ORBSLAM。整体的速度漂移路径是量化表1。而VI-ORBSLAM的速度漂移:(0.0293,0.0165,0.0501)m / s,我们的漂移是(0.0195,0.0110,0.0385)的m / s , , 轴;它可以计算出我们的准确性提高了(33.45,33.33,23.15)%。可以计算的百分比提高准确性 ,在哪里 表明VI-ORBSLAM的漂移,漂移的方法,分别。所以它可以验证,改进的迭代策略对速度估计也有积极的影响。除此之外,值得注意的是,结果是V2_01 10测试序列的中值。虽然我们保持相同的参数和数据集的播放速度(1.5×包文件)的速度在每一个测试,结果仍然略有不同。公平的比较,我们选择中值作为评价指标。的箱线图如图10测试7,中间值表示为一条水平线。

4.4。定位精度

该方法的精度性能还研究了使用整个EuRoC数据集。在这部作品中,开源包:evo [34),采用评价VI-SLAM算法。定性的绝对姿态误差(猿)结果V2_01_easy序列的翻译数据所示8(一个)- - - - - -8 (h)蓝颜色的(a), (c), (e)和(g)编码对应的绝对错误的轨迹,和红色代表误差大于蓝色。面板(b)、(d) (f),和其他(h)画的曲线指标:意思是,中位数,RMSE,性病,如图9,这三个比较猿结果给出的曲线;可以看出,我们的方法具有最好的性能比VI-ORBSLAM和VINS-MONO猿评估。关键帧轨迹与地面实况的对比测试V2_01序列如图10,地面真理由黑色虚线,表示VI-ORBSLAM由蓝线表示,VINS-MONO由绿线表示,ORB-SLAM3由紫线,表示我们的方法是由一个红线表示。与马克思的价值量化比较,意思是,中位数,min, RMSE,上交所,性病如表所示2

定量均方根误差(RMSE)整个11的序列也值中值10执行相同的计算平台。我们的报告结果显示在表中3,图中提供的箱线图也11。应该注意,估计姿势通常不是在同一个坐标系与地面真理;我们需要给一个调整的过程。实际上,我们计算的变换矩阵 从估计对地面真理;猿的 th框架定义如下:

然后,绝对的平移和取向RMSE计算如下:

从表3,就可以知道我们的方法实现在所有传感器配置比VI-ORBSLAM更准确的结果,VINS-MONO, ORB-SLAM3。实际上,我们的方法提供了最佳的性能在六个序列为取向的翻译和七个序列。它可以指出,VI-ORBSLAM不能完全运行V1_03_difficult序列,而我们的方法完全可以运行。此外,我们列出所有序列的平均值在最后一行,那里VI-ORBSLAM计算,0.077年的翻译和1.971度取向,VINS-MONO计算0.111年的翻译和2.427度取向,ORB-SLAM3计算0.042年翻译取向和2.015度,和我们的计算,0.036年的翻译和1.909度取向。VI-ORBSLAM ORB-SLAM3有更好的性能在测试的几个序列等V1_01_easy,V1_02_medium,MH_04_difficult,而我们在其他序列算法性能更好。

5。结论

本文提出的初始化算法的基础上VI-ORBSLAM框架。为了提高初始化的质量,提出迭代策略提出了一种改进的信任。验证了我们的方法在公共数据集和更快的收敛速度在初始化阶段,以及速度和姿势可以更准确地估计比原来的方法。目前,双目VI-SLAM技术工业应用中更具有实用价值。应该考虑有几个关键问题,比如实时计算和在线恢复功能。在未来,我们将努力建议申请双目模型,以及无人驾驶车辆的定位和映射在户外环境中被考虑。

数据可用性

在这篇文章中使用的数据集可以在以下链接中找到:https://projects.asl.ethz.ch/datasets/doku.php?id=kmavvisualinertialdatasets

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这部分工作是由中国国家自然科学基金(61673306)。