几种方法之间的比较分析来描述室外全景图像。主要目的在于研究这些方法的性能在本地化过程的移动机器人(车辆)在室外环境中,当一个可视映射,其中包含图像从不同位置获得可用的环境。有了这个目标,我们利用数据库提供的谷歌街景,其中包含球面全景图像捕获在城市环境和他们的GPS位置。使用这些图像的主要好处驻留在事实上,它允许测试任何小说定位算法在无数户外环境在世界任何地方和现实的捕捉的条件下。这个工作的主要贡献在于执行的比较评估不同的方法来描述图像解决定位问题在一个户外密集的地图只使用视觉信息。我们已经测试了我们的算法使用全景图像捕获的几套不同的户外环境。工作中获得的结果可能是有用的为视觉导航任务选择一个适当的描述方法在室外环境中使用Google街景数据库和考虑到定位的精度和算法的计算效率。
设计汽车自主导航能力的,在未知的环境中,在没有人为干预的情况下,是移动机器人的一个基本目标。为了实现这一目标,车辆必须能够建立一个模型(或映射)的环境,在这个模型估计它的位置。各种各样的定位方法可以在文献中找到。总的来说,机器人的位置和姿态都可以从本体(里程表)或获得外部(激光、摄像头、声纳)传感器,提出了在杜伦的作品等。
对于感受外界刺激的方法,利用计算机视觉环境的创建一个表示非常扩展由于良好的关系
球面图像的可用性代表户外环境如今几乎是无限的,多亏了谷歌街景服务。此外,这些图像提供了一个完整的 有关使用谷歌街景导航问题的文献信息有点稀疏,但近年来不断增长。例如,Gamallo et al。 车辆/机器人的定位可以制定匹配的问题目前捕获的图像与图像以前存储在密集的地图(图像数据库中)。如今,各种各样的检测和描述方法的上下文中提出了视觉导航,但在我们看来,不存在共识这个问题当我们使用户外图像。
Amoros et al。 考虑到这些特点,我们认为值得进行比较评价的性能不同的图像描述符在真实条件下自主户外定位,因为它将是一个必要步骤之前,视觉导航的实现框架。在本文中,我们评估两种不同的方法:方法基于局部特性和方法基于全球的外观。在这两种情况下我们测试的性能描述符根据主要参数配置,我们的图形化表示 户外当机器人自主导航,通常一个粗略的估计机器人移动的地方,和机器人必须能够估计它的位置在这个广阔的区域。这项工作关注这个任务;我们假设机器人导航的区域大约是已知的,它必须在这个领域更准确地估计其立场。这一目标,两个不同的宽领域已被选定评估定位算法的性能,和一组图像单位面积已经从谷歌街景获得数据库。
本文的其余部分组织如下。节
在本节中,我们提出五个不同的图像描述符是适合建立一个紧凑的描述每个场景的外观(
这个研究的最初的目的是比较一些global-appearance方法。然而,我们已经决定在这比较评价包括局部特征描述方法更全面的研究。这一目标,我们选择冲浪由于其相对较低的计算成本比较与其他经典的基于特征的方法。
第二部分提出简要的描述方法中比较评估。
加快健壮的特性(冲浪)介绍了海湾et al。 这样我们在这项工作中使用的方法结合了这两种算法。更具体地说,哈里斯角落探测器用于从图像中提取特征,和标准的冲浪描述符是用来描述之前发现并描述每一个地标。
从一个图像 考虑到这些事实,全球形象的描述 第三个图像描述方法使用在这个比较分析傅里叶签名(FS),描述最初我想et al。( 更具体地说,这个过程来计算FS在于把每一行 结果是一个复杂的矩阵 由于1 d-dft属性可以代表每一行 考虑到这些事实,全球形象的描述 的概念 该方法从开始两个版本的全景图像 面向梯度直方图(猪)描述符是基于梯度的方向在局部地区的形象。它最初被描述由中间人和组织 全向图像捕捉从特定的位置连续地平面包含相同的像素,独立在这个平面机器人的姿态,但以不同的顺序。考虑到这一事实,如果我们计算直方图的细胞有相同的原始图像的宽度,得到一个描述符对机器人的旋转不变。
我们使用的方法是描述在深度(
这项工作的主要目的在于执行一个详尽的描述的性能评价方法在前一节中提出的。所有这些方法都将包括在定位算法及其性能将被评估和比较的计算成本和定位精度。比较评估的结果将给我们一个想法的描述方法,它提供了最好的结果在户外环境使用谷歌街景图片时。
与这一目标,两个不同地区的埃尔切(西班牙)已经选择和谷歌地图的图像取得了这两个领域并存储在两个数据集。每一个数据集将构成地图,随后将使用来估计车辆的位置在地图上通过比较图像被未知的车辆位置与先前存储的图像在每个地图。
两组图像的主要特征如下。
集 集 由于宽垂直采集系统的视场,天空常常是一个巨大的谷歌街景图片的一部分。这个区域的外观将会非常容易变化时定位过程是在不同的时间进行对地图被捕时一天中不同的时间。考虑到这一事实,一个预处理步骤进行了移除一部分的天空场景。
一旦天空的一部分被从所有的场景,图像转换成灰度及其分辨率降低 之后,每个图像将被描述使用五个描述方法提出了部分 一旦地图,为了评估不同的视觉描述符中引入部分 进行本地化的过程中,首先我们选择一个数据库的图像(命名为 定位算法的结果是正确的,如果它返回第一个图片是捕获在地图上点的几何距离测试图像捕获点(与这一目标使用GPS坐标)。我们会将这种情况称为一个正确的定位 重复这个过程对于每个描述方法,使用所有的图像集 提取一个图像的设置(作为测试图像表示);然后,这个测试图像地图淘汰
因此,下一个数据保留一个单独的测试图片:
在这部作品中,通过定位结果表达 在我们的实验中,这种类型的图最重要的信息是最后一点,因为它显示了全球实验结果(最后的精度在考虑所有测试图像)。然而,可以从中提取额外的相关信息,因为图还显示了定位算法的能力找到正确的匹配,同时考虑一个特定的 在运行算法之前,需要定义 首先,在基于功能特性的方法(SURF-Harris)的情况下,有必要提取兴趣点之前描述的外观形象。我们建议使用哈里斯角落探测器( 其次,对于外貌的方法(二维DFT、FS、 需要注意的是,该算法必须能够估计机器人的位置精度,但同样重要的是,计算成本是足够的,知道是否可行的实时解决问题。估计计算成本,我们有计算,考虑两个地图在实验中,必要的时间来计算每个测试图像的描述符,来计算距离映射描述符和检测最相似的描述符。我们必须考虑到所有地图图像的描述符计算定位前,在一个离线的过程。除了时间,我们也估计所需的内存来存储每个图像描述符。
完成,我们也建议研究的关系
正如在前一节中提到的,建立的目的与每个描述符正确定位机器人的能力(或车辆),我们已经建立了
除了它之外,定位算法的性能 定位算法的结果考虑正确的匹配 定位算法的结果考虑正确的匹配
在所有情况下,结果表明:SURF-Harris描述符提供了一个相对更好的性能比较其他描述符,在准确性和使用这两种图像集。至于方法基于全球外观而言,猪的好行为可以突出显示。的本地化
一些额外的结论可以通过比较方法在开放区域的性能(集
除了定位精度,同样重要的是研究过程的计算成本,因为在一个真正的实时应用程序必须运行,随着机器人穿越环境。通过这种方式,我们在所有情况下都得到必要的时间来计算描述符测试图像的一方面和比较它与描述符存储在地图,发现最相似的描述符,另一方面分析结果。本地化过程的平均计算时间在考虑所有的测试图像显示在表中 平均计算成本的描述算法研究,每个测试图像。对于每个描述方法和数据集,表显示第一个必要的时间来获取测试图像描述符和第二时间比较它与地图的描述符和获得最终的定位结果。
二维傅里叶
傅里叶签名
猪
SURF-Harris
数据集 0.0087秒
0.0080秒
0.4886秒
0.0608秒
0.5542秒
数据集 0.0015秒
0.0058秒
0.0006秒
0.0008秒
25.8085秒
数据集 0.0085秒
0.0079秒
0.4828秒
0.0621秒
0.5389秒
数据集 0.0012秒
0.0047秒
0.0005秒
0.0006秒
19.3931秒
关于计算成本,基于傅里叶变换的方法明显比其他人更快,而SURF-Harris提出了相当高的计算成本。对必要的时间来比较两个描述符,
最后,我们获得的平均内存大小需要存储每个描述符。结果如表所示 必要的内存来存储每个描述符。
二维傅里叶
傅里叶签名
猪
SURF-Harris
描述符
16384个字节
32768个字节
4096个字节
8192个字节
110400个字节
考虑这些结果会同定位的精度,我们可以说SURF-Harris描述符显示了非常好的结果在定位精度但其计算成本使其不可行的解决实际的应用程序。猪,这是第二次在准确性方面,也有一个很好的计算成本,所以我们认为这有趣的研究更彻底地描述符是未来工作和实现更高级版本的这个方法来优化精度。同样,其他类型的距离比较图像也可以研究,除了欧氏距离。出于同样的原因,我们也考虑适当的检查更彻底
最后一个实验,我们研究了关系 的关系
在这篇文章中,我们已经进行了比较评价的几个场景的描述方法,考虑到这些方法的性能准确解决问题绝对定位在一个大的真正的户外环境。我们两种不同的方法评估的视觉描述符,局部特征描述符(SURF-Harris)和global-appearance描述符(2 d离散傅里叶变换,傅里叶签名,猪,和
所有的测试已经进行了谷歌街景的照片,在现实条件下捕获。两个城市的不同地区被认为是一个开放的区域和纯粹的城市狭窄的街道。每个区域的捕捉点呈现不同的地形。第一个是网格地图覆盖几个街道和途径和第二个线性映射(即。捕获的图像,当移动穿过一个线性路径在一个狭窄的街道)。
一些不同的研究一直在进行。首先,我们已经评估的准确性本地化过程。要做到这一点,
我们还研究了每个描述符的行为的描述符之间距离比较几何距离图像捕获点。要做到这一点,我们绘制一条曲线代表描述符之间的距离和几何距离捕获点。这个措施执行导航任务是非常有用的,因为多亏了它,我们可以估计的范围使用描述符。
值得注意的是,SURF-Harris描述符是最合适的描述符的定位精度,但它呈现了一个较小的区域工作的描述符之间的欧氏距离。猪描述符显示一个相对良好的性能解决定位问题,提出了一种良好的反应描述符之间的距离和几何距离捕获点。如果我们分析联合这两个实验的结果,考虑计算成本(表
我们计划扩展这项工作(a)捕获一个真正的户外旅行轨迹沿着几个街道和捕获全向图像使用反射折射的视觉系统,(b)将该视觉系统提供的信息和谷歌街景的照片,和(c)评估性能最好的描述符概率定位过程。
作者宣称没有利益冲突。
这项工作已经被西班牙政府通过支持项目DPI 2013 - 41557 p,