文摘

物联网的发展加快了研究在室内的位置指纹识别技术,为现有无线局域网基础设施提供附加值的本地化服务,而不需要任何专门的硬件。基于指纹定位系统的部署需要极其大量的测量接收信号强度信息来生成一个位置指纹数据库。尽管如此,这一需求很少可以满足大多数室内环境。目标但在这篇文章中,我们常见的情况,当收集测量接收信号强度信息不足,并显示现有位置指纹识别方法的局限性在处理不足位置指纹。我们还引入了一个新颖的方法来减少噪声测量接收到的信号强度最大似然估计的基础上,从不足位置和计算位置指纹通过使用随机梯度下降算法。我们的实验结果表明,该方法可以实现更好的定位性能,即使只有少量的RSS测量是可用的。特别是当观察每个位置的数量很小,我们提出的方法在定位精度有明显的优越性。

1。介绍

随着物联网的发展(物联网)和智能手机等移动设备的普及,各种各样的移动应用极大地改变了人们的生活方式。这些应用程序允许用户访问大量的服务在任何时间在任何地点和经常使用他们的位置信息来为他们提供个性化的体验。

全球定位系统(GPS)可以实现meter-level精度在户外环境。然而,GPS工程建筑物内由于不善造成的信号衰减屋顶,墙壁,和其他对象。在过去的几十年里,各种各样的室内定位系统(IPS)介绍了。因为无线信息访问现在广泛使用,许多这些方法利用无线信号的估计位置。

在过去的几年中,位置指纹(低频)技术使用现有的无线局域网(WLAN)基础设施提出了室内区域。位置指纹匹配的在线测量估计目标位置的接收信号强度(RSS)和最近的(即离线特性。位置指纹)组成的位置坐标和各自的RSS值。相对简单的部署,相比其他无线室内定位技术使用蓝牙信号[1)或RFID标签(2),从而获得更高的定位精度。

部署一个传统LF-based室内定位系统,定位服务器应该生成的位置指纹进行现场勘测RSS来自多个接入点(APs)的信息。这些指纹定位服务器能够定位移动设备根据其RSS测量。现场调查是非常耗时和劳动密集型,这引发了启动一个LP-based本地化服务的成本。此外,定位服务器应该定期reperform更新这个网站调查指纹以便控制错误在多变的无线环境中,也提出了维护本地化服务的成本。

受益于云计算和大数据技术,低频系统也可能部署没有离线网站调查。后(3),已经完成了大量的工作,使指纹的收集基于众包的解决方案。在这些解决方案中,用户需要不断上传他们的RSS测量定位服务器作为训练数据。同时,需要额外的激励机制保证志愿服务用户的数量。

众包指纹时的情况不足以部署一个低频系统,离线网站调查仍需要细化指纹数据库。假设一个室内环境作为一个例子;有一些位置从未被任何志愿服务用户。因此,没有生成这些位置的RSS指纹。为了确保位置服务的功能,服务提供者可能仍然需要执行离线网站调查在这些位置。

无论RSS测量收集通过传统的现场调研或众包的方法,这是一个普遍存在的事实不能收集足够的RSS度量(定期维护指纹)在大多数室内环境。的方式收集RSS测量不是本文的重点。我们感兴趣的是以下几个问题这可能是有趣的和有用的但是,然而,很少研究了现有的研究:(我)在一个给定的位置,需要多少RSS数据来生成一个精确的在线位置或离线指纹吗?(2)最重要的是,当收集RSS不足以产生准确的测量位置指纹数据库,在这种情况下我们如何执行本地化?

尽管这些问题的答案可能有所不同在不同的室内环境中,读者应该考虑深入分析这些问题的指导意义在一定室内应用程序场景。在本文中,我们提出一种新的定位方法,减少了噪声测量接收到的信号强度基于最大似然估计和估计位置从不足位置指纹通过使用随机梯度下降算法。我们也使用一个开放的数据集来评估我们的方法通过比较它与最常用的位置指纹识别方法和调查RSS的数量需要部署一个低频测量系统。结果表明,我们的方法可以获得更好的定位精度,只有少量的RSS数据是可用的。

本文组织如下。部分2调查现有位置指纹识别方法。部分3引入了两个主要问题,来自RSS测量不足部署位置指纹识别系统。部分4描述了我们在解决这些问题的基本思路,并给出了详细的解决方案5。我们评估我们的方法在部分6。最后,我们得出结论本文部分7

减少部署一个室内定位系统的成本,许多研究利用现有的无线网络基础设施和位置介绍指纹识别基于RSS的wi - fi信号的测量。的部署位置指纹识别系统通常被分为两个阶段:离线阶段,在这一个网站的调查收集来自多个APs的RSS,和一个在线阶段,基于当前的位置计算观察RSS测量通过匹配算法。

2.1。在线和离线收集RSS测量

至少有四个关键因素可以决定一个低频技术的准确性。

第一个是离线观察位置的密度RSS测量收集生成指纹:更高的精度在低频需要更高强度的观察位置,从而导致较重的工作负载在指纹收集和更新。

第二个是可用的数量信息,包括RSS观测的数量用于生成指纹和维度(APs)观察到的数量在每个RSS观察。现有方法使用信道状态信息(4,5)或光线等环境信息(6)、声音(7,8),温度、湿度、磁或压力数据来提高定位精度。这两个因素处理RSS的充分性度量。

2.2。减少噪音和生成指纹

第三个关键因素决定的准确性定位算法被用来减少噪音。它可以用于离线和在线阶段。

最常见的方法在去噪RSS测量观察多次在同一位置和平均多观察,这样可以减少噪音。与多个观察相同的位置,也可以确保所有可观察到的APs。棘手的部分是如何处理情况有些APs是错过了一些(但不是所有)的观察。一个常见但也天真的方法是简单地设置未被注意的APs RSS 。其他一些方法假定只有APs远离观察位置可以错过(我们将证明这个假设是错误的),让一个阈值(例如, )只考虑RSS测量大于这个阈值。也有方法,使用复杂的算法来减少噪音9- - - - - -11];然而,大多数这些方法也需要大量的RSS观察位置。一些方法使用一个轻量级的机器学习方法来生成有限位置指纹(12),或变化的指纹每一对APs(比如RSS差异13),或者不需要生成位置指纹(14];然而,他们遭受定位精度相对较低。

只有减少测量误差,但仍难以实现高定位精度。有足够的RSS测量,定位精度主要由第四个因素决定。

2.3。匹配算法

第四个关键因素决定定位的准确性是使用的匹配算法在线阶段,输出最终的位置通过比较在线RSS观测的位置指纹。到目前为止,大多数低频系统主要使用,但不限于,以下类型的匹配算法。

2.3.1。概率统计方法

概率统计方法对匹配的问题作为一个经典的分类问题。计算概率,在线观察每一离线候选人属于位置,最后执行基于概率匹配从候选人的位置。定位的结果可以是概率最高的候选位置或从每个候选人位置计算加权平均价值对应的概率。

2.3.2。 最近的邻居

基于上下文信息收集的观察位置, 最近的邻居被定义为 离线候选人位置最相似的上下文信息。的位置 最近的邻居(资讯)有助于定位的结果直接平均或加权平均加权资讯(WKNN)。必须考虑,可以各种上下文信息(例如,无线信号强度,亮度,温度和湿度),和上下文信息的指标量化向量之间的距离应该是精心设计的。的情况下只使用无线信号强度,欧几里得距离的无线信号强度空间通常是用作度量。位置有小的距离与观察的位置 最近的邻居,距离可以用来计算WKNN中的权重。

2.3.3。其他机器学习方法

现有机器学习方法可用于匹配的在线位置的离线位置。神经网络可以在离线阶段,创建的上下文信息作为输入收集在网上观察位置,需要为对象的位置指纹,学习每个维度的权重矩阵的上下文信息,最后输出定位的结果。可以使用支持向量机在小样本、非线性、高维模式识别。匹配和定位可以通过治疗候选地点的位置指纹信息支持向量,通过执行上下文信息收集分类和回归分析在目标观察位置。其他机器学习方法也可以用于位置指纹。

2.4。定位没有网站的调查

现场调查在离线阶段可能会非常耗时和劳动密集型的。最近,许多研究提出基于众包的系统(3,15- - - - - -20.),需要用户不断地观察他们的RSS测量和定位服务器上传数据。这些方法不需要要执行的现场调研,他们不需要地图的平面布置图。然而,需要额外的激励机制来吸引足够的参与,因为上传的人他观察到RSS测量不能获得任何好处像定位精度,但一定会把隐私风险和传输成本。在我们以前的工作(21),我们提出一种新颖的室内导航机制对于购物中心环境,只需要一些店主RSS信息贡献者。与我们以前的工作相比,这项工作改善方法通过调整到更一般的室内位置指纹的场景和我们还评估方法通过比较它与现有的位置指纹识别技术。此外,我们不关注收集RSS测量的方法。我们只对RSS的数量测量感兴趣,不管他们是否收集通过传统的现场调研或一个众包的方法。

3所示。问题定义

在我们的现实生活中有很多情况下当我们要求或被问了一个问题“我如何去?”或“在哪里?“例如,一个消费者可能想要找到一个特定的商店在一个购物中心,或一个病人可能需要在医院找到正确的咨询室。如今,大多数室内环境就像前面提到的购物中心或医院总是有WLAN基础设施;然而,在这些环境中定位仍然是不可用。关键原因处理指纹数据库建立和维护的成本。现有技术高度依赖于一个假设,能够收集足够的RSS度量,通过网站的一项调查,这是非常耗时和劳动密集型,或由一个众包的方法,这需要太多的协作的贡献者。

这里有一个例子显示一个人应该花多少时间在收集RSS测量“足够”。考虑一个非常小的购物中心,总面积只有5000米2包括所有的地板。离线观察收集每1米2至少,在每一个观察位置 观察必须收集。每次观测后,的时间间隔,例如, 秒了,以获得下一个观察。假设一个没有花时间从一个位置到另一个,观察和观测永远不会失败。我们可以计算,他应该至少花150000秒(即, 小时)进行现场调研。如果指纹数据库需要更新每一天,然后我们需要至少5长期员工,每个人每天工作8小时,没有周末,不得在工作休息。记住,这只是很小的购物中心。大型购物中心、工作负载可以非常重。也许这就是为什么业主总是选择部署基础设施提供本地化,而不是“infrastructure-free”位置指纹。

因此,我们的问题是,当RSS测量收集不充分,我们如何进行定位?至少应该解决以下两个问题。

3.1。测量噪声

不足带来的一个问题处理RSS测量噪声在RSS测量。RSS值可以改变大大在不同观测即使在同样的地点同样的美联社,如图1。在这个例子中,标准偏差 。没有去噪RSS测量,可以生成准确的指纹,没有准确的定位可以执行。

可能认为一个直观的解决方案的平均观察邻近的位置不同。这个想法并不总是正确的如图2。假设三个观察地点 , , 在一条线,然后呢 躺在之间 。简单但不正确的解决方案消除干扰的观测 通过加权平均观测 和权重计算的距离 。然而,这种去噪方法并不总是正确的(如果不是总是正确的),因为它依赖的是一个完全错误的假设RSS不同位置在2 d或3 d空间可以通过一个线性函数进行建模。在图2假设美联社位于接近 ;我们可以发现这个RSS美联社观察到 应该比那些观察到吗 。所以,去噪方法一定会减少的价值

3.2。错过了APs

另一个问题涉及尺寸不匹配不同的RSS观测信号空间。当wi - fi执行扫描操作频繁,许多APs可以错过了RSS的观察。RSS的观察结果,甚至从非常可能观察到不同的APs附近的位置。因为之间的距离不同的RSS观测计算高维信号空间中每个AP是一个维度,错过的APs会导致尺寸不匹配。如果RSS测量是不够的,尺寸不匹配可以发生。尺寸不匹配会导致定位失败和错误,我们称这个问题错过了美联社的问题。

我们经常使用一个开放的数据集来展示一个美联社可以错过了在任意观察。数据集是曼海姆/罗盘数据集[22)包含wi - fi的观察不同的地方。我们的实验中所描述的部分6也是基于这个数据集。对于一个给定的RSS观察,APs可分为以下三个类别,如图3:(我)观察到APs。这是观察到的记录。相对地,未被注意的APs中未观察到的记录。(2)不可见的APs。那些不能观察到观察的位置。AP是不可见的,如果没有记录在这个位置观察到这美联社。难以察觉的APs必须未被注意的APs,但未被注意的APs可能是可观测的。(3)错过了APs。这些都是可观察到的但未被注意的记录。

观察到的APs的比例,难以察觉的APs,错过了APs在图所示4。一个有趣的发现是,失踪的AP的概率显然不是平均RSS相关值。根据这一发现,是不合理的对待错过了美联社(即RSS。一个未被注意的,但可观察到的AP) ,因为 美联社是难以察觉的。

4所示。基本思想

在下面,我们提出我们的建议如何方法处理了APs和测量噪音。

4.1。处理了APs

考虑一个室内环境如图5。有4个APs表示 , , , 和4观察位置表示 , , , 。在每个观察位置,我们执行一个RSS观察;并在每个观察,特定美联社是错过了。我们可以进一步假设任意观测的位置是未知的,需要本地化。在这种情况下,我们发现很难执行传统的定位,因为这些观察观察不同的APs。如果我们丢弃了APs的尺寸,避免尺寸不匹配,我们会发现,不左信号的空间维度。因此,这些观察结果可以用于传统的定位技术。

我们的想法解决了美联社问题很简单。错过了APs的观察真的不能直接用于位置指纹;然而,观察内的信息是有价值的,因为它告诉所有APs的相对位置关系和观察。回到我们的例子在图5, 错过了在观察吗 。我们的想法是计算 基于其他RSS测量在其他位置的值。所有其他的RSS错过了APs也可以以类似的方式计算。如果我们能计算理论RSS价值为每个错过了APs在所有观察,就可以避免尺寸不匹配可以执行和本地化。详细的算法部分5

4.2。降低测量噪声

我们的想法在某种程度上相关去噪RSS测量我们错过了美联社的问题解决方案。如图5后,我们计算 , , , ,最后我们有4观察每个包含所有4 APs RSS测量。现在,可以由匹配定位RSS观测距离4 d信号空间区位距离2 d物理空间。然而,这种本地化过程的输出远不准确,因为每个RSS测量在每个观察是吵闹的。没有足够的RSS在同一位置测量,传统的定位技术不能有效地减少噪音。

我们利用所有RSS测量计算所有APs的相对位置关系和观察。回到我们的例子在图5,这种关系可以计算主要基于主定位结果。这种关系, 可以用来修改吗 ,和其他RSS测量也可以运用精心计算的重量测量相同的美联社,无论在同一位置或其他位置。然后,新去噪RSS的测量可以用来改善之前的定位的准确性,从而将输出更精确的位置。我们建议的方法迭代去噪RSS测量和精炼的位置,直到收敛。详细的算法部分5

5。设计细节

现在我们详细介绍一下我们提出的定位方法。符号,我们总结本文主要介绍了符号。

假设有 APs在一个区域,表示 信息收集在一个位置可以被描述为一个 维向量: 在每个维度对应AP的RSS信息。如果一个美联社不是观测到的,RSS价值是什么 和被标记为

对于RSS观察不足时,我们假设位置指纹识别算法需要作为输入 离线RSS观察在不同的位置和一个在线RSS观测和输出在线观察位置。RSS信息收集作为一个稀疏矩阵,表示 我们降噪RSS信息稀疏矩阵基于以下两个假设:(我)RSS (dBm)的价值是高斯分布: (2)信号的传播路径损耗指数随着距离的变化: 在哪里 在单位距离路径损耗吗 , 是传播路径损耗指数, 是一个高斯随机变量 的意思。

表示的观测值 th美联社在 ;我们可以获取RSS的值和距离之间的关系 此外,的位置之间的关系 th观察位置( )的位置 据美联社(th ),之间的距离 可以制定

上述假设也在我们以前的工作在21)和许多其他的方法。与这些假设,我们可以计算出RSS错过了APs的值并填写空白项RSS利用稀疏矩阵的最大似然估计概率密度函数: 独立和相同的分布假设 , , RSS是观察到的最大概率 这相当于最小化

我们定义的估计误差 拟合的过程中可以通过使用随机梯度下降法: 在哪里 的长度是一步。

这种拟合过程希望计算大量未知的数据(即。错过的APs) RSS值,只有少量的数据。的收敛结果,拟合过程通常是描述随机误差或噪声,而不是底层的RSS和位置信息之间的关系。为了解决这个问题,一个典型的解决方案是使用正规化,修改目标函数 在哪里 权向量和吗 正则化项。取 正规化为例; 可以被定义为 在哪里 是一个免费的参数,需要调整和交叉验证的方法。在我们的实验中,我们发现,对于大多数APs, 。值得注意的是,它通常是很难使用交叉验证方法,所以提前退出策略也可以使用。

6。评价

在本节中,我们评估我们的提出的定位方法和比较它与一些最常用的位置指纹的方法。

6.1。基准

在下面,我们详细的基准用于我们的实验。

但是。数据集

我们使用一个开放的数据集,曼海姆/罗盘数据集(22),来执行我们的实验。它记录的信号强度802.11 APs,包含数据的离线训练阶段和在线定位阶段,在一个面积约35米宽60米,长度。脱机指纹数据包含14300测量记录130个地点(110条记录),和在线定位数据包含5060测量记录46位置(110条记录)。

6.1.2。比较的方法

我们选择三个最常用的位置指纹识别方法的比较。所有三种方法生成相同的位置指纹数据库也通过简单平均观察位置。(我)加权 - - - - - -最近邻(WKNN)方法(23)是一种确定性的方法计算加权平均的估计位置指纹的位置: 在哪里 代表的重量指纹的位置 。它可以计算 在这里,欧几里得范数(2-norm)。WKNN保持 最大重量和其他设置为零。(2) - - - - - -最近邻(资讯)方法(24是WKNN而设置的一个简化版本 最大的重量 和其他为零。(3)直方图法(25)是一种概率统计方法,计算的概率RSS观察 可以观察到的位置吗 通过使用贝叶斯规则: 在哪里 是归一化常数和 可以计算如下: 在哪里 的体积是 在哪里 是归一化集中的直方图。

6.1.3。实验设置

我们使用一个程序随机选择RSS观察基于两个参数。 代表的数量的观察中选择每个观察位置(离线和在线); 代表一个细胞大小的选择(即离线观察位置。观察位置的体积)。例如,当 2这意味着,对于每个 2区域,不应该有更多的或不少于一个离线观察位置,在这个位置,8选择RSS的观察。在线观察位置是随机选择的,又在这个位置,8选择RSS的观察。使用这些在线和离线数据,位置估计通过使用三种比较方法和我们提出的方法。我们让 2(两个附近的蓝色小点之间的距离图6 在现实世界中,如此 2的最小值 )。实验对每一对执行100次

6.1.4。对比指标

两个指标用于比较不同定位的表现方法:平均定位误差和均方定位误差。

6.2。结果和分析

结果如图78。不同的设置 ,我们说明数据的平均定位误差7(一)- - - - - -7 (f)和均方定位误差数据8(一个)- - - - - -8 (f)所有的定位方法相比。

值得注意的是,实验结果提供一个直接回答的问题,我们在引入上市。从图7(一),我们可以看到,资讯和WKNN可以输出(即准确位置。,的米ean localization error is about 2 m) when we can observe at least 4 RSS measurements within an area of 2.5 m2大小。从图7 (b),我们可以看到16 RSS所需测量10 m2区域。这意味着,平均而言,每个人都应该遵守至少每平方米1.6 RSS的测量来实现精确定位。这是这个问题的答案”需要多少RSS的测量来计算一个准确的位置吗?“与我们的实验设置。

结果还表明,我们提出的方法可能是一个问题的答案“我们如何准确定位不足RSS测量吗?“我们可以看到,任何的值 ,我们提出的方法达到平均定位误差和均方较小定位错误,特别是当 (观察位置)的数量相对大 (观察每个位置)的数量相对较小。这是合理的,因为传统的方法可以消除干扰RSS测量在同一位置,所以我们建议的方法没有明显优势大 和一个小 。然而,随着一个小 和一个大 相比,我们提出的方法可以(虽然方法不能)解决了美联社的问题和降噪RSS测量在不同观察的位置。

资讯的表演和WKNN几乎是相同的,和直方图方法的性能不如其他方法。总是有一个很大的平均定位误差和均方误差。此外,直方图方法无法估计一个位置时,RSS测量是不够的。失败率是如图9

7所示。结论

探讨RSS测量不足带来的定位的问题,也就是说,错过了美联社问题和RSS测量噪声问题。传统的位置指纹方法依赖于大量的RSS观察相同的位置最后观察所有APs,不能错过APs位置指纹和降噪RSS测量平均RSS观察在同一位置。我们提出一种新的定位方法,利用最大似然估计和随机梯度下降法来估计位置,以防RSS不足以产生准确的测量位置指纹。结果表明,我们的方法可以获得更好的定位精度比最常用的位置指纹方法像资讯,WKNN,直方图的方法。特别是当观测的数量在每个位置是相对较小的,我们提出的方法具有明显的优越性。

符号

: RSS的测量 th的位置 th美联社
: 的坐标 th观察位置
: 的坐标 th美联社的位置
: 之间的距离
: 所有的RSS测量
: 的估计误差
: RSS的观察测量
: 观察位置的数量
: APs的数量
: 观察每个位置的数量
: 每个观测位置的体积。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是支持部分由中国国家自然科学基金资助下61602111,61320106007,61402104,61502100,61532013,61572130,61632008,中国江苏省自然科学基金资助下BK20150628, BK20140648, BK20150637,协同创新中心的新软件技术和产业化。