文摘
基于广泛的802.11的无线技术带来了一个很好的机会为室内定位系统。在本文中,我们提出一个新的基于802.11的室内定位方法利用支持向量回归(SVR),由离线训练阶段和在线定位阶段。模型描述了位置和接收到的信号强度之间的关系(RSS)的移动设备建立由SVR在离线训练阶段,和在线位置阶段准确的位置是由这个模型。由于复杂的室内环境,RSS是脆弱多变的。为了解决这个问题,通过统计分析获得的数据过滤规则应用在离线训练阶段提高训练样本的质量,从而提高预测模型的质量。在在线定位阶段,次连续测量是用来获得高质量的RSS输入,保证训练样本的一致性,提高移动设备的位置精度。性能评价表明,该方法具有较高的定位精度与概率神经网络方法相比,和存储容量和计算能力的需求同时也低。
1。介绍
位置识别的关键之一是普适计算的成功。各种各样的普遍应用,如行为识别、智能药物,智能建筑必须得到准确的位置信息的移动设备/用户为这些设备提供准确和及时的服务/用户[1- - - - - -3]。
如今,全球定位系统(4占据了市场的定位系统。然而,GPS在室内环境中并不能很好的发挥作用,因为它的无线电信号受到的影响建筑,墙壁,等等。为了提供室内定位服务,许多研究者提出了各种各样的室内定位系统基于不同技术的原则。基于IEEE 802.11的定位系统是其中一个最成功的系统兼容,因为802.11的硬件是廉价和可用在很多建筑。现有研究成果表明令人印象深刻的位置精度。
许多基于IEEE 802.11的室内定位系统利用所谓的指纹识别方法,它使用一个两阶段机制,离线训练阶段和在线位置确定阶段。在离线阶段,收集到的信号强度分布的无线访问点(APs)在预定义的参考点操作区域存储与身体协调在数据库中。在在线定位阶段,移动设备样本APs的通信的信号强度范围和在数据库中搜索类似的模式。选择最接近的匹配及其坐标返回到移动设备的位置估计。
IEEE 802.11使用工业、科学和医疗(ISM)乐队在2.4 GHz和5 GHz,和主要的基于2.4 GHz的不合格被称为802.11 b / g / n。2.4 GHz的共振频率是水。这是人体包含水的原因可以打扰这些无线电信号的传输。此外,由于复杂的室内环境,无线信道拥堵,障碍,和限制节点通信范围内,接收到的信号强度(RSS)是脆弱多变的实际应用。定位算法的准确性严重遭受这个脆弱多变的RSS信息。此外,大多数现有的定位方法需要移动设备存储的指纹,这使得更高的存储容量和计算能力的移动设备在现场负责大规模应用。
在本文中,我们提出一个新颖的基于IEEE 802.11的室内定位方法利用支持向量回归(SVR),也包括离线训练阶段和在线定位阶段。准确的位置预测模型是实现由SVR在离线训练阶段,并在在线位置阶段确定确切位置根据接收到的信号强度(RSS)的移动设备。为了解决脆弱多变的RSS信息问题,相应的数据过滤规则通过统计分析应用在离线训练阶段提高训练样本的质量,从而提高预测模型的质量。在在线定位阶段,两度连续测量是获取高质量的输入,利用在线接收信号强度,保证训练样本的一致性,提高移动设备的位置精度。绩效评估和综合分析是通过密集的实验。,结果表明,本文提出的方法相比具有更高的定位精度和定位方法和概率神经网络定位方法,需求和移动设备的存储容量和计算能力同时也低。
本文的其余部分的结构如下。总结相关工作提出了以下部分。部分3详细描述了我们的定位方法,包括SVR-based位置建模、在线离线训练样本过滤次连续测量,输入预处理。绩效评估和分析给出了部分4。最后,部分5结论。
2。相关的工作
2.1。现有的基于IEEE 802.11的室内定位系统位置方法
指纹识别的方法是最常见的基于位置的方法用于802.11的室内定位系统。提出了各种现有方法找到最接近的匹配指纹,包括最近的邻居(资讯)5,6),最小的顶点的多边形方法(7],概率统计方法[8),神经网络(9),和决策树10]。
在资讯巴尔和Padmanabhan提出的方法5),移动设备收集的指纹都是部署在每个预定义的参考点的操作区域。然后最近的位置发现基于最小二乘法在线定位阶段。最后,确定目标的位置的平均最近的位置。改善资讯的准确性定位方法,Bhasker et al。6)认为在线位置期间用户的反馈。最小的顶点的多边形方法(7)类似于资讯的方法。他们是相同的在离线训练阶段。在线定位期间,最小的多边形顶点的位置单元方法接受信号强度值最接近的信号值维向量信号收集的实时检测作为一个可选的顶点,选择最小的周边所有的多边形顶点的多边形和平均的职位是预测结果。
概率统计方法(8)将整个定位场景划分为一系列离散的区域,。每个区域的RSS分布信息是通过培训获得的(通常存储在一个直方图或高斯分布模型)在离线阶段。在在线定位阶段,,观察到的信号强度矢量,,和位置是由以下规则:如果 信号向量的概率是观察到,考虑到移动节点位于位置),然后选择作为移动节点的位置。可以计算如下,根据贝叶斯后验分布的原则: 在哪里移动节点的位置的概率是多少,通常是假定移动节点在每个区域的概率是均匀分布在实际应用程序中,和可以根据计算每个区域的RSS分布信息存储在离线阶段,。然而,这种方法只能获得离散位置信息。因此,连续移动设备的位置信息只能通过插值处理。
Mehmood等人提出了一个基于人工神经网络的室内定位系统(9),其中还包括离线阶段和在线阶段。在离线训练阶段,通过获得的训练神经网络数据。在在线阶段,RSS移动设备收集到的信息作为输入训练神经网络和定位该训练神经网络的输出结果。与概率方法相比,该方法具有很高的定位精度;实验结果表明,平均误差距离减少从2.54米到1.43米。
严(10与训练数据构建决策树在离线阶段,并确定用户的位置指的是树。这种方法比常用的概率统计方法,更有效的神经网络,资讯的方法。Moghtadaiee和Dempstera11)也使用指纹识别方法来实现室内定位与调频广播信号。Oussalah et al。12)提出了一种多变量模糊推理系统指纹的位置,这使得使用最近的邻居在信号空间分类和确定目标的位置的加权组合的指纹。权重确定使用Takagi-Sugeno模糊控制器。
对文献中提出的方法5- - - - - -8,10- - - - - -12),移动设备需要存储整个指纹,把一个大存储容量有限的移动设备的负担。与此同时,这些方法花很多时间在网上搜索整个指纹的阶段。基于神经网络的方法(9)有较大的计算开销,定位算法是通过服务器,没有移动设备,因此它会导致传输延迟,可能会让服务器成为瓶颈。它还导致泄露用户隐私的担忧。这些方法,错误的平均距离约2 - 3米,其中只有少数降低这个值1 - 2米。
Talvitie et al。13)被认为是与现实有一个不完整的指纹数据库覆盖缺口和利用内插和外推方法恢复丢失的指纹数据。提高指纹识别的质量数据的想法是类似于我们的方法。然而,这种情况下是不同的。
2.2。基于支持向量机的定位方法
基于核函数的学习方法(14,15)取得了巨大的成就等方面的数据分类、回归估计、函数逼近。支持向量机(SVM)是一种新型的机器学习方法这样的方法之一,它具有良好的特性,比如更高的拟合精度,更少的参数,和全局最优。这是普遍认为,数据数据时具有更好的可分性扩展到高维特征空间,适合使用支持向量分类、支持向量回归和其他核函数学习方法(16]。支持向量机包括支持向量分类(SVC)和支持向量回归(SVR)。SVR是用于处理函数回归问题。它已经成功地应用于识别系统,非线性预测系统,取得了良好效果。
Battiti [17,18]比较分析了各种定位方法基于统计学习理论(结果表明,基于支持向量机的方法最好的结果),推荐使用支持向量分类位置。阮et al。19]提出的支持向量机方法的使用位置在特设网络。这种方法假设所有节点可以接收别人的信号,有一些锚节点的位置是已知的网络中,并分为节点的位置类别。由锚节点收集到的数据作为支持向量机训练数据集,然后得到分类模型和用于扣除位置在在线阶段。Tran和阮20.)研究了基于支持向量机的无线传感器网络位置估计和分析定位误差的上界和提出一个修改版的质量弹簧优化进一步提高位置估计。冯et al。16)做了类似的工作,提出了一种层次支持向量机(H-SVM)计划进行大规模传感器网络位置和平均误差和方差进行了分析,以及定位误差的概率分布。所有这些研究[16,17,19,20.]研究特别的位置问题,传感器网络基于支持向量分类。与室内定位应用程序的场景是不同的。和位置结果对应于离散类,所以定位精度是离散化的方法和程度密切相关。例如,Tran需要提出的方法预测类和邻班的中点的位置的结果。
吴et al。21)调查的位置估计全球移动(GSM)通信系统基于支持向量回归。利用支持向量回归,他们研究了位置缺失值估计问题提供了理论和实证分析现有的和新的内核。一种新颖的合成实验旨在比较不同的位置估计方法的性能。提出的支持向量回归方法显示了有前途的表演,尤其在地形与当地环境因素的变化。然而,它是蜂窝通信系统,不是802.11的无线局域网。
空间分区方法(22,23)提出了提高定位精度的目标区域的物理空间划分成小面积根据RSS功能。对于每一个划分区域,相应的训练和支持向量机模型应用于缓解的影响变量的位置信号。然而,即使在小区域,信号也可能改变的原因是因为人民运动或网络堵塞等。
像空间分区,邓et al。24也聚集整个无线电映射到的一系列sub-radio地图——集群。之后,内核直接判别分析(KDDA)是用于实现非线性歧视特征提取RSS。然后,提取的特征和物理位置之间的关系建立了SVR。重点是设计特征提取方法可以描述和捕捉非线性RSS模式。
我们的重点是设计合适的数据过滤程序基于RSS的特征信息在IEEE 802.11环境训练数据集,消除异常数据和位置模型与高质量。输入数据的预处理过程还包括获得更稳定的输入。最终目标是实现更高的定位精度。
3所示。SVR-Based位置方法
3.1。位置的过程
SVR-based位置法的核心是确定之间的关系RSS信息收集的移动设备及其基于支持向量回归的地理位置。该方法的框架如图1。移动设备获取其位置信息通过RSS信息收集从802.11 APs部署在预定义的位置。整个定位过程包括两个阶段,离线训练阶段和在线定位阶段。
3.1.1。离线训练
在离线训练阶段,训练数据收集和位置基于SVR模型。如下所示的流程。
(我)原始数据收集。移动设备放置在每个预部署参考点收集APs的RSS信息。
(2)原始数据过滤。由于复杂的室内环境,无线信道拥堵,障碍,和限制节点通信范围内,接收到的信号强度(RSS)是脆弱多变的。为了解决上述问题,相应的数据过滤规则通过统计分析应用于提高训练样本的质量,从而提高位置模型的质量。
(3)利用支持向量回归训练数据。在这个阶段,所有收集到的数据被存储在一个中央服务器和数据过滤和培训也在这个服务器。适当位置后,由培训过滤后的数据建立模型利用支持向量回归算法,移动设备得到这个模型从这个服务器。
3.1.2。网络位置
在在线定位阶段,移动设备从APs收集RSS信息和使用这些信息作为输入的选址模型建立线下培训期间得到真正的位置。如下所示的流程。
(我) - - - - - -次连续测量收集RSS信息。RSS信息收集的移动设备是脆弱的,改变的,即使在相同的位置不一致。为了获得准确的RSS信息,移动设备执行连续测量,得到在线阶段RSS值在每个位置。
(2)输入数据预处理。输入数据预处理分析通过RSS值两度连续测量,排除环境干扰对RSS的价值观的影响,并确定最终的RSS值更准确地描述的关系。
(3)位置。RSS信息预处理后作为位置预测模型的输入训练在离线阶段和最后的位置计算。
在这个阶段,移动设备不需要交换的信息与中央服务器。这是因为我们的SVM模型足够小是存储在移动设备中。与常见的基于指纹的方法不同,不需要搜索所有匹配位置的参考点。
离线数据过滤和在线数据预处理可以有效地减少RSS的瞬态变化的影响定位精度值。然而,主要的或永久的改变发生时,例如,美联社的位置变化或室内布局变化,位置预测模型需要接受再培训,通过收集到的最新数据。这个重新训练过程可以引发的位置误差分析。如果位置误差超过预定义的阈值,再培训的开始。
3.2。基于支持向量回归的预测模型
如图1,位置预测模型描述了移动设备的物理位置之间的关系和RSS信息收到的每个802.11 APs。假设有802.11 APs,表示收到的RSS信息的移动设备物理位置为每一个测量,RSS信息接收到移动设备在物理位置从802.11美联社。表示的坐标移动设备的物理位置。给定一个训练数据集,目标函数的回归是找到映射并使。这种映射关系是非线性的。对于非线性问题,支持向量机方法(21,25将原始数据映射到一个高维特征空间,利用非线性函数然后在特征空间进行线性回归 在哪里表示输入空间的非线性映射函数到一个高维特征空间和分别支持向量重量和偏见。非线性回归模型后变成了一个线性回归模型的输入向量映射到特征空间。参数和计算通过最小化以下正规化风险函数:
在这里,和经验参数和代表了不敏感损失函数(25]
损失函数的值当错误的预测价值小于;否则,应用线性惩罚。
通过引入积极的松弛变量和最小化(4)相当于最小化约束风险函数如下: 受约束 在哪里控制之间的妥协是一个正规化常数,利润最大化和最小化训练集的数量错误,然后呢和代表上下约束模型的输出。
这个约束优化问题可以被定义为下列拉格朗日函数: 在哪里,,,拉格朗日乘数法。的优化必须满足以下条件:
上面的问题可以转化为对偶优化问题用(9)(8)。一个凸函数可以得到: 解决方案可以通过最大化(10)受一套新的约束: 用拉格朗日乘数法和,估计输出可以表示为 在哪里被称为核函数。根据Karush-Kuhn-Tucker(马)求解二次规划问题的条件,只有一些的系数,,不是零,相应的训练数据向量称为支持向量。最后由SVR预测模型的训练图所示2。
在支持向量分类和回归,选择核函数确定输入数据映射。常用的内核包括(我)线性内核 (2)多项式的内核 (多项式的次数和吗和是常数),(3)高斯RBF核函数具有以下形式: (是指定的参数和表示两个输入向量之间的距离),(iv)乙状结肠内核 (和是常数)。
3.3。在离线阶段数据过滤
训练样本的质量决定了最终位置的质量预测模型在使用支持向量回归算法:更好的训练样本的质量,更好的最终模型。与此同时,更精确的模型的输入,更精确的定位结果。无线室内环境,无线信号传输受多种因素的影响,和RSS信息接收到移动设备由于复杂的传播环境是可变的。即使在一个固定的点,RSS信息收集的移动设备将会改变,这可能会影响训练样本的质量和模型输入和影响到最终位置的准确性。因此,为了获得高质量的训练样本,需要对原始数据过滤在离线阶段。和输入RSS信息也必须预处理获得更准确的输入在线阶段。因此,我们将讨论原始数据过滤规则在这一节和输入RSS信息预处理下一节。
有很多现有的方法来缓解异常数据的影响。例如,平均是一个简单和常用的方法,它可以给一个更健壮的测量的异常值。原始数据滤波可以通过简单的RSSI值平均组。无线环境、可靠性始终是一个问题,这使得数据包包含RSS信息容易丢失,导致较低的RSS的价值。基于这种直觉,删除最值的规则可以消除若干值最低的RSSI值组。
然而,802.11无线传输有自己的特点。为了得到更好的结果,筛选规则应该根据这些特征设计。通过分析收集到的数据,概率分布的RSS信息收集的移动设备在一个固定的点APs如图3;我们发现它是符合对数正态分布描述的分布规律(26,27]。
假设 的概率密度函数如下: 在哪里表示收到的RSS信息移动设备的物理位置从美联社th 802.11,的对数平均,对数标准差。
的期望值是
基于概率分布,我们可以设置一个积极的阈值,当且仅当被认为是一个有效的价值。如果值超出了范围,过高或过低时,它被认为是一个不正常的信号值。为每一个测量值,一个有效的值的概率
除了RSS异常值,由于网络拥塞和有损无线链接,包含从美联社RSS信息的数据包可能会丢失,和移动设备可能会记录。即使在一个良好的传播环境,高网络负载会导致包下降。因此,我们需要区分包丢失的情况的情况下移动设备之间的位置关系和相应的802.11 APs使信号非常弱。因此,利用多个测量提出了区分这两种情况。
假设的测量设备是相互独立的,每个参考点的概率,在每个测量、移动设备不能收到的RSS信息美联社在这个位置 在哪里测量的总数,在参考点和移动设备了吗是测量的总数,移动设备收到的RSS信息了吗美联社在参考点。
如果非常高,这表明,移动设备是离的远吗th美联社和接收到的信号强度很低,或移动设备之间的通信th美联社干涉(例如障碍);RSS信息是不稳定的。在这种情况下,即使多个测量不能获得一个有效的信号强度值。如果很低,这表明设备的通信范围内吗th美联社;它能够接受正常的信号强度值。在这种情况下,的下降是由于包包含信号强度信息由于网络堵塞等原因。为了提高位置预测模型的准确性,这些数据记录应该从训练样本中删除。因此,我们定义一个有效的测量阈值。如果,我们相信在参考点的移动设备可以有效沟通th美联社,大多数测量可以获得有效的值;如果,我们相信和移动设备之间的通信th美联社受到更大的干扰,以及移动设备无法获得信号强度的信息;大多数测量是无效的。基于上述分析,我们定义了相应的数据离线期间过滤规则如下:(1)为每一个记录收集的移动设备在APs的参考点,如果是一个有效的测量阈值和,然后记录被认为是无效的,将被删除;如果和,它也被认为是无效的,将被删除。(2)为每一个记录收集的移动设备在APs的参考点,如果和或记录被认为是无效的,将被删除。
第一种情况下的第一条规则描述的情况包含正常的信号强度的数据包丢失由于网络拥塞;应该删除记录;第二例描述情况时生成少量的不可靠记录设备和美联社在通信范围的边缘应该过滤掉。第二个规则描述的情况异常信号时应该过滤掉移动设备之间的通信和APs打扰。
3.4。在网上输入数据预处理阶段
不稳定和异常数据后从训练样本中删除离线时间,和一个精确的位置预测模型。得到高精度的位置信息,在网上阶段模型的输入也应精度高;不稳定,异常RSS数据也应避免。次连续测量收集RSS信息。在线期间,移动设备执行连续测量首先确保可以获得有效的RSS信息;然后输入数据预处理方法消除了异常干扰的数据获得的数据来得到高质量的输入,真正反映了移动设备之间的关系和802.11 APs。
如果平均等简单的规则和删除数据过滤中使用的最小值,也可以使用相同的规则在数据预处理。复杂的数据过滤规则在前面的小节中,我们讨论需要更复杂的预处理的规则。在这种情况下,为了获得有效的RSS信息,我们必须设置一个合适的价值。
假设 在哪里表示RSS信息接收到移动设备的物理位置从802.11美联社。
基于上述分析,遵循对数正态分布分布。让的概率表示在范围内(表示的期望值和)。当考虑到信号强度的情况无法正确接收到移动设备,让表示收到的RSS的概率值移动设备在每个测量范围();然后 在哪里表示的概率,在每个测量、移动设备不能收到的RSS信息美联社在这个位置。
为了确保移动设备能够获得有效的RSS信息后次连续测量在线期间,必须满足以下条件: 在哪里是一个常数接近1。
然后,
在现实系统的价值必须大于或等于派生值从公式(25)。更大的价值是,更多的有效的RSS信息通过移动设备。与此同时,更大的值也意味着移动设备需要更多的时间来衡量,导致时间延迟和恶化的用户体验。应用程序也可能被限制的范围;例如,用户的移动速度是有限的。公式(25)给的下限价值。的真正价值可以确定基于室内无线环境和用户的需求。一般来说,更好的无线传输环境,无线网络负载轻,包损失越少,越低信号的异常的概率越小价值。另一方面,如果用户的需求定位精度很低,值还可以更小。从公式(25),它可以看到的下限价值直接相关的参数和。反映的范围用户的耐受性信号强度的变化,反映出的可靠性保证。最优值应该是由用户的需要和实际环境。
后的值决心,通过移动设备得到了有效的RSS信息在线期间两度连续测量。然后,这些信息预处理如下。
让 对于每个AP,首先计算。如果,让。否则,对数平均和标准偏差的计算期望值的决定根据(19)。如果,被认为是一个有效的值,用吗;否则,它被认为是一个无效的值。最后一个值的均值有效值: 在哪里,是一个有效的测量值,是相对应的有效值的总数吗次的连续测量美联社。
预处理后,我们可以获得有效的和真正的RSS信息与离线训练样本一致。它是预测模型的输入位置,大大提高了定位精度。
4所示。实验结果
4.1。模拟环境
这种定位方法的性能是通过仿真评估。数据来自于真正的部署和实验802.11的无线定位系统,如图4。参考点操作的网格面积包括130点间距为1.5米。在蓝色的点代表参考点的位置,黄色斑点代表美联社的位置,和红点代表了测试位置在线期间。整个系统占地面积221平方米,802.11和25 APs部署在整个地区。在我们的实验中,并不是所有的APs。默认使用的数量APs是17;也就是说,。我们也使用APs的数量更改为研究其对精度的影响。和110信号强度样本收集在每个参考点,这意味着。对于每一个测量,需要250毫秒。
SVR的实现是基于LIBSVM;SVR的参数是固定在一个经验有利的价值:,。测量定位错误,让预测模型预测坐标表示的位置,和表示实际的坐标;位置误差距离计算
在实验中,训练样本根据相应的过滤规则和过滤两度连续测量方法用于在线期间收集RSS信息。中所描述的实验参数表1。
4.2。位置上的数据质量的影响的方法
我们的方法提高训练样本的质量和过滤操作输入数据的离线期间在线期间和输入数据预处理。为了分析影响质量的相应的数据的准确性基于SVR的定位方法,四个实验进行了相互比较。在实验1中,训练样本不过滤离线期间,和移动设备只收集1样本在未知点在线期间。在第二个实验中,训练样本不过滤离线期间,但是移动设备重复8-time测量在线期间在未知点,然后记录预处理。在实验3中,训练样本过滤离线期间,但是移动设备只收集1样本在未知点在线期间。在实验4中,训练样本过滤离线期间,和移动设备重复8-time测量在线期间在未知点,然后记录预处理。图5显示错误的累积概率分布(CDF)距离为这四个场景。平均误差距离如表所示2。
可以看出,实验4的定位精度是最好的,和平均误差距离是0.68米,小于1米。实验1的结果排名第二,平均误差距离是2.25米。实验2;平均误差距离是2.70米。实验3产生最坏的结果;距离平均误差达到10.37米。因此,离线期间和过滤操作在线期间两度连续测量收集RSS信息可以有效地提高定位精度。实验1的结果表明,原始SVR没有训练数据过滤和输入预处理具有良好的特性,比如更高的拟合精度,更少的参数,和全局最优,可以建立良好的非线性映射RSSI和位置之间的关系。为了进一步提高性能,更好的预测模型和更好的输入都是必要的。更好的预测模型较差输入或更糟糕的预测模型有更好的输入不能与最初的SVR因为竞争模型和输入不符合和扭曲的映射关系。这就是为什么实验结果1比2和3的实验结果。高质量的模型由高质量的训练确实需要高质量的输入数据。
更好的模型结合差输入会导致最坏的结果,因为我们的模型并不搜索所有的参考点和结果取决于输入。还差模型结合更好的输入不能带来更好的结果。由于训练数据规模巨大,异常数据的比例很小,对模型的影响相对较小。在在线阶段,采样异常数据将输入完全错了。这是实验结果的原因3比实验2。
4.3。性能比较
为了展示位置方法的有效性(表示为预处理SVR)提出,我们将它与概率统计方法(26](表示为概率模型),概率统计方法的指纹数据过滤和输入预处理(指示为预处理概率模型),SVR方法没有过滤和没有预处理(表示没有预处理SVR),安法(9)(表示没有预处理安),和ANN方法有相同的操作预处理SVR方法在离线和在线期间(表示为预处理安)。对于每个方法,提供的最终位置误差距离如图6。平均的值如表所示3,从中我们可以看到,定位精度的预处理SVR方法(方法)是最好的在所有这些方法。安预处理方法的性能接近预处理SVR方法。安预处理方法的平均误差距离是0.886米。平均误差预处理SVR方法的距离是0.68米。没有过滤和预处理,没有预处理SVR方法的平均误差距离可以达到2.25米,平均误差距离的没有安预处理方法也可以达到2.26米。
因此,有效的数据过滤和预处理操作可以大大提高定位的准确性基于机器学习方法;SVR方法的性能优于人工神经网络方法。与支持向量机模型相比,ANN方法更大的大小及其计算复杂度也更高;因此,安不能在设备端实现的方法。移动设备必须向服务器发送样品的位置结果生成和发送回设备。安在服务器端实现方法,导致额外的延迟和额外的网络超载。
概率模型方法的平均误差距离是2.857米。预处理和过滤,减少到2.19。它显示了良好的数据质量可以提高概率模型的性能。但它仍然不能与SVR方法。与SVR和ANN方法、概率模型没有复杂的数据训练过程预测模型。位置决定通过搜索和匹配过程。SVR和安之间映射关系可以获得更准确的RSSI信息和位置。我们所知,SVR和安通常执行比概率模型,已证明了现有的文献。
4.4。训练样本大小的影响
训练样本的大小是一个关键参数定位算法。它决定了下界的收集数据所需的时间训练。分析训练样本大小对性能的影响,我们改变训练样本规模在1000年和6000年之间。相应的平均误差距离如图7。迅速减少的平均误差距离随着训练样本的增加,当训练样本规模小于2000。当训练样本大小是2000年到4000年之间,平均误差距离减少显著放缓。当训练样本容量大于4000,平均误差的距离几乎是常数随着训练样本的增加。
4.5。核函数的影响
根据支持向量回归理论,内核函数满足Mercer定理的要求将高维特征空间的内积操作转化为低维特征空间中的函数计算(16)解决“维数的诅咒”的问题。位置预测模型获得的不同的核函数将有不同的性能。在实验中,我们测试了线性内核,多项式内核,RBF内核,内核乙状结肠。结果如图所示8;我们可以看到,使用RBF核的位置预测模型精度最高。使用线性内核,平均误差距离是2.44米。使用核函数(乙状结肠,),平均误差距离是2.46米。平均误差与RBF内核使用的距离是0.68米。使用多项式核(,,),平均误差距离是1.15米。在我们的实验中,我们尝试不同的参数对所有内核函数。对于每一个核函数,我们的论文中给出的结果是最好的结果了这些实验。
4.6。APs的数量的影响
一般来说,大量的APs在某些地区会导致更高的定位精度。在前面的部分中,APs的数量是17;现在我们更改APs的数量从1到20研究APs的数量的影响定位精度。APs用于从所有的APs位置是随机选择的。我们重复上述实验一样。结果如图所示9。这些结果与我们最初的预测一致,APs的数量越高,系统的准确性就越高。当APs的数量是20,平均误差最小的距离。然而,APs位置的重要性是不一样的;定位精度不增加顺利,APs的数量的增加。一些APs可能更重要的是影响定位精度的位置比其他APs方法。因此,如何部署适当数量的APs在正确的地方需要进一步的研究。此外,当APs的数量达到一定数量时,可以获得较高的定位精度的定位方法在这篇文章中,但没有显著改善定位精度在APs的数量超过8。
4.7。的决心价值
正如之前所述,参数的值对定位精度有重要影响的系统,这是密切相关的参数和和部署环境。获得一个良好的定位精度,满足用户的需求的同时,应该设置为一个特定的值根据无线传输环境和时间延迟需求的用户,以及定位精度。为了获得的价值之间的关系位置预测模型,我们改变的价值从1到12与对应一个接一个和。实验结果如图所示10。总的来说,定位精度模型的增加而增加的价值。参数的值和识别训练样本过滤标准;更严格的标准,更大的价值所需的准确性达到收敛和定位模型,与此同时,精度越好。相反,标准越低,越少的价值所需的精度定位模型达到收敛和定位精度越低。
4.8。移动设备的资源消耗
由于有限的存储空间和计算能力的移动设备,如何减少数据存储容量和计算能力的需求的移动设备定位方法也是非常重要的。为了减少对移动设备的数据存储容量的需求,文献[28提出了一种基于算法80.11的定位系统。对于这个算法,实验结果表明,该移动终端设备只需要存储12 k字节的数据,极大地减少了对移动设备的存储容量的需求。然而,移动设备需要与数据存储中心交流和更新“指纹”的数据分析,大大加剧了移动设备的通信负载。本文方法,如果训练样本的大小是5000和内核函数的高斯核函数和APs是17日,获得位置的大小只有81 kb的预测模型。它远远小于整个“指纹”数据(6110 kb),大大降低了存储负载的移动设备。安法(9],通常提供定位服务于服务器-客户机模式由于计算的复杂性导致用户隐私保护的问题。对我们的定位方法,计算的主要工作是完成离线期间,它可以计算的移动设备的位置信息在线期间持续的时间复杂度;因此,移动设备的计算能力要求不高。
4.9。过滤/预处理规则的影响
好的数据质量导致精确定位的结果。过滤/预处理规则决定训练数据和输入数据的质量。在我们的论文中,特定的预处理/过滤规则是根据802.11无线环境的特点设计了。为了证明这些规则的效率,我们比较两个其他过滤/我们的论文中提到的预处理方法,平均和删除最小值。结果如图所示11。平均,只有很轻微的改进是实现而无预处理SVR。这两个曲线几乎是相同的。原因是不可靠的无线传输导致较低的RSS的价值观和对定位结果有巨大的影响。删除至少值比平均表现更好,因为它可以消除一些不真实的RSS值低。我们的方法执行最好的,这表明定制的预处理/高精度过滤方法是必要的。
我们还把我们的方法与KDDA [24]。根据现有文献[24),平均误差为1.46 m的实验,这是高于预处理SVR和低于原来的SVR。当然,比较可能是不公平的,因为环境和设置是不同的。因此,我们实现我们自己的版本的KDDA没有位置聚类并使用它作为过滤/位置过程中预处理的规则。如图11,KDDA执行比平均和删除最小值,这意味着将RSS信号映射到一个高维内核空间可以帮助在提取信号特征。然而,我们的预处理SVR仍然执行更好,因为过滤/预处理规则显著提高数据质量通过消除异常数据样本。
5。结论和未来的工作
位置识别的上下文感知计算范例的成功的关键之一是无处不在的和无处不在的计算。在本文中,我们提出一个新的802.11使用支持向量回归的室内定位方法。由于复杂的室内环境,无线信道拥堵,障碍,和限制节点通信范围内,接收到的信号强度(RSS)是脆弱多变的。为了解决上述问题,相应的数据过滤规则和次提出了连续测量方法。,结果表明,本文提出的方法具有较高的定位精度与定位方法和概率神经网络定位方法。需求的移动设备的存储容量和计算能力同时也低。
未来的研究工作将集中在分析APs的位置之间的关系和定位方法的定位精度。给定一定数量的APs,如何充分利用它们来提高系统的定位精度,降低系统的成本是至关重要的实际应用。
利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作是支持部分由中国国家自然科学基金批准号51435009和专门研究高等教育的博士项目基金批准号下20110142110062。