基于集群的分布式位置服务的策略

文摘

新战略提出了基于集群的分布式位置服务来解决通信瓶颈和脆弱性在集中式系统结构位置服务。提出战略,density-first聚类方法用于建立位置信息为用户配置文件,和邻近用户组满意(k,d)匿名模型。当有位置服务请求,许多邻居用户组满足密度指标条件确定首先,然后概要文件位置相似的服务请求者和邻居用户计算,最后是协同过滤推荐方法推荐相应的位置服务。位置数据集上的实验结果表明,该策略可以为用户提供足够数量的位置服务和(k,d隐私安全定义可以保证用户位置信息的隐私。

1。介绍

移动互联网技术的快速发展,各种类型的移动终端应用程序是融入人们的日常生活提供快速,简单,和满意的服务,例如,实时导航、路径规划、和询问附近的食物,景点,和便利店1]。现有LBS应用程序的工作过程如下:(1)移动终端设备发送位置信息和位置服务请求到服务器,服务器(2)推荐候选人的位置服务根据用户的位置信息。大多数现有的位置服务架构采用集中位置服务器模型,哪些位置服务根据不同的评估标准,如体积分数,和距离,然后推荐排序位置服务的候选集,用户二次筛选。然而,集中的位置服务模型也有一些缺点。首先,位置服务结果的排序优先条件密切相关,导致用户提供相同的筛选条件将得到相同的位置服务推荐的结果。其次,集中位置服务模式面临巨大隐私安全威胁。例如,一些应用程序收集和发布用户位置信息和定制的偏好,导致用户隐私信息的泄漏。第三,集中位置服务系统结构具有高负载的缺点在中央节点和恶意攻击的脆弱性。因此,它成为一个研究热点,如何克服的缺陷集中的位置服务模式,为用户提供个性化、高质量的位置服务,保证用户的隐私信息领域的定位服务。

目前,大部分的位置服务应用程序推荐的热点位置服务只考虑用户的位置信息。方法简单,位置服务结果流行和单一,不能满足个人需求的用户。这一现象的主要原因是现有的位置服务推荐机制忽略了用户的属性偏好,不考虑用户的潜在的个人差异。为了考虑到用户的属性和位置服务的个性化偏好推荐机制,本文建立了用户位置信息为每个用户概要文件和引入评分机制来描述用户的个性化偏好。协同过滤算法广泛应用于电子商务等领域。这个算法被用于根据用户的个人需求推荐合适的产品(2]。和位置服务的协同过滤算法设计建议基于用户位置信息概要模型。此外,同时提供高质量的定位服务,如何确保用户的位置信息的隐私一直是研究热点领域的定位服务。Grutester和格首先提出k的时间位置服务的隐私保护方法(3,位置服务的隐私保护方法有很多,如微分隐私保护方法,微扰,错误的位置和泛化4,5]。基于k时间的隐私保护方法,(k,d)隐私保护模型的目的是提供高质量和个性化的位置服务,确保用户的位置隐私安全。此外,集中位置服务系统结构的缺点是沉重的中央节点负载和低的隐私安全。因此,分布式位置服务系统结构逐渐位置服务领域的应用。文献[6)提出了一个k的时间位置隐私保护方法在点对点结构利用邻近用户位置信息,但本文忽略了用户节点之间的隐私安全问题。负责人提出用户磅共享机制(MobiCrowd),以减少用户的自己的位置的机会接触到服务器,但面对寒冷的泄漏和初始磅请求的隐私泄漏7]。因此,本文设计了一个新的战略位置服务建议现有的位置服务系统。首先,位置信息与用户的偏好被认为是概要文件,确保位置服务的质量和个性化需求。其次,满足的相邻的用户组(k,d)隐私模型构建,确保信息隐私。最后,基于分布式结构,设计了协同过滤推荐算法,推荐位置服务,避免了问题的集中位置的关键节点服务器上沉重的负担。

我们的主要贡献可以概括如下:(1)用户位置信息概要模型,提出了设计和评分机制。这个过程被认为是用户的位置的密度,用户的社会属性和用户首选项和满足用户的个性化需求的位置服务。(2)(k,d)隐私安全模型设计并用于确定相邻的用户组,确保隐私的信息。(3)位置服务基于分布式体系结构的协同过滤推荐方法是为了避免计算负载和隐私安全威胁存在的集中位置服务器。

本文的组织结构如下:部分2描述了相关工作;部分3描述的主要内容推荐的位置服务策略;部分4通过实验验证提出的策略的可行性,比较了算法的性能;和部分5给出了结论和研究展望。

大多数现有的位置服务应用程序的模型采用集中式匿名服务器架构,面临着严重的隐私安全威胁,如服务器攻击,数据泄漏,或链接攻击用户位置信息、背景知识的袭击,并均匀的攻击。因此,如何提供高质量的定位服务,同时保证用户的隐私已经成为很多学者的研究热点。

为了提供位置服务,一些文献结合社区与位置服务计算,使用聚类算法来识别用户的共同利益,和尽可能多的收集相关的数据来估算用户首选项。同时,应用程序发布的尽可能多的信息来帮助用户选择位置服务,如用户的分数和司机在出租车上软件(8]。尽管收集和发布更多用户信息可以提高定位服务的质量,这也进一步增加了用户隐私信息披露的风险,比如最近的恶意犯罪汽车司机和出租车用户。因此,如果用户信息的集中存储和传播可以减少位置服务的用户隐私信息泄漏的概率和规模可以降低。文献[6)提出了分布式系统下的位置服务应用程序结构和使用k匿名方法来保护用户的位置信息安全基于点对点架构;文献[7)使用位置服务结果缓存机制建议位置基于分布式结构;文献[9,10)你的邻居位置信息推荐使用位置服务基于分布式体系结构。此外,还有一些位置隐私保护方法为分布式位置服务架构(11- - - - - -13]。例如,文献[11)使用移动客户端缓存位置数据基于分布式系统提供的位置服务,以避免暴露位置信息到服务器;文献[12)的结合使用缓存和用户协作保护位置隐私;和文献[13]使用P2P结构位置隐私保护和减少位置隐私泄漏的可能性,通过移动设备的能力和协作推荐的方法。这些研究成果的主要贡献是如何减少分布式系统下用户隐私泄露的风险。

也有很多研究结果位置数据的隐私保护方法。其中,k时间数据保护方法首次应用领域的数据发布。它的主要思想是把用户的真实数据藏在一个集合包含K数据(14]。现在研究结果的基础上k时间的隐私保护方法被广泛应用于各种数据和应用领域。研究结果的基础上k匿名模型也丰富。例如,Machanavajjhala等人提出了l多样性模型(15)和刘等人提出了一个(α,k)匿名模型,需要满足k匿名和确保其多样性α(16]。基于的想法k匿名性和l多样性模型,提出了一种(k,d)隐私位置服务应用程序和模型建立了一个基于集群的邻居用户组。你的邻居用户组满意(k,d)隐私安全需求。也就是说,至少k用户和d位置服务类别包含在你的邻居用户组,并且没有要求位置服务的数量。模型是对链接攻击和背景知识攻击和均匀的攻击,同时提供足够数量的位置服务。聚类算法广泛应用于位置数据隐私保护的研究,尤其是K-top和k - means聚类方法(17,18]。在文献[19),density-based聚类方法是首次提出。在我们工作的研究背景,用户位置点密度在该地区是用来测量在该地区用户的活动。更高密度的位置点表明用户更活跃在这一地带,并推荐一个高质量的位置服务的概率越高。因此,本文介绍了一种density-based测量方法建设的用户位置信息档案和建立相邻的用户组。

协同过滤推荐算法广泛应用于网络服务和电子商务。算法使用用户之间相似性的信息推荐服务,用户可能喜欢。更详细的信息收集,将获得更准确的结果。但该算法仍然是不成熟在位置服务领域,它也面临着数据信息隐私泄漏的风险。目前,协同过滤推荐算法的隐私保护方法主要包括随机干扰方法和组匿名化方法(20.- - - - - -22]。文献[9考虑位置相似性推荐位置服务基于分布式系统,但是很难得到更高质量的定位服务。文献[10]认为用户社会属性的相似性,利用协同推荐算法的推荐位置服务,但它忽略了用户隐私保护。因此,本文设计了一种新的分布式位置服务推荐策略基于聚类方法。在这一战略中,用户使用密度基于指标的聚类方法建立自己的位置信息资料。然后邻近用户组根据地理区域,建立了相邻用户组可以满足(k,d隐私安全定义和利用协同过滤。协同过滤推荐方法推荐相应的位置服务。

与现有方案相比,该方案采用了密度聚类方法来构造用户位置信息概要文件,这样用户的位置信息是尽可能聚集;邻近的用户组根据聚类方法,建立了满足(k,d)隐私保护模型。该方案不仅确保了用户的位置信息隐私安全但也提供了足够多的用户位置服务信息。有位置服务请求时,用户位置区域和邻近的用户组位置剖面相似性计算和协作位置推荐方法推荐相应的位置服务。与文献[9,10),该方案可以为用户提供足够数量的高质量的定位服务,同时,提供更严格的安全用户位置信息的隐私。

3所示。协同过滤推荐位置服务的方法

3.1。基本描述

针对集中式匿名服务器的超载和隐私泄露问题,一些学者提出了LBS系统近年来基于分布式系统结构。在文献[6),周润发等人提出了k匿名算法下的点对点,利用ad hoc网络中用户信息和构建自己的缓存信息k时间模型。这种方法仍然需要访问服务器的位置和不考虑节点间的位置信息安全问题。负责人提出了磅共享机制来获得磅在文献[7),但它面临着冷启动问题,初期仍然依赖于集中匿名服务器。文献[9)推荐使用邻近位置服务用户组基于分布式系统结构没有访问服务器的位置。但是当选择相邻的用户来说,地理位置的重叠用户配置文件被认为是,用户位置信息的聚类属性被忽视导致低质量的推荐位置服务的结果。文献[10考虑用户位置信息的聚类,采用协同过滤推荐方法推荐位置服务,服务质量和改进的位置。然而,单一位置信息隐私安全保护机制和同态加密方法仍然引起位置信息泄漏的风险。因此,本文提出了一种新的基于集群的分布式位置服务推荐策略。战略基于分布式系统结构,用户使用density-prioritized聚类方法建立他们自己的位置信息资料,然后建立了一个满足相邻的用户组(k,d隐私安全的定义。当有一个位置服务请求时,许多邻近的符合条件的用户组决定首先,然后服务请求用户之间的相似性和邻近用户计算,最后是协同过滤推荐方法推荐相应的位置服务。

密度越高的位置点在用户活动区域显示了用户更熟悉的面积和较高的推荐位置服务质量。因此,密度优化聚类算法被用来确定与更高的密度和位置概要文件用户位置的评估机制设计。此外,当聚类算法被用来确定相邻的用户组,位置服务的类型和数量信息包含在用户组中尽可能地增加,确保推荐的位置服务的成功率。同时,结合用户位置信息隐私安全问题,你的邻居用户组(k,d)隐私保护模型设计。和邻居用户组至少包含设计的k用户和不少于d位置服务类型。满足了的相邻的用户组(k,d)隐私保护模型总体分散和本地集群的结构特点,可以减少用户的风险被攻击的用户组。

3.2。剖面建筑

基于位置的剖面模型(9],本文设计了一种新的位置信息概要施工方法。每个用户的位置信息概要文件包含该节点的位置信息本身,类别标签,分数组成。构造位置概要文件时,密度测量的位置点优先和得分位置点是根据生成的位置点停留时间和访问频率。最后,位置信息概要能够代表用户的活跃区域就形成了。用户位置信息概要模型描述所示以下方程: 在哪里代表用户的位置信息概要,包括n位置信息,我th位置信息代表的位置坐标 , 时间戳的位置吗 , 类别标签的位置吗 , 的分数是位置,是用户的位置信息的绝对密度,的面积位置概要文件,和价值的用户的熟悉程度成正比。与此同时,代表的分数 ,和得分函数设计如下: 在哪里代表用户的停留时间的位置,z代表的用户访问数量的位置点,和和 ,分别代表了权重比例系数的停留时间和访问的数量评分结果。代表的位置分,比分是单调递增(0,+∞)和范围是[0,1 /b),所以b值是用来控制上限的分数。和一个值是用来控制分数的增长速率。在这篇文章中,一个= 0.8,b= 0.2,得分位置的范围[0,5)。

为了确保用户位置信息的可用性,提高集群的位置点位置概要文件内,密度聚类算法(19采用]进一步为用户位置信息资料进行预处理。用户位置信息的位置点与更高的隐私需求模糊,如家庭和工作单位。然后,分数较低的发散点删除,因为这些散点的绝对密度大大降低位置信息的配置文件导致影响集群的位置信息。因此,预处理主要包括识别和删除发散点,确定用户位置信息的重心位置,并计算当地密度参数和你的邻居距离参数在配置文件中为每一个位置点。当地的密度参数的公式如下: 在哪里和 , 是距离阈值,和当地的密度表示节点之间的距离我小于的数量节点。此外,你的邻居距离参数的公式如下:

除此之外,你的邻居距离参数为当地最高的特殊节点密度计算如下:

这位置点的密度相对较大的地方和一个大被认为是质心位置的概要信息,并与当地的小点密度和大是一个例外。

3.3。施工邻近用户组

的k匿名技术首次应用于领域的数据发布,可以有效防止链接攻击但并不妨碍背景知识攻击和均匀的攻击。然而,的原则l多样性可以克服的缺点k匿名技术。基于现有的k匿名性和l多样性的隐私保护方法,本文提出了相邻的用户组,满意的定义(k,d)分布式位置服务应用程序问题,然后是邻近用户组被用来为用户推荐位置服务。相关定义如下。

定义1 (k匿名)。 设置一组相邻用户,在哪里是相邻的位置概要文件用户,表示为和是位置坐标标识符。对于任何 ,G分为集群 ;中的元素有相同的值,然后邻居用户组G满足k匿名。

定义2 (d多样性)。 设置一组相邻用户,在哪里是相邻的位置概要文件用户,表示为 , 的类别标签位置服务的候选人,和Cstatistic吗_G(c_我)是位置服务类别的分类统计的邻居用户组。然后,如果Cstatistic_G(c_我)≥d,周边用户组G满足d多样性。

如果邻近用户G组满足这两个定义1和2,G满足(k,d)隐私保护的定义。的k匿名性要求相邻的用户组G的每个坐标标识符对应至少k不同的邻近用户,这样很难识别位置敏感信息,和攻击者不能拥有一个概率小于1 /k获得个人隐私信息,即使目标存在于用户组。的d多样性要求至少有d的位置信息类别的用户数量邻近用户组G,而且没有要求的位置服务的候选人。(k,d)邻居用户组模型提出了结合的特点k匿名性和d多样性和它的特点k匿名连接攻击和抗背景知识的特点攻击和均匀的攻击。

构建的步骤(k,d)邻近用户组如下:(1)绝对密度最高的用户被选为中央节点的邻近地区的用户组和用户概要的质心位置的质心位置邻近的用户组。(2)计算相邻用户的相对密度和相对密度。(3)逐步将相邻的用户添加到邻近的用户组,检测(k,d)定义。(4)如果(k,d)的要求,最后重新计算质心位置相邻的用户组。(5)删除生成的邻居用户组的用户集合。(6)重新执行步骤1 - 5为其余用户集合。

相对密度测量公式如下: 在哪里和 , 位置距离测量,位置点的距离吗重心的位置点。相对密度μ对应的位置点位置概要文件在质心位置点的距离小于。相对密度越大μ说明了位置的周边用户密度相对于质心的位置 ,和位置服务的质量就会越高。

此外,当邻近用户之间传输位置服务信息,它还面临着位置信息泄漏的风险。因此,本文使用了Paillier加密方案加密位置信息(23]。

3.4。位置服务使用协同过滤方法的建议

在位置服务应用程序场景设计在这篇文章中,如果用户需要请求磅的位置坐标l_一个从广播的位置,用户请求信息服务;然后,邻近用户组能够满足相对密度要求过滤,位置概要文件用户和小组成员之间的相似性计算相似性和推荐位置服务被送到用户A。最后,用户计算推荐的位置服务的评级使用的相似性得到位置服务候选集和选择评级较高的位置服务。

3.4.1。相对密度计算邻居用户组

邻近的用户组G计算的相对密度μ位置信息的组相对于l_一个用户根据方程(6)。如果密度μ大于预设密度测量阈值,位置服务请求响应;否则,服务请求信息没有回应。

3.4.2。用户位置剖面相似性的计算

邻近的位置轮廓的相似用户和计算请求用户当收到请求者的位置概要文件。相似度越高导致更高质量的推荐位置服务。根据欧几里得相似计算用户之间的相似性度量。总共要有k在概要文件位置相同的位置点,分数的我th位置点x_我和y_我分别和欧氏距离的两个位置概要文件见以下方程:

相似的位置概要文件所示以下方程:

最后,推荐的位置服务和相应的位置剖面相似性被发送给用户,然后一组位置服务的候选人包括位置服务和生成相似。

3.4.3。位置服务结果分数计算

位置服务的候选集包含的n位置服务的结果。任何位置点l_我,有米推荐用户和组属性 ,在哪里 , 的分数是用户相似的吗用户和服务请求者B。为用户服务请求者B,位置服务预测分数计算位置点如下:

最后,预测分数最高的位置服务在服务的候选人被选为最终位置的推荐结果。

4所示。实验和结果分析

为了验证该策略的可行性和有效性,喇蛄数据集是用于模拟和分析。536辆出租车的位置数据的数据集(一个月内24,25)是广泛应用于位置数据分析和研究。在本节中,三个阶段的特点,概要文件的生成算法,包括位置服务请求、响应过程,和协作过滤推荐位置服务将基于喇蛄数据集的验证和分析。评价指标主要包括位置概要文件特性,相邻的用户组的用户数量,数量的服务候选集,和推荐服务成功的概率。同时,进行了实验分析方面的系统架构,算法效率和通信成本。除此之外,该策略与算法相比(CDCLS)提出(7)(MobiCrowd)和(9)(DCRLS)。

4.1。位置信息概要文件生成算法的验证

战略提出,每个节点的位置信息是构建一个位置信息收集概要文件。同时,位置点被评为和位置服务生成候选集。最后,数据预处理进行位置信息概要文件基于密度的聚类方法和发散点,和较低的得分是删除。因为用户位置服务候选集的质量有重要影响磅推荐结果,用户配置文件的相关特性进行了充分验证和分析实际数据集。在这个过程中,节点位置的参数,密度测量,详细分析和其他参数,算法与DCRLS相比。

在实验中,这个概要文件生成算法用于处理536名出租车对象的位置信息和相应的位置信息生成配置文件,然后概要文件位置信息预处理。当地的密度参数和你的邻居距离参数为每个居住点位置计算,和两个参数用于确定质心位置和删除的发散点。随后,最终位置服务候选集将被确定。为方便对比分析,六个出租车相同的文献[9)被选为案例分析,最后得到了所有对象的数据。

6辆出租车对象记录为∼F是随机选择的,和原来的位置信息计划如图1。

(一)

(b)

(c)

(d)

(e)

(f)

位置概要文件生成算法提出的策略是用来处理移动对象∼F原始位置信息集合。主要内容包括计算当地的密度和邻居的距离值的位置点,从而删除离群点和确定位置信息概要文件。根据停留时间和访问的数量,分数和相应的位置信息概要文件生成如图2。

(一)

(b)

(c)

(d)

(e)

(f)

位置概要设计施工方法在本文中删除基于密度的离群值点测量和执行有效的数据预处理的位置信息。比较图1与图2,它可以清楚地看到,加工位置信息概要文件最好聚合和更高的密度。此外,位置服务的候选人设置被使用进球得分函数设计。和参数α= 0.5,β= 0.5,一个= 0.8,b= 0.2,d_c= 100;分数范围是[0 5);和位置服务得分统计过去六选定的移动对象的图所示3。

此外,相同的移动物体的位置信息是与DCRLS的数据相比,比较如图4。

(一)

(b)

(c)

与DCRLS算法相比,更少的位置信息被用来构造位置信息概要CDCLS和绝对密度更高。从比较图表,它表明CDCLS最好集群和更高的数据质量。因此,在实验环境中,它是可行的建议LBS服务为用户通过使用位置信息概要文件生成算法提出,避免隐私泄漏的风险。

最后,位置信息概要文件生成算法被用来处理个人信息的移动对象数据集,数据集包含536移动对象,共有11219955个位置点,平均20930分位置移动对象。在生成的配置文件,共有312827个位置点,平均601分位置移动对象,和平均点位置比例是2.8%。根据邻近用户组构造算法提出了本文中的所有移动对象数据集处理。和k= 10,d= 30集,53个邻近用户组生成。拟议中的位置信息概要算法可以丢弃异常值移动较短的时间和更少的访问时间,位置数据在生成的位置信息概要文件有更高质量的利用率。此外,生成的邻近用户组满意(k,d隐私安全定义,以确保用户的位置信息隐私安全,数据可用性高。

4.2。隐私保护的分析效率

为了进一步分析的隐私保护效率(k,d)隐私保护模型,不同k和d值被设置为邻近的用户组喇蛄数据集,以及生成的邻居用户组满意(k,d隐私安全的定义。有536移动对象数据集,并且每个相邻用户组至少包含k移动对象在生成邻近的用户组。移动对象组中选择根据密度聚类指标,并至少包含的组d位置服务类别。移动对象的隐私泄露风险的变化趋势,与不同的位置数据k和d值如图5。

如图5可以看到,移动对象位置数据的泄漏风险的增加减少k价值。这显然是表明,泄漏的风险往往是平的值k被设置在10。因此,的价值k成立10在本文的实验过程。此外,当k是相同的值,更大的价值d造成更少的隐私泄露风险和隐私泄露的风险不会改变的价值d超过30。因此,的价值d成立30推荐位置服务。当构建一个邻居与不同的用户组(k,d)参数值,算法的执行时间的变化如图所示6。

综合考虑不同的影响k和d值的隐私保护程度和算法执行时间,k是设置为10,d被设置为30个数据集生成最优位置信息概要和建造你的邻居用户组。根据拟议的邻居用户组构造算法,所有移动对象数据集处理,53岁的邻居用户组相应的生成。在我们的工作中,通过评价和分析不同的影响k和d隐私保护的隐私风险价值模型和算法的执行时间,可以得到以下的结论:采用(k,d)隐私保护模型在分布式位置服务推荐策略可以增加执行时间和更大的价值k和d会导致更长的执行时间和降低隐私泄漏的风险。因此,隐私保护之间的平衡和时间成本可以通过适当设置的值k和d。

4.3。验证位置的服务请求和相应的过程

位置服务请求和响应过程和性能进行了分析,验证和参数设置与上一节相同。100用户位置点的数据集选择随机的磅请求者分析实验。服务请求的主题内容是简化为“下次我去哪里?“值得注意的是,在实际的应用程序中,服务主题和相关参数可以根据具体实际情况灵活设置。

伦敦商学院的请求和响应过程如下:(a)当用户请求一个磅,截断参数的距离d_c是集。(b)的邻近用户组满足密度要求的过滤数据集。(c)推荐的位置服务是邻近用户组根据协同过滤方法。d_c设置为100、200和300米3组实验。在每个实验中,反应邻近用户组的数量在100年每组随机服务请求如图7。

在每次服务请求,位置服务的候选人被推荐设置为服务请求者根据协同过滤推荐方法。在这项实验中,得到候选服务集元素的数量在每个服务请求r值是100、200和300米。结果如图所示8。

当r值是100、200和300年,分别回应用户的数量的具体统计数据如表所示1。


d_c(m)	最低	最大	平均	失败率(%)

One hundred.	1	752年	153.91	0
200年	5	1294年	340.56	0
300年	13	1485年	498.55	0

从以上数据不难看出,随着的价值r的数量增加,反应邻近用户组和服务提高推荐结果。当r价值是100米,有更少的情况下应对邻国用户组和推荐服务的数量。当r值是200或300米,响应用户的数量和推荐服务的结果往往是稳定的和更好的。

4.4。CDCLS之间比较,DCRLS, MobiCrowd

提出算法CDCLS、DCRLS MobiCrowd是基于位置服务系统的分布式系统结构模型,但他们有显著差异的程度依赖集中式服务器、位置信息隐私保护,执行效率和通信成本。以上性能指标喇蛄数据集进行对比和分析,结果如表所示2。


	CDCLS	DCRLS	MobiCrowd

架构层	2层	2层	3层
对可信第三方的依赖	低	低	媒介
同行之间的隐私保护	好	媒介	弱
定位服务质量	好	媒介	低

MobiCrowd算法依赖于集中位置服务器和服务器的访问频率可以减少当用户积累一定位置服务的结果。DCRLS算法主要用于自己的位置信息来提供位置服务和需要访问集中位置服务器时失败了。这两个算法相比,CDCLS算法最不依赖集中位置服务器。当d_c价值是正确设置,集中位置服务器访问的机会是很小的。当这三个算法随机请求100定位服务,访问位置服务器的数量与不同的值d_c。结果如图9。

(一)

(b)

(c)

在相同的实验环境下,通信成本,平均的平均时间服务器和客户端三个算法如图10。沟通成本是衡量TCP / IP数据包的数量。

(一)

(b)

(c)

从数据可以看出10 ()和10 (b)的通信负载CDCLS算法和客户的时间成本是高于DCRLS和MobiCrowd算法。主要原因是附近的用户组分区是由使用密度和绝对密度CDCLS算法。比较其他两个算法,更多的内容是CDCLS计算算法。在服务器端所花费的时间的三个算法相比在图10 (c)。MobiCrowd逐渐增加了基于时间的服务信息的缓存,在服务器端和时间成本逐渐降低,但仍高于CDCLS DCRLS。从分析结果、数据通信负载的CDCLS算法主要发生在客户端。但是,如果d_c值设置合理,服务器端可以被忽略的时间成本。因此,分析结果达到了设计目标的算法。可以证实,该算法基于分布式系统提供了更好的位置服务质量,平衡的通信负载,减少访问位置服务器,避免了现有的隐私泄露风险集中的位置服务模型。

5。结论

本文基于集群的分布式协同过滤推荐位置服务策略,提出了克服低质量的位置服务和隐私泄露的风险在现有位置服务系统。在我们的工作中,基于密度指标和用户位置信息资料(k,d)邻居用户组构造,协同过滤方法被用来推荐位置服务,最后分析了算法在真实数据集。分析表明,该策略可以提供更高质量的位置服务的结果,不依赖于第三方集中位置服务器,克服现有的通信瓶颈和攻击的缺陷集中的系统架构,并确保隐私安全。在未来的工作中,我们将更加注意位置信息隐私安全问题和打算提供更严格的数据隐私安全保证不增加数据计算负载。

数据可用性

本文中使用的原始数据集是出租车流动的痕迹。出租车流动性提供痕迹Exploratorium-the科学博物馆,艺术,和人类感知cabspotting项目:http://cabspotting.org。“基于每个旧金山黄色出租车车辆目前配备GPS跟踪设备所使用的调度程序有效地达到客户。从每个出租车数据传输到中央接收站,然后交付实时调度计算机通过一个中央服务器上。这个系统广播出租车呼叫号码、位置以及是否目前出租车车费。“出租车流动性可以指示后收集的痕迹http://cabspotting.org/api。相关的数据集支持这项工作在手稿中可用的结论或在以下网址:https://github.com/wangpeng68/Cab-mobility-traces。

的利益冲突

作者宣称没有利益冲突的存在。

作者的贡献

彭王负责概念化,数据管理,正式的分析、验证、可视化、初稿写作,审查,和编辑;杨京张Jianpei参与融资收购;彭王、杨京负责研究方法论;彭Wang Jing杨,Jianpei张参与资源获取。

确认

作者承认中国的国家自然科学基金的支持下批准号。61672179,61370083,61402126;中国的黑龙江省自然科学基金批准号F2015030;中国黑龙江省青年科学基金批准号下QC2016083;和黑龙江省博士后科学基金批准号LBH-Z14071。

引用

m·p·辛格,b . Yu和m .实现“以社区为基础的服务位置。”ACM的通信,44卷,不。4,49-54,2001页。视图:出版商的网站|谷歌学术搜索
j . Bobadilla f . Serradilla和j·伯纳尔,”一个新的协同过滤指标,提高推荐系统的行为,”以知识为基础的系统,23卷,不。6,520 - 528年,2010页。视图:出版商的网站|谷歌学术搜索
m . Grutester和d·格“匿名使用基于位置的服务通过时空隐身,”第一届国际会议论文集在移动系统中,应用程序和服务(经验)旧金山,页31-42、钙、美国,2003年5月。视图:谷歌学术搜索
r . b . c . m . Fung k . Wang Chen Yu和p . s .,“保护隐私数据发布:近期发展的调查,“ACM计算调查,42卷,不。4日—53,2010页。视图:出版商的网站|谷歌学术搜索
h . g . Ghinita, l .风扇,c . Shahabi”不同私人位置保护职工在空间数据集众包,“IEEE移动计算,16卷,不。4、934 - 949年,2017页。视图:出版商的网站|谷歌学术搜索
彭译葶。Chow, m . f . Mokbel,刘x”空间隐形匿名定位服务在移动p2p环境中,“Geoinformatica,15卷,不。2、351 - 380年,2011页。视图:出版商的网站|谷歌学术搜索
r .负责人”,躲在移动人群:位置隐私通过合作,”IEEE计算机可靠安全,11卷,不。3、266 - 279年,2014页。视图:出版商的网站|谷歌学术搜索
j . m . Zhang刘,刘y . et al .,“推荐基于时空聚类的出租车司机提货点,”学报》国际会议云&绿色计算,页67 - 72,IEEE计算机协会,湖南,中国,2012年11月。视图:谷歌学术搜索
杨j . p . Wang, j . p .张“基于分布式协作的位置隐私保护建议,“《公共科学图书馆•综合》,11卷,不。9篇文章ID e0163053 2016。视图:出版商的网站|谷歌学术搜索
杨j . p . Wang, j .张”策略对协作过滤推荐位置服务的隐私保护,”传感器,18卷,不。5,1522年,页2018。视图:出版商的网站|谷歌学术搜索
a . Shahriyar l .珍妮。香港杰森et al .,“缓存:缓存扩展地理位置信息的内容来提高用户隐私,”学报》第九届国际会议在移动系统中,应用程序和服务(经验)美国,马里兰州贝塞斯达6 - 2011。视图:谷歌学术搜索
r . Shokri p . Papadimitratos g . Theodorakopoulos, j . p . Hubaux“协作位置隐私,”《IEEE第八届国际会议上移动Adhoc网络和传感器系统2011年10月,瓦伦西亚,西班牙。视图:谷歌学术搜索
c . Chow m . f . Mokbel, x Liu”-对等空间隐形匿名算法基于位置的服务,”诉讼的ACM研讨会上先进的地理信息系统GIS 06年(ACM),页171 - 178,阿灵顿,弗吉尼亚州,美国,2006年。视图:谷歌学术搜索
l·斯威尼。”k匿名:保护隐私的典范”,国际期刊的不确定性、模糊性和以知识为基础的系统,10卷,不。5,557 - 570年,2002页。视图:出版商的网站|谷歌学术搜索
a . Machanavajjhala d麻醉品,j·耶尔克和m . Venkitasubramaniam”L-diversity。”ACM交易数据的知识发现,1卷,不。1,p。2007。视图:出版商的网站|谷歌学术搜索
b . y . Liu Yang, l . i广元“个性化隐私保护并行(α,k)匿名模型”,国际期刊《计算技术的进步,4卷,不。5,265 - 271年,2012页。视图:出版商的网站|谷歌学术搜索
r . j .时任尼加拉瓜和r . Agrawal”,通过最优数据隐私k匿名化”,程序的数据工程国际会议(2005年ICDE)IEEE,页217 - 228年,东京,日本,2005年4月。视图:谷歌学术搜索
彭g·寇,y, g .王”评价聚类算法的使用指标财务风险分析方法,”信息科学卷,275年,页1 - 12,2014。视图:出版商的网站|谷歌学术搜索
a·罗德里格斯和a . Laio”集群的快速搜索和发现密度峰值,”科学,卷344,不。6191年,第1496 - 1492页,2014年。视图:出版商的网站|谷歌学术搜索
a . Boutet d·弗雷r . Guerraoui a . Jegou, a m。Kermarrec”,保护隐私分布式协同过滤,“计算,卷98,不。8,827 - 846年,2016页。视图:出版商的网站|谷歌学术搜索
陈k和l .刘”与几何数据保护隐私多党合作开采扰动。”IEEE并行和分布式系统,20卷,不。12日,第1776 - 1764页,2009年。视图:出版商的网站|谷歌学术搜索
t·朱任y, w .周,j .荣和p .熊,”一个有效的隐私保护于社区的协同过滤算法,”未来一代计算机系统36卷,第155 - 142页,2014年。视图:出版商的网站|谷歌学术搜索
p . Paillier“公钥密码机制基于复合度residuosity类,”密码学的发展EUROCRYPT99艾德,j .干,页223 - 238,施普林格,柏林,德国,1999年,卷。1592年计算机科学的课堂讲稿。视图:谷歌学术搜索
m .来自:Sarafijanovic-Djukic, m . Grossglauser“吝啬的模型移动分区与集群网络,”学报第一国际通信系统和网络研讨会(2009年COMSNETS),页1 - 10,班加罗尔,印度,2009年1月。视图:谷歌学术搜索
j . Domingo-Ferrer和r . Trujillo-Rasua Microaggregation——permutation-based匿名化的运动数据,”信息科学卷。208年,55 - 80、2012页。视图:出版商的网站|谷歌学术搜索