文摘
在当前背景下,是非常重要的研究新的电力系统edge-to-side安全保护的关键技术为大规模物联网异构电力物联网终端和优势代理,包括国防技术水平的设备本体安全、通信交互的安全,和安全访问。意义。新的电力系统edge-to-side安全保护技术总结对室内定位的隐私保护的影响。本文提出了室内定位基于联邦隐私保护方法在移动边学习。计算(MEC)环境。首先,我们分析的学习机制水平,垂直,transfer-federated学习,分别和数学描述它的适用性的基础上水平和vertical-federated学习在不同样本数据特征。然后,数据泄漏的风险数据用于研究或分析时大大减少通过引入微分隐私。此外,考虑到定位性能、隐私保护、资源开销,我们进一步提出一个室内定位基于联邦隐私保护模型在MEC环境中学习和相应的算法。最后,通过仿真实验,该算法和其他三个算法,分别比较和分析的两个相同的数据集。实验结果表明,收敛速度,定位时间消费,该算法的定位精度都是最优的。此外,它的最终定位精度约为94%,平均定位时间是250 ms,性能比其他三个比较算法。
1。介绍
室内定位是指实现室内环境的定位,主要使用无线通信,基站定位、惯性导航定位,动作捕捉,和其他技术集成,形成一套室内位置定位系统,从而实现人员和设备在室内空间的定位。精确位置监控也很重要。为了解决弱室内定位信号的问题,确保定位精度在实际应用环境中,作者在文献[1)提出了一种高精度定位算法兼容两种定位模式通过卫星定位算法的研究原则和超宽带(UWB)定位模式。在该算法下,无缝切换两种定位模式。高精度定位算法兼容两种定位模式,和两者之间的无缝切换定位模式下可以实现该算法。文献[2)设计一个完整的无缝定位系统结合超宽频和GNSS的紧急需求集成室内外无缝定位等应用场景的北斗安全应用和自动驾驶导航。针对传统RSSI和泰勒级数展开的潜在缺陷定位算法,文献[3)提出了一套改进的定位算法适用于电力生产环境服务多样化的室内定位应用程序需求的智能电网。具体来说,通过引入高斯等筛选处理阶段,小波变换,并纠正泰勒级数展开,多余的噪音可以完全移除,计算结果可以优化,可以提高定位效率。
无线通信技术的快速发展在新的电力系统极大地促进了智能电力物联网的广泛推广和应用终端,和位置信息是至关重要的在这些智能终端设备的相关服务4]。通过收集特定的位置信息,智能终端实现位置查询和获取服务、路径规划和导航服务,目标对象识别服务和位置发送和查询服务在紧急情况下(5,6]。基于位置的服务(LBS)已经广泛应用于各个领域包括智能电网。而磅给人们的生活带来了方便,它也伴随着位置隐私泄露的风险。当用户享受室内定位服务,他们经常担心他们的隐私和安全7- - - - - -9]。
此外,用户数量的快速增长和智能终端设备导致的指数增长数据在网络的边缘。因此,传统方法的数据集中存储于云计算中心的数据处理变得越来越不可行(10- - - - - -12]。移动边缘计算(MEC)技术提供了一个有效的解决方案的存储和处理大量的数据在移动网络的边缘。它有效地解决了巨大压力问题带来的大规模数据传输和存储网络和云存储中心下沉数据存储和计算网络边缘(13,14]。然而,随着分布式数据处理方法,MEC节点可能涉及敏感数据的相互交流合作数据处理的过程,这可能会导致数据隐私泄漏(15]。
目前,边缘计算架构下,可以训练位置模型通过收集和发送无线信号强度信息通过智能云边缘设备,但如何保护一些记录与电力用户的敏感信息(如位置信息、电力操作,旅行安排,工作和休息时间),并避免使用这些敏感信息推断出其他用户不希望披露隐私信息,如电力偏好,家居用品,消费水平、行为习惯和社会关系等,是目前迫切需要解决的问题(16,17]。
为了解决定位精度低的问题,长时间消耗,以及抵抗困难cross-attack在传统的室内定位的隐私保护方法,本文提出了一个室内定位基于联邦隐私保护方法在MEC环境中学习。与传统的室内定位的隐私保护方法相比,提出的创新方法如下:(1)用户隐私信息泄露的可能性大大降低,并消除了数据破坏的风险通过引入微分隐私(2)相应的模型综合考虑定位性能、隐私保护、资源开销,提高了隐私保护算法的综合性能
其余本文的章节安排如下:第二章介绍了有关这个领域的研究;第三章引入了基于联邦隐私保护方法学习;第四章是实验部分,验证了该方法的性能;第五章总结了研究。
2。相关工作
用户隐私保护方法的室内定位在MEC的环境中,学者们做了相关的研究,取得了一定的研究成果。
文献[18)提出了一种基于用户位置隐私保护算法改进的k - means算法和l-diversity使用拉普拉斯算子的机制。他们提出了一个用户查询隐私保护算法基于k-anonymity算法,然后提出了一种微分许多基于隐私权磅隐私保护方案。然而,这种方法没有考虑数据收集和聚合操作的隐私问题,适用范围有限。文献[19]划分整个指纹数据库基于em聚类算法。在此基础上,提出了一个隐私保护方案在wi - fi fingerprint-based定位PPWFL使用wi - fi设备,但该方法不能使用相应的指标来评估高用户隐私。文献[20.)提出了一个RPL算法可分为敏感的隐私水平道路段基于道路网络的拓扑关系。在此基础上,采用微分隐私保护机制DPLPM位置分配预算敏感隐私道路部分实现定位数据的隐私保护。然而,这种方法只能在完全信任的室内场景,那是难以抗拒微分攻击在不可信的情况下。文献[21)提出了一个fingerprint-based高精度室内定位系统定位精度,操作能力改变nonline-of-sight环境、和计算简单性为目标函数,实现了用户隐私通过使用多路径传播到伪装用户的位置。然而,这种方法不能满足计算要求高的用户隐私保护。针对地理位置之间的平衡保护和语义位置保护,文献[22)提出了一个优化的隐私微分隐私方案强化学习在车载ad hoc网络中基于微分隐私。然而,这种方法导致定位精度低因为破坏了原始数据分布。文献[23]分析了移动用户位置隐私泄漏的原因和不足5 g环境中现有的隐私保护技术。结合降维的初步处理,隐私保护算法,融合和传输加密方法,融合定位隐私保护方法提出了适合5 g环境。然而,这种方法不能实现鲁棒性移动对象的变化的环境。文献[24)提出了边缘众包室内定位架构来解决隐私泄露的问题在大型室内定位系统的发展。此外,privacy-aware基于安全多方计算的室内定位算法提出了保护位置隐私。然而,该方法的定位时间长,效率很低。
3所示。基于联邦隐私保护方法的学习
3.1。联合学习机制
传统的机器学习方法正面临两大挑战:数据仓库和数据安全与隐私。联合学习已被建议作为一个可能的解决方案由于其能够提供一个学习对协作和安全协议。作为新的建模机制,从多个政党联合学习可以统一模型数据在不影响数据隐私和安全。,许多客户共同训练同一个模型的协调下中央服务器,不能披露各自的数据和训练数据分散。它可以更好地应用于领域数据不能直接聚合培训机器学习模型由于知识产权等因素,隐私保护和数据安全。
多个数据所有者想结合的案例数据,他们必须训练机器学习模型,传统的方法是所有数据整合在一起,使用集成数据训练得到最终的模型 。然而,这种方案通常很难实现由于隐私和数据安全等法律问题。然而,联合学习可以很好解决这个问题。联合学习是获得一个模型的能力通过培训数据所有者无需披露自己的数据。联合学习可以确保模型之间的性能差距和模型是足够小。当下列公式(1)成立,这意味着联邦学习算法的精度损失 :
在公式(1),代表模型的性能 。 代表模型的性能 。 是一个非负实数。
所有的数据k数据所有者是由一个矩阵表示 。在矩阵 ,每一行代表一个样本,每一列代表一个功能。数据的特征空间用 。此外,一些用户可能包含特定标签的数据,如客户价值领域的电力、卫生医疗领域的,购买力领域的销售。标签是由空间 。的ID空间样本用 。特征空间 ,标签空间 ,和ID空间构成了完整的训练数据集 。由于特征空间和样本空间的数据可能不是相同的主题,需要分发的数据根据各方数据的位置特性和样本空间ID。联邦学习分为horizontal-federated学习,vertical-federated学习,transfer-federated学习。不同类型的联合学习架构如图1。
(一)
(b)
(c)
不同类型的联合学习架构在不同情况下使用。当有大量重叠的数据集的特性和参与者之间的小样本重叠,horizontal-federated学习使用。当功能重叠很小,样本重叠很大,vertical-federated学习使用。Transfer-federated学习时使用的特性和样本少重叠。本文主要研究学习和vertical-federated horizontal-federated学习。
在联合学习参与者的数据集,当相同的样本ID是少而有许多相同的数据特性,我们经常使用horizontal-federated学习技术。例如,对于两个相同的电信运营商业务但不同的用户,他们产生较少重叠的数据集样本id但是大功能重叠。如果我们需要把双方的数据来构建一个机器学习模型中,我们通常不直接复制数据由于数据隐私问题。在这一点上,我们可以使用horizontal-federated学习方法模型数据。Horizontal-federated学习是把样本与相同的特点从多个参与者的建模。我们拿出来的数据与不同的id和样品相同的特征来训练模型。horizontal-federated学习解决方案提出的谷歌Android手机模型更新,用户使用Android手机可以在本地更新模型的参数和模型的参数上传到Android云服务器。其他数据所有者可以与用户合作训练集中的模式。
Horizontal-federated学习也称为feature-aligned联合学习;也就是说,参与者的数据样本的特点是相同的。“水平”这个词在horizontal-federated学习可以理解为“水平分工。训练样本的每个参与者可以从总被视为水平划分样本。Horizontal-federated学习扩展训练样本的数量。因此,horizontal-federated学习可以概括的
Vertical-federated学习也可以称为基于联邦的学习。适用于有许多重叠的情况下在多个模型训练样本id参与者的数据集,但一些共同的特征。Vertical-federated学习是把样本与模型训练从多个参与者相同的ID。每一方的数据集分为垂直(即根据功能划分维度),并与相同的数据样本ID和不同的特征来训练模型。例如,在两个不同组织的企业不同,但相同的用户相同的用户说明他们的用户将大大重叠,以及不同企业表明,每个组织都有不同的用户特征。当双方要共同建立一个用户消费预测模型,由于数据隐私保护的要求,任何一方可以直接获得另一方的数据。此时,双方可以使用vertical-federated学习技术,共同建立一个模型。在执行longitudinal-federated学习之前,首先需要了解参与者的样本共享,也就是说,样本对齐。longitudinal-federated学习,参与者的数据集可以被认为是纵向切片从整个大数据表。Vertical-federated学习扩展了训练样本的特征维数。 Vertical-federated learning is to combine different features possessed by participants without directly copying data to each other to enhance model accuracy. At present, vertical-federated learning has realized the modeling of many machine learning models such as neural network models, logistic regression models, and tree models. Therefore, vertical-federated learning can be summarized by
3.2。微分隐私
微分隐私是一个严格的可证明的数学框架的基本思想是将精心设计噪声添加到一个函数的输入或输出,以便修改任何一个记录的数据集不会产生重大影响输出。因此,攻击者不能推断出私人信息数据集通过分析输出结果。
微分隐私定义如下。让 是一个随机算法,和最多是两个数据集和一个记录不同,年代 算法的输出是什么 ,如果算法满足以下公式(4),据说来满足 微分隐私。
在公式(4),是微分隐私预算。值越小,隐私保护的程度越高,但与此同时,算法的精度损失是多少。代表严格的概率微分隐私允许违反,和一般价值很小。
灵敏度定义如下。任何查询功能 , 是输入数据集,然后呢是维向量输出的函数,那么函数的灵敏度显示为
在公式(5),和相邻的数据集,最多相差一个记录,然后呢代表了规范。敏感度反映了最大查询函数的输出结果的变化在一对相邻的数据集。灵敏度越小,低噪音需要添加到输出实现微分隐私。
高斯机制的定义如下。如果规范是用来计算的灵敏度函数 ,然后微分隐私 可以通过添加高斯噪声的输出函数作为
在公式(6),高斯噪声是高斯分布的意思是0的协方差 ,和是单位矩阵。
微分隐私具有以下两个属性:(1)后处理。如果一个算法的输出满足微分隐私,任何操作在这个结果不会导致额外的隐私的损失。(2)串行化相结合的原则。序列化的微分隐私组合算法仍然满足微分隐私属性。
3.3。模型架构
针对当前室内定位方法面临的问题,本文提出了一种基于联合室内定位的隐私保护模型学习MEC环境综合考虑定位性能、隐私保护、资源开销。系统体系结构如图2。
在图所示的系统架构33 - layer MEC框架,将整个室内定位联合学习协议分为云服务器层,边缘服务器层和终端设备层。联合学习与多个参与者都支持协议。假设用户组,用户组2,和用户组3拥有终端设备和收集了大量的室内定位数据,分别。为了能够享受室内定位服务部署在边缘服务器,他们都主动参与indoor-federated学习协议。与此同时,他们都尽最大努力防止泄露他们的数据不可信系统中的实体(如边缘服务器和云服务器)在整个联邦的学习过程。边缘服务器执行聚合和当地子模型训练后接收的数据终端设备摄动,云服务器和共享培训子模型参数获得最佳的全球定位模型。云服务器接收到边缘服务器发送的子模型参数,执行全局模型聚合和协作的更新,并将更新后的模型参数为每个边缘服务器。室内定位联合学习模型分为两个阶段:离线训练和在线定位。整个系统框架的具体描述如下:(1)终端设备。它指的是一组智能终端设备(如智能手机、平板电脑、智能监控设备和智能电力终端)旗下的联合学习的参与者,与计算、存储和通信能力。在离线训练阶段,终端设备可以用来获取和存储本地数据集从多个无线传感器信号在室内面积和独立执行数据预处理和噪声对收集到的数据集。摄动的数据然后送到附近的边缘服务器。在线定位阶段,边缘设备把测量的实时数据,并摄动与噪声边缘服务器获得定位服务。(2)边缘服务器。这是MEC架构的核心实体,通常在用户实现前提(如公园、商场和购物中心),并可能被部署在固定位置。他们有更强大的存储和计算资源比终端设备和作为计算单位之间的云服务器和终端设备。边缘服务器主要进行可信的数据聚合,当地子模型培训和服务的反馈。首先在离线训练阶段,边缘服务器接收摄动附近上传的数据终端设备和骨料指纹数据包含多个用户的数据信息。它使用这些聚合数据进行可靠的培训当地定位子模型、云服务器上传培训本地子模型参数,重复迭代,直到模型收敛。在线定位阶段,边缘服务器使用训练有素的定位模型,为用户提供高可靠和高精度室内定位服务根据实时数据后提交的用户隐私保护处理。(3)云服务器。作为一个数据中心,它有更强大的比边缘服务器存储和计算能力。接收由每个边缘服务共享的子模型参数,使用联邦平均优化算法来更新全球共享的模型参数,并将更新后的模型参数发送给每个边缘服务器下一轮迭代训练,直到获得最优训练模型。为了防止不可信的云服务器的私人训练数据推断每个参与用户通过模型反演攻击或梯度反向推理攻击,隐私保护处理时需要聚合和更新全局参数。这里,微分隐私技术是用于添加适当的拉普拉斯噪声模型参数的每个参与者在联邦学习协议,然后聚合全球参数实现隐私保护和更新。在这些实体中,终端设备被认为是可信的。正确处理收集到的数据,没有披露给其他参与者。同时,边缘服务器和云服务器认为是诚实的和好奇;也就是说,他们能够忠实地执行联合学习协议的过程,正确计算和发送真正的计算结果。然而,他们好奇中包含的隐私数据,尽自己最大的努力分析和挖掘用户的隐私。 During the entire offline training process, the edge server only communicates with the cloud server. It cannot obtain any information about the rest of edge servers except for the jointly maintained global parameters, which guarantees the confidentiality of user data. In addition to privacy issues, the federated learning protocol in the MEC framework may also face the problem of resource constraints of end devices. Because executing complex deep learning models require huge computational overhead, resource-constrained terminal devices cannot afford the training process of complex deep learning models. Therefore, it is essential to design an effective positioning model that does not require too much computational overhead, does not violate the federated learning mechanism, and can protect the privacy of user data at the same time.
3.4。算法描述
MEC架构下,用户收集和发送接收信号强度(RSS)信息通过智能云边缘设备培训定位模型。的基础上,提出了室内定位MEC下基于联邦隐私保护模型学习,提出了一种相应的室内定位的隐私保护方法如下。该方法可以更新用户的本地模型和云模型,同时提供 微分隐私保护和执行协作及时更新device-cloud协作的形式根据位置和参与用户需求的变化。
该算法主要包括以下步骤:(1)定位所需的用户信息收集RSS数据终端设备和本地执行隐私保护处理私人RSS信息数据满足微分隐私。处理过的数据然后送到附近的边缘节点。(2)边缘节点包和聚合RSS信息数据发送的用户,使用RSS的多用户综合数据信息处理的隐私保护机制来培训当地的子模型,和训练有素的模型参数上传到云服务器。(3)云服务器执行微分私有模型从每个边缘聚集在当地的子节点,把每个子模型的贡献全球模型,并获得全球云模型。(4)重复步骤(2)和(3)连续优化和更新本地子模型和云模型,最后实现每个边缘节点的共同利益。
终端设备,用户可以添加可控随机噪声 自己的私人真正的RSS信息数据 。微分扰动的RSS信息数据之前完成数据共享,确保隐私和安全的RSS边缘节点发送的数据信息。RSS信息数据后差扰动可以表达的 在哪里代表了可控随机噪声满足拉普拉斯分布,和添加噪声控制的灵敏度 。 表示微分扰动的保护隐私的预算分配给用户终端设备。边缘节点包所收到的RSS信息来自不同用户的数据到一个本地子模型训练数据集 。在哪里 。
云服务器接收上传本地的子不同的边缘节点和执行聚合和更新操作这些模型满足微分隐私保护。云模型的更新方法是显示为
在公式(8),代表了云模型的目标参数。表示当地的子模型参数, 。基于这一原则,不断迭代得到共同进化和云模型和局部子模型的更新。
4所示。实验和分析
4.1。模拟环境和数据集
为了模拟室内定位联合学习协议在MEC的环境中,一个室内定位模型使用TensorFlow建成,和两个边缘服务器相同的模拟的数据量。socket协议用于实现边缘服务器之间的通信,服务器参数,优化器采用AdaDelta。而不是积累所有过去的渐变,AdaDelta调整学习速率基于梯度更新移动窗口没有设定一个初始学习速率。迭代的数量是1000,和批量大小是32。硬件环境如下:国际米兰(R) (TM)核心i7 - 8750 hcpu @2.20GHz, NVIDIA GeForce GTX1060显卡,和24 GB RAM, 6 GB的视频内存。
数据集采用真实的数据收集在一个现实的室内环境中使用智能手机。wi - fi接入点AP和BLE信标预设两个室内公共区域收集RSS信息数据,分别。
办公室区域数据集收集12.5×7.5米2办公室区域。总共20 BLE信标被部署在该地区,这可以从30 wi - fi APs稳定检测信号。共有4232个样本收集的100组数据收集点,和每个样本包含二维位置坐标 和50维RSS信息功能,包括20维BLE特性和30-dimensional wi - fi功能。商场面积数据集收集从购物中心面积32.5×15.38 m2。整个地区被分为500个网格细胞,每个细胞的大小是1米2,每个网格单元是用作数据收集点位置。总共22 BLE灯塔附近部署所有集合的地点,和信号从35 wi - fi APs可以稳定检测。共收集9852份有效样本,每个包含2 d坐标位置 和57 d RSS信息特性包括22 BLE特性和35 d wi - fi功能。
4.2。仿真结果分析
的 微分隐私保证提供的算法定位精度的损失。基于上述数据集,首先假定训练样本标签是完整和学习特点是充分的,并且定位精度只添加可控随机噪声的影响。预设误差距离阈值是1米5米,和不同的影响在定位精度比较在不同误差距离阈值(PEDT),和的值范围从0.00001到1。该算法的定位效果在不同的隐私保护预算如图3。
从图可以看出3定位精度的增加而增加的 。当显著增加,定位精度的变化。这是因为一个更小的添加意味着更多的噪声,因此更大的实际误差距离。当 ,定位精度几乎达到一个稳定状态。这表明,通过添加适当的噪声,该算法可以实现良好和稳定的定位精度,同时保证隐私。在同样的隐私预算,一个更大的PEDT对应于一个更高的定位精度。在的情况下 ,算法的定位精度约为95%时PEDT = 5米,约93% PEDT = 3 m。这是因为在添加相同的噪声的情况下,一个更大的PEDT意味着摄动的位置满足条件,实际误差距离小于预设误差距离更可能是正确的结果。一个较小的值确保更高的隐私,也会牺牲更多的定位精度和导致更多的时间消耗。因此,为了平衡位置隐私,定位精度,和时间消耗,在后续的实验设置为0.1。
4.3。比较分析
当办公室区域数据集和商场区域使用数据集,分别和隐私保护预算设置为0.1,室内定位基于联邦隐私保护方法学习边计算环境提出了本文使用参考文献。(18]、[20.]、[22)进行比较分析。不同算法的训练精度的变化如图所示4在下面。不同的算法的定位时间消费图所示5。
(一)
(b)
从数据可以看出4和5训练迭代次数的增加,所有算法的定位精度在办公室区域的数据集,数据集商场面积逐渐增加,最后趋于稳定,并且模型变得逐渐稳定的收敛。其中,该算法具有收敛速度最快和定位精度最高,开始50迭代和40迭代收敛后,分别在两个不同的数据集,和他们的最终定位精度约为94%,高于其他三个比较算法,分别。
此外,对于不同的用户设备,定位算法是最小的完成时间,平均250 ms,远低于其他三种算法的定位时间。这是由于不同类型的联合学习不同的情况下可以达到最高的定位精度和减少时间消耗通过培训数据所有者无需披露自己的数据。即使边缘服务器和云服务器不受信任,它仍然可以提供用户培训数据隐私保护,同时抵制微分攻击,模型反演的攻击,和梯度反向推理攻击和获取精确的定位精度。不同类型的联合学习是用于处理不同的私有数据,使私人数据处理的效率和可靠性。引入微分隐私将精心设计噪声添加到输入和输出结果,修改任何一个记录的数据集不会产生重大影响输出结果。这使得攻击者无法推断中的隐私信息数据集通过分析输出结果,从而实现更好的隐私保护效果。
5。结论
针对定位精度低的问题,长时间消耗,以及抵抗困难cross-attacks传统室内定位的隐私保护方法,本文提出了一个室内定位基于联邦隐私保护方法计算环境学习优势。通过仿真实验,验证了该方法。的基本思想如下:(1)首先,学习不同类型的联合机制的适用性分析数据集具有不同特点和数学描述,分别。(2)消除可能造成的损害私人数据联合学习通过引入微分隐私。(3)构建一个室内定位的隐私保护模型,并设计相应的算法。实验结果表明,使用不同类型的联合学习私有数据具有不同特点可以提高数据处理的效率和可靠性。此外,引入微分隐私可以大大减少用户隐私数据的泄露和破坏的风险。
综合考虑定位性能、隐私保护和资源开销可以大大提高室内定位精度的算法。由于数据集的限制,没有更多的模态数据的分类研究。在未来,我们可以进行同时研究多模态数据的分类。未来的工作将致力于使用联合神经网络学习训练一个统一在MEC场景中同时实现多模态数据的分类和相应的隐私保护方案为多样化的室内定位在智能电网的应用程序需求。有效提高室内定位算法的可靠性和定位精度,提供更准确的位置信息终端设备在电力生产和电力客户需求定位服务环境。
数据可用性
使用的数据来支持本研究的结果包括在本文中。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作是由2022年国家电网湖北电力科技工程有限公司有限公司”关键技术的研究与实证应用工业控制安全主动防御架构新型电力系统”(52153222001 d)。