文摘
人工智能的发展和全球流行病事件促进了智能医疗的实现将数据隐私的问题时,恶意攻击,和服务质量。医疗物联网(也),和联邦的技术学习和区块链,这些问题已成为一个可行的解决方案。在本文中,我们提出一个智能医疗blockchain-based联合学习法的边缘节点维护区块链抵制一个单点故障,也设备实现分布式联合学习充分的临床数据。特别是,我们设计一个自适应差分隐私保护数据隐私和梯度算法进行共识协议检测中毒攻击。我们比较我们的方法有两个类似的方法在一个真实的糖尿病数据集。有前途的实验结果表明,我们的方法可以实现模型精度高可接受的运行时间,同时也表现出良好的性能在减少隐私预算消费和抗中毒攻击。
1。介绍
增长的数量和类型的临床数据,迫切需要高效的挖掘模型来分析这些数据,以帮助诊断疾病,提供医疗解决方案,改善病人的医疗护理。机器学习是一种有效的工具和强大的计算功能,已应用于许多领域,如图像识别、自然语言处理,和医疗。然而,机器学习模型只能达到高精度与丰富的训练数据,在医疗保健尤为重要,有时候决定是否可以拯救病人的生命。传统的集中式培训方法通常需要收集大量的数据从一个强大的云机,这可能会导致严重的用户隐私泄漏,尤其是在医学领域。许多政府已经颁布法律禁止收集有关用户隐私数据,例如欧盟的总体数据保护监管(GDPR)。医疗物联网的出现(也)赋予传统领域如医疗保健、医疗、公共卫生、社区服务,大量的也可穿戴传感器等设备分布在网络的边缘收集患者的数据。联合学习(FL) [1),作为分布式机器学习框架,可以允许多个设备训练机器学习模型协同不分享他们的原始数据,这就有助于实现智能医疗也同时减少病人的隐私泄露。
一个典型的FL-based智能医疗应用程序如图1机载传感器收集病人的临床资料,多个边缘设备执行FL协作算法,和最后的机器学习模型评估病人的身体健康,甚至在必要时请求紧急服务在云中。然而,香草FL的缺点之一是,它需要一个可信赖的中央服务器设备上传的聚合模型参数和分发所有设备的全局模型。一旦中央服务器被攻击者坠毁,FL训练将会停止。作为一个防篡改的分类与特性,集体维护,和可追溯性,区块链可以取代中央服务器在FL分散协调过程,因此抵制单点故障和非法篡改攻击。通过这种方式,传统元素在区块链可以映射到FL的训练阶段如下:每个小块代表一个训练轮,存储事务代表模型参数上传的设备在这一轮。所有设备可以查找最新的模型参数块和更新他们的局部模型。针对这些优势,很多blockchain-based FL方法提出了应用在许多领域,如智能家居(2),工业物联网(物联网)3),和智能医疗(4]。但随着越来越多的先进的隐私攻击,仍然有一些挑战需要解决而blockchain-based FL应用到医疗保健:(1)中存储的模型参数区块链仍有可能被攻击者来推断原私人临床数据;(2)临床资料的一些边缘设备可能会毒害误导FL过程;(3)边缘设备没有动力为FL贡献数据集和计算能力。
针对上述挑战,本文整合FL区块链和先进的加密技术实现智能医疗安全和保护隐私的方式模型。论文的主要贡献主要如下:(1)我们提出一个blockchain-based FL框架智能医疗,这不仅构建一个基于多个边缘设备的准确的协作模型还提供了治理的整个训练过程。(2)添加一个额外的安全层blockchain-based FL,微分隐私(DP)算法,提出自适应适应噪声根据培训过程,平衡隐私,和模型精度。(3)我们设计一个高效的共识协议基于梯度的验证,也鼓励可靠设备和边缘节点贡献他们的数据和计算能力联合学习。
剩下的纸是组织如下。我们引入了相关的部分2和给我们的方法部分3。部分4显示了我们的方法的实验结果。我们得出结论,概述未来的工作5。
2。相关工作
随着人工智能(AI)的发展,它是一种常见的做法,部署人工智能应用程序协助医疗诊断,可以改善疾病的诊断率,减少患者的等待时间。戴et al。5)住院治疗任务的预测变成了监督分类问题,导致大量的潜在的节省医疗资源。儿子et al。6开发了一个支持向量机(SVM)模式识别预测心力衰竭患者的服药依从性。Tariq et al。7)建立了一个多通道融合的人工智能模型从过去的医疗数据预测COVID-19的严重程度。为了解决缺乏可靠的数据的问题,Sedik et al。8)提出了一个数据增加框架扩展有限的数据集,利用卷积神经网络和卷积长检测COVID-19短期记忆模型。然而,above-centralized训练方法(5- - - - - -8)需要收集敏感的临床数据在一个单一的数据库,这是不可取的因为数据隐私问题。相反,联邦执行协作学习的学习成为一个分布式框架,同时保持所有的本地敏感数据,提供一个保护隐私的解决方案连接分散的医疗数据在设备。许多作品用FL近年来在智能医疗已经提出。Qayyum et al。9]提出集群FL-based方法处理临床视觉数据的边缘,以允许远程医院受益于多通道数据保护隐私的方式。Brisimi et al。10]预测心脏病患者的住院用FL解决分布稀疏支持向量机问题。徐et al。11)给FL的审查方法,指出了影响和FL在医疗尤其是潜力。Zhang et al。12)采用微分私人生成对抗网络(DPGAN)来生成不同的病人数据隐私保护的方式和杠杆FL训练COVID-19模型与多个合作医院。但这些作品(9- - - - - -12)都需要一个中央服务器整合和分发模型参数联合学习期间,这是容易被攻击一个单点故障。
为了解决这个漏洞,介绍了区块链,使分散FL,也是这篇论文的想法。El Rifai et al。13)集成FL和区块链在医疗环境中,第一次提出了一个智能合同实现透明和不变性,同时分享知识。Passerat-Palmbach et al。14)提出了一个先进的blockchain-orchestrated联合学习框架在医学和提出了一些挑战。Połap et al。4)设计了一个可替换主体医疗系统基于FL和区块链可以分隔成单独的对象和过程复杂任务实时医疗数据。而区块链的整合和FL可以抵制一个单点故障,使生命周期治理训练的过程中,由于区块链的透明度,这引发了担忧关于隐私的模型参数。为此,刘等人。15)提出了一个blockchain-based安全FL 5 g网络框架,在微分隐私噪声添加更新防止推理攻击。Kumar et al。16)提出了一个blockchain-based FL框架,训练一个协作深度学习模型COVID-19检测使用来自多个医院的临床数据和拉普拉斯噪声添加到本地梯度,以确保隐私。拉赫曼et al。17)提出了一个混合FL框架物联网的健康(IoHT)支持轻量级DP实现IoHT数据的隐私和匿名化。然而,微分隐私所使用的(15- - - - - -17)将造成一些损失数据的实用程序,这将减少智能医疗的可用性。在本文中,我们设计一个自适应差分隐私算法实现数据的隐私和数据效用之间的平衡。
另一方面,中毒攻击(18)发起的恶意用户也是blockchain-based FL方法所面临的另一个挑战。虽然刘et al。15)智能识别合同执行恶意参与者中毒发起攻击,他们认为,有一个公共提前测试数据集,这是不切实际的智能医疗与私人数据的患者。在本文中,我们提出一个简单的梯度验证方法,不需要公共测试数据集检测中毒攻击。
3所示。提出的模型
3.1。威胁模型
在本节中,我们给出了智能医疗面临的威胁。威胁1。潜在的数据隐私泄漏。人工智能模型建立在临床数据可能被敌人攻击来推断病人隐私。威胁2。单点故障。现有的智能医疗模型依赖于一个中央服务器来存储临床资料或交换模型参数。一旦中央服务器崩溃,模型培训将以失败结束。威胁3。中毒的攻击。由于的脆弱性也敌人可能发动中毒攻击也设备的数据或当地的模型参数,将妥协FL的正确性。
为了便于理解,这篇论文使用的主要符号表中列出1。
3.2。系统架构
我们的智能医疗系统主要由用户层和边缘节点层。用户层主要包括可穿戴传感器,也设备和移动终端。他们是用于监控病人的生理条件,收集临床资料,并在本地火车FL模型。边缘节点主要由基站配备边缘计算服务器强大的计算和通信能力。他们保持区块链作为矿工,接收和存储模型参数,验证参数一致通过协议。训练过程在一个圆形图所示2。
如图2,完整的一轮训练过程可以制定以下步骤:(1)医院确定区块链和发送培训任务,然后是创世纪块创建和分发给所有也设备和边缘节点执行模型初始化。创世纪块主要包含以下信息:①初始模型参数和总训练轮T;②公钥用于创建的各方签名;③初始声誉值的节点和边缘也设备;④声誉更新功能。(2)也设备本地火车模型基于其收集临床资料并添加DP噪声局部梯度(见细节部分3.3。11)以应对威胁。(3)也设备上传噪声梯度以及签名相关的边缘节点的形式交易。(4)从设备接收数据后在他们的报道,边缘节点首先验证签名的合法性,然后选出一个验证委员会检测局部梯度是否中毒更新(见细节部分3.3。23)以应对威胁。(5)领导是随机生成一个新的块包含必要的模型参数为这个培训。验证委员会验证新的块和广播的有效同步所有边缘节点的分类帐(见细节部分3.3。22)以应对威胁。(6)也设备下载最新的块的边缘节点关联和更新其本地全球梯度模型存储在块中。下一个训练轮从第二步开始,直到模型收敛或达到最大轮。
接下来,我们将详细介绍我们的主要施工方法。
3.3。施工方法
3.3.1。自适应差分隐私算法
等先进的隐私攻击模型反演[19)和模型提取攻击(20.)表明,模型参数存储在区块链并不足以保护原始临床数据的隐私。参考文献(18,21)使用沙密秘密共享和阈值Paillier加密来保护当地的梯度,分别,但消耗大的计算开销。相比之下,微分隐私技术需求减少计算开销,这是更适合也设备资源有限。
原则上,DP是一种严格的可证明的数学框架的基本思想是将精心设计噪声添加到一个函数的输入或输出,以便修改任何个人样本数据集的输出不会产生重大影响。相关定义如下。
定义1。(微分隐私22])。随机化算法 是 - - - - - -如果对于任意两个数据集不同私人和不同的个体样本和任何输出 : 在哪里是隐私的预算。一个小意味着一个更高层次的隐私保护,但更大的精度损失算法一个反之亦然。的概率是措施违反了“纯”微分隐私,这通常是一个较小的值。
定义2。(敏感性[22])。对于任何一个实值函数 与D作为输入数据集随着d维向量输出的灵敏度f是 在哪里和中两个相邻数据集不同的个体样本呢表示lp规范。
定义3。(高斯机制(22])。假设l2规范是用来计算的灵敏度函数f。
- - - - - -不同的隐私可以实现通过添加高斯噪声的输出函数f:
在哪里
是0和标准差的高斯分布意味着什么和我是单位矩阵。
从上面的定义,我们可以看到,数据集可以隐藏私人信息通过添加噪声,但与此同时,噪音会降低数据的实用程序。文献[23)添加噪声的原始数据由当地微分隐私,但它降低了模型精度严重。文献[24添加高斯噪声在剪梯度,但没有解释如何选择剪裁阈值。FL阈值是重要的价值模型:将添加过量的噪音太大一个值,过小的值将在剪辑梯度,这将导致严重的精度损失。针对这个问题,我们利用RMSProp优化算法的思想,提出一种自适应差分隐私保护算法也设备,它可以灵活地调整限幅阈值根据培训过程以减少噪声对模型精度的负面影响。
RMSProp是梯度下降法的变种机器学习的算法,加快收敛速度的调整步长。迭代公式如下:
在哪里的模型参数吗tth迭代,是一个梯度,是学习速率,是历史的累积广场梯度,是一个指数梯度的积累,是确保除数不为零,一般设置为10−8。由于收敛过程的连续性和循序性(25),历史上的梯度通常可以用来估计当前的梯度。因此,在RMSProp算法可以被视为当前梯度的先验知识。
现有的方法(26)让
限幅阈值的近似最优值。但根据培训过程图2设备,也不能获得当前的全球梯度训练轮之前上传本地梯度。所以基于RMSProp的想法,本文使用先验知识预测全球梯度当前轮然后设置限幅阈值;也就是说,
,在哪里表示局部剪切因子,和先验知识计算如下:
注意,之前的知识
在第一轮培训将导致
,它不能用于梯度剪裁。因此,我们设置一个阈值G:当梯度的先验知识不足在最初的训练阶段(例如,
),梯度剪裁阈值设置为固定值C;当培训持续进行直到先验知识满足
,设置渐变剪裁阈值
。G通常需要一个经验值根据模型的训练过程,在不同的数据集可能会有所不同,但一个简单的方法是设置G的先验知识在一个特定的训练。所以我们有
然后,在tth训练,也设备
剪辑当地的梯度并添加DP噪音如下:
自的价值在方程(6)降低模型收敛,当地的限幅阈值也会减少,使得DP声音
在方程(7少),导致模型的收敛性在以后的训练阶段。
3.3.2。共识协议基于梯度的验证
自也打开网络边缘设备广泛分布,低质量的临床数据收集可能甚至被敌人下毒,然后当地梯度训练这种数据将偏离全球趋同的趋势。来弥补这些恶意的副作用blockchain-based FL梯度,梯度积分与共识协议进行验证过程中边缘节点达成共识。每个边缘节点标识和删除恶意梯度相关的也上传的设备,只有总合格的梯度生成全局模型,实现可靠的FL。与proof-of-work(战俘)协议,消耗大量的计算资源,我们的协议是改进了Algorand (27]。在每一轮的培训,只有一些矿工被选中来验证新的块由拜占庭协议协议,和矿工之间的通信开销进一步减少,所以效率高和共识分支概率极低。具体细节如下:
(1)初始化。一群边缘节点选择与强大的计算和通信能力为矿工。这些矿工不仅生成或验证块还执行梯度验证。为了确保区块链的安全性,我们假设,在任何时候,不超过1/3的矿工是恶意的。此外,我们将最初的声誉价值分配给每个矿工。如果一个矿工被其他矿工返回一个伪造验证结果或一个假的块中,那么它的声誉值将减少1。
(2)梯度验证。在收到相关的数据也设备,矿业公司首先验证发送方通过检查数字签名的合法性。如果签名是有效的,那么矿工把当地梯度事务池。随后,一些矿工选择表单验证委员会,负责识别和过滤恶意梯度。在本文中,我们提出一个基于声誉的哈希一致协议指定验证人的角色有些矿工。具体地说,给定一个散列环的空间是分配给矿工的声誉价值比例,我们反复重复最初的sha - 256最后一块的散列值,并将结果映射到哈希环。相对应的商空间选择散列所在核查委员会的成员。重复这一步骤直到委员会的大小米,如图3。上述原则的过程类似于Algorand [27]:一方被选的概率正比于其声誉。因为敌人不能获得物体的状态,直到生成的,他们无法预测的输出一致的哈希和推出有针对性的攻击。
验证委员会执行multi-KRUM算法(28]在梯度事务池和接受最多数的梯度在每个培训。具体过程如下:步骤1。假设R渐变的总数在事务池和f是拜占庭梯度的数量。验证人加起来每个梯度的欧几里得距离最近R- - - - - -f2梯度和使用的质量分数之和梯度: 步骤2。验证器选择R- - - - - -f梯度分数最低的合格的梯度和迹象表明他们使用它的公钥。为了防止一些恶意校验任意接受的梯度勾结也设备,我们要求必须签署一个也设备的梯度最审核员才终于接受了。
(3)候选块验证。矿工是随机选择从现在核查委员会的领袖培训。领导收集合格梯度事务池中并生成一个新的块如图4,从中可以看出,除了散列值用于链接前面的块,块还包含的所有合格的梯度和相应的签名验证委员会。然后新的块以及领导的签名发送给验证委员会来验证的有效性,主要通过检查领导的签名和验证。只有当超过2/3的审核员同意块,块决心是有效和播放达成共识的区块链通过流行的八卦协议(29日]。否则,创建一个空的块。
(4)全局模型的训练。所有的设备也从区块链下载最新的块,所有合格的梯度计算全球梯度平均存储在块,然后更新当地的模型。下一个训练轮将开始,直到模型收敛或达到轮的最大数量。注意,在每一轮的培训,当地的声誉也设备价值梯度被确定为合格和验证器返回正确的验证结果都将增加1;否则,他们的声誉价值将减少1。当声誉值降低为零,实体(例如,也设备或边缘节点)放入黑名单,禁止参与共识。
上述共识的安全协议可以从以下几方面保证:(1)在每一轮的培训,我们使用一致性哈希来选择不同的矿工来验证新的块。一致性哈希的输出不能提前预测的攻击者,所以攻击者不能推出有针对性的攻击特定的验证。此外,作为设计的一致协议,一个矿工的概率被选中作为一个验证器正比于其声誉价值,因此攻击者不能增加的概率选择通过女巫攻击不增加自己的声誉值,进一步加强安全。(2)我们要求一个也设备的梯度可以确认为合格的只有当它拥有大部分的签名验证,防止一些恶意的校验方勾结也设备。(3)共识协议遵循Algorand [27),要求新生成的块只能认定为有效,播放后批准超过2/3的审核员,所以其安全是相当于Algorand。
3.4。安全分析
我们计划使用微分隐私机制来保护数据隐私,所以如何追踪积累隐私暴露隐私在训练在一个给定的预算是非常重要的。在本文中,我们使用隐私提出的会计Abadi et al。24)计算隐私的损失,许多相关的工作(15,17]。相关定义如下。
定义4。(隐私的损失)。假设 是一个随机算法,D和相邻数据集不同的个体样本中,然后输出的隐私的损失吗 是
定义5。(目前会计)。目前会计的算法一个在时刻被定义为
定理1(可组合性)。假设算法一个是由一系列subalgorithms吗一个1,一个2,…正义与发展党。对于任何时刻λ,目前的会计一个是有界的总和的时刻会计的A1,一个2,…正义与发展党:
定理2(尾绑定)。对于任何 ,该算法一个是 - - - - - -不同的私人
根据定理1隐私,我们的方法的数量成正比也轮设备和培训。假设也设备的数量K和培训是T。让整个会计时刻和会计的设备 在tth轮是 。基于定理1,我们有 在哪里主要跟踪的DP噪音 剪梯度的添加设备,显示为方程(7)。的计算如下。
让和是高斯分布的概率密度函数 和 ,分别。表示混合高斯分布 的和 ,在哪里问是当地训练的抽样概率。然后我们需要计算 ,在哪里
自噪声分布 添加在本地梯度是相同的所有也设备,计算 所有设备都是一样的。由方程13,它可以计算整个时刻或绑定我们的方法。然后我们可以用尾巴绑在定理2将边界的那一刻 - - - - - -微分隐私保证。注意,在执行DP-based深学习方法(24),整数的值范围通常是 。
4所示。实验
我们想说明以下几点在设计的评价方法:(1)我们的方法可以使模型精度和隐私保护之间的权衡。(2)给出一个合理的隐私预算,我们的方法的运行时间小于blockchain-based FL方法类似。(3)我们的方法是健壮的中毒攻击。(1)模型和数据集:Ubuntu 18.04系统下进行的实验与英特尔i7 - 8700 k的CPU, GTX 1080 t GPU, 16 GB的RAM。我们实现一个小型区块链原型基于Ethereum语言和火车在Python的深度学习模型。go-python v1.0(30.]图书馆使用Python和之间的界面。我们用卷积神经网络(CNN)两个卷积5×5层组成,一层接触和softmax输出层(1663370参数),深度学习模型,该模型由正态分布权值初始化N(0,- 0.022)和偏见都初始化为0。作为糖尿病的实验数据集,数据集来自美国国家糖尿病、消化和肾脏疾病研究所的网上(31日),这是由八个医疗预测变量和目标变量见表2,旨在预测患者是否有糖尿病。我们将数据集分为训练和测试数据集的比例70:30。为了模拟20分布式也设备在智能医疗,我们随机洗牌,将数据集划分为20部分均匀,和每个部分被认为是当地也设备的临床资料。(2)Hyperparameters和基线:每个设备也在本地火车模型与批处理大小为64和地方迭代20,和梯度参数转换成字节流传输的pickle模块。自适应的hyperparameters DP算法设置如下: 。除非另有声明,我们设置了隐私的预算 为默认。为了提供一个比较我们的方法,我们选择两种方法作为基线:(1)BlockFL [32]:blockchain-based FL方法在设备上运行;(2)原FL [1]:原联合学习方法没有任何额外保护隐私策略。
4.1。模型的准确性
鉴于预算两个不同的隐私,我们比较我们的方法的模型精度BlockFL和原FL,如图5。
我们可以找到以下:(1)我们的方法排出隐私预算 和 在第36 53轮和实现模型的准确性为78.5%和82.7%,分别。可以看出,隐私预算越大,模型精度越高,但同时降低隐私保护的水平。为了平衡模型的准确性和数据隐私,我们设置了隐私的预算 在其他实验中除非另有规定。(2)原FL和BlockFL实现模型精度高于我们的方法;这是因为我们的方法增加了DP噪声梯度,而其他两种方法保存原始梯度。但考虑到一个适当的隐私预算,我们的方法保护数据隐私只有轻微的精度损失。例如,当隐私预算 ,我们的方法准确率达到82.7%,仅略低于84.5%的原FL和BlockFL的84%。
4.2。运行时间
为了评价区块链的引入联合培训效率的学习,我们比较三种方法的运行时间,如图6,从中我们可以看到BlockFL和方法的运行时间大于原FL。例如,当训练达到50轮,原FL的运行时间,BlockFL,我们的方法是1047年代,1702年代和1624年代,分别。这是因为区块链共识协议涉及到耗时的操作,比如块生成、验证和广播。因此,blockchain-based FL方法(即。,BlockFL and our method) achieve a series of security attributes such as auditability, reliability, and resistance to a single point of failure at the cost of some computation overhead, so they are more suitable for fields with high-security requirements, such as the medical field.
因为blockchain-based FL方法通常包括当地培训阶段和共识阶段,数字7比较每个阶段的平均运行时间每轮BlockFL和我们的方法在不同的本地设备的数量。可以看出,由于自适应DP算法设计,当地的训练阶段,我们的方法比BlockFL消耗略多的时间,没有任何额外的保护隐私机制,但是当地的训练时间和设备的数量不会增加。相反,他们的共识时间正比于设备的数量,和我们的方法的共识时间小于BlockFL。这是因为使用的PoS共识协议BlockFL需要不断计算nonce直到达到目标状态,这是耗时的,而我们的方法使用更高效的哈希一致协议和梯度的验证方法。
4.3。隐私预算消费
在微分隐私设计自适应算法,我们调整限幅阈值根据培训过程。图8显示的变化在培训。我们可以发现,在第一个10轮,保持不变,这是因为我们修复它3在最初的训练阶段根据方程(6)。随着培训的价值逐渐减少。
为了进一步衡量微分隐私设计自适应算法的影响在减少隐私预算消费,我们比较我们的方法与传统DP-based方法,修正剪裁的阈值C= 3。我们记录隐私预算消耗的两种方法,当达到指定的模型精度,如表所示3,在那里和表示隐私预算消耗的传统方法和我们的方法,分别。
从表3,我们可以看到,我们的方法比传统的方法消耗更少的隐私预算达到相同的模型精度。例如,当模型的准确性为80%,82%,和84%,我们的方法减少了隐私预算57%,96%,和81%,分别比常规方法。
图9进一步显示了隐私预算两个方法在训练过程中消耗。可以看出,这两种方法的曲线几乎重叠在一开始,但隐私的增加预算的方法逐步减少后期的训练,尽管隐私传统预算方法仍然线性增加。这证明我们的方法使用相同的固定剪切阈值作为常规方法开始时由于先验知识不足但后者采用自适应DP算法降低隐私的消费预算。
4.4。抗中毒攻击
由于设备也通常是位于边缘的一个开放的网络,他们可能会面临中毒攻击对手。为了评估我们的方法抵制中毒攻击的能力,我们使用一个标签翻攻击产生中毒样品通过改变训练样本的标签和保持样本特性不变。然后,我们将中毒样品分配给指定也设备和定义攻击成功率的比例不正确预测样本的测试数据集。我们中毒也设备的比例为30%,平均20个实验的最终结果。
图10显示了培训的三个方法,从中我们可以看到,由于隐私预算的限制 ,我们的方法收敛在53个轮,但其他两种方法不能收敛甚至在70发。
图11进一步显示了标签的攻击的成功率翻攻击三个方法。因为原FL和BlockFL缺乏一种机制来检测中毒梯度,他们攻击的成功率几乎总是大于50%。然而,我们的方法限制了攻击的成功率不到20%的后期培训,和实验数据显示,四个也设备放入黑名单在培训结束时,表明基于梯度的共识协议验证我们设计可以有效地抵抗一定比例的中毒攻击。
5。结论
为了充分利用临床数据,提高疾病诊断的准确性和医疗服务,智能医疗基于近年来也被广泛利用。然而,它仍然面临的挑战,如病人隐私的泄漏和各种攻击对手。为此,我们提出了一个智能医疗blockchain-based联合学习法。特别是,我们设计一个自适应差分隐私算法仔细调整噪声添加量梯度隐私之间的平衡预算和精度退化。FL过程管理进行共识协议来防止中毒攻击和单点故障。实际糖尿病数据集的实验结果表明,我们的方法可以实现类似的准确性原FL可接受的运行时间。我们也说明它能够减少隐私预算消费和承受中毒攻击。在未来,我们将继续探索和推进我们的方法与公共合作伙伴在智能医疗做出更大的改进。
数据可用性
糖尿病数据集是公开的https://www.kaggle.com/uciml/pima-indians-diabetes-database。本文的其他数据来自测试的数据统计过程。所有的数据是真实的,可以使用。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作得到了河南省的科技项目(没有。162102310304)。