文摘
加密框架取决于关键的数据共享,以确保安全。在钥匙加密框架必须正确可再生的和不明确连接到一个用户的身份,在生物识别框架中这是不同的。加入加密技术和生物识别技术可以解决这些问题。提出了一种基于离散对数问题和生物认证方法Bose-Chaudhuri-Hocquenghem (BCH)代码,执行其安全分析,证明其安全特征。我们评估生物密码系统使用自己的数据集的脑电图(EEG)收集的数据来自42个科目。生物识别用户身份验证所描述的实验结果表明,该系统是有效的,实现平等的错误率(ERR)为0.024。
1。介绍
大脑计算机接口(BCI)是一个高度增长领域的研究与应用在医疗保健系统(从秋天预防神经康复)教育、自律、生产、市场营销、和安全,以及游戏和娱乐。BCI旨在提供一个交流的渠道,不依赖于周围神经和肌肉的通常使用(1]。虽然BCI研究目标应用程序的主要目的是运动机能的发展独立假肢设备受损的病人,BCI的其他应用程序,比如学习(2,游戏3,4),或娱乐5),提高需要确保受试者使用BCI系统的安全和隐私。BCI系统是基于测量大脑活动表面上(无创的BCI)或内部(BCI)入侵的情况下使用电极的人类头骨。测量的结果代表发出的电脉冲的和大量的大脑的神经元。无创性记录脑电图信号通过附加电极头部根据给定一个主题地图的10 - 20国际体系等脑电图电极的位置。
最近,BCI申请增加生物识别技术吸引了研究人员的关注。生物识别技术提供了识别意味着人们根据他们的生理特征6]。最近,出现了巨大的增长对密码学的研究和生物识别框架,因为难以置信的需要为数据安全在许多应用程序中,如电子商务、e-health,电子政务,网上投票,区块链,执法、数字取证,和国土安全。目的是验证的身份使用一些主题主题的特征。在加密框架,用户使用密码或密钥来保护自己的机密数据。然而,使用密码识别一些著名的缺点:文本可以发现或破解密码,和密钥太长,很难记住,可以偷来的如果存储在某个地方。加密的缺点是,验证策略不明确与身份的人。与基于密码的身份验证方法,使用行为和生理特征如虹膜生物识别技术,指纹,脑电图(EEG)数据,脸,手掌,声音,和步态,方便和不能被遗忘或丢失。
以脑波图为基础的识别是相对较新的话题。使用脑电图对生物识别技术的优点是它的低exposability(不能随意获得或被外部观察人士)和抗强迫提取因为压力下的大脑活动的变化7]。他们还可以使用残疾患者或用户缺少一些物理特征。努力开发生物识别方法和系统基于EEG有针对性的主题的发展状态监测工具,例如,对于检测睡眠呼吸暂停的8,精神分裂症9),或癫痫10];创建BCI系统来帮助残疾人的11];和营销(12]。分析师预测,全球脑电图和心电图(ECG)生物识别市场扩大12.37%的复合年增长率在2016 - 2020年期间(13]。
使用脑电图对隐私和安全应用的适用性可以归因于形态学、解剖学和功能可塑性(behaviour-related持久的功能连接)的变化特征(14),这导致辨别力主题之间(15]。几项研究(主要来自人体生理学和遗传学领域的)已经证实,脑电α波的光谱特性(8 - 12 Hz的范围,反映了放松和解脱)和β波(夫人赫兹范围,相关行动和浓度)的脑电图显示最强的遗传关系(16]。
相关的困难使用脑电图数据随着时间的推移其不稳定(EEG永久问题[17])。因为它使得基于脑电图仍难以实现高精度的生物系统,促使研究人员探索新的脑电图数据分析方法。然而,研究社区仍然缺乏知识在特定判别特征的脑电图可控告的生物统计学(18]。到目前为止,脑电图功率谱特性被用来获得相对较好的分类性能(18]。几种方法,关注网络科学的概念和方法,如功能连通性(19)和网络组织(20.),提出了。模糊的承诺(FC)计划(21)可以用作加密技术和生物识别技术相结合的理论背景。在FC方案中,密钥与参考生物特征模板,和不同的向量计算等方式,密钥可能恢复使用向量和查询生物特征模板的区别。另一种方法是模糊金库(阵线”基于多项式重建(22]。FC和阵线方案已经应用于生物识别技术(前23,24]。
因为它使得基于脑电图在这里,我们提出一个安全的密码认证计划的承诺方案采用基于[25),提供的安全特性的理论分析提出方案,该方案适用于生物识别系统构建一个生物密码系统使用EEG信号,使用我们自己的数据集和评估它记录来自42个科目。剩下的纸是组织如下。节2我们现在最先进的概述脑电图生物识别技术的相关工作。我们在部分描述该方法3。我们国家定理有关的安全加密系统的部分特征4。我们描述了脑电图数据集上的应用方法5。我们目前的实验结果及其评价部分6。最后,给出了结论部分7。
2。国家的艺术
认知生物识别技术(26)使用大脑信号作为用户标识的信息来源(身份验证)。用户身份验证是一个过程,确保在安全系统确认用户的身份。用户身份验证使用脑电图信号可以有效的与不同程度的准确性。例如,Fladby [27低)使用功率谱特性的α,β,β高,从一个脑电图和θ乐队12通道对象执行八个不同的任务(从简单的放松到计数和阅读)和一个自定义特性为主题的歧视基于距离度量,实现21.42%的曾经。印度(28]使用伽马的视觉诱发电位(VEP)信号和神经网络(NN)分类器识别20个人,平均精度为99.06%。
梁等。29日)提取的基于“增大化现实”技术的特性从8脑电图渠道和使用支持向量机(SVM)达到45.52%到54.96%的准确性受到分离任务和主题识别的准确性48.41%到56.07%的任务。烫发和文澜30.)实现了一个高斯混合模型(GMM)与最大后验(MAP)估计9个科目,实现半总错误率(ht)的6.6%。
丙烯酸- et al。31日)采用前馈神经网络使用功率谱密度(PSD)的脑电图特征从脑电图β波和6日平均达到94.4 - 97.5%的准确性。他等。32)使用朴素贝叶斯分类器(NB)与自回归(AR)特性,取得了6.7%的ht 4科目。
μ和胡33)使用bp神经网络对数据来源于6频道3主题和实现了80.7%至86.7%的准确率。布里格姆和库马尔34)使用线性支持向量机分类器的基于“增大化现实”技术的特点和实现精度98.96%的122例测试。胡(35)利用神经网络在七脑电图信号特性和获得一个真正的录取率80%到100% (TAR)和0到30%错误接受率(远),在使用数据只收到3个科目。
Zuquete et al。36]证明了脑电图的稳定生物识别技术利用视觉刺激视觉诱发电位测量)和(看到下面成了一个分类器的组合(OCCs),包括最近的邻居(资讯)和支持向量数据描述(SVDD)。阿什比et al。37)使用线性支持向量机与EEG信号的AR和光谱特征来自14个脑电图渠道和错误拒绝率(FRR)达到2.4%到5.1%和0.7%到1.1%的5身份验证。Shedeed [38)使用功能的神经网络通过快速傅里叶变换(FFT)和小波包分解(WPD)从4通道,正确分类率达到66%至93% (CCR)使用数据从3科目。
壮族et al。39)记录单通道脑电图信号时执行一个自定义主题的任务(例如,唱歌或移动手指)。身份验证系统分析这样的大脑数据之间的相似性和训练数据验证,精度达到99%左右。Yeom et al。40]使用高斯核支持向量机的信号差异和时间导数特性从18脑电图渠道和管理实现精度约86% 10日主题。
丹等。41)使用多项式核支持向量机基于AR模型参数计算EEG信号,一个脑电图记录频道,13日获得65%到75%的准确性。
Delpozo-Banos et al。18]使用功能连通性模式代表有效因为它使得基于脑电图特点对提高生物系统和分类使用卷积神经网络(CNN),取得了97.5%的准确率在闭上眼睛(EC)和96.26%睁眼(EO)静息状态的条件状态时从parietooccipital PSD信息融合(EO centroparietal)部分大脑的10个主题。
Abo-Zahhad et al。42)验证准确性达到99%以上采用单通道脑电图信号从10和15个科目。Koike-Akino et al。43)达到72%的准确率从脑电图25-subject识别使用单一800 ms时代和部分最小二乘(PLS)降维方法在二次判别分析(QDA)分类。
Crobe et al。44脑电图γ)获得好的结果(无论何时在EO条件= 0.131和AUC = 0.943;曾经在EC = 0.130和AUC = 0.933条件)和高β(曾经在EO条件= 0.172和AUC = 0.905;无论何时= 0.173和AUC = 0.906状况EC)频段。
一些研究提出了脑电图与其他形式的融合得到一个多通道生物识别系统等(45,46]。也看到一个调查的安全和隐私的挑战在BCI应用程序(47]。EEG-based认证也被视为智能驾驶系统的一部分,对需求的验证司机的身份(48]。然而,使用脑电图脑波进行身份验证可能导致用户隐私的风险。例如,作者在49)提出一个身份验证系统,验证个体脑电图信号时执行一个自定义的任务。他们还设计一个冒充的攻击模型的思想主题测试验证系统的鲁棒性。敌人也可以攻击验证系统通过合成EEG信号,它们使用一个模型生成基于历史的脑电图数据从一个主题50]。
3所示。脑电图生物统计学方法的描述
首先,我们提供定义所需的生物认证方法的低估了(25]。
定义1(离散对数)。让是一个有限循环群的秩序 。让的发电机,让 。的离散对数的基础 , ,是独特的整数 , ,这样 。
定义2(离散对数问题(DLP))。给定一个素数 ,一台发电机的的 ,和一个元素 ,找到整数这样 。
定义3(块代码)。一块代码 了一个字母的符号是一组向量称为码字。相关的代码是一个编码器 映射消息 ,一个元组,对其相关的码字。
定义4(解码函数)。让 是一块代码集 。一个解码函数 地图信息 ,一个元组,正确的码字 ,如果和足够接近根据适当的度量。否则,它映射无效的码字 。
定义5(汉明距离)。给定的代码集 ,两个词之间的汉明距离和从代码设置是由
定义6(误差修正阈值)。误差修正阈值纠错编码的 是世界上最大的错误可以纠正的码字。
定义7(统计距离)。让和是两个随机变量在同一空间 ,,让和是他们的离散概率分布函数(pdf)。然后,统计之间的距离和如下:
定义8 (Bose-Chaudhuri-Hocquenghem (BCH)代码)。让伽罗瓦域是一个原始的元素 。对任何正整数 ,让的最小多项式在 。BCH码的生成多项式的定义是最小公倍数 。
提出的方法,(25),采用脑电图生物统计学,包括三个过程:(1)设置输出一个公钥,(2)提交,作为输入,并发送消息和输出的承诺和开放值用于消息验证,和(3)开放,否则输出正确如果验证成功或错误。三个演员参与:发送者爱丽丝,接收方鲍勃和受信任的第三方特伦特生成的系统参数,并将其发布给Alice和Bob派对。
让承诺的空间信息。第一步是设置阶段(参见算法1),特伦特生成并发送Alice和Bob的关键。第二阶段是实施阶段,爱丽丝发送鲍勃承诺的私人信息 和秘密持有一个开放的价值。第三阶段是开放的阶段,爱丽丝发送鲍勃原始消息的地方 随着开放的价值,所以,Bob可以验证消息承诺在第一阶段确实是 。
|
||||||||||||||
函数定义9(承诺)。首先我们定义函数的承诺 ,定义为 ;在这里 和 的区别是向量。
定义10(承诺协议)。承诺协议是一个消息的计划(空间)定义的三倍这样(一) 生成公开承诺的关键,(b)对于任何 , 承诺/开放对吗 ,(c) ,在那里如果返回不是一个有效的承诺,任何消息。设置系统参数,特伦特执行下列程序。
设置程序
(1)特伦特生成两个质数和这样 。
(2)特伦特发现一个随机发生器 ,在那里 子群的秩序在 。
(3)特伦特计算一个元素 ,在那里 这是随机选择(是发电机的元素)。
(4)特伦特发送系统参数爱丽丝和鲍勃。
提交过程。承诺一个信息 在信息空间中 ,爱丽丝编码成一个码字的消息 ,选择一个随机的证人 在证人空间 ,然后计算的承诺 。发送给的承诺鲍勃。
打开程序。开放的承诺 ,爱丽丝揭示了见证 ,在接近原来的吗使用一些度量距离(例如,汉明距离 )。使用向量的区别证人恢复码字 然后翻译 。然后鲍勃计算的承诺 并验证 。在失败的情况下,承诺不开放使用 。否则,承诺是成功地打开了,因此秘密消息 。
4所示。安全属性和方案的分析
让 承诺方案,其安全属性是(我)的正确性,即。,for every message the commitment generated is valid, (ii) hiding, where any attacker cannot learn information from the commitment c about the message m with any advantage (perfect) or with a negligible advantage, and (iii) binding, where the message唯一绑定到(完美)或寻找另一条相同的承诺已成功的可能性微乎其微。在进一步的分析中,我们假设这两个码字和证人是随机有限集的 。
定义11(正确性)。一个承诺协议π定义的四胞胎之一是正确的,如果所有的消息吗 , 。
生物统计学的隐藏属性方案描述了系统的弹性对敌对的尝试执行的骗子FakeBob破解码字或证人 。我们声称,骗子FakeBob知道和可以访问的承诺 。
绑定属性代表系统的阻力与敌对的尝试通过一个骗子猜一个字与 ,这样 ,对于一些 。
隐藏和绑定,我们有两个不同的对手(51]:(我)的取消隐藏U,因为隐藏游戏和有两个抽象的过程,一个选择一条消息,另一个猜这两条消息对应于给定的承诺;(2)的粘结剂B,因为绑定游戏和只有一个过程的输出两种不同双(消息,打开价值)绑定到相同的承诺。
承诺协议满足隐藏安全财产如果对手不存在这样的概率获得隐藏游戏(显著)比瞎猜51]。如果这是真的,提交者是保证没有承诺可以推断的信息本身。
定义12(隐藏)。让
是一个承诺协议。然后我们可以定义为对手U的隐藏属性
。
隐藏的游戏。隐藏的游戏运行如下:
(1)对手U给出的输出设置程序和要求选择两条消息。
(2)游戏中随机选择其中一个并调用提交过程计算的承诺。
(3)对手U被要求猜测哪一个对应于两条消息的承诺。
(4)游戏输出1如果对手U的猜测是正确的。
承诺协议满足绑定安全属性如果对手不存在这样的概率获得绑定游戏比可以忽略不计(51]。如果这是真的,接收方保证提交的值不能被改变。
定义13(绑定)。让
是一个承诺协议。然后一个可以定义的绑定属性为每个对手B
。
绑定游戏。绑定游戏运行如下:
(1)对手B给出的输出设置程序和要求将两条消息绑定到相同的承诺的价值。
(2)游戏输出1,如果两条消息的不同和承诺是有效的信息,也就是说,如果两个可以验证通过调用打开程序。
5。因为它使得基于脑电图在生物识别系统的应用方法
在这里,我们使用EEG信号的生物密码系统。其实现由系统初始化阶段,招生阶段、验证阶段在图表示1。
开始报名(见算法3)、用户脑电图生物识别技术是获得和使用脑电图编码执行特征提取算法,输出一个400位的脑电图描记器代码。我们使用脑电图特征源自脑电图数据的协方差矩阵从不同的脑电图频道10 - 20国际体系。计算协方差矩阵通道矩阵如下: 在哪里各自持有的所有观察脑电图频道。
接下来,我们计算分数值的协方差矩阵如下: 在这里是协方差矩阵的一个元素。
并执行正常化得分值的协方差矩阵范围如下: 最后,我们执行数据使用的二值化阈值如下: 在这里艾弗森括号运算符。
结果是一个包含400位长度的二进制码字矩阵(获得20×20协方差矩阵)。总结了算法的过程2。
|
||||||||||||
|
||||||||||||
与此同时,一个随机密钥 准备使用 纠错编码的函数 。结果是一个码字 脑电图结合参考代码(都有400位的长度)。
认证阶段中所描述的算法4。输入脑电图生物来自一个人,导致测试脑电图的代码吗 。脑电图测试代码“异或”表示提取码字 。一旦提取,纠错解码功能 是用来计算 。函数是用来计算 。Nonvalid用户将收到一个码字 ,这样 。然后 计算和匹配存储 。如果 ,那么样本被接受的关键被释放。否则,一个人的身份将被拒绝。
|
||||||||||||||
生物识别方案总结在图2。
6。实验结果和讨论
的实施方案是在MATLAB 8.6.0.267246 (R2015b)英特尔(R)的核心(TM) i5 - 4590 CPU (x64), 3.30 GHz 12 GB的RAM在Windows 10企业版本。1709年。绩效评估,我们使用一个数据集,包括65个脑电图42个样本不同的主题,其中每个样本包括1000个信号值。受试者的数量满足的条件Lazar et al。52),谁说研究使用收集的数据来自20个或更多的参与者比这些更令人信服的表现与较小数量的参与者。我们在本研究中使用EEG数据收集的42个健康的成年人。在数据收集过程中,受试者被要求躺在一张桌子和正常呼吸。数据收集使用医用EEG设备从电极到学科国际10 - 20标准后,描绘成圈图3。采样率是256年代−1。
执行代码匹配,我们计算之间的汉明距离两个脑电图密语和如下: 在这里和是在脑电图代码的人和 ,分别。
intraperson汉明距离的计算使用脑电图样本相同的主题,而interperson汉明距离计算使用样本不同的科目。我们为同一个主题65进行比较和118335对比不同的主题。概率分布函数的结果(pdf) intraperson和interperson汉明距离如图4。一个可以看到多达87位的错误(十字路口两图)是容忍。
我们使用以下场景所显示的Gui et al。53]。
场景1。42的目的是正确地识别每个受试者参与研究。训练和测试数据集包括42位受试者的数据,分类结果属于42类之一。
场景2。目的是确定一个主题和所有其他41科目。只有两类:积极的(目标)和消极的(所有其他科目)。训练数据集相结合使用所有科目的数据和执行重采样,这样两个类是平衡的。
评价。约根森和Yu(建议后54),我们使用错误接受率(远),错误拒绝率(FRR),平等的错误率(曾经)作为关键指标生物识别系统的有效性。远和FRR描述系统是否正确标识。犯错的值指定的错误率,FRR成为平等的。指标计算如下: 在这里的数量是错误的拒绝,错误地拒绝验证尝试有效的主题,是授权的数量,的数量是错误的接受。,falsely accepting the claim of an impostor as a valid user, and被一个骗子的尝试。
性能评估使用正确的分类率(CCR)如下: 在这里是正确的数量分类决策和试验的数量。
曾经被定义为一个独特的地方FRR =。较低的曾经表明一个更准确的系统。 在这里
这将确保发现的阈值将满足FRR之间的平等条件和尽可能得多。
我们实现了两个场景1和2测试,所受到的Gui et al。53]。在场景1,CCR的每个对象呈现在图5。
注意,虽然整体精度不错(平均精度0.895),的一些主题,这是相当低的(例如,只有0.446主题15)。这个结果可能是由于臭名昭著的BCI文盲效应(55]。不过,当检查累积分布的精度分布(见图6),我们可以看到,50%的受试者有精度高于0.93,而只有10%的受试者精度低于73%。
精度数据不是正态分布,费舍尔转型是应用于计算总体均值和标准偏差,产生的平均精度0.892标准差为0.135。
subject-wise混淆矩阵提出了数字7和8。作为有意义的太高的可视化,混淆矩阵的分类根据其对角线价值(正确的点击率),和只值10最差科目(图7)和10个表现最佳主题(图8)所示。
的场景2混淆矩阵呈现在图9。我们可以看到,真阳性率(TPR)是0.9974。我们评估使用McNemar检验法的混淆矩阵统计测试。关键值在95%显著性水平为3.8415。McNemar检验法与耶茨校正卡方是0.001, 。因此,结果在α= 0.05显著水平。
的值,FRR,错在图表示10。
曲线下的面积(AUC)计算接受者操作特征(ROC)曲线下的面积(56)曲线和代表歧视,分类器的能力,区分一个积极的例子和一个负面的例子。
我们取得了以下结果,总结在表1。
比较。在表2和图11,我们比较我们的结果与Fladby [27]。注意,Fladby使用一个简单的脑电图阅读设备(Neurosky ThinkGear)只有一个频道的脑电图数据(Fp1),这可能会影响到眼睛的文物。采样频率只有128赫兹,和20秒信号样本的八个不同的任务是用于身份验证,这对许多应用程序是不现实的。然而,Fladby的方法(27),拥有广泛的应用脑电图乐队的功率谱特性,可以被视为一个基线,对我们的方法可以比较。我们已经彻底由Fladby复制实验的条件在我们的数据集,使用相同数量的样品(2560)为每个片段的蛋距离度量数据和基于特征区分真实和虚假身份验证结果,并计算了曾经的价值。请注意,我们的方法使用20脑电图10 - 20国际体系的渠道,而Fladby只有一个脑电图频道使用。然而,我们复制每个脑电图通道Fladby计算的方法做一个公平的比较。这项研究的结果发表在表2以及在图11。0.3059 Fladby的方法实现意味着犯错,而Fp1通道所使用的最初Fladby达到0.2945的犯错,最好和犯错是通过使用P4通道(0.2283)。请注意,我们可以不适用方法Fladby的数据,因为它是不可用的。
基于提出的比较,我们可以认为该方法取得更好的结果比Fladby主体身份验证(27)方法。
7所示。结论
因为它使得基于脑电图提出了一个安全的密码认证方案生物识别技术基于模糊承诺方案和纠错Bose-Chaudhuri-Hocquenghem (BCH)代码。脑电图特征源于脑电图数据的协方差矩阵不同的脑电图渠道在10 - 20国际体系。生物识别系统评估使用脑电图数据集来自42个科目。实验结果表明,该系统可以产生高达400位密钥的脑电图代码,而容忍多达87位的错误。生物密码系统的性能是一个平等的错误率(曾经)0.024,真阳性率(TPR) 0.9974,和0.927的曲线下面积(AUC)。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
作者要感谢校长的支持pro-quality批准号09/010 / RGJ18/0034的西里西亚大学的技术。作者还要感谢a . Vainoras立陶宛健康科学大学的教授请提供脑电图数据集。