文摘
作为一种生物特征,脑电图(EEG)信号的优势很难偷,容易检测活性,因为它使得基于脑电图吸引研究人员研究个人识别技术。在不同的脑电图协议,静息状态信号是最实用的选择,因为它比其他协议操作更方便。摘要个人识别系统提出了基于静息状态的脑电图,数据的增加和卷积神经网络结合在一起。109年的在一个公共数据库上执行交叉验证。实验结果表明,当只有14脑电图数据通道和0.5秒,平均精度和平均等于系统的出错率可达99.32%和0.18%,分别。与现有的一些代表作品相比,该系统具有采集时间短的优点,计算复杂度低,和快速部署使用低成本市场EEG传感器,因为它使得基于脑电图,进一步发展实际的实现识别系统。
1。介绍
随着社会进入数字时代,识别已成为重要的在人们的工作和生活。传统的识别技术,例如密码和硬件令牌,可能被遗忘,丢失或被盗,导致身份泄漏或识别故障(1]。可以避免这类问题通过使用生物识别技术,如脸、指纹、和步态,已被广泛研究2- - - - - -4]。然而,面对图像很容易被捕获,指纹可能附着在表面的许多对象无意识地(5,6),和步态可以记录并分析了在不知情的情况下,这可能是被恶意攻击。此外,活性检测这些生物识别技术并不容易实现。大脑信号由脑电图(EEG)基于生物识别技术可以解决这些问题,已成为一个突出的个人识别方法(7]。
脑电图是一种非侵入性成像技术,记录脑电信号产生的神经元。首先,需要特殊的测量装置和脑电信号采集电极放在头皮表面的主题。当电极无法接触到皮肤表面的大脑,EEG信号的质量会迅速降低(8),这就增加了挑战偷脑电图。第二,大脑是最好的保护人体器官,所以大脑生物识别技术并不容易被外部因素所破坏。第三,如果受试者死后,他们的大脑电生理信号不能被生成了,所以脑电图检测脑死亡的一个主要临床指标(9]。最后,大脑生物识别技术可以引发许多不同的系统,这使得它可能改变存储脑电图特点使用不同的大脑活动形式和响应(1]。总之,脑电图的优势是难以窃取和破坏,容易检测活性,可替换性。与此同时,低成本的脑电图因为它使得基于脑电图传感器系统提供一个机会来实现实用的识别系统。相比之下,医用传感器系统(例如,Neuroscan 64 -渠道体系,如图1(一)),低成本的传感器系统(例如,EMOTIV EPOC [10),如图1 (b)精度()有一个缺口11),但他们的小尺寸磨损,使他们更方便更容易被用户接受。此外,低成本的传感器系统有助于增加对象的大小,从而避免缺乏引起的系统性能故障样本多样性(12]。
(一)
(b)
前面提出的识别方案基于脑电图可以根据脑电图协议分为三组:静息状态,与外部刺激(认知任务和任务13]。在静止状态14),受试者被要求放松完全在一个安静的环境,和脑电图信号睁眼或闭上眼睛被记录。在认知任务,如运动图像(15),心理工作负荷(16,17),和驾驶疲劳18),主题通常需要训练,都必须完成特定任务根据外部线索,收集他们的脑电图信号(19]。在由外部刺激诱发的任务,如视觉诱发电位(20.和听觉刺激21),一些额外的设备通常需要创建和收集适当的刺激。与其他两个任务相比,静止状态基本上不需要培训主题和用户友好,一直深受研究者。
在目前的识别研究静息状态的脑电图,大多数方案都基于特征提取。d·l·罗卡et al。22)提出了一个新颖的方法,集中于光谱coherence-based大脑不同区域之间的连接和使用Mahalanobis基于距离的分类器识别10秒脑电图信号在2014年。m . Fraschini et al。23)提出了一个方案,用来计算加权相位滞后指数连接矩阵;然后,节点特征向量中心计算,最后genuine-impostor匹配分数计算确定2015年12秒的EEG信号。m . Garau et al。24]提出了融合的上述两个特性和匹配scores-level方法早在2016年,平均错误率为1.42%,实现了在12秒睁眼脑电图信号。黄永发。康等。25结合10单通道特性(七个光谱,三个非线性)和10多通道特性进行网络分析为一组脑电图特征,最后基于距离的分类器进行身份验证建于2018年。与深度学习的兴起,t·肖恩et al。26)应用CNN学习2018年静息状态的脑电图的特点,一个滑动窗口的12秒0.125秒的步伐。上述方案在实际应用中有两个缺点。(1)收购时间是10或12秒,在实时识别[太长27]。(2)记录64 -依赖医用传感器通道数据,在用户验收有困难和成本相比,低成本的传感器。解决上述问题,y太阳et al。27基于1)提出了一个系统d-convolutional长短期记忆神经网络(1 d-convolutional LSTM)在2019年,这只允许16通道脑电图信号和秒采集时间。然而,这个计划也有两个问题。(1)将LSTM引入网络将不可避免地增加了计算复杂度,在训练时间不足和模型加载时间(27]。(2)经验选择渠道市场提供低成本的传感器不能匹配,这不是理想实现实用系统。
最近,数据增加越来越使用脑电图,承诺增加EEG分类的准确性和稳定性(28]。数据增加生成新样品通过改造现有的样品,包括噪音,抽样,分割重组,生成对抗网络,等等。静息状态的脑电图,常用的数据增强算法滑动窗口,如图2(一个)。因为没有触发信号在静息状态的脑电图,固定窗通常应用于部分数据沿时间边界生成训练样本,如图2 (b)。例如,固定的窗户12秒,1秒,分别用于文献[23,27]。滑动窗口是一种泛化的固定窗口,其中包含两个属性窗口长度和步伐,也适合样本分割的静息状态的脑电图。例如,数据增加基于滑动窗口的12秒0.125秒的步幅是实现文献[26]。与固定窗相比,滑动窗口方法创造了更多的样品。然而,目前的个人识别的研究没有报道滑动窗口对性能的影响。
(一)
(b)
识别应用程序基于静息状态的脑电图,个人识别系统使用CNN模型(以下称为ICAConvNet),提出了适用于滑动窗口的数据增加0.5秒和生理网数据集上验证。实验结果表明,滑动窗口是有效的。当使用只有14频道时,平均1级精度为99.32%,平均等于错误率可以低至0.18%,接近64个频道的性能。总之,该系统具有采集时间短的优点,计算复杂度低,和快速部署使用低成本的传感器市场。
本文的其余部分安排如下:详细介绍了研究的方法提出了系统的部分2,包括数据预处理、数据增加、网络架构,和实验设置;实验结果和讨论部分3;一些结论是部分4。
2。方法
2.1。概述
图3显示了该识别系统的概述基于静息状态的脑电图。首先,在准备阶段,静息状态的脑电图数据预处理和增强,然后分为训练集和测试集。第二,在招生阶段,由ICAConvNet训练集训练,所有科目的静息状态的脑电图特征学习和存储在系统中。最后,在识别阶段,确定测试样本训练网络模型,并预测身份是输出。值得一提的是,它只需要0.5秒的静止状态后实现快速识别脑电图招生阶段。
2.2。数据预处理
为了保持原始信息和学习脑电图特征尽可能不执行过滤操作在数据预处理。
脑电图数据通常多通道时间序列与几十甚至几百个抽样电极,这是一个二维矩阵的数据结构。由于EEG信号的大小通常是小,为了避免梯度爆炸和改善深度学习的收敛速度,z分数标准化在神经网络训练之前,执行的意思和标准偏差分别计算出每个主题的信号,然后执行缩放显示以下方程: 在哪里 ,和参考通道,位置在时间维度,分别和标准偏差的信号。
2.3。基于滑动窗口的数据扩充
分段脑电图样本对网络的输入可以看作一个二维矩阵通道×点。在我们的工作中,以0.5秒的滑动窗口采用0.25秒的步伐,和数据采样率为160 Hz,所以渠道和点设置为64年和80年,分别。在实验部分,滑动窗口使用不同长度的影响和各种进步将讨论对系统性能。样本中提供基于滑动窗口的分割算法1。
|
||||||||||||||||||||
2.4。神经网络结构
独立分量分析(ICA) [29日,30.)适用于盲源分离的问题,广泛用于大脑信号的分析。因此,观察脑电图信号可以通过ICA分离,并且每个分离信号可以提供某些身份特征。ICA算法是基于以下假设:观测矩阵X由独立分量线性加权矩阵和混合矩阵,给出了(2)。ICA的目标是获得一个分离矩阵W根据X这样的信号矩阵Y获得的W作用于X是独立分量矩阵的最佳逼近年代如下方程表示:
相应的脑电图,矩阵X,年代,一个引用对象的多通道时间序列,大脑内的信号来源,内部之间的关系矩阵信号来源。灵感来自上面的ICA算法,收集到的多通道脑电图信号也可以分离得到近似原始EEG信号的内部信号来源,然后卷积是用来学习近似内部信号来源的生物特征身份识别。神经网络结构的细节被称为ICAConvNet如下。
2.4.1。ICA阶段
提供了用随机初始权重矩阵作为矩阵分离W,乘以神经网络输入(矩阵X)来获得近似矩阵内部信号来源Y,见方程(3)。采取Y后续卷积操作作为输入,W的权重是通过反向传播迭代优化。ICA阶段可能被视为一种使用神经网络的实现ICA算法。
2.4.2。卷积阶段
典型的多层卷积神经网络,包括多重卷积层和池层,将提取的生物特征信号在大脑和压缩参数范围。卷积得到内核的收敛参数经过若干次迭代的优化。
2.4.3。输出级
EEG生物特性了解卷积阶段结合和输出。第一,功能是由多个完全夷为平地,然后选择连接层。最后,由Softmax识别结果输出功能。为了提高系统的泛化性能,辍学函数添加完全连接层之间的。
ICA和神经网络相结合的理念一直在使用功能性磁共振成像(31日),但ICA阶段通常是相对独立于神经网络,和重量的优化W与网络无关。该系统集成了ICA神经网络架构,和重量的优化W取决于的反向传播网络。
网络体系结构是绘制在图4并实现了使用PyTorch [32]。Hyperparameter生理网睁眼会话的数据集执行调优的网格搜索方法,当一个0.5秒的滑动窗口采用0.25秒的步伐。经过综合考虑精度、复杂性和训练时间,主要hyperparameters最后选择如下。在ICA阶段,内部信号来源的数量是64。在卷积阶段,三层二维卷积ELU激活和三层采用max池。在输出阶段,建立了两个完全连接层和辍学率是0.5。Softmax最终的输出归一化函数。损失函数是交叉熵的损失,优化器是亚当的学习速率 。神经网络的损失函数方程所示(4),N代表样品的数量,O代表身份标签的数量,是一个函数(如果真正的标签样本吗我等于j,取1;否则,0),代表了预测概率样本的标签我是j。所有参数的神经网络如表所示1,在那里P,C,和O表示样本点的数量,样品通道的数量,和身份标签的数量,分别为:
2.5。脑电图数据集和渠道的选择
EEG信号用于验证该系统从公共数据库获得被称为生理网脑电图电动机运动/图像数据集[33- - - - - -35]。数据集是免费的,所有数据收集使用64 -通道BCI2000系统采样率为160 Hz。109名被试进行了14种不同的会话,组成两个休息基线会话和三组四个电机或电机(T1-T4)图像的任务。选择了两个静息状态的会话,一个1分钟睁眼(EO)和一个1分钟闭上眼睛(EC)。
近年来,低成本的脑电图传感器已经取得了很大的进步11因为它使得基于脑电图),进而增加的可能性识别系统将用于实际应用。为了评估该系统是否运行良好在这些商业脑电图传感器,进行了一系列的实验使用14,32岁,和64个频道,分别。所选14-channel并基于EMOTIV EPOC 32路X14频道移动Brainwear®(10)和EMOTIV EPOC Flex脑电图Brainwear®系统[36]。注意,14 EMOTIV EPOC渠道X(F7 AF3 F3, FC5 T7, P7, O1、O2, P8, T8, FC6, F4, F8,和AF4)都包含在原始生理网64个频道的数据集。因为EMOTIV EPOC Flex的32通道不精确对应原来的64个频道,四个频道选择(即。,TP7 FT7 TP8, FT8)。选定的通道在实验中以红色突出显示在图5。
(一)
(b)
(c)
2.6。实验装置
为了测试该系统能否满足识别的要求,两个实验进行生理网数据集。
2.6.1。数据增加实验
第一个实验验证数据增强系统性能的重要性。滑动窗口生成的分段样本不同长度和进步被训练和测试。第一个实验的数据都从睁眼会话,在第一个48年代划分为训练集和过去12 s作为测试集。
2.6.2。频道选择实验
14日的第二个实验探讨了影响32和64个频道在使用5倍交叉验证系统性能。在这个实验中,睁眼,闭上眼睛,和两个静息状态的工会会议检查。
应该注意的是,在这两个实验中,一个滑动窗口执行后的训练集和测试集划分。1000年以后训练时期,实验结果通常是稳定的,所以终止条件设置为2000时代。批处理的训练集的大小是64。系统性能评估使用1级精度,错误拒绝率(FRR),错误接受率(远),平等的错误率(曾经)。1级精度是用来评估场景识别的性能,这是正确的概率识别用户的身份。FRR远,曾经被用来评估性能在身份验证的场景中,系统决定了用户是否匹配他或她声称的身份(27]。
3所示。结果与讨论
3.1。实验结果
在数据中增加实验,系统使用不同的滑动窗口的性能如表所示2。滑动比率0.5意味着窗口重叠率是50%,和一个滑动比率为1意味着使用一个固定的窗口。固定windows应用时,1级精度为0.25秒,0.5秒,1秒,2秒是99.39%,98.89%,94.80%,和60.86%,分别。当滑动窗口重叠率50%,相应的1级精度为99.40%,99.51%,99.04%,和92.74%,分别与平等的错误率也提高了0.15%,0.06%,0.19%,1.67%。结果表明,滑动窗口实现更好的性能比固定窗户。有趣的是,性能的滑动窗口的1秒0.5秒的脚步就像固定窗的0.5秒,这可能是因为样品的数量最终生成的分割这两个计划几乎是相同的。测试精度和训练损失曲线绘制在图不同的窗口6。经过2000轮的训练,前三个扩张计划都在第一梯队,1级精度可以达到99%以上,这表明,方案使用0.5秒的一个窗口和一个跨步0.25秒可以实现性能优良的训练时间少。图7显示了检测误差的权衡(检波器)曲线的数据增加实验,也就是说,之间的关系,FRR,无论何时,都由阈值的变化。曾经越小意味着更好的性能在验证场景。计划使用一个窗口的0.5秒0.25秒的步伐也取得了最好的0.06%的曾经。ICAConvNet-based识别系统在某种程度上,更多的样本可能会带来一定的性能提升。此外,滑动窗口相同的窗口长度有助于减少的采集时间登记阶段。总之,一个0.5秒的滑动窗口跨步0.25秒的适用于该系统。如果窗口长度是进一步减少到0.25秒,性能没有改善,培训时间显著增加。
(一)
(b)
在渠道选择实验中,指的是数据的比较结果增加实验,一个0.5秒的滑动窗口使用0.25秒的步伐。14的性能、32和64脑电图频道在不同会话表所示3。所选14频道和32频道是基于市场EMOTIV EPOC可用XEMOTIV EPOC Flex,绘制在图5。根据实验结果,64个频道的性能通常是最好的,其次是32通道和14频道稍差。然而,尽管渠道低一半的数量甚至少于四分之一,系统的性能并没有遭受明显退化。因此,该系统有一个很好的识别性能即使很少脑电图电极和可用于使用低成本的脑电图传感器构建一个实用的识别系统。此外,平均1级精度可以达到99%以上在不同会话的交叉验证,表明该系统是有效的和鲁棒性。
3.2。与相关的工作
因为它使得基于脑电图的表现我们的工作与其他识别系统使用生理网数据集,如表所示4。应该注意的是,选择的结果从14频道联盟会议的频道选择实验。5倍交叉验证的具体结果是1级精度为98.152216%,99.573588%,99.599431%,99.819098%,和99.457294%,无论何时都是0.465176%,0.155298%,0.077230%,0.064428%,0.144111%。提出的方案m . Fraschini et al。23),m . Garau et al。24),t·肖恩et al。26)需要64 EEG信号通道和12秒的片段,这可能意味着漫长的等待为用户在注册和识别阶段。也存在类似的情况,提出的方法d·l·罗卡et al。22)和黄永发。康等。25]。在美国杨的工作等。37),达到99%的准确性T1-T4任务9-channel数据;然而,窗口时间增加到30秒。16通道系统提出了y太阳et al .,只有1秒的脑电图描记器需要完成这项工作,但LSTM引入网络体系结构将不可避免地增加了计算复杂度,从而增加高识别性能所需的培训时间(27),如表所示5。相比之下,该系统采用一个0.5秒的滑动窗口并选择14脑电图渠道基于现有的低成本的脑电图传感器,在1级精度仍有一定的优势,无论何时。同时,ICAConvNet缩短加载时间和更快的计算速度,当测试电脑配备一个英特尔10700 CPU, 2080 ti Nvidia GPU,希捷1 TB硬盘。从理论上讲,该系统具有更好的实用性。通过结合ICAConvNet和优化的滑动窗口,我们的工作有更好的整体性能。
4所示。结论
摘要个人识别系统使用提出了静息状态的脑电图,其目的是通过ICA和卷积计算。系统中通道的数量可以只有14岁和一个0.5秒的滑动窗口是增加申请数据。不同生理网公开访问数据库上滑动窗口方案比较选择最优数据增大参数。109年的交叉验证,1级为99.32±0.60%,能效比为0.18±0.15%,分别。与相关工作相比,我们的系统精度有一定的优点,计算复杂度,稳定性,因为它使得基于脑电图进一步发展实际的实现识别系统。
静息状态的识别应用脑电图是本文中讨论。在未来,nonresting状态脑电图的特点可以进一步研究。此外,因为它使得基于脑电图所面临的挑战识别系统在实际应用也值得探索,如脑电图的持久性和稳定性。
数据可用性
生理网脑电图电动机运动/图像数据集可以访问https://physionet.org/content/eegmmidb/1.0.0/。提出了系统的代码公开https://github.com/hitfyd/Personal-Identification-System-using-Resting-State-EEG。
的利益冲突
作者宣称没有利益冲突有关这项研究的出版物。
确认
这项工作得到了国家自然科学基金(批准号62071151和62071151)。