文摘
癫痫是一种常见的电生理障碍的大脑,发现主要是通过脑电图(EEG)信号。正确诊断癫痫发作以来通过监测脑电图信号非常繁琐和费时的神经学家,越来越多的研究一直在进行发展自动检测(AESD)癫痫发作。在这项工作中,小说提出了AESD监督模型。最初,EEG信号来自波恩大学脑电图(BU-EEG)数据库。然后,经验模态分解和特征提取(熵、频率和统计功能)应用于提取特征。此外,暹罗网络是用来减少提取特征的数量和获得最歧视的特性。然后,利用这些特性来分类发作和non-seizure EEG信号通过使用支持向量机分类器。本文探讨了暹罗在网络的贡献学习型特征变换改善癫痫检测的性能。数值结果证实,该框架可以达到一个完美的分类性能(精度)。这种方法可以有建设性的帮助医生检测癫痫发作活动,减少他们的工作量。
1。介绍
癫痫发作被定义为一个临时事件的迹象或症状产生的异常过度大脑中的神经元活动由国际抗癫痫联盟以及国际癫痫(1]。根据世界卫生组织宣称,目前,全球所有年龄段的大约有6500万人罹患癫痫,这使得它的一个最常见的神经系统疾病在全球范围内(2]。技术上来说,各种可用的技术被用来测量在癫痫脑功能,包括脑电图(EEG)、MRI(核磁共振成像),PET扫描,单光子发射计算机断层扫描,magneto-encephalography [3]。在所有这些技术,脑电图一直保持它的位置作为最广泛使用的诊断方法。自动检测癫痫发作的问题(AESD)已被广泛研究利用机器学习算法,可以分类脑电图信号正常,发作,发作的大脑活动。代表图1,AESD的整个过程包括四个主要步骤:数据采集、信号预处理、特征工程和分类。在过去的十年中,各种类型的研究已经进行了开发AESD技术通过提高一个或多个上述的步骤(4]。AESD、特性工程旨在从脑电图信号,提取最简洁的特性包括两个主要阶段,即特征提取和功能降低。有很多方法来提取特征。提取更多的功能可能会导致得到更多信息,进而可能导致提高分类精度。然而,它已经发现,超过某特定点上的特性可能会导致降低分类精度由于维度的诅咒5]。然而,没有足够的知识EEG信号的特征提取过程的开始。因此,它是合理的从EEG信号中提取许多功能,然后使用降维方法来选择一个特性的信息子集。请注意,降维映射的可行性取决于从高维输入空间数据点X使用函数的低维特征空间Y ,在哪里可以从数据获得试图将损失降到最低,当数据点信息吗X预计将y函数可以是线性的。这是与主成分分析(PCA)和其他相关的技术。然而,这些方法的能力严重依赖于函数的非线性。因此,深度学习(DL)可以提供新的方法精确计划执行非线性特性降低。应对上述挑战,我们利用暹罗网络减少手工特征的维数提高AESD准确性。我们的论文的主要贡献可以概括如下。(我)一种改进的基于机器学习AESD方法利用DRL-based特性提出了减少。(2)变化的影响特征维度的数量调查。此外,为了获得的最好的窗口大小是实验段改善AESD EEG信号。(3)介绍了特征提取策略提取多种特征利用时间和frequency-based原始EEG信号的统计分析和小波变换分解后由经验来分解(易)。 (iv) The Siamese network is constructed based on a multi-layer perceptron to extract the most informative features for improving classification performance. By exploiting the Siamese network as feature reduction, the performance of AESD significantly improves. The main idea behind Siamese networks is processing two inputs in parallel and training a double-input neutral network with a contrastive loss function, which gives the ability to detect whether the two inputs are from the same class or not. The Siamese network is used to reduce features and extract the most informative and discriminative features based on representation learning. Since few parameters in the Siamese network need to be learned, acceptable results can be achieved with relatively low training data. Considering all the previous works on the subject, utilizing the Siamese network for feature transformation in AESD is suggested in this study for the first time. Other sections of the study can be laid out as follows. In Section2,相关的工作和任务的背景进行了讨论。部分3描述了我们提出的一般方法和暹罗基于网络的详细功能转换。实验结果的框架提出和讨论的部分4和5。最后,部分6提供的结论和未来的工作。
2。相关工作
许多研究论文发表检测癫痫发作近年来支持自动诊断系统,以帮助临床医生和繁重的任务。这项研究在6)显示了使用模式识别方法在癫痫中的重要性采样和收集的数据在这个领域研究的讨论和分析。这项研究也证明了离散小波变换(DWT)可以发挥重要作用在改善和提高癫痫发作检测的准确性;此外,使用不同的模式识别方法与各种特性进行了探讨。这项研究在7)已经使用和研究各种DL方法,例如,autoencoder (AE),递归神经网络(RNN)和卷积神经网络(CNN),由不同的筛查检测癫痫MRI和脑电图等方法。现在科学家们可以使用这些分析来更好地理解概念来源于这些信号的信息。AESD一直在总结的整个过程(4]。本文旨在研究癫痫发作检测使用EEG信号的细节。同样,在8),癫痫发作预测过程的主要步骤,包括数据采集、信号预处理、特征提取、特征选择、分类、和性能评估,进行了综述。混合发作检测框架,介绍了小波变换和希尔伯特变换用于(9]。江等人提出了两个新的方法以基于辛几何分解和散射变换(10,11]。仿真结果在10]证明了特征提取的基于辛几何分解可以用高性能有助于癫痫检测精度和较低的计算成本。在[11],散射变换的能力,这是一种改进的基于一个复杂的小波,在癫痫检测进行了研究。探索FuzzyEn和LogEn-based散射变换是本研究最重要的贡献。在[12),土耳其Tuncer AESD等人提出了一个方法,利用当地六的模式(LSP)从EEG信号中提取稳定的特性。起初,15360特征提取,然后邻居成分分析(NCA)是用来减少功能,和256年特性。最后,支持向量机,再二次判别分析,线性判别分析作为分类器。这项研究在13)提出了一种新的分类方法癫痫阶段基于EEG信号的傅里叶synchro-squeezed变换(FSST)。在这种方法中,FSST的EEG信号的绝对划分为五个副环带。然后,每个副环带的灰度共生矩阵应用灰度共生矩阵建立()被认为是功能。通过连接不同的分解的特点,最终获得特征向量。最后,在选择信息特征的无限潜在的特征选择方法,支持向量机(SVM)是利用脑电图信号进行分类。作者在14]提出了一种新的方法来检测癫痫发作使用TunableQ从脑电图信号小波变换(TQWT),用于将脑电图信号分解成分解。然后,四对称模式是利用从原始EEG信号中提取256特性及其分解。之后,NCA选择最重要的特征在特征选择阶段。最后,再(资讯)是利用作为分类器。这项研究在15]应用互补的集成经验模态分解(CEEMD)和极端梯度提高改善AESD (XGBoost)。首先,CEEMD来原始EEG信号分割成固有模态函数。随后,从原始信号和多域特征提取分解组件。然后,最歧视的特性选择了重要性分数。最终,XGBoost应用于检测癫痫发作。在[16),国际货币基金组织混合选择法结合四种不同方法(能源、相关、功率谱距离,和统计学意义的措施)。在这个工作中,所选货币基金提取的影响通过EMD和EEMD分类调查。仿真结果表明,国际货币基金组织的选择影响分类。EEMD提供了一个可靠的方法分离preseizure从脑电图数据和发作阶段。Mammone et al。17)提出了一个使用PE失神癫痫脑电图记录的时空分析。摘要排列Renyi熵(每)参数化定义在癫痫脑电图分析。每对PE的设置已经调整(秩序,延迟时间,和α)。每超过体育因为有统计学意义,更大的区别每水平比PE发作,发作的。每超过体育作为分类器的输入发作vs发作的状态。所有的讨论了最先进的技术从EEG信号中提取的众多特性及其分解和选择最有益的功能使用传统的特征选择方法。获得更高的精度,我们利用暹罗网络特性减少提取最丰富的特性。考虑工作的目的主要是降低维度,我们没有调查AESD端到端可微的解决方案。尽管这些方法(18,19)可接受的性能,它们超出了本文的范围。
2.1。特征选择和特征转换
降维AESD系统的性能有很大的影响。有多种方法降低维度,所有方法试着寻找最歧视的特性,可以区分不同的类。一般来说,降维方法已经分成两个主要团体:特征选择和特征变换,也称为子空间学习。特征选择方法背后的主要思想是消除冗余和高度依赖功能通过不同的标准,可有效改善学习性能,增加准确性和减少学习算法的执行时间(20.,21]。另一方面,功能转换结合原始特性来构造一个新的和更小的组特性。最大相关最小冗余(mRMR) [22),卡方(气)23),比值比(或)[24特征选择方法的实例很少。主成分分析(PCA) (25),潜在语义索引(26),独立分量分析(ICA) [27,28),和部分最小二乘(PLS) (29日)是一些功能转换方法的示例。除此之外,很多研究工作已着手进行改善癫痫检测性能基于特征选择和降维。例如,作者在30.)提出了一种新的方法来检测癫痫发作使用改进的correlation-based从脑电图信号特征选择方法和随机森林分类器。这项研究在31日)提出了一种新的特征选择算法基于和声搜索AESD。在[32),一种新颖的基于遗传算法的特征选择。此外,在[33),提出了一种新的特征选择算法的基础上,费舍尔得分和组合p价值特征选择方案。拟议的方法最常见序列扩展到等级分类癫痫和non-epileptic EEG信号的特性,和它大大超过几个标准的特征选择方法。
2.2。暹罗网络
布朗首次引入暹罗神经网络作为一种强大的方法来解决图像匹配问题(34]。然后,暹罗提出了神经网络的新结构(35),主要的想法是找到一个从输入数据的相似性度量找到一个输入模式和目标之间的映射空间这样一个特定的距离在目标空间估计输入空间的语义距离(36]。更准确地说,暹罗网络被训练使用“对比损失,”创建了一个欧氏空间和样品相同的类标签的接近另一个和样品不同的类标签相距远。从那时起,几种研究进行调查暹罗网络等不同的模式识别应用程序度量学习,药物发现,蛋白质结构预测,演讲表示,0 / 1 / few-shot学习,人地。总之,暹罗神经网络学习,能与表示的空间便于分类创建任务。简单地说,暹罗网络用于减少高维度特征实现对输入数据之间的联系。
3所示。方法
如图2,该方法包含两个不同的系统:离线训练系统用于生成规则从脑电图信号和在线检测系统,使用这些规则对新的信号进行分类。离线训练系统试图通过以下步骤建立一个分类器。预处理是第一步,包括时间分割和噪声去除。下一步是脑电图信号分解成窄的子频带信号通过使用易,然后从易分解后获得一些标准特性。然后,NCA用于从所有子频带信号选择排名靠前的特性。之后,提出了暹罗网络应用于高维特征空间转换成更多的减少,简洁的空间。最后,转换特性和相应的标签是用来训练分类器。的区别,从测试样品中提取特定特性在线系统,然后类标签使用pretrained参数估计。最终,分类器的性能评估,以确定准确的,敏感的,具体的可以。
3.1。数据库
该方法评估使用波恩大学的EEG信号的数据集,这是首先报道了Andrzejak et al。37]。这个数据集包括五个subdatasets命名Z,O,N,F,年代(也叫一个来E与表中描述的特点,分别)1。此外,每组有100 23.6的单通道脑电图信号持续时间、采样频率为173.6赫兹为每个信号导致4097个样本。时间序列的例子脑电图信号从可用在波恩五套数据集在图中进行了描述3。因为这个数据集包括五个子集,各种分类任务可以考虑学习,最实用的一个表所示2(38]。在这部作品中,考虑四种常见病例脑电图信号分类:1,9,11,12。因此,该方法的一个有效的比较与先前的研究可以建立。应该提到的这种情况下12是最具挑战性的类型的癫痫发作分类,因为它涉及五类之间的差别。在这种情况下,本研究的主要目的是实现精度高,几乎没有研究five-class分类问题。
3.2。预处理
在预处理阶段,首先分为输入脑电图信号段固定长度,有或没有重叠,这完全取决于输入数据库,最后的任务。在这项研究中,不同的段长度的影响癫痫检测的最终精度也检查了。在这方面,研究区段长度是512个样本,1024个样本,2048个样本,整个时期(4097个样本)的脑电图信号。由于波恩数据集的脑电图信号噪声完全免费,不需要运用降噪方法(37]。在现实实验获得了脑电图中,常常需要消除不受欢迎的工件从脑电图信号为了获取有价值的诊断数据。对于这样一个目标,通常先验信息的性质工件是必需的。为广泛的脑电图系统参与者可以自由移动,因此引入一个广泛的motion-related工件,工件的污染脑电图普遍得多。因为很难得到先验知识的特性,不幸的是,传统的工件去除过程往往是无用的。在这种情况下,该方法提出了(39)可以为工件实际抑制普遍的脑电图。
3.3。通过实证小波变换信号分解
因为原始EEG信号是非线性和非平稳,分解算法被广泛用来分解原始脑电图数据AESD性能更佳。在许多研究中,时频分析已用于生物时间序列处理(40- - - - - -42]。在这项研究中,易被利用每个原始EEG信号分解成几个分解。然后,这些原始的脑电图信号和分解组件被认为是为后续的特征提取。易,这已经在[首次提出43),是一种自适应和强大的技术分析非平稳信号。易旨在分解wavelet-tight框架构建自适应的信号。只是,易试图提取各种信号模式通过构造合适的自适应信号处理的小波滤波器。易使用的必要步骤如下所述。
步骤1。计算傅里叶频谱的频率范围 信号的通过应用快速傅里叶变换算法,然后找到所有局部极大值 的并推导出相应的频率 在哪里输入EEG信号, 。
步骤2。分段傅里叶频谱N部分的边界检测方法。在这项研究中,子频带信号(的总数N为每一个脑电图信号被固定到10)。每一段的边界可以很容易地通过计算连续两个局部极大值的中间。它应该首先提到和最后一个边界频率是0 ,分别和傅里叶段 。
步骤3。定义一个自适应滤波器银行米小波滤波器在每段获得。这些小波带通滤波器产生的想法Littlewood-Paley-Meyer小波(44]。总而言之,易分解的信号成N子频带信号 ,这实际上是一个窄带调制。因此,利用希尔伯特变换定义每个子频带信号的瞬时振幅和频率。作为一个例子,原始的脑电图信号和对应的组件使用易分解的集F波恩数据见图4。
3.4。特征提取
先前的研究显示,不同的领域退出功能,包括时间、频率、和时频域,被证明是比一个域在改善AESD精度(2,4,45]。在这项研究中,我们提出一种时频分析策略使用易,脑电图信号自适应分解成分解。值得一提的是,十分解后选择经验进行进一步分析。然后,15个特征从原始EEG信号和分解分解提取。这些特性在表中做了总结3,所有的全面解释(2]。之后,我们连接的特点不同的分解和生脑电图信号获得最终的特征向量。最终, 特征提取原始EEG信号和分解分解。提出了特征提取的过程是显示在图5。
3.5。特征选择
最有可能的是,其中的一些特性可能是无关紧要的或多余的,不适当的分类。因此,它必须有一些算法来消除这些无关的特性的特征向量。在这方面,通过使用功能排序法,提取的特征为癫痫发作检测排名根据他们的重要性。在提出的模型中,从165特性,30选择排名靠前的功能通过使用方差分析(方差分析)。更具体地说,方差分析应用选择最相关的特征基于排名特征向量通过计算f值为每个特性。例如,对于案例1,F值的特性是描绘在图6和前30名提取特性表中列出4在降序排列。
3.6。暹罗网络功能转换
在建议的方法,暹罗网络是用来学习非线性函数的特性还原法。如图7暹罗网络由两个相同的子网架构共享相同的重量相等。在我们的方法中,延时是骨干,地图输入特征空间到一个较低的通过选择空间p和问 随着神经元数量的输入和输出层,分别。假设是一个p输入空间的维向量, 是一个非线性表示MLP网络变换向量成一个q-dimensional欧几里得空间,二进制变量Y时0和1两属于同一个类,分别D的指标是一双样品之间的距离,得到以下方程是什么 ,在哪里是欧氏距离。其目的是发现(通过更新权重)为 ,最小化的距离,D。为 ,D变得足够大,至少比 ,在哪里是hyperparameter量化的最小距离。
因此,一对的对比损失函数被定义为(46]
显然,对比损失函数试图最小化阶级之间的距离和组内的距离最大化。有效地培训网络,数据必须分为对相似或不同的数据。在这里,类似的数据被定义为拥有相同的标签,而不同的数据有不同的标签。在拟议的结构,每个子网由五个完全连接层(输入层,三个隐藏层和输出层)。每一层是紧随其后的是一个激活函数,一个辍学层,和一批标准化层。数量输入层和输出层的神经元可以由所选功能维度和最终功能维度,分别等于30和2。然而,在每个隐层神经元的数量是一个hyperparameter,并且它可以通过反复试验的过程。这里,许多种类的实验被用来确定每个隐层神经元的数目(10在这项研究中,20个神经元,神经元,神经元和5,分别为隐藏层1、2和3)。此外,均方误差作为损失函数,和亚当应用优化器。学习率是0.0005,采样mini-batch B被认为是256。暹罗的细节子网是描绘在图8。
3.7。分类和性能评价
分类选择的特性,我们使用了一个支持向量机分类器。Vapnik提出的支持向量机,是一种先进的模式分类器,正确区分两类。阐述了基于统计学习。通过确定的最佳超平面的最大利润,SVM尖锐地分类数据点也是能够无视离群值。对于线性不可分的数据点,样本空间映射到高维特征空间通过一个非线性支持向量机的核函数。因此,内核函数集成数据转换成可分的数据。在目前的研究工作,不同kernels-linear和非线性包括二次立方,Gaussian-are用于确定最佳超平面和相关结果显示精度最高。此外,评价该方法的性能,精度(ACC),灵敏度(Se)和特异性(Sp)是利用。准确性是评价最常用的因素分类,衡量分类器的有效性,被定义为正确预测实例的数量数量的例子。敏感性,另一方面,被定义为真正的正确预测数量的比率正面例子的所有积极的例子。 Specificity is the ratio of the number of correctly predicted of true negative examples to the number of all negative examples. The mathematical notations of these performance metrics are formulated as follows:
真正积极的和真正的消极的EEG信号,也称为TP、TN,指示正确识别脑电图信号的数量和正确地拒绝了EEG信号的数量为每个类。同时,假阴性(FN)和假阳性(FP)错误地拒绝了EEG信号的数量为每个类和错误识别脑电图信号。
4所示。结果
在拟议的方法,以确保当前分类的性能是免费的偏见,k-fold使用交叉验证。然而一次性k-fold交叉验证的总体精度可能不被认为是可靠的。因此,T次k倍交叉验证执行在每一分类阶段,和平均值和标准偏差估计在这个考试。在这项研究中,我们假设T= 20,K= 5。来模拟该模型,我们使用了MATLAB编程环境在个人电脑(PC)。如前所述在方法部分,我们首先把每个EEG信号分为短段,在分解和各个部分分解。后来从分解提取的各种特性,然后提出了两阶段的特征选择方法选择最简洁的特性。之后,使用支持向量机对所选特征进行分类。最后,k采用倍交叉验证检验该模型的性能。涵盖所有步骤,仿真结果获得了不同的情形。首先,几个窗口长度,该方法的适用性评估。然后,我们显示特性的影响工程步骤(分解后的数量,数量的特性,和降维)的分类性能。最后,比较了该模型与最新的技术。
4.1。特征选择步骤对分类性能的影响
在本节中,我们审查的影响特征选择踏上最后AESD的性能。为了这个目的,我们首先排名获得的165特性使用方差分析(如图6在每一步),然后,我们考虑k顶级特性分类。分类器的精度不同数量的选择顶级特性 4例(病例11例1、案例9日,和案例12)如图9,这表明性能在所有实验情况下改善的增加到顶级的选择功能 ,然后它变成了几乎稳定为止k= 35;在那之后,精度退化是由于维度的诅咒。值得一提的是,在这个实验中,窗口的长度4096个样本。为了增加AESD的准确性,选择30顶级特性之后,我们建议利用暹罗网络将这些特性和提取最丰富的特性。
4.2。特性工程步骤对分类性能的影响
检查功能工程的重要性,我们分析了分类的最终结果与不同的特征维度。为此,我们考虑四种不同的态度。在第一的态度,我们只是用15上述特性和他们从原始信号中提取并进行分类。在第二个态度,我们使用易分解的信号变换分解并提取165特性,而这些特性被送到评价的分类器。在第三的态度,我们选择了从165年排名前30位的信息最丰富的功能特性和分类研究结果。在最后的态度,我们认为该模型的结果,介绍了数字2;这四个态度的结果总结表5。
4.3。EEG信号的不同长度的影响
分割的正确选择是至关重要的在癫痫检测的研究得到更好的分类结果。因此,选择基于长度的分割也会产生分类的结果。在这方面,四个窗户的长度取决于使用4096年,2048年,1024年和512年的样本,分别将每个原始脑电图段分为1、2、4、8短段。表6展示了不同的段长度对最终的精度的影响,癫痫检测的敏感性和特异性。
5。讨论
5.1。检查参数变化的性能
从表6,我们可以推断,通过增加信号长度,将改善分类精度、灵敏度和特异性。实验结果表明样本的倾向产生最优分类的结果在一个长度为4096样本长度的512年和1024年相比,这可以归因于信号长度之间的直接联系和分类信息的增加前者导致后者的增加。此外,例1的长度最短的信号,最好的表现,这表明我们提出的鲁棒性方法对减少信号长度。简称也值得一提的窗口长度,精度、灵敏度、特异性的模型情况下12(最具挑战性的类型)是98.91%,97.94%,和99.05%,分别比以前现有方法(47,48]。表5说明了分类性能(精度、灵敏度和特异性)不同的特征维度和四个场景。在第一步中,15个特征选择,显示适度的性能指标。在下一步中,使用易,特征的数量已经急剧增加从15到165年。如表5表明,精度、灵敏度和特异性已经大幅减少,造成维度的诅咒。简单地说,除了改善通过超过功能很不满意,因为过度拟合。在第三步中,30个排名靠前的特性选择了使用方差分析来解决这个问题。结果表明,精度、灵敏度和特异性1已经达到100%,这是最好的性能,如果12日他们已经达到95.15%,93.85%,和96.75%,分别。这种改进反映出适当的特征选择算法的性能。在最后一步,暹罗基于网络的降维方法结合特性和获得最歧视的特性,这是主要的思想。总的来说,很明显,精度,灵敏度和特异性所有病例显著增加在该方法仅使用两个特性。例如,案例12、准确性、敏感性,和特异性相比第三步已经提高了4.15%,5.79%,和2.37%,分别。
5.2。与最近比较先进的作品
该方法的性能比较与其他现有最先进的方法使用相同的数据集。如表所示7和8,该方法显示了性能优越的准确性、敏感性和特异性的最先进的方法。
6。结论
在这项工作中,我们提出了一个新颖的基于暹罗AESD模型网络。我们建造了一个暹罗网络基于多层感知器来提取最丰富的特性对提高分类性能。暹罗基于网络的降维方法AESD设计和评估在不同的场景。结果表明方法的有效性二进制(案例1)和多层次(例11和12)分类和不平衡数据集(例9)。暹罗的最终结果意味着一个有前途的应用程序体系结构的分类任务。在不久的将来,我们将扩展我们的模型检验与更多的癫痫患者更大的数据集,提高泛化能力。此外,一个先进的三联体网络模型可以考虑更好的结果。
数据可用性
数据分析在当前研究中可用https://ebrary.net/59044/education/details_public_databases。
的利益冲突
作者宣称没有利益冲突。
作者的贡献
白木巴拉狄和哈米德Azad同样这项工作。