文摘
本文提出了一种新颖的分类框架和一个新的数据简化方法来区分多级运动图像(MI)脑电图(EEG)的脑机接口(BCI)基于协方差矩阵的歧管在黎曼的视角。方法1,科目的决策树(SSDT)框架与过滤测地线最小距离黎曼意味着(FGMDRM)的目的是识别MI任务和减少FGMDRM的不可分的地区分类错误。方法2包括特征提取算法和分类算法。特征提取算法结合semisupervised联合互信息(半-JMI)与通用歧视分析(GDA),即SJGDA,减少在黎曼切平面向量的维数。和分类算法替换方法1中的FGMDRM再(资讯),名叫SSDT-KNN。通过应用方法2 BCI竞争第四集2,kappa值相比,改进了从0.57到0.607的获胜者数据集2 a。和方法2也获得很高的识别率在另外两个数据集。
1。介绍
大脑计算机接口(BCI)基于运动图像(MI)是用于分析人类意图通过脑电图(EEG)信号所产生的人类大脑电生理活动(1,2]。基于BCI技术,外骨骼可以用来帮助残疾人恢复他们的运动能力,BCI也广泛应用于智能家居、娱乐、军事、和其他领域(3- - - - - -6]。
常见的空间模式(CSP)广泛用于汽车图像提取脑电特征(7]。在两个分类任务CSP具有良好的性能,但缺点是它需要大量的电极(8]。
尽管历史很短,使用黎曼几何在BCI解码正在吸引越来越多的关注9- - - - - -13]。协方差矩阵是对称正定的空间(SPD)矩阵,可以制定作为一个黎曼流形(14]。在BCI领域,CSP的连接算法和几何信息的工具已经被调查,考虑在选择几个散度函数黎曼的距离(15- - - - - -18]。Barachant等人提出了一个简单的数据扩增方法提高性能的黎曼平均距离意味着(MDM)算法(13]。Kumar等人提出一个乐队CSP MI-BCI框架,利用切线空间的概念映射歧管的协方差矩阵,并且该方法获得好成绩相比其他竞争方法(19]。层次MDM分类器对多类问题已经测试(20.]。
先进的分类器基于黎曼流形上的切线空间积极的矩阵也得到越来越多的关注。Barachant等人地图切线空间的协方差矩阵和应用特征选择和线性判别分析(LDA)的切线空间(10]。在tan分类器的应用空间,问题是,维度的诅咒。传统的数据降维方法包括两类:线性降维(异地恋)和非线性降维(NLDR)。由于大多数实际数据的非线性,NLDR技术,如局部线性嵌入(米歇尔)[21(ISOMAP)[],等距映射22)、最大方差展开(MVU) [23],t-distributed随机邻居嵌入(t-SNE) [24,25)广泛用于解决问题。李等人使用离散小波变换(DWT)和连续小波变换(CWT) MI任务,提取特征和高斯混合模型(GMM)是用于构造GMM supervectors;这种方法加速的速度训练和提高运动图像的准确性(26]。Sadatnejad等人提出一个新的内核保持拓扑特征空间中的数据点,并提出内核强,特别是在数据点的情况下有一个复杂和非线性可分的分布(8]。谢等人提出了一个框架内在子流形学习从高维黎曼流形;该方法表现出很强的健壮性与一个小的训练数据集(27]。
还有另一种方法来克服高维度社民党集合管的问题。和这种方法映射从高维社民党廖一个低维而社民党流形的几何是保存。,只有两个这样的工作。Davoudi et al。14)提出了距离保护地方平均(DPLM)降维技术,结合FGMDM,本文的最佳性能的kappa值是0.60。Harandi et al。28学到的一个映射,最大化之间的测地线距离组内的同时最小化同类之间的距离,它是通过一个优化Grassmann导管。
在本文中,我们提出了一个新颖的SSDT-FGMDRM SSDT-KNN多级MI的分类任务,设计一个简单而有效的决策树与框架。方法1包含SSDT-FGMDRM改善FGMDRM的性能。为每个单独的,方法1首先分离的两个最歧视类集团。此外,其余类别包括误分类样本之前最后一个节点的节点重新分类。方法2包含SSDT-KNN和一个名叫SJGDA NLDR方法。SJGDA结合的优势半-JMI GDA、方法2表现良好在不同的数据集。这篇文章的目的如下:(1)SSDT框架来验证的有效性提出了通过数据集1(2)在特征提取验证SJGDA的优越性,与之相比半-JMI和GDA(3)验证方法的泛化能力2通过不同的数据集,本文
剩下的纸是组织如下:部分2介绍了黎曼几何的数学预赛。部分3详细讨论了拟议的方法。三个数据集介绍了部分4。我们工作的结果讨论了部分5。而在部分6,我们比较我们与艺术的状态的方法。本文的结论部分7。
2。社民党矩阵的几何
让X我代表一小段连续脑电图信号,X我可以表示如下: 在哪里X我对应于的成像运动开始时间t=T我。表示数量的采样点的选择。
为小道,空间协方差矩阵(SCM)可以计算如下:
基于单片机,有两种方法对MI黎曼流形中的任务进行分类。
2.1。过滤测地线最小距离黎曼的意思
黎曼两个社民党矩阵之间的距离P1和P2在P(n)是由(29日]
鉴于米社民党矩阵P1、…P米黎曼几何平均数的意义上被定义为
对于算法意味着黎曼距离黎曼意味着(MDRM),我们计算黎曼未知类之间的距离P的黎曼意味着每个类和分类未知类分类对应于最短的距离。灵感来自于主测地线分析(PGA)方法(30.],文献[31日)发现一组过滤器采用Fisher线性判别分析的延伸名叫费希尔(FLDA)测地线判别分析(FGDA)。然后,这些过滤器适用于MDRM形成过滤测地线最小距离黎曼意味着(FGMDRM)。可以看到更多的细节从[31日]。
2.2。切线空间映射
如图1社民党的矩阵P用一个可微的黎曼流形Z。每个切向量年代我可以被看作是导数在哪里t测地线的= 0Γ(t)之间的P和指数映射P我=经验P(年代我),定义如下:
对数映射的逆映射,可以定义如下:
使用黎曼测地距离,黎曼的意思我> 1社民党矩阵
使用切线空间位于几何平均数的成套试验, ,然后,每个SCMP我映射到这个切线空间,产生的吗米=n(n+ 1)/ 2维的向量:
许多有效的分类算法可以实现在黎曼空间(10]。
3所示。方法
3.1。与决策树框架
决策树是一种常见的机器学习方法。决策树的每个节点可以定义为一个规则。郭和盖尔芬德32]提出了用神经网络分类树,该方法嵌入多层神经网络直接在节点。在决策树中,最重要的事情之一是构建一个适当的二叉树结构;上层节点产生更大的影响整个样品的准确性(33]。为了解决multiclassification问题在这篇文章中,我们构建了一个科目的决策树(SSDT)分类框架,如图2根据最佳的分离原理(34]。从图可以看出2SSDT提出了列车不同,在不同的节点决策树分类模型。
SSDT框架的优点如下:(1)这个模型把两个MI的任务(例如,C.1和C.2)最高识别率尽可能(2)在最后一个节点,我们重新分类一些样品来提高分类器的分类能力
3.2。方法1:直接根据SSDT-FGMDRM分类方法
首先,我们指出一个问题的多级FGMDRM通过使用一个例子。图3给出了一个三级分类问题。图3(一个)显示了FGMDRM分类进展。我们可以看到三个黎曼意味着点(rmp)位于歧管。由于分类标准是决定通过测试点之间的距离计算和RMP,它造成了错误的分类。图3(b)的分类结果显示了示例使用SSDT-FGMDRM框架的第一个节点。可以看出,错误使用决策树分类是纠正框架。
方法1是用于分类四种类型的MI直接任务。训练和测试图如图4。
3.3。基于黎曼切线空间特征提取算法
在这个段落中,我们提出一种新颖的数据简化方法相结合半-JMI GDA,即SJGDA,解决维数灾难问题后切线空间映射。
3.3.1。Semisupervised联合互信息
Semisupervised数据集D=D{Dl∪DU}由两部分组成,标记数据和未标记的数据。一个二进制随机变量年代介绍了确定标记数据和未标记的数据集的分布。当年代= 1,我们记录的价值y,否则不是。通过这种方式,标签集Dl来自联合分布p(x,y|年代= 1),而未标记的集合DU来自于分布p(x|年代= 0)。潜在的机制年代特征选择是非常重要的。
基于互信息的特征选择方法理论是一种常见的特征选择方法(35]。在这些方法中,我们排名的功能根据分数,选择得分越高的特性。例如,通过排名根据他们的互信息的特性与标签,我们得到的相关性与类标签。分数的特征定义如下: 在哪里Xθ已经选择和代表的特性Xk是按分数排名的特性。Y对应的标签功能Xk。
半-JMI方法使用semisupervised JMI数据集作为训练集。可以看到更多的细节从文献[36]。摘要missingness机制是class-prior-change semisupervised场景(MAR-C) [37]。特性的排名后,我们可以获得一个特征向量如下: 在哪里n切向量的长度吗年代我。因为存在信息冗余f我们选择最好的向量长度米(米<n每个主题的分类识别率:
3.3.2。广义判别分析
变量选择后,本文利用广义判别分析(GDA) (38,39),这是一个非线性的特性减少技术基于内核以减少特征向量的长度fSJ和他们的裁员。映射X(fSJ)到一个高维空间F通过核函数Φ:
线性费舍尔决定执行F空间和判别函数的扩展 在哪里WΦ∈F和年代B和年代W分别是类间散点和在类散射。
为方便数值计算,介绍了核函数来解决这个问题:
高斯内核、保利内核和乙状结肠内核广泛应用于GDA [40]。测试数据的z,其形象Φ(z)F太空项目WΦ如下:
本文运用策略内核减少维度。GDA后,我们可以得到一个向量fG如下: 在哪里d的fG是决定的实际需要,在本文中,我们准备好了吗d= 1。然后,SJGDA应用于本文的数据集,最后构造特征向量如下:
3.4。方法2:SJGDA和科目的决策树再
方法2是用于分类四种类型的MI任务后切线空间映射。训练和测试图如图5。
4所示。描述的数据
4.1。数据集1
BCI竞争第四集2是用来评估提出了两种方法的性能(41]。数据集2收集22个通道脑电图数据和3小城镇频道数据。四种类型的运动图像采集:左手,右手,脚,和舌头。数据集包含九个健康受试者,每个主题都有两个会议,一个训练和一个考试。每个会话都有288的足迹数据与72轨迹为每个任务。EEG信号5日阶巴特沃斯滤波器的带通滤波8-30赫兹频段。试用期的选择是很重要的在MI分类;我们选择2 s数据(0.5和2.5年代)线索后,指示用户执行MI任务竞争的获胜者。
4.2。数据集2
BCI竞争第三集III a用于评估方法2的性能。BCI第三集III a包含三个主题:K3b K6b, L1b,收集64通道脑电图数据。脑电图是采样250 Hz。四种类型的运动图像采集:左手,右手,脚,和舌头。可以看到更多的细节关于这个数据集在文献[42]。
4.3。数据集3
在我们的数据集,Emotiv Epoc +是用于收集脑电图数据的运动图像。它是一种便携式脑电图采集设备采样率为128 Hz。它有14个电极通道(AF3 F7, F3, FC5 T7, P7, O1、O2, P8, T8, FC6, F4, F8,和AF4),两个推理(CMS和DRL)电极,电极位置遵循国际标准10 - 20。设备和Emotiv 14电极位于10 - 20国际体系如图位置6。这个实验收集三种脑电图信号的一个联合:想象力的肩膀弯曲(F),扩展(E),绑架(A),如图7。
(一)
(b)
(一)
(b)
(c)
七个科目参加了本实验研究。这些受试者健康状况良好。在实验中,受试者自然放置双手,试图避免身体或头部运动。在实验中,受试者运动图像进行外部线索下,单个实验收集脑电图信号5秒钟,然后休息5 - 7秒,每个动作重复采集的20倍。实验过程如图8。
5。结果
5.1。方法1的结果
我们使用SSDT-FGMDRM分类中引入多级MI任务部分3.1。因为有四类,我们可以四对MI任务:左vs休息(L / RE),对vs休息(R / RE),脚和其他(F / RE),和舌头vs休息(T / RE)。对于每个主题,精度最高的一对用于火车N.1,和一对第二最高精度是N.2训练。表1给出了10倍交叉验证结果使用FGMDRM表达方案。
表2通过方法1显示kappa值。与其他方法相比,五个科目(A03, A06, A07、A08 A09)实现高kappa值九没有探索频域信息的方法1。在固定频率窗口的情况下,我们有改进的均值比MDRM kappa值为0.069 ( ),比FGMDM_fixed和0.139 ( )。我们的方法比FGMDM还显示显著改善( ),利用了科目的频率信息,kappa值为0.039。
5.2。方法2的结果
结果在图9显示,T / RE特性分布的五个特性A09主题。图9(一个)显示,排名前五的特征半-JMI。后应用半-JMI,前五个最佳特性提取显示显著改善的可分性p值< 0.05除了功能2值0.77。在图9 (b),从原始特征向量提取的前五个功能值为0.13,0.05,0.87,0.05和0.13。的值表明,对T / RE没有意义的原始特征向量。结果表明,随着我们的排名算法semisupervised特性,分离度的特性都得到很大的提高。
(一)
(b)
图10显示了分类精度的进化与资讯(k摘要= 5)对排名的数量变量表达方案。L / RE和T / RE识别率最高的两双,和他们在100年达到了最高识别率变量。但这仍然是一个诅咒的维度分类器;GDA用于分析第一个100分类变量在我们的研究中。
的分离特性不能满足我们的要求,GDA用于获得更多明显的变量。图11说明了前五个分布最GDA和判别变量半-JMI。从图可以看出11L / RE分离利用GDA同样。
表3显示十倍交叉验证结果使用SJGDA和资讯的表达方案。可以看出的向量映射到切线空间有更好的分类性能比直接在黎曼流形。
表4礼物的结果SJGDA成对多级MI任务。我们有六对MI任务:左和右(L / R),左右脚(L / F),左和舌头(L / T)和脚(R / F),和舌头(R / T),脚和舌头(F / T)。
表5显示分类精度的比较使用SJGDA和资讯为L / R任务10倍交叉验证。参考文献(8,43- - - - - -45)包含其他出版物的分类。我们已经改善了精度与文献[44)(p= 0.85)和文献[45)( )。白肢野牛et al。43)( )每个主题,探讨了特定频率信息和Sadatnejad Shiry Ghidary [8)( )小说的内核用于类似于SJGDA降维。尽管本文中的结果并不高的文献[43),它可以得出结论,没有区别的结果文献[43这些摘要,因为 。
表6介绍了kappa值的结果。该方法1达到平均0.589的性能排名的方法首先竞争。2我们的方法,我们实现了平均0.607的性能,这使得方法2获得最佳性能状态的艺术。
数据集2是用于验证方法2的影响,并直接给出分类结果。结果如表所示7。从表可以看出7方法2获得第二个最高识别率比较文学。相比之下,最近的文献[472)、方法取得了良好的分类结果。
5.3。结果数据集3
数据集3是用来评估方法2的性能。图12显示与资讯分类误差对排名的数量变量表达方案。/ RE和F / RE是最低的两对分类错误,他们都达到了最高识别率在60变量。本文首先60排名变量用于下一个分析。
图13显示5倍交叉验证结果利用SJGDA和资讯在表达和蛋。这个数字(13日)说明了三种可能的对MI任务(F / RE, E /, / RE)为每个主题。可以从图,弯曲和绑架是最简单的运动七区分六个科目,和六个科目是S1, S3、S4, S5, S6和S7。然而,由于个体差异,每个主体的最高识别率是不同的。
(一)
(b)
我们也比较三种可能对(F / E, F / A, E / A)在蛋的七个科目。图13 (b)描述了每个主题的比较结果,可以看出,对F / A获得最高识别率在七个科目。结合数据的分析结果(13日)和13 (b),它可以被认为是弯曲和扩展更明显的三小姐的任务。
SJGDA是本文提出的一种新方法,我们也SJGDA的特性分布相比,GDA、半-JMI说明SJGDA的有效性。图14描绘了F / E MI的功能分配的任务七个科目。蓝色和红色圆圈表示两种不同功能的类。如图14、F / E MI任务比GDA SJGDA有很高的可分性和学习半-JMI。
该方法的性能2是利用分类精度评价。因为有三个类,水平是33.33%。图15表明该方法达到更高的性能六个科目(S1, S2、S3、S4 S5,和S6)七除了S7相比半-JMI和GDA方法。此外,它还可以看出GDA获得一个更好的分类精度为4的7 (S1, S2, S5和S7)相比半-JMI。这一现象的原因可以归结为如下:特征选择的过程中,我们手动选择特征尺寸适合分类器,导致部分信息丢失。特征降维技术,GDA适合保存有用的信息从原始的向量。和该方法SJGDA本文不仅保留GDA的优点,还增加了一些高级的特性来加强表达能力特性。
6。讨论
在本文中,我们提出了一个新颖的SSDT框架结合分类器为多级MI任务提高分类器的性能。我们还提出了一个新颖的名叫SJGDA NLDR方法,这NLDR方法执行比半-JMI和GDA在不同的数据集。在下面的文章中,我们已经详细讨论了两种方法。
方法1表明FGMDRM的缺点,然后小说SSDT框架是用来改善为每个单独的准确性。如表所示2与其他出版的结果相比,方法1得到了不错的结果处理EEG信号的固定频率段(8-30赫兹)。
如表所示6白肢野牛et al。43]提出SS-MEMDBF选择科目的频率获得增强的脑电图信号代表MI任务相关µ和β节奏,然后直接与黎曼距离分类。TSLDA提出了Barachant et al。10),和协方差矩阵被映射到一个高维空间,它们可以作为欧几里得矢量化和治疗对象。Ang et al。46竞赛的优胜者,FBCSP和多个表达分类器被用于MI的任务,并取得kappa值的平均值是0.57。Sadatnejad和Shiry Ghidary [8)提出了一种新的内核NLDR社民党的歧管矩阵,kappa值是0.576。Davoudi et al。14]认为社民党的几何矩阵和提供了一个歧管的低维表示与一流的歧视,和该方法的最好结果kappa值是0.60。
方法2,SJGDA用于从切向量,得到更明显的向量和SSDT-KNN分类器是用于识别不同的任务。结合SJGDA SSDT-KNN,我们取得了更好的性能比方法1 ( ),文献[43)( ),TSLDA ( ),赢家1 ( ),文献[8)( ),和文献[14)( )。很明显,本文提出的方法是有效的MI BCI系统的任务。
为了证明该方法的有效性,我们测试了两个数据集。如表所示7和图15,方法2达到好的分类结果在两个数据集。
7所示。结论
方法1的实验结果表明,该分类框架显著提高分类器的分类性能。方法2的实验结果表明,该SJGDA本文算法优于GDA和半-JMI特征提取,方法2最高识别率。然而,随着分类器在SSDT框架是可替换的,接下来的重点工作是把更先进的分类器与SSDT增加BCI系统的识别率。
数据可用性
数据集1和数据集2用于支持本研究的发现是可用的http://bnci地平线- 2020. - eu/database/data -集。数据集3用于支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突。
确认
东北电力大学(批准号bsjxm - 201521)和吉林市科技局(批准号20166012)。