基于MPI的脑电信号特征提取并行算法框架

摘要

本文提出了一种基于MPI的大数据集并行框架，用于提取脑电信号的功率谱特征，以提高脑信号的处理速度。目前，Welch方法被广泛应用于功率谱的估计。然而，传统的Welch方法花费了大量的时间，特别是对于大数据集。鉴于此，我们在传统的Welch方法中加入了MPI，并将其开发为一个可重用的主从并行框架。该并行框架只要将任意格式的脑电图数据转换为指定格式的文本文件，即可快速提取功率谱特征。在提出的并行框架中，将一个通道记录的脑电图信号分为多个部分N重叠的数据段。然后，PSDN段是由一些节点并行计算的。结果由主节点收集和总结。每个通道的最终PSD结果保存在文本文件中，可通过Microsoft Excel读取和分析。该框架不仅可以在集群上实现，而且可以在桌面计算机上实现。在实验中，我们将这个框架部署在一台带有4核Intel CPU的台式计算机上。从2.85 GB脑电图数据集中提取功率谱特征只花了几分钟，比使用Python快7倍。该框架方便了没有并行编程经验的用户构建并行算法来提取EEG功率谱。

1.介绍

脑电图是大脑电活动的记录信号，通过电极从头皮收集。脑电图在医疗、军事、体育、情报等领域的应用具有重要的实用价值，得到了广大研究者的广泛认可。到目前为止，各个学科的科学家在这一领域都取得了很好的成果。例如，美国沃兹沃斯中心的科学家通过信号帮助瘫痪者输入36个字符，而不是用自己的手指。这些信号与特定的大脑活动相对应。在中国，清华大学的科学家们设计了一种自动拨号系统。该系统将大脑的思维方式解释为相应的数字，并与计算机相连进行实时拨号[1-6.]。EEG信号的模式识别的研究包括以下步骤：数据收集，数据存储，数据处理，数据分类和识别，如图所示1．

为了记录脑电图信号，需要在头皮上放置几个电极。传统的设备通常有20个电极。然而，最近使用的脑电图设备多达256个电极，如图所示2（a）．电极数量的增加使得能够记录大数据，从而使图中的数据处理阶段1更重要也更复杂。这不仅消耗了大量的计算机资源，而且导致数据提取效果差，直接影响分类的准确性。有许多信号处理方法可以提取具有良好识别性的脑电图特征。这些方法包括时域分析、频域分析和时频分析。本文对不同的频谱信号表示方法进行了比较分析[7.]。这些方法包括功率谱密度(PSD)技术、原子分解、时频(T.-F）能量分布和连续和离散的小波方法，可以从哪个频带电力特征中提取和使用在电动机图像（MI）分类的框架中使用。所指出的是，在EEG信号的所有特征类型中，PSD方法证明是提取左右MI诱导的EEG之间的精确辨别的独特光谱模式的最一致，稳健，有效。

(一)

（b）

（C）

目前，许多方法用于计算信号的PSD。Welch方法是最受欢迎的方法之一，其中用户计算Python或MATLAB环境中的EEG信号的PSD。函数scipy.signal.welch用于Python和PWelch在Matlab中使用。在少量数据的情况下，可以通过这两个功能快速获得EEG信号的PSD。但是，来自数字2（b）和2 (c)我们可以看到，随着科学和信息技术的快速发展，即将到来的5G时代，可穿戴设备将广泛优先考虑。这些设备可以收集人类活动的EEG信号。我们可以通过分析他们的EEG信号来收集一些特定人员（如司机和学生）的当前工作或学习状态[8.那9.]。如果我们计算Matlab或Python环境中的PSD，我们需要很长时间我们无法承受它。因此，我们集中于如何通过平行方法来计算EEG信号的PSD。

并行方法可以提高处理速度，但需要支持分布式计算的技术。如今，大数据分析有两个通常不同的框架。一个是Apache Spark，另一个是OpenMP / MPI。在文献中比较和分析了两个计算框架[10]。Apache Spark具有良好的数据管理能力。OpenMP/MPI比Apache Spark快一个数量级。基于此，我们提出了一种并行的大数据集脑电信号功率谱特征提取框架，该框架可在Linux和MPI环境下实现。

本文的主要贡献有三个方面:（1）根据Welch算法的原理，我们提出了一个平行的Welch算法，PFWelch，计算脑电图的PSD。PFWelch的体系结构基于主从模式。每个通道记录的EEG信号分为N重叠的数据段。然后，这N段由主节点并行计算。结果由主节点收集和总结。每个通道的最终Welch PSD结果将保存在文本文件中，可以通过Microsoft Excel读取和分析。（2）使用了指定格式的中间文件。世界上脑电图数据集种类繁多;不同的数据集有不同的文件格式。为了在并行框架中处理各种脑电信号数据，需要将脑电信号数据转换为中间文件。中间文件和并行框架之间的关系如图所示3.．（3）设计了比较实验。在实验阶段，我们首先在Matlab环境中运行函数pwelch，从EEG信号中提取PSD功能作为基线，以便比较，随后在Ubuntu平台上运行PfWelch。结果表明，PFWelch与功能PWELCH具有相同的结果。在此之后，我们使用pfwelch运行在同一环境中的Python函数scipy.signal.welch。实验结果表明，所提出的并行框架比使用Python快7倍。

本文组织如下。部分2简要概述了韦尔奇方法的原理，然后呈现了韦尔奇方法的串行算法和韦尔奇方法的建议平行框架。在部分3.，我们呈现实验结果和分析。讨论和结论在一节中介绍4.．

2.材料和方法

2.1。韦尔奇的方法

功率谱密度（PSD）展示了如何包含在频域中的信号中的功率。Welch的方法和多扶兆方式表明了PSD估计中的最佳性能[11]。韦尔奇算法[12]显示在图中4.．

从图中4.，我们可以以以下数学形式展示Welch算法。

输入信号那分为多个重叠段。在大多数情况下，当输入信号分成段时，将应用50％的重叠。让每个细分的长度是段的总数是．中数据的公式部分内容如下:

分割的程序如图所示5.．

抽样长度的关系N，重叠点数N_D.，部分数量N_S.，节段长度L.是

平滑窗口适用于每个段。通常，我们通常使用汉明窗口。每个段的汉明窗的公式如下：在哪里表示每段的长度。figure6.用Matlab在时域和频域显示256点汉明窗口。

窗函数的目的是防止频谱泄漏[13]。figure7（a）显示原始信号的频谱泄漏。figure7（b）汉明窗口可以有效地减少光谱泄漏。

(一)

（b）

从公式(3.)，我们可以得到公式(4.)我被加窗后的数据段:

计算每个窗口段的傅里叶变换。公式是作为遵循：在哪里傅里叶变换的结果是我th窗口的部分, ．

通过使用以下公式来计算每个窗口段的周期图：在哪里表示窗口的平均功率．

所以, 表示窗口功能的能量长度．

最后，我们可以通过Welch方法获得PSD，这是那些时期的平均值，即，

2.2。Welch方法的串行算法

为了设计一个好的并行程序，有必要了解传统的串行算法。根据上面对Welch方法的描述，给出了Welch方法的串行算法为algorithm1．

输入: EEG_file: EEG Signal File韦尔奇:你想要的长度seg_len:每个段的长度 Fs: sampling rate

输出： Wel_psd: the Welch estimate of PSD（1） Initialization: over_len = seg_len/2;//Length of overlap between the successive segments（2） Data are read from EEG_file and stored into the arrary welch[N.];（3）计算有多少段:N._segs（4）for index in range (0, seg_len)（5)创建汉明窗口[我];（6）你+ = win[index]∗win[index]你;(7)指数+ +;（8） end for（9） for seg_start in range (1, x_len-seg_len + 1)（10） seg_end = seg_start + seg_len −1; //seg_start and seg_end is start point and end point of each data segment, respectively.(11)将汉明视窗应用于韦尔奇的数据[N.]在[seg_start，seg_end]之间;（12） Do FFT for windowed data. The result is stored in variable fft_x;（13） Calculating the square of the amplitude of the fft_x. The result is stored in variable pgram;（14）求和功率谱Pxy + =程序;（15）start_seg + = seg_len-overlap;（16) end for(17） Wel_psd = Pxy/(N._ffts × Fs ×你)；

2.3。提出了韦尔奇方法的平行框架

2.3.1。程序结构

根据第2.2节中韦尔奇方法的串行算法的步骤，可以看出该算法可以与MPI并联实现。并行算法的结构是主奴隶，并被证明为图8.．

PFWelch算法在部分中的结构2.2包含以下阶段:输入、分割、映射、缩减和输出阶段。将一个通道数据分成7段，按照一定的规则分配给4个节点。所有节点负责计算。在reduce阶段，主进程负责接收从进程的结果并计算最终的PSD。由于快速傅里叶变换的并行实现已经发展成熟[14-20.]，我们不需要提供相关细节。以算法描述了韦尔奇方法的并行算法2．

输入: EEG_file: EEG Signal File韦尔奇:你想要的长度seg_len:每个段的长度 Fs: sampling rate

输出： Wel_psd: the Welch estimate of PSD开始（1）初始化:MPI_Init;排名←MPI_Comm_rank; size ← MPI_Comm_size;overlap_len = seg_len / 2;（2）读EEG_file（3）EEG_file中的数据存储到数组welch[N.];（4） Calculate how many segments:N._segs（5) for node = 1 to size par-do//Parallel process（6）将汉明视窗应用于韦尔奇[N.]/ /N.间startPos stopPos);startPos和stopPos分别是某个数据段的起始点和结束点。(7)对加窗数据进行FFT。结果存储在变量fft_x中;（8） Calculating the square of the amplitude of the fft_x. The result is stored in variable pgram;（9） Summate power spectra Pxy + = pgram;（10） end for(11) if (rank = = 0)//master process（12） Receive Pxy from each process and compute average of all periodogram.（13）/ /其他奴隶的过程（14）发送Pxy到主进程结束

2.3.2。任务分配

并行程序的关键是如何与各个节点进行协作[21.]。如何将任务均匀地分发给每个计算节点是影响并行程序性能的主要因素之一。从图中8.，将每个通道的脑电图数据分为7段(N._segs = 7）。每个段的长度为64.分配方案如表所示1当节点的数量为4时（size = 4）。


段的标号	0.	1	2	3.	4.	5.	6.

节点的标签	0.	1	2	3.	0.	1	2

根据表1，方便计算每个处理器需要计算的信号范围。例如，处理器0需要处理段0和4。从公式(1），可以计算信号范围是[0,63]和[128,191]。

3.实验结果与分析

3．1.数据集

在实验中，数据是从网站下载的http://kdd.ics.uci.edu/databases/eeg/eeg.html．该数据集源于大型研究，检查遗传易感性对酗酒的脑电图。它包括从位于256Hz的头皮上的64个电极的测量值。EEG数据集有三个版本：小数据集，大数据集和完整数据集。完整数据集包含122个科目的所有120个试验。整个数据集被压缩到大约700 MB [22.]。在未压缩时，它的大小约为2.8 GB。所有文件转换为中间文件后，共有11058个文件。

３．２．测试方法和环境

需要测试三种不同的表演：（1）精度．并将MATLAB仿真结果与并行框架仿真结果进行了比较。（2）速度．对Python程序的运行时间与并行框架的运行时间进行了比较。（3）加速．并行框架使用不同的节点运行。记录运行时间，可以得到加速。

硬件测试环境如表所示2，软件测试环境如表所示3.．


节点	CPU	记忆	类型

4.	英特尔（R）核心（TM）I5-4460	8 GB.	台式电脑


操作系统	并行环境	Matlab

Ubuntu 16.04	C + MPICH 3.3.1在Ubuntu上	R2018a Win10上

3.3。实验结果

在Matlab中使用Welch函数计算一个脑电通道的PSD，即pwelch (data, hamming(64)， 32, 64, 256)。pwelch参数是指将样本数据分割成段，每段有64个数据点，相邻段重叠为32个，采用汉明窗，采样率为256hz。figure9.在Matlab中给出了三种不同窗口函数的Welch方法的结果。

我们在并行框架中执行了相同的测试。PSD结果存储在可通过Microsoft Excel访问的文本文件中，如图所示10．

比较数字9.和10表明Matlab和PfWelch两者获得的结果是一致的，这使得PFWelch的正确性得到了一致的。为了测试时间性能，我们首先使用不同段中的不同数量的节点来计算使用pfwelch的一个eeg文件的PSD（在这个实验中，我们将不同的CPU核心视为不同的节点）。时间消耗（以秒为单位）记录在表中4.．为了便于比较，Python环境中串行算法的时间开销也列于表中4.．由于没有使用Matlab Linux版本，我们用Python做了这样的对比实验。


段	节点
段	1	2	3.	4.	Python

7.	0.0543	0.0413	0.0382	0.0365	0.228
3.	0.075	0.06	0.056	0.056	0.235
15.	0.064	0.054	0.05	0.047	0.224

其次，我们使用具有7个段的不同数量的节点来计算使用Pfwelch的所有脑电图文件的PSD。时间成本记录在表中5.．


节点	1	2	3.	4.	Python

时间成本(s)	478.778	354.008	342.715	337.966.	2451.

加速可以评估PFWelch的时间性能。speedup的定义为speedup = Ts/Tp，其中Ts表示串行操作时间，Tp表示并行操作时间。提速如图所示11．figure11展示了，随着节点数量的增加，加速也会增加。但是，在不同的情况下，增加是不一样的。对于所有EEG文件，图11表明，随着节点的数量增加到一定值，加速缓慢增加。原因是所花费的时间包括打开和关闭文件。当节点数量增加时，无法更改此时间。

对于单个脑电图文件，当信号被分成7段时，PFWelch表现出最好的性能。这是因为当节点数为4时，它的加速速度最大。因此，我们将信号分成7段，计算图中所有EEG文件的PSD11．如果将信号分成15段，加速度基本上是线性增长的，但其加速度是最低的。figure12清楚地揭示了段数和加速之间的关系。

可以看出的是，通过增加节点的数量，加速性提高。但是，仅增加节点数量不能提高加速。从图中12，可以看出，当段数增加到15时，加速系数减小。当段数为7，节点数为4时，加速性能最好。

4.讨论与结论

目前，虽然可以从脑电信号中提取特征的方法有很多，但PSD仍是其中最重要的方法之一。但是，在处理大量脑电数据时，需要提高PSD的计算速度。因此，本文提出的并行框架用于解决大数据环境下EEG数据集提取PSD特征耗时较长的问题。该框架基于C + MPI语言，采用主从模式完成。与传统的串行Welch方法相比，该框架将信号分为N并将其均匀分布到不同的节点上，并行计算PSD。在实验中N分别是3、7和15。节点个数为1 ~ 4。对于给定的数据集，我们发现虽然可以通过增加节点来提高加速性能，但如果段过多，加速性能会降低。实验表明，只有合理选择节点和段数，才能获得最佳的并行框架性能。PFWelch的速度比在相同的硬件和操作系统平台上使用Python快7倍。

由于MPI的强大功能，此框架不仅可以在群集上部署，而且可以在桌面计算机上部署，这对用户非常方便。实验结果也证实了框架是正确的，有效的，并且具有良好的实用价值。它可以应用于提取各种eeg数据集，稍微修改。对PFWelch感兴趣的研究人员可以从源代码下载https://github.com/abcxq.．

数据可用性

我们研究中使用的所有数据都可以从http://kdd.ics.uci.edu/databases/eeg/eeg.html．

利益冲突

作者声明他们没有利益冲突。

致谢

基金资助:湖南省教育厅科研项目(no. 201430430531);基金资助:国家自然科学基金资助项目(no. 17A148)、国家自然科学基金资助项目(no. 61673316、no. 11601339)和湖南省自然科学基金资助项目(no. 17A148);S2019JJSSLH0130)。

参考资料

B. He, L. Astolfi, P. A. Valdes-Sosa et al，“脑电生理连接:理论与实践”，生物医学工程的IEEE交易第66期7，第2115-2137页，2019。视图:出版商网站|谷歌学术搜索
“脑机接口中脑电信号相位空间特征的提取”，《计算机科学》，Neurocomputing号，第151卷。10, pp. 1477-1485, 2015。视图:出版商网站|谷歌学术搜索
“基于脑电图的脑-机接口汉字拼写系统的研究”，“基于脑电图的脑-机接口汉字拼写系统的研究”，信息技术与电子工程边界，卷。19，没有。2018年3月3日。视图:出版商网站|谷歌学术搜索
B. Yan，S. He和K. Sun，“网络排列熵的设计及其对混沌时间序列和脑电图信号的应用”，熵，卷。21，不。9，p。849,2019。视图:出版商网站|谷歌学术搜索
Y. Dai，X. Zhang，Z. Chen和X. Xuebin，使用小波-CSP和投影极端学习机的脑电图信号分类，“科学仪器审查，第89卷，第89期。7、文章ID 074302, 2018。视图:出版商网站|谷歌学术搜索
S. He，K. Sun和R. Wang，“非线性时间序列的分数模糊熵算法和复杂性分析”欧洲体质期刊特殊主题号，第227卷。7-9，第943-957页，2018。视图:出版商网站|谷歌学术搜索
P. Herman，G.Prasad，T. M. McGinnity和D. Coyle，“eEG基电机图像分类专题提取的光谱方法的比较分析”神经系统与康复工程学报，第16卷，第5期。4，pp。317-326，2008。视图:出版商网站|谷歌学术搜索
Y.Gu，E.Cleeren，J. Dan等人，“头皮脑电图和耳后闭腹部的比较”局灶性癫痫患者可穿戴癫痫发作检测系统的开发，“传感器第18卷第2期2，第29页，2017。视图:出版商网站|谷歌学术搜索
J. W. Ahn, Y. koo, D. Y. Kim, J. Sohn, J.- h。Kim和H. C. Kim，“基于ssvep的脑-机接口的可穿戴式耳内脑电图系统”，电子字母，卷。54，没有。7，第413-414,2018。视图:出版商网站|谷歌学术搜索
J. L. Reyes-Ortiz, L. Oneto和D. Anguita，《云中的大数据分析:hadoop上的spark vs beowulf上的MPI/openMP》，Procedia计算机科学， vol. 53, pp. 121-130, 2015。视图:出版商网站|谷歌学术搜索
M.G.Jahromi，H.Carsaei，A.Zamani和D. W. Stashuk，“EMG信号分解中使用的电机单元电位特征的交叉比较”神经系统与康复工程学报，卷。26，不。5，pp。1017-1025,2018。视图:出版商网站|谷歌学术搜索
K.K.Parhi和M.Ayinala，“低复杂性韦尔奇功率谱密度计算”IEEE电路与系统汇刊I:常规论文第61卷第1期1, pp. 172-182, 2014。视图:出版商网站|谷歌学术搜索
F. J. Harris，“关于离散傅里叶变换的谐波分析的窗的使用”，IEEE论文集第66期1, 1978年第51-83页。视图:出版商网站|谷歌学术搜索
M. Ayinala, M. Brown，和K. K. Parhi，“通过折叠变换流水线并行fft架构”，IEEE超大规模集成(VLSI)系统汇刊，第20卷，第2期。6，第1068-1081页，2012。视图:出版商网站|谷歌学术搜索
T. Cho, H. Lee, J. Park，和C. Park，“高速、低复杂度的修改基-2^5.用于千兆WPAN应用的FFT处理器IEEE电路和系统国际研讨会的诉讼程序， IEEE，中国北京，2013年5月。视图:谷歌学术搜索
Z.Wang，L. G. Yeo，W.Li，Y. Yany，Y.Ting，以及M. Tomisawa，一种用于OFDM UWB系统的新型FFT处理器，“APCCAS IEEE亚太地区电路和系统会议的诉讼程序， IEEE，荷兰埃因霍温2006年4月。视图:谷歌学术搜索
S.乔，Y.Hei，B. Wu和Y.Zhou，“一个UWB系统的一个区域和功率高效的FFT处理器”2007年关于2007年无线通信国际会议，网络和移动计算会议，中国上海，2007年9月。视图:谷歌学术搜索
S. N. Tang，J.W. Tsai和T. Y. Chang，“基于OFDM的WPAN应用程序”的2.4-GS / S FFT处理器“，IEEE电路与系统汇刊II:快速摘要，卷。57，没有。6，pp。451-455，2010。视图:出版商网站|谷歌学术搜索
M.Garrido，K.K.Parhi和J.Grajal，“一种用于实值信号的流水线FFT架构”，“IEEE电路与系统汇刊I:常规论文，卷。56，没有。12，pp。2634-2643，2009。视图:出版商网站|谷歌学术搜索
M.Ayinala，K.K.Parhi，Parhi和K. Keshab，“基于基于基于Radix-2 {3}和Radix-2 {4}算法的实际信号的FFT架构”IEEE电路与系统汇刊I:常规论文，第60卷，第2期9、pp. 2422-2430, 2013。视图:出版商网站|谷歌学术搜索
李晓平，安乃珠林，张立平，“基于MPI的主从并行遗传算法框架”，仿真系统学报，第16卷，第5期。9，页1938-1827,2004。视图:谷歌学术搜索
http://kdd.ics.uci.edu/databases/eeg/eeg.html．

医学中的计算和数学方法

脑机接口或脑机接口的计算智能方法

摘要