复杂性
复杂性
1099 - 0526
1076 - 2787
Hindawi
10.1155 / 2020/1496973
1496973
研究文章
协同睡眠脑电图数据分析基于改进的经验模态分解和聚类算法
https://orcid.org/0000 - 0003 - 4873 - 4567
郑
Xiangwei
1
阴
小春就
2
https://orcid.org/0000 - 0002 - 8592 - 3087
邵
就有
3
李
非政府组织
4
https://orcid.org/0000 - 0002 - 8342 - 6714
余
小梅
1
张
Xuyun
1
信息科学与工程学院
山东师范大学
济南市
中国
sdnu.edu.cn
2
设施园艺山东大学的实验室
潍坊科技大学
寿光
中国
wfkjxy.com.cn
3
信息科学与工程学院
兰州大学
兰州
中国
lzu.edu.cn
4
信息工程学院
山东管理大学
中医重点实验室数据云服务在山东大学
济南250357
中国
sdu.edu.cn
2020年
13
6
2020年
2020年
23
01
2020年
28
03
2020年
13
6
2020年
2020年
版权©2020郑Xiangwei et al。
这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。
睡眠疾病严重影响患者的生活质量。睡眠阶段分类(或睡眠分期),研究人类睡眠过程和分类睡眠阶段,是一个重要的参考睡眠障碍的诊断和研究。许多学者进行了一系列的睡眠分期研究,但不同睡眠阶段之间的相关性和分类的准确性仍需要改进。因此,本文提出了一种自动睡眠阶段基于EEG分类。通过构造一种改进的经验模态分解和k - means实验模型,定义“频域相关系数”的概念。在特征提取的过程中,最好的特征向量相关性在时频域被选中。脑电图特征的提取和分类是基于k - means聚类算法实现的。实验结果表明分类精度显著提高,我们的算法具有积极的影响睡眠分期相比其他算法。
中国国家自然科学基金
61373149
61672329
1。介绍
睡眠对人类和非凡的意义是与人们的生活密切相关。它扮演着一个重要的角色在人类身体功能的维护,因为它可以提高同化和减少异化
1 ,
2 ]。睡眠是一种可逆性的特点是快速状态意识丧失和减少响应外界刺激(
3 - - - - - -
5 ]。对于人类来说,医疗问题的主要原因之一是睡眠疾病,严重影响患者的生活质量。睡眠分期的目的是将睡眠阶段,这是必不可少的睡眠研究和睡眠障碍的诊断。传统上,根据Rechtschaffen和羽衣甘蓝建议或者新的指导方针由美国睡眠医学学会(发布),专家手工分析夜间多导睡眠图(PSG)记录执行视觉评分。之后,基于改进的发布规则,S3和S4阶段被合并进慢波睡眠(SS)和睡眠分为五个阶段:W, S1, S2, SS,快速眼动期
6 ,
7 ]。
一个脑电图(EEG)记录,反映了普通电动作用的大脑细胞组,它包含了大量的生理和病理信息。它有助于临床医生提高诊断的可靠性和准确性和检测大脑中神经损伤(
8 - - - - - -
10 ]。同时,它提供了一个有效的方法对脑部疾病的诊断。脑电图信号是一个包含多种频率成分的波形,并且它通常分为
β
波(13-40 Hz),
α
8—13赫兹波(),
θ
波(4 - 7赫兹)
δ
波(0 - 4赫兹)。因此,睡眠阶段可分为基于不同的脑电波频率和数据特点的脑电图信号。8个小时的PSG录音的手工分类(全部记录)大约需要2到4个小时。此外,手动标记结果有强烈的主观意识,这很容易影响分类精度。因此,自动睡眠阶段分类的研究是必要的(
11 ]。通过分析PSG记录、自动睡眠阶段分类(上海市建筑)可以与计算机实现,因此解决问题的耗时和费力手动标记(
12 ]。
考虑到非线性和不稳定的时间复杂性的脑电图数据信号,我们提出一个基于脑电图的自动睡眠阶段分类方法。改进的完整的集成经验模态分解与自适应噪声(CEEMDAN)算法用于提取EEG数据的特点和计算国际货币基金组织(IMF)组件。通过计算国际货币基金组织(IMF)组件的频域相关系数,选择适当数量的国际货币基金组织(IMF)组件,形成新的特征向量作为下一阶段的输入分类器。提取和选择特性的集群是由一种改进的k - means算法。上海市建筑最终实现了基于相关距离和聚类中心的选择。
本研究的主要贡献如下:
(1)
提出了一种改进CEEMDAN把频域相关系数提取脑电特征和IMF计算组件。通过计算国际货币基金组织(IMF)组件的频域相关系数,选择适当数量的国际货币基金组织(IMF)组件和形成新的特征向量。
(2)
一种改进的k - means聚类算法提出了基于相关系数与密度。首先定义为距离相关系数度量基于特定时间序列数据的时间和空间相关性。然后,密度是用于选择k - means聚类中心和聚类中心是由计算迭代更新所有的点的平均值。
(3)
非线性和不稳定的时间复杂性的脑电图数据信号,我们提出一个自动睡眠阶段分类方法的基础上,改进的经验模态分解和k - means聚类算法。通过创新改进特征提取方法和分类器的算法,上海市建筑的分类精度明显提高,得到了更好的实验结果。
其余部分组织如下。部分
2 评论最先进的自动分类和部分睡眠阶段
3 简要介绍了EMD和它的变体。部分
4 介绍了上海市建筑提出了基于改进CEEMDAN和k - means详细包括总体框架,改进CEEMDAN频域相关系数、改进的k - means聚类算法和基于相关系数的密度。部分
5 分析了睡眠分期的准确性和实验设置和结果聚类有效性和还讨论了本研究的发现。最后,部分
6 总结了论文,并讨论未来的研究机会。
2。相关工作
为了进一步提高上海市建筑的效率和精度,研究人员进行了大量的实验研究,实现更好的上海市建筑结果通过改进相关的算法(
13 - - - - - -
15 ]。其中,特征选择应用于增强分类能力的训练数据,可以提高数据分类的效率和准确性
16 - - - - - -
18 ]。最近,特征分析和提取方法,已经得到越来越多的研究和古典或现代信号处理方法采用分析EEG数据。例如,安德森et al。
19 )使用了一个自回归(AR)模型对EEG信号的特征提取和使用两——三层神经网络来执行10倍交叉验证4日主题认知与5项。为了实现更好的结果,杨et al。
20. )提出了一个脑电图信号基于小波包分解特征提取方法对两种不同的思维活动进行分类。下降等。
21 )进行了频域和非线性方法的比较研究和睡眠过程分为四个阶段:S1, S2,党卫军,和快速眼动。提取频域特性包括权力、光谱边缘,D2。然而,这些研究忽略时间的变化特点,脑电图信号以及自适应和地方特性。幸运的是,经验模态分解(EMD)算法解决问题的非平稳信号的脑电图数据(
22 ),和数据特征提取可以解决自适应数据分解到一个固有模态函数(IMF)。因此,学者们进行了广泛的研究运用EMD和EMD算法在信号筛选和检测、故障分析和生理信号处理。这些结果等传统方法难以实现傅里叶变换和小波变换
23 ]。
由于良好的EMD算法的自适应性,研究人员对EMD进行了广泛的研究。MuFeng和认为
24 )提出了一种改进的EMD滤波算法和使用快速傅里叶变换(FFT)进行简单的信号频谱分析。如果有高频噪音信号,那么IMF一阶组件通过EMD分解处理,可以实现一个更好的过滤效果。Zhang et al。
25 )提出了一种快速小波变换(淡水舱),可以达到较高的计算速度,同时提高计算精度。吴和黄
26 )提出了一种新的集成经验模态分解(EEMD)算法在2005年。这是一个改进的EMD算法,有效地解决了EMD混合现象。后来,CEEMDAN算法与添加自适应噪声模态效应进一步降低。与原算法相比,它具有更好的收敛性和哈桑和下榻的饭店
27 )应用到分析EEG数据实现上海市建筑。
目前,有许多分类方法应用于EEG信号,包括集群,支持向量机,神经网络和决策树
28 ,
29日 ]。1967年由Macqueen k - means算法(
30. ]。它是一个数值聚类算法,需要同时提取
N 特性。最初的k - means迭代聚类算法是一种基于距离。优点是快速、简单,效率高。本文对聚类算法的研究,希望将它应用到睡眠分期的研究通过改进的k - means算法。例如,枪等。
31日 )提出了组合结构的特征加权和C4.5决策树在睡眠阶段基于k - means聚类分类。上海市建筑上的聚类算法不仅解决了耗时和费力的人工标志的缺点但是也可以有效地提高分段操作的效率和上海市建筑的准确性(
32 ]。
3所示。EMD和它的变体
EMD是小说和自适应信号时频处理方法提出的黄等。
33 1998年)。它特别适用于分析非线性非平稳的信号。1999年,黄等。
34 ]改善EMD和介绍了希尔伯特谱分析来提高数据处理能力。这被认为是一个突破的线性和稳态谱分析在2000年基于傅里叶变换。EMD旨在产生一个高度一个信号的局部时频估计数据驱动的方式通过分解成有限和IMF或模式。每个模式都必须满足两个条件:
(1)
极值的数量和零交叉的数量必须相同或不同的最多
(2)
在任何时候,信封的平均值定义的局部极大值和定义的信封局部最小值是零
输入信号,迭代EMD分解
N 分脑电图时代为振幅和调频首先根据以下步骤:
步骤1:初始化
k
=
1
和
l
=
1
。
步骤2:确定输入脑电图数据的最大值和最小值
x
。
第三步:获取当地最大的信封
v
马克斯
和局部最小值
v
最小值
使用三次样条插值。
第四步:生成地方平均曲线
米
上部和下部信封:
(1)
米
k
=
v
马克斯
+
v
最小值
2
。
第五步:计算
h
k
由当地减去均值曲线
x
:
(2)
h
k
=
x
−
米
k
。
第六步:如果
h
k
满足两个条件的国际货币基金组织(IMF)
国际货币基金组织
l
获得;否则,设置
x
=
h
k
,
k
=
k
+
1
转到第2步,重复步骤2 - 5,直到
h
k
满足国际货币基金组织的两个条件,最后,
国际货币基金组织
l
得到如下:
(3)
国际货币基金组织
l
=
h
k
−
米
k
。
第七步:设置
c
l
=
国际货币基金组织
l
与当前模式。
第八步:寻找残留,
r
l
=
x
−
c
l
,
x
=
r
l
,
l
=
l
+
1
。步骤2 - 8筛选。
第九步:重复步骤2 - 8,找到其余的货币
c
2
,
c
3
,
…
,
c
l
。
因此,可以分解为输入信号
l
首先,直到残留成为单调函数,进一步提取国际货币基金组织是不可能的。输入
x
可以从所有重建imf的如下:
(4)
x
=
∑
j
=
1
l
c
j
+
r
l
,
在哪里
r
l
的残渣
l
th迭代。EMD和它的变体,如二元EMD和多元EMD广泛用于脑电图和其他生理信号分析(
35 ]。然而,EMD和其扩展模式混合的问题。后,消除模式混合的问题,noise-aided自适应数据分析和扩展方法提出了基于EMD和命名EEMD [
36 ]。在EEMD,低级添加随机噪声作为输入EMD分解过程。实现EMD修改后的信号的过程称为一个测试。测试是重复很多次获得最终的模式。EEMD最大的进步在于,它包含了高斯白噪声的基础上EMD如下:
(5)
x
我
n
=
x
n
+
w
我
n
,
在哪里
w
我
n
与
我 = 1,2,…
我
代表不同实现的高斯白噪声。
尽管EMD是数据驱动的,它是影响混合模式的问题,从而导致不同的振荡在相同的模式中,在不同的模式或类似的振荡。这个算法太简单的结构来解决这个问题。尽管EEMD有效解决问题的模式混合,EEMD分解产生残余噪声也是需要大量的计算。
4所示。基于改进CEEMDAN和k - means上海市建筑
4.1。总体框架
我们设计一种改进的CEEMDAN和k - means算法结合实现上海市建筑如图
1 。时域特征提取的基础上,我们进一步增加频域特性计算,并选择最有效的国际货币基金组织(IMF)组件。这种方法最终达到上海市建筑通过k - means聚类。
图1
基于脑电图的自动睡眠阶段分类。
该方法的过程如下:
(1)
输入:数据预处理去除工件和干扰噪声的小波去噪,和脑电图数据作为实验样本数据。
(2)
特征提取:我们使用改进CEEMDAN算法从样本数据中提取特征。通过脑电图信号的时域相关性,计算样本数据进行EMD分解获得国际货币基金组织(IMF)组件。然后,我们应用迭代计算从EEG信号中提取特征。
(3)
功能选择:特征提取和IMF分量的基础上收购,我们每个IMF组件转换成相应的频域特性通过FFT,及其“频域相关系数”是通过经验获得的选择和有效的数据分析方法;然后,国际货币基金组织(IMF)组件与high-frequency-domain相关选择,和所有国际货币基金组织(IMF)组件是重建。
(4)
选择分类:重建脑电图作为输入来实现睡眠分期基于改进的k - means聚类算法。
(5)
输出:聚类结果直接输出,然后结果是相对于手动标记。
4.2。改进CEEMDAN算法
CEEMDAN从原始EMD算法改进算法。添加高斯白噪声进行EMD分解得到IMF组件基于引导聚合方法,然后执行迭代计算实现数据集的分解。值得一提的是,传统的性能基于小波变换的时频变换方法是影响选择最好的基函数。CEEMDAN是数据驱动的,不需要prebase功能,这也使得它成为一个有吸引力的选择来处理高度非线性和非平稳的信号,如睡眠脑电图信号(
37 - - - - - -
39 ]。
在这项研究中,提出一种改进的CEEMDAN将频域相关系数的IMF的频域相关系数的定义,国际货币基金组织的每个组件的相关原始信号在频域中体现。然后,选择适当数量的国际货币基金组织(IMF)组件和新的特征向量是由国际货币基金组织(IMF)频域相关系数的计算组件。改进CEEMDAN算法可以描述如下:
一个操作员
E
j
⋅
定义产生
j
th的EMD模式。
第一步:计算
X
我
n
:
(6)
X
我
n
=
x
n
+
ε
0
w
我
n
,
在哪里
X
我
n
通过自适应加白噪声序列
x
n
,
w
我
n
与
我
= 1,2,…
我
代表不同的高斯白噪声实现,
ε
0
高斯白噪声的标准差。
步骤2:通过EMD分解上述信号获得他们的第一个模式。
步骤3:计算第一个模式
国际货币基金组织
1
˜
的CEEMDAN
(7)
国际货币基金组织
1
˜
=
1
我
∑
我
=
1
我
国际货币基金组织
1
我
n
=
国际货币基金组织
k
n
¯
。
第四步:获得第一个渣:
(8)
r
1
n
=
x
n
−
国际货币基金组织
1
˜
n
。
第五步:分解实现
r
1
n
+
ε
1
E
1
w
我
n
与
我
= 1,2,…
我
他们第一次EMD模式。
ε
k
(
k
这个阶段= 1)高斯白噪声的标准差
k
th阶段。
国际货币基金组织
2
˜
n
可以计算如下:
(9)
国际货币基金组织
2
˜
n
=
1
我
∑
我
=
1
我
E
1
r
1
n
+
ε
1
E
1
w
我
n
。
第六步:计算
k
th残留的
k
= 2,3…
K
:
(10)
r
k
n
=
r
k
−
1
n
−
国际货币基金组织
k
˜
n
。
第七步:分解实现
r
1
n
+
ε
1
E
1
w
我
n
与
我
= 1,2,…
我
他们首先EMD模式和定义(
k
+ 1)th模式如下:
(11)
国际货币基金组织
k
+
1
˜
n
=
1
我
∑
我
=
1
我
E
1
r
k
n
+
ε
k
E
k
w
我
n
。
第八步:走为下一个步骤6
k
。
重复步骤6到8,直到残留成为单调函数,进一步提取国际货币基金组织是不可能的。
K
模式和的总数吗
r
k
n
是最后的残渣。然后,
k
+ 1 EMD模式是通过迭代计算公式所示(
11 )。在这一点上,我们有多个固有模态函数(货币),也就是说,
国际货币基金组织
1
,
国际货币基金组织
2
,
…
,
国际货币基金组织
K
。
步骤9:为每个国际货币基金组织(IMF)组件、快速傅里叶变换(FFT)进行变换EEG信号从时域到频域。它的定义如下:
(12)
x
k
=
∑
n
=
0
N
−
1
x
n
W
N
nk
,
k
=
0
,
…
,
N
−
1
,
x
n
=
1
N
∑
n
=
0
N
−
1
x
k
W
N
−
nk
,
n
=
0
,
…
,
N
−
1
,
在哪里
W
N
=
e
−
j
2
π
/
N
。
执行国际货币基金组织(IMF)的频谱分析组件通过使用FFT,和相应的频域形式的时域特性计算得到的频率和振幅。
在实验中,我们直接叫FFT在MATLAB函数。其中,我们设置采样频率
f
年代
= 100赫兹和样品时间
t
=
N
/
f
年代
;
N
是数据长度。振幅和频率图所示
2 。
第十步:获取有效的功能组件CEEMDAN分解后,我们重新定义IMF的频域相关系数指数的提高“频域相关系数”的概念,提出了(
40 ]:
(13)
ρ
x
,
国际货币基金组织
我
=
E
国际货币基金组织
我
f
−
μ
国际货币基金组织
我
x
f
−
μ
x
σ
国际货币基金组织
我
σ
x
。
在公式(
13 ),
国际货币基金组织
我
f
和
x
f
代表的频域形式
国际货币基金组织
k
˜
n
和
x
n
在公式(
7 )分别;
μ
国际货币基金组织
我
和
μ
x
的频域的意思吗
国际货币基金组织
k
˜
n
和
x
n
;
σ
国际货币基金组织
我
和
σ
x
代表的标准差频域。
国际货币基金组织的频域相关系数反映了国际货币基金组织的每个组件的相关性与原信号在频域。也就是说,
ρ
x
,
国际货币基金组织
我
∈
0 1
表明IMF分量之间的相关性和原始信号在频域。因此,根据的价值
ρ
x
,
国际货币基金组织
我
可以选择最有效的国际货币基金组织(IMF)组件的多个国际货币基金组织(IMF)组件获得的分解,和国际货币基金组织可以根据记录频带从高到低:
国际货币基金组织
=
国际货币基金组织
1
,
国际货币基金组织
2
,
…
,
国际货币基金组织
K
。国际货币基金组织(IMF)组件的具体细节筛选实验部分中描述,在图
3 。
步骤11:输入
x
n
可以从所有重建imf的如下:
(14)
x
n
=
∑
k
=
1
k
国际货币基金组织
k
˜
n
+
r
k
n
。
图2
相对应的振幅和频率域。
图3
国际货币基金组织(IMF)的频域相关系数的频率。
我们计算的意思(
μ
),方差
σ
2
偏态(
γ
)和峰态(
κ
)的重建
x
n
,在数学上定义表
1 。
表1
特征向量用于这项工作。
的名字
数学公式
意思是(
μ
)
μ
=
1
N
∑
我
=
1
N
x
我
方差(
σ
2
)
σ
2
=
1
N
∑
我
=
1
N
x
我
−
μ
2
偏态(
γ
)
γ
=
1
N
∑
我
=
1
N
x
我
−
μ
σ
3
峰度(
κ
)
κ
=
1
N
∑
我
=
1
N
x
我
−
μ
σ
4
国际货币基金组织(IMF) time-frequency-domain特征向量计算出
N
乐队脑电图数据和特征向量组成如下:
(15)
年代
=
年代
x
1
,
年代
x
2
,
…
,
年代
x
n
。
输入
x
n
可以从一个重建
N
维向量特性集到一个新的
x
n
设置为下一阶段分类器的输入。
4.3。改进的k - means算法
k - means是一个基本的聚类算法;然而,也限制了一些实际应用和自身的机制。首先,
K
必须事先给定的选择
K
值是很难估计的。有必要确定一个初始分区基于初始聚类中心。它可以从k - means算法框架,算法的时间复杂度很大,应用时间序列数据容易受到异常值,和不确定性
K
值也会导致质量下降的集群
41 ]。克服缺点的k - means收敛于当地的问题和改善的影响
K
值聚类质量由于不准确,我们改进k - means算法如下。
本文选择初始聚类中心的密度概念基于相关系数和相关距离。脑电图样本数据,有一定的脑电图数据的时间序列之间的相关性。相关系数定义如下:
(16)
P
x
我
,
x
j
=
浸
x
我
,
x
j
D
x
我
D
x
j
=
E
x
我
−
E
x
我
x
j
−
E
x
j
D
x
我
D
x
j
。
在公式(
16 ),
浸
x
我
,
x
j
的协方差
x
我
,
x
j
。
D
x
我
和
D
x
j
的方差
x
我
和
x
j
,分别。
P
x
我
,
x
j
称为相关系数,用于测量随机变量之间的相关程度。
P
x
我
,
x
j
∈
−
1,- 1
表明更大的相关系数与更大的变量之间的相关性
x
我
和
x
j
。当
P
x
我
,
x
j
是1或−1,有一个明确的线性相关性
x
我
和
x
j
。
相关的距离计算如下:
(17)
d
x
我
,
x
j
=
1
−
P
x
我
,
x
j
。
对于这些数据关系,数据点的密度定义为一个数量随机分布在一定范围内。现在,设置
D
=
x
1
,
x
2
,
…
,
x
n
的密度
x
我
定义如下:
(18)
ρ
我
=
马克斯
d
x
我
,
x
j
。
其中,
x
j
属于最近的点集
x
我
。在聚类过程中,
ρ
最小值点是第一个聚类中心。当确定下一个集群中心,集群形成的第一集
ρ
至少从数据中删除
D
。在剩余的集,选择最小的点,直到形成新的聚类中心
K
选择聚类中心。大多数相关算法选择欧几里得距离计算集群中心。然而,欧几里得距离忽略了时间序列数据之间的相关性,因此,它不适合EEG信号分析。因此,改进的k - means使用相关系数作为指标基于时间和空间的距离相关的特定的时间序列数据和充分的时间序列数据的相关性。
改进的k - means聚类将迭代更新原型在选择初始中心和班上所有的点的平均值计算新的聚类中心。新的聚类中心的平均向量定义如下:
(19)
u
我
=
1
D
我
∑
x
∈
D
我
x
。
对于某一组数据,数据分布规律符合正态分布法。因此,详细讨论了正态分布的样本数据是准确的,每一部分的阈值。此外,它被用于与一个分段函数的概念。现在,正态分布概率和数据相关系数是等价的:
(20)
P
x
我
,
x
j
=
ϕ
x
−
u
σ
,
在哪里
u
的意思是内部点的距离中心的集群和
σ
是距离标准偏差从内部点的中心集群。
4.4。算法流程图和描述
提出上海市建筑的流程图如图
4 。
图4
基于改进的CEEMDAN和k - means流程图。
上海市建筑提出的算法的描述总结了算法
1 。
<大胆>算法1:< /大胆>上海市建筑基于改进CEEMDAN和k - means。
要求:
原始脑电图信号处理与小波去噪算法。
确保:
聚类结果表明,脑电图信号分为不同的睡眠阶段。
(1)定义
x
n
一个
N 分脑电图时代
X
。
(2)变量
Nstd
是噪声标准差;
NR
是实现的数量;
麦克斯特
是筛选迭代允许的最大数量。
(3)通过改进CEEMDAN分解,第一个模式
国际货币基金组织
1
和第一个剩余组件
r
1
n
得到,如公式(
6 )- (
9 )。
(4)
为
k = 2,…
K
做
(5)计算
k th IMF分量和残余分量
r
k
n
=
r
k
−
1
n
−
国际货币基金组织
k
˜
n
。
(6)分解实现新模式如公式(
11 )。
(7)
结束了
(8)分为初始集群中心。
根据公式(9)
16 )和(
17 ),距离的相关性
d
x
我
,
x
j
数据点和密度之间的关系
ρ
计算每个点的和最小的
ρ
作为第一个聚类中心获得设置
D
。
(10)剩下的数据集
D
分配到最近的类按照距离最近的聚类中心。
(根据公式(11)
19 ),每个点的距离计算每个类的中心;
u 和
σ
根据不同的计算
σ
段计算。最小的
ω
得到新的聚类中心。
(12)重新计算并分配单个样本对象,直到聚类中心不再变化。
5。实验和讨论
5.1。性能指标
我们使用准确率(ACC)作为一个客观评价指标,这意味着正确的样本的数量除以所有样本的数量。它的定义如下:
(21)
ACC
=
TP
+
TN
TP
+
TN
+
《外交政策》
+
FN
×
One hundred.
%
,
分别TP、TN代表的正样本和负样本分为正确的类型。ACC,分类精度的评价指标之一,可以有效地测量分类实验结果的准确性。因此,我们计算了ACC更好地评价实验结果。
评估k - means聚类算法中,我们使用SSE作为其性能指标来评价聚类质量。SSE表示平方误差的总和拟合数据和原始数据的对应点。上交所是越小,误差越小的样本和中心。它的定义如下:
(22)
上交所
=
J
k
,
u
=
∑
我
=
1
N
x
我
−
u
k
我
2
,
在哪里
N
显示数据源的数量,
K
代表集群中心的数量,
u
k
显示集群中心。目的是使每个类中的数据不同于每个集群。
5.2。数据集和预处理
实验数据得到了从生理网数据银行Sleep-EDF数据库。实验样本从白人男性和女性(21-35年)未采取任何药物。前四个记录(标记为
sc
∗
)与健康的呼吸从志愿者获得1989年在24小时内正常的日常生活。数据库中的数据记录(标记为
圣
∗
)于1994年获得受试者睡眠浅但相对健康。一个例子是图所示
5 。
图5
特征提取等水平小城镇,Fpz-Cz, Pz-Oz。
只有8原始Sleep-EDF数据库中的样本数据集,包括来自健康志愿者的4。实现上海市建筑,我们的实验样本选择的睡眠数据从三个健康的志愿者,那么,星际2,和sc3(对应于数据库数据sc4002e0 / sc4012e0 / sc4112e0);每个样本包含的小城镇,Fpz-Cz和Pz-Oz脑电图数据,每个采样在100赫兹。从Pz-Oz脑电图信号通道产生更好的分类性能比Fpz-Cz通道(
42 ,
43 ]。Pz-Oz通道被选为我们的研究与文献[
44 ]。
专家得分EEG数据和PSG基于生成的
R
&
K
建议如图
6 。每个阶段的时间间隔在这项研究中被定义为30年代,或30×100 = 3000数据点。此外,我们计算每个样本的有效睡眠时间,标志着24小时的EEG信号,选择9小时的睡眠有效性作为最终测试样本通过手动标记结果(.hyp) Polyman统计数据。
图6
脑电图和手动标记Polyman Pz-Oz渠道的统计结果。
与手动标记进行比较的结果,我们设计了两种分类标准。一个是根据定义的
R
&
K
睡眠阶段包括远、S1、S2、S3、S4, REM,另一个是将睡眠阶段定义为五类(S3和S4是组合成党卫军时期)。
数据预处理进行了减少噪声干扰。在这个实验中,这个函数
w
thcoef
使用小波分解系数进行阈值处理,然后,threshold-processed小波系数被用于重建降噪。首先,小波函数“db5跑车”是用于执行3 - layer分解的信号。第二,规模向量
n
被设置为1,2,3,和阈值向量
p
被设置为100、90和80。接下来,修改后的小波分解结构重建。最后,我们获得了处理数据,如图
7 。
图7
去噪前后的数据来减少噪声干扰。
5.3。结果
基于频域FFT计算相关性,根据越大的原则
ρ
值越大,IMF分量之间的相关性和原始信号在频域。我们发现,排序后,
ρ
的值
国际货币基金组织
1
来
国际货币基金组织
12
逐渐降低,如图
8 。
图8
箱形图的示例数据处理CEEMDAN改善。
(当我们设置阈值方法
ρ
>
0.3
频域相关性更为明显;否则,如果
ρ
≤
0.3
,我们忽略了它)和国际货币基金组织组件,选择7由改善CEEMDAN和重建作为分类器的输入,如图
9 。
图9
国际货币基金组织(IMF)组件在时域。
根据睡眠分期的临床需求,睡眠过程分为30年代的舞台。如果两个阶段的数据出现在相同的数据区域,超过一半的睡眠阶段时间睡眠相位代表了这部分的数据。我们观察到睡眠的分类精度等级的变化,通过调整簇中心的数量(
K
= 5或
K
= 6)如图
2 ,
9 ,
10 。
图10
不同的
K
值聚类实验。
(一)
(b)
介绍了ACC的客观评价指标来比较和分析的结果手动标记。准确地分类样本的总样本的比例计算,和实验得到的分类精度。
实验结果表明,不同
K
值会导致不同的结果在表
2 和
3 。当
K
= 6,
R
&
K
睡眠分期的标准被用来定义六个睡眠阶段。这时,S3和S4是独立计算,分类精度
81年
%
。当
K
= 5,S3和S4阶段被认为是作为一个单一的阶段。集群中心的数量减少,实验复杂度降低。使用这种方法,准确率
83年
%
。
表2
五级贷款分期结果。
主题
分类精度
W (%)
S1 (%)
S2 (%)
党卫军(%)
快速眼动(%)
总额(%)
那么
78年
65年
76年
96年
93年
83年
星际2
75年
35
76年
76年
90年
79年
SC3
82年
83年
87年
94年
95年
89年
表3
Six-category分期结果。
主题
分类精度
W (%)
S1 (%)
S2 (%)
S3 (%)
S4 (%)
快速眼动(%)
总额(%)
那么
75年
71年
78年
93年
64年
91年
80年
星际2
87年
15
71年
82年
43
88年
78年
SC3
80年
88年
82年
95年
76年
93年
84年
表
4 显示了SSE值第一次迭代后的两种算法。上交所的改进算法是小于原来的聚类算法,和SSE越小,更好的聚类结果。
表4
上交所的比较值的两种算法在第一次迭代之后。
方法
上交所
那么
星际2
SC3
原始的k - means
1103.77
1221.05
1097.54
改进的k - means
1100.03
1197.96
1015.73
由于不同渠道的脑电图数据的不确定性,上海市建筑的各种方法很难建立一个统一的标准进行比较。使结果更有意义,从几种不同方法获得的结果在同一数据集被用来比较。在表的精度值
5 为一个给定的方法是最好的。没有相关精度值在某些文学研究,所以失踪的情况下用“-”表示在表
5 。因此,该方法与原来的k - means算法和其他算法。实验结果表明,明显增加实现指标的准确性和效率。
表5
我们建议的方法结果的比较与其他相关文献的研究。
方法
6级(%)
五级(%)
原始的k - means
67年
71年
改进的k - means (
45 ]
- - - - - -
76年
小波变换+支持向量机(
46 ]
- - - - - -
76.5
PSD +安(
47 ]
76.7
- - - - - -
该方法
81年
83年
5.4。讨论
不难发现,使用该方法的平均精度大大提高。我们还发现,不同阶段之间有一定的相关性如W和S1阶段。在闪烁的状态下,α波是弱,类似于S1及其特征。这是区别脑电图波形的形态多样性,但这并不意味着所有阶段值会减少。尤其是当使用由六个阶段组成的分类、S3和S4阶段与文献中的结果相比显著提高(
44 ]。这可能与改善我们所选择的特性和相关系数的聚类算法的改进。此外,以往的研究可能忽视了不同阶段之间的相关性,这些问题将在未来的研究。
6。结论
本文提出了一种基于改进的CEEMDAN和k - means上海市建筑方法。首先,改进CEEMDAN算法应用于时间序列数据处理。基于频域相关的选择适当的时频分析和计算。域特征作为特征向量,由EMD方法来减少数据重构原始EEG信号的维数,提高了计算效率。第二,我们改善了聚类算法的分类精度的基础上创新的密度定义。最后,我们发现不同睡眠阶段之间的相关性是显著提高基于改进的聚类算法。
尽管该方法可以提高分类精度的睡眠分期,仍有一些局限性,应该考虑
48 - - - - - -
50 ]。的一个缺点是相对较低的分类精度。我们将采用深度学习在未来解决这个问题研究[
51 ,
52 ]。另一方面,我们将进一步探索不同的睡眠阶段和区分它们之间的相关性,从而更好地提高分类精度
53 ,
54 ]。
数据可用性
本文的数据用于制备得到从生理网数据银行Sleep-EDF数据库(
https://www.physionet.org/content/sleep-edfx/1.0.0/ )。Sleep-EDF数据库内的调查了上海市建筑的设计和实现方法和/或提供的数据,但没有参与分析或写这份报告。坎普等描述的数据集。
55 ]。它可以从下载
https://ieeexplore.ieee.org/document/867928 。这个数据集已经支持Goldberger et al。
56 ]。
的利益冲突
作者宣称没有利益冲突。
确认
作者感谢中国国家自然科学基金委的支持(61373149和61373149)。作者还想承认睡眠专家的宝贵的支持在数据采集和视觉评分Sleep-EDF脑电图记录的数据集。
[
]1
崔
Z。
郑
X。
邵
X。
崔
l
自动睡眠阶段分类基于卷积神经网络和细粒度的片段
复杂性
2018年
2018年
13
9248410
10.1155 / 2018/9248410
2 - s2.0 - 85063108776
[
]2
郑
x W。
胡
B。
陆
d . J。
陈
z H。
刘
H。
节能的云计算虚拟网络嵌入到网络
国际期刊的网络和网格服务
2017年
13
1
75年
93年
10.1504 / ijwgs.2017.082058
2 - s2.0 - 85011880076
[
]3
刘
Y。
王
年代。
汗
m . S。
他
J。
小说深刻的混合推荐系统基于auto-encoder神经协同过滤
大数据挖掘和分析
2018年
1
3
211年
221年
[
]4
气
l
陈
Y。
元
Y。
傅
年代。
张
X。
徐
X。
QoS-aware虚拟机调度方法在云cyber-physical节能系统
万维网
2020年
23
2
1275年
1297年
10.1007 / s11280 - 019 - 00684 - y
2 - s2.0 - 85066043868
[
]5
龚
W。
气
l
徐
Y。
Privacy-aware多维移动服务在分布式雾环境质量预测和建议
无线通信和移动计算
2018年
2018年
8
3075849
10.1155 / 2018/3075849
2 - s2.0 - 85046682540
[
]6
郑
X。
肖
X。
张
Y。
一个多畴的可生存的虚拟网络映射算法
安全性和通信网络
2017年
2017年
12
5258010
10.1155 / 2017/5258010
2 - s2.0 - 85042729606
[
]7
郑
X。
余
X。
李
Y。
刘
H。
一个增强的多目标群搜索优化器基于multi-producer和交叉算子
信息科学与工程》杂志上
2017年
33
1
37
50
[
]8
余
X。
王
H。
郑
X。
王
Y。
有效的垂直挖掘算法概率频繁模式不确定移动环境
国际期刊的特别和无处不在的计算
2016年
23
3/4
137年
10.1504 / ijahuc.2016.079263
[
]9
郑
X。
田
J。
肖
X。
崔
X。
余
X。
一个启发式可生存的虚拟网络映射算法
软计算
2019年
23
5
1453年
1463年
10.1007 / s00500 - 018 - 3152 - 7
2 - s2.0 - 85044281700
[
]10
郑
X。
李
Y。
刘
H。
段
H。
研究合作角色建模基于一种改进NSGA II
多媒体工具和应用程序
2016年
75年
8
4305年
4320年
10.1007 / s11042 - 015 - 2476 - x
2 - s2.0 - 84921883316
[
]11
许
杨绍明。关铭
杨
Y.-T。
王
js。
许
彭译葶。
自动睡眠阶段复发性神经分类器使用eeg信号的能量特征
Neurocomputing
2013年
104年
105年
114年
10.1016 / j.neucom.2012.11.003
2 - s2.0 - 84873736761
[
]12
Aboalayon
k。
Ocbagabir
h·T。
Faezipour
M。
有效的睡眠阶段基于EEG信号的分类
诉讼IEEE长岛的系统、应用程序和技术(LISAT)会议2014
2014年
法明岱尔,纽约,美国
IEEE
1
6
[
]13
周
J。
太阳
J。
琮
P。
强调安全节能意识任务调度在物联网异构实时MPSoCs
IEEE服务计算(TSC)
2020年
在新闻
[
]14
气
l
张
X。
李
年代。
王ydF4y2Ba
年代。
温
Y。
龚
W。
时空数据驱动与隐私保护服务的建议
信息科学
2020年
515年
91年
102年
10.1016 / j.ins.2019.11.021
[
]15
余
X。
冯
W。
王
H。
注意机制和multi-granularity-based Bi-LSTM中文问答系统的模型
软计算
2020年
24
8
5831年
5845年
10.1007 / s00500 - 019 - 04367 - 8
2 - s2.0 - 85073937450
[
]16
刘
H。
口
H。
杨ydF4y2Ba
C。
气
l
链接预测在论文引用网络构建论文相关图
EURASIP无线通讯和网络》杂志上
2019年
2019年
1
10.1186 / s13638 - 019 - 1561 - 7
2 - s2.0 - 85073630078
[
]17
气
l
他
Q。
陈
F。
找到你所需要的:web api推荐在web通过关键词搜索的东西
IEEE计算社会系统
2019年
6
5
1063年
1072年
10.1109 / tcss.2019.2906925
2 - s2.0 - 85065119602
[
]18
Ramlatchan
一个。
杨
M。
刘
Q。
李
M。
王
J。
李
Y。
推荐系统矩阵完成的调查方法
大数据挖掘和分析
2018年
1
4
308年
323年
10.26599 / bdma.2018.9020008
[
]19
安德森
c·W。
Stolz
大肠。
Shamsunder
年代。
多变量自回归模型的分类自发脑电图仪的信号在精神的任务
IEEE生物医学工程
1998年
45
3
277年
286年
10.1109/10.661153
2 - s2.0 - 0032031368
[
]20.
杨榜华
y G。
Rongguo
Y。
特征提取在脑机接口基于小波包最优基
上海交通大学学报
2015年
39
11
1879年
1882年
[
]21
下降了
J。
Roschke
J。
曼恩
K。
夏弗纳
C。
歧视的睡眠阶段:比较谱和非线性脑电图的措施
脑电图与临床神经生理学
1996年
98年
5
401年
410年
10.1016 / 0013 - 4694 (96)95636 - 9
2 - s2.0 - 0342398227
[
]22
哈桑
a。R。
巴沙尔
美国K。
下榻的饭店
m . i . H。
从单通道脑电图睡眠阶段的自动分类
《2015年度印度IEEE会议(INDICON)
2015年12月
Jamia Millia Islamia,印度
IEEE
1
6
[
]23
张
H。
蔡
Q。
基于小波变换的时间序列相似的模式匹配
中国日报的计算机
2003年
26
3
373年
377年
[
]24
μ冯
c F。
认为
J。
基于改进的EMD算法的信号滤波
山东大学学报(工程科学版)
2015年
45
3
35
42
[
]25
张
Z。
川端康成
H。
刘
Z.-Q。
脑电图分析使用快速小波变换
计算机在生物学和医学
2001年
31日
6
429年
440年
10.1016 / s0010 - 4825 (01) 00019 - 1
2 - s2.0 - 0034793856
[
]26
吴
Z。
黄
n E。
集成经验模态分解:noise-assisted数据分析方法
先进的自适应数据分析
2009年
01
01
1
41
10.1142 / s1793536909000047
2 - s2.0 - 80052078099
[
]27
哈桑
a。R。
下榻的饭店
m . i . H。
计算机辅助睡眠分期使用完整的集成经验模态分解和自适应噪声和引导聚合
生物医学信号处理和控制
2016年
24
1
10
10.1016 / j.bspc.2015.09.002
2 - s2.0 - 84941900071
[
]28
Cecotti
H。
γ射线激光器
一个。
卷积神经网络用于p300检测脑-机接口的应用程序
IEEE模式分析与机器智能
2010年
33
3
433年
445年
[
]29日
Şen
B。
北京的
M。
Cavuşoğlu
一个。
Celebi
f . V。
分类的比较研究睡眠阶段基于eeg信号使用特征选择和分类算法
医疗系统杂志
2014年
38
3
18
[
]30.
MacQueen
J。
一些方法进行分类和分析多变量的观察
1
《第五伯克利研讨会上数理统计和概率
1967年
美国奥克兰
281年
297年
[
]31日
Guneş
年代。
Polat
K。
Yosunkaya
年代。
Dursun
M。
一种新颖的数据预处理方法自动确定睡眠阶段:基于k - means聚类特征权重
计算科学及其Applications-ICCSA学报》上
2009年
法国诺曼底
112年
117年
[
]32
Lajnef
T。
Chaibi
年代。
Ruby
P。
学习机器和睡眠的大脑:自动睡眠阶段使用决策树多层次支持向量机分类
神经科学杂志》上的方法
2015年
250年
94年
105年
10.1016 / j.jneumeth.2015.01.022
2 - s2.0 - 84937973439
[
]33
黄
n E。
沈
Z。
长
s R。
经验模态分解和希尔伯特谱对非线性和非平稳时间序列分析
英国伦敦皇家学会学报》上。系列一:数学、物理和工程科学
1998年
454年
1971年
903年
995年
[
]34
黄
n E。
沈
Z。
长
s R。
非线性水波的新观点:希尔伯特谱
流体力学的年度审查
1999年
31日
1
417年
457年
10.1146 / annurev.fluid.31.1.417
2 - s2.0 - 0033489494
[
]35
Riaz
F。
哈桑
一个。
拉赫曼
年代。
Niazi
即K。
Dremstrup
K。
Emd-based时间和光谱特性的分类脑电图信号使用监督学习
IEEE神经系统和康复工程
2015年
24
1
28
35
[
]36
Langkvist
M。
Karlsson
l
Loutfi
一个。
对无监督学习和深度学习时间序列建模功能
模式识别的字母
2014年
42
11
24
10.1016 / j.patrec.2014.01.008
2 - s2.0 - 84894359867
[
]37
徐
X。
傅
年代。
气
l
一个iot-oriented与隐私保护在云环境数据放置方法
网络和计算机应用》杂志上
2018年
124年
148年
157年
10.1016 / j.jnca.2018.09.006
2 - s2.0 - 85054580283
[
]38
徐
X。
刘
Q。
罗
Y。
在大数据计算卸载方法iot-enabled cloud-edge计算
未来一代计算机系统
2019年
95年
522年
533年
10.1016 / j.future.2018.12.055
2 - s2.0 - 85060695141
[
]39
气
l
张
X。
窦
W。
胡
C。
杨
C。
陈
J。
基于两级locality-sensitive散列方法保护隐私跨平台边缘环境中移动服务的建议
未来一代计算机系统
2018年
88年
636年
643年
10.1016 / j.future.2018.02.050
2 - s2.0 - 85048165651
[
]40
唐
Q。
研究基于脑电图的自动睡眠分期
2016年
广州,中国
广东科技大学
博士论文,
[
]41
郑
X。
胡
B。
陆
D。
一个多目标的虚拟网络嵌入算法在云计算
互联网技术杂志》
2016年
17
4
633年
642年
[
]42
朱
G。
李
Y。
温
P。
分析和分类基于不同的睡眠阶段的可见性图表从单通道脑电图信号
IEEE生物医学和卫生信息学杂志》上
2014年
18
6
1813年
1821年
10.1109 / jbhi.2014.2303991
2 - s2.0 - 84908668792
[
]43
Berthomier
C。
德鲁
X。
Herman-Stoica
M。
单通道睡眠脑电图自动分析:在健康个体验证
睡眠
2007年
30.
11
1587年
1595年
10.1093 /睡眠/ 30.11.1587
2 - s2.0 - 35648931467
[
]44
哈桑
a。R。
哈桑在下榻的饭店
m . I。
自动睡眠得分使用EMD域统计特性和整体的方法
生物控制论和生物医学工程
2016年
36
1
248年
255年
10.1016 / j.bbe.2015.11.001
2 - s2.0 - 84957847199
[
]45
肖
年代。
王
B。
张
J。
张
Q。
邹
J。
自动睡眠阶段基于一种改进的k - means聚类算法的分类
生物医学工程杂志
2016年
33
5
847年
854年
[
]46
Pascualvaca
j . m . S。
费尔南德斯
C。
不在
一个。
睡眠阶段分类使用先进的智能方法
国际工作会议在人工神经网络
2013年
柏林,德国
施普林格
604年
612年
[
]47
Ronzhina
M。
Janoušek
O。
Kolařova
J。
Novakova
M。
Honzik
P。
Provaznik
我。
使用人工神经网络的睡眠得分
睡眠医学评论》
2012年
16
3
251年
263年
10.1016 / j.smrv.2011.06.003
2 - s2.0 - 84859637624
[
]48
王
Y。
赵
C。
徐
q。
郑
Z。
陈
Z。
刘
Z。
公平安全的计算与声誉的假设在移动社交网络
移动信息系统
2015年
2015年
8
637458年
10.1155 / 2015/637458
2 - s2.0 - 84922287393
[
]49
张
l
王
Y。
李
F。
胡
Y。
非盟
m . H。
基于q学习的无效刑事对策论方法智能合同
信息科学
2019年
498年
144年
153年
10.1016 / j.ins.2019.05.061
2 - s2.0 - 85066073376
[
]50
王
Y。
杨
G。
李
T。
李
F。
余
X。
信仰和公平:安全两党协议为物联网设备对熵的观点
网络和计算机应用》杂志上
2020年
161年
102641年
10.1016 / j.jnca.2020.102641
[
]51
周
J。
胡
x。
马
Y。
太阳
J。
魏
T。
胡
年代。
提高可用性的多核实时系统遭受永久性和瞬态故障
IEEE计算机
2019年
68年
12
1785年
1801年
10.1109 / tc.2019.2935042
[
]52
周
J。
太阳
J。
周
X。
资源管理对提高软件出错和生命周期的可靠性实时mpsocs
IEEE计算机辅助设计的集成电路和系统
2019年
38
12
2215年
2228年
10.1109 / tcad.2018.2883993
2 - s2.0 - 85057777876
[
]53
刘
R。
王
H。
余
X。
Shared-nearest-neighbor-based集群的快速搜索和发现密度峰值
信息科学
2018年
450年
200年
226年
10.1016 / j.ins.2018.03.031
2 - s2.0 - 85044481559
[
]54
胡
B。
王
H。
余
X。
元
W。
他
T。
稀疏网络嵌入在签署了社交网络社区检测和预测标志
环境智能和人性化计算杂志》上
2019年
10
1
175年
186年
10.1007 / s12652 - 017 - 0630 - 1
2 - s2.0 - 85049605888
[
]55
坎普
B。
Zwinderman
a . H。
Tuk
B。
Kamphuisen
h·a·C。
Obery
j·j·L。
分析睡眠神经反馈循环:慢波microcontinuity脑电图
IEEE生物医学工程
2000年
47
9
1185年
1194年
10.1109/10.867928
2 - s2.0 - 0034283107
[
]56
Goldberger
a . L。
阿马拉尔
l . a . N。
玻璃
l
PhysioBank、PhysioToolkit和生理网:组件的一个新的研究资源对于复杂的生理信号
循环
2003年
101年
23
e215
e220