文摘

睡眠障碍是一个严重的公共卫生问题。不引人注目的家庭睡眠质量监测系统可以更好地开辟道路的睡眠disorder-related疾病筛查和健康监测。在这项工作中,基于多尺度的睡眠阶段分类算法剩余卷积神经网络(MRCNN)提出了检测脑电图(EEG)信号的特征检测到可穿戴系统和分类睡眠阶段。EEG信号分析在每个时代每30秒,然后五级睡眠阶段分类,之后(W),快速眼动睡眠(REM)和非快速眼动睡眠(非快速眼动)包括N1、N2和N3阶段输出。好的结果(92.06%和91.13%的准确率,科恩kappa的0.7360和0.7001)实现了5倍交叉验证和独立的学科交叉验证,分别进行欧洲数据格式(EDF)数据集包含197整晚睡眠呼吸障碍。与几个具有代表性的深度学习方法相比,该方法可以很容易地获得睡眠阶段信息从单通道脑电图信号没有专门的特征提取,这是接近临床应用。基于CinC2018数据集的实验也证明了该方法具有良好的性能在大数据集,可以为睡眠disorder-related疾病筛查和健康监测提供支持基于自动睡眠分期。

1。介绍

睡眠中扮演一个重要的角色在人类健康1]。睡眠监测人类对医学研究和实践有重大影响2]。睡眠专家通常评估睡眠质量通过分析来自传感器的信号连接到身体的不同部分按照Rechtschaffen和羽衣甘蓝规则(3]或美国睡眠医学学会发布的睡眠分手册(4]。特别是,多导睡眠图(PSG)记录脑电图、眼电图(小城镇),心电图仪(心电图)、肌电图(EMG)、呼吸努力,腿运动,和血氧饱和度在几个晚上睡眠实验室,被认为是黄金标准评估睡眠状态的主题(5]。为了提高睡眠效率监测、几种有效的睡眠分期方法基于脑电图、心电图,近年来提出了EMG信号(6]。然而,穿太多传感器在睡眠中突兀的不舒服,银/氯化银电极与特定的粘合剂或大多采用导电胶信号采集,和他们的位置是要求仔细在头皮刺激噪声降到最低,毛茸茸的地区影响的自然睡眠主题和不适合长期睡眠监测家庭环境。

近年来,非侵入性(7,8)或非接触(9,10)测量心脏、呼吸和肢体动作信号提供低成本和容易操作的潜在长期动态睡眠监测逐步得到研究人员的青睐。但其性能严重依赖于复杂信号采集和信号处理的质量。脑电图记录睡眠阶段的分类中发挥着至关重要的作用。为了解决人的问题的安慰,睡眠阶段基于单通道脑电图信号的分类进行了广泛的调查(11,12),因为比较复杂的多导睡眠监测设备,相应的dual-electrode设备可穿戴的优势和更少的干扰。

与正面电极相比,脑电图记录从中央,枕叶,顶叶电极可以更好的检测睡眠纺锤波,顶点波形,和节奏13]。然而,渠道选择是重要的测量方便。Fp1 Fp2, Fpz电极下面的发际线适合穿着和数据收集,F3, F4电极。研究人员试图解决这一问题,从正面电极提取相同的相关信息(14]。但是信息可以支持W, N1、N2, N3阶段不同于从顶叶中提取,所以它可以影响分级结果的可信度。

大多数睡眠阶段分类方法的性能依赖于特性的选择代表不同的睡眠阶段。频域(15)、时域和时频域(16)分解的常见步骤处理时间信号和直接提取特征,以及各种已建立数学模型的过程中发现隐藏的特性。特征提取后,各种机器学习算法用于分类(17,18),如线性判别分析,近邻分类器、决策树、支持向量机,随机森林,整体学习。它还显示了良好的效果与组合机器学习模型(19]。近年来,深入学习方法如卷积神经网络(CNN) (20.递归神经网络),和其他深层神经网络在模式识别在生物医学信号处理已成为普遍。在[21),长期短期记忆(LSTM)模型,利用顺序数据的学习来优化分类性能提出了自动化的睡眠阶段。从基于特征的方法可能不适合全面描述主题的异质性,cnn也应用到学习多个过滤器从原料中提取定常特性脑电图通道(22]。

解决主体异质性和时间模式识别问题,CNN和LSTM已经显示出良好的性能使用预先计算的谱图(23]。然而,大多数代表深度学习模式在很大程度上是依靠hyperparameter调优,这是具有挑战性的扩展。尽管一些研究如(24)考虑时间上下文,训练必须分为pretraining和微调。此外,由于学习速率设置为一个非常低的值在微调,这需要更多的时间来达到最优或甚至可能不是最优的。因此,计算不能并行执行,也延长了训练过程。

增加网络层cnn的数量可以提高信号特征的提取效果。多尺度cnn提出了同时进行多尺度特征提取和分类(25]。然而,梯度扩散或梯度爆炸很可能发生在cnn的深度增加。剩余网络(ResNet)提出他等。26)是旨在解决退化问题的网络。该方法应用于机器故障检测,取得了好的结果(27]。睡眠阶段分类基于residual-based注意力模型也被采用(28),但只有 - - - - - -折交叉验证不进行交叉验证,与此同时,大量的测试数据是不够的。

考虑到多尺度卷积神经网络可以捕获所需的详细的信号特征模式分类,他们的想法是通过实现一个可穿戴的聪明的眼罩在我们之前的研究(29日]。这种方法使用原始单通道脑电图信号和省略了特殊的特征提取的过程。它具有良好的性能和应用潜力,可以为临床应用提供支持,如睡眠障碍的筛查和诊断。这项工作的主要贡献如下:(1)深度学习架构ResNet不同大小的过滤器了。定常特性从原来的单通道脑电图信号可以通过培训学习中提取过滤器,它可以节省时间的特性计算,而剩余可以训练编码时间信息,如睡眠阶段过渡到模型的规则(2)训练算法,可以有效地培养模型的端到端开发。单通道脑电图从额头适应减少病人的影响,提高可用性(3)该方法评估两个公开的数据集:sleep-EDF-expanded [30.]和CinC2018 [31日通过学科交叉验证实验有很强的鲁棒性性能。结果与最先进的领域的睡眠阶段分类结果证明我们的方法的优越性,解决问题,数据太少可能会导致睡眠阶段模型的泛化效果差

2。方法

睡眠分期是识别的问题或回归时间序列信号。根据睡眠手册,专家把脑电图,小城镇,肌电图,和其他信号通过传感器每隔30年代到W, REM, N1、N2和N3。学习本文的多尺度特性是集成到一个残余网络(ResNet)自动学习睡眠原始生理信号的特性在不同的时间尺度,以并行方式和分类从复杂的原始生理信号的睡眠。

2.1。剩余块

一般来说,越是在卷积神经网络层,可以提炼出不同特性。但先前的实验表明,存在一个退化问题深陷网络:网络的网络深度增加时,精度饱和烃降解,和增加更多的层会导致更高的训练误差,不造成过度拟合。

虽然几十的CNN层可以通过规范化的初始化和批处理规范化培训(BN),它是容易退化随着层数的增加。从理论上讲,如果某一层的附加层深度网络没有学到任何东西,只是副本最后一层的特点,它被称为身份映射,训练误差不应增加。深残余学习框架提出了解决退化现象(26):如果一个身份映射是最优的,它会更容易把剩余0比合适的标识映射一堆非线性层。

网络的一个输入 ,学习特性来标示 ,将网络学习残差 因为剩余的学习比传统的特性容易学习,剩余的学习采用每隔几堆层,如图1,剩余块是由神经网络和快捷键连接。它包含两种类型的映射:一是身份映射,即快捷图中曲线,另一个是剩余的映射。如果残差不等于0,仍然可以改善网络性能,提高网络层的数量。如果剩余是0,当前层只是一个身份映射,无论是提高还是降低,因此,网络可以解决退化问题。

输出 从快捷操作给出以下方程。 在哪里 的输入和输出向量层考虑, 可以学到残余映射函数,它可以表现出下列方程。 在哪里 是解决线性单元(ReLU)激活函数。

2.2。MRCNN

为了从不同的接受域提取特性,我们使用三个ResNet通路由多个ResNet单元如图2,时间序列信号片段直接作为网络的输入。每个路径包含四个ResNet单位两个卷积层和一个快捷方式。每个卷积层随后ReLU BN和激活函数。实线快捷方式直接意味着它可以添加数据,虚线快捷键表示,他们需要增加了 卷积(Conv)相同的维度,和每条路径的结果是由池512年平均的特性。每个ResNet块有不同的内核核心尺寸时将卷积 , ,

根据上面的描述,ResNet单元构建的表达可以表示由以下方程。

在哪里 卷积算子, 是用于提高泛化能力。

CNN是一个独特的人工神经网络受大脑皮层的启发,利用卷积方法提取信号的特性和压缩信号大小。为了保留有效信息,它减少了输入数据的数量由几个数量级,从而形成一个最优网络,减少网络的风险过度拟合。CNN包含两个核心层:卷积和池。卷积的目的就是从原始数据中提取特征在不同层次上,和一定数量的过滤器是用来提取特征图的输入数据。池层是CNN的卷积之间定期插入层,和一个二次抽样操作是用来减少参数的数量。在算法结束, 激活函数可以显著提高训练速度。

CNN,受体字段定义为区域的大小映射输入图像的像素点的输出特性映射在每一层CNN。通俗的说,这是一个地方的输入输出特性是“看到”的特征点。接受域是由下列方程计算。 在哪里 的接受域 - - - - - -th回旋的层, 的接受域 - - - - - -th层, 卷积的步长 - - - - - -th层, 卷积核的大小吗 - - - - - -层。

EEG信号输入到网络由卷积处理层与卷积核的长度15和传播BN和ReLU激活函数为最大池。然后,输出数据被送到三个通道的卷积核的不同大小的计算。最后,三个渠道的特点结合起来,与1536个神经元连接完整的连接层,和网络分类结果将softmax函数。

可以计算每一个卷积的接受域层根据方程(1)。的接受域的输出特性图中最后一个卷积层网络是563年的输入数据。EEG信号的采样频率为100赫兹,和有效的频率分辨率为563数据点是0.35赫兹,可以满足有节奏的波的频率分辨率的要求。

2.3。网络训练

为了实现multiclassification的损失计算的睡眠阶段,交叉熵(CE)作为损失函数,及其定义显示为以下方程。 在哪里 数组是一维数组(包括预测概率值为每个标签)被Softmax处理后, 是实际的标签。 代表元素 数组的序数 重量是实际的标签。因为睡眠阶段的分类是一个不平衡的分类任务,本文试图平衡每个标签的数据量的差异,和 被定义为以下方程。 在哪里 是标签的比例 总共标签。

的损失函数,自适应估计时刻解算器(亚当)是用于优化。学习速率是设置为 ,和所有其他参数被设置为默认值。每次执行网络训练时,该算法将用于优化训练集所有数据20次,然后验证设置将用于获得系统性能指标的结果。MRCNN是由使用PyTorch 1.0,这是训练用GTX950M Ubuntu 18.04系统。其他硬件配置包括英特尔酷睿i7 - 4710 mq 12 GB RAM。

2.4。绩效评估

回忆 ,精度( ),和特异性 被用来评估睡眠分期的结果。整体的回忆( ),总体精度( ),和整体特征( )由下列方程表示。 在哪里 代表真正的情况下,真正的负面情况下,假阳性的情况下,和假阴性的情况下形成的分类器来判断类别,分别。在这些方程, 代表了五种不同的睡眠阶段。At the same time, the coefficient which could describe overall performance of the system would also be calculated as the following equation. 在哪里 代表真正的标签样本 , 代表样本的预测标签 的模型, 介绍每个正确的样本类别的总和除以总数量的样本, , 样品的实际数量吗 , 样本的预测数量吗 , 是样品的总数。

3所示。实验

3.1。数据集

为了确保结果的鲁棒性和重现性,两个公共数据集进行了实验。第一个实验中使用的数据集是sleep-EDF-expanded和包含两个不同组的主题,命名为睡眠盒(SC)组和睡眠遥测(ST)组,分别。注释文件包括睡眠阶段W, REM,第1阶段(S1),第二阶段(S2),第三阶段(S3),第四阶段(S4),运动时间(M),和未知的,它由一个手动评分由技术熟练的技师。阶段M和未知的被删除的比例非常小。与此同时,据最新发布的睡眠评分手册,S1和S2与N1和N2,分别和S3和S4组合成N3。在这项研究中,我们裁剪SC 文件数据集,只有信号从睡眠开始前30分钟到30分钟结束后的睡眠被保留,FPz-Cz通道使用的数据。

第二CinC2018提供的实验中使用的数据集,其中包含1985个样本。每个样本的睡眠阶段是由马萨诸塞州总医院临床工作人员和标签分为六个阶段:W, N1、N2, N3, REM,定义。为研究和应用的考虑,数据从F4-M1渠道选择这里。数据分为训练集( )和一个测试集( )。我们随机选择500例从训练集作为数据集和一小部分删除未定义的时期。适应AASM睡眠评分手册,EEG信号的数据集被分成30年代的时代。处理后,睡眠阶段两个数据集的统计数据如表所示1

3.2。预处理

为了适应不同PSG设备和个体差异的主题,脑电图信号被使用规范化的5日和95分位数(32),见下面的方程。 在哪里 是信号归一化的结果, 是原始信号, 是5%和95%的最大价值的信号。

为了扩大数据集,提高网络的泛化能力,每个输入数据应该随机剪(3000数据点在每个时代被随机剪到2700),翻转概率为50%,添加随机噪声的0.01倍。最后,预处理数据集成,然后添加批量大小和通道数,并转换为张量数据类型,如以下所示的方程。 在哪里 代表批量大小、通道数,分别和数据点的单身时代。为了输入相对应的睡眠阶段向网络,每个时代的脑电图睡眠阶段被映射为下列方程。

3.3。绩效评估

本文中使用的交叉验证包括在内 - - - - - -折交叉验证和交叉验证。前随机将整个数据集分成 子集以时代为最小单位。每个子集作为验证集,剩下的 子集作为训练集,进行了实验 次,所有验证集的结果加权和总结得到最终结果。

为了评估该方法的性能,5倍交叉验证和学科交叉验证完成sleep-EDFx数据集,和数据的197例FPz-Cz渠道使用。学科交叉验证数据集分为训练集和验证集的分区比8:2,统计信息如表所示23。为了评估效果在实际应用程序中,学科交叉验证也完成了CinC2018数据集,500名被试的数据从F4-M1通道使用。

4所示。结果与讨论

4.1。交叉验证

5倍交叉验证的结果如表所示4。表包含每个睡眠阶段的分类性能指标和总体性能指标的原始混淆矩阵交叉验证后获得。整体的召回率、准确率、特异性和kappa系数是78.94%,92.06%,95.13%和0.7360,分别。可以看出,本文提出的网络可以提供良好的分类性能与高分辨率的W,但对N1可怜的决议。特别是,它是由混淆矩阵发现N1容易误判为N2和快速眼动,这是一致的结果(33]。这可能是由于在N1睡眠时间占相对较小的份额,导致更少的训练数据。同时,N1是清醒状态和睡眠状态之间的过渡时期,既包含 波,使分类困难。

学科交叉验证的结果数据集如表所示5。整体的召回率、准确率、特异性和kappa系数分类是75.81%,91.13%,94.65%和0.7001,分别。结果相比存在睡眠分期方法如表所示6。它可以保持更好的系统性能的数据看不见的对象的大量的数据和CNN-LSTM[达到类似的效果21]。这种交叉验证方法能有效证明未知的对象系统的泛化能力,具有较高的实际应用价值。N1的决议,提出网络N1的召回率是60%,远超过其他深度学习模型。

在[29日),几种方法基于残余网络比较通过使用sleep-EDF-expanded数据集,可以看到,我们提议MRCNN执行比其他剩余网络也N1的决议。摘要ResNet18 [26在相同情况下,MRCNN比较。为了适应一维数据的输入,网络结构的二维层ResNet18被修改为一维层。也可以看到,我们的提议MRCNN执行比ResNet18 N1的决议。从数据表所示6也可以看出该网络可以提供低分辨率N2。特别是在表5,这是很容易找到由混淆矩阵,N2是误判为N1或N3。这可能是由于N2是N1和N3之间的过渡时期,包含睡眠纺锤波和 - - - - - -复杂的波,使得分类困难。

4.2。绩效评估在嵌入式应用程序

特别是在实验中使用的通道是F4-M1,适合嵌入式应用程序。100年400个样本训练集和测试集样本CinC2018被用于交叉验证。性能的结果如表所示7。即使系统的性能下降一点应用于大量的数据时,它仍然显示系统的泛化能力存在未知的对象。

4.3。比较自动和人工睡眠分期

自动睡眠分期是由使用训练模型并与专家手工评分结果,如图3,自动分期结果接近手工分段的结果。

4.4。自动提取MRCNN的脑电图特征

MRCNN提取有效的脑电图的结果特性。在W脑电图数据阶段和N3阶段从CinC2018送入网络模型训练数据集,分别,然后第一次卷积的输出层模型的可视化。它包含64卷积核,对应64个频道的输出,最后结果如图4。从图可以看出,对于相同的输入信号,不同的卷积核有不同的输出。此外,通过比较卷积层W阶段和N3阶段的输出结果,可以发现,在相同的输出有显著差异不同的输入信号的卷积核,这充分证明了卷积神经网络可以自动提取EEG信号的特性。

5。结论

在本文中,一种新的睡眠分期方法提出了基于多尺度残余网络。它可以自动从原来的单通道脑电图信号中提取有用的信息并分类睡眠阶段。通过数据集的交叉验证,系统性能可以保持数据的无形的受试者在大数据量的情况下。与其他深度学习方法相比,我们的方法只使用一个单通道脑电图,和它不需要复杂的数据预处理和专业特征提取过程来实现更好的系统性能,提供自动化睡眠分期的临床应用的可能性。此外,多尺度残余网络将进一步加深了足够的计算能力时,然后,一个更大的数据量可以用于培训,以便模型理论上可以获得更好的鲁棒性和系统性能。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

科技计划支持的研究是广州(2019050001),计划在大学长江学者和创新研究团队(没有。IRT_17R40),广东省重点实验室的光学信息材料和技术(2017 b030301007),广州重点实验室的电子纸显示器材料和设备(201705030007),和MOE国际光学信息技术实验室和111项目。“睡眠分期的多尺度残余卷积神经网络基于单通道脑电图信号”作为初步研究已经提出了预印本根据以下链接:https://www.researchsquare.com/article/rs-554671/v1