文摘

早产是新生儿死亡的主要原因之一,也会造成巨大的健康和发展障碍的人生存。然而,仍然有早产预测没有可靠和准确的工具在临床的设置。Electrohysterography (EHG)已被证明在劳动时间提供相关信息。许多研究集中在预测早产通过使用时间,谱和非线性参数提取单一EHG录音。然而,多通道分析,包括信息从整个子宫和录音领域之间的耦合,可以提供更好的结果。交叉验证的方法经常被用来设计分类器并评估他们的表现。然而,当验证数据集用于调整分类器hyperparameters,这个数据集的性能指标不能正确评估其泛化能力。在这项工作中,我们开发和不同的分类器相比,基于人工神经网络,预测早产使用EHG特性从单一和多通道记录。一组时间、光谱、非线性和同步参数计算从EHG录音被用作输入功能。所有分类器进行独立测试数据集,它没有“看到”的模型,以确定其泛化能力。 Classifiers’ performance was also evaluated when obstetrical data were included. The experimental results show that the classifier performance metrics were significantly lower in the test dataset (AUC range 76-91%) than in the train and validation sets (AUC range 90-99%). The multichannel classifiers outperformed the single-channel classifiers, especially when information was combined into mean efficiency indexes and included coupling information between channels. Including obstetrical data slightly improved the classifier metrics and reached an AUC of 对测试数据集。这些结果显示承诺转让EHG技术早产预测在临床实践中。

1。介绍

早产(PL),由世界卫生组织定义为所有交付前妊娠37周(259天)(1),是医疗最紧迫的挑战之一。它与围产期死亡人数的75%2),而那些幸存下来的风险更大的健康问题和神经发育障碍,专家在他们的初期,需要严格的监督(2,3]。这些情况导致社会和经济成本高;这方面的一个全面的研究估计,每年的社会经济负担归因于早产在美国为262亿美元,2005年超过50000美元每早产新生儿出生一个术语的约5倍(4]。

在大多数欧洲国家,PL率范围在6 and11%和近年来停滞不前甚至增加5]。据报道,一个先进的母亲的年龄(40)可以被关联到一个早产的风险更高。母亲的年龄逐渐增加在世界范围内,尤其是在高收入国家(6),而最近人工生殖技术的发展已经煽动怀孕妇女常见的生物生殖年龄外,因此增加了PL风险(6]。

PL的早期诊断是非常重要的相关药物(必须尽快管理PL检测(7])怀孕成功扩展足够长的时间来允许行动的糖皮质激素,促进胎儿成熟。尽管努力了,某些标记如主教得分,胎儿纤连蛋白,宫颈长度,有tocodynamometry PL预测,他们的预测能力有限,可以不准确或主观8,9]。事实上,这些测试的价值主要在于其高负面预测值,而他们的积极价值较低,并不总是确定的病人将会早产9,10]。

怀孕期间子宫电活动的变化;稀缺和几乎同步在妊娠早期年龄和变得更加激烈和协调劳动力趋于[11,12]。这种现象与子宫肌层的细胞兴奋性增加(13,14和耦合15- - - - - -17),导致大量招募的细胞,从而有效的收缩,在劳动中结束。子宫收缩的子宫肌层的细胞电活动的变化由于涉及离子电流的流动。这个活动的无创性记录,称为electrohysterogram (EHG),从母体腹壁已成为最有前途的工具之一PL预测(18- - - - - -20.]。

颞(均方根振幅,峰峰振幅)和光谱参数(峰值频率的功率谱(PS), PS的中值频率,或高频功率/低频功率的比值)通常计算从EHG信号。一些作者表明,EHG光谱内容转向更高频率的方法交付(20.- - - - - -22]。光谱参数interpatient可变性比时间更强大和更少的敏感参数区分劳动和nonlabor和任期从早产分娩11]。像任何其他生物系统,子宫电生理学包括非线性和复杂的流程,和一些研究非线性和复杂的参数,如样本熵,李雅普诺夫指数,时间可逆性,或Lempel-Ziv,获得额外的信息在怀孕期间的生理变化23- - - - - -25]。据报道,EHG信号变得更有组织的或更少的“混乱”20.,26]和EHG同步索引从已发现多通道记录增加劳动方法(16,27]。

一些作者报道PL预测分类器使用时间的发展,光谱、非线性、复杂EHG参数(25,28- - - - - -30.]。尽管结果是有前途的,他们仍然有一定的局限性。首先,他们试图预测PL从单通道EHG录音信息,即使多通道记录是可用的(31日- - - - - -34]。信道信噪比最高的是常用的从其他渠道和信息忽略。提高分类器的鲁棒性,子宫电生理信息从不同的索引记录网站和耦合应该包含在早产预测模型。

另一方面,交叉验证方法通常被用来设计和评估分类器性能(31日- - - - - -34),即。,the validation set is used to “fine-tune” the model’s hyperparameters, such as pruning parameters for the decision trees, the value of 最近邻算法,和学习功能(学习速率、动量、早期停止和初始条件)的神经网络(35,36]。真正的分类器的泛化能力因此不能从这些验证小组,评估和测试数据集的“看不见的”分类需要进一步评估他们的表现(31日,32,34,37,38]。此外,只有少数研究考虑使用产科数据除了EHG参数(32,38]。

对分类方法,因为生物的生理机制系统通常由非线性过程(39),非线性分类器,如支持向量机(svm), - - - - - -最近邻(资讯)和人工神经网络(ann)在预测应用中最常见的选项(40- - - - - -43),通常是首选。在这方面,当样本容量是有限的,然而,往往存在一个劣质的性能指标,因为它是高度依赖于训练数据集和输入的维数特征(40,43]。

尽管支持向量机和神经网络都是普遍的非线性函数近似者(44,45),他们呈现不同的非线性数据分类:支持向量机采用非线性映射的线性数据分离,选择内核是分类器性能的一个关键因素41,43,45),而人工神经网络使用多层连接和几位激活函数来处理非线性问题40]。两种算法是强大的工具,用于模式分类和识别和被广泛用于预测任务由于他们从经验中学习的能力和概括30.,33,44]。从一般的角度来看,两种算法通常提供类似的性能,尽管人工神经网络在解决分类问题似乎更精确(45),已成功用于劳动预测应用,报道相对较高的精度值训练和验证数据集(30.,33]。在这个工作中,早产预测的人工神经网络选择,因为他们的学习能力从例子和提取功能关系,即使底层关系是未知的或难以描述44]。

因此,在这种背景下,我们的目标是开发健壮和可概括的分类器预测基于ANN的PL。为此,单通道EHG特性和多通道EHG使用小说子宫收缩效率指标,考虑了EHG同步,喂养分类器。

改进的性能通过增加产科早产预测信息分类器也被评估。自的目标是获得可概括的预测模型,不同的分类器的性能比较,不仅在训练和验证数据集,而且在一个独立的测试数据集。

以下步骤进行开发可概括的ANN-based分类:首先,早产妇女的样本是远小于期限劳动的示例中,它可以使分类器“学习”,大多数组织有高特异性但早产低灵敏度检测。为了克服这个问题,击打技术应用于oversample少数类。数据被随机分为30试验减少偏见,然后主成分分析用于降低数据维数,从而尽量避免过度拟合。ANN-based分类器被训练和评估在每个试验训练、验证和独立的测试数据集。

2。材料和方法

2.1。数据库

多通道EHG信号记录在常规体检妇女提供到期和早产被用于这项研究从开放存取数据库“Term-Preterm EHG数据基地”(TPEHGDB)上可用生理网(20.]。这个数据库包含300个从孕妇EHG录音,262年从那些术语交货,其余38从女性过早地交付。EHG录音都从个人之间的女性22和胎龄32天。选中的数据库包括三双记录(S1, S2和S3)从四个一次性电极对称放置在腹部表面在横向和纵向两个水平行和相隔7厘米的距离(20.]。TPEHGDB还包括以下产科数据:产妇年龄,平价,先前的流产,妊娠年龄、和胎儿体重的时候录音,高血压、糖尿病、胎位、汇集,抽烟,和出血在第一和第二阶段。只有前五个产科数据作为分类器的输入特征。剩下的功能包括分类变量和缺失的数据,因为很少有病人积极类(例如,2对高血压和糖尿病3)。

2.2。数据分析

自从EHG信号的主要内容分布在0.1到4赫兹的范围46,47),双信号数字滤波范围(5th阶巴特沃斯带通在前后方向上获得零相位转变)。代替传统的EHG-burst分析,我们更愿意执行整个EHG窗口分析,这已被证明为预测早产和提供相关信息更容易集成在实时应用程序38,48]。在这方面,与明显的运动信号部分构件从单一渠道目视检查被丢弃。事实上,一些EHG记录必须被移除,因为信号质量差。多通道分析只有在所有的频道都artifact-free信号部分。图1显示了早产的样本大小和期限劳动记录每单通道和多通道分析。

EHG信号被分成120年代分析窗口重叠以包括代表50%部分的记录在一个合理的计算成本48]。

对每个分析窗口,几个EHG性质不同的特点(时间、光谱和非线性参数)计算每个单通道。峰峰振幅计算,因为它直接关系到子宫电活动的强度。一组光谱参数包括平均频率(48),占主导地位的频率(20.,37),H / L比值代表之间的关系计算的能量(0.34 1 Hz)对计算的能量(0.2 - -0.34赫兹)和功率谱密度的十分位数选择因为他们相关细胞兴奋性(19,49]。我们还包括一组非线性参数被广泛用于描述的电生理状态子宫和脑电图等其他生物电子信号,包括样本熵(26),谱熵(50),模糊熵(51),Lempel-Ziv复杂性(二进制和多态版本)25),时间可逆性(23),庞加莱图度量(SD1, SD2 SDRR, SD1 / SD2) (52],Higuchi的分形维数53]。

多通道分析,两种方法都采用;首先,不同的时间,从单通道谱和非线性参数计算分类器被喂食。第二,估计的同步程度的不同区域子宫、双变量方法基于归一化排列交叉互信息(NPCMI) [54),已被证明是更好的区分即将期限劳动(55),从不同的计算对EHG频道。然后我们计算的平均效率指数(梅)的不同的参数提出了以前的工作来定义一种更健壮的子宫电活动效率的指标从多通道记录55]。梅的定义根据公式描述: 在哪里 , , 任何EHG特征(时间、光谱和非线性)估计从单通道S1, S2和S3。NPCMI而言,产品的每一对单通道参数之间的耦合指数公式被这条通道。

简要总结这项工作,计算参数的组合家庭,可以在表中找到1

2.3。数据平衡

数据集包含在TPEHGDB显然是不平衡的,因为它包含262录音从交货术语的女性,只有38女性早产。这种情况意味着分类器更容易检测项的情况下,减少检测PL情况下正确的概率。为了克服这个问题,在文献中所提出的解决方案之一是利用过采样技术提高少数类样本的数量(31日,32]。在这项工作中,我们采样过量少数类的数量的绝大多数合成少数类样本的过采样技术(打)56]。这种技术(基于 - - - - - -最近邻插值)一直在先前的研究中使用TPEHGDB解决不平衡类问题(33,34,38),据报道优于其他技术,如将采样(45]。在这工作,5邻居选择插入并获得新的少数类样本。为了检查的准确性的偏差模型由于杀变异产生新的样本时,我们也采样过量少数类的十倍。

2.4。降维

以避免泛化误差的分类器开发由于过度拟合,这发生在分类器的参数的数量是非常高的对训练样本的数量,降维技术应用(57]。具体地说,在目前的工作,选择主成分分析进行降维的输入特性,因为大量的输入特性可能导致过度拟合,而数据库的规模相对较小,可能导致过度拟合(57,58]。我们因此决定进行主成分分析,因为它保留了一个相对较高的值为初始方差和显著减少的特性和数量已经被其他作者在EHG领域(51,59]。它涉及一个正交线性变换的原始数据投影到一套新的坐标减少方差(57,59]。PCA后,生成的组件选择顺序直到原始方差的98%,为了保持降维之间的权衡和保留信息。

2.5。分类器的设计和评估

人工神经网络(ANN)分类算法选择构建分类器,由于其性能在处理非线性问题(36]。多层感知器(MLP)分类器被使用,设置双曲正切为所有神经元激活函数。延时是一种前馈人工神经网络,由至少三层(见图2每一层的神经元是完全连接到下一个:输入层、隐藏层和输出层(34,44]。简要培训监督,真正的为每个输入所需的类总是可用的(44]。每个分类器的输入权值调整的迭代反向传播训练算法,概念上很简单,计算效率(60]。

十个不同的分类器是基于前馈神经网络反向传播算法训练。不同的分类器与单通道双渠道的信息包括三个版本S1, S2和S3(分类:C1, C3和C5);一个多通道的版本被认为是信息从三个单独计算双通道(C7);和多通道版本,利用均值参数效率指数(C9)。另外五个前面描述的修改版本分类器开发包括产科数据除了EHG参数(C2, C4、C6、C8和C10)。开发的可视化表示不同的分类器,涉及的参数如图3

解决可能的过度拟合问题,由于过度的隐藏的单位或者overparameterized训练数据(58,60),我们决定只使用一个隐层神经元的数目和执行网格搜索从2到8,以确定最优拓扑预测早产在每个分类器。在这方面,隐藏在安隐藏层神经元的数量逐渐从2增加到10,根据改进的性能选择最佳的拓扑在训练和验证数据集。我们也使用了早期停止为正则化方法,因为据报道时显著降低过度拟合结合反向传播(60,61年]。

为了评估的泛化能力训练人工神经网络,数据集swa随机分裂的30倍,把数据分成三个相等的部分在每个迭代中(抵抗方法):1/3培训,为验证1/3,1/3用于测试(见图4)。随机自初始权重设置,安训练训练和验证分区进行30次在每个迭代中避免堆积在一个局部最小值。只有最好的30神经网络拓扑结构和迭代的最后选择。表2显示最优隐层神经元的数量和特性包括在每个分类器之前和之后执行PCA。分类器C9 C10包括额外EHG NPCMI特性。

人工神经网络训练时,不同的指标包括精度、灵敏度、特异性、预测正值(PPV),阴性预测值(NPV),和曲线下面积(AUC)接受者操作特征(ROC)为每个数据集评估:培训、验证和测试。 在哪里 代表了真正的阳性, 真正的底片 分别构成了假阳性和假阴性。30迭代的所有指标进行评估的使用杀10个不同的平衡的数据集,计算它们的平均值和标准偏差,最后显示的值最好的拓扑结果有关。也表现一个方差分析分析确定统计学意义差异被发现的AUC得到不同的分类器在测试数据集。Shapiro-Wilk测试以前用于检查所有AUC值来自正态分布。

3所示。结果

34显示的平均值和标准偏差不同分类器的性能在训练、验证和测试集,从10获得平衡的数据集的击杀技术。无论安特性集用于设计分类器(单通道、多通道和有或没有产科的数据),他们的表现(准确性和AUC)比90%的培训和验证数据(表3)。没有发现明显的差异分类指标的培训和验证数据。这些结果表明,ANN-based预测模型能够从底层结构的输入特性。

然而,分类器的性能测试数据集(表明显恶化4比训练和验证数据)。确实是一个伟大的变化在他们的准确性(从 )和AUC(来自 ),根据他们的输入特性。至于单通道分类器和EHG特性,S3 (C5)似乎包含信息PL预测比通道S1 (C1)。当EHG特性提取三个单通道的分类器(C7),没有明显改善C5分类指标。相比之下,获得了相当大的改善分类器的性能在使用三个通道的梅估计作为输入特性(C9)。中华民国的准确性和AUC C9约 ,分别对测试数据集,呈现的敏感性 和特异性 产科数据作为输入特性添加到分类器稍微提高了指标。AUC均值分类器的改进范围从0.5%到3.2%,取决于输入功能。在这方面,没有发现任何有关改进分类器度量之间的C5(只使用通道S3的EHG特征作为输入特性)及其相应的C6模型(见图5)。实现最佳的性能在使用三个通道的梅估计和产科数据(C10),获得的敏感性和特异性 ,分别的准确性和AUC ,分别。

5显示框,须情节(a)的AUC ROC曲线的不同分类器的测试数据集之间的统计学意义不同分类器的性能在跟踪(b)底部。只有AUC被选为代表,自其他指标也显示出了类似的趋势。只有EHG特征的分类器时,C1的性能(在信息提取通道S1)明显低于使用EHG特性从频道S2和S3 (C3和C5)。没有发现显著差异之间C3和C5的性能。分类器C7 EHG特性,提取每个单通道,未提供ROC曲线的AUC显著高于C5。相比之下,制备过程的性能,包括梅从多通道记录计算,显著高于C5和C7。分类器的性能,只用EHG信息嵌入在单通道和多通道记录也与它们相应的配对分类器确定的产科提供相关数据信息预测PL。之间的分类器性能显著改善只是获得以下双:c1,同样,C9-C10(见图5 (b))。的C10性能,包括梅从多通道记录和产科的数据计算,显著优于其他分类器。

击打技术发达的敏感性也分析了分类器的泛化能力。为此,10平衡数据集被击杀过采样获得的少数类。图6显示的平均值和标准偏差的平均AUC ROC曲线的不同分类器十平衡测试数据集。再一次,最高平均AUC是实现当使用美和产科一起从三个通道中提取数据。不管使用的输入特性设计分类器,分类器的性能差异极小击杀不同数据集之间的被发现。一般来说,分类器性能的变化范围从0.8%到1.7%,表明该模型对人工数据添加到数据库中。

4所示。讨论

目前的工作主要集中在ANN-based分类器预测PL的发展,在产科领域最大的挑战之一。为了这个目的,一组颞、光谱、非线性和同步参数提取EHG录音。我们的结果显示,超过90%的不同分类器开发达成AUC为训练和验证数据集,与报道的其他作者,试图预测PL使用相同的数据库(31日]- [34,51]。不同的作品证明,无论输入特性(时间、光谱和非线性参数)从原料中提取EHG记录后,从固有模式函数的应用经验模态分解使用不同的分类器算法(安,支持向量机,演算法,多项式分类器,等等),能够学习底层数据结构的数据,因此培训达到类似的结果和验证数据31日- - - - - -34,51]。然而,获得的结果在目前工作的不同分类器显示,测试数据集上的性能明显比那些获得培训和验证数据集,它揭示了可能的过度拟合现象。这些结果强调保持一个独立的数据测试分区的重要性来确定模型的泛化能力面临新的数据时,分类器从来没有“看到”(35,36),这是特殊的相关性的转会EHG技术临床设置。

我们还比较了不同分类器指标使用EHG特性提取来自几个渠道。结果表明,EHG S3记录频道包含更好的信息准确预测PL比其他单一的渠道,这是与其他作者的研究结果报道在协议(20.,32]。这可能与电极位置时获取子宫myoelectrical活动。在这方面,S3传感电极定位中间底部和联合20.),因此可以拿起电活动从子宫肌肉细胞比其他渠道,尤其是在录音前26周妊娠。

与其他作者丢弃来自其他渠道的信息(31日,33,34),我们测试和比较两种方法相结合的多通道的信息记录。EHG特性提取每个分类器的3个频道首次美联储C7、C8,然后,EHG特性计算的梅多通道记录也被作为输入特性(C9和C10)。我们的结果表明,制备过程和C10分类器的性能明显优于C7、C8,它们分别可与各种因素有关。首先,梅从多通道记录整个子宫的“平均”的信息,可以更可靠和健壮的比获得的相同的参数从一个频道,提供信息传感电极附近活动(55]。此外,包括同步参数明显有助于劳动更准确的预测。这些结果同意先前的一项研究显示,使用强度,兴奋性,多企业信息系统和同步多通道EHG录音及其组合成一个全球效率指数提高的能力区分女性将在不到7/14天,那些生在较长时间内55]。

不同于之前的工作,不同的信息是由一个固定的组合公式(55安),在目前的工作,负责进行非线性变换和分配适当的体重每个EHG特性(强度、兴奋性和同步)来实现最佳的分类器性能。这是更合适的分类器设计比提供一个全局特征相结合的信息根据预定义的公式。另一方面,而不是计算样本熵等非线性参数的美从多通道记录获得更可靠的信息,其他作者提出的使用多变量样本熵(51]。进一步的工作需要做在比较他们的辨别能力PL期限劳动妇女和她们的计算成本。

我们的研究结果还表明,包括产科数据略有改善分类器的性能。ROC曲线的AUC的增加仅为2%,大大低于所报道的费格斯et al .,使用不同的分类器预测PL使用相同的数据库(32]。在后者情况下,多项式的AUC分类器ROC曲线从86%提高到了95%额外的产科数据添加到输入功能,而AUC改进仅为4%(从89%到93%)决策树分类器(32]。这种差异可能是由于不同的因素。首先,作者用5倍交叉验证评估预测模型开发,和没有保存测试数据确定其泛化能力。此外,我们相信,轻微改善分类器与产科相关指标数据获得在这个工作有关的事实产科提供数据库中的数据只包含一些早产的危险因素(2,62年),没有包括劳动直接测量距离。添加其他产科测量,比如宫颈长度、胎儿纤连蛋白,和/或白介素6,这已经被证明为PL预测提供相关信息(4,9,10),可以显著提高分类器性能与EHG一起使用时功能。

另一方面,一个常见的问题在分类器在生物医学工程的发展是一个数据不同阶层之间的不平衡。在我们的示例中,只有11 - 13%的女性常规控制提前交付。数据不平衡可能产生偏见的强烈学习的分类器学习算法多数类但程度较轻的少数类(61年]。Naeem等人试图预测PL使用EHG特性喂安和实现分类器精度为92.3%,阳性预测值为42.1%左右时(30.]。换句话说,其诊断价值在于其消极的预测价值。在这项工作中,我们使用击打技术来减轻学习问题的不平衡数据,而其他作者更倾向于使用其他过采样技术,如ADASYN为此(31日,51]。我们相信类似的结果将获得如果使用ADASYN过采样少数类(63年]。过采样技术的分类器性能的敏感性也进行了分析。我们发现,该模型对人工数据添加到数据库中,这表明模型可以可概括的,只要少数类的真实数据在统计上代表这个类的。然而,过早的女性最终交付数量TPEHG数据库相对较小,因此,所提供的样本是否具有统计代表性问题的人口早产仍然未知。科学界必须做出更大的努力创建一个数据库PL足以获得可靠结果预测和改善的可转让性EHG技术临床实践。与此同时,其他的办法来减轻不平衡数据集可以进行测试的影响并与过采样技术。在这方面,加权分类器,将更多的重量分配给少数类的成本函数,这将迫使他们学习不仅多数类的底层数据结构也是少数类的,将有助于开发更可靠的分类器预测PL (61年]。

安输出目前由[1]之间的一个值(因为双曲正切用作一个激活函数)。这可以转换为离散值通过设置一个阈值最大化的敏感性和特异性,在临床实践中可以转化为一个简单的概率置信区间。一旦分类器的能力,包括多通道EHG特性和产科一直在评估大型数据库的信息,下一步的发展对预测早产的临床可行的决策支持系统将实现最佳性能的DSP或FPGA等嵌入式系统(软件EHG特征提取与降维的PCA和训练有素的安)为临床医生和一个用户友好的界面。这样一个决策支持系统的使用还需要一个特定的协议,包括多通道EHG收购和产科信息。

5。结论

PL预测仍然是一个重大的挑战在妇产科,和可靠的工具,提高实际的预测能力是必需的。我们开发和而PL ANN-based分类器的性能预测使用EHG参数提取单一和多通道记录连同产科的数据。

首先,所有的分类器的发展,不论他们的输入功能,达到了高指标的培训和验证数据集(auc超过90%)。然而,测试数据集的结果表明,泛化能力显著不同。

据我们所知,这是第一次,这意味着效率指标和信息信号同步估计NPCMI被用来预测早产。自的目标是获得可概括的预测模型,不同的分类器的性能相比不仅在训练和验证数据集还有一组独立的测试数据。早产预测ANN-based分类器的性能使用单通道和多通道EHG信息,以及子宫收缩效率指标,也第一次比较。单通道分类器性能高度敏感电极位置,而那些相结合的信息从三个EHG渠道提供更好的AUC值。分类器使用意味着效率指标和产科信息产生最好的分类器性能指标,实现测试数据集的AUC值91.1±2.5%。这些结果表明,意味着效率指标计算从多通道EHG录音和产科信息可能是强大的工具来获得可概括的和准确的PL分类器,可以应用于临床实践。

数据可用性

我们使用一个公共数据库:术语早产EHG数据库(生理网)。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项工作是支持的西班牙经济和竞争力,欧洲区域发展基金(dpi2015 - 68397 r, MINECO /菲德尔和rti2018 - 094449 a - i00 - ar);Generalitat Valenciana (AICO / 2019/220);和VLC /校园(upv - fe - 2018 b03)。