不同EHG特征选择方法对早产的比较

摘要

从子宫电图(EHG)中提取了许多类型的线性和非线性特征，以分类分娩和妊娠收缩。因此，可用特性的数量现在非常多。本研究的目的是减少特征的数量，只选择对解决分类问题有用的相关特征。本文提出了三种特征子集选择方法，可用于选择对分娩和妊娠收缩进行分类的最佳子集:Jeffrey divergence (JD)距离算法、顺序前向选择(SFS)算法和二进制粒子群优化(BPSO)算法。最后两种方法基于一个分类器，并使用三种类型的分类器进行了测试。这些方法使我们能够识别与收缩分类相关的共同特征。

1.介绍

早产，也就是在怀孕37周之前分娩，仍然是产科的一个主要问题。足月前出生的儿童死亡率高，健康和发育方面也有问题[1]．根据世界卫生组织(世卫组织)的数据，即使在世界上最发达的地区，早产率也在5%至12%之间，围产期死亡率在这些病例的3%至47%之间[2]．

分娩发生在有规律和有效的子宫收缩开始后，这导致宫颈扩张和胎儿排出。子宫肌肉的收缩是由于在给定的子宫细胞中产生的电活动扩散到其他邻近的细胞。因此，子宫收缩的演变，从怀孕期间的弱和无效到分娩期间的强和有效，与细胞兴奋性的增加有关，从而增加了整个子宫的同步[3.]．

怀孕的主要目的是维持母亲和胎儿的健康，并使胎儿在子宫内，直到健康分娩所需的时间。在怀孕期间，监测子宫收缩力是至关重要的，以便区分正常的无效收缩和可能导致早期宫颈扩张和早产的有效收缩。尽管对早产发生的相关现象的认识和理解有所增加，但目前在产科中使用的方法还不够精确，不足以早期发现早产的威胁。我们需要一种更可靠的方法来早期发现和预防早产威胁。

监测子宫活动的最有前途的方法之一开始于20世纪50年代，并在20世纪80年代发展起来。它是基于对记录在母亲腹部表面的子宫电活动的研究[5]．子宫电图(EHG)由活跃的子宫肌肉细胞产生的电活动之和，加上与破坏电和机械活动有关的噪声。外部记录的EHG已被证明是内部记录的子宫电活动的代表[6]．

许多研究小组已经从EHG信号中提取特征，以便找到导致早产的特定信息。首先，采用时域和频域线性方法提取eeg特征;为了改善线性方法获得的结果，并且由于EHG与其他生物医学信号一样，也具有一些非线性特征，因此提出了几种检测EHG非线性特征的措施。

迄今为止，许多不同的研究人员使用非常不同的人群和记录协议从EHG信号中提取了大量的特征。一般来说，诊断所需的计算复杂性随着使用的特征数量的增加而增加。在模式识别中，通过去除无关和噪声特征来降低特征维数是非常重要的。本研究的目的是在从参考文献中提取的特征中选择最重要的子集，以区分怀孕和分娩收缩，这些特征是从相同给定的人口中计算出来的。在本研究中，我们从文献数据中选取了EHG提取的20个特征(16个线性特征和4个非线性特征):平均频率(MPF) [7]、峰值频率(PF) [8- - - - - -10和十分落实（)[11]，其中包含频率中位数[9，11，12]，由小波分解提取的参数()[13]，Lyapunov指数（LE）[14，15，时间可逆性(Tr) [15]，样本熵(SE) [12]和方差熵（变别）[16]．

本文提出了三种特征子集选择方法。第一种方法是基于测量从怀孕和分娩EHG类中计算的参数直方图之间的Jeffrey发散距离[17]．为数据挖掘而开发的后两种方法依赖于分类器和搜索过程的组合:顺序前向选择(SFS) [18或二进制粒子群优化（BPSO）[19]．这些方法的目标是从给定的特征集中选择能给出最大分类精度的特征子集。

本文组织如下。在第一部分，我们将描述实验协议。然后给出了从EHG处理书目中提取的特征以及特征选择的三种方法。最后，给出特征选择的结果。

2.试验协议

在我们的研究中，我们使用记录在48名女性的信号：32次怀孕期间（妊娠339周）和16次劳动期间（妊娠39-42周）。测量在法国和冰岛的两家医院进行。在冰岛，使用相关道德委员会（VSN02-0006-V2）批准的议定书，在地利性大学医院进行了测量。在法国，使用相关道德委员会（ID-RCB 2011-A00500-41）的议定书，在妇产科和妇科（Amiens）中进行测量。录音后，我们跟随孕妇，以便将信号标记为怀孕或劳动力。当女子在24小时内诞生时，该信号被标记为“劳动力”。如果稍后发生交货，则信号被标记为“妊娠”。在我们的研究中，并非所有因自发交付而结束的怀孕，以及两家医院的不同药物都是常规用于劳动诱导或进展的不同药物。在我们的研究中，7名妇女接受催产素（79个收缩），3名妇女接受前列腺素（49个收缩），1名患有硬膜外（3个收缩），8名妇女没有任何药物（38个收缩）。我们的数据库只包含单例怀孕。

EHGs是用一个由18个电极组成的多极系统记录的:16个电极排列在一个4 × 4的矩阵中，放置在女性的腹部，两个参考电极分别放置在她的臀部[20.]．放大器带宽为0.16-128 Hz。为了提高信噪比，我们计算了垂直双极信号(Vb)．最后我们得到12个双极信号，如图所示1．我们信号的带宽在0.1到3赫兹之间。使用的采样频率为200hz，向下采样12倍，得到一个16.67 Hz的新信号。

（一种）

(b)

在本研究中，我们只使用了一个双极信号Vb7，因为这个信号是我们研究中使用了很长时间的参考记录位置。它位于子宫垂直中轴上。这个区域的信号能量在整个孕期和分娩过程中都保持高水平。根据同时记录的生育功计信号，人工分割与宫缩相对应的子宫电活动爆发。在对EHG爆发进行手工分割后，我们得到了一个包含133个妊娠爆发和133个分娩爆发的数据库。

3.材料和方法

3．1.参数提取

在我们的研究中，从EHG中提取了20个参数。这些参数分为两类:线性和非线性。

3.1.1。线性参数

功率谱密度相关参数．从功率谱密度(PSD)中提取了若干频率参数，．在我们的工作中，我们使用Welch周期图方法来计算每个突发的功率谱密度[11]．Welch周期图使用nfft类型的窗口，其大小等于信号的长度/2，有50%的重叠，总共使用了三个窗口。从这个PSD中提取了11个频率参数:平均频率强积金[7]、峰值频率(PF) [8- - - - - -10,十分位数［11，其中包含中值频率［9，11，12]．大量对应频率将功率谱密度分成部分，每部分包含总能量的10%。考虑以下: 从小波分解提取的参数。一些作者还使用时频方法，如小波分解，来表征EHG的非平稳特性。在我们的工作中，我们使用小波symlet 5，一个基于参考文献[21]．本研究比较了几种类型的小波。结果表明，symlet 5是最适合用于EHG信号检测和分类分析的小波。将每个EHG分解为细节系数后，我们计算以下细节水平的方差:2、3、4、5和6(命名为，，，,)，如先前在[13]．这些细节系数如下:(2.08 - -4.17赫兹),(1.04 - -2.08赫兹),(0.52 - -1.04赫兹),(0.26 - -0.52赫兹)[0.13-0.26 Hz](见图2)．细节的选择取决于信号的采样频率(下采样后的采样率为16.67 Hz)，以便与在[13]．这些所选细节表示信号能量的96％以上，覆盖频段的感兴趣。

3.1.2。非线性参数

时间可逆性(Tr)。如果时间序列的概率性质相对于时间反转不变，则时间序列是可逆的。时间不可逆性是非线性的一个很好的指标。计算信号的时间可逆性(Tr)我们使用了[15)如下: 在哪里信号长度是和吗为时间延迟。

李雅普诺夫指数。李雅普诺夫指数(LE)研究了系统的稳定性和对初始条件的敏感性。它测量相空间中相邻轨迹间的轨迹分离率[14，15]．在我们的研究中，我们使用了[15]，并以在哪里表示任意时间在系统的两个状态之间的欧几里德距离和对应于后来系统的两个状态之间的欧氏距离．

样本熵。我们使用样本熵(SE)来识别EHG信号的规律性。在我们的工作中，我们使用了[12]．较难预测的时间序列呈现较高的样本熵。考虑一个时间序列的长度和模式的长度,,；；．时间序列在一个时间，是否匹配给定的模式,如果,对于每一个．样本熵的计算方法如下: 其中四个参数，，,分别表示时间序列的长度、要比较的序列长度、接受匹配的容忍度和模式匹配的数量(在空白范围内)）为每个构建．

在我们的研究中= 2。该值由假最近邻法(FNN)确定;的价值根据文献，等于0.2 [12]．

方差熵。近年来的研究利用方差熵(VarEn)来研究生物信号，但未用于EHG研究。我们感兴趣的是使用方差熵，因为这种方法通过逆方差加权将方差和样本熵结合起来。对于一个时间序列，方差熵定义为在哪里是个th段，的逆方差是多少,是滑动窗口的数量。不是固定的，因为我们的数据库中信号的长度取决于EHG突发持续时间。

滑动窗口的大小为50(窗口大小)，随着时间的推移，滑动窗口的步长为45(步长大小)，导致滑动窗口之间的重叠为5。窗口大小和步长的选择是经过多次试验的经验选择。因此取决于窗口大小。

由于方差熵是通过逆方差加权将方差与样本熵结合在一起的，所以窗数是非常重要的，对结果有很大影响。既不能太高也不能太小。一个太大值会导致大量的计算时间，并不能给出精确的结果。一个太小值限制了可变性的检测。

3．2．特征选择技术

3.2.1之上。基于Jeffrey发散距离的特征选择

该方法包括计算每个特征的两个直方图之间的Jeffrey divergence (JD)距离，从怀孕和分娩爆发类获得。这两个直方图之间的距离允许我们测量它们相应统计属性的相似/不同。距离越小，相似度越高，距离越大，相似度越低[22]．然后利用发散距离来选择鉴别特征。事实上，怀孕和劳动阶级的特征直方图之间的距离越大，特征的甄别性就越强[17]．

该方法分为两部分。第一部分是计算参数及其直方图。第二部分是计算直方图之间的距离。

计算参数及其直方图．对于每个组的每个缩略语，我们应用以下步骤。（1）计算整个EHG的非线性参数。这些方法分别是时间可逆性(Tr)、Lyapunov指数(LE)、样本熵(SE)和方差熵(VarEn)。（2)计算小波分解后2、3、4、5、6各细节层的方差(，，，,)．（3)对于每个信号，计算频率参数:，，，，，，，,)、平均频率(MPF)和峰值频率(PF)。(4）根据整个EHG数据库计算出的矩阵将这些值分组。因此，对于给定的压缩，我们得到维数为20的向量。矩阵的20列对应从一个EHG计算的20个参数值。由于我们在每个类中有133个收缩，我们得到133个20维的向量(每个类有一个133 × 20矩阵)。然后，我们从每个类别的133个向量中计算每个参数的直方图，得到2组20个直方图，每个参数和每个类别各有一个直方图。

直方图之间的距离．在获取给定参数的分娩和怀孕类的两个直方图后，我们测量两个类的直方图之间的距离。为了测量这个距离，我们使用[22]：在哪里和两个直方图在哪里垃圾箱()的定义为和，使用bin索引．计算20个参数对应的两个参数直方图之间的距离，得到一个维数为20的距离向量。我们计算这个距离向量中包含的距离的分布。我们研究的目的是选择最具鉴别性的参数;因此，我们在距离向量上应用一个阈值，以选择与较大距离相关的参数。通过Lilliefors检验验证该分布的高斯性后，选择阈值为距离分布的均值+1*标准差。

3.2.2。顺序前进选择（SFS）

序列前向选择(SFS)是一种用于特征选择的序列搜索算法[23为数据挖掘而开发的。SFS以一个空子集开始。准则函数的值()通过使用分类器计算每个特征。选择分类性能最好的特征()，然后添加到子集。下一步是按顺序添加特性它具有最高的标准函数当与功能结合时已经被选中的。这个循环重复，直到扩展当前子集时没有得到任何准则改进。下面的步骤给出了SFS算法[18]．（1）从一个空子集开始（2)选择下一个最佳功能:（3)如果（一种）更新(b)转到步骤2结束对于我们的研究，三个古典分类器已被用于计算标准函数(最小误差)。分类器如下:线性判别分析(LDA) [24，二次判别分析(QDA) [25),而最近邻(KNN)(选择是基于训练集的数量)[24]．SFS算法依次搜索最佳特征子集。然后，我们只选择能呈现最小误差的特征组合。

将SFS算法应用于合成数据，验证了算法的有效性。合成数据由一个矩阵组成（400个对应于6个功能定义的两个类的观察结果）。随机生成四个特征（特性1,2,4和6）（以中心标准化高斯）生成。使用归一化的高斯和5）生成剩余的（特征3和5），用于为类别为1和M2的平均M1分布2.在验证其对合成数据的效率之后，我们已将其应用于我们的EHG数据库。我们使用了70％的数据集进行了分类器培训，并且剩余的30％用于测试。

3.2.3。二进制粒子群算法

粒子群算法(PSO)是由Eberhart和Kennedy于1995年提出的。这是一种基于种群的随机优化技术，灵感来自于鸟群或鱼群的社会行为[26]．粒子群算法(PSO)利用在搜索空间内移动的若干粒子(群)来获得最佳解。我们假设搜索空间是每个粒子都是这个空间中的一个点。位置群粒子表示为．每个粒子都有一个最佳前位，它对应于最佳适应度值(在本例中，使用所选特征提供的分类器给出的最佳分类)。种群中所有粒子中的全局最优粒子表示为．速度粒子表示为．粒子的速度和位置根据以下两个方程进行操作: 在哪里为惯性权重，和是正常数吗和两个随机值在这个范围内吗．

Kennedy和Eberhart还提出了一种二进制粒子群优化算法(BPSO)，用于求解具有离散值参数的优化问题[19]．在BPSO中，每个粒子的位置用二进制字符串表示。通过比较PSO和BPSO，我们发现它们有共同的速度方程和不同的粒子位置方程，可以计算为: 在哪里是s函数和吗一个随机数是否在这个范围内．

BPSO最近在文献中被广泛应用于特征子集选择[27]．在这种情况下，每个粒子的二进制串的长度等于特征总数的长度，每个粒子都提出了一个子集选择的候选。如果二进制字符串中包含的位值为" 1 "，则选择该特征;否则，该特性不被选中。下面介绍BPSO算法的步骤。（1）初始化所有粒子的位置和速度随机。设置迭代次数和其他BPSO参数。（2)计算适应度值每个粒子。适应度表示正确分类的百分比。（3)将每个粒子的适应度与其迄今为止的最佳适应度进行比较(最后一次迭代）： (4）确定全球最佳位置从所有．然后比较与： (5）更新每个粒子的位置和速度根据(7)和(10)．（6)转到步骤2，并重复，直到达到迭代次数。当迭代次数达到极限时，我们得到一个最优解(特征选择的最佳子集)。

BPOS的参数经典地选择为30个粒子，每个粒子的长度等于20(最大特征数)，迭代。加速常数和被设定为2.我们还使用了从0.6到0.1的线性下降惯性重量。

在本文中，对于BPSO算法，我们使用了三种经典的分类器来计算适应度:线性判别分析(LDA) [24，二次判别分析(QDA) [25),而最近邻(KNN)(选择是基于训练集的数量)[24]．BPSO算法选择的最佳特征子集定义为100次迭代(1次运行)后正确分类的百分比最大的特征子集。然后，为了评估BPSO的性能和可变性，我们进行了多次运行(200次)。该算法应用于上述相同的合成和真实数据。

4.结果

4．1.参数提取结果

对于每组的每次收缩，我们从EHG中计算出20个参数(线性和非线性参数)。表格1呈现每个类中每个参数的平均值±标准偏差。此外，在此表中，我们为每个参数呈现Lilliefors测试结果关于其高斯。


参数	的意思是STD（怀孕）	高斯	的意思是性病(劳动)	高斯

Tr		N		N
勒		Y		Y
SE		Y		Y
VarEn		Y		Y
W1		N		Y
W2		N		Y
W3		N		Y
W4		N		Y
W5		Y		Y
D1		N		Y
D2		N		N
D3		N		N
D4		N		N
D5		N		N
D6		N		Y
D7		N		Y
D8		N		Y
D9		N		Y
强积金		N		Y
PF.		N		N

4．2．使用JD距离进行特征选择的结果

首先给出了基于Jeffrey散度的特征选择方法的结果。计算20个特征的每两个对应特征直方图之间的距离，得到一个维数为20的距离向量，如图所示3.．红色表示分布距离的最大值，蓝色表示分布距离的最小值。这个向量的每个坐标代表一个不同的特征。

数字4表示在距离向量上应用阈值(等于距离分布的均值+1*标准差)后得到的选择向量。白色表示该特征已被选择作为区分妊娠和分娩的特征。

通过这种方法，我们选择了5个鉴别特征:小波分解细节级的方差4 ()，十分位6 ()，十分位数7 ()，十分位8 ()，十分位9 ()．

4．3．使用SFS和BPSO进行特征选择的结果

4.3.1。合成数据结果

首先将BPSO算法和SFS算法应用于上述合成数据，以测试其有效性。表格2呈现在将SFS和BPSO应用于这些合成数据后获得的结果。我们注意到两个特征3和5以粗体字体标记在表中2无论m1和m2 (m1#m2)的均值是多少，无论分类器是什么，总是由两种算法(BPSO和SFS)选择。我们还可以注意到，无论分类器是什么，两种方法都选择更大的集，而不是包含两个明显区别特征的最小集，而SFS在大多数情况下给出的集比BPSO更小。


分类器	最佳适应度的gbest	SFS(以最小误差组合功能)

QDA	3.45	3.，56
LDA.	1，3.456	3.，56
然而,	3.456	2，3.，5

4.3.2。真实子宫肌电图信号结果

表格3.给出了使用3种分类器从BPSO和SFS中获得的特征子集，并将其应用到EHG数据库中。每个选择的特征子集对应于给出最大正确分类百分比的特征子集(QDA为93.73%，LDA为91.23%，KNN为89.97%)。表格3.并给出了SFS选择的最佳特征子集，对应最小误差。


分类器	BPSO(在200次运行之间拥有最佳适应度的gbest)	SFS(以最小误差组合功能)

QDA	乐，VarEn，W1, w4, d1, d2, d4, d5，D8, D9	TR、勒,VarEn，W1 W2, W4,*D8,*D9
LDA.	,VarEn，W1 w2 d1 d4，D8，强积金	,VarEn，W2 w3 d1 d3 d7，*D8,*D9,强积金
然而,	勒,,VarEn，W3 w4 d1 d3 d5 d6D8	TR、勒,VarEn，W1, w2, w3, w4, w5, d1, d2, d3, d4, d7，*D8,*强积金

从表3.，我们可以注意到，不管分类器类型如何，BPSO总是选择3个特征。这些特征是VarEn, D1和D8。对于SFS，从三个分类器得到的子集之间的共同特征是SE、VarEn、W2和D8。表格中只有VarEn和D8用粗体标注3.是由两种方法系统地选择的。

4.4。验证

上述结果给出了使用JD、SFS与QDA、SFS与LDA、SFS与KNN、BPSO与QDA、BPSO与LDA、BPSO与KNN选择的7个特征子集。然后，我们通过计算作为分类器输入时它们给出的正确分类的百分比来评估这七个选定子集的性能。我们在此验证中使用与选择阶段相同的分类器:QDA、LDA和KNN。

表格4显示使用QDA分类器对每个子集正确分类的百分比。使用QDA的BPSO选择的特征子集分类率最高(88.72%)，其次是使用QDA的SFS选择的特征子集分类率为87.47%。表格5给出了使用LDA分类器对每个子集正确分类的百分比。结果表明，采用QDA的SFS和采用KNN的SFS所选择的子集所占比例最高(84.96%)，其次是采用LDA的SFS和采用LDA的BPSO所选择的子集所占比例最高(83.71%)。表格6给出了使用KNN分类器对每个子集正确分类的百分比。结果表明，使用QDA的BPSO选择的子集分类率最高(87.47%)，其次是使用KNN的BPSO选择的子集分类率为84.96%。


选择方法	选择特征子集	使用QDA正确分类

JD	W3, d6, d7, d8, d9	79.95%
SFS与QDA	TR, LE, SE, VarEn，W1, w2, w4, d8, d9	87.47%
SFS与LDA	SE、VarEnW2 w3 d1 d3 d7 d8 d9强积金	83.71%
使用KNN的SFS	TR, LE, SE, VarEn，W1、w2、w3、w4、w5、d1、d2、d3、d4、d7、d8、强积金	84.96%
全局搜索与QDA	VarEn勒,W1 w4 d1 d2 d4 d5 d8 d9	88.72％
BPSO与LDA.	SE、VarEnW1 w2 d1 d4 d8强积金	81.20%
全局搜索与资讯	勒,SE、VarEnW3 w4 d1 d3 d5 d6 d8	86.22%


选择方法	选择特征子集	使用LDA进行正确分类

JD	W3, d6, d7, d8, d9	81.20%
SFS与QDA	TR, LE, SE, VarEn，W1, w2, w4, d8, d9	84.96%
SFS与LDA	SE、VarEnW2 w3 d1 d3 d7 d8 d9强积金	83.71%
使用KNN的SFS	TR, LE, SE, VarEn，W1、w2、w3、w4、w5、d1、d2、d3、d4、d7、d8、强积金	84.96%
全局搜索与QDA	VarEn勒,W1 w4 d1 d2 d4 d5 d8 d9	82.46%
BPSO与LDA.	SE、VarEnW1 w2 d1 d4 d8强积金	83.71%
全局搜索与资讯	勒,SE、VarEnW3 w4 d1 d3 d5 d6 d8	82.46%


选择方法	选择特征子集	使用KNN进行正确的分类

JD	W3, d6, d7, d8, d9	78.70%
SFS与QDA	TR, LE, SE, VarEn，W1, w2, w4, d8, d9	83.71%
SFS与LDA	SE、VarEnW2 w3 d1 d3 d7 d8 d9强积金	81.20%
使用KNN的SFS	TR, LE, SE, VarEn，W1、w2、w3、w4、w5、d1、d2、d3、d4、d7、d8、强积金	83.71%
全局搜索与QDA	VarEn勒,W1 w4 d1 d2 d4 d5 d8 d9	87.47%
BPSO与LDA.	SE、VarEnW1 w2 d1 d4 d8强积金	81.20%
全局搜索与资讯	勒,SE、VarEnW3 w4 d1 d3 d5 d6 d8	84.96%

5.讨论和结论

在本文中，我们提取了几个特征(线性和非线性)从EHG。然后，我们应用了三种选择技术(Jeffrey发散距离、SFS和BPSO)，以选择最相关的特征，允许区分分娩和妊娠收缩。

从桌子上清楚2(对合成数据的结果)表明，BPSO算法和SFS算法具有选择鉴别特征的能力。在表3.从EHG信号中提供的选择结果，我们注意到使用三种不同的分类器时，BPSO和SFS选择了不同的功能子集。突出显示用不同方法选择的最重复功能非常重要。实际上，这些功能预计将非常相关。应用JD算法（W3，D6，D7，D8和D9）时，已选择五个特征。通过BPSO（变量，D1和D8）反复选择其他三种，另外通过SFS（SE，VAREN，W2和D8）反复选择，无论分类器的类型如何。只有D8对于这3个子集很常见。D8对应于怀孕类的平均值的平均值为0.36±0.09，劳动类的0.45±0.12（表1)．D8值的增加与研究EHG频率内容的团队所做的最被接受的观察是一致的，无论种类是什么:从怀孕到分娩，EHG频率内容明显向更高频率转变[3.，6]．

比较BPSO和SFS获得的6个特征子集，我们注意到VarEn和D8这两个特征也很常见。这证实了不同小组关于考虑EHG的非线性特征以进行诊断的观点[12，14，15]．VarEn从怀孕到分娩也会增加(见表)1)，表明从怀孕到分娩期间EHG非线性增加，这与不同团队的研究结果一致[12，14，15]．VarEn在这里的表现比这些团队计算的其他非线性特征更好。这个简短的子集也应该具有诊断价值。

从为了测试所选子集的性能而开发的验证研究中，我们从Table中注意到4使用QDA的BPSO选择的特征对应于使用QDA获得的最高分类正确率(88.72%)。表格6采用基于KNN的QDA的BPSO选择的特征子集的分类正确率第二高(87.47%)。这使得我们可以说，与QDA相关的BPSO似乎是我们研究中最有效的特征选择方法。

从这些结果可以得出两个结论。(我)最具鉴别性的子集应该是(或至少应该包含)以下2个特征:VarEn和D8。事实上，不管分类器是什么，它们都是在使用JD、SFS和BPSO定义的7个特征子集中选择的最相关的特征。（ii）带QDA的BPSO比JD方法给出更大的选择集，这可能对时间和训练数据都有要求。但是，当使用非线性分类器时，这些集合也为验证阶段提供了更好的结果。这意味着无论是特征选择还是分类，EHG的分类都应该基于非线性方法，而不是线性方法。在以后的工作中，我们将只使用所选择的特征作为分类器的输入，对EHG进行分类，以便将得到的结果与使用所有特征得到的结果进行比较。我们还将在更大的数据库上测试特征选择的最佳方法。因此，我们将能够使用比本研究中使用的简单交叉验证技术更可靠和相关的交叉验证技术。此外，我们应该在验证阶段尝试其他分类方法，如基于神经网络、SVM或KNN的分类方法。我们还将在这个选择过程中包括与子宫同步和活动传播有关的特征，这些特征已被证明是EHG监测的兴趣[4]，只要他们从我们团队目前正在进行的工作中获得。通过这项工作，我们希望获得最相关的数据分析特征，以预测早产威胁尽早。

承认

作者负债望对法国教皇政治委员会和联邦资金进行资金。

参考文献

R. L. Goldenberg, J. F. Culhane, J. D. Iams和R. Romero，《流行病学和早产原因》，《柳叶刀》，第371卷9606, pp. 75 - 84,2008。视图:出版商的网站|谷歌学术搜索
“新生儿和围产期死亡率:国家、区域和全球估计数，世卫组织报告，”2006，http://whqlibdoc.who.int/publications/2006/9241563206_eng.pdf．视图:谷歌学术搜索
R. E. Garfield和W. L.甲师，“子宫收缩的生理和电气活动”，细胞与发育生物学研讨会第18卷第2期3，页289-295,2007。视图:出版商的网站|谷歌学术搜索
M. Hassan, J. Terrien, C. Muszynski, A. alexandandersson, C. Marque，和B. Karlsson，“使用子宫外肌电图非线性相关分析更好的妊娠监测”，生物医学工程学报，第60卷，第2期4, pp. 1160-1166, 2013。视图:谷歌学术搜索
H. Alvarez和R. Caldeyro，“新方法记录的人类子宫收缩力”，外科、妇产科学第91卷第1期1，第1 - 13页，1950。视图:谷歌学术搜索
D. Devedeux, C. Marque, S. Mansour, G. Germain, and J. duchenn，《子宫肌电图:评论》美国妇产科杂志第169卷第1期6，第1636-1653页，1993。视图:谷歌学术搜索
J. Terrien, T. Steingrimsdottir, C. Marque，和B. Karlsson，“使用时频脊重构研究不同子宫位置的肌电同步:妊娠和分娩收缩的比较，”《信号处理进展》文章编号:242493,2010。视图:出版商的网站|谷歌学术搜索
W. L. Maner, R. E. Garfield, H. Maul, G. Olson，和G. Saade，“通过经腹子宫肌电图预测足月和早产”，妇产科，第101卷，第1期。6，第1254-1260页，2003。视图:出版商的网站|谷歌学术搜索
J. Sikora, A. Matonia, R. Czabański, K. Horoba, J. Jezewski，和T. Kupka，“从子宫生物电活动信号识别早产威胁性分娩症状”，围产期医学档案，第十七卷，第二期2, pp. 97-103, 2011。视图:谷歌学术搜索
M. Lucovnik, W. L. Maner, L. R. Chambliss等人，“无创子宫肌电图用于预测早产”，美国妇产科杂志第204卷第1期3、228. e1 - 228页。e10, 2011年。视图:出版商的网站|谷歌学术搜索
C. Marque, H. Leman, M. l . Voisine, J. Gondry，和P. Naepels， " Traitement de l ' électromyogramme utérin pour la caractérisation des contractions pendant la grossesse， "rbm-news.第21卷第2期9、1999年。视图:谷歌学术搜索
G. Fele-Žorž， G. Kavšek， Ž。Novak-Antolič和F. Jager，“用于分离足月和早产组子宫肌电图记录的各种线性和非线性信号处理技术的比较，”医学、生物工程和计算机第46卷，第46期9，第911-922页，2008。视图:出版商的网站|谷歌学术搜索
M. O. Diab, C. Marque, M. A. Khalil，“子宫肌电信号的分类:AR模型与统计分类方法的比较”，国际计算认知杂志，第5卷，第5期。1，页8-14,2007。视图:谷歌学术搜索
T. Ivancevic, L. Jain, J. Pattison, A. Hariz等，“使用非线性方法的早产分析”，最近的生物医学工程专利， vol. 1, no. 13，页160-170,2008。视图:谷歌学术搜索
A. Diab, M. Hassan, C. Marque，和B. Karlsson，“评估信号非线性的四种方法的定量性能分析:对子宫肌电信号的应用”，刊于第34届IEEE EMBS国际年会论文集2012年9月，美国加州圣地亚哥。视图:谷歌学术搜索
胡敏，“方差熵:表征视觉刺激的感知意识的方法”，应用计算智能和软计算， 2012年第5期，文章编号525396,6页，2012。视图:出版商的网站|谷歌学术搜索
D. Alamedine, M. Khalil，和C. Marque，“子宫肌电信号的参数提取和监测”早产的检测， Recherche en Imagerie et Technologies pour la Santé，法国波尔多，2013。视图:谷歌学术搜索
L. Ladha和T. Deepa，“功能选择方法和算法”，国际计算机科学与工程杂志，第3卷，第2期。5, pp. 1787-1797, 2011。视图:谷歌学术搜索
J. Kennedy和R. C. Eberhart，“粒子群算法的离散二进制版本”IEEE系统、人与控制论国际会议论文集，第4104-4108页，1997年10月。视图:谷歌学术搜索
B. Karlson, J. Terrien, V. Gudmundsson, T. Steingrimsdottir，和C. Marque，“腹部EHG在一个4 × 4网格:测绘和呈现子宫收缩的传播，”在第11位地中海医疗和生物工程和计算会议的诉讼程序，第139-143页，斯洛文尼亚，卢布尔雅那，2007。视图:谷歌学术搜索
m·哈利勒一个方法，在détection和分类，在非统计数据中。应用a l’emg utérin[博士论文]， Thèse de l 'Université de Technologie de Troyes, 1999法语。
Y. Ma，X. Gu和Y. Wang，“使用变量箱尺寸距离的直方图相似度测量”计算机视觉与图像理解，第114卷，第2期。8, pp. 981-989, 2010。视图:出版商的网站|谷歌学术搜索
D. W. Aha和R. L. Bankert，“序列特征选择算法的比较评估”，刊于学习数据，页199-206，施普林格，纽约，纽约，美国，1996。视图:谷歌学术搜索
S. Dudoit, J. Fridlyand和T. P. Speed，“利用基因表达数据进行肿瘤分类的鉴别方法比较”，美国统计协会杂志第97卷第1期457页，77 - 87,2002。视图:谷歌学术搜索
N. georgiu - karistianis, M. A. Gray, D. J. F. Domínguez et al.，“基于基底节区二次判别分析的亨廷顿病诊断前与健康对照个体的自动鉴别:IMAGE-HD研究，”疾病的神经生物学， vol. 51, pp. 82-92, 2013。视图:出版商的网站|谷歌学术搜索
R. Eberhart和J. Kennedy，“使用粒子群理论的新优化器”，刊于第六届微型机和人类科学研讨会议程（MHS'95），pp。1995年10月39-43。视图:谷歌学术搜索
V. Ranaee, A. Ebrahimzadeh，和R. Ghaderi，“PSOSVM模型在控制图模式识别中的应用”，ISA事务，卷。49，没有。4，pp。577-586，2010。视图:谷歌学术搜索

医学中的计算和数学方法

孕期监测

摘要