文摘

胎儿运动是一个重要的临床指标评估胎儿在子宫增长和发展地位。近年来,无创胎儿运动智能传感检测系统,可以监控高风险怀孕在家收到了大量的关注领域的可穿戴的健康监测。然而,恢复胎儿运动持续小幅度的信号背景与噪声严重污染并认识到真正的胎儿运动是一项具有挑战性的任务。摘要胎儿运动可以有效地识别结合卡尔曼滤波的力量,时间和频率域和小波域特征提取,和hyperparameter调谐光梯度提升机(LightGBM)模型。首先,卡尔曼滤波(KF)算法用于恢复胎儿运动在持续小幅度信号背景噪声污染。其次,时域、频域和小波域(TFWD)预处理胎儿运动的特征信号提取。最后,贝叶斯优化算法(BOA)是用于优化获得最优hyperparameters LightGBM模型。通过这个,准确的预测和识别胎儿运动的成功实现。Zenodo胎儿运动性能分析的数据集,提出了KF + TFWD + BOA-LGBM方法的识别精度和F1-Score达到94.06%和96.85%,分别。相比8现有先进的胎儿运动信号识别方法,该方法具有更好的精确性和鲁棒性,表明其潜在的医学应用在嵌入式智能传感系统胎儿产前健康监测。

1。介绍

世界各地,重大公共卫生资源一直在致力于产前卫生监测高危的母亲,目的是降低围产儿死亡率。尽管如此,每年全世界有260万死产(1),其中大多数发生在低收入和中等收入国家与相对贫穷的资源(2,3]。死胎通常是与怀孕期间获得适当的保健和交付(4),并建立产前监测可以有助于减少死产5]。胎儿运动被广泛认为是一个重要的生理指标来评估胎儿的健康(6- - - - - -9]。胎儿运动被定义为任何不规则的踢,飘扬,摇摆、滚动和通常是第一个被母亲在怀孕18到20周(10]。胎儿运动的频率达到高原在妊娠32周和保持在这个层次上,直到出生11,12]。有证据表明,过多或过少在子宫在围产期胎儿运动可能导致死胎(4]。连续定量记录胎儿运动允许可靠的胎儿损伤识别,使及时干预,以减少死亡率(5]。母亲的看法改变或减少胎儿运动与死产有关(13,14)和其他不良结果,包括母胎出血,增长限制,先天性畸形,和长期的神经发育障碍15- - - - - -20.]。通常,母亲反复对胎儿运动被认为是胎儿健康的标志(17,21,22]。是建立孕产妇胎儿运动之间的不同女性的看法(23- - - - - -25]。孕产妇胎儿运动是受心理因素影响的看法和胎儿运动的持续时间26]。另一方面,超声成像技术,检测胎儿运动的黄金标准(32,49),可以提供更好的参考信息。然而,这是一个长期的心电图监测同步过程,需要高素质的医务人员的参与(27]。此外,这种技术不能用于很长时间实用和安全的原因28)和超声波传感器的干扰可能扭曲了多普勒信号。

近年来,随着智能传感装置的迅速发展和现代数字信息处理技术的发展,胎儿运动使用microacceleration传感器的自动识别和高效的信号处理算法得到了广泛关注29日- - - - - -42]。加速度计传感器嵌入在可穿戴设备和戴在孕妇的腹部来检测一系列动表面的腹部。与超声波仪器相比,嵌入式智能传感设备的强度低的货币成本,操作方便,在家和长期监测胎儿运动(41]。

文献综述基于加速度记录的胎儿运动自动识别数据。Mesbah et al。29日)设计了一个基于重力感应的胎儿运动检测器,提出了均方根(RMS)检测方法。使用加速度计来检测胎儿运动信号被证明是比母亲更有效感知和self-counting胎儿运动。然而,基于振幅阈值的均方根方法对噪声干扰和高度敏感可能不会达到预期的识别性能。良等。30.)使用了一种新的电容式加速度计记录胎儿运动在孕妇的夜间睡眠。记录仪拥有准确的承诺和长期健康监测胎儿运动在家里。Layeghy et al。31日胎儿运动]提出了一种时频分析方法记录的加速度信号。该方法首先使用一个带通滤波器(瘘)算法的带宽为0.5 Hz-45赫兹降噪胎儿运动加速度记录的信号,提取预处理信号的时频域(TFD)特性,然后支持向量机(SVM)模型用于胎儿运动识别(带通滤波器+ TFD + SVM)。的方法获得了良好的分类精度和灵敏度的胎儿运动。然而,支持向量机的单分类器的帮助下解决了支持向量的二次编程,这对大规模训练样本难以实现。Boashash et al。32)使用时频匹配(TFMP)追求和时频匹配滤波器(TFMF)方法来检测胎儿运动加速度计记录的信号。这两个提议时频检测方法计算复杂度较低,能满足大多数现有的微处理器系统的计算空间需求的识别精度。然而,很难构建一个完整的字典胎儿运动的经验观察和没有达到预期的性能。Altini et al。33)使用数字带通滤波器的带宽1 Hz-20赫兹降噪胎儿运动信号从孕妇的腹部表面获得了由多个感应器和时域提取预处理功能(TD),然后随机森林(RF)模型用于胎儿运动检测(带通滤波器+ TD + RF)。方法重传感器的数量和位置之间的关系定位和使用交叉验证来实现现实的和可靠的结果。kamata et al。34)使用一个加速度计识别胎儿打嗝的数量在怀孕早期和晚期。良等。35)设计了一种新型加速度计记录的数量总值胎儿运动来确定正常参考价值等动作。Abeywardhana et al。36)使用时域(TD)分析分离胎儿运动从原始记录的加速度计信号。赵et al。37]使用无限脉冲响应(IIR)数字带通滤波器(瘘)算法的带宽0.5 Hz-20赫兹胎儿运动消除干扰信号通过加速度计,和离散小波变换(DWT)后的特征提取,然后模糊自适应共振理论(模糊ARTMAP)模型映射用于胎儿运动识别(带通滤波器+ DWT +模糊ARTMAP)。方法结合信号预处理、阈值检测和轻量级的机器学习算法来降低系统的计算复杂度,同时保持较高的分类精度。然而,传统的数字带通滤波器过滤困难幽灵似地混合信号和孕产妇胎儿运动工件的信号,导致误报的高水平的认可。Wasalaarachchi et al。38)提出了一个自动胎儿运动计数算法基于非负矩阵分解(NMF)和谱聚类,结合家庭可穿戴设备。延迟等。39,47)开发了一种无创胎儿运动识别系统将卷积神经网络(CNN)混合算法。盛田昭夫et al。40)使用加速度计计算胎儿运动小胎龄(SGA)婴儿和确定SGA与减少胎儿运动有关。赵et al。41)使用时域和离散小波域(台币)方法提取潜在的胎儿运动特性。Bobrova et al。42用带通滤波器(瘘)与0.5 Hz-20赫兹的带宽算法去噪。该方法对噪声有很好的抑制影响在频带之外,但是很难过滤掉噪音信号,与胎儿运动信号的频谱重叠。Martinek et al。43)使用先进经验模态分解(EMD),集成经验模态分解(EEMD)和自适应小波变换信号处理(AWT)胎儿心电信号去噪的方法。这些现代数字信号处理方法提供一些最优准则下的最大干扰抑制基于一些随机信号的统计特性。陆et al。44利用奇异谱分析(SSA)胎儿心率信号去噪的方法。方法保持相同的信号趋势传统去噪算法和不会引起信号失真和衰减。杜et al。45)评估的相对位置可穿戴胎儿运动检测装置戴在孕妇的腹部。刘等人。46)使用时间和频率域(TFD)方法提取胎儿运动获得了由多个压力传感器信号特性。现有的胎儿运动信号特征提取方法仍然有缺点,不考虑的一些特性,比如谱熵表示信号的不确定性和复杂性,所以不会获得理想的识别性能。Vican et al。48]使用经验模态分解(EMD)算法来消除干扰信号,提取时域(TD)功能,然后使用一个机器学习(ML)模型识别胎儿运动(EMD + TD +毫升)。该方法可以有效地提取关键特性信息,充分考虑胎儿心跳信号的噪声特性。Mesbah et al。49]使用高通滤波器的截止频率(高通滤波器)算法0.8赫兹降噪胎儿运动信号获得的加速度计,和特性后,独立分量分析(ICA)和离散小波变换(DWT)提取,然后用随机森林装袋算法作为其基本分类器被用来识别胎儿运动(高通滤波器+ ICA + DWT + RF-Bagging)。方法使用先进的信号处理技术来区分真正的胎儿和工件运动信号的信号。然而,当胎儿运动信号包含大量噪声分量,装袋算法和随机森林作为其分类器将overfitted基地。ML算法包括随机森林(RF) (55),多层感知器(MLP) [58),支持向量机(SVM) [59,逻辑回归(LR) [60)分类模型。

在这项研究中,卡尔曼滤波(KF)算法的优点,时间和频率域和小波域(TFWD)特征提取方法和贝叶斯优化算法(BOA)光梯度提升机(LightGBM)模型结合识别和评估胎儿运动(KF + TFWD + BOA-LGBM)。总结了本文的主要贡献如下:(1)KF + TFWD + BOA-LGBM胎儿运动识别框架是开发有效地解决困难问题的胎儿运动信号恢复和识别精度较低的背景下持续小幅度噪声。(2)KF算法开发胎儿运动信号预处理、基于一些随机信号的统计特性,在某些最优准则最大化干扰的抑制,同时最大化胎儿运动的经济复苏信号,从而实现最优滤波的目的,解决问题的胎儿运动的光谱混合信号和干扰信号,不能分开。(3)TFWD特征提取方法识别分类模型的性能进行改进,有效解决功能冗余的问题。(4)BOA-LGBM分类模型,提高胎儿运动识别精度通过结合贝叶斯优化算法优化整体学习的hyperparameters LightGBM分类器,解决问题的模型过度拟合和计算复杂度高,单个分类器无法获得高识别性能。(5)综合性实验的设计和实施,全面展示KF的效率+ TFWD + BOA-LGBM框架与8通过比较现有最先进的胎儿运动识别方法,使用精度,精度、召回、F1-Score, AUC-ROC评价指标。

其余的部分安排如下2。我们首先介绍整个工作流框架提出了胎儿运动的识别方法,然后介绍实验数据集,胎儿运动信号预处理算法,特征提取方法和贝叶斯优化LightGBM胎儿运动识别,分别在部分3。提出优化hyperparameter算法,预处理算法,特征提取方法,优化分类算法和识别方法进行了分析,与现有的方法相比,分别在部分4。最后给出了一个简短的结论。

2。材料和方法

2.1。提出的方法

整个工作流框架提出了胎儿的运动识别方法如图1。准确的识别和评价胎儿运动解释结合卡尔曼滤波的力量,时域、频域和小波域特征提取,并使用贝叶斯优化hyperparameter调谐LightGBM模型。在提出的模型中,10倍交叉验证用于估计胎儿运动识别性能。

2.2。数据集描述

比较分析,该方法应用于一个公开的胎儿运动数据集。本文中使用的数据集是Zenodo胎儿运动的加速度数据集(61年]。数据集包含了胎儿运动的加速度计信号记录16个不同的孕妇。数据集包含信号从一个加速度计放置在孕妇的腹壁。加速度计是ADXL355从模拟设备,Inc .)、采样频率为500赫兹。

2.3。使用卡尔曼滤波预处理

在预处理阶段,原始加速度信号划分为长2.56秒时代,然后使用卡尔曼滤波(KF)预处理。KF是最小方差估计量和高斯和非高斯噪声的最佳线性估计量(62年]。

考虑到离散时间系统模型,表达了以下方程: 在哪里 美国时刻吗 ,分别 是在时刻测量吗 , 是已知的控制输入, 已知状态转移矩阵的时刻吗 , 是已知的输入矩阵, 是已知的测量矩阵, 过程噪声和 是测量噪声。状态 与估计 初始化和误差协方差如下: 在哪里 表示期望算子。

KF方程如下所示: 在哪里 表示的先验估计 , 表示的后验估计 , 表示卡尔曼增益, 表示状态的预测, 表示更新后的协方差矩阵。 状态误差协方差矩阵和测量误差协方差矩阵,分别。 通常初始化为零。

输入:一个原始加速度信号 ,状态误差协方差矩阵 ,测量误差协方差矩阵 ,和时间步
输出:优化过滤输出
1:执行使用卡尔曼滤波算法来计算最优滤波器向量
2:设置 , , , ,
3:而
4:
5:
6:
7:
8:
9:
10:
11:结束时
12:获得最优滤波器向量

当噪声序列 是高斯,不相关的,和白色,KF生成最小方差估计错误 真实的状态 对于每一个时间 考虑到测量 非高斯,KF也表现最好的线性滤波器。胎儿运动信号预处理的详细步骤使用卡尔曼滤波器算法所示1

2.4。特征提取

在这一步中,时域、频域和小波域(TFWD)预处理信号的特征提取分类模型的训练和测试。tf特征提取的详细说明如表所示1

2.5。使用BOA-LightGBM胎儿运动识别

在这个步骤中,选择最优hyperparameters LightGBM分类和识别胎儿运动使用贝叶斯优化算法(BOA)。最后,最优hyperparameter合奏获得用于构造LightGBM模型识别和评估胎儿的运动。

2.5.1。基于Hyperparameters贝叶斯优化

贝叶斯优化算法(BOA)是一种有效的全局优化方法解决黑盒功能相对高的费用(63年]。贝叶斯优化算法包括两个核心组件:(1)高斯过程(GP)是一个组合的一系列随机变量服从正态分布在一个指数集。给定一组测量 ,预测的意思 和认知的不确定性 在任何时候 同时在输入空间建模。在这里, 过程输入和吗 相应的输出时间 (2)收购函数发现最有前途的参数下模拟基于预测的意思 和认知的不确定性

医生被定义为其均值函数 及其协方差函数 ,见以下方程: 的协方差函数 ,否则称为“内核”,用于表示“平滑”的过程。如果两个点之间的距离 更接近,那么相应的过程输出 也将更紧密,实验结果更有前途。指数函数的平方(海基会)是频繁的协方差函数类型的选择,也称为径向基函数(RBF)。 在参数 是用来表明,协方差函数的长度尺度相关性降低点之间的距离的平方。在实验参数配置,观察模型还包括一个术语代表正态分布的噪声 如下: GP回归可以用来预测目标函数的值吗 在时间t+ 1的任何位置 结果显示在以下方程:

GP过程模型的帮助下,一个采集函数建立代表最有前途的设置为下一个计算。

2.5.2。光梯度提升机(LightGBM)

LightGBM是提高整体模型的新成员,由微软研究员,北京大学(53]。LightGBM是一种有效的实现梯度提高决策树(GBDT)算法(64年)通过引入Leaf-wise树增长战略基于深度限制和梯度单面抽样(高斯)和独家功能捆绑(EFB)技术。

假设存在数据服从独立的维度和相同的分布n,就像 ,每个独立的 表示一个向量的维度年代在太空中 在每个梯度迭代采样,损失函数的负梯度对模型的输出可以表示为 分配给每个叶节点的决策树模型是基于最大信息增益值的分段特征权重。GBDT,信息增益特征分割后可以通过方差描述,定义如下。

与叶节点固定表示训练样本,分割点的信息增益d从功能划分j所示如下方程: 在哪里 表明 表明 , , ,遍历每个分割节点 ,计算最大信息增益值 从功能细分,然后计算功能 分割点 ,最后把数据分成左、右subleaf节点。

排除一些数据分布不均匀的影响,戈斯更新信息增益常数乘法器设计小梯度。戈斯第一排名数据根据他们的绝对星等和选择 的例子。然后用随机抽样方法选择 例子中剩余的数据。最后,小梯度数据乘以 当更新分割节点信息增益,使算法更加关注缺乏训练样本不改变原始数据特征分布。计算信息增益由以下方程: 在哪里 表示小的子集实例和其信息增益是用来计算分割节点,它可以很大程度上减少了计算复杂度。

在这项研究中,以胎儿运动特性数据为例,我们显然解释LightGBM模型算法的训练过程2

输入:训练集
输出:LightGBM模型
1:初始化第一树表示为:
2:损失函数的负梯度作为当前决策树训练的一个近似一个新的决策树:
3:下一个模型是通过积累多个弱分类树:
4:重复上面的步骤2和3,直到模型达到停止迭代条件:
5:获得强劲的最终分类模型:

下面是一个解释过程的算法2 表示的预测结果th样本在tth迭代。 的学习功能吗tth分类树。 损失函数是用来测量之间的残余预测 和目标 停止条件的完成th迭代的培训过程。此外,明智的残值损失函数可以代替使用迭代结束条件。如果训练模型的残差小于预期损失值设置,培训过程将被停止。两个停止迭代条件可以互相交换。

2.6。性能指标

该方法评估使用精度,精度,召回,F1-Score混淆矩阵。接受者操作特征(ROC)也是一个重要的评价指标,比较了可视化曲线的真阳性和假阳性。AUC是定义为ROC曲线下的面积。AUC是一个性能指标,措施的优点一个机器学习模型。真阳性(TP)意味着真正的类的样本是一个积极的情况下,模型预测一个积极的结果。真阴性(TN)表明,真正的类的样本是一个负面的情况下,模型预测一个负面的结果。假阳性(FP)意味着真正的类的样本是负的情况下,但模型预测它是一种积极的情况。假阴性(FN)表明,真正的类的样本是一个积极的情况下,但是,模型预测它是负面的情况。

3所示。实验结果

3.1。结果和分析

在这项研究中,仿真性能评估胎儿运动识别是通过结合卡尔曼滤波的优势进行分析,以恢复胎儿运动在持续小幅度信号背景噪声污染了,时频域和小波域特征提取和贝叶斯优化算法(BOA) LightGBM模型。实验在Windows 10个人电脑的英特尔酷睿i7 - 7700 CPU @ 3.6 GHz和32 GB的RAM。该方法的仿真实验进行使用Python 3.8。我们分析了评价指标的准确性,精度,还记得,F1-Score, AUC-ROC。提出了评价指标方法比较信号预处理算法,特征提取算法,优化算法,分别和识别模型。

在这项研究中,胎儿运动识别的结果表示为0,nonfetal运动识别的结果表示为1。使用10倍交叉验证进行实验分析。之前的研究表明,十倍交叉验证有利于避免模型过度拟合。

3.2。实验结果与LightGBM模型

使用10倍交叉验证进行实验分析。首先,原始胎儿运动使用卡尔曼滤波信号预处理。其次,时域、频域和小波域特征预处理信号的提取。最后,hyperparameter LightGBM模型的价值进行评估使用网格搜索算法(GSA) [50),随机搜索算法(RSA) [51)和贝叶斯优化算法(BOA) [52]。表2表明不同的优化算法得到的最优hyperparameter值LightGBM模型。

比较不同的优化模型的性能,精度,精度,回忆,和F1-Score评价指标在使用混淆矩阵。图2显示了性能分析的准确性和F1-Score LightGBM模型的评价指标采用不同的优化算法。

为了更好地观察不同的优化技术的细节调优hyperparameters LightGBM模型,图3显示了优化的核密度估计情节hyperparametric LightGBM模型的采样使用网格搜索算法,随机搜索算法和贝叶斯优化算法。如图3,贝叶斯优化算法往往集中在hyperparameter交叉验证值,因此获得最低的损失。这演示了使用贝叶斯优化算法的优势来优化LightGBM模型hyperparameters花更少的时间来评估承诺hyperparameter值。

3显示了特定的平均值。如数据所示23和表3LightGBM模型,贝叶斯优化算法优于网格搜索算法和随机搜索算法在所有评价指标。网格搜索算法找到最佳组合的hyperparameters遍历网格中的每个路口,它的优点是有效和适合的情况下需要搜索整个参数空间和非常计算量大的缺点,面对维灾难。随机搜索算法是指hyperparameters随机搜索的搜索策略:hyperparameters的搜索范围分布,随机抽样是根据给定的分布执行的,而且,hyperparameters的搜索范围是列表,执行抽样有相等的概率在给定的列表中。随机搜索的优点是快速计算,缺点是容易错过一些重要的信息。贝叶斯优化算法逐渐学会获得更多反馈目标函数通过初始hyperparameter优化尝试。然后,调整初始搜索空间的不同部分和取样。贝叶斯优化算法的效率比网格搜索和随机搜索算法,同时避免随机搜索的影响可以错过重要的信息。

3.3。提出了预处理算法的比较分析与先前的研究

验证提出了胎儿运动的强度信号预处理算法,使用10倍交叉验证进行实验分析。的性能提出了卡尔曼滤波(KF)预处理算法与带通滤波器的带宽(瘘)算法0.5 Hz-20赫兹(42[],奇异谱分析(SSA)算法44),经验模态分解(EMD)算法,集成经验模态分解(EEMD)算法和自适应小波变换(AWT)算法(43]。现有的带通滤波器,SSA, EMD, EEMD AWT胎儿运动信号预处理算法,和拟议中的KF算法结合时域,频域和小波域特征提取方法和Bayesian-optimized LightGBM十倍交叉验证的模型进行了分析。表4显示了与之前提出的预处理算法的比较分析研究算法,EMD方法的参数类型是固有模态函数(IMF), EEMD方法的参数类型噪声标准差(STD)和固有模态函数(IMF),和AWT的参数类型技术是阈值的小波类型(WT)和(刺)。

如表所示4,提出了卡尔曼滤波预处理算法对胎儿运动信号是最好的在所有评价指标相比,现有的带通滤波器的带宽0.5 Hz-20赫兹算法,SSA算法,EMD算法,EEMD算法,和AWT算法。

的准确性提出了卡尔曼滤波算法提高了1.15%,1.64%,2.59%,4.87%,和1.38%相比,带通滤波器的带宽0.5 Hz-20赫兹算法,SSA算法,EMD算法,EEMD算法,分别和AWT算法。

带通滤波器的优点是,每一个有用的频率成分和所需的过滤频率成分占据不同的频带,干扰是通过一个合适的频率选择过滤器过滤掉获得纯净的信号。然而,有可能胎儿运动之间的频率重叠信号和干扰信号,然后带通滤波器不能有效地过滤掉干扰。EMD的优点是数据驱动和适应性,分析非线性平滑信号的能力。然而,EMD得到国际货币基金组织(IMF)组件与模态混叠。EEMD略有改进的基于EMD算法的分解效率,取得更好的结果在一维随机信号去噪领域的有效。然而,EEMD算法计算复杂度高,计算量大。SSA算法保持相同的信号趋势传统去噪算法和不会引起信号失真和衰减。相比之下,卡尔曼滤波算法估计动态系统的状态的一系列数据的测量噪声测量方差已知时。卡尔曼滤波算法具有较低的计算复杂度和计算量小,可以过滤掉持续低振幅的随机噪声在胎儿运动信号和恢复并纠正胎儿运动信号。

3.4。比较分析所提出的特征提取方法与先前的研究

验证拟议中的胎儿运动的强度信号特征提取方法,提出了胎儿的表演运动信号时域、频域和小波域(TFWD)与现有的时域特征提取方法进行比较(TD)的特征提取方法36),时间域和小波域(台币)特征提取方法(41),和时间域和频率域(TFD)特征提取方法(46]。现有的TD,台币,TFD胎儿运动信号特征提取方法和提出TFWD方法结合卡尔曼滤波算法和贝叶斯优化LightGBM模型分析了十倍交叉验证。

使用10倍交叉验证进行实验分析。图4显示的比较分析,提出了特征提取方法与现有的研究方法。表5显示十倍交叉验证结果的平均值不同的特征提取方法。

如表所示5的精度性能分析提出TFWD特征提取方法提高了1.98%,2.14%,和1.73%相比,TD特征提取方法,台币特征提取方法,分别和TFD特征提取方法。

验证的性能强度提出TFWD特征提取方法,人物5显示性能分析曲线的特性选择数量和准确性。图6显示了学习曲线对训练样本的数量和分数。如数据所示56,LightGBM模型执行越来越好随着特性和训练样本的数量增加,没有出现过度拟合。现有的TD,台币,TFD胎儿运动信号特征提取方法仍然有缺点,不考虑的一些特性,比如谱熵表示信号的不确定性和复杂性,所以不会获得理想的识别性能。相比之下,TFWD在特征提取方法更全面,充分考虑胎儿运动的关键的详细特性信号在时域、频域、小波域,这使得模型训练和分类性能更好。

3.5。比较分析所提出的优化模型与先前的研究

为了验证提出的强度优化模型,使用10倍交叉验证进行了实验分析。提出了贝叶斯优化算法的性能分析(BOA) [52]LightGBM模型与现有的网格搜索算法(GSA) [50),随机搜索算法(RSA) [51),和遗传规划算法(TPTO分类器)54)优化随机森林(RF) (55)模式和极端梯度增加(XGBoost) [56)模型,分别进行(57]。性能比较和分析通过改变优化模型的优势,结合卡尔曼滤波(KF)算法和时域、频域和小波域特征提取(TFWD)十倍交叉验证。

数据78显示的准确性和F1-Score比较分析提出了LightGBM贝叶斯优化算法模型与现有的不同的优化模型。数据910展示中华民国和Precision-Recall曲线提出了LightGBM贝叶斯优化算法的性能分析模型与现有的优化模型,分别。表6显示了评估指标的平均值不同的优化模型。

如数据所示78的准确性和F1-Score评价指标提出BOA-LGBM模型是最好的比现有的优化模型。如表所示6,提出BOA-LGBM模型的精度提高了1.81%,1.48%,1.15%,3.79%,1.97%,和1.23%相比,现有的方法像RSA-RF GSA-RF, TPTO-RF, RSA-XGBoost, GSA-XGBoost和TPTO-XGBoost分别。

射频、XGBoost LightGBM都属于整体学习,旨在提高泛化能力和鲁棒性的基本学习者通过结合多个基本的预测结果学习者。射频的优点是可以高度并行和处理very-high-dimensional数据训练,与它的缺点往往overfit在嘈杂的分类或回归问题。XGBoost改善模型的损失函数和添加一个普通术语为模型的复杂性。其优势是并行处理高维数据的能力,这在很大程度上减少了计算工作量。然而,XGBoost使用预分类,这就需要迭代前预分类的特征节点,然后遍历选择最佳分割点,算法是数据量大时更费时。相比之下,LightGBM使用直方图算法,它占据了低内存和数据分割的复杂性更低。此外,LightGBM使用深度优化和leaf-wise增长战略,选择最大的节点获得当前叶每次分割和迭代周期,防止过度拟合。

3.6。与以往的研究提出的模型的比较分析

KF + TFWD + BOA-LGBM提出分析和比较各种现有胎儿运动信号预处理、特征提取和识别方法,即,带通滤波器的带宽0.5 Hz-45赫兹预处理、时间和频域特征选择和支持向量机分类方法(带通滤波器+ TFD + SVM) (31日),带通滤波器的带宽1 Hz-20赫兹预处理和时域特征提取和随机森林分类方法(带通滤波器+ TD + RF) (33),带通滤波器的带宽0.5 Hz-20赫兹预处理和离散小波变换特征提取和模糊自适应共振理论映射分类方法(带通滤波器+ DWT +模糊ARTMAP) [37),经验模态分解预处理和时域特征提取和机器学习分类方法(EMD + TD +毫升)48),高通滤波器截止频率为0.8赫兹预处理和独立成分分析和离散小波变换特征提取和装袋用随机森林分类方法作为基分类器(高通滤波器+ ICA + DWT + RF-Bagging) (49]。ML算法包括随机森林(RF) (55),多层感知器(MLP) [58),支持向量机(SVM) [59,逻辑回归(LR) [60)分类模型。

为了验证提出的强度胎儿运动分类模型,使用10倍交叉验证进行实验分析。如数据所示1112的准确性和F1-Score评价指标,提出了KF + TFWD + BOA-LGBM模型与现有模型相比。如数据所示1314的ROC曲线和Precision-Recall曲线提出了KF + TFWD + BOA-LGBM模型与现有模型进行比较。表7显示了不同模型的评价指标的平均值与10倍交叉验证。

如表所示7,的准确性提出了KF + TFWD + BOA-LGBM胎儿运动识别模型比现有的方法如带通滤波器+ TFD +支持向量机,带通滤波器+ TD +射频带通滤波器+ DWT +模糊ARTMAP, EMD + TD +射频,EMD + TD +延时,EMD + TD + SVM, EMD + TD + LR,和高通滤波器+ ICA + DWT + RF-Bagging,提高了11.38%,2.14%,3.47%,2.06%,6.85%,6.93%,7.1%,和2.88%,分别。提出的F1-Score KF + TFWD + BOA-LGBM胎儿运动模型识别是高于现有的带通滤波器等方法+ TFD +支持向量机,带通滤波器+ TD +射频,带通滤波器+ DWT +模糊ARTMAP, EMD + TD +射频,EMD + TD +延时,EMD + TD + SVM, EMD + TD + LR,和高通滤波器+ ICA + DWT + RF-Bagging,提高了7.07%,1.42%,2.6%,1.37%,4.75%,4.61%,4.85%,和2.45%,分别。

对于现有的胎儿运动信号预处理算法。带通滤波器的优点是每个胎儿运动信号组件和所需的过滤频率成分占有不同的频带。然后,干扰是由一个合适的频率选择过滤器过滤掉获得纯净的信号。然而,带通滤波器时不能有效地过滤掉干扰有可能胎儿运动之间的光谱重叠信号和干扰信号。EMD的优点是数据驱动和适应性,分析非线性平滑信号的能力。然而,EMD得到国际货币基金组织(IMF)组件与模态混叠,从而导致错误的时频胎儿运动信号。ICA的优点让胎儿运动信号的盲源分离。然而,胎儿运动信号的分离组件的ICA算法导致振幅和源信号之间的不一致。此外,该算法可能不适用,当假设并不满意。相比之下,KF算法可以估计动态系统的状态的一系列数据的测量噪声测量方差已知时。 The Kalman filtering algorithm has the advantages of low computational complexity and small computational effort, which can filter out the random noise of continuous low amplitude in the fetal movement signal and recover and correct the fetal movement signal.

对现有胎儿运动分类算法,支持向量机分类算法使用核函数映射到高维空间,解决非线性分类问题。然而,该算法很难实现大型训练样本和敏感参数和核函数的选择。延时算法由许多相同的简单处理单元并行相结合,具有高度的并行性和良好的容错能力和联想记忆。然而,选择的问题的隐节点数的网络算法迄今仍然是一个挑战,学习速度慢和容易陷入局部极限的值。LR算法计算便宜的和能够处理大型数据使用更少的资源,但它往往underfit和分类精度较低。模糊ARTMAP属于轻量级的神经网络算法,计算价格低廉,具有良好的性能和广泛的适用性,但分类过程同意过度拟合。射频的优点是可以高度并行和处理very-high-dimensional数据训练,与它的缺点往往overfit在嘈杂的分类或回归问题。相比之下,LightGBM使用直方图算法,它占据了低内存和数据分割的复杂性更低。此外,LightGBM使用深度优化,leaf-wise增长战略,选择最大的节点获得当前叶每次分割和迭代周期,防止过度拟合。

4所示。结论

在这篇文章中,卡尔曼滤波的优点,时间和频率域和小波域和贝叶斯优化LightGBM模型相结合的准确预测和识别胎儿运动。首先,卡尔曼滤波(KF)算法用于恢复胎儿运动在持续小幅度信号背景噪声污染。其次,时域、频域和小波域(TFWD)预处理胎儿运动的特征信号提取。最后,贝叶斯优化算法用于优化LightGBM分类器来获取最优hyperparameters。在这个手稿,卡尔曼滤波结合时间和频域和小波域特征提取和贝叶斯优化LightGBM模型提供了最好的基于预测和检测识别结果。Zenodo胎儿运动性能分析的数据集,提出了KF + TFWD + BOA-LGBM模型具有更高的识别精度比现有的方法如带通滤波器+ TFD +支持向量机,带通滤波器+ TD +射频带通滤波器+ DWT +模糊ARTMAP, EMD + TD +射频,EMD + TD +延时,EMD + TD + SVM, EMD + TD + LR和高通滤波器+ ICA + DWT + RF-Bagging,提高了11.38%,2.14%,3.47%,2.06%,6.85%,6.93%,7.1%,和2.88%,分别。实验结果表明,该KF + TFWD + BOA-LGBM模型是更健壮的预测和识别胎儿运动。该方法具有重要的医学价值和广阔的应用前景的应用智能sensing-based技术临床胎儿运动检测。

数据可用性

在这项研究中使用的数据是公开的数据集,可在网上https://doi.org/10.5281/zenodo.3544631

的利益冲突

作者宣称没有利益冲突有关的出版。

作者的贡献

Sensong梁和彭Jiansheng同样这项工作。

确认

作者非常感谢中青年教师的研究项目在广西大学(身份证:2021 ky0617)。本研究项目财务支持的广西高校重点实验室培育基地系统控制与信息处理。