文摘

预测患者的血糖(BG)值可以帮助防止低血糖和高血糖事件。为此,本研究提出了一种智能合奏深度学习系统来预测BG值在15、30、60分钟预测视野(小灵通)基于历史BG值收集通过连续葡萄糖监测设备作为一个内生因素和碳水化合物摄入量和胰岛素管理信息(次)作为外生因素。尽管有许多深刻的学习算法,本研究应用五个算法,即递归神经网络(RNN),这是优化序列数据(例如,时间序列),和RNN-based算法(例如,长期短期记忆(LSTM)堆放LSTM,双向LSTM,复发和封闭的单元)。然后,遗传算法(GA)应用于五个预测模型来优化他们的重量通过整体技术和产量(输出)最后预测BG值。该模型的性能比较的自回归综合移动平均(ARIMA)模型作为基准。结果表明,该模型明显优于基线的均方根误差(RMSE)和连续葡萄糖网格误差分析。为有效29糖尿病患者多变量模型,RMSE为11.08 ( 3.19),19.25 ( 5.28),和31.30 ( 8.81 mg / DL 15、30和60分钟的PH值。当相同的数据被应用于单变量模型、RMSE为11.28 ( 3.34),19.99 ( 5.59),和33.13 ( 9.27 mg / DL 15、30和60分钟的PH值。单变量和多变量模型与基线相比显示出统计上的显著差异在5%的统计显著性水平。而不是使用一个模型用一个算法,应用GA与多个算法基于模型的每个输出被发现在改善模型性能发挥重要作用。

1。介绍

糖尿病(DM)是一种代谢性疾病,影响一些人,会造成巨大的社会经济损失(1]。有两种类型的糖尿病:1型糖尿病(T1DM)和2型糖尿病(T2DM)病人体内。T1DM也被称为胰岛素依赖型糖尿病(2),是一种自身免疫性疾病β胰岛素的胰腺细胞被破坏,不踏实。2型糖尿病也称为noninsulin-dependent糖尿病和能产生胰岛素β胰腺的细胞;然而,身体的细胞胰岛素抵抗,使它无法正常运转。糖尿病患者有急性并发症的风险,如果他们继续高血糖,如大脑营养不足,导致头痛,嗜睡,因此昏迷。因此,外部胰岛素管理是糖尿病患者的先决条件来控制他们的血糖(BG)浓度。2型糖尿病患者胰岛素抵抗也需要自我监控BG (SMBG)。在过去,它是必要的,以管理BG浓度通过finger-stick测试:通过测量其价值观出发的方法(3]。然而,由于技术的进步,连续葡萄糖监测(CGM)引入了测量BG值每隔几分钟使用设备附加到皮肤。CGM不仅促进了BG浓度控制糖尿病患者也促进了研究预测未来BG值。

BG值不是任意的,有一个可观察到的趋势。因此,鉴于BG历史有一个可行的架构,可以预测未来BG值根据过去的BG值收集通过CGM (4]。大多数以前的研究一直在进行BG使用传统统计方法预测模型。然而,由于这种方法不占BG值的非线性关系,研究主要应用机器学习模型已经进行了5- - - - - -8]。

许多机器上优于BG预测进行了研究,和大多数只用CGM读数作为输入。证明了模型,添加外源性因素,如胰岛素和碳水化合物(CHO)信息,BG预测模型作为输入执行比模型只使用CGM阅读作为输入(9]。此外,大多数研究进行T1DM,即使2型糖尿病糖尿病占超过90%的糖尿病患者。2型糖尿病和T1DM有不同的原因;因此,不同的方法应该被应用到预测BG值。

特别是,BG不同影响因素,包括压力、情感、身体活动,胰岛素和赵。因此,它不能以递归神经网络(RNN)的算法性能最好的模型,由于波动的变化(10]。在某些情况下,长期短期记忆(LSTM)模型显示精度最高,然而,另一方面,其准确性可能最少的。能够合理地解决这个问题,一个重量优化技术利用遗传算法(GA)应用于基于每个分解条件推导出健壮的模型。防止低血糖和高血糖的事件,五个RNN算法用于优化2型糖尿病合奏变量权重使用遗传算法来预测未来BG值在15日30和60分钟预测视野(小灵通)从时间序列数据和外生因素。选择那些PH值设置的原因如下:1。体内胰岛素的利率和曹吸收匹配临床阈值;2。这让它更容易比较常用的模型的结果(10- - - - - -15]。

本文的其余部分组织如下。部分2介绍了以前的研究,概述了该模型相关的背景知识。部分3描述了该模型的框架及其过程。部分4讨论了实验来评估该模型的性能。最后,部分5提出了研究的结论和对未来研究的建议。

过去,SMBG finger-stick血液测试要求每隔几小时监测糖尿病患者的BG浓度。然而,随着CGM的引入设备,测量和记录估计葡萄糖值(EGV)每隔几分钟,研究人员现在可以收集高度可利用的数据,导致BG预测模型的发展和低血糖症的早期预警系统。葡萄糖的方法估计因为CGM设备测量BG间接从间隙液体。因此,SMBG需要每隔几小时,EGV优化通过校准是必需的。因此,这些设备的准确性取决于校准算法。担忧在临床上可以取代绝对EGVs BG值是否解决Rebrin和斯泰尔16]。

2.1。背景的工作

许多研究已进行了使用收集的数据来预测未来的BG值通过CGM设备监视和控制BG浓度,防止低血糖的糖尿病患者使用警报。然而,大多数研究进行在网上或与患者T1DM [12,13,17]。文献的简要概述,请参阅奥维耶多et al。5]。

最初试图预测未来BG值基于过去BG cgm收集的数据是由布雷默和高夫(4),证明过去的BG值可以用来预测未来BG值。从那时起,各种研究已经进行使用在网上和临床数据应用传统的统计和机器学习技术。Sparacino et al。18相比一个一阶多项式模型和一阶自回归(AR)模型在28 T1DM的糖尿病患者。他们预测BG值后30到45分钟的PH值,并考虑到延迟,均方预测误差,和能量的二阶差异,采用AR模型作为评价指标。太阳et al。19]LSTM和双向LSTM-based神经网络应用于26 T1DM患者的数据,测量了均方根误差(RMSE) PH值21.07 mg / dL 30分钟和33.27 mg / dL 60分钟博士Perez-Gandia et al。20.)一个人工神经网络用于六T1DM的病人。患者携带CGM设备间歇地72 h /星期/ 4周,RMSE 10.38 mg / dL, 19.51 mg / dL, 15和29.07 mg / dL, 30和45分钟博士表明,神经网络预测模型是一个可靠的解决方案从CGM系统预测BG值。Rabby et al。21)提出了一个堆叠LSTM六T1DM的卡尔曼滤波模型患者使用一个数据集,其中包括8周为每个病人的数据;他们达到了6.45和17.24 mg / dL的RMSE 30和60分钟博士李et al。(22)提出了一种多层卷积RNN (CRNN)模型,并使用10性能评估在网上和临床数据点。拟议的RMSE CRNN模型在网上是9.38和18.87 mg / dL 30和60分钟PH值;在临床资料的情况下,均方根误差为21.07,和33.27 mg / dL 30和60分钟的PH值。

2.2。预赛

如前所述,五RNN-based算法应用于本研究在第一阶段建立BG值预测模型。一个RNN安是一个隐藏节点连接的定向边缘形成一个循环结构(23]。一个RNN网络类型结构的强度,可以接受输入和输出序列长度无关;因此,它可以灵活地构造。然而,有一个RNN的长期依赖性问题,数据之间的差距越大,学习的更大的下降。

来处理这些问题,LSTM算法解决了长期依赖问题通过增加细胞状态相同的RNN结构(24]。一堆LSTM LSTM是一个扩展的单隐层创建多个隐藏层。它扩展了神经网络的深度,这样就有可能实现更精确的结果。此外,典型的RNN结构只使用历史数据转发状态,而双向LSTM可以使用未来的信息作为一个落后的国家,解决长期依赖问题通过添加一个RNN结构细胞状态。门格勒乌算法有两个门:一个更新和重设门。它也有类似的性能和更快的计算比普通LSTM [25]。

在这项研究中,气体用于合奏重量优化过程。GA搜索方法,发现最优解通过模仿生物的进化,他们适应环境;理论上它是一种有效的方法,因为它发现全球最佳状态和处理问题,不明确的数学26]。GA的组件如下:

染色体:生物,它表示一组遗传材料,在GA,它代表一个解决方案。

吉恩:这是一段染色体的基因信息作为构建块。如果一个染色体X Y Z),里面有三个基因,每个值X,Y,Z,分别。

染色体后代:这是来自那些存在于特定的时间t。后代有上一代的遗传信息。

健身:这是染色体的特征值,表明染色体所表达的解决方案的适用性问题。

3所示。方法

本研究提出了个人深度学习BG预测模型分为两种类型根据输入变量。一个是单变量模型只使用过去的BG值作为输入,,另一个是一个多变量模型,使用过去的BG值除了赵摄入量和胰岛素管理时间信息。两种模型有相同的架构,除了输入。本研究的整体研究框架如图1

提出过程包括几个部分:数据收集、预处理、时间序列预测使用五RNN-based算法,和体重整体优化。

3.1。第一阶段:数据设置

首先,网页和数据库建立促进远程数据条目。糖尿病患者的人口统计信息,CGM读数,曹和胰岛素通过web页面信息输入和存储在数据库中。收集到的数据被转换成合适的形式以适应神经网络通过预处理。

(1) 预处理程序()
(2) 虽然countPoint < numberOfPointInFile
(3) 如果葡萄糖= =“低”
(4) 葡萄糖= 60
(5) 如果葡萄糖= = "高"
(6) 葡萄糖= 400
(7) 如果曹> 0
(8) 曹= 1
(9) 其他的
(10) 曹= 0
(11) 如果胰岛素> 0
(12) 胰岛素= 1
(13) 其他的
(14) 胰岛素= 0
(15) countPoint + +
3.2。第二阶段:预测算法

输入数据是根据lookback分裂时期之前的值的数量和时间步(即使用。、序列大小)。所有样品都设置了滑动窗口的步长。全球的描述数据如何制定适合神经网络图所示2

在图的描述术语2如下:Lookback描述了前几分钟时间BG值作为输入;预测点反映了BG值几分钟后的PH值作为目标;采样率措施病人的BG值每5分钟。

(1) 过程预测()
(2) 虽然countPoint < numberOfPointInFile
(3) / /背中提取数据
(4) 提取葡萄糖/ / predictionPoint
(5) countPoint + +
(6) 分割训练,测试
(7) 在modelList模型
(8) / / modelTraining火车模型
(9) 预测trainGlucose
(10) getModelWeights GA
(11) 在trainModelList trainModel
(12) 预测testGlucose
(13) 用trainModelWeight, testPredGlucose
(14) modelSums multiplyPredResult
(15) 计算RMSE (testGlucose modelSumsResult)

第三阶段优化,五RNN-based算法被用来产生预测BG值。每一个算法都是轻微的变种,如表所示1基于hyperparameters。所有实验hyperparameters决心通过试错的良好表现。

3.3。阶段3:Optimization-GAs

第三阶段描述了应用遗传算法的优化过程基于BG值获得的预测模型,应用每一个RNN阶段2。使用遗传算法的主要目的是优化每个RNN模型组合权重。每个RNN的输出计算健身和收益率权重的最优解的目标函数最小化RMSE。目标函数定义如下: 在哪里n的数据和数量吗的数量模型。方程的结构类似于RMSE。但是,预测值计算方程(2)。在方程(2), 模型预测价值点吗 , 是应用到模型的重量。加权的一组 优化对最小化 , 通过遗传算法推导。此外,两个约束条件建立了GA的这项工作。首先,权重的总和大于0.99,小于1。这是因为每个模型的预测BG值必须乘以权重和总结与实际BG值相比。第二,每个重量大于0.05小于0.5。设置这些限制的目的是为了防止过偏压权重。

(1) 参数(s): w-modelWeight
(2) 要求:0.05 < < 0.5、0.99 <总和(wList) < 1.00
(3) 过程GA ()
(4) 生成wLists / / initialChromosomes
(5) calculateFittness objectiveFunction
(6) 而不满足终止条件
(7) selectIndividuals wLists / /选择
(8) 重组人/ /交叉
(9) 变异个体/ /突变
(10) calulateFittness objectiveFunction
(11) wLists =个人
(12) wList / / optimalWeights返回

4所示。实证研究

在本节中,实验来评估该模型的性能进行了讨论。首先,数据集。然后,预处理数据过滤和清洗以适应神经网络。在下一步中,提出模型的有效性评估根据输入数据在两个设置。然后,最好和最差情况下基于均方根误差进行了分析。最后,残余误差分析和连续葡萄糖网格分析(CG-EGA)进行解释的原因预测最佳和最坏情况之间的性能差异。

4.1。数据描述

数据是使用G5®Dexcom公司将获得移动CGM (, Dexcom公司将Inc .)、圣地亚哥、钙、美国)从51 T2DM病人住院。发射机,G5 Dexcom公司将由一个传感器和一个移动应用程序。病人鼓励进入自己的秋,胰岛素含量,使用移动应用程序和时间。该装置测量病人的血糖阅读每5分钟4 - 7天。葡萄糖通过传感器测量附着在G5, Dexcom公司将测量葡萄糖是传送到接收者(移动应用)定期通过发射机。病人数据收集从Soonchunhyang大学天安号医院2019年7月至2021年3月。收集到的数据存储在数据库中建立基于APM (Apache-PHP-MySQL),它包括人口统计信息的2型糖尿病患者,CGM数据,胰岛素和曹信息。在csv格式存储在数据库的数据导出,用于实验。病人的信息登记在我们的研究显示在表中2

这项研究是通过SoonChunHyang大学医院天安舰机构审查委员会(SCHCA IRB协议数量:SCHCA 2019-11-048)。51岁的糖尿病患者,29日是用于多变量模型基于有效曹和胰岛素的时间信息。因此,实验继续下面的场景:(1)使用51糖尿病病人的单变量模型的结果数据;(2)比较多变量模型和单变量模型的性能使用相同的29个糖尿病病人的数据;(3)RMSE被用作模型性能评估指标,最好的和最坏情况进行比较和分析解释样本之间的差异的原因。

4.2。数据预处理

预处理的主要目的是清理数据,将它们转化为神经网络拟合的一个合适的形式。在这项研究中使用的数据在网上通过模拟生成的数据,而是临床收集的数据现实条件。因此,异常值可能存在,由于无线通信设备中的错误。外生因素直接记录病人可能是不一致的,因为他们是直接输入病人,需要适当的预处理工作。首先,CGM设备附加到本研究的患者在数据收集阶段被记录为“低”如果BG值测量小于60 mg / DL,“高”如果他们大于400 mg / DL。因此,CGM阅读(输入)和预测BG值(输出)被固定在一个60的最小值和最大值为400。第二,胰岛素和曹信息转换为0和1。胰岛素和赵被患者直接输入到应用程序的信息,导致每个病人的信息输入的差异。例如,有一些病人的情况准确记录摄入量的秋克,而另一些人则表示,他们已经采取了秋。因此,数据被转换为最低维统一的胰岛素和曹信息为每个病人发生。时间序列数据(即。, the time information of insulin and CHO) were added to the past BG values via preprocessing.

4.3。结果

这部分详细介绍了实验根据输入两类:单变量模型只使用CGM读数和多元模型添加曹和胰岛素信息(CGM)读数。模型的预测性能是评价通过考虑15日30和60分钟小灵通。提出的性能模型与ARIMA模型的基线。

在这项研究中,两个标准被用来评估该模型的性能:RMSE CG-EGA。RMSE是一种最常用的评价指标回归问题,已经在许多研究采用促进性能比较。CG-EGA评估临床BG精度预测系统(27]。这个错误分析方法量化测量的临床准确性和预测BG值。网格划分的散点图参考葡萄糖值和预测血糖值分为五个地区:a到e点区一个越近,越重要的临床结果。

4.3.1。结果数据集和CGM读数

首先,如有共有51个数据点所有的糖尿病患者,运用单变量模型的结果描述。表3介绍了模型性能(RMSE)单变量模型的训练与CGM读取数据作为输入没有外生因素。

3表明该模型表现出最好的性能和最低的标准偏差。此外,PH值在15到30分钟,有统计上的显著差异与基线相比5%统计显著性水平。

4.3.2。结果数据集和CGM读数和外生因素

在下一个场景中,一个单变量和多变量模型的性能比较29糖尿病患者如表所示4

结果在表4表明,除了RNN的多元模式模型,该模型具有最佳性能的小灵通和最低的标准偏差。有效29糖尿病患者的原始51多元模型,RMSE为11.08(3.19),19.25(5.28),和31.30(8.81)为15 mg / DL, 30和60分钟PH值,分别。当29岁的糖尿病患者的相同的数据应用于单变量模型、RMSE为11.28(3.34),19.99(5.59),和33.13(9.27)为15 mg / DL, 30和60分钟PH值,分别。的ARIMA模型被用来作为基线,RMSE为14.82(4.41),23.11(6.66),和35.67(10.23)为15 mg / DL, 30和60分钟PH值,分别。因此,单变量和多变量模型显示统计学意义模型的性能t测试的统计显著性水平为5%。此外,多变量模型的性能略优于单变量和多变量模型。细微差别的原因在节中解释精度5

4.3.3。最好/最坏情况分析

RMSE绩效评估指标的基础上,分析了最佳和最坏情况来确定差异导致性能差距最好的和最差的模型。数据34最佳和最坏情况表明,不同测试集的BG值的变化。

CG-EGA结果如图56,这表明最好的情况下都点区,最坏的情况下是分布在几个区域,包括A, B, D。

5。结论

这项工作研究高度准确的个性化BG与体重整体优化使用GA预测模型的输出RNN-based算法对住院2型糖尿病患者。而不是使用一个模型用一个算法,应用GA与多个算法基于模型的每个输出发挥重要作用被发现在改善模型性能,使模型更健壮的变化。

然而,本研究的局限性,一些不准确的数据关于外生因素,曹和胰岛素等信息,使用;这是因为在现实条件下数据测量和记录。因此,在未来的研究中,多变量模型可能表现明显好于单变量模型如果使用更严格的记录数据,即使是有限的数据量。

进一步研究包括一个更详尽的测试模型,及其与其他的方法相比(例如粗糙Autoencoder (RAE),深层信念网络(DBN),学习时间间隔的概率分布(IPDL)和颞深字典学习(DTDL)),在一个明显的大量真实数据集(28- - - - - -31日]。此外,可能需要复杂性分析系统应用于实时环境。

数据可用性

没有数据被用来支持本研究。

的利益冲突

作者宣称没有利益冲突有关的出版。

作者的贡献

Dae-Yeon金姆和Dong-Sik崔同样对本文亦有贡献。

确认

这项研究由生物与医学技术发展计划的国家研究基金会(NRF)由韩国政府(MSIT)(2019号m3e5d1a02069069),由BK21四(培养优秀大学的研究)(5199990514663),和Soonchunhyang大学研究基金。