研究文章|开放获取
Umair Muneer对接,Sukumar Letchmunan,穆阿里,Fadratul Hafinaz哈桑,一Baqir,哈菲兹Husnain Raza Sherazi, ”基于机器学习的糖尿病医疗应用程序的分类和预测”,医疗保健工程, 卷。2021年, 文章的ID9930985, 17 页面, 2021年。 https://doi.org/10.1155/2021/9930985
基于机器学习的糖尿病医疗应用程序的分类和预测
文摘
卓越的生物技术和公共医疗基础设施的发展导致了重大的生产的关键和敏感的医疗数据。通过应用智能数据分析技术,许多有趣的模式识别和发病早期检测和预防的一些致命的疾病。糖尿病是一种极度威胁生命的疾病,因为它有助于其他致命的疾病,例如、心脏、肾脏和神经损伤。本文提出了一个基于机器学习方法的分类、患糖尿病的早期识别和预测。此外,它还提供了一个IoT-based假设糖尿病监测系统对于健康和影响人来监视他的血糖(BG)水平。糖尿病的分类,三种不同的分类器,即。,随机森林(RF),多层感知器(MLP)和逻辑回归(LR)。预测分析中,我们使用了长短期记忆(LSTM)移动平均线(MA)和线性回归(LR)。实验评估,基准皮马印第安人糖尿病数据集。在分析过程中,可以看出MLP优于其他分类器86.08%的准确性和LSTM改善糖尿病的重要预测准确率达到了87.26%。此外,比较分析的方法也与现有的先进的技术,证明了该方法的适应性,在许多公共医疗应用程序。
1。介绍
公共卫生是一个基本的关心保护和防止社区健康危害疾病(1]。政府花了大量的国内生产总值(GDP)公众的福利和计划等疫苗接种有延长人们的寿命2]。然而,过去多年,有相当大的慢性和遗传疾病的出现影响公共卫生。糖尿病是一种非常危及生命的疾病,因为它有助于其他致命的疾病,例如、心脏、肾脏和神经损伤(3]。
糖尿病是一种代谢紊乱,会损害一个人的身体处理血糖,血糖。这种疾病的特点是高血糖产生的缺陷在胰岛素分泌,胰岛素的行动,或两者兼而有之(3]。绝对的胰岛素分泌不足导致1型糖尿病(近年来)。糖尿病大大传播由于胰岛素产生的病人无法使用。它被称为二型糖尿病(T2D) [4]。这两种类型正在迅速增加,但增加的比率T2D比近年来高。90 - 95%的病例T2D的糖尿病。
糖尿病的监督不足导致中风,高血压和心血管疾病(5]。为了避免和减少并发症糖尿病,BG水平的监测方法中起着重要的作用[6]。生物传感器和先进的信息和通讯技术(ICT)提供了一种有效的实时监控管理系统通过使用SMBG对糖尿病患者的健康状况(自我监测血糖)便携式设备。病人可以检查自己血液里葡萄糖水平的变化(7]。用户可以更好地理解BG变化采用CGM(连续葡萄糖监测)传感器4]。
利用发展的优势在现代传感器技术,物联网,和机器学习技术,我们提出了一个方法的分类、糖尿病的早期识别和预测。本研究的主要目的是双重的。首先,糖尿病为预定义的类别进行分类,采用三种广泛使用的分类器,即。,随机森林、多层感知器和逻辑回归。其次,对于糖尿病的预测分析,长期短期记忆(LSTM)移动平均线(MA),使用线性回归(LR)。证明该方法的有效性,皮马印第安人糖尿病是用于实验评估。中长期规划我们的结论是,在实验评价,实现了86.083%的糖尿病分类精度比其他分类器和LSTM实现糖尿病的预测的预测精度为87.26%。此外,我们还进行了比较分析,该方法与现有最先进的方法。我们建议的方法的精度结果证明在许多医疗应用的适应性。
除此之外,我们也提出了使用BLE IoT-based假设糖尿病自我监控系统(蓝牙低能量)设备和实时数据处理。后者技术利用两个应用程序:Apache卡夫卡(用于流媒体消息和数据)和MongoDB(存储数据)。利用BLE-based传感器,一个可以收集重要标志关于体重和血糖数据。这些数据将由数据处理技术在实时环境中。BLE设备将收到的所有数据由传感器和其他必要的病人的信息驻留在用户应用程序,安装在手机。传感器产生的原始数据将使用该方法生产加工结果,建议,和治疗病人的服务器端。
剩下的纸是组织如下。节2的动机,提出审查系统提出的最先进的技术和他们的缺点。它涵盖了文献综述的分类、预测和IoT-based医疗的技术。部分3强调了体育活动的作用在糖尿病预防和控制。节4,我们提出的设计和架构糖尿病分类和预测系统。部分5讨论结果和建议的方法的性能与最先进的技术。节6IoT-based假设系统提出了糖尿病的实时监控。最后,本文的结论部分7概述了未来研究的方向。
2。文献综述
在本节中,我们讨论了糖尿病的分类和预测算法预测医疗。特别是BLE-based传感器和机器学习算法的意义是强调自我监测糖尿病的医疗保健。机器学习在医疗行业中扮演一个重要组成部分,提供缓解医疗专业人员分析和诊断医疗数据(8- - - - - -12]。此外,智能医疗系统是为有需要的患者提供实时的临床护理13,14]。的功能覆盖在这项研究中比较先进的研究(表1)。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2.1。糖尿病分类为医疗保健
健康状况的诊断是一个重要的医疗专业人员和重要方面。型糖尿病的分类是最复杂的现象之一,医疗保健专业人士和由几个测试。然而,多种因素分析在诊断时有时会导致不准确的结果。因此,糖尿病的解释和分类是一个非常具有挑战性的任务。最近的技术进步,特别是机器学习技术,医疗行业是非常有益的。许多技术已经在文献中提出糖尿病分类。
Qawqzeh et al。15)提出了一个基于photoplethysmogram逻辑回归模型分析糖尿病分类。他们使用459名患者的数据进行训练和128数据点测试和验证模型。提出系统正确分类为非糖尿病患者552人,取得了92%的准确性。然而,拟议的技术不是与最先进的技术。Pethunachiyar [16]介绍了糖尿病的分类系统使用机器学习算法。主要是,他用具有不同核函数的支持向量机和糖尿病UCI机器的数据存储库。他发现支持向量机与线性函数更有效比朴素贝叶斯决策树和神经网络。然而,最先进的比较是失踪,参数选择不了。
古普塔et al。17利用朴素贝叶斯和支持向量机算法对糖尿病的分类。他们用皮马印第安人糖尿病数据集。除此之外,他们使用了一个基于特征选择的方法和k-fold交叉验证来提高模型的准确性。实验结果表明支持向量机的霸权在朴素贝叶斯模型。然而,比较先进的缺失以及实现精度。Choubey et al。18)提出了一个糖尿病分类的分类技术进行比较分析。他们用皮马印第安人收集的数据来自UCI机器学习库和本地糖尿病数据集。他们使用的演算法,再回归,径向基函数分类患者糖尿病或不是从这两个数据集。除此之外,他们用PCA和LDA特性工程,认为都是有用的分类算法对提高精度和消除不必要的功能。
Maniruzzaman et al。19机器学习范式用于分类和预测糖尿病。他们利用四个机器学习算法,即。,naive Bayes, decision tree, AdaBoost, and random forest, for diabetes classification. Also, they used three different partition protocols along with the 20 trials for better results. They used US-based National Health and Nutrition Survey data of diabetic and nondiabetic individuals and achieved promising results with the proposed technique. Ahuja et al. [20.)进行了比较分析各种机器学习的方法,即。NB, DT,延时,糖尿病的皮马人数据集分类。他们发现MLP优越与其他分类器。作者认为,中长期规划的性能可以通过微调增强工程和高效的特性。最近,Mohapatra et al。21糖尿病)还用MLP分类,取得了77.5%的精度比马的数据集,但未能执行先进的比较。中长期规划已在文献中使用了各种医疗疾病分类如心血管疾病和癌症的分类(35,36]。
2.2。预测分析的糖尿病医疗保健
糖尿病的准确分类是一项基本的一步糖尿病预防和控制医疗保健。然而,糖尿病发病早期识别更有利于控制糖尿病。在早期糖尿病识别过程似乎乏味因为病人定期去拜访医生。机器学习方法的进步已经解决了这一关键和必要的医疗问题,预测疾病。提出了一些技术文献中对于糖尿病的预测。
辛格和辛格22)提出了一个stacking-based合奏预测2型糖尿病的方法。他们使用了公开皮玛UCI机器学习数据集的存储库。四个基础学习者使用的堆积合奏,即。,SVM, decision tree, RBF SVM, and poly SVM, and trained them with the bootstrap method through cross-validation. However, variable selection is not explicitly mentioned and state-of-the-art comparison is missing.
Kumari et al。23)提出了一种软computing-based糖尿病预测系统,使用三个广泛使用监督机器学习算法以整体的方式。他们比马和乳腺癌数据集用于评估目的。他们用随机森林、逻辑回归和朴素贝叶斯和比较他们的性能最先进的个人和整体的方法,和他们的系统优于79%的准确率。
伊斯兰教等。24利用数据挖掘技术,即。,r和om forest, logistic regression, and naïve Bayes algorithm, to predict diabetes at the early or onset stage. They used 10-fold cross-validation and percentage split techniques for training purposes. They collected diabetic and nondiabetic data from 529 individuals directly from a hospital in Bangladesh through questionnaires. The experimental results show that random forest outperforms as compared to other algorithms. However, the state-of-the-art comparison is missing and achieved accuracy is not reported explicitly.
马利克et al。25)进行了比较分析,数据挖掘和机器学习技术在早期和女性发病糖尿病的预测。他们利用传统的机器学习算法提出了一种糖尿病预测框架。该系统评估在德国医院的糖尿病数据集。实证结果显示再的优越性,随机森林,比其他传统的决策树算法。
侯赛因和Naaz26)提出了一个彻底的审查机器学习模型提出了2010 - 2019年期间糖尿病的预测。他们比较传统监督机器学习模型与神经网络算法的精度和效率。他们使用马修斯相关系数为评价目的和观察朴素贝叶斯和随机森林的霸权相对于其他算法。
2.3。实时IoT-Based医疗数据的处理
实时糖尿病的预测是一项复杂的任务。新兴的传感器在医疗处理致命的疾病铺平了道路37]。一些技术已经在文献中提出分类和预测糖尿病。Acciaroli et al。4暴露两准确米测量糖尿病血液减少了错误率。此外,这些商业版本的葡萄糖测定仪是Accu-Chek误差和CareSens 4.0%的误差为6.5%。白金汉et al。38)描述的准确性链接CGM校准传感器。Alfian et al。27)发现,美国食品和药物管理局已经接受了CGM葡萄糖传感器监测在不同的趋势和模式。此外,在一个特定的时间,一个葡萄糖阅读不应该用于分析胰岛素的数量在一个不接受。罗德里格斯et al。28)提出了一个结构设计包含本地网关作为一个智能手机,云系统,传感器的先进的管理糖尿病。
Filippoupolitis et al。29日)计划行动承认一个系统使用蓝牙低能量(bie)信号灯和smartwatches。Mokhtari称等人认为技术与祝福活动标签和居民本地化30.]。Gentili et al。31日)与另一个应用程序被称为蓝色BLE使用声音,可以揭示传感器设备的多媒体通信的概率和语音流媒体服务。苏亚雷斯et al。32预计一个空气质量监测系统基于BLE装置暴露与环境的应用程序。它旨在定义潜在的应对政策和研究变量之间是相互关联的社会层面因素和糖尿病患病率(33,34]。
王等人。39)给最新的大意BLE技术医疗系统基于一种可佩带的传感器。他们建议低功率通信传感器技术如绒设备可以让它可行的可穿戴的医疗保健系统,因为它可以使用没有位置限制和轻。此外,bie是第一无线技术为医疗设备通信的形式可穿戴设备与低功率满足预期的操作需求,直接与细胞通讯,安全的数据传输,互操作性,电子兼容性,和互联网通信。Rachim和涌40)建议一个传输系统,利用不足的权力观察心脏的活动通过心电图仪信号使用BLE设备数据传输采集的臂章传感器和智能手机。
莫拉等人预计分散结构使用物联网模型检查人类生物医学信号生成报告使用BLE传感器设备(41]。Cappon et al。42]探索CGM的研究可穿戴传感器的原型和目前使用的商业版本的特性。Arsand et al。43)提供最简单的方法,监测血糖,体育活动,胰岛素注射,并使用智能手机和smartwatches营养信息。白痴et al。44)观察到的性能智能手机用于医学领域。李和柳(45)预期结构使用PDA(个人数字助理)管理糖尿病病人的条件更好。它也可以用来发送信息血压、BG水平,食品消费,和锻炼计划的糖尿病患者,给治疗通过监测身体活动的方向,食品消费,规定数量和胰岛素。
罗德里格斯et al。28)建议智能手机应用程序,可用于接收来自传感器的数据使用一个自动。Rodriguez-Rodriguez et al。46)建议检查病人的血糖水平和心率使用传感器会产生巨大的数据,并分析大数据可以用来解决这个问题。
3所示。体育活动在预防和控制糖尿病
一般来说,体育运动是第一个预防和控制策略由医疗专业人员建议糖尿病或前驱糖尿病的病人47]。在饮食和医学、运动是糖尿病的基本组件,心血管疾病、肥胖、和生活方式的救助计划。尽管如此,处理所有的致命的疾病有很大的经济负担。然而,糖尿病成为毁灭性的问题对于一个国家的卫生部门和经济的世纪。
最近,国际糖尿病预防和控制糖尿病联合会预测,可以影响全世界超过3.66亿人(49]。美国疾病控制和预防中心警告政府,糖尿病会影响超过2900万人(50]。虽然这些令人担忧的数字不断增加,他们将全球经济负担。因此,研究人员和全球卫生保健专业人士研究和提出的指导方针,预防和控制这种威胁生命的疾病。佐藤(51)提出了一个彻底的调查日本的运动处方对糖尿病患者的重要性。他建议我们应该避免久坐,身体活动应该执行每30分钟。科文et al。47)强调规律的运动控制和预防2型糖尿病。特别是,他们研究了糖尿病患者的代谢对组织的影响,发现非常重要的改善个人执行定期锻炼。莫泽et al。48)也强调定期锻炼的重要性在改善身体的各种器官的功能,如图1。
杨et al。52)关注糖尿病运动疗法,在治疗中起着重要作用及其相关的副作用。具体地说,他们发现了细胞因子使小说深入了解糖尿病的控制,但序列仍在研究中。金和全53)提出了一个系统的概述不同运动对代谢的影响改善糖尿病年轻个体。他们指出,一些研究报道的意义运动对胰岛素,英国石油(BP)和BG水平提高。然而,这些研究提到了β细胞改善。因此,许多挑战坚持预防和控制糖尿病,需要严重关注全世界的研究人员。
4所示。提出了医疗保健糖尿病分类和预测系统
提出糖尿病分类和预测系统利用不同的机器学习算法。首先,对糖尿病进行分类,我们利用逻辑回归,随机森林,和延时。值得注意的是,我们调整MLP分类由于其承诺在医疗保健性能,特别是在糖尿病预测(20.,21,35,36]。中长期规划提出的体系结构和算法如图2和算法1,分别。
第二,我们实现了三个糖尿病预测广泛使用的机器学习算法,即。移动平均线,线性回归,LSTM。主要是,我们优化LSTM犯罪预测由于其卓越的性能在实际应用中,特别是在医疗保健(53]。该算法的实现细节如下。
4.1。糖尿病分类技术
对于糖尿病的分类,我们调整三个广泛使用的最先进的技术。主要执行比较分析中提出的技术分类个体在糖尿病的类别。提出了糖尿病的细节技术如下。
以下4.4.1。逻辑回归
适当的使用逻辑回归,当因变量是二进制54),对个体进行分类在1型或2型糖尿病。此外,用于预测分析和解释因变量之间的关系和一个或多个独立的变量,如方程所示(1)。因此,我们使用了s形的成本函数为假设函数((x))。目标是最小化代价函数 。它总是导致分类二班上课1或者一个例子。
4.1.2。随机森林(RF)
顾名思义,它是一个集合的模型作为一个整体运作。射频背后的关键思想是群众的智慧,每一个模型预测结果,最后,绝大多数获胜。它已经在文献中用于糖尿病预测和发现是有效的(55]。给定一组训练的例子X=x1,x2、…x米和各自的目标Y=y1,y2、…y米,射频分类器迭代B *树通过选择样本与更换配件的训练例子。训练算法由以下步骤中描述方程(2)。(我)为b= 1…B、样品与更换n训练的例子X和Y。(2)训练一个分类树fb在Xb和Yb。
4.1.3。多层感知器
糖尿病的分类,我们在实验中已调整多层感知器的设置。这是一个网络,多个层配合的分类方法,如图2。这个模型的构建块是感知器,这是一个输入和权值的线性组合。我们使用乙状结肠单位作为激活函数算法所示1。该算法包括三个主要步骤。首先,初始化权重计算和输出在输出层( )使用乙状结肠激活函数。其次,计算误差在隐藏层( )所有隐藏的单位。最后,在落后的方式,所有网络权重( )更新来减少网络错误。算法中概述的详细过程1糖尿病的分类。
|
图2显示了使用多层感知器分类模型体系结构,其中8个神经元在输入层,因为我们有八个不同的变量。中间一层隐层的权值和输入将使用乙状结肠单位计算。最后,将计算结果输出层。反向传播用于更新权重,这样可以最小化错误预测类标签。为了简单起见,只显示一个隐层的体系结构,这在现实中密集得多。
输入数据从输入层计算隐藏层的输入值和权重的初始化。每单位中间层称为隐藏层的净输入,应用激活函数“乙状结肠”,将大量的数据转换为一个较小的范围在0和1之间。每一个中间层的计算功能。同一应用程序在输出层,导致对糖尿病的预测结果。
4.2。糖尿病的预测
它更有利于识别比治愈糖尿病的早期症状后被诊断。因此,在这项研究中,一个糖尿病的预测系统,提出了利用三个先进的机器学习算法,并进行比较分析。提出的方法的细节如下。
4.2.1。准备移动平均线
预测糖尿病,我们使用移动平均线与实验装置由于其有效性在糖尿病预测儿童56]。它是基于计算分析数据点通过创建一系列的平均随机数据的子集。移动平均算法是基于“前转”机制。它排除了第一个数字系列,包括下一个值的数据集,如方程所示(3)。输入值计算了平均(PSM)火车数据在特定的时间戳P米+P米P +…米−(n−1)。该算法使用过去的观测数据作为输入,并预测未来事件。
4.2.2。线性回归
第二,线性回归模型应用于皮马印第安人相同的数据集实验设置。我们使用这种方法来建模一个因变量之间的关系,也就是说,结果在我们的案例中,一个或多个自变量。自动变量响应影响很大在目标/因变量,见方程(4)。我们使用一个简化的假设和成本函数为多元线性回归,在我们的数据集(有八个不同的变量57]。我们选择一个非常简化的假设函数( )。目标是最小化代价函数通过选择合适的重量( )参数和最小平方误差的总和(SSE)。
4.2.3。长时间的短期记忆
对于糖尿病的预测,我们有校准这个漫长的短期记忆算法与我们的实验装置。该方法优于相比其他先进的技术实现,如表所示2。LSTM基于递归神经网络(RNN)的架构,并反馈连接,使其适合糖尿病预测(58]。LSTM主要由一个细胞,保持门,写门,和一个输出门,如图3。使用LSTM这个问题背后的关键是细胞记得模式在很长一段时间里,和三个门户网站帮助调节流量的系统的信息。介绍了算法的细节2。
|
||||||||||||||||||||||||||||
|
算法的输入八个属性表3,从健康和糖尿病患者测量。拟议中的LSTM-based糖尿病预测算法与80%的数据训练,剩下的20%是用于测试。我们调整预测模型通过使用不同数量的LSTM单位细胞状态。这种微调有助于识别更加突出特征的数据集。这些特性将被保存在细胞的状态保持LSTM门,将得到更多的weightage因为他们提供更多的见解来预测BG水平。之后,我们更新了网络权重的点态细胞的状态和只通过那些BG预测的关键属性。在这个阶段,我们捕捉到糖尿病参数和输出变量之间的依赖关系。最后,输出门更新细胞状态和输出/前锋只有那些可以映射的变量有效地对结果变量。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
糖尿病预测算法包括三个基本步骤。首先,初始化权重和乙状结肠单元用于忘记/保持门决定哪些信息应该保留从以往和当前输入( )。输入/写门需要保持门的必要的信息和使用乙状结肠单位输出值在0和1之间。此外,晒黑h单位是用于更新细胞状态Ct并结合输出更新旧的细胞状态新细胞状态。
最后,再次输入输出门口处理和乙状结肠单元应用于决定哪些细胞状态应该输出。同时,谭h应用于传入细胞状态将输出1和−1之间。如果门的输出是1,那么记忆细胞仍然是相关所需的生产和应该保持对未来的结果。如果门的输出为0,记忆细胞是不合适的,所以它应该被删除。写的大门,合适的模式和类型的信息将决定写入存储单元。提出LSTM模型预测BG水平(ht)作为输出基于病人的现有BG水平(Xt)。
5。实验研究
提出了糖尿病分类和预测算法评估公开可用的皮马印第安人糖尿病数据集(https://www.niddk.nih.gov/health-information/diabetes)。此外,与最先进的算法进行比较分析。实验结果显示该算法至高无上的地位比最先进的算法。数据集的详细信息、绩效衡量和比较分析执行将在以下小节中描述。
5.1。数据集
本研究使用皮马印第安人糖尿病(PID)数据集来自国家糖尿病和肾脏疾病研究所中心(59]。使用这个数据集的主要目标是构建一个智能模型,可以预测一个人是否患有糖尿病,使用一些测量中包含的数据集。有八个医疗数据集预测变量和目标变量之一。糖尿病的分类和预测是一个二元分类问题。变量的详细信息如表所示3。
768条记录的数据集是由不同的健康和糖尿病女性患者年龄大于21,如图4。特征值分布如图5。目标变量的结果只包含两个值,0和1。使用这个数据集的主要目的是为了预测糖尿病诊断。用户是否有机会在未来四年的糖尿病妇女属于皮马印第安人。数据集共有八个变量:葡萄糖耐量,不。的妊娠、体重指数、血压、年龄、糖尿病胰岛素,血统的功能。所有八个属性表所示3用于分类模型的训练数据集在这工作。
5.2。实验结果和讨论
本文比较了提出了糖尿病的分类和预测系统与先进的技术使用相同的皮马印第安人数据集上实验装置。下面突出显示的性能测量和结果达到用于分类和预测,并与基线比较分析研究。
5.2.1。性能指标
三个广泛使用先进的性能措施(召回、精度和准确性)是用来评估提出技术的性能,如表所示4。TP显示一个人没有糖尿病和确认为非糖尿病的病人,和TN显示了糖尿病病人正确标识为糖尿病患者。FN显示病人糖尿病但预计作为一个健康的人。此外,FP显示病人是一个健康的人但预测糖尿病患者。该算法利用10倍交叉验证培训和测试的分类和预测模型。
|
||||||||||||||
糖尿病的预测,两种最常用的性能措施意味着相关系数(r/皮尔森R)和均方根误差(RMSE),如表所示5。R主要用于衡量两个变量之间的线性相关的力量。一个变量是实际值,另一个变量的预测值。RMSE生成一个提示的总体估计的正确性。关联可以有三个值:0没有关系,1为正相关,−1负相关。RMSE显示实际值和预测值之间的区别。
|
||||||||||||||
5.2.2。达到糖尿病的结果分类技术
糖尿病分类、三最先进的皮马人数据集分类器进行评估。获得的结果说明中长期规划调整算法精度最高的86.083%,而最先进的系统,如表所示2。
很明显的结果,我们提出的模型校准算法可用于糖尿病的有效分类。提出的分类方法也可以在未来有益与我们提出的假设的系统。数据的重量尺度、血压监测和血液glucometer将通过传感器设备如祝福和收集用户输入的人口数据(例如,出生日期、身高和年龄)。中长期规划提出算法精度优于86.6%,85.1%的回忆,和86.083%的准确率,如图6。这些结果与提出假设的系统优秀的决策来确定病人糖尿病,近年来或T2D。
我们还探讨了安迪Choens的研究中使用的数据集(27]。这个数据集包含只有一个病人的记录。每五分钟记录的信息。数据的收集是由使用一个传感器设备(CGM设备)。这个设备允许病人存储信息BG每五分钟。所以,记录数据通过使用这个设备在大量。数据集是有限的,大多数数据噪声,会影响该系统的准确性,我们忽略了它。
5.2.3。结果糖尿病预测技术来实现的
对于糖尿病的预测,我们实现了三个最先进的算法,即。线性回归,移动平均线,LSTM。值得注意的是,我们调整LSTM与其他算法相比,其性能。很明显从图7和表6LSTM超过相比其他算法在本研究中实现。
|
||||||||||||||||||||||||||||
表2显示了性能和RMSE值预测模型r评价措施。建议调整LSTM生产精度最高,87.26%,而线性回归和移动平均线。我们可以看到在表6使用LSTM相关系数值是0.999,0.071−线性回归,0.710,移动平均线,如图7。
5.2.4。与基线比较该方法的研究
不同基线研究已经实施并与该系统验证的性能提出了糖尿病的分类和预测系统。主要是,我们专注于那些使用皮马人数据集的研究。
首先,我们比较先进的糖尿病分类技术和拟议的技术。所有基线技术(17- - - - - -19)使用皮马人数据集和评价措施用于这项研究。特别是,作者比较朴素贝叶斯(17通过回归),PCA_CVR(分类)(18),和支持向量机(19糖尿病分类)和不同的机器学习技术。然而,提出调整MLP-based糖尿病分类技术表现与基线相比研究,如图8。
几次糖尿病预测也取得了文学在现实生活中由于它的重要性。对于这种比较,我们选择了最新和最先进的技术。最近我们比较建议的系统性能和先进的系统(60- - - - - -65年),如图9和表7。该方法优于比最先进的系统的准确性达87.26%,所有的系统评价PID相比同样的实验装置。
6。提出假设IoT-Based糖尿病医疗监测系统
这项研究还提出了假设的体系结构为糖尿病患者糖尿病监测系统。提出的假设的系统将使病人控制、监视和管理他们的慢性病在家中一个更好的方法。监控系统将存储健康活动和创建患者之间的交互,智能手机、传感器医疗设备、web服务器、和医疗团队提供一个平台让无线通信设备,如图10。提出了医疗监控系统的中心主题是来自传感器的数据的收集使用无线设备和传输到远程服务器进行糖尿病的诊断和治疗。以知识为基础的数据存储。基于规则的程序将被应用的建议和治疗糖尿病,告知病人对他目前的健康状况,预测,建议未来的BG的变化。
首先,有关病人健康必不可少的数据将被收集祝福等传感器的无线设备。数据包括体重、血压、血糖、和心跳,以及一些人口统计信息,如年龄、性别、姓名、为维基百科和(社会安全号码)。一些信息需要在应用程序安装在用户的移动和传感器数据。完成所有数据的应用程序将被转移到实时数据处理系统。另一方面,聚合数据将存储在MongoDB未来处理。分析和引人注意的技术执行从知识库中提取规则治疗并建议用户。结果和治疗程序将发送到监控系统,最后,用户可以通过与他们的交流输出的android手机。最后,病人会知道糖尿病的健康状况和风险预测的基础上,从历史数据转移到他们的应用程序和存储数据的用户。
6.1。工具和技术实施的假设的医疗保健系统
拟议的结构设计为假想的实时处理和监测糖尿病如图11。数据从用户的移动将传播的JavaScript对象表示法(JSON)格式的应用程序编程接口(API)在任何语言。在这个阶段产生的数据将以消息的形式,然后转移到卡夫卡应用程序(27]。卡夫卡将存储的所有数据和信息并交付所需的数据和处理输出端点可以是一个web服务器,监控系统,或者永久存储的数据库。在卡夫卡,应用程序数据存储在不同的经纪人,这可能会导致延迟的问题。因此,在系统架构中,是至关重要的考虑处理传感器的读数接近数据获得的地方,例如,在智能手机上。延迟的问题可以得到解决,通过将传感器接近的地方,比如智能手机数据发送和接收地点。
这种包容会使整体网络架构兼容的新兴边缘和雾计算范例,其重要性在关键基础设施如医院获得动力。有必要考虑边缘和雾发送和接收数据时计算范式从智能手机到增加假设系统的性能。边缘计算利用传感器和移动设备来处理,计算,云计算和数据存储在本地,而不是。此外,雾计算地方资源附近数据源例如网关改善延迟问题[9]。
实时将使用Apache卡夫卡作为消息的投递代理平台,允许容错、高吞吐量和低延迟出版。生命体征的患者采集的数据放置使用JSON格式然后传播使用无线设备的帮助下一个android应用程序的HTTP REST API一起在远程服务器的设计(28]。此外,节点。js对网页设计将被用作一个REST API来收集传感器数据。卡夫卡应用程序将接收它以流的形式记录。
传感器数据来自卡夫卡应用程序不断生成并存储在服务器上。在拟议的系统中,MongoDB NoSQL数据库将用于数据存储由于其处理效率和处理现实世界的数据29日]。存储糖尿病病人数据可以输入到我们提出糖尿病分类和预测技术来得到有用的见解。
7所示。结论
在这篇文章中,我们已经讨论了一种方法来帮助医疗保健领域。本研究的主要目的是双重的。首先,我们提出了一个MLP-based糖尿病分类算法和基于深度学习LSTM糖尿病的预测。其次,我们提出了一个IOT-based假设实时糖尿病监测系统。该理论糖尿病监测系统将使用智能手机,BLE-based传感器设备和基于机器学习的方法,在实时数据处理环境中预测BG水平和糖尿病。该系统的主要目标是帮助用户使用BLE-based监控他们的生命体征传感器设备的帮助下他们的智能手机。
此外,该模型将帮助用户发现患糖尿病的风险在一个非常早期的阶段,帮助他们获得未来的预测BG水平增加。糖尿病的分类和预测、延时和LSTM微调。拟议的方法评估的皮马印第安人糖尿病数据集。两种方法比较先进的方法和表现的准确性达86.083%和87.26%,分别。
作为未来的工作,我们计划实施的android应用程序提出假设的糖尿病监测系统提出了分类和预测方法。遗传算法还可以探索和提出预测更好的监督机制(24,64年,66年- - - - - -71年]。
数据可用性
使用的数据来支持本研究的结果包括在本文中。
的利益冲突
作者宣称没有利益冲突有关这篇文章的出版。
确认
这项工作是由计算机科学学院马来西亚理科大学,马来西亚槟城。
引用
- 世界卫生组织,在身体活动2018 - 2030全球行动计划:更积极的人,建设一个更健康的世界瑞士日内瓦,世界卫生组织,2019年。
- r·威廉姆斯,s . Karuranga b Malanda et al .,“全球和区域与糖尿病有关的卫生支出的估计和预测:源于国际糖尿病联合会糖尿病阿特拉斯,”糖尿病的研究和临床实践文章ID 108072卷,162年,2020年。视图:谷歌学术搜索
- 美国糖尿病协会”,糖尿病的诊断和分类。”糖尿病护理,37卷,不。补充1,S81-S90, 2014页。视图:出版商的网站|谷歌学术搜索
- g . Acciaroli m . Vettoretti a Facchinetti, g . Sparacino“微创连续葡萄糖监测传感器的校准:最先进的和当前的观点,“生物传感器,8卷,不。1,2018。视图:出版商的网站|谷歌学术搜索
- n . n .桶g . Arunagirinatha s . k . Munshi和j·m·Pappachan“糖尿病和中风:临床更新”,世界糖尿病杂志》,8卷,不。6、2017。视图:出版商的网站|谷歌学术搜索
- m·j·戴维斯,D . a . D 'Alessio j . Fradkin et al .,”2018年2型糖尿病,高血糖症的管理。达成共识报告由美国糖尿病协会(ada)和欧洲糖尿病研究协会(2),“Diabetologia,卷61,不。12日,第2498 - 2461页,2018年。视图:出版商的网站|谷歌学术搜索
- Bruen d·c·德莱尼,l . Florea, d .钻石,“糖尿病的葡萄糖传感监测:最近的进展”,传感器,17卷,不。8,2017。视图:出版商的网站|谷歌学术搜索
- Wadhwa和k·巴布,“人工智能在卫生保健:糖尿病使用机器学习算法,预测分析”国际会议进行计算机科学及其应用施普林格,页354 - 366年,卡利亚里,意大利,2020年7月。视图:出版商的网站|谷歌学术搜索
- p·泰德斯和美国Sciancalepore边缘和雾在关键基础设施:计算分析,安全威胁,和研究的挑战,”进行2019年IEEE欧洲安全和隐私研讨会研讨会上(EuroS&PW)IEEE,页1 - 10,斯德哥尔摩,瑞典,2019年6月。视图:谷歌学术搜索
- m·v·d·夏尔a . m .阿拉a Floto et al .,“人工智能和机器学习如何帮助卫生保健系统响应COVID-19,”机器学习,卷110,不。1、1 - 14,2021页。视图:出版商的网站|谷歌学术搜索
- m·h·阿诺德”梳理出人工智能在医学:一个道德批判人工智能和机器学习在医学上,“生命伦理杂志的调查,18卷,不。1,第139 - 121页,2021。视图:出版商的网站|谷歌学术搜索
- 金和j .嗯,“基于人工智能的电子医疗解决方案,”计算机科学的进步和无处不在的计算施普林格,新加坡,2021年。视图:出版商的网站|谷歌学术搜索
- f·阿里,s e . Sappagh s·m·r·伊斯兰教et al。”一个智能医疗监控框架使用可穿戴传感器和社交网络数据,”未来一代计算机系统卷。114年,23-43,2021页。视图:出版商的网站|谷歌学术搜索
- m . Saji m . bloom a . Rajasekaran r·a·库马尔a . Suyampulingam n p·克利须那神,“Iot-based智能医疗模块”先进的智能系统和计算施普林格,新加坡,2021年。视图:出版商的网站|谷歌学术搜索
- y . k . Qawqzeh a . s . Bajahzar m . Jemmali m . m . Otoom和a . Thaljaoui“糖尿病分类使用photoplethysmogram (PPG)波形分析:逻辑回归建模、”生物医学研究的国际卷,2020篇文章ID 3764653, 6页,2020。视图:出版商的网站|谷歌学术搜索
- g . a . Pethunachiyar“糖尿病患者使用基于内核的支持向量机分类,”2020年国际会议上进行计算机通信和信息(ICCCI)哥印拜陀,页1 - 4,IEEE,印度,2020年1月。视图:谷歌学术搜索
- 古普塔,h . k . Verma和d . Bhardwaj“糖尿病使用朴素贝叶斯和支持向量机分类技术,”业务管理和系统工程施普林格,新加坡,2021年。视图:出版商的网站|谷歌学术搜索
- d . k . Choubey m·库马尔诉舒克拉,s .特里帕西和v . k . Dhandhania”分类方法的比较分析PCA和LDA糖尿病,”目前糖尿病的评论,16卷,不。8,833 - 850年,2020页。视图:出版商的网站|谷歌学术搜索
- m . Maniruzzaman m·j·拉赫曼b . Ahammed和m·m·阿贝丁“糖尿病疾病的分类和预测使用机器学习的范例,”健康信息科学和系统,8卷,不。1、7 - 14,2020页。视图:出版商的网站|谷歌学术搜索
- r . Ahuja s c·沙玛,m·阿里“糖尿病疾病预测模型基于分类算法,”新兴技术在计算的史册,3卷,不。3,44-52,2019页。视图:出版商的网站|谷歌学术搜索
- s . k . Mohapatra j·k·斯温,m·n·莫汉蒂“使用多层感知器检测糖尿病,”国际会议进行智能计算和应用施普林格,页109 - 116年,加济阿巴德,印度,2019年12月。视图:出版商的网站|谷歌学术搜索
- 辛格n和p·辛格Stacking-based多目标进化预测糖尿病、整体框架”生物控制论和生物医学工程,40卷,不。1、22页,2020页。视图:出版商的网站|谷歌学术搜索
- s . Kumari d·库马尔·m·米塔尔,”一个方法的分类和预测糖尿病使用软分类器投票,”国际期刊的认知计算在工程,2卷,2021年。视图:出版商的网站|谷歌学术搜索
- m·m·f·伊斯兰教,r . Ferdousi s拉赫曼和h . y . Bushra”可能性的预测糖尿病早期使用数据挖掘技术,”计算机视觉和机器智能在医学图像分析施普林格,页113 - 125年,新加坡,2020年。视图:出版商的网站|谷歌学术搜索
- 马利克,s . Harous h·e·赛义德,“机器学习算法的比较分析女性糖尿病的早期预测,”程序的复杂系统的建模和实现国际研讨会施普林格,页95 - 106年,方案,阿尔及利亚,2020年10月。视图:出版商的网站|谷歌学术搜索
- a·侯赛因和美国Naaz预测糖尿病:各种机器学习模型的比较研究”进行创新国际会议上的计算和通信施普林格,页103 - 115年,新德里,印度,2021年1月。视图:出版商的网站|谷歌学术搜索
- g . Alfian m . Syafrudin m . Ijaz m . Syaekhoni n . Fitriyani和j . Rhee“个性化医疗监测系统对糖尿病患者利用ble-based传感器和实时数据处理,”传感器,18卷,不。7日,2018年。视图:出版商的网站|谷歌学术搜索
- i r·罗德里格斯·m·A。z Izquierdo, j . v . Rodriguez”向一线平台1型糖尿病管理,“应用科学,8卷,不。4、2018。视图:出版商的网站|谷歌学术搜索
- a . Filippoupolitis w . Oliff b Takand, g . Vachon”扩展地理位置信息的活动在室内环境中识别使用现成的智能手表技术和ble灯塔,”传感器,17卷,不。6、2017。视图:出版商的网站|谷歌学术搜索
- g . Mokhtari称a . a .穆贾达姆问:张先生,和m . Karunanithi”Multi-residential活动标签与可穿戴的标签使用绒技术,智能家居”传感器,18卷,不。3,p。908年,2018年。视图:出版商的网站|谷歌学术搜索
- m . Gentili r . Sannino, m . Petracca”Bluevoice:语音通信在蓝牙低能量在物联网情况下,“计算机通信卷,89 - 90年51-59,2016页。视图:出版商的网站|谷歌学术搜索
- j . i .苏亚雷斯·阿罗约j . Lozano j·l·埃雷罗和m·帕迪拉“蓝牙气体传感模块结合智能手机对于空气质量监测,“光化层卷,205年,第626 - 618页,2018年。视图:谷歌学术搜索
- s a·摩根·m·m·阿里,a . a . Channon et al .,“糖尿病及其并发症的患病率和关联四个海湾合作委员会国家:证据来自世界健康调查加上,“流行病学和社区卫生杂志》上,卷73,不。7,630 - 636年,2019页。视图:出版商的网站|谷歌学术搜索
- s . Majumder y Elloumi, m .议长r . Kachouri和n . Kehtarnavaz“深上优于智能手机应用实时检测五个阶段的糖尿病性视网膜病变,”程序的实时图像处理和深度学习2020,卷11401,p . 1140106,国际社会对于光学和光子学,2020年4月。视图:谷歌学术搜索
- r . Valupadasu和b . r . r . Chunduri自动心脏疾病用mlp分类算法”进行预测和系统健康管理会议(PHM-Paris)IEEE,页253 - 257年,巴黎,法国,2019年5月。视图:出版商的网站|谷歌学术搜索
- r·麦科伊蒂,d . Chen c . Scott a . Miller和m . CelineN。切,“乳腺癌分类使用深转移学习结构化的医疗数据,”IEEE国际会议上的数据进行科学和先进的分析方法(DSAA)IEEE,页277 - 286年,美国华盛顿特区。,2019年10月。视图:出版商的网站|谷歌学术搜索
- 即Baik”回应:投影韩国成年人的糖尿病患病率在2030年利用国家数据的风险因素识别(糖尿病金属底座J 2019; 43:90-6),“糖尿病与代谢杂志,43卷,不。2、244 - 245年,2019页。视图:出版商的网站|谷歌学术搜索
- b . a .白金汉j . Uitto c . Sandborg et al。”Scleroderma-like胰岛素依赖型糖尿病的变化:临床和生化研究,“糖尿病护理,7卷,不。2、163 - 169年,1984页。视图:出版商的网站|谷歌学术搜索
- s。王”,ble-based行人导航系统为汽车寻找在室内停车场,”传感器,18卷,不。5,2018。视图:出版商的网站|谷歌学术搜索
- v . p . Rachim w . y .涌,“Wearable-band类型可见近红外光学生物传感器为非侵入式血糖监测、”传感器和执行器B:化学卷,286年,第180 - 173页,2019年。视图:出版商的网站|谷歌学术搜索
- h·莫拉·d·吉尔,r . m . Terol j . Azorin和j·西曼斯基,“一个iot-based计算框架,用于医疗监测在移动环境中,“传感器,17卷,不。10,2302年,页2017。视图:出版商的网站|谷歌学术搜索
- g . Cappon g . Acciaroli m . Vettoretti a . Facchinetti g . Sparacino,“可穿戴连续葡萄糖监测传感器:糖尿病治疗的革命,”电子产品》第六卷,没有。3,2017。视图:出版商的网站|谷歌学术搜索
- 大肠Arsand: Tatara, g . Hartvigsen“无线和移动技术改善糖尿病自我管理”手册的研究流动和计算:进化技术和无处不在的影响IGI全球,页136 - 156年,PA,美国,2011年。视图:谷歌学术搜索
- r . m .白痴,卢克,大肠Casilari”智能手机的功能来执行作为医疗无线个人区域网络通信网关,”传感器,14卷,不。1,第594 - 575页,2014。视图:出版商的网站|谷歌学术搜索
- k·h·李和k . t .柳”的方法和提供的血糖管理器信息,“美国专利,8卷,2015年。视图:谷歌学术搜索
- a . e . Rodriguez-Rodriguez j . Trinanes大肠Porrini et al .,“葡萄糖稳态变化和胰腺β细胞增殖在tacrolimus-induced糖尿病转向环孢菌素后,“Nefrologia,35卷,不。3、264 - 272年,2015页。视图:出版商的网站|谷歌学术搜索
- j·p·科文,j .麻袋,s . Nieuwoudt”运动的重要作用在2型糖尿病患者的管理,“克利夫兰诊所医学杂志》上,卷84,不。7 5 1,p . S15, 2017年。视图:出版商的网站|谷歌学术搜索
- o .莫泽m . l . Eckstein d . j .西方,n .他,:h . Sourij p·霍夫曼,“1型糖尿病和体育锻炼:运动(向前)作为辅助治疗,“当前的药物设计,26卷,不。9日,第957 - 946页,2020年。视图:出版商的网站|谷歌学术搜索
- a·g·Ampofo比比Emmanuel,“超越2020:造型肥胖和糖尿病患病率,”糖尿病的研究和临床实践文章ID 108362卷,167年,2020年。视图:谷歌学术搜索
- 疾病预防控制中心,国家糖尿病统计报告疾病控制和预防中心,美国卫生和人类服务部,亚特兰大,乔治亚州,2020年。
- 佐藤y”,糖尿病患者的运动处方概述及其应用在日本,“体育与运动科学杂志》上,2卷,2020年。视图:出版商的网站|谷歌学术搜索
- 李·d·杨,杨y, y, r·汉”体育锻炼治疗2型糖尿病:从机制到取向,“年报的营养和新陈代谢,卷74,不。4、313 - 321年,2019页。视图:出版商的网站|谷歌学术搜索
- j.y.金姆和j . y .全”运动对胰岛素敏感性和β细胞功能的作用:锻炼足以youth-onset 2型糖尿病的预防吗?”《儿科内分泌和新陈代谢,25卷,不。4、208 - 216年,2020页。视图:出版商的网站|谷歌学术搜索
- c . Costanian蔡明俊。奥宾、r . Buhrmann和e·e·弗里曼”之间的交互绝经后妇女激素替代治疗和糖尿病白内障,”更年期,27卷,不。3、263 - 268年,2020页。视图:出版商的网站|谷歌学术搜索
- n Yuvaraj和k . r . SriPreethaa糖尿病预测在医疗保健系统中使用机器学习算法在hadoop集群,”集群计算,22卷,不。1、1 - 9,2019页。视图:出版商的网站|谷歌学术搜索
- a . b . Bazila r·k·Priyadarshini, p . Thirumalaikolundusubramanian”儿童糖尿病通过自回归综合移动平均预测模型不仅利用大数据和sql,”计算和理论纳米科学杂志》上,16卷,不。8,3510 - 3513年,2019页。视图:出版商的网站|谷歌学术搜索
- 他,K.-i。蜀,h·张,“机器学习和数据挖掘在糖尿病诊断和治疗”进行眼压会议系列:材料科学与工程IOP出版,曼谷,泰国,2019年5月。视图:出版商的网站|谷歌学术搜索
- t·e·文a . Idri Abnane, z . Bakkoury,“用一个LSTM神经网络预测血糖,”2019年联邦会议进行计算机科学和信息系统(FedCSIS),IEEE 35-41页。2019年9月,德国莱比锡。视图:谷歌学术搜索
- 国家卫生研究院国家糖尿病、消化和肾脏疾病研究所美国马里兰州安纳波利斯的趋势,2003年。
- d·s·克里斯蒂·d·m·库马尔和m . ChandrakumarPeter”为使用k意味着糖尿病患者数据构建预测模型算法,”杂志主页,8卷,不。7日,2018年。视图:谷歌学术搜索
- n . Pradhan g .王妃v . s .达卡和r . c . Poonia“糖尿病使用人工神经网络预测,”深度学习生物医学和卫生信息学的技术施普林格,新加坡,2020年。视图:出版商的网站|谷歌学术搜索
- k . Saravananathan和t . Velmurugan”,分析糖尿病数据使用分类算法在数据挖掘中,“印度科学和技术杂志》上,9卷,不。43岁的1 - 6,2016页。视图:出版商的网站|谷歌学术搜索
- j . a·本·t·哈姆迪n . Fnaiech v . d .使用f . Fnaiech和j·m·基”连续血糖水平基于人工神经网络的预测1型糖尿病,”生物控制论和生物医学工程,38卷,不。4、828 - 840年,2018页。视图:出版商的网站|谷歌学术搜索
- r . Rajni和a . Amandeep RB-Bayes算法预测糖尿病的皮马印第安人数据集,“国际电气和计算机工程杂志》上,9卷,不。6,4866 - 4872年,2019页。视图:出版商的网站|谷歌学术搜索
- d .西索迪亚和d s西索迪亚”预测糖尿病使用分类算法,Procedia计算机科学卷,132年,第1585 - 1578页,2018年。视图:出版商的网站|谷歌学术搜索
- t . Anand, r . Pal和s . k . Dubey”聚类分析使用数据挖掘技术对糖尿病性视网膜病变的预测,”国际业务信息系统杂志》上没有,卷。31日。3、372 - 390年,2019页。视图:出版商的网站|谷歌学术搜索
- t·e·文。阿里,Abnane, z . Bakkoury,“用一个lstm神经网络预测血糖,”联邦会议进行计算机科学和信息系统(FedCSIS)IEEE,莱比锡,德国,2019年9月。视图:谷歌学术搜索
- j .旷h·杨,j·刘,z,“动态预测心血管疾病的使用改善lstm,”国际人群科学杂志》上,3卷,不。1,2019。视图:谷歌学术搜索
- t·a·拉希德·m·k·哈桑·m·穆罕默迪和k·弗雷泽,“改善变体适应性lstm训练有素的医疗metaheuristic算法分析,”先进的医疗分析分类技术IGI全球,页111 - 131年,PA,美国,2019年。视图:出版商的网站|谷歌学术搜索
- t . Wang w·李,刘易斯“血糖预测使用开源lstm变异的环境下人工胰腺系统,”第53届夏威夷国际会议系统科学学报》上2020年1月,毛伊岛,夏威夷,美国。视图:出版商的网站|谷歌学术搜索
- 林y, z, y Kang r .宁和孟y,“准确的前馈神经网络模型预测糖尿病,”国际科学与技术研究杂志》上,7卷,不。8,151 - 155年,2018页。视图:谷歌学术搜索
版权
版权©2021 Umair Muneer对接等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。