文摘

数据分析、机器智能和其他认知算法用于预测各种类型的疾病医疗保健。革命的人工神经网络(ann)在医学学科出现了对于数据驱动的应用程序,特别是在医疗保健领域。它的范围从诊断各种疾病,医学图像处理,决策支持系统(DSS)和疾病预测。进行这项研究的目的是确定参数对糖尿病的影响数据预测一个特定的病人是否有疾病。本文发展一种改进的ANN模型训练使用人工神经网络反向传播扩大共轭梯度(ABP-SCGNN)算法来预测糖尿病有效。为了验证该模型的性能,我们进行大量的实验在皮马印第安人糖尿病(PID)数据集使用的准确性和均方误差(MSE)作为评价指标。我们使用不同的隐层神经元的数量,从5到50,训练的ANN模型。实验结果表明,ABP-SCGNN模型,包含20个神经元,验证集的准确率达到93%,高于其他使用人工神经网络模型。这个结果证实了模型的有效性和效率在预测糖尿病疾病所需的数据属性。

1。介绍

人工神经网络(ann)的革命在医学学科研究领域出现的数据驱动的应用程序,尤其是在医疗保健行业。它的范围从诊断各种疾病,图像处理在医学领域,决策支持系统(DSS)和疾病预测。许多当代ANN模型如深度学习模型,递归神经网络和遗传算法是重要的在人工智能、机器人、图像处理、和其他一些尖端技术,尤其是在卫生部门。安是一个理想的工具,用于识别、分析和预测的一般卫生部门参与血栓栓塞中风病,骨密度,乙型肝炎,和乳腺癌1]。介绍了预测框架对于一个成功的诊断糖尿病患者使用一个数据集包括女性相应的属性。很相关,典型的回归模型被用来解决这个问题。通常,这些模型的基础包括推断统计独立和相互依赖关系的输入和输出变量和均匀性的连续性和外部变量的存在。

另一方面,在大多数应用程序中,这些推断常常冒犯或忽视由于复杂的生理特点。提高患者的糖尿病自我管理,设计各种模型研究进展(2]。然而,一些模型和程序开发提供医学研究的好处;这些模型的严格的测试部分不足,导致很难执行,难以管理。在这项研究中,一个组织良好和精致的回归模型,即。,artificial backpropagation scaled conjugate gradient neural network (ABP-SCGNN), is proposed that predicts the underlying disease since ANN has been employed in medical research and analytical studies [3]。反向传播是安使用梯度下降法的监督学习。该算法计算误差函数的梯度与权重。

糖尿病是一种与胰岛素有关的疾病影响问题。时可能出现的人体行为的反应,尤其是负面的方式。不幸的是,它取得了治疗没有直到现在,但糖尿病患者可以采取某些预防措施来应对他们的疾病,享受健康生活。本文关注的是成功的预测使用安仔细诊断方法通过选择一些属性。在积极的预测结果,人们可能会咨询他们的医生治疗之前的预防措施。通常情况下,患有糖尿病,患者成为其他严重疾病的受害者从心脏病到肾衰竭如果不适当控制(4]。在许多国家,心血管疾病的一个重要原因,失明、肾衰竭,下肢截肢是糖尿病。糖尿病患者的数量一直在增加在世界范围内,近2亿人是有针对性的,一半以上的人口是女性。女性可以迅速成为这种疾病的受害者在高危年龄介于25至44和相应的行动。一些研究进展预测糖尿病早期诊断和治疗因此[4,5]。

这样的模型可以设计和实现使用安被证明是更有用的,有效的,和有效的医学研究领域的分析、诊断和预测并协助不仅专业而且普通人(5]。安是一个代表人类的神经系统在数学上,展示的力量训练和泛化。大部分的安技术是基于非线性函数的链接或协会是有点复杂的或未知输入特性。一系列的节点也被称为神经元,形成一个安组织在不同的层中。安在一个典型的统计模型,每个神经元都是直接连接到其他层的神经元雇佣一些加权值,说明它们之间的连接的力量或能力(6,7]。每个神经元的输入加权排列的影响几个输入信号,可能包含不同的计算和最终结果输出。这些神经元传递函数加权输入适用于评估阈值。使用激活函数,有关消息发送到下一个神经元如果阈值超过。

基于人工神经网络的功能,重要的是理解提出了预测时,感知分类和模式识别以及相应的培训(7]。尽管如此,另一方面,重要的工作是进行对安发展在医学领域的应用,例如,分类、聚类、数据优化和预测基于一组给定的输入。任何ANN模型由多个组件组成的层,特别是一个输入层、一个或多个隐藏层,一个输出层,几个神经元,及其相应的交互。选择这些特性是敏感的一些功能导致缓慢的培训,相反,许多功能降低整体网络的处理能力。有不同的方法来确定这些组件,通常修剪方法和不断增长的方法。修剪方法可以与许多特性之一,减少网络的大小与那些不重要的组件(8]。不断增长的过程,是用于拟议的工作增加了欲望逐渐组件。一些算法已经应用于本文中使用的数据集上执行各种操作来选择属性,处理数据,并据此预测糖尿病。糖尿病诊断在医学领域使用相同的数据集使用通用回归神经网络(grnn),多层感知器(MLP)神经网络、径向基函数(RBF)和前馈神经网络比较简要的性能测试不同类型的反向传播训练算法(9]。自适应学习例程一直被应用在(10]。

剩下的纸是组织如下。部分2介绍了以前的糖尿病预测的相关工作。第三节解释的方法提出ABP-SCGNN-based糖尿病预测框架详细给出。介绍了实验和结果第四节,然后研究的结论与未来工作所示第五节

2。文献综述

2011年,Sapon et al。1)花了250糖尿病患者男性和女性25 - 78年27输入变量到培训网络识别疾病模式。在三个算法、贝叶斯规则算法提出了最优秀的导致糖尿病的预测Broyden-Fletcher-Goldfarb-Shanno(高炉煤气)算法和拟牛顿和Levenberg-Marquardt算法。bfg拟牛顿拥有0.86714相关系数0.99579 578时代而贝叶斯规则获得37时代只有0.6051,Levenberg-Marquardt只有五个时期。在[1),贝叶斯规则算法提供了一个良好的相关性估计目标和实际的输出(即。,0.99579) with 88.8% prediction accuracy that affirms the validation that exhibits the appropriateness of this algorithm to carry out the successful diabetes prediction.

为了数据集分类,在2012年,Choubey et al。8]应用朴素贝叶斯分类器(国家统计局),以及遗传算法(GA)与国家统计局方法预测糖尿病女性年龄在21 - 78年。实例的总数是768。首先,使用朴素贝叶斯分类的过程已经完成,PIDD和遗传算法被用来添加和删除属性的数据集。它相对降低了计算成本以及时间和增加ROC和分类精度。结果比较与中华民国PIDD关于准确性,GA, NB突显出最准确的结果和更好的中华民国与其他方法相比。

2003年,卡娅和Yıldırım [9]应用MLP神经网络、RBF和grnn的皮马印第安人糖尿病数据。Levenberg-Marquardt训练算法对训练数据已经证明了最好的结果。RBF的准确性并不优于延时,甚至利用所有基本的价值观。grnn达到最好的结果(即使用测试数据。,80.21%)。这个算法被证明是一个优秀的和务实的选择成功的糖尿病数据的分类。

2016年,Florez et al。11]700个实例作为训练数据,选择随机使用软件R预测糖尿病的强度。均方误差为2.952。接下来,更高的风险特征导致糖尿病的子组。修改的模型是怀孕的次数(PRG),唾液中血浆浓度(等离子体),英国石油公司、身体质量指数(身体),和糖尿病血统函数(血统)。PRG,等离子体、主体和背景对预测糖尿病根据他们的系数有一定的影响。大量的变量包含糖尿病的几率更高拥有3.21068的MSE。因此,结论变量包括PRG,等离子体,身体,和血统。

伊克巴尔et al。12)提出了一个智能系统为智能城市使用集群和模糊推理系统预测交通堵塞。交通拥堵的解决方案是使用智能手机技术。它激发的想法糖尿病的预测使用的计算智能技术。

因为拟议的框架是基于ABP-SCGNN算法,实验可能会进行少量的组件,并可以做出决定的性能的学习曲线。网络的特点可以总结在生成一个小错误率当培训完成。

3所示。提出的方法

任何年龄段的人可能成为糖尿病的受害者。原因可能有所不同在不同年龄组、性别、生活风格、血糖和胰岛素水平,英国石油(BP)等等。目前,许多算法,如人工神经网络、支持向量机、朴素贝叶斯(国家统计局)和模糊逻辑(FL),预测合并糖尿病的诊断。这些算法有其利弊对于他们的处理时间和准确率,从给定的数据获取隐藏的信息。因为在复杂的问题域,找到一个最佳的解决方案可能不需要一个简单的方法(13- - - - - -16]和拟议的框架在下图演示了ANN预测算法的工作过程,验证和系统测试目的的网络提高自力更生和重要的确定性。操作和参数areyielded在安训练,仔细比较了预测和获得的值用于安优化。整个行动解释在图1示意图。

根据框架,网络获得数据集,由女性糖尿病患者的详细预测疾病的诊断。由于数据集包含不同的属性/特性(葡萄糖、胰岛素和BP)病人的相关细节,仔细选择必须执行这些功能的一些特性可能导致误导的结果,因为噪音或null数据。有时,在属性值范围。建议应用形式化的过程中为了减少错误的结果,同时找到一个相对改善结果(9]。数据,需要培训评估之前必须预处理过程。网络体系结构不同分类器的分类器,表现出依赖底层算法参数的分类器训练网络。其他糖尿病患者可以使用这个网络预测诊断的疾病。结束,一般医生的糖尿病或医学博士执行评估和评估过程预期诊断。拟议的框架提供了一个详细的解释如下。

3.1。数据收集和代表性

在这项研究中使用的数据集是来自国家糖尿病、消化和肾脏疾病研究所(17]。这背后的目的是预测疾病考虑一些选择诊断关键属性包含在数据集是否一个人是糖尿病患者。女性患者的数据集包含数据只有最低年龄21年美国亚利桑那州的居民。应答器包括一个二进制值0(负面测试代表糖尿病)或1(积极测试代表糖尿病)。大约有35%(268)的病人都包含在一个类包含值1。另一方面,65%(500)患者中包含另一个类包含一个值为零的9]。研究人员提到许多至关重要的因素,可能会因病人而异,糖尿病目前或在预定义的时间18]。

3.2。特征选择/减少

正确诊断糖尿病,关键属性通常是相互独立的。医学专家仔细检查属性,决定是否需要每个确定可行的诊断。这些属性,称为安特性,可以被称为糖尿病症状和另一个有关的信息,有助于预测糖尿病。Choubey et al。8GA)用于选择属性(特征)和国家统计局对PID数据集分类。

从特征选择是一个过程的识别从成套中提取最相关的特性,它增加了预测糖尿病患者的诊断的成功率8]。鉴于(18),这些特性必须健壮、无噪声的;因此,仔细选择在选择这些特性与整个数据集。女性可能有糖尿病的第六个月怀孕,此外,一定程度的血糖和胰岛素糖尿病的诊断中发挥了重要作用。最终,有八个解释输入变量和一个输出响应器变量中包含所选的数据集。每个变量分别在诊断糖尿病起着至关重要的作用。积累他们的价值观使网络有效地训练和执行糖尿病预测回报。这两种类型的变量的详细解释表1

3.3。预处理

可以使用许多方法预处理数据在数据集模型评价(19,20.]。预处理的结果必须证明预期的输出。学习速率、动量和时间拍摄;所有响应中得到预处理过程。数据必须转换的形式满足验收标准。积累所提供的值在不同的特性,如血压、皮肤厚度、胰岛素和BMI必须映射结果的价值。糖尿病数据集包含768个实例与8个输入变量,可以使用仿真模型预测糖尿病的诊断。嘈杂的数据已经被消灭之前收到有关权威数据集(19]。

3.4。神经网络拟合过程

目标积累上述信息设计的神经网络模型可以准确地预测一个特定的病人有糖尿病或不是。因为安是许多算法的结合,一些算法用于训练网络,得到预测率,考虑到比较共同的结果。在选择病人的数据集,下一步是隔离数据根据需求。在我们的示例中,数据需要被分为三个主要部分训练,验证和测试数据。训练数据提出了网络训练时需要与一个错误开始同时调整网络参考。糖尿病数据集包括768例患者,70%(约537)实例是用于训练目的。多个部分的培训可能会产生不同的结果每一次关于各种条件以及数据。另一方面,验证数据需要测量网络泛化。当它达到最佳水平,验证过程停止。大约115个实例选择执行验证过程评估实际训练的影响。 In so far as test data are concerned, there is no effect or change on training data due to testing data and after training process. It enhances the independent measurement of the desired performance of the underlying network. A set of 115 instances are chosen for testing purposes, and each algorithm’s overall performance is observed and recorded accordingly.

3.5。提出的系统模型

ABP-SCGNN方法架构是隔离成四个不同的部分,如图2。这包括初始化的重量,向前和向后传播的错误,更新的重量,和偏见。隐藏层由一个神经元,每个神经元激活函数 激活函数加权输入的总和 参数如下:

激活函数被用来建立一个非线性变换,分配给对应的非线性命题或评估复杂的功能。激活函数的输入是由重量乘以计算输入,然后添加偏置值。在以下部分中,提出了神经网络解释如何执行其预期的操作。首先,向前传播。首先,向后传播后比较预测 输出与实际输出 在梯度误差的计算输出层。

与糖尿病神经网络训练数据集通过使用以下算法:(1)多层感知器(MLP)(2)贝叶斯正规化(3)按比例缩小的共轭梯度

拟议的框架包含一个输入和一个输出层只有一个隐藏层包含8个输入特性(神经元)产生的两个输出所提出的研究方法。数据集包含输入和输出层 ,在哪里 是输入层和 是预测的输出。如果 是整个组的总大小,然后呢

前馈的参数表示集体 因为训练一个神经网络误差函数的梯度 与体重有关 (重量在节点j在层为节点 ),偏见是 (偏差在节点 在层),所以根据学习速率,在每步迭代梯度下降法更新权重如下: 在哪里 代表安参数在迭代 的均方误差反向传播 在哪里 预测输出和吗 输入的实际产出吗。的导数f表示为(x) ,和乙状结肠函数的导数 (偏见)层k,包括节点i体重 与一个输出 在节点0层 ;因此,

重量和偏见与随机值作为一次性起始值初始化;更新权重值是在随后的迭代中使用。方程(6)可以写成:

方程(7)表明, 包含的体重从输入层到隐层 是代表从隐层到输出层的重量。

方程(8)含有输入层和隐层之间的权值。它包含 元素。 是元素之间的重量。

在我们的例子中,只有一个输出神经元。方程(9)也可以写成

对应的原始配方 ,

然后,可以计算的错误

在方程的导数(12),

反向传播算法涉及一对I / O,以及所有I / O对 每个梯度可能产生的合并。推导的误差函数

3.5.1。误差函数的衍生品

在应用链式法则, 在哪里 对节点的激活 在层

在这里,

第二项的方程 如下:

误差函数 偏导数 (重量)如下:

重量的偏导数是一个误差项的产物 在节点 在层 和输出 的节点 在层

3.5.2。输出层

反向传播特征值 ,在哪里 最后一层。但是神经网络具有 层和结束 第二最后一层。表达 (误差函数)的价值 (因为 是一个偏导数的 )给了

然后,应用偏导数,

的偏导数 和误差函数

3.5.3。隐藏层

隐藏层的错误可以计算如下: 在哪里 范围从rk+ 1的节点数目。

误差项 给以下方程: 记忆的定义 在哪里 是激活函数。

正如我们所知, 的偏导数 误差函数

偏导数和最后一层的误差项,

隐藏层的误差项,

结合偏导数,

更新权重,

3.6。ABP-SGCNN模型的算法

假设 学习速率和参数初始化 ,以下步骤在该算法用来保持进步。

3.6.1。计算远期阶段

对于每组输入和输出( ),将结果存储 为每个节点(j)层 通过从层零,输入层,层( ),输出层。

操作。计算落后的阶段

对于每组输入和输出( ),将结果存储 对于每一个重量 连接节点 在层 到节点 在层 通过从层 ,输出层,层(1),输入层。

评估最后一层的误差项使用方程(2)。

Backpropagate隐藏层的错误条件 ,向后的工作 ,通过反复使用方程(3)。

评估个人的偏导数误差 关于 利用方程(1)。

3.6.3。结合个人的梯度

结合个人为每个输入-输出对梯度 总梯度 ,整个组的输入-输出对 利用方程(4)(一个简单的个人平均梯度)。

3.6.4。更新权重

根据学习速率 和总梯度 并利用方程(5)(移动的方向负梯度),权重更新使用方程(27)。

使用方程(27),重量相应更新。

4所示。实验和分析验证

也许,它不可能达到期望的结果在一个训练迭代。然而,有时,模型需要训练几次直到附近的方法预测的结果。成千上万的迭代完成后,测量和评价结果的预测表中描述的诊断糖尿病2用于分析实际性能。考虑,优化框架以及培训5000年的网络时代,使用768实例,实验证明了神经网络算法的潜在效益和价值。对所有算法用于训练、学习速率为0.25,和动量系数为0.5。在仿真,在隐藏层神经元数量下降范围5、10、20、30、40、50神经元。结果证明相关系数的价值尤其是提出人工神经网络反向传播扩展共轭梯度(ABP-SCGNN)是接近1,表明相当准确性基于回归精度的故事情节在所有其他算法。均方误差(MSE)计算算法。计算预测精度和预测的总数的比例,正确完整的预测。该算法(ABP-SCGNN)产生更多的正确预测预测精度为93%。

3礼物的MSE在学习过程中使用不同数量的隐层神经元计算范围5 - 50中对所有算法。表3揭示了延时算法包含0.0026使用五在隐藏层神经元;毫无疑问,通过增加神经元的数量,即。,20.和40, MSE was approaching low, but network complexity increased along with decreasing MSE rate. The Bayesian regularization algorithm has approximately high MSE, which is the same for a different number of neurons of the hidden layer. On the contrary, the proposed algorithm, ABP-SCGNN, attains relatively a lower MSE result when five neurons are used at the hidden layer, and this result is reduced more upon increasing the number of neurons, as shown in Figure4。它证实,使用20神经元获得最低MSE和高精度的结果。此外,模型达到93%的回归精度值,如图所示3。因此,网络的复杂性和性能之间的权衡模型是接近20隐藏神经元在MSE和精度的措施。

回归精度绘制在图3描绘了一个显著相关的算法所确定的目标和预期值之间的虚线展品的最高精度。三个不同数量的神经元隐层中使用,如表中所述2。所有神经元预测延时精度保持不变。在同一案件中与贝叶斯正则化算法,其回归精度结果范围从70年到78年使用相同数量的隐藏神经元其他两种算法。

自向前传播问题的推理阶段前馈神经网络和反向传播神经网络学习阶段处理,学习阶段相对慢于推理阶段期间因为梯度下降法需要多次重复整个过程。使用并行运行,底层算法可以有效的工作表现。前馈神经网络的计算复杂度计算通过分割训练和推理的计算阶段。如图5,整个时间复杂度与时代的数量将会增加。然而,算法的效率保持稳定。

下列方程计算复杂性的因素( )根据图5 在哪里 是输入层神经元,j隐藏层神经元,迭代的数量。

同样,MSE时间复杂度为同一算法可以计算如下: 在哪里 时间复杂度, 是输入层神经元, 隐层神经元, 是迭代的数量。图5演示了基于数量的时间复杂度时代通过选择三种配置不同的神经元,如5、20和40,如下所示。

事实上,增加神经元,成功率会增加在某种程度上。然而,经过检查20神经元,成功率不变与时间复杂度的增加。表4显示了比较在各种神经网络算法的提出(ABP-SCGNN)算法演示了其成功率最高,如93%。Broyden-Fletcher-Goldfarb-Shanno(高炉煤气)算法包含一个88.8%成功率高于早期用于潜在的问题。另一方面,该算法显示了关于成功率和回归精度最好的结果。

5。结论

使用人工神经网络反向传播(ABPNN),一个务实的框架提出了预测糖尿病的诊断。呈现的结果证实了本文,它可以使用APBNN可行的模型自适应框架。安的应用以来组织不同于经典的方法,提供的功能是作为输入变量,而不是为他们到安。

拟议中的ABP-SCGNN框架是有效和高效,以93%的成功率模拟测试时PIDD数据集(17]。检查有效的人工神经网络的性能和计算分析,许多性能指标计算。在这些指标中,均方误差(MSE)和回归精度分析焦急地检查。所有神经网络训练使用5到50个隐层神经元和相同的数据集。最好的结果是在一个隐藏层包含20个神经元,特别提出ABP-SCGNN。其余的两种算法同时保持高MSE 20隐层神经元,而呈现ABP-GCGNN给有吸引力的结果相同的数据集。

实验结果表明,ABP-SCGNN是最好的算法表现出最高的预测结果在所有算法。自安可能提出新的方法、策略和方法消除不确定性和减少相关的潜在不稳定,网络性能通过使用该框架的强度验证安功能有利于成功地与合适的疾病预测糖尿病的诊断输入特性和相应的实例。

数据可用性

在这项研究中使用的数据集是来自国家糖尿病、消化和肾脏疾病研究所,在[引用17)(http://archive.ics.uci.edu/ml)。

的利益冲突

作者宣称他们没有利益冲突的报告对于本研究。

确认

科学研究的作者感谢院长以来,沙特国王大学,资金通过科研副院长职椅子。