文摘
高血压(BP)与心血管疾病的风险增加相关。因此,BP优化精度测量是适当的在临床和研究。在这个工作中,人体测量特征包括年龄、身高、体重、身体质量指数(BMI),手臂周长(AC)被用作独立预测变量预测的BP反应说话。主成分分析(PCA)和人工神经网络(ANN),融合自适应neurofuzzy推理系统(简称ANFIS)和最小二乘支持向量机(二)模型,消除人体测量指标变量之间的多重共线性的影响。统计测试以确定系数(),均方根误差(RMSE)和平均绝对百分比误差(日军)透露,基于PCA的回归模型(PCA-LS-SVM)模型产生更有效的预测BP反应相比其它模型。评估介绍构成的重要性和优势PCA融合预测模型预测的生物变量。
1。介绍
BP的精确测量是必不可少的在流行病学研究中,在筛查项目,在研究,并在临床实践中分类,确定高血压相关风险(冠心病、中风和肾功能衰竭),和指导管理。推荐几个国际组织包括美国心脏协会(AHA) (1),英国高血压学会(黑洞)[2),和欧洲高血压协会(数量)3)透露,英国石油(BP)的测量精度是高度相关的条件测量。观察者应该意识到可能发生相当大的变化,在英国石油公司由于各种因素。然而,它并不总是可行的控制所有的因素,但我们可以减少他们的影响考虑到他们在达成决定3]。
在临床实践中,是最常见的一种测量扰动影响英国石油(BP)测量精度(4]。它可以有助于提高BP阅读,称为BP反应说,这可能导致误诊高估的高血压或高血压的严重程度和可能导致过度积极的治疗。抗高血压治疗可能是不必要的没有并发心血管疾病的风险因素(5]。
在过去的几年里,一些研究量化在英国石油公司的影响。郑et al。6)五种不同条件下测量了英国石油公司在健康受试者包括休息,更深层次的呼吸,说话,头和手臂运动和证明SBP和休息条件相比,菲律宾发生重大的改变。Le Pailleur et al。7探索一个夏普和显著增加SBP和高血压的主题类似而说话。Le Pailleur et al。8]显示瞬时SBP和类似的处理和未经治疗的高血压患者在一段时间的压力大声说话,一段时间的计算(活跃的时期)。
郑et al。9]证明显著高于手动和自动地图在健康受试者。林奇et al。4)报道,言语活动始终伴随着明显的海拔在正常血压和高血压。迟到等。10]表明,说国家增加了英国石油公司相比静止状态的科目。林奇et al。11)描述突然极端血压下降在实验和临床情况下,当一个人在谈论或描述情况下的绝望和无助。长等。12]显示显著增加在BP说话的时候比较安静。张春,格林13)调查的影响讨论的主题有一个以前的舒张压阅读90毫米汞柱以上和不服用抗高血压药物。都说条件下血压显著增加(阅读过程的一部分,中性材料阅读中性材料不断)。
来自不同人群的流行病学研究探讨了BP和人体测量特征之间的显著相关性(14- - - - - -16]。因此,人体测量变量应该考虑实现BP的精确测量。然而,人体测量指标变量之间的多重共线性也被报道,这可能会导致“过度拟合”的预测模型17- - - - - -19]。处理多重共线性的一个方法是使用主成分分析,统计方法。通过使用主成分分析原始数据集可以转换成主成分(pc)的最大方差正交和能够解释数据不丢失任何信息(20.,21]。
软计算覆盖计算技术,提供一些“不准确”的解决方案非常复杂的问题通过建模和分析不精确的公差,不确定性,部分真理,和近似。软计算方法的成功应用在生物医学研究表明,软计算的影响将越来越明显地感受到。
统计的融合和软计算方法通常可以提高训练速度,提高模型的鲁棒性,并降低了标定误差。这些模型可以帮助临床医生在决策过程中有关临床承认,早期预防、早期临床诊断和临床治疗中的应用。在这个意义上,本文基于主成分分析的软计算方法的发展预测的BP反应说,其中包括传统的PCA统计方法进行数据预处理。我们开发了基于PCA的安(PCA-ANN),基于PCA的简称ANFIS (PCA-ANFIS)、英国石油(BP)和PCA-LS-SVM模型预测反应在正常血压和高血压。开发模型的预测精度评估和比较使用统计指标包括确定系数(),均方根误差(RMSE)和平均绝对百分比误差(日军)选择最准确的模型预测BP反应。
剩下的论文结构如下。节2,我们目前的数据收集的细节。部分3用于数据分析处理的实验方法。部分4处理结果的总结。部分5描述了讨论和部分6结尾工作未来的发展方向。
2。数据收集
总共40血压正常的和30高血压女性受试者在学生中,员工,和教师的桑特Longowal工程技术研究所(认为大学),Longowal,区Sangrur,旁遮普,印度,自愿参加本研究。合格的参与者必须超过18岁。我们排除受试者怀孕和心律失常。机构研究委员会批准了研究协议和所有参与者参与之前给书面知情同意。
标准的问卷收集信息的管理在人体测量特征的参与者。使用的是一个特别分开房间进行研究。这房间内确保最小的干扰而测试被执行。观察者参与这项研究被训练使用黑洞的英国石油(BP)测量培训材料(22]。
消除观察者偏见,英国石油(BP)测量使用临床验证(标准化的测量条件下),新买的,完全自动血压计欧姆龙哼哼- 7203(欧姆龙医疗有限公司,京都,日本)使用示波的测量方法。BP监控可用小袖口(17-22厘米),中袖(22-32厘米),和大袖口(32-42厘米)。袖口的适当大小确定mid-arm周长的主题。
受试者建议避免饮酒、吸烟、咖啡/茶摄入量,和锻炼至少30分钟前英国石油(BP)测量。他们要求空膀胱和两肘支在桌子坐直,支持,和脚平放在地面上,因为它们是潜在的混杂因素。此外,他们被要求不说话和移动测量(1]。
休息5分钟后(1),测量进行了四次反复的间隔一分钟。第一次测量都被丢弃而最后三个测量的平均值。随后,相同的测量协议是重复说下阶段期间,《观察家报》要求每个主题“详细告诉我关于你的工作”4]。只在讨论阶段,观察者与主题保持对话的流动,使每一个可能努力最小。提高测量的可靠性,实验对象被检查了一个星期(3]。
3所示。实验方法
数据被表示为平均数±标准差。一个配对以及用于评估测量休息和讲条件之间的差别。
3.1。主成分分析
首先,巴特利特球形的测试(23)和凯萨梅尔Olkin (KMO)衡量抽样的充分性24)被应用于检查数据是否适合应用PCA。
巴特利特球形的测试测试相关矩阵的零假设是一个单位矩阵或没有预测变量之间的关系。考虑 在哪里卡方检验,是样品的尺寸,是数量的预测变量,自然对数,是相关矩阵的行列式。
KMO比较计算相关系数和偏相关系数的大小。给出KMO的公式如下: 在哪里所有变量的矩阵变量,是变量之间的皮尔逊相关系数和,是变量之间的偏相关系数和。
KMO指数范围,从0到1,应该大于0.6的PCA被认为是合适的。
主成分分析是一种多变量统计分析方法。主成分分析的目的是消除多重共线性的问题,减少预测变量的数量,将它们转化为个人电脑是独立的线性组合的原始数据集和最大程度的方差占原始数据集,这样的足够的信息从原始数据集可以提取20.,21]。
标准化矩阵特征值的计算 在哪里标准化数据的相关矩阵,特征值,是单位矩阵。电脑中的变量的权重之后获得的 在哪里是权重矩阵。
评估个人电脑中的每个预测变量的影响,利用方差极大旋转得到旋转后的因子载荷值。这些载荷代表每个预测变量的贡献在一个特定的电脑。电脑用于预测的BP反应不受支持的,通过标准化的数据矩阵的乘法重量()[25]。
3.2。安
安的惯例的体系结构由一个输入层、输出层和一个或多个中介层,也称为隐藏层捕获数据的非线性。
图1显示了一个ANN模型组成的输入层节点,一个隐藏层隐藏节点,和一个输出层节点。
网络训练给一对输入输出向量。输入计算的加权和th隐藏节点 在哪里重量是连接的吗th的th节点,输入数据从输入节点,输入节点的总数,是偏见隐藏的节点。
每个隐藏节点使用一个切线乙状结肠传递函数来生成一个输出,说,在0和1之间。每个隐藏节点的输出,以及偏见输出节点,发送到输出节点和加权和 在哪里隐藏节点的总数和吗是重量的隐藏的节点到输出节点。
加权和网络成为线性传递函数的输入输出节点和预测输出
然后第二阶段的BP算法,调整连接权值,开始了。安的参数可以确定通过最小化训练过程中目标函数如下: 在哪里网络的输出来自哪里观察。
的敏感性每一个的输出th输入,输出对输入的偏导数,在假设的关系和是单调26),给药 或 与假设和是常数。自变量相对较高的积极或消极的灵敏度更高的积极或消极影响因变量。
3.3。简称ANFIS
简称ANFIS,多层前馈网络,利用神经网络的学习算法和模糊推理一个输入空间映射到一个输出空间,如图2。它有能力结合的口头能力模糊系统与神经网络的数字力量。
它可以构造一个输入输出映射基于人类知识(if - then模糊规则)和规定的输入-输出数据对。隶属函数的参数,运用if - then规则,和输出参数计算了训练数据集。训练算法通常是混合或反向传播。简称ANFIS实现的规则形式 :如果是和…是,然后
在哪里是独立的变量,是一个模糊语言学的概念,然后呢是因变量。
输入层( )。每个单元的输入层存储参数的隶属度函数定义隶属函数表示一个语言术语。
输入隶属函数层( )。每一单位的这一层代表一个规则。输入一个单元度增加的会员,确定实现的程度为代表的规则。
逻辑节点( )。这一层由一个单位对于每个规则计算相对程度的实现如下:
每个单元的连接到所有的规则单元在吗。
输出隶属函数层( )。每个单元的计算规则的输出作为
的单位连接到所有单位的输入层和一个单位。
输出层( )。计算最终的输出通过添加的所有输出(27]。
3.4。回归模型
支持向量机回归模型的扩展标准。它将支持向量机的不等式约束转化为平等的导致求解一个线性系统,而不是二次问题,其收敛速度快(28]。它已广泛应用于评估和函数逼近29日]。回归模型的体系结构如图3。
给定一组训练数据集 与输入向量和输出向量最小平方支持向量机回归函数,在特征空间中,可以表示为 在哪里权向量,是偏见。地图的输入成一个向量。
模型推断从给定的训练数据集通过最小化代价函数如下 根据等式约束 在哪里是错误,,是正则化参数。
解决这个优化问题的对偶空间导致找到系数和在以下的解决方案: 在哪里是内核函数。
3.5。性能指标用于模型的比较
开发模型的比较和选择的最优,性能评估模型的使用和RMSE日军。
是两个变量之间的相关系数的平方和谁的对可用如下:
均方根误差均方误差的平方根,由以下方程:
日军被定义为平均百分比误差,由以下方程: 在哪里样品的数量,从模型中获得的预测值,是实际值,是实际值的平均值。
RMSE日军,越低越好模型在预测参数的准确性。另外,最高的值表明,模型表现最好的(30.]。
4所示。结果
为每个人体测量特征是描述性统计给出均值和SD在表1。
配对的结果以及显示显著更高的SBP、菲律宾和平均动脉压(MAP), ()说。均值上升被发现在高血压人群高于normotensives,如表所示2。这些结果符合的建议啊哈BP测量在人类和实验动物(1]。
表3介绍了皮尔森所有人体测量变量的相关系数计算。高值之间的相关系数(大于0.6)对人体测量特征(31日显示存在的多重共线性。
之前应用PCA,巴特利特球形度的测试,Kaiser-Meyer-Olkin (KMO)衡量抽样充足应用于确定主成分分析是否适合数据研究。结果如表所示4。卡方值高(Bartlett)的试验表明,使用PCA是适当的(在正常血压和高血压科目。KMO也大于0.6的值表明,样本容量足够应用PCA (32]。
第一个四个人电脑(PC1-PC4),解释总变异的5%以上,如表所示5保留进一步分析。
旋转组件载荷后方差极大旋转代表原始的人体测量特征的程度在形成有影响力的电脑,如表所示6。
粗体标记加载显示最高的人体测量特征之间的相关性和相应的组件。对正常血压和高血压、体重和体重指数与PC1积极高度相关,负面观察高度和PC2之间高度相关。
主要的得分值分配电脑使用主要得分系数测定。
此外,皮尔森的价值相关性(相关系数< 0.6)之间的电脑,如表所示7表明,表中给出的消除多重共线性的影响3。
开发基于主成分分析的软计算预测模型80%的数据被用于训练在整个数据集用于测试。此外,数据必须规范化实现更精确的预测(38]。预测的BP反应值规范化与实际值进行比较。MATLAB 7.5版本是用于开发预测模型。
4.1。PCA-ANN
为了达到最好的BP ANN结构反应预测,不同结构的前馈神经网络隐层的神经元数量不同。最后,考虑的统计指标,结构有两个隐藏层,有六个节点在每个隐层,是发达的。有四个输入节点代表了四个个人电脑和一个输出节点代表英国石油公司反应说话。切乙状结肠和线性传递函数作为激活函数的隐层和输出层。反向传播学习算法使用基于Levenberg-Marquardt技术(39]。
数据4和5的观测值和预测值之间的散点图SBP,类似从PCA-ANN模型和映射反应在正常血压和高血压科目,分别。
(一)SBP
(b)菲律宾
(c)地图
(一)SBP
(b)菲律宾
(c)地图
4.2。PCA-ANFIS
PCA-ANFIS模型被开发使用genfis1与网格分区的数据。不同的简称ANFIS参数进行测试以达到完美的训练和最大的预测精度。
输入隶属函数“trapmf”和“gauss2mf”是用来预测SBP和反应类似,分别在血压正常的个体,而隶属函数“psigmf”是用来预测SBP和高血压患者反应类似。输出隶属函数使用了“线性”。
其他参数训练PCA-ANFIS模型的隶属度函数的数量= 16,节点的数量= 55岁的线性参数= 80,非线性参数的数量= 32,参数= 112,总数和模糊规则的数量= 16。
SBP的观测值和预测值,菲律宾,从PCA-ANFIS模型和映射反应正常血压和高血压科目数据绘制6和7。
(一)SBP
(b)菲律宾
(c)地图
(一)SBP
(b)菲律宾
(c)地图
4.3。PCA-LS-SVM
PCA-LS-SVM模型使用RBF内核和网格搜索优化算法与二倍交叉验证了获得最优参数组合(40]。的最优值(正则化参数)和(平方带宽)对正常血压和高血压科目表所示8。
数据8和9的观测值和预测值之间的散点图SBP,类似从PCA-LS-SVM模型和映射反应在正常血压和高血压科目,分别。
(一)SBP
(b)菲律宾
(c)地图
(一)SBP
(b)菲律宾
(c)地图
统计指数的比较模型,如表所示9显示,PCA-LS-SVM模型的价值最高和最低的RMSE值的预测BP反应在正常血压和高血压科目。
5。讨论
适当的诊断和治疗的高血压,准确和可重复的英国石油(BP)测量是至关重要的。
本研究证实,扩展了以前的研究4,6- - - - - -13通过记录一个显著增加BP与交谈。这一发现倾向于支持维纳et al。41)的建议,可能是一个言语活动和BP海拔之间的联系。和退出这样的言语活动对心血管系统具有重要的临床意义。
此外,我们说明了应用程序的基于主成分分析的软计算模型在预测BP反应说话。PCA纠正混杂造成的人体测量特征包括年龄、身高、体重、BMI,和交流,因此,血压正常的受试者被用来提供一个比较的基础。
据我们所知,本文是第一个研究与预测BP反应说使用基于主成分分析的软计算方法。因此,结果与间接相关的研究(33- - - - - -37),如表所示10。有前景的结果的软计算技术研究由于其高度的鲁棒性和容错性。在这工作,具体来说,最好的性能来自它的几个优点包括回归模型的全局最优解能力,收敛速度快,与小尺寸样品和良好的泛化。
这项研究有许多优点。我们使用小型、中型和大型袖口,这可能产生更准确的读数。我们把多个读数的意思是加强英国石油(BP)测量的准确性。
然而,任何单一模型之间的比较可能不可靠地代表了真正的结果。验证计算模型的使用更大的数据库以外获得的准确测量的性能是至关重要的发展人口。
6。结论
成功开发的预测模型的质量和性质在很大程度上取决于数据用于模型的发展。解决多重共线性的问题在人体测量变量,主成分分析结合。此外,性能比较PCA-ANN、PCA-ANFIS PCA-LS-SVM模型揭示了PCA-LS-SVM模型在预测BP反应的潜在能力。这项工作为研究人员和工程师可以提供有价值的参考应用软计算模型的建模生物变量。结果有助于医生的诊断在临床医学预防高血压。我们未来的研究目标是研究一个方法通过结合不同的混合动力技术的输出与多个预测变量和更大的数据集来实现软计算的广泛的临床应用。
利益冲突
作者宣称没有利益冲突有关的出版。