研究文章|开放获取
穆罕默德·Rezapour名Khavanin陈守煜,默罕默德·迈赫迪Sepehri, ”实现预测性数据挖掘技术识别早期AVF失败在血液透析患者的危险因素”,计算和数学方法在医学, 卷。2013年, 文章的ID830745年, 8 页面, 2013年。 https://doi.org/10.1155/2013/830745
实现预测性数据挖掘技术识别早期AVF失败在血液透析患者的危险因素
文摘
动静脉瘘(AVF)是一种重要的血管进入血液透析(HD)治疗,但20 - 60%的早期失效。检测病人的参数之间的联系和早期AVF失败对于降低其患病率和相关成本是很重要的。还预测这种并发症的发生率在新病人是一个有益的控制过程。病人安全与保护的早期AVF失败是最终目标。我们研究社会Hasheminejad肾中心德黑兰(惠科电子),这是伊朗最大的医院肾。我们分析数据193 HD患者使用监督技术的数据挖掘方法。有137名男性(70.98%)和56岁女性(29.02%)患者引入这项研究。所有患者的平均年龄为53.87±17.47年。8例患者20例吸烟和糖尿病患者的数量和刻意是87年和106年,分别。重大关系被发现“糖尿病”,“抽烟”、“高血压”初动失败在这个研究。 We have found that these mentioned risk factors have important roles in outcome of vascular surgery, versus other parameters such as “age.” Then we predicted this complication in future AVF surgeries and evaluated our designed prediction methods with accuracy rates of 61.66%–75.13%.
1。介绍
慢性肾脏疾病(CKD)是一个条件的肾脏受损,不能过滤血液尽可能好。在晚期CKD的称为终末期肾病(ESRD)肾脏功能下降很严重。血液透析(HD)治疗是最常见的程序,执行ESRD患者和HD需要永久性血管通路(VA)是一个重要方面1]。此外,有三个主要类型的VA用于HD治疗:动静脉瘘(AVF),合成动静脉移植(AVG)和中央静脉导管(CVC) [2]。类型的弗吉尼亚州有风险,可以是昂贵的。根据临床实践指南的推荐,AVF的访问是第一选择的基础上,减少相关并发症,发病率,死亡率相比AVG和CVC;动也优越的存活率(一年后估计为90%)比其他VA类型(如AVG的60%)(3]。AVF便宜,仍然是黄金标准访问高清。
由于早期AVF失败的发生率是报告为20 - 60% (4),因此检测风险因素在早期AVF失败是必不可少的在照顾这些HD患者的医疗、经济和心理影响。动静脉,从不用于透析或三个月内未使用,应该归类为早期故障(5]。我们研究的目标是提取早期AVF失败的模式,预测这个问题,并确定的高危因素,使用数据挖掘方法。
“数据挖掘”被定义为一个步骤在数据库知识发现(KDD)过程,包括应用数据分析和发现的算法,在可接受的计算效率的限制,产生一个特定的模式(或模型)的枚举数据(6];还知识发现(KDD)的定义是重要的识别有效的过程,小说,可能有用,最终可以理解的模式数据。数据挖掘的方法提高他们的应用程序变得越来越必不可少的医疗组织决策分析的基础上所产生的大量的临床数据医疗事务。在医疗数据挖掘正变得越来越受欢迎,如果不是越来越重要,和几个因素动机在医疗数据挖掘应用程序的使用,如欺诈和滥用检测、转换数据的能力,和卫生保健提供者的好处7]。另一个因素是,数据挖掘可以改善决策通过发现模式和趋势在大量复杂的数据8]。几项研究采用数据挖掘方法发现测量参数之间的关系的知识和预防AVF失败。时态数据挖掘技术研究[9]因为透析故障预测和分析透析会话的数据来自43个不同的病人。则和期望最大化算法实现(10)集群HD患者的一些属性。数据挖掘是在医疗设置HD治疗和提供了一个简短回顾的最先进的方法预测透析病人(病人风险和生存11]。WJ.48树算法是用于分析数据的170名患者在透析12个月以上的患者的高危人群和解释模式提取决策规则(12]。
1.1。世界统计
慢性肾病的患病率增加世界各地。2010年,超过10%的人或在美国超过2000万名患者有慢性肾病13]。根据最近的统计国家肾脏基金会(NKF), 2012年美国有2600万慢性肾病患者(14]。还ESRD的慢性疾病近年来增长迅速(15]。ESRD在2004年底,据报道普遍世界人口为400000,其中包括300000多名血液透析(HD)患者(16]。2008年底,547982美国居民在ESRD的治疗和382343人接受透析治疗,其中354443在血液透析(17]。
在伊朗有超过14000名患者治疗慢性ESRD HD治疗(18]。动静脉使用93.4%的伊朗HD患者(1]。这一发现超过建议的指导方针和动静脉使用报告的67 - 91%的比例近年来许多西方国家(19]。
2。材料和方法
2.1。患者人群
这项研究由AVF的数据193患者血液透析(HD)在德黑兰Hasheminejad肾中心(惠科电子),这是伊朗最大的医院肾。有137名男性(70.98%)和56岁女性(29.02%)患者引入这项研究。所有的病人的平均年龄年。8例患者20例吸烟和糖尿病患者的数量和刻意是87年和106年,分别。在以前的研究中,我们聚集早期AVF的属性失败,使用描述性方法患者(20.]。
在本研究中,我们有两个数据集的血管手术:一个数据集收集期间从2005年到2006年的99名患者和包含36个参数都有早期AVF失败;第二个数据集收集从2010年11月和12月包含25参数生存其中94例患者87例的手术和其余的患者(7)早期AVF失败。所以,通过合并这两个数据集有106患者早期AVF失败和87名患者没有AVF失败。
2.2。数据参数
我们合并两个数据集,发现八相似参数,其中每个病人的特点是七个属性:年龄(年龄的患者),性别(男性或女性)、htn(高血压),DiabetesM(糖尿病)、血红蛋白(血红蛋白),吸烟(是或否),和位置(AVF臂或径向的网站)。最后一列血栓形成(是的:失败或没有:生存)是指定的类属性。所以我们获得最后一个数据集与193的参数记录(病人),其中包含106例失败和87例的残留。
2.3。方法
在本研究中,我们使用监督数据挖掘技术来预测早期AVF失败和确定的危险因素有重要的作用。有许多在Weka运营商数量的可能的选择;我们进行了许多类型的他们,咨询医生关于决策树(DT)获得的。的选择算子的基地,其提取DT包含帮助下血管手术的新知识,最后由于预测方法之间最好的准确率(我们将会看到“分析验证”的一部分)。抽样数据预测(和训练患者的数量)是随机选择的。我们报告的简要描述学习者算法用于这项工作:JRIP J48。
科恩JRIP规则学习者提出了学习算法的优化版本IREP(增量减少错误修剪);JRIP实现重复增量减少修剪产生错误(开膛手)在Java中,介词规则学习者(21]。规则为每个类创建的训练集,然后修剪。在这个算法中,发现知识表示形式的if - then规则,预测已成为一个高级的优势和符号知识表示贡献对发现的可理解性知识(22]。该方法是基于规则集的建设所有的正面例子。最初,当前的训练集划分为若干个例子两个子集,越来越多的设置和一套修剪。规则是由日益集中的例子。规则集初始化一个空的规则集和规则逐步添加到规则集,直到没有负面的例子。之后,JRIP替换或修改个人规则通过减少错误修剪为了增加规则的准确性。它取代或修正个人规则通过减少错误修剪。修剪规则算法需要在账户只有最后一个序列规则的条件和排序删除,最大化函数(23]。
J48决策树就是著名的昆兰的实现算法(C4.5) [24),这是一个改进算法,源于基本的ID3感应系统使用标准TDIDT(自上而下的决策树归纳)方法,递归划分成更小的数据子集基于一个属性的值(24,25]。的“修剪”版本J48减少过度拟合数据的机会(26]。这个分类器构建一个给定数据集,决策树的节点代表歧视规则作用于选择性特性通过递归分区的数据,使用深度优先策略。算法使用的每个属性可以用来做决定的数据分割成更小的子集的数据。来做这个决定,该算法考虑所有可能的测试,可以将数据集和精心挑选了一个测试,给出了信息增益最高。每个离散属性,一个测试结果为每个不同的值的属性。对于每一个连续属性,二进制测试涉及的每一个不同的价值属性。为了收集所有这些二进制的熵增加测试效率,属于节点考虑训练数据集进行排序的值连续属性和二进制的熵增加减少基于每个不同值计算在一个扫描排序的数据。然后选择一个新特性和分裂过程是递归的方式对每个属性重复直到进一步的分裂是不赚钱的。在生成的树结构;树中的每个内部节点对应一个属性,每个分支代表一个可能的值或范围的值的属性,每片叶子代表目标属性的预测价值(23]。
数字(括号)结束时每片叶子的例子告诉我们这叶子。如果一个或多个叶子不纯(=所有相同的类),的数量是不是也会给出例子,削减后(“/”)27]。
2.3.1。规则挖掘
首先,我们在七参数分析,不考虑侧动静脉的数据(位置属性)在这个阶段。我们提取规则嵌入数据,使用“JRIP”操作符。这个分类器实现了一个命题规则学习者从数据。获得的规则表1显示确定糖尿病(DM)的角色AVF失败。
|
||||||||||||
跑后提取的树J48数据显示吸烟和糖尿病危险因素(图1)。
第二个操作符是“学习者”,其结果如表所示2。
|
||||||||||||||||||||||||||||||||||||
如果我们考虑AVF的参数“位置”在我们的分析中,提取的规则如表所示3。从表2和3看来,“htn”(高血压)是一个非常重要的参数。
|
||||||||||||||||||||||||||||||||||||||||||||
我的预测。现在我们选择训练数据,从原始数据通过“分层抽样”方法。为此,我们选择;然后选择20个样本,11号都在课堂上“是”和9数字在课堂上“没有。”规则,隐藏在这部分数据将被检测到系统培训后使用决策树,如图2。
因此,在选定的数据之上,三个参数有重要的角色:年龄,吸烟,和糖尿病。现在我们预测AVF失败是第一种方法,如表所示4。所以,新领域将创建“预测”(失败)。
|
||||||||||||||||||||||||||||||||
预测二世。在第二个方法由“绝对分层抽样”和系统训练J48树,我们确定图的树3。
因此,AVF故障预测是由于表5。
|
||||||||||||||||||||||||||||||||
比较预测结果表4和5的结果表明,方法二是接近真实的事件。准确评估部分中我们将看到这一事实;还在这里我们表示,最近在相应的数据表、图3更符合医学经验的外科医生。因此我们喜欢图3在图2并遵循“吸烟”和“糖尿病”的角色(在图3)是更有效的比“年龄”(在图2)作为早期高危因素AVF失败。
3所示。结果
存在的糖尿病或在HD患者吸烟增加早期AVF的手术失败。我们设计了两种应用方法,预测风险因素的并发症61.66% - -74.61%的准确率。然后我们添加了数据的AVF手里(位置)的数据和预测这种并发症与准确率在67.91%和75.13%之间。结果支持了令人印象深刻的角色AVF失败的风险因素。我们发现“糖尿病”、“吸烟”和“高血压”AVF失败年初有重要的作用,这是更有效的角色比其他因素,如“年龄”。
3.1。方法评估
在我们的研究中,如前所述,的单独影响糖尿病、吸烟、高血压,分别确定按照提取规则(在表1- - - - - -3)。也可以找到一起的角色人物1- - - - - -3。如前所述,我们设计了两种抽样方法和系统训练和分析他们。此外我们测量这些方法的准确率,看到他们的利率在61.66%和74.61%之间(表6和7)。
|
||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||
在第一种方法(分层抽样和系统训练和决策树),我们有准确率61.66%(表6)。
方法2将测量的准确率74.61%(表7)。
因此由于准确率,第二个方法的预测结果比1更好的近似方法。因此我们表示,糖尿病和吸烟在AVF失败(即比年龄更有效。1),更高的因素树的方法。
最后,我们添加了手术侧参数(位置)我们也调查了其他两个方法使用“神经网络”和“朴素贝叶斯。“然后我们预测早期AVF失败更好的准确率67.91% - -75.13%的说一个重要的角色”的位置。所以我们获得的数量”预测患者/没有任何最近的早期AVF失败”和速度表的方法8。
|
||||||||||||||||||||||||||||||||||||||||
比较以上结果与真实的最终点,记住,我们有193个失败的106例患者和87例动静脉的生存。
4所示。讨论和结论
从血管手术中提取潜在的知识信息显示,使用数据挖掘技术。提出的动静脉瘘早期现象的分析我们可以发现脆弱的病人和确定决定使用动静脉或替换通过其他方法如AVG。最终好处是诊断和控制危险因素的患者或提出建议。
在本研究中,我们发现高危因素和预测AVF早期失效的风险患者,使用监督技术。这些方法给医院的专家系统更好的功能。科学预测和控制AVF失败可以帮助实现目标的百分比AVF普遍使用高清人口。此外,AVF失败的预测有重要作用计划在这些情况下:如果失败的比例高,他们可能使用其他手术方法如AVG;如果瘘失败的风险很低,他们可以使用相同的方法(AVF),但提出建议病人和他/她的家庭,比如在什么水平应该保持手术后病人的血压。
我们检查了早期AVF失败的风险因素在血管手术。这项研究是研究血液透析(HD)患者的现实社会,我们得出的结论是,糖尿病,吸烟,高血压是早期AVF失败的危险因素。我们使用数据挖掘技术和设计这种并发症的概率预测方法来预测新的HD患者已经被研究者称为动静脉手术。
总之,这些结果使早期检测的患者有更高的风险,可以引导外科医生选择手术。此外,我们的额外的临床结果,提出了决定选择更有用的血管访问方法来指导外科医生,提高病人安全。最后,我们证明的必要性,利用数据挖掘技术来发现临床相关知识。
缩写
| 动: | 动静脉瘘 |
| AVG: | 动静脉移植 |
| 疾病预防控制中心: | 疾病控制和预防中心 |
| CKD: | 慢性肾脏疾病 |
| CVC: | 中央静脉导管 |
| 糖尿病: | 糖尿病 |
| DT: | 决策树 |
| 迹象: | 终末期肾脏疾病 |
| 高清: | 血液透析 |
| 惠科电子: | Hasheminejad肾中心 |
| IREP: | 增量减少错误修剪 |
| 知识发现(KDD): | 在数据库知识发现 |
| 女士: | 理学硕士 |
| NKF: | 国家肾脏基金会 |
| 开膛手: | 减少重复增量修剪产生误差 |
| TDIDT: | 自上而下的决策树归纳 |
| 计算: | Tarbiat Modares大学里 |
| TUMS: | 德黑兰大学医学科学 |
| USRDS: | 美国肾脏数据系统 |
| 弗吉尼亚州: | 血管的访问。 |
信息披露
本文从成功辩护论文题为“瘘手术失效分析的数据挖掘方法在血液透析患者”的第一作者(m . Rezapour)工程硕士的学位。本文的作者和合作者都没有任何直接或间接金融与商业标识,本文中提到的“快速矿工,”。
引用
- m·k·德z Omrani: Najmi et al .,“患病率和生存的血液透析血管通路的终末期肾病(ESRD)患者德黑兰,伊朗,”伊朗医学年鉴,3卷,不。8日,37-40,2006页。视图:谷歌学术搜索
- j .诉印度“老年患者透析血管通路选择”,美国肾脏学》第六卷,没有。2、128 - 130年,2011页。视图:谷歌学术搜索
- r . Fluck和m . Kumwenda,”英国肾血管访问协会临床实践指南,2008 - 2011,“最终版本,2011年,http://www.renal.org/Libraries/Guidelines/Vascular_Access_for_Haemodialysis_-_FINAL_VERSION_-_05_January_2011.sflb.ashx。视图:谷歌学术搜索
- 杰拉尔德,“先瘘导致导管使用的增加,6年争议透析访问,”血管杂志访问,10卷,第285 - 284页,2009年。视图:谷歌学术搜索
- g . a . Beathard·阿诺德·j·杰克逊et al .,“积极治疗瘘早期的失败。医生运营商论坛RMS的生命线。”肾脏国际卷,64年,第1494 - 1487页,2003年。视图:谷歌学术搜索
- 美国法、g . Piatetsky-Shapiro和p·史密斯,“从数据挖掘在数据库知识发现,“人工智能杂志,17卷,不。3,37-53,1996页。视图:谷歌学术搜索
- g h . c . Koh和棕褐色,“医疗数据挖掘应用程序”,医疗信息管理杂志》上,19卷,不。2、64 - 72年,2005页。视图:谷歌学术搜索
- 他,“预测解决方案给决策者带来更多权力,”健康管理技术,20卷,不。10、12 - 14,1999页。视图:谷歌学术搜索
- r . Bellazzi c . Larizza p·马尼,r . Bellazzi”时态数据挖掘的质量评估血液透析服务,“人工智能在医学上,34卷,不。1、25 - 39页。2005。视图:出版商的网站|谷歌学术搜索
- m·f·Bries数据挖掘建模的血液透析病人血红蛋白:探索[硕士论文)爱荷华大学,2007。
- t·克诺尔蒂米·l·施密特,约翰,”识别病人风险:挖掘透析治疗数据,”合作分类和数据分析施普林格,页131 - 140年,柏林,德国,2009年。视图:谷歌学术搜索
- y Altintas, h . Gokcen m . Ulgu et al .,“根据风险水平分析风险因素的相互作用对血液透析病人在土耳其:数据挖掘应用程序中,“Gazi大学科学杂志》上,24卷,不。4、829 - 839年,2011页。视图:谷歌学术搜索
- 疾病控制和预防中心(CDC),国家慢性肾病简报:一般信息和国家估计在慢性肾脏疾病在美国,2010年美国卫生和人类服务部(HHS),疾控中心,亚特兰大,乔治亚州,美国,2010年。
- 国家肾脏基金会(NKF),“关于慢性肾脏疾病(CKD)的事实,“国家肾脏基金会,2012年,http://www.kidney.org/kidneydisease/aboutckd.cfm。视图:谷歌学术搜索
- m . Rambod和f . Rafii”,感知到的社会支持和伊朗的血液透析患者的生活质量,”护理学杂志》,42卷,不。3、242 - 249年,2010页。视图:出版商的网站|谷歌学术搜索
- s . c .比赛b . g .光秃秃的,j·l·亨克尔和k·h·奇弗,医疗外科护理学Lippincott Williams &威尔金斯,费城,宾夕法尼亚州,美国第11版,2008年版。
- USRDS, 2010年度数据报告,USRDS终末期肾病事件和流行季度更新,2010年,http://www.usrds.org/qtr/default.aspx。
- m . Aghighi a Heidary Rouchi, m . Zamyadi et al .,“透析在伊朗,”伊朗肾脏疾病杂志》上,卷2,不。1,11 - 15号,2008页。视图:谷歌学术搜索
- j . Ethier特区门德尔松,s . j . et al。“血管访问使用和结果:一个国际视角透析结果和实践模式的研究中,“肾脏透析移植,23卷,不。10日,3219 - 3226年,2008页。视图:出版商的网站|谷歌学术搜索
- m . m . Sepehri m . Khavanin陈守煜,m . Rezapour et al .,“瘘手术失效分析的数据挖掘方法在血液透析患者中,”生物医学工程18伊朗研讨会论文集(ICBME 11)2011年12月,页15 - 20,。视图:出版商的网站|谷歌学术搜索
- w·科恩,“快速有效的规则归纳”学报》第12届国际会议在95年机器学习(ML),第123 - 115页,1995年。视图:谷歌学术搜索
- i . h .威滕·m·弗兰克,m·a·霍尔数据挖掘:实用机器学习工具与Java实现技术,摩根考夫曼,旧金山,加州,美国第3版,2011年版。
- a . b . s . Serapiao和a·c·Bannwart”知识发现三相垂直流分类模式的重油的压降和流量数据,”《石油工程ID 746315条,卷。2013年,8页,2013。视图:出版商的网站|谷歌学术搜索
- j .昆兰C4.5:机器学习项目摩根考夫曼,旧金山,加州,美国,1993年。
- g . Ilczuk r . Mlynarski a . Wakulicz-Deja a . Drzewiecka和w·Kargul“粗糙集技术对于医学诊断系统,”美国心脏病学电脑2005年9月,页837 - 840。视图:出版商的网站|谷歌学术搜索
- p·科恩和d·詹森”,在拟合解释道:“在学报第六届国际研讨会在人工智能和统计,第122 - 115页,1997年。视图:谷歌学术搜索
- e . r . r . Bouckaert弗兰克,m . et al。WEKA手册版本3-6-0新西兰怀卡托大学汉密尔顿,2008年。
版权
版权©2013年穆罕默德Rezapour等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。