摘要
客观的。可靠的诊断仍然是老年痴呆症的早期阶段,一个具有挑战性的问题。我们的目的是开发和验证基于机器学习,帮助正常,轻度认知障碍(MCI)的初步诊断的一种新方法,非常轻度痴呆(VMD),和老年痴呆症使用基于线人问卷。方法。我们招收5272人谁填补了37项调查问卷。为了选择最重要的特点,特征选择三种不同的技术进行了测试。然后,上面的功能有六个分类算法相结合用于开发诊断模型。结果。信息增益是三个特征选择方法中最有效的。The Naive Bayes algorithm performed the best (accuracy = 0.81, precision = 0.82, recall = 0.81, andF-测量 = 0.81) among the six classification models.结论。本文提出的诊断模型提供了一个功能强大的工具,为临床医生来诊断老年痴呆症的早期阶段。
1.介绍
老年痴呆症和其他痴呆症是老年人中最常见的疾病,由于其高度的智力缺陷,对家庭和社会来说是沉重的负担。到目前为止,还没有有效的治疗方法来减缓或阻止痴呆症的发展。重点关注早期阶段、及时干预和延误疾病是至关重要的。痴呆的临床诊断是基于患者及其家属提供的详细病史、神经系统检查和神经心理测试。其他检查包括血液学、CT和MRI检查,以排除痴呆的其他原因。神经心理学测试在检测人类认知领域的功能障碍方面起着至关重要的作用。“尽管痴呆的早期诊断有多种临床措施,但仍存在很多主观性[1- - - - - -3.]。开发更好的诊断工具是非常重要的。
认知障碍的准确分类不仅对个体有益,对医学也很重要。在临床诊断中,手工诊断认知障碍是费时的,这可能需要多种信息,如神经心理学测试分数、实验室研究结果、有知识的线人报告等。诊断的效率和准确性取决于医生的专业水平。在一些缺乏专业人员的偏远地区,痴呆症的分类和早期诊断将是一项更加困难的任务。机器学习是一种先进的计算技术,可以提高对医疗数据的分析,自动做出诊断决策[4]。
本文的目的是:(1)优化或甚至降低的,通过使用特征选择算法和(2)开发和验证基于登记对象的诊断信息的精确分类模型用于分类痴呆患者的神经心理测试的次数。
2.材料和方法
从秀传医疗体系的基于寄存器的数据库中选择的参与者。该研究设计是回顾性的,并且对数据进行匿名分析。秀传纪念医院的医学研究伦理委员会(秀传IRB编号:1041208),审查了项目和数据督察批准了研究[5]。数字1显示了我们方法的工作流程。数据集是首先随机分成训练集和测试数据集。特征选择,模型优化,和5倍交叉验证被应用于训练数据来开发和优化诊断模型。最后,模特们用测试数据进行测试,以找到最佳的诊断模型。
2.1。参与者
我们采用了Sun等人的方法。6]。分析5272例患者的临床资料。正常认知(NC)、MCI、VMD或痴呆的定义如下:NC指的是不符合美国老年痴呆协会(National Institute on Aging-Alzheimer 's Association, ia - aa)全因痴呆核心临床标准中列出的任何条件的个体[7的0]和有临床痴呆评级(CDR)的分数[8]。MCI被定义为谁曾在方向和/或判断的域,但没有社会或职业功能损害与损害认知改变,并有CDR得分为0.5的人9]。此外,随着年龄和教育水平调整后的CASI至少有一个认知领域应该受损[10,11]。在社区事务、家庭爱好和个人护理方面,CDR应该是0。VMD是指CDR得分为0.5的符合ia - aa全因痴呆标准的个体[7,在2个或2个以上认知领域有轻度损伤,在日常功能方面有轻度下降,包括社区事务、家庭爱好或个人护理领域,这些领域的CDR应≥0.5。全因痴呆的定义是基于NIA-AA推荐的核心临床标准[7]。不同类型的痴呆是根据每个共识标准诊断。
结构化临床病史从参与者和主要照顾者服用。临床病史被送往检测行为或性格和运作以前的水平任何智力衰退的任何微妙的变化,并确定这是否下降干扰在工作或日常活动能力的功能。除了认知的历史地位,包括CDR客观的评估,筛查仪(CASI)和蒙特利尔认知评估量表(MoCA)认知能力进行评估记忆,执行功能,定位,视觉空间能力和语言功能。老年痴呆症的严重程度,然后由CDR决定。日常功能与日常生活活动(IADL)的规模[的工具性评估9]。神经精神病学(NPI)是用来评估参与者的神经精神症状〔12]。卡西和MOCA的分数评价为诊断模型在这项研究的结果。
随机分为训练集(4745人)建立诊断模型和独立测试集(527人)验证诊断模型鉴别正常、MCI、VMD和痴呆。为了估计泛化误差,该过程独立重复5次,以避免随机划分数据集造成的偏差。我们选择了一组类别分布与实际数据中情况相似的训练集和测试集,类似于分层抽样技术。在训练集中,正常328例,MCI 1234例,VMD 718例,痴呆2465例。在测试组中,51例为正常,113例为轻度认知障碍,98例为VMD, 265例为痴呆。在认知障碍诊断中,神经外科医生通过规范化的神经学检查对研究对象进行访谈,历史询问充分掌握了研究对象的记忆抱怨和临床表现,并完成了CDR评分。诊断小组由认知障碍神经内科的医生组成。对每个研究的神经学检查、病史和神经心理学测试结果进行评估。最后给出了诊断结果。已获得所有参与者的知情同意。
2.2。特征选择
在机器学习中,37个特征在痴呆症的诊断中具有不同的潜在重要性。特征选择可以有效地去除冗余和/或不相关的特征。一方面可以提高机器学习算法的泛化性能和效率;另一方面可以简化诊断程序,提高临床的实用性。在本节中,我们探索了三种特征选择方法,即随机森林、信息获取和释放。
2.2.1。随机森林算法的特征选择
我们可以使用随机森林模型来过滤特征,并得到它们与分类的相关性。由于随机森林固有的随机性,模型可能每次都给出不同的重要性权重。然而,在对模型进行多次运行训练时,在每次运行中,我们选择一定数量的特征,并保留新特征集和在其他运行中选择的特征集之间的交集。经过一定的运行次数,我们终于可以得到一定数量的特性。然后计算出这些特征对应的out- bag错误率,并使用out- bag错误率最低的特征集作为最后选择的特征集。该方法由Python在机器学习软件包中实现[13]。算法说明了随机森林算法的特征选择过程1。
|
2.2.2。信息增益算法特征选择
信息增益是特征选择的一种有效方法。在信息增益方面,标准是衡量特征能给分类模型带来多少信息,所带来的信息越多越重要。信息获取是基于熵理论,熵理论被研究者广泛应用于各种应用场景中。熵是信息论中的一种符号,可以用来评价特征的重要性。香农熵的经典公式是H(x)=− ,哪里是用高斯核估计的概率密度函数。我们使用了在Weka中实现的信息增益算法,Weka是一个强大的基于java的开源机器学习工作台。根据信息增益分值,过滤分值低于阈值的特征。
2.2.3。特征选择的浮雕算法
救济的核心思想是一个好的特征应该使最近邻样本的特征值相同或相似,使不同类别的最近邻之间的值不同或相差很大。该算法的优点是运算效率高,对数据类型没有限制,对特征之间的关系不敏感。救济算法的缺点是,与信息增益等许多特征评价算法不同,救济算法不能去除冗余特征,无论该特征与其他特征是否冗余,算法都会给出各种高度相关的特征。我们使用了Weka中可用的救济算法的实现。
2.3。诊断模式的构建
我们研究了六种不同的分类算法来建立诊断模型,包括随机森林、AdaBoost、LogitBoost、神经网络(NN)、朴素贝叶斯(Naive Bayes)和支持向量机(SVM)。为了优化相应的模型参数并估计性能,我们使用了Scikit-learn Python工具箱和Weka中的实验模式(Experimenter),它允许大规模的实验与存储在数据库中的结果一起运行,以便以后检索和分析。此外,准确性、精密度、召回率和F-measure作为性能指标进行了计算,以评估使用测试集诊断模型。该诊断模型的训练和参数优化,通过5倍交叉验证完成。
随机森林是一种具有多棵决策树的分类器,其输出由大多数决策树的投票决定。它对噪音或过度训练不敏感,因为重新采样不是基于加权。具有较高的精度和计算效率。AdaBoost和LogitBoost都是增强算法,其核心思想是针对同一训练集训练不同的分类器(弱分类器),然后将这些弱分类器组合成一个更强的最终分类器(强分类器)。我们使用多层感知器(MLP)作为NN实现,这是一个前向结构的人工神经网络,它将一组输入向量映射到一组输出向量。朴素贝叶斯是一种基于贝叶斯定理和特征条件独立假设的分类方法。SVM通过搜索最优分离超平面作为最大边缘超平面来解决多类分类问题。
3.结果
试验组的详细人口统计数据见表1。结果表明,认知功能,日常生活活动功能,和恶化,老年痴呆症的阶段神经精神症状的严重程度增加。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
CDR:临床痴呆评定量表;轻度认知障碍;VMD:非常轻微的痴呆;N:参与人数;蒙特利尔认知评估;日常生活工具活动;NPI-sum:神经精神病学量表总分。Post hoc analysis showed CDR 0 < MCI < VMD < CDR≧1;post hoc analysis showed CDR 0 = MCI > VMD = CDR≧1;事后分析CDR 0 = MCI = VMD < CDR≥1。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.1。特征选择
3.1.1。功能的排名
数字2显示功能排序。数字2(a)为信息增益算法中按等级分数排序的特征,图2(b)表示特征在救济算法中按等级分数排序,图2(c)表示特征在随机森林算法中按等级分数排序。
(一个)
(b)中
(C)
3.1.2。特征选择
数字3.示出了根据特征选择算法所选的顶部15的功能。由三个特征选择算法选择的顶部15的功能是不同的。其中通过随机森林选择的特征,有5设有由信息增益的特征常见,4设有那些由救济常见的,和2设有共同与那些由信息增益。在由信息增益选择的功能部件,有12设有那些由救济常见。
3.2。诊断模型优化
我们使用gridSearchCV优化模型的参数。最佳模型参数示于表2。不显示算法的默认参数。
|
|||||||||||||||||||||||||||||||||||||||||||||||||
3.3。诊断性能评估
表格3.展示了六种算法在使用全部37个特征时的分类性能。准确性、精密度、回忆和F-measure报告。The Naive Bayes algorithm performed the best (accuracy = 0.87, precision = 0.88, recall = 0.87, andF-测量 = 0.87) among the six classification models, followed by the MLP (accuracy = 0.87, precision = 0.87, recall = 0.87, andFSVM (accuracy = 0.87, precision = 0.86, recall = 0.87, andF测量= 0.86)。
|
||||||||||||||||||||||||||||||||||||||||||||||||||
|
利用全部37个特征得到结果。 |
||||||||||||||||||||||||||||||||||||||||||||||||||
表格4显示的六种算法下的三个特征选择的分类性能。The Naive Bayes algorithm performed the best (accuracy = 0.81, precision = 0.82, recall = 0.81, andF-测量 = 0.81) among the six classification models, followed by the Random Forest (accuracy = 0.78, precision = 0.79, recall = 0.78, andF-measure = 0.78)和LogitBoost算法(accuracy = 0.76, precision = 0.77, recall = 0.76, andF测量= 0.74)。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
利用特征选择得到结果。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
表格5显示6种分类模型对正常、MCI、VMD、痴呆的诊断结果。利用信息增益特征选择得到随机森林、AdaBoost和朴素贝叶斯的结果;采用随机森林特征选择方法得到LogitBoost和MLP的结果;利用地形特征的选择,得到支持向量机的结果。朴素贝叶斯算法有效地提高了正常(敏感性= 0.84,特异性= 0.94)、MCI(敏感性= 0.62,特异性= 0.93)、VMD(敏感性= 0.72,特异性= 0.93)和痴呆(敏感性= 0.92,特异性= 0.95)分类的总体性能。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
数字4展示了六种分类模型诊断正常、MCI、VMD和痴呆的受试者工作特征(ROC)分析。在六个分类模型中,朴素贝叶斯算法表现最好。ROC曲线下面积(AUC)为0.95。
(一个)
(b)中
(C)
(d)
(e)中
(F)
数字5显示了5轮中每个算法的5次交叉验证的结果。
4.讨论
这项研究的目的是提供基于机器学习的老年痴呆症的早期诊断新的临床工具。为了找到最佳的分类模型,我们比较了使用相同数据的不同特征选择算法和分类算法。我们进行了敏感性分析我们的分类算法测试结果的可靠性。我们的研究结果表明,在特征选择,信息增益表现最好的六个分类模型的三个特征选择算法中。随机森林特征选择算法使稀有类(正常)易于正确分类。其中分类模型,朴素贝叶斯算法执行效果最好,其次是随机森林和LogitBoost算法。
虽然已有多项研究建立了诊断模型,但据我们所知,目前的筛查工具在分类失衡问题和临床适用性方面存在很大的局限性。类不平衡(14- - - - - -16存在于许多现实世界的决策问题中。本文在Random Forest、AdaBoost、LogitBoost中使用的集成学习技术,通过结合不同训练分类器的分类结果,提高单个分类器的准确率;已经证明在处理不平衡问题时可以提高性能[17]。朴素贝叶斯分类器通过将概率乘以类先验概率来自然地处理类不平衡。在支持向量机中,样本越少的类的误分类惩罚越高,可以缓解不平衡。然而,我们的诊断模型的准确性仍有改进的余地。
几项研究[18- - - - - -20在临床应用方面取得了有希望的结果。Bron等人[18]组织了一个大挑战,目的是客观地比较基于临床代表性多中心数据集的算法。这个挑战为计算机辅助诊断痴呆症提供了洞察力。阿莫罗索等人[19使用来自帕金森氏进展标记计划(PPMI)的MRI数据来提取影像学标记并学习一个精确的分类模型。Heister等人[20利用临床可用的MRI和脑脊液生物标记物预测MCI结果。但这些方法在临床应用上存在一定的局限性。本研究还存在临床适用性问题。本文对三种不同的特征选择算法进行了比较,以选择出最优的特征选择算法。但是从结果中可以看出,三种特征选择算法选择的前15个特征是不同的。采用三种特征选择算法同时选择C05和J03特征。随机森林特征选择算法与其他两种特征选择算法共有特征较少,但信息增益和地形特征选择算法选择的12个特征相同。这37个特征所包含的信息是不同的,如何挑选出对分类更有价值的特征仍然是一个需要研究的问题。我们未来的工作将进一步探索采样技术和分类算法,以改进我们的诊断模型。
5.限制
本研究仅在台湾三家医院进行,可能存在选择偏倚。需要更多的医疗中心和受试者进一步验证我们的方法。
6.结论
我们开发和验证新的方法来诊断正常,MCI,VMD,和老年痴呆症。其结果是,信息增益是最有效的三个特征选择方法中的特征选择。随机森林改善所有诊断机型的整体性能。Among the six classification models, the Naive Bayes algorithm performed the best (accuracy = 0.81, precision = 0.82, recall = 0.81, andF测量= 0.81);对正常(敏感性= 0.84,特异性= 0.94)、MCI(敏感性= 0.62,特异性= 0.93)、VMD(敏感性= 0.72,特异性= 0.93)和痴呆(敏感性= 0.92,特异性= 0.95)均有良好的识别结果。
数据可用性
所有相关数据都在论文中。
的利益冲突
作者声明他们没有利益冲突。
致谢
本项目由河南省科技发展计划2020年科技研究项目资助(项目编号:202102210384)和郑州轻工业大学“2019创客空间孵化项目”资助(项目编号:2019ZCKJ228)。这项研究也得到了美国心脏协会第17号airea33700016奖和密歇根理工大学计算机与网络系统研究所(PI:周伟华)的教职员工启动基金的部分支持。
参考文献
- N. Amoroso, D. Diacono, A. Fanizzi等人,“深度学习揭示了MCI受试者的阿尔茨海默病发作:来自一个国际挑战的结果,”神经科学的方法,第302卷,2018年第3-9页。视图:出版商网站|谷歌学术
- “机器学习技术对轻度认知障碍和痴呆的诊断区别”,国立台湾科技大学医学研究所硕士论文第27届AAAI人工智能研讨会论文集,美国华盛顿州贝尔维尤,第71-76页,2013年7月。视图:谷歌学术
- D. Bansal, R. Chhikara, K. Khanna,和P. Gupta,“检测痴呆症的各种机器学习算法的比较分析,”Procedia计算机科学,第132卷,第1497-1502页,2018。视图:出版商网站|谷歌学术
- 刘x,陈k,吴t, D. Weidman, F. Lure, J. Li,“利用多模成像和人工智能诊断早期阿尔茨海默病”,转化研究卷。194,第56-67,2018。视图:出版商网站|谷歌学术
- p .赵h . Tang c, c,和g .挂“NMD-12 :一种新的机器学习中筛查工具发现轻度认知损害和痴呆,”公共科学图书馆·一,第14卷,no。3、文章编号e0213430, 2019年。视图:出版商网站|谷歌学术
- Y.太阳,H.-J.李,S.-C.杨等人,“轻度认知功能障碍和痴呆,包括非常轻度痴呆,在台湾的一项全国性调查,”公共科学图书馆·一,第9卷,no。6,文章ID e100303,2014。视图:出版商网站|谷歌学术
- G. M. McKhann, D. S. Knopman, H. Chertkow等人,“阿尔茨海默病引起的痴呆的诊断:来自国家老年协会阿尔茨海默病诊断指南工作组的建议,”阿尔茨海默氏症和老年痴呆症第7卷,no。3,第263-269页,2011。视图:出版商网站|谷歌学术
- 《临床痴呆评分(CDR):当前版本和评分规则》,J. C. Morris著。神经内科第43卷,no。11, 1993年第2412页。视图:出版商网站|谷歌学术
- M. S.伟业,S. T. DeKosky,D迪克森等人,“轻度认知功能障碍,由于阿尔茨海默氏病的诊断:从对阿尔茨海默病的诊断指南老化,老年痴呆症协会的工作组研究所的建议”。阿尔茨海默氏症和老年痴呆症第7卷,no。3, 2011年270-279页。视图:出版商网站|谷歌学术
- “认知能力筛查工具(CASI):痴呆跨文化流行病学研究的实用测试”,邓丽君、长谷川,a . Homma等,“认知能力筛查工具:痴呆跨文化流行病学研究的实用测试”,国际老人精神科卷。6,没有。1,第45-58,1994。视图:出版商网站|谷歌学术
- K.-N。林,P.-N。王,彭译葶。刘,W.-T。陈,研究。李,H.-C。认知能力筛查工具的分数线,痴呆筛查的中文版,老年痴呆症和老年认知障碍,第14卷,no。4,第176-182页,2002。视图:出版商网站|谷歌学术
- M. P.劳顿和E. M.布罗迪,“老年人的评估:自我维持和工具性日常生活活动,”的老年医学,第9卷,no。1969年第179-186页。视图:出版商网站|谷歌学术
- 刘建民,“计算机语言学习与机器学习”,《计算机语言学习与机器学习》,2012。视图:谷歌学术
- 尹丽君,葛玉英,肖国强,王新春,全新春,“高维不平衡数据的特征选择”,Neurocomputing卷。105,第3-11,2013。视图:出版商网站|谷歌学术
- G. Menardi和N. Torelli,“用不平衡数据训练和评估分类规则”,数据挖掘和知识发现第28卷第2期1,第92-122页,2014。视图:出版商网站|谷歌学术
- B. Krawczyk,M.沃兹尼亚克和G.谢弗,“成本敏感的决策树合奏有效不平衡的分类,”应用软计算,第14卷,第554-562页,2014。视图:出版商网站|谷歌学术
- M. Galar,A.费尔南德斯,E. Barrenechea,H. Bustince,和F. Herrera的,“上合奏的类不平衡问题的综述:bagging-,boosting-,和基于混合的方法中,”IEEE系统,人,与控制,C部分(应用和评论)卷。42,没有。4,第463-484,2012。视图:出版商网站|谷歌学术
- E. E. Bron, M. Smits, W. M. van der Flier等,“基于结构MRI的痴呆症计算机辅助诊断算法的标准化评估:CADDementia挑战”,神经成像,第111卷,第562-579页,2015。视图:出版商网站|谷歌学术
- N. Amoroso, M. La Rocca, A. Monaco, R. Bellotti, S. Tangaro,“复杂网络揭示帕金森病的早期MRI标记物,”医学图像分析, 2018年第48卷,第12-24页。视图:出版商网站|谷歌学术
- D. Heister, J. B. Brewer, S. Magda, K. Blennow, L. K. McEvoy,“用临床可用MRI和脑脊液生物标志物预测MCI结果,”神经内科,第77卷,no。17, 1619-1628页,2011。视图:出版商网站|谷歌学术
版权
版权所有:Fubao Zhu等这是一篇开放获取下发布的文章知识共享署名许可,允许在任何媒体中不受限制地使用、发布和复制原创作品,只要原稿被正确引用。