文摘
痴呆是一个日益严重的问题,在全世界影响老年人。更准确的评价痴呆诊断可以帮助在医学检查。提出了几种方法计算机辅助痴呆诊断使用磁共振成像扫描来区分阿尔茨海默病(AD)患者或轻度认知障碍(MCI)和健康对照组(NC)。尽管如此,计算机辅助诊断是特别具有挑战性,因为异构和中间MCI的性质。我们地址自动痴呆诊断通过引入一个新的监督pretraining方法,利用人工神经网络(ANN)的复杂分类任务。建议初始化一个安基于线性预测来实现更多的歧视空间。这样的预测是通过最大化为中心内核对齐标准估计评估磁共振成像数据内核之间的关联矩阵和标签的目标矩阵。结果,进行线性嵌入允许占特性贡献最MCI阶级歧视。我们比较两个无监督的监督pretraining方法初始化方法(autoencoders和主成分分析)和2014年表现最好的四个分类方法CADDementia挑战。因此,我们的建议优于所有基线(7%的分类精度和receiver-operating-characteristic曲线下的面积)它降低了类偏置。
1。介绍
在2010年,超过60岁患有痴呆症的人数估计在3560万年全世界,这个数字将翻倍,未来20年(1]。事实上,世界卫生组织和国际宣布阿尔茨海默病痴呆作为公共卫生重点,鼓励阐明政府政策和促进行动在国际和国家水平(2]。阿尔茨海默病(AD)是最被诊断患有痴呆症引起的慢性疾病,需要非常昂贵的医疗费用,生活安排和疗法。因此,人们正在采取措施改善治疗可能会推迟,至少一年广告的出现和发展,导致减少的病例数9数百万[3]。广告可以通过预测转换早期诊断痴呆从轻度认知障碍(MCI)的状态,特别是增加广告风险(4]。
在这方面,早期诊断与干预措施的有效性直接相关(5]。随着临床历史,神经心理测试,实验室评估,联合临床诊断的广告还包括神经成像正电子发射断层扫描技术(PET)和磁共振成像(MRI)。这些技术通常包含在常规检查排除继发性病理原因(如肿瘤)6,7]。然而,图像质量相关因素和放射科医生的经验可能会限制其使用8]。处理这个问题,量化生物标记物的成像进行自动评估已被证明为痴呆诊断提高性能。在广告的具体情况,有两组广泛研究生物标志物:(i)的大脑淀粉样β蛋白模式,如低脑脊液(CSF)和淀粉PET成像,(ii)神经损伤或退化的措施如脑脊液τ测量,PET,萎缩在结构磁共振成像(9]。因此,结构磁共振成像已经成为有价值的生物标志物评估因为这解释了发生的结构性变化的无损伤技术,认知障碍(10]。
为目的的自动诊断,实现第一阶段是structure-wise从可用的MRI数据特征提取,包括分布形态测量学、体积、厚度、形状和强度的关系。尽管如此,更多的关注通常关注的分类方法由于其强大的影响力在整个诊断系统。关于神经退行性疾病,报告的分类器的范围从简单的方法(最近的邻居(11),线性判别分析(12),支持向量机(13),随机森林14),和回归15])的组合分类器(16]。最上面的方法评估了2014年CADDementia挑战旨在重现的临床诊断主题的多类分类问题三个诊断组(17),阿尔茨海默氏症诊断病人,与MCI科目,和健康对照组(NC),考虑到他们的t1加权磁共振成像扫描。结果,表现最好的算法取得了63.0%的准确性和下一个区域receiver-operating-characteristic曲线(ROC)的78.8%。然而,报道真阳性数控和MCI,利率是96.9%和28.7%,分别导致类偏置。
一般来说,痴呆从MRI诊断仍然是一个挑战性的任务,主要因为轻度认知障碍的本质;即有一个异构和数控和广告之间的中间类别诊断组,从主题可能转换为广告或返回到正常的认知4]。为克服这一缺点,机器学习工具开发的人工神经网络(ANN)提高痴呆诊断,提出以下优点(18,19]:(i)处理大量数据的能力,(2)减少俯瞰相关信息的可能性,和(3)减少诊断时间。
尽管如此,安实现初始化深架构的基本过程(称为pretraining)可由培训深度网络优化直接利益的监管目标,从一组随机初始化参数。然而,这种策略在实践中表现不佳20.]。目的是提高每个initial-random猜,当地无监督则被认为pretrain每一层逐步,试图产生一个有用的高级描述基于邻低级表示前一层的输出。特殊的使用无监督学习的例子有以下:限制玻耳兹曼机(21],autoencoders [22],稀疏autoencoders [23),和贪婪layer-wise无监督学习是最常见的方法,学习一个层的体系结构(24]。虽然无监督pretraining生成隐藏表示比输入空间更有用,许多的特性可能是无关紧要的歧视任务(25,26]。
在这篇文章中,我们受益于安优势对于复杂的分类任务引入小说监督安初始化方法致力于自动化痴呆诊断。拟议中的pretraining方法搜索一个线性投影到更加分化的空间,这样产生的嵌入特性和标签变得尽可能相关。因此,获得安架构应该匹配更好监督训练数据的性质。考虑到一个事实,即安直接与其他方法产生更强的杂交模式为解决复杂和计算量大的问题27,28),我们也将内核理论评估预测数据之间的关联和可用的标签。使用内核的方法提供了一个优雅,功能分析框架的任务,收集多个信息源(例如,特性和标签)的最小方差无偏估计回归系数和最小二乘估计的随机变量(29日]。此外,我们考虑集中内核对齐标准内核之间的亲和力测量数据矩阵和目标标签矩阵(30.,31日]。结果,贡献的线性特性嵌入允许占大多数的阶级歧视。
本文的组织结构如下:部分2首先描述了数学背景学习使用CKA和ANN预测分类。部分3介绍的所有实验进行优化算法参数与盲数据和评价方案。然后,实现章节中讨论的结果4。最后,部分5给出了结论和未来的研究方向。
2。材料和方法
2.1。使用人工神经网络的分类
在分类框架,一个分层安认为预测所需的类标签组通过前馈的电池确定性转换,实现的隐藏层输入空间映射网络输出如下(27]: 在哪里是th偏移向量,是th线性投影,的大小吗层。这个函数适用于饱和非线性,element-wise操作。在这里,我们选择标准的s形的,表示如下:
第一层(1)(例如,)是传统调整输入特征向量。反过来,输出层预测提供的类时加上一个目标成损失函数。在实践中,可以由输出层非线性softmax函数描述如下: 在哪里是th元素,是th排,是正的,。
softmax函数的选择背后的基本原理是,每个产生输出可以用来估计量的,这样的解释涉及到与输入模式相关联的类。在这种情况下,通常将softmax损失函数对应的-条件对数似:
因此,预期的值对是最小的偏见和加权矩阵。
2.2。安Pretraining使用内核居中对齐
让输入特征矩阵的大小该基金持有轨迹,让是一个维随机过程。为了编码两个轨迹之间的亲和力,我们确定以下核函数: 站内积和从原始域映射,再生核希尔伯特空间理论,复制内核希尔伯特空间(),。作为一个规则,它认为,所以可以假定。然而,不需要计算直接。相反的,著名的内核的技巧是用于计算(5)通过正定和无穷可分核函数如下: 在哪里是一个距离算子实现正定核函数一个内核矩阵从应用程序的结果在每一对样品假设随机过程的协方差估计量吗再生核希尔伯特空间理论的。
改善系统性能的目的而言,学习速度和分类精度,我们之前的标签知识引入到初始化过程。因此,我们计算两两之间的关系通过引入内核特性相似矩阵特征向量该元素如下: 与是一个距离运营商实现正定核函数,是一组输入标签对吗和,类的数量确定。
因为我们寻找一个合适的权重矩阵初始化安优化,我们依赖于距离上所定义的维空间由以下逆协方差矩阵: 在矩阵持有的线性投影,。
基于已经估计特征相似,我们建议进一步学习矩阵通过添加会员关于可行的样本的先验知识(例如,健康或患病组)封装在一个矩阵与元素。因此,我们测量之间的相似性矩阵和通过下面的函数集中内核对齐(CKA) [32]: 在哪里,是一个定心矩阵,是一个所有元素向量,和分别代表弗罗贝尼乌斯的内积和规范。
因此,集中版本的一致性系数导致更好的相关性估计相比,其偏心版本(31日]。因此,描述的CKA成本函数,(9通过学习矩阵),突出相关的特性最能匹配所有生成的特征向量之间的关系,提供目标类。因此,我们国家优化问题计算投影矩阵如下: 因此我们初始化安的第一层。
此外,加权矩阵可以分析的输入特性集建筑的贡献相关向量投影矩阵的计算功能在以下形式: 在哪里是将每一个的重量吗th特性隐藏的神经元。代表平均算子。主要介绍了相关性背后的假设(11)是更大的值估计嵌入的依赖性越大对输入属性。
3所示。实验装置
自动化、计算机辅助诊断系统介绍了基于人工神经网络的分类结构磁共振成像(MRI)扫描按照以下三个神经系统类:正常控制(数控),轻度认知障碍(MCI)和阿尔茨海默病(AD)。图1说明了该方法的方法论的发展。
3.1。ADNI数据
本文的数据用于制备得到的阿尔茨海默病的神经影像学(ADNI)数据库(http://adni.loni.usc.edu/),于2003年由美国国家老龄化研究所(NIA),国家生物医学成像和生物工程研究所(NIBIB),美国食品和药物管理局(FDA),私营制药公司和非营利组织。ADNI的主要目标是测试是否连环磁共振成像(MRI),正电子发射断层扫描术(PET),其他生物标记,可以结合临床和神经心理学评估衡量轻度认知障碍(MCI)的进展和早期阿尔茨海默病(AD)。从ADNI 1, ADNI 2, ADNI阶段,我们选择的一个子集受试者与扫描,指出“最好”的质量分数。因此,选择的子集图片有三个类标签上面描述;。此外,一个随机的子集数据为优化选择和培训阶段,而剩下的是为了测试目的。此外,图像与一个“部分”质量分数被选为了评估在更复杂的成像条件下的性能。表1简要描述ADNI选择群体的人口统计信息。
3.2。核磁共振数据的处理
我们使用FreeSurfer, 5.1版本(免费提供(http://surfer.nmr.mgh.harvard.edu/),广泛使用和广泛验证大脑核磁共振分析软件包),处理结构的大脑核磁共振扫描和计算形态测量33]。FreeSurfer地貌形态示量程序都被证实两次试验法的可靠性在扫描仪制造商和跨领域的优势(34]。全自动FreeSurfer管道,包括下一个程序:watershed-based头骨剥离(35Talairach],转换,一个强度归一化和偏压场校正36),灰色/白色边界问题,拓扑的镶嵌校正(37),和一个表面变形(38]。因此,皮质表面之间的白色和灰色的表示问题,软膜的表面,分割白质的大脑得到休息。FreeSurfer计算structure-specific体积、面积和厚度测量。皮质卷和皮层下卷是归一化的主体的颅内总额(eTIV) [39]。表2总结了五个特性集提取对于每一个主题,这是连接到特征矩阵与维和。
3.3。ANN模型的调优参数
给定的输入核磁共振特性的分类神经系统类,我们使用前馈人工神经网络与一个隐藏层:固化和与产出的神经元。一个详尽的搜索进行调优单个自由参数,即隐层神经元的数量()。我们也比较我们的建议对autoencoders(为)20.)和著名的主成分分析(PCA)的初始化阶段。所有这些方法(PCA,为和CKA)提供一个投影矩阵与一个输出维度,在这种情况下,相当于隐藏层的大小。因此,预测结果作为第一层的初始权重。此外,偏见和输出层权值是随机初始化。不同数量的神经元,人物2显示每个考虑策略的准确性结果初始化使用5倍交叉验证方案。因为我们寻找最准确和稳定的网络配置,我们选择最优净mean-to-deviation比率最高的。搜索结果表明,最好的完成隐藏神经元的数量,,为,主成分分析,分别和CKA方法。
(一)为
(b)主成分分析
(c) CKA
我们进一步分析每个特性的影响有关相关性准则中引入的初始化过程(11)。结果在图的相关性3表明,该CKA方法提高皮层下体积特性时减少大多数皮质体积和平均厚度的影响。提供的每个特性集的相关性为和PCA几乎是相同的。因此,CKA允许从核磁共振相关生物标记物的选择。
(一)为
(b)主成分分析
(c) CKA
3.4。神经系统类的分类器的性能
如表所示3ANN模型,针对三个初始化策略与最好的四个表现方法2014 CADDementia挑战17]。比较算法评估的分类性能,精度(),receiver-operating-characteristic曲线下的面积(来说),真阳性率()标准,分别定义为 在哪里每个类和索引,,样品的数量,真正的优点,和真正的底片吗th类,分别。曲线下的面积的加权平均每个类的ROC曲线下的面积。提出业绩基准方法的报道所面临的挑战图像。尽管测试组织的挑战,本文并不完全相同,数据的数量,他们的特点,盲目设置使这两组等效为评价目的。
见表4比较了分类性能的“最好”的质量测试集算法,提出的方法中,除了表现优于其他的初始化方法相比,表现也优于其它计算机辅助诊断方法作为一个整体。“部分”质量图像,正如预期的那样,所有ANN方法的一般性能降低。尽管如此,总体精度和AUC仍竞争挑战冠军。基于显示ROC曲线和混淆矩阵ANN-based分类器的最优参数设置(见图4),我们还推断,该方法提高了MCI歧视。
(一)为(:64.9)
(b)主成分分析(:80.0)
(c)CKA (:85.3)
(d)为(:47.6)
(e)主成分分析(:63.8)
(f)CKA (:70.9)
4所示。讨论
从上面的验证进行了mri痴呆诊断,以下几方面成为有关安pretraining的发展建议:(我)通常由安最先进的算法实现,提出了初始化方法也有一个免费的模型参数是隐藏的神经元的数目。调整该参数提出了一些进行了详尽的搜索,从而达到最高的5倍交叉验证(见图精度2)。因此,,,选择隐藏神经元CKA,分别为、和主成分分析。结果,建议CKA方法改善其他pretraining ANN方法(有关),减少执行参数灵敏度的额外好处。(2)我们评估每个核磁共振成像特性的影响pretraining过程对于相关准则中引入(11)。如下图3,为每个特性均匀的PCA思考,抑制提取生物标记的能力。相比之下,CKA提高皮层下体积和厚度的影响标准差时减少皮质的贡献量和厚度平均水平。因此,该方法也适用于特征选择的任务。(3)在利益的比较,我们对比发达安pretraining方法与2014 CADDementia最好的四种分类策略,特别是致力于痴呆的分类。从结果,总结在表4,因此,提出CKA优于其他算法在大多数的评估标准和成像条件,提供最均衡的性能在所有类。特别是测试图像,CKA增加点的分类准确性和平均ROC曲线下的面积。值得注意的是,尽管Sørensen方法完成值点高于提议,其性能是偏向于数控,MCI产生一个差值。即CKA进行无偏类痴呆分类的性能。“部分”的图像质量,尽管总体性能降低,CKA安仍然是最好的初始化方法。此外,总体措施仍CADDementia提供的竞争结果的挑战。(iv)图4显示了每个类ROC曲线和混淆矩阵获得的对比方法。在所有情况下,曲线下的面积为数控和广告类和准确性高于MCI类(实现的数字4(一)- - - - - -4 (c))。因此,MCI分类合并的MRI特点仍然是一个挑战性的任务由于以下事实:众所周知的MCI的异质性,MCI的健康个体之间的中间阶级和那些被诊断为老年痴呆症,和MCI的可能性最终转换成广告或数控。此外,混淆矩阵中显示数据4 (d)- - - - - -4 (f)确认数控和广告适合在大多数情况下的区别。然而,MCI类介绍了大多数错误当视为目标和输出类。因此,特定研究轻度认知障碍应该提高诊断(5,40]。
5。结论和未来的工作
在本文中,我们提出一个监督方法初始化人工神经网络的训练,旨在提高痴呆的计算机辅助诊断。给定一组体积、面积、表面和厚度特征提取受试者的大脑核磁共振,检查痴呆诊断任务包括将对象分配给下一个神经组:正常的控制,轻度认知障碍(MCI),或阿尔茨海默氏症。这个痴呆的分类任务是特别具有挑战性因为MCI数控和广告之间的异构和中间的范畴。同时,MCI科目可能转换为广告或回到数控。
为了提高分类的性能,我们把一个矩阵预测样品到更加分化的特征空间,这样投影特性和类标签之间的亲和力是最大化。这样的标准是由集中内核实现对齐(CKA)之间的特性和目标标签内核,提供两个关键好处:(i)唯一的自由参数是隐藏的维度;(2)相关性分析可以介绍寻找生物标志物。因此,我们的建议的安pretraining优于对比算法(分类精度和ROC曲线下的面积),降低了类偏置,导致更好的MCI歧视。
尽管如此,使用CKA意味着几个限制。首先,样本的数量应该大于输入和输出尺寸,以避免overfitted线性预测。我们应对这个缺点通过考虑一个足够大的样本子集用于培训目的(约1300)。其次,达到预测必须始终较低的维度比原始特征空间。在这种情况下,阶级歧视的增强是由于标签和功能之间的亲和力,不是因为增加维度。
作为未来的工作,我们计划在其他神经病理学评估CKA歧视能力任务从MRI预测阿尔茨海默氏症转换从MCI和注意缺陷多动障碍的分类。我们也希望建立一个神经网络训练计划使用CKA作为成本函数。
附录
梯度Descend-Based CKA方法的优化
明确的目标函数的实证CKA (9)的收益率32] 与作为一个常数无关。然后我们考虑梯度下降迭代方法来解决优化问题。为此,我们计算的显函数的梯度(. 1)对作为 在哪里和分别表示对角线运营商和阿达玛的产品。是目标函数的梯度矩阵对内核: 因此,更新规则,考虑到初始猜测,成为 与的步长更新规则,估计投影矩阵迭代
相互竞争的利益
作者声明没有竞争金融、专业或个人利益影响性能或演示本文中描述的工作。
确认
这项工作是支持的而Formacion de Investigadores“Generacion del Bicentenario”2011和研究项目。由COLCIENCIAS 111956933522。除此之外,本研究将不可能没有E-health项目的资金“组织tecnologica这个组织帕洛servicios de teleasistencia emergencias书,seguimiento monitoreo permanente de pacientes y apoyo洛下de prevencion”倘使3-ARTICA。