文摘

乳腺癌是全球女性死亡的主要原因之一。有很多技术用于诊断这种疾病:乳房x光检查,超声波,和活检等。这些都有著名的优点和缺点。一个相对较新的方法,基于温度可能产生肿瘤,最近一直在探索:温度记录。在本文中,我们将评估温度记录在乳腺癌的诊断能力使用贝叶斯网络分类器。我们将展示如何热图像提供的信息可以用于描述疑似癌症患者。我们的主要贡献是得分的建议,根据上述信息,这可能有助于区分病人与健康的。我们的主要结果显示该技术的潜力在这样一个目标,但也显示其主要限制必须克服认为这是一种有效的辅助诊断工具。

1。介绍

乳腺癌是全球女性死亡的主要原因之一(1]。此外,这种疾病的特异性诊断中需要考虑到一个不正确的分类样本的假阳性可能导致乳腺癌的手术切除(2]。如今,有不同的技术进行诊断:乳房x光检查,超声波,磁共振成像,活检,,最近,温度记录3- - - - - -6]。事实上,温度记录始于1956年(7但丢弃一些年后因为质量差的热图像(8)和特异性较低价值实现。然而,随着新的热成像技术的发展,温度记录再次出现,正在认真考虑作为乳腺癌的诊断的辅助工具(9]。因为所需的特异性,是强制性的尽可能多的可用工具来减少,一方面,假阳性的数量,另一方面,实现高灵敏度。虽然开放活检被认为是黄金标准技术诊断乳腺癌,它几乎是最后的诊断资源使用,因为它是一种侵入性手术代表不仅严重影响健康,而且心理和经济的10]。其他技术不一定是侵入性的,隐含的风险或局限性,如x射线曝光,interobserver可解释性和困难获得高科技昂贵的设备(11,12]。温度记录也非侵入性,但它的优点是使用更便宜的设备(红外摄像头),远比那些更方便用于乳房x光检查,MRI和超声。此外,它可以认为一些变量考虑温度记录可能比这些更容易解释上述的一些技巧。事实上,在本文中,我们将探索和评估这个论点为了测量的潜在技术作为乳腺癌的诊断工具。此外,我们的主要贡献是得分的建议,不仅基于thermographic变量还比温度变量描述更多的信息,这可能有助于区分病人和健康的。我们还将探索潜在的温度记录在诊断女性50岁以下,这将允许检测疾病的早期阶段,从而降低死亡率的比例。

剩下的纸是划分如下。节2,我们将呈现一些相关研究,我们的研究在上下文和赞赏我们的贡献。节3我们解释我们的实验中使用的材料和方法。节4,我们将目前的方法和实验结果。节5,我们将讨论这些结果,最后,在部分6,我们将结束我们的论文,关于未来的研究方向。

在相关文献的回顾,我们把这些分为三类:入门,基于图像和基于数据的工作13- - - - - -17]。介绍性的研究主要指出潜在的温度记录作为替代治疗乳腺癌的诊断工具比较其性能和其他诊断方法,如乳房x光检查和活检18,19]。不幸的是,由于本研究的目的是介绍这个话题,它缺乏一些重要的细节在这些研究中使用的数据以及分析。

基于图像的作品主要从集群分析应用于热图像(健康与生病的乳房)20.)分形分析恶性病变的几何特征()(21)捕获热图像的相机校正(3,22]。

基于数据调查的统计分析病人数据库(健康和生病)等非参数测试,相关性,和方差分析;人工智能人工神经网络和贝叶斯分析等分析;和数值模型,如物理和仿真模型(bioheat方程)8,9,23- - - - - -26]。只有少数的论文提出一个分数由thermographic数据(27,28),但他们只提出最多5变量形成这样一个分数。在我们的研究中,我们提出了14个变量来计算这个分数:这是这篇论文的主要贡献和分析诊断能力的变量。节3,我们将详细描述这些变量,在部分4,我们将评估信息这些变量在乳腺癌的诊断。结束本节,是很重要的,虽然这一类非常有趣的研究,其中的一些方法还不清楚。这可以防止一个轻松复制实验。我们已经尽力呈现一个清晰的方法,这样我们的结果可以复制。

3所示。材料和方法

3.1。数据库

在我们的实验中,我们使用一个真实的数据库,是由一位肿瘤学家专业提供温度记录的研究自2008年以来,包括98例:77例乳腺癌患者(78.57%)和21例健康的病人(21.43%)。所有的结果(生病或健康)经开放活组织检查,这被认为是乳腺癌的金标准诊断方法(29日]。我们包括在这项研究14解释变量(属性):8人组成我们的分数(专家提出的),6得到的热图像,一个变量是分数本身,和最后一个变量是年龄在三个类别,这是推荐离散选择的算法(30.- - - - - -32]。在表1我们提供详细的名称,定义和每个变量的值。因变量(类)的结果(癌症或没有)。

3.2。贝叶斯网络

一个贝叶斯网络(BN) [33,34)是一个图形化模型表示变量之间的关系的概率自然的兴趣。这种网络由一个定性部分(结构模型),它提供了一个交互的可视化表示变量,定量部分(组局部概率分布),它允许概率推理和数值措施一个变量或一组变量的影响。定性和定量的确定一个独特的部分变量的联合概率分布在一个特定的问题33- - - - - -35]。换句话说,一个贝叶斯网络是一个有向无环图组成的36]:(a)节点(圈),它代表了随机变量;弧(箭头),它代表概率这些变量之间的关系,为每个节点(b),有一个当地的概率分布,这取决于其父母的状态。

数据34(见部分4)十亿年的例子。这个模型的优势之一是它允许联合概率分布的表示在一个紧凑和经济的方式通过广泛使用的条件独立,所示(1): 在哪里 代表的父节点的集合 ,即节点和弧指向 。方程(1)也显示了如何恢复当地的联合概率从产品条件概率分布。

3.2.1之上。贝叶斯网络分类器

分类是指分配类标签标记的任务实例。在这样一个任务,给定一组无标号的情况下,一方面和一组标签,要解决的问题在于找到一个合适的函数匹配每个标记实例对应的标签(类)。可以推断出,中央这个特定的兴趣领域的研究是自动分类器的设计,可以估计这个函数从数据(在我们的例子中,我们使用贝叶斯网络)。这样的学习被称为监督学习(37- - - - - -39]。为了简洁而缺乏空间,我们没有写在这里的代码2程序中使用的测试进行研究。我们只有短暂的描述,参考读者原有的来源。程序中使用这些测试(a)朴素贝叶斯分类器,Hill-Climber (b)和(c)重复Hill-Climber [38,40,41]。(一)朴素贝叶斯分类器(NB)是一种最有效的分类器(38)和先进的分类器的基准进行比较。其主要诉求在于它的简单性和准确性:尽管其结构总是固定(弧指向每个属性类变量),它已经表明,该分类器分类精度高和最优贝叶斯的错误(见图3,部分4)。简而言之,NB学习,从训练数据样本,每个属性类的条件概率。一旦到达一个新的情况,NB使用贝叶斯法则的条件概率来计算类的设置属性选择的价值最高的类的后验概率。(b)Hill-Climber Weka的(41实现搜索和评分算法,它使用greedy-hill-climbing [42]的搜索部分和不同指标评分部分,如贝叶斯信息准则(BIC),贝叶斯狄利克雷(BD) Akaike信息标准(AIC)和最小描述长度(MDL) [43]。这里的实验报告,我们选定的MDL度量。这个过程需要一个空图和数据库作为输入,并适用于不同的运营商建立贝叶斯网络:添加,删除,或弧形的逆转。在每个搜索步骤中,它看起来结构,最大限度地减少MDL分数。在每一步,MDL计算和程序Hill-Climber保持最好的结构(最小)的分数。完成搜索后没有新的结构提高了MDL得分之前的网络。(c)重复Hill-Climber Weka的(41)实现搜索和评分算法,它使用重复的贪婪爬山(42]的搜索部分和不同指标评分部分,如BIC、BD、AIC和MDL。这里的实验报告,我们选定的MDL度量。简单Hill-Climber算法相比,重复Hill-Climber需要作为输入一个随机生成的图表。它还需要一个数据库和应用不同的运营商(添加、删除或逆转的弧)并返回的最佳结构重复Hill-Climber过程的运行。这种重复的运行时,它可以减少陷入局部最小值的问题(35]。

3.3。评价方法:分层k-Fold Crossvalidation

我们跟着crossvalidation方法的定义由Kohavi [37]。在k-fold crossvalidation,我们把数据库 相互排斥的随机样本称为折叠: ,说折叠有大约相同的大小。每次我们训练分类器 使用 和测试它 (同样,符号表示设置不同)。crossvalidation精度评估是正确分类的总数除以样本大小(实例总数 )。因此,k-fold crossvalidation估计如下: 在哪里 表示标签指定的诱导物 一个无标号实例 在数据集 , 类的实例吗 , 完整的数据集的大小, 是一个函数, 如果 如果 。换句话说,如果分配的诱导物的标签标记的实例 恰逢类 ,然后结果是 ;否则,结果是 ;也就是说,我们考虑一个 损失函数的计算(2)。提到是很重要的,在分层k-fold crossvalidation,折叠包含大约同样比例的类的完整的数据集 。crossvalidation发生时的一个特例 ( 代表了样本大小)。这种情况被称为分析crossvalidation [37,39]。

为评价方法,我们评估部分中给出的分类器的性能3.2使用以下措施(44- - - - - -47]。(一)准确性:正确分类的总体数量除以相应的测试集的大小: 在哪里 代表正确分类和病例数 是总病例数在测试集。(b)灵敏度:能正确识别那些有疾病的病人: 在哪里 代表真正的阳性病例和 是假阴性病例。(c)特异性:能正确识别那些没有疾病的病人: 在哪里 代表真阴性病例和 是假阳性病例。

4所示。方法和实验结果

我们使用分层10倍crossvalidation 98 -案例数据库中描述的部分3.1。所有部分中描述的算法3.2。1使用这些数据来学习一个分类模型。一旦我们有这个模型,然后,我们评估其性能的准确性、敏感性和特异性。我们使用Weka [41为这里的测试执行(见表的参数集2)。出于比较目的其他分类器包括:一个多层感知器(MLP)神经网络和决策树ID3和C4.5)对于相对使用默认参数。这个实验的基本目标是评估的诊断能力thermographic变量形式得分与这些变量之间的交互。为了说明变量值是如何获得的,我们举一个例子。(一)在图1我们展示的类型由热像仪获得的图像;在这种情况下,前面的乳房温度记录。使用ThermaCAM研究员专业2.9(48软件,我们检测乳腺癌的最热门的领域,从红色到灰色。乳房最大的皱纹显示灰色区域分配一个正面的价值,另一个负面的评价。

在图2我们展示的一般概述乳腺癌温度记录的过程,从热图像采集到的形成得分。

3,4,5,6,7,8,9,10这个实验的数值结果。数据34显示结构造成运行Hill-Climber反复Hill-Climber分类器和图5显示了决策树(C4.5)。我们不存在朴素贝叶斯分类器的结构,因为它总是固定的:有一个弧指向每个属性的类。精度检验,旁边的标准偏差显示精度的结果。对于剩余的测试,各自95%可信区间(CI)括号中所示。

5。讨论

本文的主要目的是评估温度记录在乳腺癌的诊断能力使用贝叶斯网络分类器。从表可以看出3,整体精度仍远的理想价值。我们选择分析的贝叶斯网络,因为这个模型不仅进行分类任务,但它也能够显示属性和类之间的相互作用以及属性本身之间的交互。贝叶斯网络的这种能力可以让我们直观地确定哪些属性有直接影响的结果以及它们如何彼此相关。显示了一个类似的性能,但缺乏向MLP的力量解释:不可能查询这个网络来知道它达到一个特定的决定。另一方面,决策树有这个解释能力但缺乏权力代表属性(解释变量)之间的交互。数据34描述,只有5个变量(16)是直接相关的分数:1 c, f_unique, thermovascular curve_pattern, asymmetry_t。因此我们可以看到分数影响类结果是零和的变量(这个变量是得分的一部分)是唯一一个影响类。图5显示程序C4.5还确定2的5变量是最丰富的作出决定:f_unique asymmetry_t。事实上,如果我们只考虑这些属性,我们得到相同的分类性能,当考虑到所有thermographic变量。其他模型,如人工神经网络、无法轻易识别这种情况。见部分3.2条件独立性使贝叶斯网络的广泛使用可能不虚假的原因和轻松地识别直接与间接的影响。换句话说,一旦这些变量是已知的,他们呈现独立于其他变量的结果。另一个令人惊讶的结果是,变量的年龄:一些其他测试认为这是一个重要的观察对乳腺癌的诊断30.- - - - - -32]。然而,我们的分析表明,至少与数据库用于我们的实验中,年龄是不重要的诊断当使用温度记录。从数据可以看出34,年龄是与其他变量。这可能意味着温度记录显示潜力诊断乳腺癌女性50岁以下。

关于我们的模型的灵敏度性能(见表3),Hill-Climber反复Hill-Climber达到一个完美的100%的价值。这意味着,至少在我们的数据库中,温度记录很好识别病人。朴素贝叶斯分类器显示了显著的性能下降;可以说,这种性能是由于噪音,其余的变量可能会增加。再一次,如果我们只考虑上面提到的5个变量,我们可以得到相同的结果和那些使用Hill-Climber Hill-Climber重复。其他模型不能够揭示这种情况。当然,这是强制性的得到更多的数据以证实这些结果。

重要的是要指出,Hill-Climber反复Hill-Climber程序识别相同的5个变量直接影响结果。

关于我们的模型的特异性表现(见表3),Hill-Climber反复Hill-Climber达到最坏的可能值的0%。这意味着这五个变量,同时信息检测疾病的存在时,不用于检测缺乏此类疾病(见表5- - - - - -10)。另一方面,其余的属性时产生的噪声检测这种疾病似乎工作相反:它不是噪音,而是信息使朴素贝叶斯实现33%的特异性。当然,这种价值是可取的,但这个结果让我们思考提出两种不同的分数(一个用于敏感性和特异性)与两个不同的变量。分数的但是我们的建议是第一个近似结合thermographic变量以这样一种方式,使我们从健康的告诉病人。我们的结果表明,这样的分数需要精制为了更容易地识别这些类型的病人。

尽管结果可能是令人沮丧的,我们坚信,他们是一个一步为了更深入地理解这一现象进行调查:乳腺癌。事实上,我们提出了一个分数,考虑更多的信息不仅仅是温度。直到现在,一些领域的研究已经考虑其他变量除了温度(27,28]。这些文件包括在他们的分析共5变量可以从热法提供的信息。我们的分数包括16个变量和我们的工作,我们所知,礼物第一使用贝叶斯网络分析这类数据。这分析表明改进的分数,可能在某种意义上提出一个更复杂的函数来表示它超出了简单的每个属性的值。直观地说,我们认为,其他变量,如高热或thermovascular网络,将更重要的区分从健康的病人。

在数据库的情况下,我们意识到限制有关的案件数量和类的数量的不平衡。因此,我们需要收集更多的数据,以便可以进行更详尽的测试。

6。结论和未来的工作

温度记录已作为一种替代方法使用了自2005年以来的诊断乳腺癌。基本原理是病变乳房的温度比健康的地区。在我们的经验中,只考虑温度不足以诊断乳腺癌。这就是为什么我们提出了一个分数,只考虑更多的信息比温度。我们发现只有5属性的一部分,这个分数是唯一直接影响需要确定一个病人得了癌症。

尽管一些其他研究项目显示出更好的性能比我们的,他们的方法进行实验是不清楚;因此这些实验不能复制。因此,我们需要更紧密地探索这些模型的细节和他们的数据的性质。在本文中,我们已经做了我们最好的呈现方法用于我们的实验尽可能明确,这样他们确实也可以复制。的确,我们不给详细信息数据库是如何形成的(因为这不是本文的主要目标)。然而,我们相信,如果我们提供这个数据库,研究人员想要复制我们的实验应该能够没有多麻烦。

我们发现贝叶斯网络的框架提供了一个很好的模型来分析这类数据:它可以直观地显示属性和结果之间的相互作用以及相互作用的属性和数值测量每个属性类的影响。

虽然我们取得优秀的敏感性的结果,我们也获得了非常贫穷的特异性的结果。灵敏度值与专家的期望一致,和乐于助人的讨论贝叶斯网络已经开始为了更好地理解这种疾病。鉴于乳腺癌特异性值的特殊要求,我们必须更深入地调查那些业绩不佳的原因。一个可能的未来的研究方向是收集更多的使用技术,如打平衡数据(49],ADASYN [50],AdaC1 [51],GSVM-RU [52]。另一个可能的方向是设计一个更复杂的分数,包括一个更复杂的函数比一个简单的总和。第三个方向我们可以检测评估的变量是如何收集和尽量减少主观性。最后,我们还发现,医生通常比,考虑更多的信息提供给模型诊断乳腺癌。因此,我们也可以更多领域的知识抽取工作。

利益冲突

作者宣称没有利益冲突。