研究文章|开放获取
日本Hiroyuki注资,Hamamoto驾Yusuke Fujita, Atsushi Goto,小君Nishikawa Isao Sakaida, ”胃癌的诊断支持系统的发展模式识别方法使用一个高光谱相机”,杂志上的传感器, 卷。2016年, 文章的ID1803501, 6 页面, 2016年。 https://doi.org/10.1155/2016/1803501
胃癌的诊断支持系统的发展模式识别方法使用一个高光谱相机
文摘
胃癌是完全可以治愈的癌症时,可以发现在其早期阶段。因此,因为早期发现胃癌是很重要的,执行癌症筛查通过胃镜检查。最近,高光谱相机(HSC),它可以在各种波长,观察胃癌已收到关注胃镜。HSC允许识别胃癌的轻微的颜色变化,我们认为其适用性胃癌诊断支持系统。本文纠正后反射吸收个人HSC的反射率的变化,胃癌的诊断支持系统设计使用修正后的反射率。在系统设计中,选择最佳波长的问题和优化截断值分类器的使用作为一个模式识别问题的解决训练样本。使用合作方法与104例胃癌样本,设计和评价系统的独立重复30次。在30试验,在分析性能的敏感性是72.2%,特异性是98.8%。结果表明,该系统有效地支持胃癌筛查。
1。介绍
胃癌是完全可以治愈的癌症时,可以发现在其早期阶段。因此,因为早期发现胃癌是很重要的,执行癌症筛查通过胃镜检查。然而,据报道,约20%的胃癌症是错过了(1检测),此外,很大程度上取决于医生的熟练程度。因此,不管医生的技能,诊断支持系统的开发提供恒定的诊断准确性是急需的。
因为有大变化的癌症,不仅在胃癌,甚至同一癌可以因人而异。因此,高光谱相机(HSC),它可以在各种波长的观察胃癌,受到的关注(2]。HSC拥有先进的遥感领域。捕获的图像的HSC包含每5 nm 81反射数据值从400年到800纳米波长范围为每个像素。
HSC可以辨别胃癌的轻微的颜色差异3),它被认为是适用于胃癌的诊断支持系统。然而,由于胃的内壁的颜色因人而异,应吸收颜色的个体差异歧视胃癌。
在这篇文章中,执行某种类型的反射率校正吸收个体差异,使用修正后的反射率和系统设计。这样一个系统的设计包括两个任务。一是选择最优波长。HSC可以观察胃癌与不同的波长,但考虑到成本和实时处理,反射得到的最佳波长。另一个任务是确定截止值区分胃癌在分类器的设计。这些问题得到解决单独使用训练样本与模式识别方法。首先,关于最佳波长的选择,使用特征选择方法的Mahalanobis距离(4被定义为准则函数,选择一个最佳的波长波长的候选人。接下来,关于分类器设计,最小距离分类器(5修改和使用。设计系统的效果评估的合作方法(5独立于训练样本)使用测试样品。
2。材料和方法
内镜切除术的104例胃癌进行山口大学医学院医院2010年4月至2012年8月(6),胃肿瘤切除术后立即受到HSC的拍摄。反射率测量值对正常和肿瘤组织在每个治疗的104例病例中内镜黏膜下剥离。使用的情况下作为一个例子,图1显示正常的波长和反射率之间的关系和肿瘤站点,分别。一般来说,肿瘤部位的反射比正常的大网站,以及当波长大于650纳米,和反射率的差异值在正常的网站和肿瘤部位清晰可见。在系统设计中,在51反射率值波长550 nm和800 nm之间使用,因为正常和肿瘤之间存在重重叠网站从400年到550纳米波长范围的几乎所有的样本。HSC的分辨率为480×640像素。
因为组织类型、形状和颜色的胃肿瘤不同,反射并不总是统一的网站即使在肿瘤。因此,得到了10分的肿瘤区域。10分是选择,所以他们尽可能均匀地分散在整个肿瘤。以同样的方式,从正常的网站也获得11分。11点之一是用于反射率校正,使用剩下的点,是说正常的网站估计。照片的详细信息,请参见[2]。
2.1。提出了系统的设计
在模式识别中,样本用于系统设计被称为训练样本,这些系统评估被称为测试样品。训练样本和测试样本必须不同(7]。
图2从正常网站表明反射率值与ו与肿瘤站点,为例。这些例子表明,在反射率值,有个体差异,价值观有时显示正常的情况下,有时肿瘤病例。这些结果表明,一个单一的截止值反射不能区分一个正常的网站和肿瘤部位。因此,纠正反射率值使用。平均反射率值估计从10的反射率值正常训练样本对应一个案例在波长。使用平均反射率值,纠正反射率值为描述如下: 与此同时,修正后的反射率值平均反射率值,从10的反射率值获得肿瘤训练样本对应的情况描述如下: 从现在起,我们解释设计过程使用修正后的反射率值,和。
首先,找到最佳波长。波长的波长选择的标准是确定的。Mahalanobis距离代表正常和肿瘤之间的统计距离分布,用作标准: 在哪里和各自的均值和方差的纠正在波长反射率值一个正常的网站吗和和各自的均值和方差的纠正肿瘤部位的反射率值。方程(1),修正导致获得的 因此,如下:
因为有反射的个体差异,利用反射率值对于每个个体来说,正常网站的反射率值正常网站是纠正了(1),然后纠正肿瘤的反射率值(2)。因此,在所有的正常的训练样本,纠正反射率的价值为零。作为一个模式识别问题,正常和肿瘤站点被确定为一个双阶级问题。通常的双阶级的差异问题是师范类的分布仅限于原始点校正。出于这个原因,乍一看,而不是一个双阶级问题,这似乎是一个1级肿瘤部位的问题。
一个波长,最大化的价值选择从51候选人波长和被定义为最优波长。这是描述如下:
第二,我们解释一个分类器的设计过程区分像素在正常和肿瘤网站内的图片。摘要最小距离分类器,这是最简单的分类器,修改和使用。最小距离分类器分配一个模式类与最近的两个类的平均值和描述如下: 在这里,是。截止值的绝对值的最小距离分类器是中点,,意思是纠正反射率值之间的一个正常的网站,,意思是纠正肿瘤部位的反射率值,。
通常有一个权衡关系敏感性和特异性;也就是说,灵敏度越高,特异性越低,反之亦然。因为系统用于胃癌筛查、截断值,预计产量最大的灵敏度,以避免丢失的癌症,同时保持高特异性。截止值由乘法定义参数和,也就是说,。因此,优化截断值代表的优化参数。尤其当最小距离分类器,这个分类器(见图3)。
在这项研究中,优化截断值参数,我们的方法分配歧视表现的最高价值是实际执行歧视的最优值。因为优化参数在分类器设计阶段进行,参数应该单独使用训练样本进行了优化。因此,训练样本进一步分为subtraining样品和分测验样本,通过使用subtraining样品,一个分类器设计,歧视分测验样本。这个过程被应用到每一个预定的候选值的参数,在候选值的值满足条件的歧视能力被选为最佳值。重采样的概念可用的样本作为次级样本来自文献[8,9]。候选人的参数值被确定为。优化的参数是按照下面的程序进行的。过程5是歧视的条件的能力。
过程1。训练样本是随机分为subtraining样品和分测验样本。
步骤2。使用subtraining样本,是获得。
程序3。截止值使用和。
步骤4。使用每个截止值,分测验样本是歧视。
步骤5。关于歧视的能力分测验样本,参数99%或更多的特异性和最大灵敏度选择作为最优值。
2.2。验证所提出的系统
最好的方法来评估系统是评估后的敏感性和特异性的百分比歧视实际上是测试样品。本文104例作为样本。104年样本随机分为54 50训练样本和测试样本,,仅使用54训练样本,系统设计通过50测试样本被歧视。上述试验独立重复30次,和歧视的能力系统评价。评估的流程图如图4。此外,在参数优化的截止值,54个训练样本随机分为27 subtraining样品和27分测验样本。
在测试样品,首先,从11反射率值的平均值计算正常网站在训练样本,和反射率值最接近平均值的11个反射率值通常从他们被选中作为一个正常的反射率值。剩下的10反射率值的平均值计算,定义为平均反射正常网站的价值。对肿瘤的网站,类似于正常的训练样本的网站,10反射率值的平均值的肿瘤站点被定义为肿瘤的平均反射率值站点。修正后的反射率值正常和肿瘤的网站通常是通过减去正常反射值从各自的平均反射率值。
3所示。结果与讨论
图5显示从图中的值修正后的反射率值2。肿瘤站点的反射率值相对较大在每种情况下与正常相比网站。波长和参数的值都获得了来自30个独立试验。对波长770 nm选择11的30倍,,选择,1/4的15倍。在这项研究中,最常见的波长770 nm, 1/4是最佳的解决方案。的二流波长675 nm被选5的30倍,与1/5选择的7倍。此外,风光不再的波长680 nm和1/3选择3和4次30日分别。这些表所示1。
|
||||||||||||||||||||||||
歧视的结果使用770 nm和1/4如表所示2。在试验30歧视,敏感性和特异性分别为72.2%和98.8%,分别。同时,Youden指数(10],它被定义为敏感性+特异性−1,供参考。胃癌筛查需要高特异性和灵敏度也必须高,因此没有癌症是错过。虽然似乎是72.2%的敏感性低,歧视为每个像素,在这项研究中进行,因此,尽管每一个歧视的低灵敏度,像素分辨为癌症聚集形成一个地区内的图像,从而避免错过癌症的医生。
|
||||||||||||||||||||||||
| 上一行显示的数字的意思是价值观,和较低的行显示的数字95%置信区间。 |
||||||||||||||||||||||||
本研究的点可以在个体差异的校正反射。因此,澄清这种修正的影响,我们做了一个实验比较技术执行校正技术,不进行修正。在这两种技术,特征选择是使用距离Mahalanobis执行,修改后的最小距离分类器使用。如表所示3比较有和没有校正时,歧视能力与修正,改善的有效性,因此,修正了。
|
||||||||||||||||||||||||||||||||||||||||||
我们只有一个波长用于歧视在我们的原始研究。因此,我们做了一个实验来确定歧视可以提高性能通过增加波长的数量。具体来说,歧视实验是进行二维特征空间结合的最佳波长的二流波长770 nm和675 nm。结果如表所示4。即使特性的数量增加,歧视性能几乎保持不变。通过使用Youden指数的值,假设测试的平均值的差异进行独立770海里的性能和770 nm和675 nm的综合性能,并没有显著差异结果的测试()。
|
||||||||||||||||||||||||||||||||||||
在这项研究中,实时处理是必不可少的。增加功能的数量不仅延长处理时间,而且硬件规模增加。因为没有明确的改善歧视性能通过增加功能的数量,通过强调实时处理,我们采用了一维系统通过使用一个波长。在实际使用,可能有HSC的摄影速度的问题,许多波长的照片。然而,由于系统使用一个最佳波长,HSC的摄影速度并不重要,因此实时处理是可以实现的。
最后,当这个系统应用在实际运用中,修正将是一个问题。校正需要正常的样本,但这些样本不是实际可用。因此,在本文中,我们假设当相机照片里面的胃,几乎所有的像素在图像将正常像素。如果图像包含许多像素的癌症,医生可以很容易地检测癌症没有系统的支持。一般来说,这个假设被认为是形成的图像用于胃癌筛查。如果这个假说是满意,一个像素内随机选择的图像,可以用作正常像素校正。
本研究取决于获得的数据。这意味着单个波长和优化截断值应根据高光谱相机使用。因此,770 nm和1/4的值可能不是有效当另一个高光谱相机使用。然而,作为显示在这项研究中,解决病人的个体差异的问题,本研究的价值是在建立一个方法,实时处理是可能的。
4所示。结论
在本文中,我们开发了一个胃癌诊断支持系统能够分辨正常的网站和一个像素的像素的肿瘤部位的图像中的每个像素104例胃癌病例HSC拍摄的照片。基于30独立试验的结果与最优波长770 nm和1/4的截断值,结果表明,该系统是有效的在胃癌筛查,达到平均72.2%的敏感性和特异性平均为98.8%。
从研究的角度来看,是否胃癌病变最终是由医生决定的,和系统支持医生为了避免丢失的胃癌。为此,系统可以区分基于像素和支持医生的解释和彩色显示器的像素组成的地区歧视的肿瘤图像。
这里使用的数据来自组织拍摄的图像HSC立即胃癌切除术后。在未来,我们的目标是使用系统在临床设置,和我们计划执行实验使用从胃中拍摄的图像。
利益冲突
作者宣称没有利益冲突有关的出版。
引用
- k . Aida h . Yoshikawa c Mochizuki et al .,“胃癌临床病理特征检测内窥镜作为年度体检的一部分,”胃肠病学和肝脏病学杂志》上,23卷,不。4、632 - 637年,2008页。视图:出版商的网站|谷歌学术搜索
- s . Kiyotoki j . Nishikawa t Okamoto et al .,”新方法检测胃癌的高光谱影像:一个试点研究,“《生物医学光学,18卷,不。2、文章ID 026010, 2013。视图:出版商的网站|谷歌学术搜索
- 开悟,y Aoyanagi, Hara, r . Mitsuhashi y .竹内,“高光谱传感器HSC3000 nano-satellite TAIKI,”2多光谱、高光谱和Ultraspectral遥感技术,技术和应用程序卷,7149学报学报努美阿,p . 71490米,新喀里多尼亚,2008年11月。视图:出版商的网站|谷歌学术搜索
- r·o·杜达·e·哈特和d . g .鹳,模式分类约翰•威利& Sons第二版,2001年版。视图:MathSciNet
- 英国的巨大,介绍了统计模式识别、计算机科学和科学计算、学术出版社,波士顿,质量,美国,第二版,1990年版。视图:MathSciNet
- a . Goto j . Nishikawa s Kiyotoki et al .,“使用光谱成像技术发展为胃癌诊断支持系统,”《生物医学光学,20卷,不。1,文章ID 016017, 2015。视图:出版商的网站|谷歌学术搜索
- s . j . Raudys和a . k . Jain,”小样本量的影响在统计模式识别:建议从业者,”IEEE模式分析与机器智能,13卷,不。3、252 - 264年,1991页。视图:出版商的网站|谷歌学术搜索
- b·埃夫隆和r . j . Tibshirani介绍了引导1993年,查普曼&大厅。视图:MathSciNet
- y Hamamoto驾、美国内村和获利,“最近邻分类器设计,引导技术”IEEE模式分析与机器智能,19卷,不。1,第79 - 73页,1997。视图:出版商的网站|谷歌学术搜索
- w . j . Youden“指数评级的诊断测试,”癌症,3卷,不。1、32 - 35,1950页。视图:谷歌学术搜索
版权
版权©2016)注资等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。