文摘

糖尿病视网膜病变是影响眼睛的主要疾病之一。缺乏早期发现和治疗会导致完全失明的眼睛。最近,许多研究人员试图生产自动糖尿病视网膜病变检测技术来补充诊断和治疗糖尿病视网膜病变的早期症状。在这个手稿,提出了一种新方法。该方法利用特征提取眼底图像使用本地极值信息量化Haralick特性。量子化特征编码不仅结构Haralick功能,还利用大量的多分辨率信息在糖尿病性视网膜病变症状。长期短期记忆网络与本地极值模式提供了一个概率的方法来分析每一部分的图像与高精密这有助于抑制假阳性现象。该方法分析了视网膜血管和渗漏糖尿病性视网膜病变的症状在两个不同的公共数据集。实验结果评估使用性能矩阵如特异性、准确性和灵敏度揭示有前途的指标。同样,与相关的先进的研究突出了该方法的有效性。 The proposed approach performs better than most of the researches used for comparison.

1。介绍

糖尿病性视网膜病变(DR)是一个医学术语,用来描述一个悦目的威胁出现在视网膜的疾病。这种疾病主要是普遍的工作年龄的人当正确不治疗会导致完全失明1,2]。视网膜病变是全世界成年人致盲的主要原因在3]。根据一项研究,2010年超过2.39亿人受到影响,仅在美国拥有超过770万。美国人与糖尿病视网膜病变的数量,根据新的投影,预计将增加近一倍,从770万年到2010年的大约1460万到2050年(4]。续集其严重性和重力的破坏原因,早期发现和治疗一直是世界上大多数卫生机构关注的焦点。

糖尿病视网膜病变导致视网膜血管结构重大变化包括用于转换的主要血管血液含氧和营养物质的各种视网膜的一部分。在一些患有糖尿病性视网膜病变,血管可能肿胀和渗出液导致形成软硬分泌物等异常。在其他情况下,开发新异常血管,血管阻塞,血液(出血)泄漏到视网膜的健康部位有经验。检测糖尿病性视网膜病变的征兆包括正确识别所有可能的异常如软硬分泌物,出血,血管遮挡(2,3,5]。

因此,一个有效的技术来实现一个合理的诊断病变眼博士将包括识别和分割等各种功能的视网膜血管,视盘和许多其他异常症状的一种眼病。血管分割的一个重要方面是,即视网膜血管被提取眼底图像的仔细检查这些血管的解剖结构的变化如直径、分支角和闭塞。

在过去,这些视网膜症状的诊断依赖于人工视网膜眼底图像的分割。这个动作需要眼科医生的专业技能的过程很耗时间,精力,和非常复杂的6]。然而,随着机器学习和人工智能领域的重大突破,许多算法是由研究人员帮助完成这些异常的诊断过程中视网膜眼底图像。例如,眼科医生可以使用适当的分段船舶检验和检测疾病通过识别额外的船只数量的增长或液体的特性,其形状和大小。不同的技术被采用或提出了许多研究,其中一些主要关注各种特性的分割视网膜检查异常。此外,一些技术有更多的一般方法,而机器学习算法和训练对眼底图像进行分类与健康或nonhealthy疾病的不同阶段。解剖视网膜描绘在图的概述1

手稿分为7个部分。部分12包括在部分的介绍和文献综述3的理论背景,给出了建议的方法中使用的关键概念。节4,该方法讨论了部分5使用该方法给出了实验结果。节6、讨论和比较了手稿是结论部分7

最近,一些研究已经出现生计算机辅助诊断系统,用于眼科诊断异常视网膜眼底图像。血管分割了卷的文章(最高的国家之一2,7]。大多数用于分割的技术可以分为两类:监督方法和非监督方法。监督方法使用标记数据来训练分类器算法,如支持向量机(SVM)对每个像素进行分类根据标签。无监督方法相比之前使用没有标签的数据或任何有关疾病的信息。无人监督的技术可能包括形态学操作,匹配滤波方法,和可变形模型(1]。

阴et al ., (8)使用概率tracking-based方法从眼底视网膜血管段图像使用结构分析视网膜(瞪)和数字视网膜图像的血管提取(驱动器)数据库。敏感性和特异性0.75和0.95的记录,分别。

在他们提交,Ravichandran和拉贾9)应用当地entropy-based预处理后眼底图像的阈值技术。王et al ., (10]利用监督学习方法的卷积神经网络(CNN)和随机森林(RF)结合训练后船像素进行分类和标签的数据。这种方法表现良好但耗资巨大的计算成本。

Sohini et al ., (11]提取主要血管在预处理阶段,然后,他们应用高斯混合模型(GMM)分类器已经使用优化和完善最后的船从其余的形象。赵et al。12]运用活动轮廓技巧运用图切段血管。他们最初增强图像使用本地阶段过滤器。赵et al。13)提出了一种新的无限的活动轮廓模型的自动检测视网膜血管。

沃尔特et al。14]介绍了一个使用候选人提取微动脉瘤检测算法。最初他们的技术增强图像,然后提取绿色通道和正常化,紧随其后的是候选人与直径检测关闭和自动阈值方案。微动脉瘤像素候选人的分类是基于核密度估计完成的。

同样,斯宾塞等。15和框架等。16)两个候选人器方法,应用阴影校正被减去平均过滤背景从绿色通道图像。然后,他们最后使用形态学操作基于上流社会的转换使用十二个结构元素提取候选提取。导致候选人像素进一步进行对比度增强操作,最后是关键。

3所示。理论背景

3.1。灰度同现矩阵

GLCM通常用于纹理分析和Haralick等人于1973年首次引入从图像中提取统计纹理特征的(17]。应用灰度共生矩阵建立Haralick纹理特征计算从编码重要纹理描述符可以用于纹理分类和感兴趣的区域(ROI)定位在一个图像。应用灰度共生矩阵建立了由考虑每个像素与周围像素。它给某一街区cooccurring像素值分布的考虑。社区中心的像素定义的距离和方向(抵消)中心像素(18]。一个偏移量的 ]或[1135°)描述了一种邻域像素在一个像素的距离 和135度( 从中心像素。图2显示了如何考虑这些偏移量。

因此,对于灰度图像 的大小 灰度值,同现矩阵 将有一个大小 这是定义在整个图像和参数化的抵消( )。 GLCM计算在抵消角度定义的四个不同的偏移量(0°、45°、90°、135°)通常编码转换价值的信息水平,垂直,两个对角线。应用灰度共生矩阵建立这样的旋转不变。应用灰度共生矩阵建立对称形成当所有补偿相对对称的四个方向被认为是应用灰度共生矩阵建立建设(即。,四面八方被认为是)18]。

考虑图3(一)原始灰度图像的灰度 ,如果定义水平偏移量(例如, ),应用灰度共生矩阵建立计算图3(b) 大小的计算使用的条目情商。1)。例如,应用灰度共生矩阵建立的突出显示的条目“2”矩阵(图3(b)),发生在一行 和列 通过计算像素的数量获得了一双灰色的水平偏移值3和1,分别从原始灰度图像如图3(a),应用灰度共生矩阵建立规范化的图3(c)代表了灰度共生矩阵估计每个组合的概率出现在图像中发生。每一行的灰度图像如图3(a),有三个独特的可能性结合像素对的水平偏移;因此,总共12可能性存在整个灰度图像。应用灰度共生矩阵建立规范化的图3获得(c)除以每个灰色共存条目如图3(b)由12。这个应用灰度共生矩阵建立规范化用于提取Haralick特性,总结一个和它的条目。应用灰度共生矩阵建立规范化可以看作一种概率质量函数对灰度的图像。

3.2。Haralick纹理特征

Haralick计算24个不同的统计特性应用灰度共生矩阵建立规范化矩阵, 正如在图3(c)。这些特性的重要量化部分本地信息和空间特性在图像。尽管所有24特性可能是有用的在不同的结构分析,在这个研究的几个试验组合这些特性来提取所需的信息,非常有前途的五个特性因此方程式描述。(2)- (6)。

同质性:描述应用灰度共生矩阵建立亲密的每个元素的测量其对角元素

:是随机性的测量或障碍存在于图像的程度

能源:是角二阶矩的根源,使灰色的本地一致性水平的措施 相关:这个特性显示灰度值的线性依赖同现矩阵。

在条款 的均值和标准偏差总结同现矩阵 ,水平和垂直的空间平面,分别。

对比:对比也被称为标准偏差表示测量像素间的灰度强度的变化。

3.3。长短期记忆(LSTM)网络

LSTM网络是一种深度学习的递归神经网络(RNN)于1997年首次提出[的Hochreiter和。施密德胡贝尔表示19]。它解决的熟悉问题消失/爆炸梯度与传统的神经网络。消失的梯度问题逐渐侵蚀误差梯度的大小用于更新重量和偏见。这可以防止网络进一步调整重量和偏见,因此,学习最终停止在网络的深层13]。

在一个RNN的古典结构(图4),网络更新权重向量 ,在每一个隐藏层。的隐藏层 在时间戳 而数据标签吗 计算净误差 这一层的使用梯度像样的网络误差降到最低。净输入每个隐层时间差 由输入序列 和加权输出( )相邻的隐层的时间

LSTM替换每个隐层由一个封闭的结构细胞(图5)有额外的连接使用细胞状态,每一层 盖茨LSTM细胞包括三个:忘记门,输入门,输出门。每一个盖茨使用乙状结肠( )通过细胞激活控制数量的信息在不同的阶段。忘记门 ,控制信息的保留或忘记以前的时间间隔序列在相邻层门的输入 调节当前内部细胞状态 拥有细胞被压扁后的净输入使用吗 激活功能。门的输出 ,控制单元的输出 ,这确实是一个压扁的向量当前电池状态吗 由门的输出。门的输出控制压扁当前电池状态。

每个门的关系LSTM网络与偏见可以在情商。7)。

LSTM网络使用梯度像样的通过时间(BPTT)与截断反向传播调整权重 和偏见( )网络的输出之间的误差最小化和目标输出。

4所示。该方法

在拟议的方法中,特征编码使用本地极值信息在不同应用灰度共生矩阵建立构建量化水平。应用灰度共生矩阵建立规范化构造用于提取Haralick特性感兴趣的是随后编码为一个特征序列,喂了LSTM网络培训。

4.1。局部极值量子化Haralick特性

它明显,同样的图像,Haralick功能大小影响明显的图像中灰度值的数量,因为数量的灰色水平确定应用灰度共生矩阵建立的大小。看到效果的一种方法是通过量化原始灰度的新水平。对于灰度图像, ,量化值非线性变换,给出了图像在不同分辨率比原来的。除了灰色的量化水平,应用灰度共生矩阵建立等特性抵消和预定的灰度强度范围(极值)的原始灰度图像都会影响Haralick特性。应用灰度共生矩阵建立这些属性通常称为施工参数

应用灰度共生矩阵建立捕获两种施工参数,量化水平和强度极值范围的灰色图像,计算GLCM从原始图像创建的新形象 ,与不同的量化级别(分辨率)和局部极值范围。

一个图像 ,这是在灰度量化吗 与灰色地方极值信息 ), 代表当地的最小和最大的极值灰度强度值,会有不同的Haralick特性当这些参数是不同的。修改后的新图像 既抓住了量化 可以使用方程式计算。(8)和(9)。

在哪里 是一个中介形象和 是一个上限算子映射的计算值吗 最小整数大于或等于本身。

极值的一个常见的选择 是全球最大和最小gray-intensity值的图像。选择 在一个局部的ROI图像中同一量化水平 将导致不同的强度值分布在图像的同一幅图像相比呢 是图像的全局极值强度值。因此,选择极值的价值 应用灰度共生矩阵建立影响矩阵(见图6)。

拟议中的量子化Haralick特性形成使用五Haralick节中描述应用灰度共生矩阵建立规范化的特点3。最初,四个不同版本的原始灰度图像在不同的量化计算的水平,也就是说, 箱里。 从每一个量化的版本 ,应用灰度共生矩阵建立规范化的构造,然后使用提取五Haralick特性(例如,同质性,,能源,相关,对比)。对于每一个量化的图像,使用最小和最大像素强度值的极值 例如,极值的值 是由(11)。 最后,应用灰度共生矩阵建立规范化的所有Haralick特征提取的四个量化图像连接起来形成一个特征向量 长度为20。

4.2。分割

而不是应用上述提出的特征选择对整个灰色眼底图像,图像分割 窗口。在必要时,用0填充图像,以确保一个整数的段数的大小 是生成的。每个分割窗口使用建议的方法形成了20特性。分割的目标是帮助找到感兴趣的地区发生的概率(ROI)糖尿病性视网膜病变症状最有可能发生的地方。计算这个概率,一个前症状的位置信息是必要的。提供这些信息在区域的训练数据集,被感染的专家。这些概率确定每段使用基准测试方法之间的相似性措施一段的特点和实际的ROI的特点进行了比较。ROI只是训练数据的真实图像显示在图7 (b)

4.3。序列编码LSTM

LSTM网络是训练一个向量序列模型。对于任何训练图像,其相应的真实提出用于提取20特性。如果有 训练样本,每一个真实(ROI)生成的 长度为20。基准的ROI特征向量 使用来评估每个部分都将这些特性的平均值(12)。 相关系数 计算之间 特性和 功能段分配一个标签。生成水平为每一段序列编码的特性,相关系数 计算每个编码段之间的特性和候选人的ROI编码功能。如果计算 小于0.5,这段被分配一个标签没有一个。的值 在0.5和0.7之间的标记形式温和的,0.7到0.89标记强大的和0.9比1非常强烈的标签。

每段图像中提取的特征(特征)20日火车是顺序输入LSTM和计算标签的标签数据。因此,网络列车在一个连续的数据流。对于一个ROI编码功能 和部分功能 ,相关系数 计算使用情商。13)。该方法的完整的流程图如图8 在哪里 分别是期望值均值和方差函数。

LSTM网络训练与部分在每个训练数据和相应的标签(相关系数计算 )以上。在测试过程中,网络使用它学习模型预测相关系数 一个新的部分。预测的结果是解释为症状的发生概率在这段用于后续阶段分析和检测眼底图像的部分症状。该方法的完整的流程图如图9

5。实验结果

该方法实现了两个独立的受欢迎的公众性视网膜病变数据集:盯着看(20.),图像受潮湿腐烂数据集(21]。的图像受潮湿腐烂由两个单独的数据集DIARETDB01和DIARETDB1。DIARETDB1由89眼底图像5健康样本,其余样本光糖尿病性视网膜病变的症状如出血、微动脉瘤,渗出液,和柔软的渗出液。我们使用这个数据集渗出物检测的困难。另一方面,凝视数据库用于血管分割。

除了一般的性能提出了方法的准确性,其他性能指标被认为是。这些度量相似性措施依赖pixel-to-pixel真实模板之间的匹配模板及其等效获得使用该方法。真阳性(TP)和真正的负(TN)定义正确的分类。TP识别正确的所有候选像素分类为候选人,而TN给非实际候选人的数量正确认定为非实际候选人像素的像素。错误分类,假阳性(FP)和假阴性(FN)定义。FP是一个非实际候选人作为候选像素像素分类错误而FN就是候选像素并被错误地归类为非实际候选人。相似的措施被认为是在方程式中定义。(14)- (19)。

例如,真阳性(TP)计算白色像素的数量真实交叉二进制图像和二进制图像通过我们的方法而获得真阴性(TN)之间的交集是黑色像素的数量日渐二进制图像和二进制图像获取方法。FP和FN黑白像素的数量在两个模板之间的互补组,分别。 在哪里 , , 均值、标准差和模板图像的动态范围常数 ,分别。

5.1。LSTM实现信息

实现LSTM网络的训练,python 3.8编程语言是用于TensorFlow和Keras库。LSTM有回头的每个细胞的记忆3,这意味着计算当前输出的细胞,它使用前三段之前的结果。输入层由100个细胞,和输出层神经元(稠密)是由我作为模型总结在图中注明10。100年网络培训共有41701参数迭代训练和测试损失(RMSE) 20.79和30.13,分别。

5.2。渗漏检测

LSTM网络的输出决定硬分泌物的存在或不存在一个特定的基于预测的图像部分 价值。为 小于或等于0.5,假设硬段渗出物不在。的值 大于0.5表明存在困难显露但在不同阶段(没有一个,温和的,强大的,非常强烈的)。

然而,进一步分类为模板匹配像素在一段真实的形象,进一步处理是必需的。之前计算量化版本的段( 转换使用非线性伽马变换(Eq。20.)),以提高它们的对比。的常数伽马转换来自输出分数 段的LSTM网络。这些gamma-transformed段使用全球大津阈值转换为二进制图像。只有部分 被认为是,所有像素段 被归类为非实际候选人。像素的片段 进行分类,计算四个不同的十字路口(量子化、gamma-transformed和关键)版本的使用Eq。段(21)。图11和表1目前的提取实验结果在DIARETDB1数据库上使用该技术。 在哪里 是一个常数的伽马变换吗

5.3。血管分割

的糖尿病性视网膜病变、血管肿胀和泄漏液体导致形成软硬分泌物等异常。在其他情况下,开发新异常血管,血管阻塞,血液(出血)泄漏到视网膜的健康部位有经验。检测糖尿病性视网膜病变的征兆包括适当的分割给任何不正常的发展线索和周围血管。细分部署相同的方法渗漏检测(使用方程式。(20.)和(21),除了背景估计是用来量化之前删除背景预处理的图像。估计背景,三个通道的RGB图像总结在一起,由此产生的图像转换为二进制使用100阈值,如图12。图13介绍了血管的分割结果使用该方法在表2样品的性能测量结果自动血管分割的凝视数据库列表。

6。比较和讨论

检测特定症状的糖尿病性视网膜病变是相当具有挑战性的任务。这是由于这样的事实:这些症状也有类似的结构成分和强度分布很难区分使用简单的结构和强度分布分析。例如,在视网膜血管结构从眼底图像的绿色通道,它表现出强度分布类似于光盘坐落在上面这些血管结构产生的神经中枢。因此,分离这样的实例需要的不仅仅是过滤但更健壮的方法是需要独特的分离和扩大这些特性之间存在微小的差异。使用不同的量子化水平显著增强区分图像中重叠特性的可能性。不同量化水平将功能转换成不同的分辨率,一些功能,在更高的分辨率是不可见的(更高的量子化能级)突然变得可见,因此可以很容易地分析。

在发现症状如血出血和微动脉瘤,他们通常小斑点通常太具有挑战性的,因为任何噪音图像处理可能需要这些症状的形式。使用顺序训练LSTM变得非常方便和高效的自其输出可以用来决定是否一段形象的症状。这些方法确保平和输出,只有部分概率较高的症状进一步位。在表3,我们提出建议的方法之间的比较结果和其他先进的方法。

7所示。结论

一种新的方法来检测提出了糖尿病视网膜病变的症状。一个算法,彻底和全面分析视网膜血管结构和硬渗出物了。编码的方法,分析了症状的一个强大特性表示促进改进的性能相比,其同行在文献中。使用不同的量子化水平变换域和空间图像域不同分辨率大大有助于改进的组内的差异特征相似的结构和强度分布。此外,LSTM模型非常有效,有助于减轻噪音的存在或假阳性出现在最后一位的输出图像。它也减少了后处理图像所需的时间只有部分同现概率较高的症状被认为是。

总之,结果获得令人印象深刻并验证相关性和该方法在这种情况下的效率。尽管成功,该方法不包括出血等症状的糖尿病性视网膜病变的检测和微动脉瘤。其他症状检测可能存在不同的挑战。

数据可用性

研究中使用的两个数据集可以通过公开访问以下链接:(1)DIARETDB1:http://www2.it.lut.fi/project/imageret/diaretdb1_v2_1/(2)凝视:https://cecas.clemson.edu/ ~ ahoover /凝视。

的利益冲突

作者宣称没有利益冲突。