文摘

糖尿病视网膜病变(DR)是一个长期的糖尿病的并发症,这是很难发现在其早期阶段,因为它只给出了一些症状。如今,博士的诊断通常需要采取数字眼底图像,以及使用光学相干断层扫描(OCT)图像。自10月设备非常昂贵,这将有利于病人和眼科医生如果可以准确诊断,完全基于阅读数字眼底图像。在本文中,我们提出一个新颖的算法基于深卷积神经网络(DCNN)。与传统的DCNN方法不同,我们用分数max-pooling代替常用的max-pooling层。其中两个DCNNs不同层数训练获得更多歧视特性分类。从元数据的图像特征相结合后DCNNs,我们训练支持向量机(SVM)分类器学习每个类的潜在分布的边界。博士的实验中,我们使用了公开检测Kaggle提供的数据库。我们使用34124训练图像和1000与53572年验证图像来创建我们的模型和测试测试图像。该分类器分类阶段分为五类博士,贴上一个整数0和4之间不等。 The experimental results show that the proposed method can achieve a recognition rate up to 86.17%, which is higher than previously reported in the literature. In addition to designing a machine learning algorithm, we also develop an app called “Deep Retina.” Equipped with a handheld ophthalmoscope, the average person can take fundus images by themselves and obtain an immediate result, calculated by our algorithm. It is beneficial for home care, remote medical care, and self-examination.

1。介绍

全球成人糖尿病及其引起的慢性并发症的治疗费用是8500亿年的2017美元。糖尿病视网膜病变(DR)是糖尿病最常见和严重的并发症和低视力和失明的主要原因在工作年龄的成年人(1,2]。国际糖尿病基金会(IDF)估计,2017年全球人口糖尿病患者是在4.51亿年,超过三分之一的人口(博士3),代表一个巨大的人口视力损害的危险或失明。到2045年,全球糖尿病患病率预计将增加到6.93亿人(3]。此外,几乎一半(49.7%)的糖尿病患者仍未确诊的多年来,因为安静的症状(3]。然而,长期的高血糖水平最终破坏血管和神经,导致并发症,如心血管疾病和失明。检测和治疗的早期博士将防止其发展或进展。

博士的诊断和严重程度是基于视网膜检查。博士的分类,临床可分为两类:(1)nonproliferative糖尿病性视网膜病变(NPDR)分泌和缺血不同严重程度但没有视网膜新生血管形成,和(2)增生性糖尿病视网膜病变(PDR),它的特点是新血管形成的并发症有或没有传统的视网膜脱离和最初的玻璃体出血。视网膜微血管疾病NPDR包括微动脉瘤,点污点出血,脂质分泌物,静脉瘤改变,intraretinal微血管异常(厄玛)。基于这些病变的程度和范围,NPDR可以分为三个层次:轻度NPDR礼物与微动脉瘤或几个视网膜出血;温和NPDR显示更严重的微动脉瘤,出血或柔软的渗出物,但没有达到严重NPDR水平,这与明显视网膜出血4象限,静脉瘤在至少两象限和厄玛在至少1象限。表1总结了博士类别的表现。

手动评分由眼科医生的主要筛选博士在过去几十年。然而,由于扩大人口患有糖尿病和最近的技术进步,自动检测博士提供了潜在的筛选提供一个有效的和具有成本效益的方法。目前商业化的自动视网膜图像分析系统(阿里亚斯),如iGradingM Retmarker, EyeArt,专注于区分病变/不病,或检测可参考的博士(5,6]。尽管如此,阿里亚斯目前不够复杂的分类不同水平的博士,这意味着识别之间的微妙的变化水平仍然是一个挑战性的任务医学图像分析的技术。图1为每个病变眼底图像显示了示例。

除了医学图像处理的准确性,医学检查设备的灵活性和可移植性是同等重要的。目前,数字眼底图像的采集要求合作病人坐在房间里的眼底照相机,环境照明最小化或关闭。病人需要期待在摄像机固定光和使用红外眼底成像技术来专注于感兴趣的领域。许多nonmydriatic相机自动检测软件的后极时眼睛和带照片集中在眼睛后面。RGB图像传感器仍然需要flash捕捉在可见光光谱图像。然而,数字眼底成像系统中使用最广泛的诊所笨重且昂贵的,如图2为大规模的筛查,限制其功能。

本研究的主要目标之一,除了使用人工智能提高分类精度,是想出一个新的筛选博士的系统框架。这个新框架结合了移动计算的优点,云计算、大数据和人工智能。拟议的框架的组件可以被描述为:(我)移动块:眼底图像采集是通过使用一个手持眼底成像,加上自主研发的iPhone应用程序。成像仪很小和轻量级。它可以在一个背包里。这些设备是极其方便的部署。便携式自然由于其小的形式因素和轻量级的偏远农村地区的医疗服务中受益。(2)云块:该系统不牺牲其计算性能的可移植性。由于云计算的体系结构,计算资源的核心是搬到云端,可以扩大灵活的要求增加。我们开发了高效深度学习算法,云服务器上运行,能够应对诊断请求在10秒。(3)大数据块:基于云计算的体系结构也有助于收集大数据。随着越来越多的终端设备(手持眼底相机)正在使用,眼底图像传递到云的数量将会增加。通过存储所有这些眼底图像数据,我们能够好好利用这样的大型数据集,比如培训机器学习模型,探索新功能,或为不同类型的跨域数据挖掘ophalmological疾病。

总之,在本文中,我们提出一个新的筛选博士的系统框架,基于人工智能、移动计算、云计算和大数据分析。图3提出了系统的显示了一个范例。这样的系统是一个新的范例telemedical服务并将有利于农村地区医疗资源不足。

在下面几节中,我们将逐步推出我们的想法和显示实验结果。节2,我们进行相关文献综述博士的基础分类的重要算法,这是视网膜血管分割。节3检测博士,我们进行了相关的文献综述。节4,我们说明了提出了深度学习和机器学习算法的细节。我们展示了部分实验结果5在部分和讨论一些重要的发现6。最后,给出一个结论部分7

2。文献综述的视网膜血管分割

博士在识别的过程中,关键是找到视网膜血管。如果船只位置可以正确,我们可以确定病人是否患有博士基于信息的精确位置和厚度的血管。然而,船舶跟踪是一个复杂的过程,因为许多其他物质除了在眼底血管图像。提出了众多的血管分割方法,可以大致分为五类:血管跟踪、匹配滤波,形态学处理,变形模型和机器学习。

2.1。血管跟踪的方法

血管跟踪方法是基于连续血管结构,通过从一个初始点和血管后,直到没有进一步的船只。这个过程的关键因素是初始点的设置,因为这将影响血管分割的准确性。目前,设置初始点可以人工或自动完成。

最早提出的自适应血管跟踪方法刘和太阳7]1993年,提取血管从x射线造影。首先,给定一个初始点和方向在一个容器,作者采用“extrapolation-update”计划,包括评估当地的船的轨迹。一旦船片段被跟踪,从图像中删除。重复这个过程,直到血管树已经被提取。这种策略的缺点是,由于使用的算法,用户必须设置容器的起点,似乎不适应三维提取的方法。1999年,一个自动血管跟踪方法是由可以et al。8]。这种策略主要是收集像素宽血管局部最小值点(通常是在一艘)进行跟踪。Vlachos和Dermatas9)提出了一个多尺度形态学后处理线跟踪方法。阴et al。10)提出了一种提取视网膜血管树,基于迭代跟踪和贝叶斯方法。

血管跟踪的优点是,它可以提供当地信息特征,如血管的直径/宽度和方向。然而,血管跟踪性能容易受到交叉或分支血管,这减少了识别效率。

2.2。匹配滤波的方法

采用多个匹配滤波器提取匹配滤波方法,所以设计适当的过滤器来检测血管至关重要。由于眼底血管的灰度分布符合高斯分布,存在一个直观的方法,利用图像的最大响应过滤后找到船点。随着血管的直径/宽度是多样化,多尺度高斯滤波器的方法通常用于船舶跟踪。

1989年,乔杜里et al。11率先应用高斯滤波器在船舶跟踪,通过使用一些血管特征,比如血管比背景深,船的宽度范围从2到10像素,并从视神经盘血管生长成径向的形状。因此,乔杜里et al。11)设计了二维高斯滤波器,可以检测血管在12个不同的方向。然而,这种方法需要大量的计算,有些黑暗病变类似于血管的特点,导致跟踪错误。胡佛et al。12)描述了一种改进的方法,认为地方和区域特征的血管分离血管在视网膜图像和迭代确定当前的点是一个船点。

这样改进之后,大量的研究已经发展改革过滤器。江和Mojon13)提升通用阈值方法基于multithreshold检测。Zhang et al。14)提高了匹配滤波方法通过应用局部血管横截面分析,使用本地双边的阈值。李等人。15)提出了一个多尺度匹配滤波器的生产,提高微小血管的提取。

2.3。形态学处理的方法

形态学处理促进了分割和识别目标对象的结构元素在一个二进制图像分析和处理。因此,线性和圆形元素可以选择血管,分离所需的结构而不是背景图像。此外,形态学处理也可以平滑和图像轮廓填充抗噪音的的优势。然而,这方法overrelies结构元素,不好好利用血管的特征。

根据船舶特点,Zana和克莱因(16]介绍了数学morphology-based算法,允许从所有可能的不良模式分离血管。在这种方法的基础上,Ayala et al。17使用不同的平均模糊集)提出。在米里Mahloojifar [18],眼底图像进行了分析,利用曲波变换和形态重建multistructural元素来增强血管脊和确定的界限。Karthika和Marimuthu19]曲波变换和形态重建multistructural元素相结合,与强连通分量分析(SCCA)段和识别血管。

2.4。变形模型的方法

首先介绍了卡斯et al。20.]1988年,变形模型的主要优势是能够产生平滑参数曲线或表面。两种变形模式识别:参数变形和几何变形。参数变形模型也称为活动轮廓或蛇模型(点集都有一个关联的能量)。通过内部和外部力量作用于蛇,蛇模型可以改变其形状和平滑度对所需的结构。2007年,Espona et al。21)使用参数形变模型方法对眼底图像和提升形态分割的改进方法。形态血管分割的协助下,蛇模型扩展轮廓的船只,直到获得局部能量函数最小。双胞胎的另一个变形模型方法称为丝带(腐烂),带蛇和双蛇相结合,提出了Al-Diri和猎人22]。每双由两个蛇,一内一外容器边缘。然后双蛇模型试图对双胞胎在容器边界融入一个丝带和计算船的宽度。

有一些缺点在参数变形模型。例如,分割结果依赖于初始轮廓,和困难时出现的从低到高维度和分段复杂对象。几何变形可以解决这些问题引起的参数变形模型。几何变形模型是基于变形曲线演化理论,没有严格要求的初始轮廓的位置,这就增加了该方法的鲁棒性,并允许它扩展到高维度。Zhang et al。23)提出了一个船自动分割方法,它使用非线性正交投影来捕获视网膜血管的特点,并获得一个血管分割的自适应局部阈值算法。赵et al。24)视网膜血管分割方法,提出了采用提出用水平集活动轮廓模型实现和区域增长模型。

2.5。变形模型的方法

机器学习是一个教计算机学习的算法自动实现目标,通过构建生成或歧视模型从积累的数据集。机器学习可以分为监督学习和无监督学习。监督学习方法学习实现真实目标的基础上,这意味着在训练阶段,使用训练数据训练模型有一个“标签”,可以使用机器学习算法来区分数据。应用这种模式在博士的问题,这意味着使用监督学习时,需要马克所有的像素属于提前船只,而非监督学习方法不需要事先标记它们。

监督学习,塞萨尔和内克(30.)和莱安德罗et al。31日)提出了一种利用监督分类和二维伽柏小波。每个像素都有一个特征向量,由不同大小的灰度特性和响应的二维伽柏小波。里奇和Perfetti25)提出了一种分割方法基于视网膜血管网络操作和支持向量分类。自从特性提取两个正交垂直的线,它减少了特性和在监督学习训练样本。监督方法利用神经网络提出了马林et al。26),一个输入层,三个隐藏层和一个输出层。图像中每个像素由7维特征向量训练网络。Shanmugam和α(27)使用一个极端学习机(ELM)检测视网膜血管通过创建一个7维特征向量基于灰度特征和不变矩和用榆树段血管。2015年,王等。28)提出了一种新的分层视网膜血管分割,包括三个步骤:预处理、层次特征提取和集成分类。它使用简单线性迭代聚类(SLIC)执行super-pixel分割和随机选择一个像素来表示整个super-pixel,更简单和有效的方法提取特征。

无监督学习,1998年,Tolias和Panas [32)创建了一个自动和无监督分割方法基于模糊眼底图像,使用模糊c均值(FCM)找到最初的候选点。谢和聂33)提出了一种基于遗传算法和FCM分割方法。Salazar-Gonzalez et al。29日)使用矢量流段视网膜血管的方法。

2总结了不同的现有方法之间的性能比较。

3所示。糖尿病性视网膜病变检测的文献综述

虽然之前提取血管与机器学习可以实现高精度检测博士,是耗时的创建真实明显的视网膜血管。另一个范例是培养计算机自动学习如何区分级别的视网膜图像直接读博士,没有进行分割。2000年,针对et al。34)博士提出了一个自动的分析不同的统计分类器,包括贝叶斯Mahalanobis,再。Silberman et al。35]介绍了一种自动检测系统为博士和报道平均错误率为87%。Karegowda et al。36]试图检测分泌物在视网膜图像使用bp神经网络(症)。他们的特点决定了两个方法:决策树和correlation-based遗传算法特征选择(GA-CFS)。在他们的实验中,最佳的BPN是性能显示98.45%的准确率。Kavitha和Duraiswamy37)做了一些研究在自动检测的硬性和软性渗出液在眼底图像,使用颜色直方图阈值分类渗出液。他们的实验表明99.07%的准确率,敏感性89%,特异性99%。2014年,de la Calleja et al。38)使用局部二进制模式(LBP)提取局部特性和人工神经网络,随机森林(RF)和支持向量机(SVM)检测。在71年使用一个数据集包含图像,与射频的最好成绩已经达到了97.46%的准确率。

4所示。材料和方法

我们博士提出了一个自动检测算法,基于DCNN,分数max-pooling [39),支持向量机(40(TLBO) [], teaching-learning-based优化41]。具体地说,我们与分数max-pooling火车两个DCNN网络,结合他们的预测结果与TLBO使用SVM和优化支持向量机参数。培训两个不同网络的原因是,不同的网络架构可能有其独特的优势在特征空间表示。通过训练两个DCNNs,结合他们的特性,可以进一步提高预测精度。另一个重要因素影响分类器的识别率是参数。我们建议使用TLBO优化支持向量机参数。我们在部分说明了图像预处理方法4.1和现在的分数max-pooling、支持向量机和TLBO部分4.2,4.3,4.4,分别。

4.1。预处理

鉴于原眼底血管图像大多不是很清楚,和每个眼底图像的大小可能不同,这样图像预处理是必不可少的,它们有相同的大小和提高船舶的可见性。有三个在预处理步骤。首先是重新调节图片大小相同。自眼底图像是圆形,我们重新调节输入图像,眼底图像的直径变得540像素。重新调节后,当地的平均颜色值中减去的新图像,和另一个执行转换,这样当地的平均灰度映射到50%,从而消除颜色差异引起的不同的检眼镜。最后但并非最不重要,因为边界效果可能发生在一些图片,我们将边缘剪断10%从图像的边界。图4显示了原始眼底图像和预处理后的图像。

4.2。部分Max-Pooling

池是一个过程,输入矩阵 到一个更小 输出矩阵。其目的是将输入矩阵划分为多个池区域( ):

池结果计算根据池类型:

在方程(2),“打开”是指一个特定的数学运算。例如,如果使用max-pooling,手术是将输入的最大区域。普通池、输入区域的平均值。对于这样一个网络,需要巨大的学习,最好使用尽可能多的隐藏层。在这部作品中,池层用于我们的网络部分max-pooling代替max-pooling将军。

部分max-pooling池方案,使输出矩阵的大小相当于输入矩阵的分数倍池之后,也就是说, 描述一般池区域,让 两个整数序列增加开始和一个结束 这两个序列在池的步骤中,使用所述数据56

常量, 在方程(3),代表的搭接长度和宽度池窗口,分别。图5是一个简单的例子,重叠的池。图6说明了不同的池区域类型。

部分max-pooling后,池窗口大小仍然是整数,但全球池大小会改变。即部分max-pooling并不直接改变池窗口部分范围内。相反,它使用可变大小的窗口来实现分池。的一代 可以随机或伪随机序列。伪随机序列生成更稳定的池地区比随机序列,也可以获得更高的精度39]。

4.3。支持向量机(SVM)

支持向量机是一种监督学习方法用于分类和回归分析。支持向量机可以找到超平面或决策边界向量定义的解决方案 ,不仅把训练向量也适用与看不见的测试数据。改善其泛化能力,支持向量机选择决定边界基于最大化利润类之间。

7说明了这个想法。假设有 点一个二进制数据集: 在哪里 是数据标签,可以1或−1,表示类的吗 属于。我们需要找到最优超平面,这样超平面之间的距离和它最近的点 是最大化。一个超平面可以写成方程(5基于 : 在哪里 超平面的法向量,值吗 决定的超平面的训练数据点的法向量

,的值是1,数据必须满足 , ,其价值是−1, 必须满足。结合这两个条件,我们得到

我们的目标是最大化 根据约束方程(6)为了获得优化的决策超平面分类。

有时,训练数据可能无法使用线性边界是完全分离的。因此,在支持向量机配方,我们需要引入误差度量 和成本参数 ,如方程所示(7)。现在的目标变得最小化

SVM的性能是由两个主要的影响参数,第一个是 ,这是一个可调参数方程(7)。另一个是 ,用于径向基函数(RBF)内核将数据映射到一个高维空间之前的训练和分类。RBF内核可以被定义为 在哪里 表示高斯包络的宽度在高维特征空间。

4.4。Teaching-Learning-Based优化(TLBO)

TLBO师校准优化算法,提出了饶et al。41),2011年。TLBO的概念是受学习过程的演变当一组或一类学习者学习目标任务。有两种方法学习的组或类:(1)学习的指导老师和(2)与其他学习者学习。TLBO的过程可以分为两个阶段,在部分如下所述4.4。14.4。2

4.1.1。老师阶段

在整个人口,老师( )可以被认为是最好的解决方案。即学习者学习老师在教师阶段。在这个阶段,老师努力提高其他个体的结果( )通过增加意味着结果的教室。这可以被描述为调整 近似 为了保持自然随机在优化过程中,两个随机生成的参数, ,在每个迭代中申请解决方案吗 作为

在方程(10), 是一个随机选择的数字0和1的范围。此外, 在迭代的新的和现有的解决方案吗 ,分别。 在方程(11)是一个教学因素可以是1或2。

10/24/11。学习阶段

学习者获得知识的相互作用。因此,个体学习新信息如果其他比他或她个人拥有了更多的知识。在这个阶段,学生 随机相互作用与另一个学生 ( )为了提高他或她的知识。方程(12)表明,如果 (例如, 最小化问题), 是走向 否则,它离开了

如果新的解决方案 这个问题比旧的好,新的解决方案 将被记录为最佳解决方案。更新每个学习者的状态后,一个新的迭代的开始。基于迭代停止准则,数量或成本函数的区别,可以设置为正常停止迭代。TLBO如图的流程图8

5。结果

我们的眼底图像数据从数据库所提供的一个Kaggle竞赛;题为“眼图像识别糖尿病性视网膜病变的迹象”(42]。在这个数据库中,大约有90000的图像。我们单独的1000张图片从训练数据集验证数据集。每个数据集的详细信息如表所示3,我们两个网络架构如图9

我们建议的方法使用两个DCNNs分数max-pooling层。对于每一个输入眼底图像,两DCNN将输出一个向量的大小1×5,代表每个病变的预测的概率分布(类别)。的概率分布,连同其他值,形成一个功能维度24。24功能描述如下:(我)DCNN概率分别为每个病变(5功能)(2)平均的R, G, B通道值在50%∗50%中心裁剪图像(3功能)(3)宽度和高度的50%∗50%中心裁剪图像(2功能)(iv)原始图像的总体标准偏差和50%∗50%集中裁剪图像,Laplacian-filtered形象(2功能)(v)总共有12一个眼底图像特征。然后添加另一个12的另一只眼睛的眼底图像特征相同的主题。因此,特征向量的总长度是24眼底图像。的24特征向量维数作为支持向量机的输入向量

24-dimensional向量用于火车多类支持向量机(5类),使用TLBO方法的参数进行了优化。我们实现了中描述的方法(39),并使用它作为基线。基线系统使用类似的特性与系综分类器(RF)的计划。

我们使用了验证集数据优化参数集 在使用TLBO SVM。设置参数的上界和下界在[0,100]。我们跑50迭代与50名学生。

博士最后five-class分类任务的准确性为86.17%,二进制类分类任务的准确性为91.05%。标签five-class分类是正常的,NPDR一级,NPDR级别2,NPDR 3级,PDR同时为二进制类标签分类是正常和异常。二元分类,其敏感性是0.8930而特异性是0.9089。除了计算的准确性,我们也做一个T以及对我们的二进制类分类。的T以及也称为学生的t以及。这是一个统计假设检验,检验统计量遵循学生的t分布。通常,t以及用于比较两组之间是否存在显著差异的数据和协助判断散度的数据。在做一个配对样本t以及随机二进制类分类和判断的结果,其结果是1对假设检验的结果,零的 价值和置信区间[0.3934,0.4033],在零假设在5%显著水平。

假设检验的结果是一个索引,以告知是否两个数据来自相同的分布。如果数据来自相同的分布,假设检验结果的价值将接近0。相反,如果数据资源是不同的,结果将是接近1,这意味着有一个区分数据。的 值的概率是接受的假设是有区别的两个数据可能是错误的。越小 价值,更多的原因是数据之间的差距。

也,我们设计了一个应用程序被称为“深视网膜”,提供个人检查,远程医疗护理,早期筛查。图10展示了我们的应用程序接口。后选择一个用户想要检查眼底图像,将图像发送到我们的服务器,使用我们的机器学习方法设计。大约需要10年代(取决于网络速度)的结果,将每个损伤的概率。手持设备,个人可以做最初的检查区办公室,甚至在家里。更重要的是,它可以受益的一些偏远地区缺乏医疗资源。

6。讨论

6.1。精度提高

4显示了精度比较时使用不同的分类器对每个数据集和参数优化方法。使用默认参数与支持向量机(没有优化),精度验证和测试集是高于RF (39]。如果我们优化参数使用默认参数搜索方法LIBSVM软件提供的计划,尽管它达到很高的精度在5倍交叉验证实验,验证和测试精度比默认甚至更低。从这个结果,我们认为时出现过度拟合优化支持向量机参数。

5显示了分类结果的混淆矩阵的两个DCNN网络(在执行SVM分类之前)。网络1是左侧的图所示的体系结构9和网络2是一个在右边。从表5,这表明病变分类0和2比另一个类别去了。对于病变1,大多数的预测结果是不正确的。也为病变3和4,大多数结果是错误分类,分为病变2。

6显示分类结果的混淆矩阵使用该方法的整个过程与TLBO(使用SVM)。表7显示表的区别56,这是两种方法之间的性能比较(只使用DCNN和DCNN +方法+ TLBO)。从表中,每一节课,除了类0和整体精度,增加网络1。对于网络2,每个精度,除了3班,增加。3班的准确性的下降主要是由于误分类的二班。表8显示了分类结果的混淆矩阵使用基线方法报道(39),用于比较。

6.2。深度学习与传统的分类方法

许多传统的分类方法试图解决这个问题的博士(1)利用图像处理的检测捕获症状在眼底图像,然后(2)建立一个分类器决策基于检测到的症状(1)。图像处理方法的缺点是,表现的症状是随机在不同的图像;因此,它是非常耗时的,需要努力,标签的位置的症状。遵守的新哲学的深度学习技术的出现,我们的方法是努力学习如何做决定直接从图像数据本身。和前者的方法不同,我们的图片只需要贴上病变位置而不是标签数量症状。因此,它可以节省相当多的时间在数据库预处理阶段。上面两个DCNN网络的分类结果,我们使用TLBO产生一种改进的支持向量机优化的结果,我们达到86.17%的准确率。我们的结果比Kaggle比赛的第一名。它显示了我们的研究结果是最先进的。

6.3。限制

在我们当前的数据集,病变3和4的图片的数量不足以训练网络,这是一个该方法的局限性。因此,我们未来的作品之一是与医院和诊所发展更深层次的合作关系,获得更多的病变3和4的数据。更多的数据,我们认为,分类精度将进一步增加。此外,从我们的结果,我们发现很难区分病变0和1之间的图像。因此,当我们收集新数据,需要收集更多的图片属于病变0和1。同时,我们可以尝试使用不同的网络体系结构这一问题。

7所示。结论

火车的深度学习模型是可行的自动诊断博士的,只要我们有足够的数据统计模型的训练。此外,数据库准备阶段只需要每个训练图像的分类标签。它不需要详细的注释为视网膜血管跟踪每一个图像。因此,它是基于处理相比,传统的机器学习方法进行自动诊断博士最后的精度可以达到86.17%和91.05% five-class和二进制类分类,分别。

二元分类的敏感性和特异性是0.8930和0.9089,分别,这是一个令人满意的结果。此外,我们开发了一个自动检查应用程序,可用于个人考核和远程医疗。更多的图像数据收集,我们预计精度可以更加提高,进一步提高我们的系统。

数据可用性

所有实验数据来自一个Kaggle比赛叫做“眼图像识别糖尿病性视网膜病变的迹象”(网站:https://www.kaggle.com/c/diabetic-retinopathy-detection)。

的利益冲突

作者宣称没有利益冲突。

确认

作者要感谢胡Chia-Ming先生,他的帮助在准备实验的计算工具和执行部分。