研究文章|开放获取
Nour-Eddine El Harchaoui穆尼尔Kerroum, Ahmed Hammouch Mohamed Ouadou Driss Aboutajdine, ”无监督方法基于模糊可能性聚类数据分析:应用MRI医学图像”,计算智能和神经科学, 卷。2013年, 文章的ID435497年, 12 页面, 2013年。 https://doi.org/10.1155/2013/435497
无监督方法基于模糊可能性聚类数据分析:应用MRI医学图像
文摘
大数据的分析和处理是研究人员面临的挑战。几种方法被用来模拟这些复杂的数据,他们都是基于一些数学理论:模糊,概率,可能性,证据理论。在这项工作中,我们提出一种新的无监督的分类方法,结合了模糊可能性理论;我们的目的是克服不确定复杂系统中数据的问题。我们使用模糊c均值(FCM)的隶属函数来初始化的参数可能主义的c (PCM),为了解决这一问题的同时集群由PCM和噪音也克服FCM的弱点。来验证我们的方法,我们使用一些有效性指标和我们相比,他们与其他传统的分类算法:模糊c均值,可能性c,与模糊c可能主义的。实验发现在大脑不同合成数据集和真实图像先生。
1。介绍
图像分割是一个非常重要的操作过程中处理和分析图像,并广泛应用于不同的领域:模式识别、遥感、人工智能、医学成像等。医学成像领域包括几种类型的图片:放射学(x射线),超声和磁共振图像(1- - - - - -4]。这些图片是一个非常复杂的数据,所以他们的研究分析是一个挑战。
在文献中,有几种方法可以部分这些图像。我们可以组织他们在四类。第一个是阈值;它允许寻找最优阈值,为了提取图像中的背景物体。一般来说,这种方法对噪声非常敏感,而忽略了空间参数(5,6]。
第二种方法是轮廓;它允许检测图像的轮廓。这种方法很容易实现,但不幸的是它也很敏感噪声和参数初始化,这意味着它主要是用于预处理滤波器(7- - - - - -10]。
第三种方法是地区,以生成一些方法:种植区域(称为上升)和分裂/合并(称为后代);这种方法是非常敏感的初始参数和噪声(11- - - - - -13]。
最后一个方法是聚类;这是一个非常重要的操作流程和数据分析,和它允许创建均匀分区使用相似准则(3,4,14- - - - - -33]。
在这项工作中,我们感兴趣的聚类分割使用的可能性理论与模糊理论相结合。
本文的其余部分的结构如下。节2,我们提出的聚类方法有三个传统算法,模糊c均值(FCM)算法1),可能主义的c (PCM)(算法2),可能主义的模糊c均值算法(PFCM) (3)。节3拟议的新方法(二)是制定集群节中复杂的数据集。4使用不同的人工合成物,我们目前的实验结果数据集和真实图像。最后,给出了结论和观点5。
2。数据分析理论
2.1。分类的方法
分类是一个方法,使复杂的数据分析和处理。广泛应用于不同的领域:模式识别、遥感、图像处理和人工智能(3,14,16]。
在文献中有两种类型的分类:监督和非监督。一般来说,监管方法使用一个学习基础为了分类数据的提取和生产决策的功能。但是,使用非监督分类没有学习知识库,也称为聚类(17,22,34,35]。
在这项工作中,我们感兴趣的是学习聚类方法及其在医学图像处理中的应用。
2.2。聚类
集群是一个过程,允许将数据划分为组类似的模式,而这些团体被称为集群。在文献中,有几个聚类理论。第一个概念模糊理论提出了德(36),他建立了模糊理论的基本原理,利用模糊逻辑,为了由隶属函数描述归属的不确定性。然后Ruspini [35]提出第一个模糊分区的概念,他认为每个集群是一个模糊集。德(34提出了聚类分析的概念框架和模式分类使用模糊集理论。后,几个研究发表;为了提高Bezdek算法,Rousseeuw et al。37- - - - - -39)提出了不同的目标函数,使改进模糊c均值算法的有效性。
为了克服FCM噪音的弱点,Krishnapuram和凯勒23]提出放宽约束的模糊,他们建立了第一个可能性c均值算法(PCM)。然后Barni et al。40PCM)表明,算法对初始化和生成一致的集群非常敏感。蒂姆et al。29日提出了可能性模糊聚类,Pal et al。30.模糊c]提出了另一种可能性(PFCM)可以避免PCM的重合集群,对噪声不敏感。
2.3。模糊c均值
模糊c均值算法建立了Bezdek [22),它允许分类不确定和不精确的数据,它是使用最广泛的模糊聚类。FCM模型的优化问题: 在哪里是数据集,是数据的数量,是集群的数量,模糊的程度,是隶属程度,是集群的中心,是一个距离和对象。考虑
定理1 (FCM)。如果,尽管,,,数据集包含至少不同的模式,那么和可以最小化只有吗
2.4。可能性c均值
可能性c均值算法引入Krishnapuram和凯勒23)来克服模糊c均值噪声的敏感性。他们的想法可以放松的模糊约束。
PCM是优化问题:
定理2 (PCM)。如果,尽管,,,,数据集包含至少不同的模式,那么和可以最小化只有吗
2.5。可能主义的模糊c均值(PFCM)
朋友等。30.)提出了可能主义的模糊c均值算法(PFCM)是基于FCM和PCM,同时生成两个隶属度函数;第一种是可能主义的会员(),介绍了典型性的绝对程度,第二个函数是模糊会员(),提出了相对的程度。
PFCM是优化问题: 在哪里,。
定理3 (PFCM)。如果,尽管,,,,数据集包含至少不同的模式,那么和可以最小化只有吗
朋友等。30.表明PFCM可以克服FCM噪声以及克服的弱点重合的PCM的问题。
3所示。该算法二
3.1。二
我们新的混合方法二是基于前两个数学理论、模糊集理论和可能性理论。我们对混合二使用FCM算法的结果作为输入数据的PCM算法。隶属程度矩阵PCM的值初始化FCM的结果矩阵。我们提出我们的算法在算法4。
|
||||||||||||||||||||||||||||||||||||||||||||||
4所示。实验结果
4.1。合成数据集
数据集 。这个数据集由10模式和两个离群值(噪音),如表所示1和下30.]。我们应用FCM, PCM, PFCM,二初始参数,(集群),和中心矩阵随机值。理想的(真正)重心
|
||||||||||||||||||||||||||||||||||||||||||||||||
表2显示了原型的结果簇的中心和使用四个算法。计算结果之间的误差模型和理想中心集群,我们使用公式:,*是FCM、PCM PFCM,二。所以,我们可以有错误如下:,,,。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
这些误差值表明,我们的方法给最好的原型和。和图1展示了我们的方法的有效性。
(一)
(b)
(c)
(d)
4.2。真正的UCI数据集
4.2.1。准备UCI数据集的描述
在本节中,我们测试了我们的方法的性能在不同的真实数据集:虹膜、玻璃、酒,乳腺癌和威斯康辛州,如表所示3。这些数据集引用在基准UCI机器学习数据库的存储库(31日]。
|
||||||||||||||||||||||||||||||||||||||||
Iris数据集。它描述了一个类型的虹膜植物,它包含3类50实例为每个类。有一个类(1级)从其他是线性可分的,但是2和3的类不是线性可分的,这是一个四维数据集(31日]。
葡萄酒数据集。酒是13-dimensional数据集,包含化学分析值的葡萄酒种植在同一地区在意大利但来自三个不同的品种31日]。
玻璃的数据集。玻璃是一种能量的数据集,它包含214个对象6类的代表类型的玻璃(31日]。
乳腺癌的数据集。威斯康辛州乳腺癌是一个能量的数据集,其中包含699个对象2类的代表类型的良性和恶性肿瘤31日]。
4.2.2。对UCI数据集的聚类结果
评价聚类的准确性,我们使用了黄和Ng指数32]中给出 在哪里是集群的数量,模式发生在两个集群的数量吗th和它真正的对应在数据集对象的总数。
在表4,使用虹膜数据集,我们可以看到,PCM算法给少精度比其他算法(0.667),和FCM算法和PFCM给值0.893和0.9,分别,我们的方法给了最好的准确性(0.929)。和使用其他数据集、葡萄酒、玻璃、和乳房,我们还可以看到,所有精度值的方法比其他算法:FCM, PCM, PFCM。
|
||||||||||||||||||||||||||||||||||||||||
4.3。医学图像数据集先生
4.3.1。效度指数
有几个有效性指标来评价聚类方法的性能(25]。在我们的工作中,我们使用敏感性指数(Se),特异性(Sp),分类精度(AC)。这三个指标是基于四个参数:真阳性(TP),真阴性(TN),假阳性(FP),和假阴性(FN),如图2、表5和6。(我)TP是真正积极的,当一个像素标记正确归类为积极。(2)TN是一个真正的消极,当像素标记正确归类为负。(3)FP是假阳性,阴性标记像素时错误地划分为积极的。(iv)FN假阴性,阳性标记像素时错误归类为负。
|
|||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||
灵敏度(Se)指数为真阳性的比例对所有应该分段的结构
特异性(Sp)指数给真正的底片的比例结构,不应分段
分类精度(CA)指数给出了性能的方法:
4.3.2。Brainweb:模拟大脑的数据库
这个数据集可以模拟大脑图像先生在三个正交视图(横、矢状面和冠状);它也可以给三个序列卷(T1, T2,和PD(质子密度),如图3,4,5(41,各种各样的切片厚度,噪音,和水平的强度不均匀性41]。
(一)
(b)
(c)
(一)
(b)
(c)
表7,8,9使用不同的大脑组织显示,聚类结果:灰质(GM),白质(WM),分别和脑脊液(CSF)。我们使用了不同的噪音水平(0%,1%,3%,5%,7%,和9%),为了评估我们的方法二和我们精度结果与其他算法相比,FCM, PCM, PFCM。我们可以看到,FCM算法不稳定和对噪声非常敏感,和PCM算法给稳定值,但它并没有显示出足够的性能;相反PFCM和二给了良好的性能和稳定。同时,我们绘制曲线的可视化结果,可以看到在图6相比,我们的方法给最好的准确性PFCM和其他传统的FCM算法和PCM。聚类结果对大脑图像先生与地面真理如图7。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
(一)
(b)
(c)
(d)
(e)
(f)
(一)
(b)
(c)
(d)
(e)
(f)
4.3.3。IBSR数据集
评估我们的方法在实际医学图像,我们使用了IBSR数据集(大脑网络分割存储库),这是由马萨诸塞州总医院的形态学分析中心(42]。
表10显示不同的大脑组织的聚类结果:通用、WM和脑脊液。10日我们做这项研究的图像数据集IBSR;每个图片都有150×256×256像素点。同时,地面事实成立的专家和有IBSR [42]。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
据表的结果11,我们可以看到,我们的方法使用不同的索引二给最好的结果:特异性(Se)、敏感性(Sp)和聚类准确性(CA)。为了更好的分析结果,我们建立了曲线,如图8,所以这条曲线表明,我们的方法是一种更好的模型和非常有效的与其他算法FCM相比,PCM, PFCM。大脑先生IBSR的图像的聚类结果与地面真理如图9。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
(一)
(b)
(c)
(d)
(e)
(f)
5。结论
在本文中,我们提出了一种新的聚类方法,基于模糊c和可能性c。我们的方法用于模型不确定和不精确的数据,为了段MRI医学图像的脑组织。它比较三个传统聚类算法:FCM, PCM, PFCM。我们的方法已成功验证的性能在几个合成数据集和真实的MRI医学图像。在未来,我们将整合其他理论:遗传和证据理论,以优化我们的混合法,我们可以有一个非常健壮的复杂数据建模。
引用
- c . s . Drapaca诉Cardenas, c . Studholme”分割的组织边界演化从大脑图像序列使用多相水平集,先生”计算机视觉和图像理解,卷100,不。3、312 - 329年,2005页。视图:出版商的网站|谷歌学术搜索
- m . Kamber r . Shinghal d·l·柯林斯g·s·弗朗西斯,a·c·埃文斯,“基于模型的分割多发性硬化病变的磁共振脑图像,”IEEE医学成像,14卷,不。3、442 - 453年,2000页。视图:谷歌学术搜索
- n . El Harchaoui巴拉,m . Ait-Kerroum a . Hammouch m . Ouadou和d . Aboutajdine“改进的模糊聚类方法:应用MRI医学图像,”IEEE国际会议的程序复杂的系统,2012年,页1 - 6。视图:谷歌学术搜索
- d, l .周y . Wang h .元,d .沈,“多模式分类的阿尔茨海默病和轻度认知障碍,”科学杂志,55卷,不。3、856 - 867年,2011页。视图:出版商的网站|谷歌学术搜索
- y俏,问:胡,g .钱罗,和w·l·Nowinski“基于方差阈值和强度对比,”模式识别,40卷,不。2、596 - 608年,2007页。视图:出版商的网站|谷歌学术搜索
- z君和h . Jinglu图像分割基于2 d大津法与直方图分析,”《计算机科学和软件工程国际会议(CSSE ' 08)武汉,页105 - 108年,中国,2008年12月。视图:出版商的网站|谷歌学术搜索
- t . Pavlidis Y.-T。Liow”,整合区域生长和边缘检测,”IEEE模式分析与机器智能,12卷,不。3、225 - 233年,1990页。视图:出版商的网站|谷歌学术搜索
- l·d·科恩和科恩,“有限元方法为活动轮廓模型和气球2 d和3 d图像,”IEEE模式分析与机器智能,15卷,不。11日,第1147 - 1131页,1993年。视图:出版商的网站|谷歌学术搜索
- t·f·陈,洛杉矶Vese主动轮廓没有边缘,”IEEE图像处理,10卷,不。2、266 - 277年,2001页。视图:出版商的网站|谷歌学术搜索
- l . Najman m·施密特,“测地线凸起的分水岭轮廓和层次分割,“IEEE模式分析与机器智能,18卷,不。12日,第1173 - 1163页,1996年。视图:出版商的网站|谷歌学术搜索
- m .泰伯和n . Ahuja”,综合多尺度图像分割的边缘和区域检测,”IEEE图像处理》第六卷,没有。5,642 - 655年,1997页。视图:出版商的网站|谷歌学术搜索
- j .粉丝,d .刘贤瑶族,a . k . Elmagarmid和w·g·奥”自动图像分割通过整合彩色边缘提取和播种地区增长,”IEEE图像处理,10卷,不。10日,1454 - 1466年,2001页。视图:出版商的网站|谷歌学术搜索
- S.-Y。广域网和w·e·希金斯,“对称的区域增长,”IEEE图像处理,12卷,不。9日,第1015 - 1007页,2003年。视图:出版商的网站|谷歌学术搜索
- m河中的小岛Kerroum、a . Hammouch和d . Aboutajdine”结构特征选择联合互信息基于高斯混合模型的多光谱图像分类,“模式识别的字母没有,卷。31日。10日,1168 - 1174年,2010页。视图:出版商的网站|谷歌学术搜索
- a . Hammouch m河中的小岛kerroum, d . Aboutajdine”输入结构互信息的特征选择多光谱图像分类,“国际信号处理杂志》上》第六卷,第1条,2010年。视图:谷歌学术搜索
- d·维达梅嘉“dempster-shafer应用证据理论在多源遥感、非监督分类”IEEE地球科学和遥感,35卷,不。4、1018 - 1031年,1997页。视图:出版商的网站|谷歌学术搜索
- 许r和d·温斯迟二,”调查的聚类算法IEEE神经网络,16卷,不。3、645 - 678年,2005页。视图:出版商的网站|谷歌学术搜索
- k . Wagsta c .羊毛衫,s·罗杰斯,s . Schroedl“约束与背景知识,k - means聚类”机器学习的国际会议,第584 - 557页,2001年。视图:谷歌学术搜索
- l, m . k . Ng, j . z黄”一个熵加权子空间聚类的k - means算法高维稀疏数据,”IEEE工程知识和数据,19卷,不。8,1026 - 1041年,2007页。视图:出版商的网站|谷歌学术搜索
- f . Hppner f . Klawonn r·克鲁斯,t . Runkler“模糊聚类分析方法来论述,”数据分析和图像识别约翰•威利父子公司,1999年版。视图:谷歌学术搜索
- j . c . Bezdek“集群与模糊集有效性,”《控制论,3卷,不。3,58 - 73、1973页。视图:出版商的网站|谷歌学术搜索
- j . Bezdek模式识别与模糊目标函数算法,充气出版社,纽约,纽约,美国,1981年。
- r . Krishnapuram和j·m·凯勒”可能性聚类方法,“IEEE模糊系统,1卷,不。2、98 - 110年,1993页。视图:出版商的网站|谷歌学术搜索
- k . p . Detroja r . d . Gudi, s . c . Patwardhan”可能性聚类方法新颖的故障检测和隔离,”《过程控制,16卷,不。10日,1055 - 1073年,2006页。视图:出版商的网站|谷歌学术搜索
- 江y, b . Cukic, y,“技术评估故障预测模型,经验软件工程,13卷,不。5,561 - 595年,2008页。视图:出版商的网站|谷歌学术搜索
- a .法官:Laird, d·鲁宾,“最大似然通过EM算法,不完整的数据”英国皇家统计学会杂志》上,39卷,不。1,1-38,1977页。视图:谷歌学术搜索
- Biernacki c、g . Celeux和g . Govaert”评估聚类的混合模型综合完成的可能性,”IEEE模式分析与机器智能,22卷,不。7,719 - 725年,2000页。视图:出版商的网站|谷歌学术搜索
- n . El Harchaoui巴拉,m . Ait-Kerroum a . Hammouch m . Ouadou和d . Aboutajdine”一种改进的模糊聚类方法使用可能主义者c均值算法:应用MRI医学图像,”《IEEE讨论会在信息科学与技术(石棺12),第122 - 117页,2012年。视图:谷歌学术搜索
- h·蒂姆,c . Borgelt c·多尔,r·克鲁斯“模糊聚类分析的扩展可能性,”模糊集和系统,卷147,不。1,3-16,2004页。视图:出版商的网站|谷歌学术搜索
- n . r .朋友k .朋友j·m·凯勒和j·c . Bezdek”可能主义的模糊c均值聚类算法”,IEEE模糊系统,13卷,不。4、517 - 530年,2005页。视图:出版商的网站|谷歌学术搜索
- c·布莱克·e·基奥,c·j·梅尔兹UCI机器学习数据库的存储库。部门的信息和计算机科学,加州大学欧文分校加州,美国,1998年,http://www.ics.uci.edu/mlearn/MLRepository.html。
- 黄z和m . k . Ng”模糊k-modes算法聚类分类数据,”IEEE模糊系统,7卷,不。4、446 - 452年,1999页。视图:出版商的网站|谷歌学术搜索
- j·c·邓恩,“模糊isodata过程及其使用的相对检测集群紧凑布置得井然有序,“《控制论,3卷,不。3,32-57,1973页。视图:谷歌学术搜索
- 洛杉矶德”,模糊集及其应用模式分类和聚类分析,”分类和聚类,j . v . Ryzin Ed, 251 - 282年,1977页。视图:谷歌学术搜索
- e·h·Ruspini”,一种新的聚类方法,”信息和控制,15卷,不。1,22-32,1969页。视图:谷歌学术搜索
- 洛杉矶德,“模糊集”,信息和控制,8卷,不。3、338 - 353年,1965页。视图:谷歌学术搜索
- p . j . Rousseeuw”讨论:模糊聚类在十字路口,“技术计量学,37卷,不。3、283 - 285年,1995页。视图:谷歌学术搜索
- p . j . Rousseeuw和公元前Van Zomeren揭露多元异常值和杠杆点。”美国统计协会杂志》上,卷85,不。411年,第639 - 633页,1990年。视图:谷歌学术搜索
- l·考夫曼和p . j . Rousseeuw发现组织数据:介绍了聚类分析1990年,约翰·威利和儿子。
- 卡佩里尼m . Barni诉,a . Mecocci”评论“可能性聚类方法”,“IEEE模糊系统,4卷,不。3、393 - 396年,1996页。视图:出版商的网站|谷歌学术搜索
- BrainWeb”,模拟大脑的数据库。麦康奈尔脑成像中心。麦吉尔大学蒙特利尔神经学研究所”http://www.bic.mni.mcgill.ca/brainweb。视图:谷歌学术搜索
- “互联网大脑分割存储库(IBSR)。”http://www.cma.mgh.harvard.edu/ibsr/。视图:谷歌学术搜索
版权
版权©2013 Nour-Eddine El Harchaoui等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。