研究文章|开放获取
拉弥亚Jaafar被设置, "图像处理中拓扑梯度方法的概述:优点和缺点",应用数学学报, 卷。2010, 物品ID761783, 19 页面, 2010. https://doi.org/10.1155/2010/761783
图像处理中拓扑梯度方法的概述:优点和缺点
摘要
摘要拓扑梯度图像分析是一种基于拓扑渐近展开法的图像分析技术。本文通过对该方法在图像处理中的各种应用进行综述;具体地,本文提出了灰度图像和彩色图像的边缘检测、分类和分割问题。数值实验表明了拓扑梯度法在建模和解决不同图像分析问题方面的有效性。然而,拓扑梯度方法有一个主要缺点:识别的边不连接,然后得到的结果,特别是分割问题会退化。为了克服这种不便,我们提出了一种将拓扑梯度方法与分水岭技术相结合的替代方案。用耦合方法得到的数值结果非常有趣。
1.介绍
拓扑优化的目标是找到一个给定域的最优分解:最优设计和它的互补部分。类似地,在图像处理中,目标是将图像分割成几个部分,特别是在图像恢复中,边缘的检测使这个操作变得简单。
这项工作的目的是展示如何使用拓扑优化工具来解决一些图像分析问题。让我们回顾一下,基本的和第一个想法是基于Amstutz等人的工作[1.]其中作者提出了一种利用拓扑梯度方法解决裂纹检测问题的方法,并将该方法推广到图像处理中的不同问题,如恢复、分类、分割、修复和层析成像应用[2.–6.]本文概述了拓扑梯度法在主要图像处理问题中的应用,并举例说明了该技术在图像分析中的不便之处和优势。
让是在一个域内定义的给定噪声图像和恢复图像。这是一种经典的恢复图像的方法是为了解决以下偏微分方程(PDE)问题 在哪里是一个小的正常数表示垂直于的向外单位.众所周知,这种方法效果不佳:它模糊了像边缘这样的重要结构,为了改进这种方法,引入了非线性各向同性和各向异性方法。在我们的拓扑优化方法中,只取两个值:在图像的平滑部分取一个小值在边缘。然后经典的非线性扩散方法可以看作是我们方法的松弛,增加了恢复过程的不稳定性。本节简要介绍了拓扑梯度法的基本原理2..其他章节如下所示。第节介绍了边缘检测的恢复问题3..部分4.处理分类问题。节5.,我们介绍了拓扑梯度方法在层析成像问题中的应用6.致力于分割问题;在这一节中,我们介绍了拓扑梯度方法的主要缺点,并提出了一种替代这种不便的方法。最后,我们以一些结束语结束本文。文中还对所研究的所有应用进行了若干数值试验。
2.拓扑梯度法:基本原理
让是的一个开有界域,让,是要最小化的成本函数,其中中定义了PDE问题的解决方案吗. 一小会儿,让为裂纹插入的摄动域哪里,是直缝和垂直于裂纹的单位向量。拓扑灵敏度理论提供了裂纹的渐近展开式什么时候倾向于零。它采用一般形式 在哪里显式正函数是否趋于零和称为点处的拓扑梯度.很明显,要尽量减少标准,我们必须在这些点上插入小孔答案是否定的。利用这种梯度类型的信息,可以建立快速算法。在大多数应用中,在优化过程的第一次迭代中,可获得满意的最优解近似值。Masmoudi的工作中提出了一个拓扑敏感性框架,允许对一般成本函数进行这种扩展[1.,7.].
这是一种经典的恢复图像的方法从它吵闹的版本在域中定义是为了解决以下PDE问题 在哪里是一个小的正常数,叫做电导率,表示法向导数和外单位与外单位正常吗拓扑梯度法的思想是只考虑电导率的两个值。:在图像的平滑部分和0(或者说是未定义的)在它的互补(边缘)。因此,经典的非线性扩散方法,其中c取所有的值,可以看作是我们方法的一种松弛。通过扩大容许解集,松弛增加了恢复过程的不稳定性,这可以解释为什么我们的方法在算法成本方面如此有效。
3.在图像复原中的应用
本节的目标是使用拓扑梯度方法作为检测图像恢复边缘的工具[5.,6.]事实上,图像可以看作是一个分段光滑函数,边缘可以看作是一组奇异点。其基本思想在于应用用于裂纹检测的拓扑梯度方法[1.].更准确地说,让是通过插入裂纹获得的扰动域.扰动解满足 问题的变分形式(3.1)是由 在哪里是双线性形式吗通过 和线性形式定义在哪里通过
边缘检测相当于寻找的一个子域在能量很小的地方,我们的目标是最小化边缘外的能量范数 成本函数的变化由小裂纹的插入引起由拓扑梯度理论给出[1.]: 与 在哪里是直接问题的解决方案(3.1),这样和下列伴随问题的解决方案 我们注意到这里的解和在无裂纹的初始区域内计算,即裂纹尺寸等于零。然后,拓扑梯度可以改写为 在哪里对称矩阵是由 我们可以推断是最小的时候正常吗特征向量是否与矩阵最小(即最负)的特征值相关联.在下面,这个特征值将被认为是拓扑梯度。我们的算法是在拓扑梯度小于给定阈值的区域插入小的异质性.这些区域是边缘算法如下。
恢复算法
(一)初始化:.(2)计算和直接(3.1)及伴随(3.8分别)问题。(iii)计算的矩阵和它的最小特征值在定义域的每一点。(iv)设置
(五)计算问题的解决办法(3.1),.
对于数值实验,我们首先考虑了灰度图像(见图)1.).我们注意到扰动图像是通过添加高斯噪声()到原始图像,其灰度值取其在区间[0,255]内的值。如图所示1.图像恢复的不同方法。更准确地说,提出了使用拓扑梯度方法恢复的图像,并与线性和非线性扩散方法进行了比较[8.].请注意,非线性方法的收敛是在53次迭代后实现的。我们的方法可以解释为一种线性各向同性扩散方法,定义在边的互补性中。在各向异性情况下,不仅扩散量局部适应数据,而且平滑方向也适应数据。与各向异性非线性方法一样,我们沿着图像边缘进行平滑,同时抑制边缘之间的平滑。这可以通过将扩散率标量替换为扩散率张量来实现。为了证明我们的方法的有效性,我们测试了一个具有拓扑梯度的各向异性算法,如下所示
(一)
(b)
(c)
(d)
各向异性拓扑梯度算法
(一)初始化:.(2)计算和:直接解决方案(3.1)及伴随(3.8)问题。(iii)计算的矩阵和它的最小特征值在定义域的每一点。(iv)设置,和哪里和表示切线方向和法线方向。(五)计算问题的解决办法(3.1).
在图2.,我们证明了各向同性方法和各向异性方法与拓扑梯度方法之间的结果没有显著差异。我们的两种算法在几幅图像上进行了测试。数值试验表明,两种算法的计算结果非常相似。如图所示2.缩放Lena图像及其非线性复原方法[8.],以及各向同性和各向异性拓扑梯度算法。
(一)
(b)
(c)
(d)
我们现在考虑使用RGB模式的彩色图像。然后,图像是由3D矢量定义的表示红、绿、蓝三种颜色的强度,由于每个分量都可以作为灰度图像处理,因此只要要最小化的代价函数不存在多个通道之间的耦合项,就可以很容易地使用拓扑梯度方法。对于恢复问题,通常将代价函数设为图像梯度的平方范数。如果我们考虑最简单的情况,也就是标准然后,彩色图像问题可以分解为三个通道,一个通道一个通道的独立问题。我们在这里提到,可以假设三个通道是耦合的,并且可以考虑图像的张量梯度正如Di Zenzo工作中提出的那样[9].
为了处理多通道图像,还定义了其他一些耦合技术。我们可以举个例子,Beltrami扩散型过程中,图像被认为是流形。定义非线性结构张量,并根据梯度型测度进行局部调整,使其能够控制扩散过程[10–12].
对于数值试验,我们首先考虑图中3.使用标准梯度范数将拓扑梯度法自然扩展到多通道图像,我们将此方法与Ambrosio-Tortorelli版本的Mumford-Shah泛函进行比较。
(一)
(b)
(c)
(d)
然后为了改进恢复过程,我们提出了如图所示的方法4.使用Di Zenzo方法和拓扑梯度方法给出数值结果。图4.给出了应用于Di Zenzo梯度的恢复算法彩色图像。噪声图像由加性高斯噪声获得,因此信噪比(SNR)等于10.54。第三幅图像对应于我们算法恢复的图像。恢复图像的信噪比为19.23。第四幅图像中给出的识别边缘对应于矩阵最负特征值所在的像素小于给定的阈值。
(一)
(b)
(c)
(d)
在这里我们必须注意,对于经典拓扑梯度法对应的情况,解的(2.2)可以写成哪里是以下问题的解决方案: 为,这意味着成本函数也可分解为三项,每个通道一项,如下所示: 与 以及拓扑梯度可以用以下方式重写: 在哪里是对称的吗矩阵由 与和是各通道的直接问题和伴随问题的解.
另一方面,对于使用Di Zenzo梯度的拓扑梯度方法对应的情况,考虑与图像向量场相关的多光谱张量,张量的最大特征值对应于梯度的范数,称为Di Zenzo梯度[9].[13已经证明了以下结果。
引理3.1。对于在,给出了Di Zenzo梯度 在哪里函数的定义是 与 和标准规范在吗.如前一节所述,拓扑梯度可以写成 在哪里是对称矩阵 在哪里是由 和定义为(3.18).
4.在图像分类中的应用
本节涉及使用图像分类对原始图像进行分类的问题预定义的类,,通过选择颜色强度作为分类器是在开放集上定义的原始图像的.我们的目标是找到颜色,,分区,的,以致接近在.分类的图像将被定义为 在哪里定义为 我们记得变分方法包括定义一个代价函数来度量原始图像和分类图像之间的均方根差 的最小化很简单,因为每一分,我们只需要找到并添加对子集.这可以称为最近的类因为原始图像中的每个像素都被分配到分类图像中最接近的类中。受到参孙等人工作的启发[14],其中作者提出了一个与恢复过程相结合的分类模型,我们提出将拓扑梯度方法应用于图像恢复问题,同时用于监督和非监督分类问题[3.,4.].我们的想法仍然是考虑PDE问题(2.2)而不是考虑(或从数值的角度)对边集和在其他地方,我们考虑在图像的轮廓和其他地方。作为那么它应该是小的和几乎一样,否则,,这意味着在(2.2)几乎相当于Neumann边界条件(法向导数)等于零,这将提供一个真正平滑的图像。
监督分类算法
(一)初始化:.(2)计算和直接(3.1)及伴随(3.8分别)问题。(iii)计算的矩阵和它的最小特征值在定义域的每一点。(iv)设置
(五)计算问题的解决办法(3.1),.(六)k-均值分类算法在分类中的应用.
在恢复过程中,通过在RGB颜色空间中分解图像,将分类算法应用于彩色图像,然后我们分别处理三个分量的图像。总和的拓扑梯度可视为每个通道的三个拓扑梯度之和。图5.显示一个项目的分类彩色图像,使用30色阶(而原始图像有不同的颜色),在第一次没有正则化,然后有正则化。在这里我们应该提到,可以通过逐步考虑不同的值来控制正规化过程,,等等
(一)
(b)
另一方面,非监督分类对应的分类问题中没有给出类别。在这种情况下,可以用最优的方法来确定它们,仍然是使用拓扑梯度法。这个想法是为了研究改变一个班级的价值所产生的影响或在成本函数上,这意味着对于每个类别,我们向类别的值添加(或减去,取决于哪个变量提供了最负的变量)。该算法已在以前的数值测试中应用,以确定类别的最佳值:如图所示5.,值为32、用该算法确定了5个关于通道RGB的类。有人可能会注意到,这个算法至少需要知道类的数量。但在无监督分类中,情况并非如此。接下来的想法是在(4.3),计算班级的数量。这可以看作是一个正则化术语,因为我们通常不想得到太多的类。我们在这里建议重写(4.3)详情如下: 在哪里是一个正正则化系数。然后可以因为成本函数的两项是正的。无监督分类算法如下
非监督分类算法
(一)初始化与.(2)确定最优值。(iii)而小于其上界:(iv)设置并确定新的最优值类。(五)如果成本函数的值是最优的(相对于),停止)大于之前的最优值类。
图中应用了该算法5.以便找到类的最佳数量及其最佳值。
5.在层析成像问题中的应用
在本节中,我们将拓扑梯度作为一种工具来处理层析成像中的重建问题。我们记得,正则化层析成像不适定问题的标准方法包括以下优化问题: 在哪里表示定义离散Radon变换的系统矩阵,是测量的投影,正规化是功能性的吗表示一个参数,该参数控制对数据的良好拟合与解决方案的平滑度之间的折衷。受…的工作启发。Chan等人[15我们建议考虑以下最小化问题: 在哪里是一个正的常数吗在边缘上等于1,在其他2处,使用相同的拓扑梯度方法的思想,我们考虑,对于给定的正则函数。,直接存在以下问题: 在哪里表示垂直于的向外单位和和分别是离散Radon变换和对偶离散Radon变换。
让是伴随问题的解 考虑到同样的算法在图像恢复中的应用,我们通过求解以下问题来计算重构解: 与 在哪里是一个给定的常数。为了获得最佳的系数值,我们研究了重建图像的信噪比作为函数的行为.事实上,我们已经通过实验证实了重建图像的质量首先是随着然后略有下降,如图所示6..最佳值为我们在著名的Shepp-Logan头部模型上测试了我们的方法,使用离散Radon变换计算了该模型的投影数据。图7(一)显示原始图像。高斯噪声以信噪比添加到数据中,汉字图如图所示7(b).数字7(c)显示重建结果().本文还用几种方法进行了数值比较。表格1.给出了几种方法重建图像的PSNR(峰值信噪比,dB)、SNR(信噪比,dB)、SSIM(结构相似性)和MSE(均方误差):FBP(滤波后投影),FBP +汉明(在FBP图像上使用汉明滤波器),以及使用TV(总变异)范数或TV和的拓扑梯度方法规范。信噪比为24.5。我们可以在表格中看到1.所有指标的最佳结果都是通过混合拓扑梯度法中的范数。峰值信噪比高于3分贝,结构相似性指数大于94%,均方误差小于1%。请注意,两种拓扑梯度法都比过滤反投影法提供了更好的结果,这并不奇怪。
|
||||||||||||||||||||||||||||||||||||||||
(a) 原始图像
(b)噪声信号图()
(c)重建图像()
6.在图像分割中的应用
在这一部分中,我们提出了一种基于拓扑梯度法的分割算法。通过各种不同的应用,我们可以很容易地得出结论,拓扑梯度法是一种非常有趣的图像分析方法。首先,拓扑梯度法可以很容易地应用于图像分析中的许多问题。第二,我们应该提到,我们获得了很好的数值结果,计算时间非常有趣,并且证实了理论的复杂性我们的算法是图像的大小。然而,拓扑梯度方法存在一个主要缺点:识别出的边缘没有连接,因此分割问题的结果可能会降低,特别是对于复杂图像。因此,这一部分的主要思想是利用拓扑梯度效率,以有趣的计算成本检测主轮廓(拓扑梯度算法只需要三个系统分辨率),并为拓扑梯度方法检测到的不连续边找到替代解决方案。本文提出的方法是基于数学形态学的[16,17]更准确地说,是分水岭变换[18].该方法的一个主要优点是衰减了分水岭技术通常观察到的过分割。这种衰减是由于拓扑梯度提供了图像的全局分析,然后通过我们的方法有效地减少了由于噪声添加到给定图像中而几乎不需要的轮廓。使用这种耦合方法观察到的基本思想是使用拓扑梯度而不是传统的形态梯度用于分水岭。对于图像的噪声和小变化,拓扑梯度比形态梯度或经典梯度更不敏感,这一特性将极大地有助于对边缘进行最佳识别,然后减弱通常使用分水岭技术获得的过分割。在这项工作中,我们说明了提出的组合方法的分割问题的效率。其他数值测试和与其他方法的比较可在[19].在这一部分中,我们考虑了两幅具有不同难度的真实图像(曲线、圆、直线等)。第一个图像是果篮灰度图像,第二个是表示道路场景的灰度图像。数字8.根据基于分水岭算法的图像分割耦合方法,显示了前两幅图像的分割结果[18]和本文前面提出的拓扑梯度法。结果如图所示8(c)和8(d)得到了与,我们可以通过选择较大的系数值来改善分割后识别区域数量的衰减,但这将取决于我们想要分割什么,以及在分割过程结束时我们想要获得什么:如果一个人能够获得最多的细节,那么它就足够了否则,我们应该考虑更大的价值。这给了分段区域相当大的衰减8(e)和8 (f)给出分割过程的数值结果。我们可以清楚地观察到所获得区域的衰减,从而使两幅图像的主要边缘保持不变。应该注意的是,我们可以定义函数的分水岭或其梯度:两种定义之间的区别在于,在第一种情况下,我们获得了处理图像的影响区域,而第二种情况给出了图像边缘。众所周知,在这两种情况下,分水岭都给出了过度分段,为了避免这一缺点,可以将其与拓扑梯度相结合如图所示,ient方法似乎是克服这一不便的好选择8..
(一)
(b)
(c)
(d)
(e)
(f)
最后,由于分割问题使用了大量的方法,显然将我们的实验结果与文献中已经提出的方法进行比较是很重要的。特别是,我们建议将我们的方法与基于水平集方法的活动轮廓模型进行比较,这是一种众所周知的有效方法ent方法,在过去十年中被广泛应用于许多应用中。活动轮廓模型的基本思想是根据给定图像的约束演化出一条曲线,以检测该图像中的不同对象。为了实现这一目标,我们从待检测对象周围的一条曲线开始,曲线向其内部法线移动并且必须停在物体的边界上。这是由[20.].我们的数值测试基于[21,由以下演化方程给出: 的边界条件和初始条件在和在,是一个正的给定系数,在我们的数值测试中,边缘检测函数的定义是,表示初始级别集函数。请读者参阅[8.]有关测地线活动轮廓和水平集方法的更多详细信息。图9给出了得到的数值结果。为了得到如图所示的最终轮廓,我们应该提到这一点9 (e),该算法需要500次迭代,计算时间为78秒。我们在图中显示9一些解决方案随着时间的发展而发展:在发展过程中,初始曲线收缩并在接近物体边界时停止,为了检测其他物体而溢出。
(一)
(b)
(c)
(d)
(e)
(f)
7.结论
本文介绍了拓扑梯度法在图像处理中的许多应用,并举例说明了这种技术的优点和缺点。我们证明了拓扑梯度方法为解决不同的图像处理问题提供了一个很好的框架,同样,如果克服其给出不连通轮廓的主要缺点的另一种方法是将其与其他方法相结合。它已被应用于图像恢复、边缘检测、图像分类和图像分割,无论是灰度图像还是彩色图像。我们的主要目标是将其应用到其他实际问题中,在所有提出的应用中,我们都取得了良好的效果,并且计算时间非常短。在一篇即将发表的论文中,我们提出将拓扑梯度方法应用于图像分割,最终将其与其他方法结合起来,特别是使用标记标准。实际上,由于边缘是在拓扑梯度最负的区域检测出来的,那么提取一些属于边缘集的点,然后将这些点作为选择的标记集就足够了。我们还打算将这项工作扩展到彩色图像分割和三维图像分割。
参考文献
- S. Amstutz, I. Horchani, M. Masmoudi,“基于拓扑梯度法的裂纹检测”,控制和控制论第34卷第3期1,页81-101,2005。视图:谷歌学者|Zentralblatt数学
- D.Auroux和M.Masmoudi,“基于拓扑渐近分析的一次性修复算法,”计算与应用数学,第25卷,第2-3号,第251-267页,2006年。视图:出版商网站|谷歌学者|Zentralblatt数学
- D. Auroux, L. Jaafar Belaid, M. Masmoudi,“基于拓扑渐近展开的图像恢复和分类”,刊于力学中的变分公式:理论与应用E. Taroco, E. A. de Souza Neto和A. A. Novotny, Eds。,第23-42页,西班牙加泰罗尼亚,CIMNE, 2006。视图:谷歌学者
- D. Auroux, L. Jaafar Belaid, M. Masmoudi,“正则化灰度图像分类问题的拓扑渐近分析”,数学模型和数值分析,第41卷,第3期,第607-625页,2007年。视图:出版商网站|谷歌学者|Zentralblatt数学
- L.Jaafar Belaid,M.Jaoua,M.Masmoudi和L.Siala,“通过拓扑渐近展开进行图像恢复和边缘检测,”政府建筑渲染的数学,第342卷,第5期,第313-318页,2006年。视图:出版商网站|谷歌学者|Zentralblatt数学
- L.Jaafar Belaid、M.Jaoua、M.Masmoudi和L.Siala,“拓扑梯度在图像恢复和边缘检测中的应用,”边界元工程分析,第32卷,第2期11,第891-899页,2008。视图:出版商网站|谷歌学者
- M. Masmoudi,“拓扑渐近”,刊于控制应用的计算方法R. Glowinski, H. Karawada, J. peraux, Eds。,第16卷GAKUTO国际系列。数学科学与应用,第53-72页,加库托,日本东京,2001年。视图:谷歌学者
- G. Aubert和P. Kornprobst,图像处理中的数学问题,第147卷应用数学科学,施普林格,纽约,纽约,美国,第二版,2001。
- S. Di Zenzo,《关于多图像梯度的注意》计算机视觉,图形和图像处理第33卷第3期1,第116-125页,1986。视图:谷歌学者
- A.Brook,R.Kimmel和N.A.Sochen,“彩色图像的变分恢复和边缘检测,”数学成像与视觉杂志,第18卷,第3期,第247-268页,2003年。视图:出版商网站|谷歌学者|Zentralblatt数学
- R. Kimmel, R. Malladi,和N. Sochen,《通过贝尔特拉米运算符进行图像处理》第三届亚洲计算机视觉会议记录,页574-581,香港,1998。视图:谷歌学者
- N. a . Sochen, G. Gilboa,和Y. Y. Zeevi,《通过前后自适应Beltrami°ow增强彩色图像》,收录知觉-行动周期代数框架国际研讨会论文集(AFPAC’00)G. Sommer和Y. Y. Zeevi, Eds。,卷1888年计算机科学课堂讲稿,页319-328,施普林格,2000。视图:谷歌学者
- D. Auroux, L. Jaafar Belaid, B. Rjaibi,“拓扑梯度法在彩色图像恢复中的应用”,SIAM影像科学杂志,第3卷,第2期,第153-175页,2010年。视图:出版商网站|谷歌学者|Zentralblatt数学
- C. Samson, L. Blanc-Féraud, G. Aubert和J. Zerubia,“图像分类和恢复的变分模型”,模式分析与机器智能学报,第22卷,第5期,第460-4722000页。视图:谷歌学者
- T. Chan, A. Marquina,和P. Mulet,“基于高阶总变异的图像恢复”,暹罗科学计算杂志第22卷第2期2,页503-516,2000。视图:出版商网站|谷歌学者|Zentralblatt数学
- J.塞拉,图像分析与数学形态学I,学术出版社,伦敦,英国,1984年。
- J.塞拉,图像分析与数学形态学II:理论进展,学术出版社,伦敦,英国,1984年。
- L.Vincent和P.Soille,“数字空间中的分水岭:基于浸入模拟的有效算法,”模式分析与机器智能学报,第13卷,第6期,第583-5981991页。视图:出版商网站|谷歌学者
- L. Jaafar Belaid和W. Mourou,《图像分割:分水岭变换算法》,图像分析与体视学,第28卷,第2期,第93-102页,2009年。视图:谷歌学者|Zentralblatt数学
- M.Kass、A.Witkin和D.Terzopoulos,“蛇:活动轮廓模型,”国际计算机视觉杂志,第1卷,133-144页,1987年。视图:谷歌学者
- V.Caselles、R.Kimmel和G.Sapiro,“测地活动等高线,”国际计算机视觉杂志,第22卷,第1期,第61-79页,1997年。视图:谷歌学者
版权
版权所有©2010 Lamia Jaafar Belaid。这是根据知识共享署名许可协议,允许在任何媒介上不受限制地使用、传播和复制,但必须正确引用原作。