研究文章|开放获取
Kittiya Khongkraphan Aniruth声子,Sainuddeen Nuiphom, ”一种有效的盲图像去模糊使用一个平滑函数”,应用计算智能和软计算, 卷。2021年, 文章的ID6684345, 10 页面, 2021年。 https://doi.org/10.1155/2021/6684345
一种有效的盲图像去模糊使用一个平滑函数
文摘
本文介绍了一种有效的图像去模糊方法基于途径和迭代的概念。我们的方法不需要特定的环境图像,因此可以广泛应用于非特定的通用图像。内核评估首先执行,然后将用于在每个迭代估计潜在的形象。得到最终的解模糊图像的模糊图像卷积的最终估计的内核。然而,图像去模糊是由于一个不适定问题解的非唯一性。因此,我们提出一个平滑函数,不同于以往的方法,应用分段函数估计潜在的形象。在我们的方法中,我们使用l2正则化在强度和梯度收敛于一个解决方案之前去模糊问题。此外,我们的工作是基于二次分割方法。它保证每个子问题都有封闭解。各种合成和真实图像实验证实,我们的方法优于现有的几个方法,特别是在图像被噪声。此外,我们的方法给更合理和更自然的解模糊图像比其他方法。
1。介绍
一个图像去模糊是一个恢复的过程,恢复一把锋利的潜像从一个模糊的形象,这是由相机抖动或物体运动引起的。它在图像处理和计算机视觉领域广泛关注。提出了许多算法处理图像去模糊问题。最常见的模糊方法切除是治疗模糊和嘈杂的卷积操作模糊的内核。模糊图像的数学形式通常模仿 在哪里是一个模糊的形象,是一种相应的潜像,和分别表示模糊内核和白噪声代表卷积算子。
提出了许多方法来解决图像去模糊问题,和一个流行的方法是基于deconvolution-based概念。有两种方法:nonblind和盲反褶积。这两种类型之间的主要区别是,之前模糊内核必须被称为nonblind反褶积的情况。模糊核估计本质上是一个重要的步骤在获得高质量的清晰图象。大多数方法使用统计先验的自然图像和选择突出边缘的模糊核估计(1- - - - - -6]。此外,一些研究人员估计一个高质量的模糊内核直接从输入图像运动模糊在频域通过研究问题(7- - - - - -9]。
盲反褶积的目的是估计相应的潜像和模糊的内核。盲反褶积是一个不适定问题,因为它有许多成对的解决方案。处理盲人适定的去模糊问题,大多数盲图像去模糊方法倾向于制定一个最小化问题的问题。模糊的内核和潜在的形象通常是交替的方式解决。算法收敛迅速,如果适当的有用的初始化是好选择。然而,不同的假设或要求合法化。锅等。10]介绍了l0正规化强度和梯度之前由模糊变清晰的文本图像。此法适用于文本图像用干净的背景,但它是一个杂乱的背景那么有用。刘等人。11)结合l0正规化的一线和二阶梯度图像为了规范最终的评估结果。曹et al。12)开发了一种方法将text-specific属性由模糊变清晰。这比之前在深浅不一的图像;然而,它仍然不是很有效通用的图像。
许多研究人员提出了许多image-priors强调优化技术解决不适定问题通用的图像。锅等。13)继续提出自己的工作通过修改一个黑暗的通道与通用图像首先引入了他et al。14]。它是基于观察,在大多数自然场景的补丁,至少一个颜色通道具有一些像素强度非常接近零。该算法执行潜伏的黑暗通道图像的稀疏内核估计并生成比其他方法更好的结果。然而,黑暗的通道可能不会帮助中间潜像估计如果没有黑像素的图像,但相反,很大程度上明亮的像素。
燕et al。15)提出了一个新颖的自然图像之前叫极端频道之前(ECP)通过两者优点的黑暗通道之前(DCP)和明亮的通道之前(BCP)提炼自然图像。这种方法更健壮和执行积极先进的图像去模糊方法在合成和自然图像。然而,它有一定的局限性和不太可能支持内核估计。内核评估过程复杂,性能主要取决于图像的强度值。一些研究人员转向采用梯度之前提高核估计的准确性。山等。16)采用稀疏图像之前,引入一个统一的概率模型来适应自然图像的梯度分布来解决内核估计问题。作者在17,18)提出了一个之前hyper-Laplacian适合自然图像梯度的分布,以避免当地的解决方案。费格斯et al。1)提出了一个算法使用一个零均值混合高斯模型的拟合之前学习图像梯度分布的自然图像梯度。钟等。19]提出了一种自适应广义变异(TGV)正则化模型来消除由模糊变清晰,维护良好的企业形象的细节。
所有提出的算法(3- - - - - -15在目标函数)添加辅助术语。根据观察,我们发现封闭形式的辅助条款包含参数的分段函数。这些参数值被扩展不断更新,导致图像细节的损失。此外,大多数算法需要特定条件对通用的图像,所以他们不能被广泛应用于非特异性通用的图像。
在本文中,我们提出一个有效的优化算法基于二次分割方法。分裂的方法保证每个子问题都有一个封闭的解并确保快速收敛。另外,我们介绍一种新的平滑函数更新像素值和乙状结肠函数缩放参数。我们基于平滑函数l2正规化强度和梯度之前给一个显著优势的结果,可以减少损失图像的细节。此外,我们的方法也适用于彩色图像,而不需要任何特定的环境形象。
本文组织如下。我们的信用证2正则化方法中描述的部分2。部分3描述我们的盲图像去模糊方法。节4,我们给出一些实验结果。最后,结论部分5。
2。我们的信用证2正则化方法
我们首先制定盲图像去模糊一个最小化问题和引进一个新的高效的正则化项由模糊变清晰的收敛到一个解决方案。正如我们提到的,方程(1)是可以解决的。也就是说, 不是空的。我们寻求一个相应的内核的标准是最低的。然而,我们首先需要确认此类解决方案总是存在于集 。给定一个潜在的形象和一个模糊的内核 ,一个模糊的图像可以写成 ,在哪里托普利兹矩阵和吗是列潜在的形象吗 。所以,我们有 。表明 与最低标准的解决方案,我们需要以下命题。
命题1。让和希尔伯特空间,
和
伴随算子;然后以下观点:
当且仅当存在
这样
当且仅当是一比一现在,这个矩阵可以被视为一个线性算子吗
;因此,
。自
解决所有
,
是满射。因此,通过命题1,存在
这样
。
因此,
。这意味着是一比一。因此,
。我们可以看到,
是一个解决方案
。现在,我们将看到,这个解决方案有一个最低标准。事实上,考虑
这样
和
请注意,
因此,
。因此,
。这意味着的最低标准。因此,我们可以得出结论,对于每一个模糊的形象,总是存在一个相应的潜像与一个内核的规范是最低的。基于这一事实,我们自信地认为,寻找这样一个潜在的图像的最低标准是一个替代的方法来解决这个问题。因此,我们定义
正则化项的方法。
3所示。我们的图像去模糊方法
我们的图像去模糊方法是一个迭代的方法基于一个途径的概念。在每个迭代中,内核执行评估,然后它被用来估计潜在的形象。然后估计潜在的图像作为输入的下一个内核估计。从卷积获得最后的解模糊图像是模糊图像的最终估计的内核。一个系统的概述我们的方法是显示在图1。
估计内核和潜在的形象,方程(1)形成为一个优化问题正则化项图像去模糊表达如下:
解决方案直接从强度值通常是不准确的(2,4,10),所以我们将正则化项在一个空间和一个梯度空间与强度
我们使用一个有效的交替最小化方法2,5,10,13)来解决方程(4)。这两个子问题解决如下:
的细节在以下部分中描述的两个子问题。
3.1。评估潜在的形象模糊的内核
我们引入一个有效的交替最小化方法解决方程(5)。像(10,13,20.),我们提出了辅助变量 对应于和 ,分别。目标函数可以写成 的常量和重量是基于潜在的形象价值和常量和是重量值。
求解方程(7)的值和在第一次迭代初始化是零。然后,解决在每个迭代中获得解决
基于最小二乘法最小化问题,我们执行是由封闭解 在哪里和表示快速傅里叶变换(FFT)和逆FFT,分别。复共轭算子。 ,在哪里和分别是水平和垂直微分算子。
更新的变量 ,我们首先需要计算和 ,可以单独做的吗
注意,方程(10)和(11)pixel-wise最小化问题,最重要的是,他们是光滑的。因此,解决方案的和由简单的方法获得的区别:
值得注意的是,在每个迭代中,加权值和总是更新。在大多数算法(3- - - - - -15),的加权值和粘在和 ,但在分段函数的形式,他们总是更新扩展。这可能会迫使一些像素的值为零,导致潜在损失的细节图像。事实上,我们自信地认为,每个像素由相同的值,但不应按比例缩小的应该是依靠自己。所以,在我们的方法中,我们采用乙状结肠功能和更新的值和 ,分别在哪里 和 ,在哪里和被定义为过渡区域的中心。由于平滑方程(12)和(13),它不仅减少工件的效果,但也保证不丢失细节中间潜在的图像。
3.2。估计模糊内核与潜在的形象
估计 ,我们雇佣的形象和模糊图像在梯度空间见方程(14),然后应用fft算法解决最小二乘法最小化问题
的封闭形式内核评估与潜在的形象和模糊图像是
该方法,类似于最先进的方法,而且处理策略用于处理模糊核估计。算法通常是有效地使用一个图像金字塔实现(2,10]。潜在的主要步骤的总结图像和模糊核估计在一个金字塔水平提出了算法1。
|
||||||||||||||||||||||||||||||||||||||
3.3。最终的图像修复
在最后一步,我们恢复最后的解模糊图像使用nonblind反褶积,给出最终的内核从方程(15)。最后的潜像可以恢复
然后我们计算一个区别这两种估计图像之间的映射不同的s形的参数。最后,我们减去的恢复图像映射到不同抑制振铃构件。
4所示。实验结果
评估我们的方法的性能,我们测试了我们的方法在实际图像数据集(21),合成图像,和特定的域图像(14]。此外,我们也评估我们的方法对高斯噪声的鲁棒性。在所有的实验中,我们设置 和
4.1。评估在实际图像数据集
首先,我们测试了我们的方法在图像去模糊数据集(21(4),包含48图像图像12模糊内核)。这个数据集作为基准图像去模糊方法的性能测量。该方法较先进的方法:赵和李2),费格斯et al。1),赫希et al。22),克里希南et al。23),Whyte et al。24),徐和贾3),锅等。13]。比较性能,我们使用峰值信噪比(PSNR)值计算,通过比较每个恢复映像与199年地面实况图像。PSNR值= 100,对应于一个完美的去模糊。PSNR值的方法和比较的方法对数据集(21见图2。我们发现的PSNR值的方法,徐和贾3),锅等。13在图2)没有多少不同。在图2的平衡可能是黑暗和明亮的像素适度是一样的。然而,我们的方法比其他方法给出了一个更高的平均PSNR。图3显示了示例图像由最好的解模糊三个算法。然而,我们的方法给出了清晰的细节,比其他方法更自然。
(一)
(b)
(c)
(d)
4.2。评价合成图像
然后我们评估我们的方法在合成图像模糊的内核。第一个合成模糊图像的比较结果如图4。可以看出,我们的方法的恢复形象提供了一个更好的结果,是比其他方法更为合理。的结果(3,13赎回)方法比原始图像更模糊。这可能是原始图像包含大量明亮的像素。所以这两种方法不能控制正则化项,导致不合理的解决方案。
(一)
(b)
(c)
(d)
此外,我们证明了该方法的性能在合成模糊图像被高斯白噪声的不同实现,5 - 30dB。的样本噪声的模糊图像和合成解模糊图像如图5。
(一)
(b)
(c)
(d)
合成图像的PSNR值被各种高斯白噪声级别图所示6。我们的方法实现最高的PSNR值。很明显,我们的方法显示了表现。我们的方法显然表现优于其他两种方法测试图像包含大量的噪音。
4.3。评估特定领域的图像
下一步,我们评估该方法在特定领域的图像如的脸和文本图像。我们在每个领域较先进的去模糊方法。然后,我们评估我们的方法在面部图像的方法锅等。13),一个黑暗的通道用于图像去模糊。此外,我们相比该方法徐和贾3]。如数据所示7和8,我们的方法给出更多细节,比其他方法更自然。
(一)
(b)
(c)
(d)
(一)
(b)
(c)
(d)
接下来,我们评估该方法选择真正的和具有挑战性的文本图像定性评价如图9和10。我们将我们的方法与锅的方法等。10和燕等。25]目前特定的方法去模糊图像的文本。如数据所示9和10,我们的方法更合理、更清晰和更少的失去比这两种方法的细节。
(一)
(b)
(c)
(d)
(一)
(b)
(c)
(d)
我们评估我们的方法的鲁棒性与高斯噪声的模糊图像。的比较结果与高斯噪声模糊图像如图11。还含有模糊的其他方法去模糊结果,而我们更合理和更自然。的方法(3给出了工件比其他方法。在[13]给出了一个不合理的结果自噪声改变了一个图像块的最小强度值。
(一)
(b)
(c)
(d)
5。结论
我们提出一个新的方法去模糊图像,尤其是对盲反褶积。我们提出l2正则化的图像去模糊形成作为一个优化问题。这种方法不需要特定条件的图像,因此可以广泛应用于非特定的通用图像。它适用于光滑函数在每个迭代估计潜在的形象。它使更多的细节比现有方法恢复图像。评估我们的方法的性能,我们进行实验合成和真实世界的图像。我们发现,我们的方法优于之前的方法,特别是在图像,其中包含高斯噪声。此外,我们的恢复图像给更多的细节和更自然比其他方法产生的恢复图像。
数据可用性
数据是可用的https://sites.google.com/site/jspanhomepage/。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作得到了信校园Songkla王子大学研究基金会(SAT63030065)在泰国。
引用
- r·费格斯b .辛格,a . Hertzmann s . t . Roweis和w·t·弗里曼,“从单个照片,删除相机抖动”ACM交易图片,25卷,不。3、787 - 794年,2006页。视图:出版商的网站|谷歌学术搜索
- 赵和李,“快速运动由模糊变清晰,“ACM交易图片,28卷,不。5,145 - 152年,2009页。视图:出版商的网站|谷歌学术搜索
- 徐l . j .贾,“健壮的运动由模糊变清晰,内核两阶段估计”欧洲计算机视觉的诉讼伊拉克里翁,页157 - 170年,克里特岛,希腊,2010年9月。视图:谷歌学术搜索
- a·莱文y . Weiss, f·w·t·弗里曼,勾勒出“高效的边际似然优化盲反褶积,”IEEE会议进行计算机视觉和模式识别科罗拉多,页2657 - 2664,有限公司,2011年6月美国。视图:谷歌学术搜索
- l .徐、郑s和j·贾,“自然L0稀疏表示对自然图像去模糊”《IEEE计算机视觉与模式识别会议波特兰,页1107 - 1114,或者美国,2013年6月。视图:谷歌学术搜索
- j .锅和z苏,“快速L0-regularized内核估计健壮的运动由模糊变清晰,“IEEE信号处理信件,20卷,不。9日,第844 - 841页,2013年。视图:谷歌学术搜索
- r .破折号和b Majhi”,对图像恢复运动模糊参数估计,”Optik,卷125,不。5,1634 - 1640年,204页。视图:谷歌学术搜索
- z z . Wang么,问:王,“估计图像恢复运动模糊参数的改进方案,“数字信号处理,卷65,不。1,11到18门,2017页。视图:出版商的网站|谷歌学术搜索
- l .锅r·哈特利戴y、m . Liu”Phase-only内核估计幅图片盲目的去模糊的影像,”《IEEE计算机视觉与模式识别会议长滩,页6027 - 6036年,CA,美国,2019年6月。视图:谷歌学术搜索
- j .锅z胡、z . Su和m .杨”由模糊变清晰的文本图像通过L0-regularized强度和梯度,”前,“在《IEEE计算机视觉与模式识别会议哥伦布,页2901 - 2908年,哦,美国,2014年9月。视图:谷歌学术搜索
- r·w·刘,w .阴,s, s .彭,“L0-regularized混合梯度稀疏先验的健壮的幅图片盲目的去模糊,”《IEEE Int。会议音响、语音信号的过程。(ICASSP),页1348 - 1352,首尔,韩国,2018年4月。视图:谷歌学术搜索
- h·曹,j . Wang和李,“文本使用text-specific属性图像去模糊”欧洲计算机视觉的诉讼537年,页524 -佛罗伦萨,意大利,2012年10月。视图:谷歌学术搜索
- j·潘,d .太阳,h·费斯,M.-H。杨”,通过去模糊图像暗通道之前,”IEEE模式分析与机器智能,40卷,不。10日,2315 - 2328年,2018页。视图:出版商的网站|谷歌学术搜索
- k他、j .太阳和x,“单一图像烟雾去除之前使用黑暗通道,”IEEE模式分析与机器智能,33卷,不。12日,第2353 - 2341页,2011年。视图:出版商的网站|谷歌学术搜索
- 郭y, w . Ren, y, r . Wang和曹x,“通过极端的通道前,图像去模糊”《IEEE计算机视觉与模式识别会议火奴鲁鲁,页6978 - 6986年,美国,2017年7月,你好。视图:谷歌学术搜索
- 问:山、j·贾和a .《“高质量的运动从单个图像去模糊,”ACM交易图片,27卷,不。3、1 - 10,2008页。视图:出版商的网站|谷歌学术搜索
- a·莱文y . Weiss, f·w·t·弗里曼,勾勒出“理解和评价盲反褶积算法”诉讼IEEE计算机视觉与模式识别会议1971年,页1964 -迈阿密,佛罗里达,2009年3月。视图:谷歌学术搜索
- y卢,a . l .贝尔托齐,s . Soatto“直接稀疏由模糊变清晰,”《数学成像和愿景,39卷,不。1、1 - 12,2011页。视图:出版商的网站|谷歌学术搜索
- 问:问:钟,c . Wu蜀,r·w·刘”空间自适应广义variation-regularized总与脉冲噪声图像去模糊,“电子杂志的成像,27卷,不。05,p . 2018。视图:出版商的网站|谷歌学术搜索
- j . Tang x蜀,G.-J。Qi et al .,“Tri-clustered张量完成social-aware图像标记细化。”IEEE模式分析与机器智能,39卷,不。8,1662 - 1674年,2017页。视图:出版商的网站|谷歌学术搜索
- r·K¨奥·m·赫希b·莫赫勒b .原理图¨olkopf,和s .马克的“相机抖动的录音和回放:基准测试盲反褶积与一个真实的数据库,”欧洲计算机视觉的诉讼,页27-40,佛罗伦萨,意大利,2012年10月。视图:谷歌学术搜索
- m·赫希c·j·舒勒马克的,和b .原理图¨olkopf,“快速消除非均匀相机抖动,”在计算机视觉研究进展国际会议西班牙巴塞罗那,页463 - 470,,2011年11月。视图:谷歌学术搜索
- d . Krishnan, t·泰,r·费格斯”使用规范化稀疏盲反褶积的人制定出的措施”,《IEEE计算机视觉与模式识别会议科罗拉多,页233 - 240,有限公司,2011年7月美国。视图:谷歌学术搜索
- o·怀特,j . Sivic和a . Zisserman“去模糊动摇和部分饱和图像,”《IEEE计算机视觉国际会议研讨会(ICCV研讨会),页745 - 752,海得拉巴,印度,1992年3月。视图:谷歌学术搜索
- 郭y, w . Ren, y, r . Wang和曹x,“通过极端的通道前,图像去模糊”《IEEE国际会议在计算机视觉和模式识别火奴鲁鲁,页4003 - 4011年,美国,2017年7月,你好。视图:谷歌学术搜索
版权
版权©2021 Kittiya Khongkraphan等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。