基于稀疏编码的方法已成功地用于单图像超级化(SR)重建。然而,用于红外线(IR)图像的传统稀疏表示的SR图像重建通常存在三个问题。首先,IR图像始终缺乏详细信息。其次,传统的稀疏词典是从具有固定大小的修补程序中学到的,这可能无法捕获图像的确切信息,并且可以忽略图像在许多情况下自然地在不同尺度上的事实。最后,传统的稀疏字典学习方法旨在学习普遍和过度普遍的词典。然而,存在许多不同的局部结构模式。一部词典不足以囊括所有不同的结构。我们提出了一种新的IR图像SR方法来克服这些问题。首先,我们将来自多传感器的信息组合以提高IR图像的分辨率。然后,我们使用多尺度修补程序以更有效的方式表示图像。 Finally, we partition the natural images into documents and group such documents to determine the inherent topics and to learn the sparse dictionary of each topic. Extensive experiments validate that using the proposed method yields better results in terms of quantitation and visual perception than many state-of-the-art algorithms.
高分辨率(HR)红外(IR)图像所需的各种电子成像应用,例如医疗诊断,刑侦,监控,远程感测,和航空。然而,考虑到相关的成像装置或其他因素的影响,在所希望的分辨率获得的图像的固有的限制是困难的。因此,许多努力一直致力于改善红外图像的空间分辨率。超分辨率(SR)是在研究界最有前途的方法之一。
目前,大量的SR方法已经研制成功。用于图像SR现有方法可分为三大类:基于内插的方法[
基于插值的[
基于重建的方法利用低分辨率(LR)图像的附加信息来合成HR图像。这些方法是病态估计问题,需要图像的先验信息来正则化求解。因此,人们提出了各种正则化方法来提高SR重构的性能,如凸集投影[
基于学习的方法认为,通过学习LR训练补丁和相应的HR补丁之间的Cooccurrence关系,可以预测LR图像中丢失的高频细节。Freeman等人。[
上述基于sc的SR方法总是存在三个问题。首先,由于相关成像设备的固有限制或其他因素,红外图像往往缺乏详细信息,导致红外图像重建结果不尽如人意。不同传感器获取的多幅图像提供了对同一场景的互补信息。因此,提高红外图像分辨率的合理方法是将不同多传感器获取的图像固有互补信息进行组合。其次,传统的稀疏字典是从固定大小的小块中学习,不能准确地捕捉图像的信息。然而,图像的局部结构往往在自然图像中与一些相似的邻居重复多次,不仅在相同的尺度内,也在不同的尺度内。局部结构在小尺度上缺失的细节可以在大尺度上从相似的斑块中估计出来。不同的图像选择不同的patch大小以获得最佳的表示。因此,在不同尺度下联合表示图像是很重要的。考虑到上述线索,我们提出了一种多尺度patch学习字典的模型。 We use a simple model that generates pyramid images and divides such images into multiscale patches. Finally, given that dictionary learning is a key issue of the sparse representation model, considerable effort in learning dictionaries from example image patches has been exerted, leading to state-of-the-art results in image reconstruction. Many dictionary learning methods aim at learning a universal and overcomplete dictionary that represents various image structures. However, for natural images, a large number of different local structural patterns exist. The contents can vary significantly across different images or different patches in a single image. One dictionary is inadequate in capturing all of the different structures. Multiple dictionaries [
总之,本研究提出了以下三个主要贡献:
本文的其余部分安排如下:第二部分
本文提出了一种新的稀疏表示算法,旨在结合可见光图像的信息,提供更全面的红外图像,同时在统一的框架内利用红外图像的固有主题。该方法可分为3个步骤:(a)融合多传感器图像信息;(b)获取多尺度小块;(c)学习多主题稀疏字典。在结合可见光图像信息的情况下,该框架在学习LR稀疏字典时提高了红外图像的分辨率。在获取多尺度小块时,我们构建金字塔图像,并从中提取多尺度小块,可以提供更全局的图像。为了更准确地呈现不同的结构模式,我们将自然图像划分为文档,并使用pLSA对其进行分组,确定其内在主题。然后可以学习每个主题的紧凑子字典。
鉴于观察到的LR IR图像
随着LR图像
最近的作品[
通过多传感器采集的图像提供相同场景的补充信息。红外图像始终缺乏详细信息。同时,VI图像包含丰富对象的边缘和细节,对于人眼提供场景的更感知描述[
应用这四个滤波器,我们获得了用于LR IR图像的每种补丁的四个描述特征向量及其对应的HR可见图像,其在LR贴片的最终梯度表示中被连接为一个向量。LR IR图像的信息和其相应的HR可见图像的信息组合在一起以学习LR稀疏字典。
使用稀疏的生成模型,每个补丁功能
重新涂上稀疏的生成模型,我们有
结合可见光图像的信息基于稀疏表示-SR。
因此,重建的HR图像
该SC显然是LR和HR补丁之间的桥梁。字典
观察到,不同的图像更喜欢最佳性能的不同补丁尺寸[
金字塔变换是一种有效的多分辨率分析方法。在金字塔变换期间,通过从其相邻的低通滤波的HR图像下采样来获得低空间金字塔中的每个像素。序列金字塔图像构造,如图所示
一个三层空间金字塔。
高斯金字塔的图像。原始图像(第一级)和它的高斯金字塔从左到右显示。
让
在生成金字塔图像后,我们使用quadtree模型[
基于四叉树模型的多尺度斑块。
提取多尺度补丁。
我们将自然图像分组到文档中,并将其分组,以确定使用PLSA的固有主题,并更准确地呈现不同的结构模式。每个字典都是从具有相同主题的某些类型的示例补丁中学习的,并且同时学习多个字典。示例图像修补程序由PLSA模型分为许多主题。鉴于每个主题由具有类似模式的许多修补程序组成,可以为每个主题学习一个紧凑的子学习。对于要编码的图像修补程序,选择了与给定修补程序的最相关的最佳子分象。考虑到给定的贴片可以通过所选择的子暗学可以更好地表示,而不是我们的实验验证的当使用通用字典时更准确地重建整个图像。多级文字典学习的使用有两个主要优点:
该PLSA [
包含的语料库
(a)中的PLSA图形模型表示;(二)条件分布的矩阵分解。
等式(
PLSA的模型参数是两个条件分布
EM算法用于计算参数
EM算法的步骤描述如下:
鉴于IR图像的集合,我们打算确定图像的固有主题。我们使用一般条款[
滑动窗口和补丁。
我们的方法的插图。
在我们的实验中,IR图像和相应的可见图像是从[
我们实验中使用的红外图像和可见图像的一些示例。
我们采用峰值信噪比(PSNR)和结构相似度测量(SSIM)来评估超溶剂图像并评估所提出的方法的性能。所有测试图像的PSNR和SSIM的平均值用作质量指标。PSNR基于像素强度评估重建质量。SSIM基于其结构信息测量两个图像之间的相似性。SSIM度量需要一个“完美”参考图像以进行比较,并提供归一化值
在本节中,我们进行了几个实验来评估所提方法的有效性。
使用一些红外图像测试所提出的方法,以验证所提出的分辨率增强方法的有效性,而是在视觉保真和客观标准方面。我们将算法与一些众所周知的图像SR算法进行比较,例如最近的邻居,立方B样条插值方法和阳的方法[
此外,SR的PSNR和SSIM值在表中列出了使用各种算法的LR图像
数字的数值结果
| 方法 | 最近的邻居 | 立方B样条曲线 | 杨的方法 | 我们的方法 | ||||
|---|---|---|---|---|---|---|---|---|
| PSNR. | SSIM | PSNR. | SSIM | PSNR. | SSIM | PSNR. | SSIM | |
|
|
36.77 | 0.4440. | 36.80. | 0.4458 | 36.98 | 0.5394 | 37.32 | 0.5857 |
|
|
||||||||
|
|
38.06 | 0.7210. | 38.07 | 0.7279 | 38.17 | 0.7691 | 38.20. | 0.8107 |
|
|
||||||||
|
|
36.19 | 0.4652 | 36.19 | 0.4713 | 36.63 | 0.6005 | 36.68 | 0.6405. |
|
|
||||||||
|
|
36.49 | 0.4933 | 36.48 | 0.5007 | 36.73 | 0.5477 | 36.93 | 0.5964 |
|
|
||||||||
|
|
32.91 | 0.3621 | 32.93 | 0.3646 | 34.02 | 0.3702 | 34.10 | 0.3741 |
四个测试图像的视觉比较:(a)LR图像,(b)使用最接近的邻插插获得的原始HR图像,(C)获得的结果,使用立方B样条插值获得(E)获得的结果基于稀疏表示的方法和(f)使用所提出的方法获得的结果。
为了通过组合可见图像的信息来验证多传感器的有效性,我们将多传感器SRIR与传统的SRIR算法相比,作为阳的方法[
数字的数值结果
| 方法 | 杨的方法 | 多传感器 | ||
|---|---|---|---|---|
| PSNR. | SSIM | PSNR. | SSIM | |
|
|
34.28 | 0.4123 | 35.53 | 0.4237 |
|
|
||||
|
|
36.63 | 0.6005 | 36.65 | 0.6247 |
|
|
||||
|
|
36.73 | 0.5477 | 36.87 | 0.5751 |
|
|
||||
|
|
33.07 | 0.3731 | 34.57 | 0.3769 |
四个测试图像的视觉比较:(a)LR图像,(b)原始的HR图像,(c)使用基于稀疏表示的方法获得的结果,以及使用基于多传感器的方法获得的结果。
我们将从使用MultiScale修补程序和一个固定级别修补程序的字典中获得的SR结果进行比较。在基于MultiScale补丁的方法中,根贴片尺寸为16×16.在固定刻度贴片中,分析了具有三种不同贴片尺寸的固定贴片4×4,8×8和16×16。培训过程中的培训补丁数量为100,000。对于字典学习步骤,字典中的原子数为1,000。重建结果如图所示
数字的数值结果
| 方法 | 补丁大小4×4 | 贴片尺寸8 × 8 | 贴片尺寸16 × 16 | 多尺度补丁 | ||||
|---|---|---|---|---|---|---|---|---|
| PSNR. | SSIM | PSNR. | SSIM | PSNR. | SSIM | PSNR. | SSIM | |
|
|
36.96. | 0.5378 | 36.93 | 0.5327 | 36.92 | 0.5298 | 37.27 | 0.5679 |
|
|
||||||||
|
|
38.07 | 0.6247 | 38.15 | 0.6538 | 38.18 | 0.7721 | 38.19 | 0.7894 |
|
|
||||||||
|
|
36.64 | 0.6109 | 36.24 | 0.5371 | 36.17 | 0.4928 | 36.65 | 0.6362 |
|
|
||||||||
|
|
36.51 | 0.4959 | 36.72 | 0.5468 | 36.57 | 0.5179 | 36.89 | 0.5683 |
|
|
||||||||
|
|
34.04 | 0.3723 | 34.01 | 0.3703 | 33.72 | 0.3674 | 34.06 | 0.3726 |
四个测试图像的视觉比较:(a)LR图像,(b)原始的HR图像,(c)用贴片尺寸4×4,(d)与贴片尺寸8×8获得的结果获得的结果获得,(e)获得的结果贴片尺寸16×16,和(f)使用所提出的方法获得的结果。
我们提出了一种新颖的基于稀疏表示的图像SR方法。该算法将可见图像中的详细信息组合以提高IR图像的分辨率。鉴于这些类型信息的互补性质,所提出的方法可以在SR任务中产生最先进的结果。考虑到自然图像的最佳稀疏域在单个图像中的不同图像和不同图像斑块中可以显着变化,所提出的方法使用一个简单的模型,该模型生成金字塔图像,并将金字塔图像划分为多尺度补丁以表示图像一种更有效的方式。我们还将自然图像分区到文件中,并将文档分组以确定使用PLSA的固有主题,并使用稀疏字典学习技术学习每个主题的稀疏字典。广泛的实验结果表明,与最先进的方法相比,我们所提出的方法可以实现竞争性能。
提交人声明没有关于本文的出版物的利益冲突。
该研究由中国国家自然科学基金(No.61271330和61411140248),高等教育博士学位研究基金(20130181120005),中国博士后科学家的国家科学基金会(2014千米552357),四川省科技计划(2014GZ0005),以及返回海外中国学者,州教育部的科学基础。