文摘

Copy-move伪造是最主要的伪造技术在数字图像领域的伪造。基于块的和基于兴趣的目前的两类主流copy-move伪造检测方法。然而,基于块的算法缺乏抗仿射变换攻击能力,和基于兴趣点的算法是有限的准确定位篡改区域。应对这些挑战,而且模型(CFM)提出。通过提取特征,仿射变换矩阵和伪造检测区域,从稀疏的干扰区域的定位精确的实现。具体地说,为了进一步准确提取伪造区域和提高性能的模型,两级本地搜索算法设计在细化阶段。在第一级,图像块作为搜索单位特性匹配,第二个层次是完善在像素级别的边缘地区。方法之间保持良好的平衡的复杂性和伪造检测的有效性,实验结果表明,它具有更好的检测效果比传统的基于兴趣的复制和伪造检测方法。此外,CFM后处理操作方法具有较高的鲁棒性,如缩放、旋转、噪声、JPEG压缩。

1。介绍

随着全球科技的迅速发展,有很多方法来获取和处理图像1]。演进在计算机技术,互联网,和图像应用程序允许个人很容易与图像内容篡改。Copy-move是最常见的图像伪造手段,其中的一个副本区域插入相同的图像。两个例子如图所示1,copy-move伪造是用来丰富图像内容。考虑场景涉及法院、新闻,等等,这是至关重要的,以确定一个图像被篡改。数字图像取证的目的是验证图像的真实性。

作为图像篡改的最常见的一种手段,copy-move伪造可能会伴随着一定的后处理,包括JPEG压缩、噪声,和模糊,改变图像内容和混淆的信息接受者(2]。特别是,复制的区域通常是几何转换(旋转、缩放等)。因此,被动取证copy-move干扰图像面临巨大的技术挑战,有很强的实际应用价值。本文研究了相应的被动copy-move法医技术操作。

我们的主要贡献可以概括如下:(1)本文提出了而且模型检测伪造区域的仿射变换矩阵(CFM)。伪造从稀疏区域的定位准确。(2)进一步提取伪造区域准确,两级本地搜索算法设计在细化阶段之间能够更好的保持平衡的复杂性和伪造检测的有效性。(3)方法具有更好的检测结果和更高的鲁棒性后处理操作,如缩放、旋转、噪声、JPEG压缩。

无数copy-move伪造检测方法(CMFD)提出了在过去的十年中,这是传统上分为两类:基于块和基于兴趣点的方法。

2.1。基于块的CMFD

2003年,Fridrich [3]提出第一个CMFD算法将输入图像分成重叠块产生相似块双和使用离散余弦变换(DCT)来描述图像块。枸杞多糖是一种灰度纹理算子用于描述图像纹理的空间结构。王等人。4]提取四元数指数的时刻(QEM)从每个重叠圆形颜色块模。这种方法的主要限制是计算复杂度越高,可减少应用超像素理论。陈等人。5)提出了一个方案来检测copy-move地区通过从每个块中提取不变的特性,和每一块只有与其他块封闭的十字路口下均值和方差的特性。马哈茂德et al。6]/移不变的平稳小波变换的近似子频带重叠块。截然不同的特征提取重叠块被用来暴露干扰区域伪造的数字图像。这些算法的特点可分为如下:不变的时刻,降维、结构特性,和极坐标变换。匹配技术包括字典排序和欧几里得距离(7]。然而,大多数表现不佳的算法基于图像块的仿射变换攻击。

2.2。基于兴趣点的CMFD

不同于基于块的算法,基于兴趣点的CMFD算法对仿射变换更健壮。与分裂一个图像,这种方法提取图像兴趣点,然后和图像特征提取的感兴趣点。他等。8)使用PCA特征向量,以减少计算复杂度。Mohamadian和Pouyan9)结合筛选和泽尼克时刻减少的潜力无法检测干扰区域在平坦区域。双关等。10)提出了一个新颖的CMFD使用自适应oversegmentation和特征点匹配方案,集基于块和基于兴趣点的伪造检测方法。Pandey et al。11)提出了一种快速、有效的copy-move伪造检测算法通过分层特征点匹配。由于中间的高稳定性和后处理操作,筛选方法已广泛应用于CMFD。提高过滤性能,湾等。12)最初提出“骗健壮的特性(冲浪)技术。海浪操作员维护筛选的优良性能,但地址计算复杂度高的缺点和时间消耗。Bo et al。13)提出了一种基于冲浪的CMFD方法和扩展的维度湾的128年技术来减少错误匹配。许多学者只使用这种技术的兴趣点检测特征点,之后当地特性被用来描述一个兴趣点(取得满意结果14,15]。Mishra et al。16)提出了一种检测方法的基础上,结合“骗健壮的特性(冲浪)和分层烧结的集群(HAC)。Zandi et al。17)提出了一个新的兴趣点探测器,利用基于块的优点和传统的基于兴趣点的方法,并使用改进的策略来实现该算法。然而,由于兴趣点是相对少而分散,基于兴趣点的检测方法在定位精确的伪造的地区可能会遇到困难。

基于块的CMFD算法和基于兴趣点的CMFD算法都有类似的框架如图2(18]。(我)预处理:它的主要目的是消除图像中无关的信息,恢复有用的真实信息;最常见的方法是将图像从RGB版本转换成灰度图像(2)特征提取:本地图像信息提取从一个图像块或兴趣点由一个功能描述符表示(3)匹配:类似的图像块或点对匹配过程中确定

大多数现有的算法基于图像块受到一些攻击,如缩放、旋转,和噪音,和基于兴趣点的方法不能精确定位被篡改区域。要解决这些问题,一个混合两级方法结合图像块和本文提出的兴趣点。我们选择筛选的特征描述符来表示兴趣点。然后,自适应oversegmentation方法用于提高匹配过程和计算仿射变换矩阵。最后,提出了局部搜索算法应用到图像块级和像素级,分别准确定位被篡改区域。

3所示。提出了检测算法

在本文中,基于兴趣点的准确CMFD方法和局部搜索算法。流程见图3

该算法的主要流程如下:(1)特征提取:兴趣点检测到输入图像由一个功能描述符,然后准确的兴趣点匹配获得通过一个匹配的过程;(2)仿射变换计算:利用随机验证算法计算仿射变换矩阵;(3)伪造区域提取:本地搜索算法应用于图像块和像素级水平。图像块级别实现篡改区域的位置和像素级用于提炼篡改区域边界。

映像级别检测,对该模型进行像素级检测测试数据集展示出了一些有希望的结果。我们的主要贡献如下:(我)方法结合图像块和像素。基于块,伪造区域定位,和像素点是用来制造区域边界更精致。这种方法可以弥补只提取干扰区域的表现不佳的兴趣点,从而提高检测性能。(2)考虑算法的复杂性和性能之间的平衡,设计一个两级本地搜索算法。在第一阶段,图像分成小块矩形块。如果图像块包含感兴趣的点,它被标记为一个伪造单元和计算仿射变换。搜索算法匹配结果的伪造。在第二阶段,伪造区域提取的边界像素级,和二次搜索算法用于改进进一步提高模型的精度检测。(3)四个不同的后处理操作进行测试数据集,和实验结果表明,我们的模型仍有较高的鲁棒性。

在本节的其余部分,我们现在这个检测算法的流程如图3。我们的算法的细节反映在以下部分:部分3.1介绍了特征提取和描述以及图像分割使用自适应oversegmentation算法准备下一个匹配的过程。部分3.2概述了使用两个最近邻特征匹配过程(2 nn)算法(19]。然后,计算仿射变换。部分3.3介绍了局部搜索算法。节3.4使用仿射变换矩阵,两级本地搜索算法是利用准确定位被篡改区域。在第一阶段,使用的图像块作为特征匹配搜索单元,第二阶段是在像素级别提炼的边缘地区。

3.1。特征提取和自适应Oversegmentation

第一阶段的算法涉及到兴趣点检测和特征提取的基础上筛选功能,指的是地方特色的形象。筛选仍然不变的旋转、缩放,光强度和维护稳定的鲁棒性视角的变化,仿射变换、噪声。兴趣点和相应的描述符。基于这些结果,该算法执行匹配操作识别类似的局部地区。

获得良好的性能匹配和计算仿射变换矩阵,采用自适应oversegmentation方法(10]。接下来,我们找到相应的利益通过特征点对匹配过程。在我们的方法中,简单的线性迭代聚类分割算法(SLIC)。SLIC算法可以生成和近均匀superpixel紧凑,而且具有较高的综合评价的操作速度,物体轮廓保存,superpixel形状,更符合预期的分割效果。当SLIC分割方法,平衡计算成本,必须保证检测精度。因此,自适应分割算法采用自适应定义的大小superpixels根据测试的纹理图像。

接下来,一个分割图像构建图像块集 ,在哪里图像块的总数;的兴趣点和特征描述符th块存储在图像B4描述物体的关系。然后,我们找到了相应的兴趣点对通过特征匹配过程。

3.2。兴趣点匹配和仿射变换的计算

2神经网络算法利用最近邻之间的距离之比,第二个最近邻。如果图像块BBj必须匹配,对于任何特征点,在哪里kth块点B计算如下: 在哪里 相似度阈值,d1是最亲密的邻居,d2是第二个最亲密的邻居。的距离d是计算 在哪里d表示点之间的距离 和点 thPj, 相应的特征描述符。

在我们的实验中, 设置为0.2。如果满足约束条件(1),然后检查兴趣点 是与 ( 对)表示兴趣。

我们2神经网络迭代过程在不同的图像块在我们的实验中,直到所有块被遍历,导致数据集: ,之间的利益对吗BBj存储在

匹配图像块之间的操作可以避免失败的匹配由于邻近点的坐标。进一步防止匹配失败,假设 存在于国会议员,如果点对的数量 太小,那么图像块之间的点对吗BBj被认为是一个失败,必须删除。因此, 大小()代表点的数量对吗国会议员(x和阈值Tp设置为3过滤对失败。因此,错过了大部分比赛都过滤掉。

为了更好地显示干扰区域,仿射变换矩阵T用于描述源区和复制区域之间的关系。估计仿射变换的传统方法是不适合的算法。在我们的方法中,我们提出一个更高效的矩阵估计算法。如果 存在于国会议员对,我们随机抽取三个点 并将它们存储在 仿射变换矩阵T描述如下: 仿射变换矩阵在哪里T被表示为 在哪里 ty表示翻译和一个1,一个2,一个3,一个4与缩放和旋转相关联。C矩阵仿射变换矩阵可以获得T

验证矩阵的准确性T对,所有的点 必须使用这个矩阵进行了测试。任何兴趣点对( ) ,p可以获得相应的利益点p '使用以下方程:

我们验证了基于距离矩阵的准确性 p ' 在哪里x ',y ',x ',y '的坐标是 p 'Td矩阵的相似度阈值(Td我们的实验= 1.5)。然后,我们获得正确的点对计数的数量

率大于0.5时,矩阵T被认为是正确的。在这种情况下, 大小( )中的所有点对吗

在大多数情况下,源区域和复制区域可能是由许多图像块。许多可以通过仿射变换矩阵国会议员。我们提出一种算法来处理这个问题。每当任何一组国会议员必须计算,我们必须研究点对之间的关系和现有的矩阵使用公式(6)- (8)。如果标签超过0.5,准备好了吗不计算。最后,矩阵集描述如下:

接下来,我们将显示破坏区域搜索算法。

3.3。局部搜索算法

只使用兴趣点提取干扰地区导致低劣的性能。通过考虑算法的复杂性和性能之间的平衡更准确地提取伪造区域,我们提出一个局部搜索算法,可以应用在图像块和像素级水平。局部搜索算法的作用是描述在图5网格,用于替换测试图片,红色是伪造的地区中概述的区域,蓝色的小块是伪造的单位;当第一个搜索算法,伪造的单位是一个图像块,第二个伪造的单位是像素。搜索算法的细节提供了以下部分。

检测单位可以找到相应的单位通过仿射变换矩阵,这是局部搜索算法的关键。检测单位可以找到相应的单位通过矩阵。在执行搜索算法之前,伪造的单位必须整理和添加到伪造区域设置(TR)。然后,执行本地搜索算法;算法步骤所示1

输入:伪造区域设置(TR)(块或像素),仿射变换矩阵(T结束)
输出:伪造区域设置(TR问+ 1)
(1) 检测单位p选自TR并获得附近pnei;已检测到的元素pnei删除。pnei添加到组吗Dnei
(2) Nondetection单位pDnei并获得检测单位 通过T。计算之间的相似性p ;如果成功,p 被添加到TR问+ 1的社区p被添加到Dnei继续执行步骤2,直到Dnei是空的。
(3) 重复第1步和第2步,直到所有元素TR被检测到。

TR是当前检测的结果,Dnei是小区的集合 ,(1、2、3、4)表示四个角(0°、90°、180°和270°)。值得注意的是,检测单位pnei可能是发现元素;因此,检测到的元素pnei必须被删除。然后,相应的单位p是计算矩阵T,和特征描述符用于测量相似。这些描述符在以下部分中详细解释。

成功匹配单元对被添加到TR问+ 1。这个操作是迭代,直到所有元素TR被检测到。最后,测试结果TR问+ 1结合原始的结果吗TR问+ 1,我们获得最终结果TR问+ 1=TR问+ 1UTR。理解算法流和证明的有效性局部搜索算法,用于描述一个流程图(图6)。

6介绍了普通流的局部搜索算法。只有六个伪造的单位(a, b, c′,b′, c′)的算法;伪造的地区并不完全覆盖。图中描述了算法的实现步骤6,蓝色块伪造的单位,绿色标记代表检测单位,红色块nonforged单位,和白色块单位,没有被发现。假设只有一个仿射变换矩阵T,最后的结果显示。

3.4。破坏地区本地化

平衡算法的复杂性和准确性,两级本地搜索算法:图像块的水平。第二阶段是在像素级别提炼被篡改区域的边缘。算法的框架显示在图中7

3.4.1。第一阶段

在我们的方法中,兴趣点国会议员提取并存储在吗P正确的。首先,一个小,不重叠的矩形块用于覆盖宿主图像,图像块扫描。如果图像块包含兴趣点P正确的,块标记为一个伪造的单位。然后,添加到图像块作为检测单元TR0,采用搜索算法在图像块的水平。相应的计算仿射变换的图像块T。假设图像块B计算相应的图像块B;在这种情况下,图像块B无法达到另一个块的中心(B),需要提取正确的匹配图像块B,所以功能对比之间必须执行BB。然后,ZNCC(从零开始的归一化互相关)应该计算之间BB如下: 在哪里(u), (u)表示像素强度的位置u,的平均像素强度吗BjB。我们应用高斯滤波器的标准偏差为0.5 7×7像素以减少噪音;阈值(T理查德·道金斯)建立获得相似的图像块对:

在我们的工作,T理查德·道金斯设置为0.55一次公式(11)计算。这两个图像块(BBj)

是相似的,搜索算法的结果存储在吗TR1

滤波算法用于使测试结果更准确。为每一个伪造的单位TR1,检测元素的邻居D必须提取,邻近的街区被定义为Dnei= {d0,d1,d2,d3,d4,d5,d6,d7}。在我们的实验中,如果伪造的单位的数量Dnei小于2,检测元素D被删除。

3.4.2。第二阶段

是具有挑战性的提取伪造区域在图像块级别,没有良好的性能和算法的边缘干扰区域。因此,的边缘TR1提取,我们获得一个边缘区域0和一个中心地区CR1在图像块的水平,0被认为是不准确的,CR1是准确的。在矩阵T,所有的像素1必须计算。获得像素配对,ZNCC算法是用来衡量相似性,阈值(热带病研究和培训特别规划)设置为0.55。匹配的结果保存在1,从伪造区域TR2通过结合中心地区吗CR1匹配的结果1。提高锻造的边缘地区的边缘2提取像素级的TR2,2用于执行本地搜索算法。假设我们(,我′)矩阵T;分别提取颜色特征应该之间我′如下: 在哪里R(),G()和B()是三个颜色通道的检测图像单元;FF的颜色特性吗;如果功能FF符合公式(11),单位之间的匹配成功 在哪里 之间的相似程度,吗我′。在我们的工作, 是0.5。结果存储在3

破坏地区TR2通过结合3和中心地区CR2。过滤步骤后,应用形态学关闭操作TR3为了消除小缺口,之后被篡改区域TR结束是生成的。以下部分的算法评估证明其有效性。

4所示。实验结果

在本节中,进行了一系列的实验来评估拟议中的CMFD方法的性能。部分4.1介绍了图像数据集用于我们的实验和评价标准用来评估该方法的性能。部分4.2显示了该算法的实验结果。节4.3的实验结果提出了CMFD方法终于与现有最先进的CMFD方法相比在不同变换,并比较分析的结果。

4.1。数据集和评价标准

在接下来的实验中,基准数据库(20.),包括现实copy-move伪造被用来测试方案。这幅图像数据集包括48个源图像以及手动准备/图像,复制语义上有意义的区域。每个图像测量3000×2300像素。每个图像的伪造区域占大约10%。复制的区域属于类别的生活,自然、人工、和混合纹理从平稳到复杂。转换图像,如那些进行旋转、缩放、JPEG工件,并添加噪声,也包括在图像数据集。

定量评估检测性能,我们采用两个指标:精度和召回。精确的分数像素认定为伪造真正伪造、定义为正确检测到伪造的像素的数量的比率检测到伪造的像素的总数。召回是指伪造的分数像素正确分类,定义为正确检测到伪造的像素的数量比伪造的像素的数量在地面真理伪造图像。计算精度和召回使用(14)和(16),Ω表示检测到伪造区域的集合与CMFD伪造图像方法在像素级和Ω表示伪造的伪造真实区域的图像。我们提供的F分数作为衡量相结合的精度和召回在一个单一的值。

利用这些指标,我们展示如何精确CMFD算法识别干扰区域。减少随机样本的影响,平均精度和召回所有图像数据集的计算。

4.2。该算法的实验结果
4.2.1。准备实验结果在平原Copy-Move伪造的

平原copy-move伪造是一种一对一的copy-move方法,不涉及其他转换操作。减少当地的目标图像,然后再粘贴到目标图像通过旋转、缩放等操作,以生成一个新的篡改图像。我们尝试在48纯copy-move伪造图像。图8显示八copy-move伪造检测结果平原copy-move伪造、和伪造内容要么是光滑(如天空),粗糙的(例如,岩石),或结构化(通常是人造建筑)。从上到下真实测试图像和相应的伪造区域,最后一行是伪造CFModel检测到的地区。从图可以看出,该模型得到好的预测面具,甚至在小伪造区域。这些团体可以用作CMFD类别图像。

4.2.2。实验结果在各种攻击

除了一对一copy-move伪造,我们也在各种攻击实验来验证该算法的有效性。(我)规模:破坏地区新91%至109%的原始大小步长为2%。总共48×10 = 480图像进行实验。图9缩放显示八copy-move伪造检测结果,和一些规模调整参数包括:91%,93%,95%,97%,103%,105%,107%,109%。(2)旋转:干扰区域旋转,旋转角度不同从2°到10°步长为2°。总共48×5 = 240图像进行实验。图10显示了旋转,八copy-move伪造检测结果和一些旋转角度,即。、2°、4°,6°,8°,和10°,被认为是。(3)高斯噪声:破坏区域归一化的图像强度在0和1之间添加了零均值高斯噪声标准差为0.02,0.10和0.02的步长。总共48×5 = 240图像进行实验。图11说明八copy-move伪造检测结果噪声,噪声标准差是包括:0.02,0.04,0.06,0.08和0.1。(iv)JPEG压缩:伪造图像JPEG压缩与质量因素之间不同的100和20,步长为10。总共48×9 = 432图像进行实验。图12显示了JPEG,八copy-move伪造检测结果质量的因素(QF)包括:20、30、40、50、60、70、80和90。

4.3。比较分析的算法

本节介绍CFModel之间的比较结果和现有的方法,和实验数据集提出了(20.),包括1488个干扰图像。三个最近的方法基于筛选[20.和冲浪20.]随着迭代CMFD [17被选作比较。

4.3.1。检测结果在平原Copy-Move伪造的

我们首先评估算法在平原copy-move伪造攻击。我们尝试在48原始图像和48伪造图像,由一对一的玩弄copy-move伪造的。表12现在评估的结果图像和像素级水平。

如前所述在表1回忆,CFModel精度达到97.82%和93.75%,比最先进的方法在图像的水平。我们的计划也取得了更好的性能在像素级别。显示在表2,CFModel达到84.58%的精度和召回高达97.41%,超过了最先进的方法。相对于Bi (22和陈23),F1分数略低于他们。可能的原因是,该模型是基于块和兴趣点,将更加注重召回率(检查伪造像素是否完全和正确)。这些结果表明,该方法比其他的更有效。图8还提供了代表八个例子的结果。图5所示,我们可以看到,我们的算法可以准确地定位被篡改区域甚至在那些小或光滑copy-move地区。

4.3.2。检测结果在各种攻击

为了获得更详细的评估方法的区别的性质,copy-move伪造检测结果的详细数据,尝试在1392年总干扰图像在各种攻击下,如图所示13。我们使用1392图像在不同的攻击。图13提供所有定性结果:bottom-scale攻击,旋转攻击,高斯噪声,和JPEG压缩;留给right-precision率、召回率F1分。

如图,我们方案的精确率和召回率比其他方法,达到一个更高的水平F1下成绩特别突出规模表明我们的方法提供了一个良好的平衡精度和召回。主要原因是我们的方法提出了一种两级本地搜索算法,它不仅可以定位被篡改区域在图像块级别也定位在像素级边缘。换句话说,我们的计划比执行最先进的方法在大多数情况下;然而,我们的方法有一个非常低的分数标准偏差超过0.6时,我们将解决这个缺陷在后续工作。

5。结论

随着数字技术的发展,数字图像可以很容易地使用图像处理软件。伪造的图片必须确定考虑到潜在的法律和其他影响。在本文中,我们提出一个copy-move伪造检测算法使用筛选作为兴趣点和特征提取方法。仿射变换矩阵计算,其次是本地搜索算法来定位伪造的地区。实验结果表明,该方案执行比最先进的copy-move伪造检测算法和展示良好的性能在各种攻击。然而,图像含有噪声时性能较差;稍后我们将关注这个图像输入工作。

未来的研究主要是如下:(1)为了解决这一问题,该方法不能适应嘈杂的操作,未来的计划是将丰富的纹理特征信息来达到更好的鲁棒性(2)在未来的工作中,我们将关注检测任务与多个copy-move干扰区域在同一图像检测算法的实现实际应用

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究受到了中国国家重点研发项目(2018 yfb080402和2018 yfb0804203),区域联合基金国家自然科学基金委(U19A2057),中国国家自然科学基金(61672259和61672259),吉林省科技发展计划项目(20190303134科幻和20190303134科幻小说),赛尔创新项目(NGII20190802),吉林大学大学生创新与创业训练计划(202010183389)。