文摘

在这个数字时代的技术和软件开发工具,低成本的数码相机和强大的视频编辑软件(如Adobe Premiere,微软电影制造商和迷幻拉斯维加斯)已经成为对任何常见的用户可用。通过这些软件,数字视频编辑的内容变得非常容易。帧重复是一种常见的视频伪造攻击可以通过复制和粘贴一个帧序列在同一个视频为了隐藏或复制视频的一些事件。在文献中提出了许多算法来检测这种伪造的视频序列,通过分析空间和时间相关性。然而,他们中的大多数都患有低效率和准确率,计算复杂度高。在本文中,我们提出一个有效的和健壮的帧复制检测算法来检测重复帧的视频序列基于改进的Levenshtein距离。广泛的实验进行一些选择视频序列由静止和移动摄像头捕捉到的。该算法的实验结果,显示效果与最先进的技术。

1。介绍

在我们的日常生活中,数字视频都发挥着至关重要的作用在许多领域的应用,如监测系统、医学领域和刑事调查。因为可用性的低成本的数码视频相机和强大的视频编辑工具(如Adobe Premiere,微软电影制造商和迷幻拉斯维加斯),现在方便普通用户编辑视频内容没有留下任何视觉伪造的痕迹。所以,我们不能相信这些视频的真实性了。因此,这种视频的身份验证是成为一个非常重要的研究领域。数字视频取证是一个新兴的研究领域,旨在验证这些视频的真实性(1]。数字视频取证的分类如图1,它可分为3类:识别源相机,歧视的电脑视频和视频伪造检测(视频篡改检测)1]。

伪造视频操作可以表现在三个领域:空间域(intraframe伪造),时间域(帧间伪造)和时空领域。Intraframe伪造可能包括区域内重复(copy-move)和拼接帧本身而帧间伪造包括帧重复、插入帧,帧洗牌和帧删除(1]。

伪造数字视频目标检测算法检测到伪造的痕迹在数字视频序列。在数字图像、数字视频伪造检测技术也可以分为主动和被动(盲人)技术。被动伪造视频检测技术,建立视频的真实性验证没有原创视频的存在,只取决于从伪造视频中提取一些特征或脚印已被留下的编辑操作(1]。这些脚印可能包括帧之间的时空相关性高强度值(2],噪声和运动残留[3),工件在光学流(4),motion-compensated边缘构件(MCEA) [5),和帧质量评估(6]而活跃的技术要求等将信息嵌入到视频数字水印(7),但这种技术的许多研究人员是不可取的,因为它需要原始视频的存在以及干扰通常不可用。

帧复制伪造是一种常见的伪造类型在数字视频,这是一个发生在时间域帧间伪造。它可以通过复制和粘贴来执行一些在另一个位置在同一帧视频序列为了隐藏或复制视频的一些事件。图2显示帧重复攻击的过程,从1到6帧会被复制,然后粘贴到另一个位置,而不是从7到12帧,从而消除移动车穿过停车场的存在,经过一个灯柱,背后没有留下任何视觉伪造的痕迹。原始视频的例子是来自LASIESTA数据集(8]。

克隆来自同一视频的帧序列提高帧复制伪造检测的难度,使它不检测颜色变化和光照条件(9]。虽然提出了各种方法,这些方法在帧复制伪造仍面临以下挑战:(1)高的计算复杂度(2)低检测率在静态场景(3)无法找到的位置对复制帧

在本文中,我们提出了一个有效的和健壮的帧复制检测技术检测重复帧的视频序列基于改进的Levenshtein距离。首先,我们将视频序列分成小重叠的子序列和测量它们的相似性通过使用改进的Levenshtein距离(ILD)。接下来,ILD的值是用来检测复制伪造,价值越高,两帧之间的相似度越低。因此最后,复制帧。该算法的实验结果,显示效果与最先进的技术。

本文的其余部分组织如下。在相关工作部分,概述相关领域的工作和贡献的帧复制伪造检测。方法部分描述该方法的概念和实现细节。实验中使用性能验证和结果讨论了实验结果部分,论文是在上一节结束。

帧重复攻击可以从被篡改检测视频通过使用现有的数字图像伪造检测技术(10)连续的视频序列图像在一个时间(时间t),两个空间(x,y)维度。然而,这可能不是一个好主意由于获得的巨大的计算复杂度,而不是复杂的场景,视频等静态场景(11]。小王和法(12]提出的第一帧复制伪造检测算法利用视频帧之间的空间和时间相关性。而且比较的方式被用来比较视频子序列。时间相关系数的高相似性导致空间相关系数的比较。然而,他们的方法无法检测到帧复制伪造在静态场景和后处理的攻击如添加噪声在复制帧。使用以前的框架,杨et al。6)提出另一个两阶段的相似性分析方法。在第一阶段,他们从每个视频帧中提取特征通过奇异值分解(计算)。然后,欧几里得距离特征之间的相似性计算参考系(视频)的第一帧,每一帧。在第二阶段,使用一个随机块匹配显示候选人重复。然而,他们的方法未能检测到伪造帧重复在不同的顺序完成时也当复制帧不到窗口大小(1]。辛格et al。13)将每个视频帧分成四个区块,然后九从每一帧特征提取。然后,他们按字母分类提取的功能组帧最相似。均方根误差(RMSE)然后计算特征排序的相邻帧之间的识别可疑的帧。然后检测帧重复,可疑的帧之间的相关性。他们的方法未能检测到伪造视频由一个固定相机和重复在不同的顺序完成时(1]。林和张14)提供了一个框架重复检测方法有四个步骤:候选人段选择其次是空间相似性度量帧重复分类最后后处理。然而,许多后继候选人选择视频,结果在一个相当高的计算时间。李和黄15)提出另一个帧复制伪造检测方法基于结构相似度(SSIM) [16]。视频子序列之间的相似性计算找到重复的帧。然而,他们的方法也未能检测到帧复制伪造在静态场景。D 'Amiano et al。17)提出了一个算法框架基于dense-field复制伪造检测方法不变的特性。他们使用一个合适的video-oriented patch-match限制复杂的版本。贾et al。9)提出了一个新颖的方法来检测帧copy-move伪造基于光流(的),和稳定的参数设计。

上述方法预定义的全球固定阈值在候选人的选择或重复检测阶段。这些阈值调整的特定条件,不得为其他情况下工作。此外,它使这些方法不通用。此外,时间复杂度是最具挑战性的问题之一帧重复检测算法,从而增加显著增加帧的数量在一个给定的视频序列。此外,还有无法区分重复帧对和高度相似的框架对(误测或假阳性双帧)的视频仍然长时间静态或场景。

3所示。该方法

在帧间伪造(帧重复),一些从视频帧时间替换为一个副本从其他帧相同的时间表(如图2)。在本节中,该方法对帧复制伪造检测和定位详细介绍。该方法包括四个阶段,如图3

首先,视频序列分为小重叠的子序列;其次,基于Levenshtein距离的相似性度量(18]计算;第三,重复帧检测到伪造;第四,帧复制伪造所在地。计算视频帧之间的相似性和识别的高相似子序列,所有重叠的子序列的改进Levenshtein距离计算。实验中,我们玩弄的视频序列帧复制伪造通过随机选择在每个视频时间轴的位置。

3.1。分区的视频子序列

在实验中,被篡改视频序列V首先是分为重叠的子序列 ,开始时间ζl是所有重叠的子序列的总数。我们假设每个子序列长度从重叠的子序列(r)框架和测试视频的长度(N)的框架。因此,所有重叠的子序列(的总数l可以由)

接下来,我们检测到潜在的重复的候选人通过计算这些子序列之间的相似之处。每个子序列的相似性计算的其他子序列。采用改进的Levenshtein距离和用作测量方法的相似之处,测量相应的帧的相似性对每两个候选人。

3.2。基于改进的Levenshtein距离的相似性度量

Levenshtein距离是一个度量来衡量两个集合之间的相似之处一个B作为一个简单的函数的长度(|一个|和|B|)[18]。广义Levenshtein距离测量(GLD)是最常见的用于比较不同编辑的过程,如插入、删除和替换集元素(19]。可以获得GLD[中提出的方法18,20.]。它显示了不同的工具在某些应用程序中,纠错和模式识别21,22]。

假设两个子序列SeqSeqj从被篡改视频V表示为 ,分别在哪里 m框架Seq n框架Seqj。的长度Seq是由|Seq|。我们建立了每个子序列的长度r = 5和重叠的长度r−1

用于显示编辑转换的 这是一个序列基本编辑流程的改变吗 假设一个初级编辑的过程是(x,y),如果一个加权函数γ分配给xy一个实数(非负)γ(xy),编辑转换重量 可以计算 鉴于 是两个帧V,那么广义Levenshtein距离计算(GLD)在以下方程:

如果 是一个度量序列的基本编辑流程,Marzal和比达尔(23)定义了GLD在以下方程: 在哪里 是一个编辑之间的路径吗 的重量是 ,这是一个点集或下令对吗 满足下列条件:(1) (2) (3)

改进的Levenshtein距离相似度(ILD) GLD的正常化,并通过GLD是很容易计算的。改进的Levenshtein距离两帧之间 可以得到如下: 在|F|和|Fj|的长度FFj,分别。的最终价值改善Levenshtein距离计算两帧包含在[0,∞)0意味着两个帧(复制或复制)而之间的任何整数1:∞表明不同强度的数量相应的帧。

为了说明ILD的优点,我们削减连续两帧代表一个静态场景在一个真正的视频中,如图4。他们有很高的相关系数,可能导致misdetection。例如,这两个框架之间的结构相似度(SSIM)计算,它等于0.9935,这意味着如果SSIM-based算法中的阈值(14,15)设置为小于或等于0.9935,这些帧复制伪造检测算法的检测性能将大大降低由于错误检测到帧的存在对复制(误测帧对)。此外,他们未能检测到重复在静态场景而改善Levenshtein距离这两个真实的帧之间等于109,这意味着有109个不同的这些帧之间像素强度值,这表明这两个框架都是不同的,而不是互相重复。

3.3。合并子序列和重复定位

一个有用的距离度量技术极大地提高了定位的性能,聚类和分类过程(24]。因此,距离度量技术帮助算法来衡量视频内容之间的相似之处。被篡改视频序列被分成小重叠的子序列检测帧复制伪造。为了形成一组候选人重复帧,几个重复的子序列应该合并,形成一个完整的重复序列。此外,我们需要确定哪些子序列是原始和子序列重复(复制品)。

由于小重叠的子序列,一个或更多的子序列可以用两个或两个以上的重复的子序列匹配。所以,子序列与相应的帧之间的距离等于0双选为复制帧对这些子序列合并以形成一个完整的候选人重复帧的子序列。在每个子序列,每一帧的相似性和所有其他帧计算其他的子序列。因此,在本文中,我们使用改进的Levenshtein距离计算相似之处D[我]在相应的候选帧 如下: 在哪里

假设(S T)是一个重复的子序列,年代T具有相同数量的帧(长度相同)和(年代,T)是一对相应的匹配框架。如果所有的ILD距离D之间(年代,T)= 0年代被认为是源子序列和T是重复的。

4所示。实验结果

4.1。数据集

在实验中,我们选择了一些常用的测试视频序列视频测试序列视频跟踪可以在图书馆(VTL)数据集http://trace.eas.asu.edu/yuv/index.html。选中的视频捕获与静止和移动相机模式。每一个都是352×288像素的分辨率和30帧的帧速率。表1显示的细节测试干扰视频。

4.2。绩效评估和分析

方程的精度和召回率作为(6)和(7),评价该方法的检测能力。我们也算另一个措施F1分数,结合精度和召回见方程(8)。 在哪里 (真阳性复制帧对)代表的数量正确检测到帧对重复的帧, (假阳性复制帧对)代表假冒复制检测到帧对帧的数量,和 (假阴性复制帧对)代表重复帧的数量对分类为真实的。

评估我们的方法的性能,我们比较该方法与小王和法(12和李、黄15]。精度、召回和F1分率计算的所有伪造视频数据集。更高的精度和召回率F1分数,将更好的性能。

2显示了该方法的检测结果的测试视频序列。看来,该方法不仅能够实现高检测的帧复制伪造也准确地定位视频序列中的重复的视频剪辑。表3表示比较的检测能力和位置之间的复制方法和方法(12,15]。

对于测试干扰视频Akiyo帧从1:20位置重复的301:320。这个视频有一个静态场景如图(仍然)5,里面的头四帧视频视觉是相同的(真实的结构复制)。图6和表2表明,该方法能够检测到帧复制伪造在静态场景中,该方法可以正确检测和定位框复制伪造(精确率100%)。然而,该方法在小王和法12失败和确认这个破坏视频作为一个真实的视频序列,而李方法和黄15)检测到帧复制伪造精确率较低(9.43%)192年由于存在误测架双(假阳性复制帧对)。因此,我们建议的方法的性能远优于其他先进的方法(12,15),如表所示23和图6

4.3。运行时间

该方法的运行时间之间的比较和王中的方法和法12和李、黄15)如表所示4。从这个表,我们可以注意到小王和法的方法(12比其他的)最低的平均时间。主要原因是王提出的方法和法(12)是无法找到重复的帧的位置对,花费其他方法有更多的时间来定位的位置重复的帧。然而,该方法在12)最严重的检测精度比其他算法框架复制伪造检测(见图6和表2)。

所有的实验都进行工作站与英特尔酷睿i7 - 8750 h CPU和32 GB RAM。我们实现了MATLAB R2018a的三种方法。

一般来说,本文中给出的结果表明,该算法提供了一个良好的性能相比,最先进的技术。对未来的方向,最近,深度学习方法介绍了在不同领域的探测和识别问题(25- - - - - -27]。它显示一个对恶意攻击有效性和鲁棒性。此外,copy-move伪造检测(CMFD)算法,提出了数字图像可以用于视频帧复制伪造检测(28- - - - - -30.]。

5。结论

介绍了帧复制伪造检测和定位的方法基于相似性分析改善Levenshtein距离。首先分为破坏视频序列重叠的子序列。接下来,计算每个子序列都有相似的其他子序列。采用改进的Levenshtein距离作为衡量相似之处。的所有子序列之间的相似性测量找出潜在的重复帧对。这些重复的帧对结合成一个完整的重复序列,因此帧复制伪造坐落的位置。广泛的实验是进行一些干扰视频从VTL下载数据集。结果表明,该方法的精度可以达到99.5%,高于最先进的方法。此外,该方法可以找到复制品的确切位置除了检测功能的帧复制伪造静态场景。

数据可用性

没有私人数据被用来支持本研究。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作由基础研究基金支持下的中央大学拨款2572018 bh09和2572018号pz10和东北林业大学博士后研究项目批准号203822年。