文摘
目前,大众富裕模式隐写式密码解密功能通常包含大量的冗余功能组件可能会带来“维度”的诅咒和大型计算成本,但现有特征选择方法难以有效降低维度有许多强烈相关有效的功能组件。本文提出了一种新颖的选择方法对于丰富模型隐写式密码解密功能。首先,每个特性的子组件的可分性丰富的模型是基于费舍尔标准衡量,和功能组件是降序排序基于可分性。第二,任何两个功能组件之间的相关系数在每个计算子模型,并根据费舍尔值进行特征选择的每个组件和相关系数。最后,结合作为最终选定的子隐写式密码解密功能。结果表明,该特征选择方法可以有效地减少JPEG域和空间域的向度:丰富模型隐写式密码解密功能不影响检测精度。
1。介绍
数字隐写术是一种技术,在数字图像的冗余嵌入信息,音频、视频、文本等达到隐蔽通信的目的(1- - - - - -6]。雨果速记式加密算法的演示(7]2010年,自适应隐写术的框架基于“失真函数+ STC编码”已经成为主流的图像隐写术。基于这个框架,研究人员相继提出了一系列自适应隐写术算法antidetection性能高,使传统的隐写式密码解密算法大多是无效的(8- - - - - -12]。2012年,Fridrich和Kodovsky提出了丰富模型隐写式密码解密功能(13),这对雨果隐写术有效地提高了检测性能。从那时起,许多特性与成千上万的尺寸已经先后提出了隐写式密码解密,如PSRM(项目空间丰富模型)特性(14),制药(Phase-Aware投影丰富模型)特性(15肾小球滤过率(GFR)],(伽柏过滤器丰富的模型)特性(16],CC-JRM (Cartesian-Calibrated JPEG丰富模型)特性(17]。这些功能可能会带来大的计算和存储成本,甚至“维度的诅咒的问题。“为了减少维数的隐写式密码解密的功能,研究人员进行了一系列适用于两种不同的方式包含功能转换和特征选择。
基于功能特征降维变换通常将特征向量转换成另一个特征空间,以便有效的信息将主要集中在一些组件的转换特性,选择和最有效的功能成分的转换特性来实现特征降维的目的。例如,秦et al。18]使用PCA(主成分分析)获得的主要组件特性来达到降低特征维数的目的。然而,PCA方法不适合的功能不是线性的19]。王等人。20.)进行一维离散傅里叶特征转换SRM隐写式密码解密功能,然后选择正半轴的谱系数作为特征向量,这有效地降低特征维度。Boroumand和Fridrich21)获得了一类非线性变换的近似对称半正定核函数,然后用它们来降低特征维数的同时,提高检测精度。然而,这两种方法20.]提出以上只适用于空间域隐写术。
基于特征选择的降维主要是选择的一部分功能组件,可以最有效区分封面图片和stegoimages从原始特征向量。例如,宣et al。22和戴维森和道路23]使用Bhattacharyya距离与Mahalanobis距离测量功能组件的分辨率,分别,然后选中部分的功能组件和它们之间的最大距离和stegoimages封面图片。陆et al。24Fisher)利用一种改进的标准来衡量特征向量,然后选择特征的重要性subvector费舍尔值最高的检测。Zhang et al。25)应用方法(24]在SRM减少每个子模型。马等。26)提出了一种基于决策粗糙集的特征降维方法α减少艾滋病地区和选定的部分功能组件,符合的原则nonreduction正域和独立的原则。然而,这种方法使大减少计算成本的过程中积极的领域。
总之,上面的方法可以显著降低丰富模型的维数隐写式密码解密功能。然而,当前的现有特征选择方法不考虑功能组件之间的关系,所以他们不能有效降低高度分离和相关功能组件。针对这个问题,提出了一种特征选择方法基于功能组件的相关性。实验结果表明,该方法可以选择减少CC-JRM[的向度:17]和SRM [13隐写式密码解密的功能,同时保持了检测精度。
剩下的纸是组织如下。部分2介绍了相关知识参与本文的方法第三节详细介绍了基于功能组件的相关的特征选择方法在富裕模型隐写式密码解密功能。因此,第四节给出了该方法的实验结果,最后总结全文。
2。相关的知识
2.1。皮尔逊相关性和费舍尔的标准
在统计中,皮尔森相关系数应用于衡量两个变量之间的线性相关程度和 ,和它的值是在−1和1之间。皮尔森相关系数被定义为两个功能组件 在哪里 表示两个变量之间的协方差和 。 和表示两个变量的标准差。和表示两个变量的平均值。当相关系数的绝对值更大,这意味着两个变量之间的相关性更强。
激活(7陆,et al。24)用Fisher判别函数测量单个特征的可分性组件如下: 在哪里和表示的平均值和标准偏差dth特性的组件特性和封面样本和表示的平均值和标准偏差dth特性的组件特性相应的stegosamples,分别。反映了之间的分散度d从封面和stegosamples th功能组件计算。值越大,差异越大和stegosamples将封面。 反映了组内的聚合度d从封面和stegosamples th功能组件计算。因此,值越小 是,组内差异越小。在隐写式密码解密,当费舍尔价值更大,这意味着功能组件对stegoimages的检测。
2.2。丰富的模型
目前,富人模型隐写式密码解密功能仍然是最有效的方法之一来检测自适应隐写术。这个特性是Fridrich等人2012年提出的(13),其提取过程如图1。首先,各种线性和非线性的高通滤波器用于滤图像从不同的方向和角度,导致各种类型的残余图像。然后,每个剩余的四阶同现矩阵计算图像以及不同的方向。由于同现矩阵的对称性,一些同现矩阵合并形成新的剩余同现矩阵。最后,每个new-formed同现矩阵被视为子模型特性,和所有子模型特性组合到最终丰富模型隐写式密码解密功能。
3所示。基于相关性的特征选择丰富的模型
在本节中,特征选择方法的原理和过程丰富模型的隐写式密码解密功能。然后,一个算法搜索适当的相关系数阈值。
3.1。特征选择的方法
功能组件之间的高维丰富模型的隐写式密码解密功能,有些功能组件的方差在封面和stegoimages 0。特别是,这种情况是常见的功能组件JPEG图像量化DCT系数的计算。这些功能组件没有积极的影响区分封面和stegoimages。因此,在封面样本方差为0的功能组件和stegosamples将消除。获得的特性和他们的尺寸D。
接下来,方程(2)是用来测量每个功能组件的费舍尔价值和并获得相应的D费舍尔价值的维向量 。功能组件和按降序排序生成的新特性和 。
此外,方程(1)是用来计算相关系数矩阵的封面图片中的组件功能和组件stegoimage特性,分别。相关系数矩阵表示如下: 在哪里和都是对称矩阵的大小D×D和元素和代表之间的线性相关性的强度我th组件和特性jth封面图片的功能组件特性和stegoimage特性,分别 。当 和 ,这两个功能组件是完全负线性相关。相应地,当 和 ,这两个功能组件是完全积极的线性相关。
最后,由于和是对称矩阵,只需要遍历元素低于主对角线(上图),如 ( )。然后,当元素满足方程(4),功能组件组 减少到一个元素。 在哪里T是一个预设相关系数阈值。根据方程(4),提供功能组件的选择规则。(1)当 和 ,有一种强烈的积极的线性相关性和 ,功能组件保留和功能组件删除(2)当 和 ,有一种强烈的负线性关系和 ,功能组件保留和功能组件删除(3)当 和 (或 和 ),两个功能组件需要被保留(4)当 或 ,两个功能组件需要被保留
基于规则表示的选择特性和 。
基于上述规则,该方法的主要过程如图2。以SRM (13)作为一个例子,首先,高维SRM隐写式密码解密功能分为106子模型的特性。然后,每个子模型消除了功能组件的封面和stegoimage方差为0。接下来,每个子模型的功能组件排序根据费雪方程获得的价值(2)。之后,选择有效的功能组件的基础上,提出了特征选择的规则。最后,选择从每个子模型结合的功能组件隐写式密码解密的最终功能。
3.2。相关系数阈值T的选择算法
在特征选择过程中,相关系数阈值T具有至关重要的意义。时的值T较大,所选特征的维数越小,反之亦然。阈值的选择T应该遵循的想法所选功能组件可以保留原功能的多样性尽可能和冗余功能组件可以删除尽可能多。此外,为了确保过程的有限性,有效数字的T是设置为5。算法1描述选择适当的步骤T。
|
||||||||||||||
4所示。实验结果和分析
在本节中,提出的特征选择方法是测试典型的JPEG图像隐写式密码解密功能CC-JRM和空间图像隐写式密码解密功能的SRM J-UNIWARD和S-UNIWARD速记式加密算法。
4.1。实验设置
所有实验BOSSbase 1.01数据库。数据库包含10000灰度级图像大小为512×512,和他们的PGM的格式。首先,10000灰度级图像被用于生成stegoimages S-UNIWARD载荷为0.1,0.2,0.3,0.4和0.5。然后,SRM隐写式密码解密功能从封面图片和stegoimages提取。最后,六组SRM隐写式密码解密功能维度(34671)[13]。
10000年,灰度图像被压缩的JPEG标准的品质因数75生成JPEG图像。10000年的封面JPEG图像被用于生成stegoimages J-UNIWARD载荷为0.1,0.2,0.3,0.4和0.5。然后,6组CC-JRM隐写式密码解密功能维度(22510)[17从封面图片和stegoimages]提取。
在实验中,一个分类器(27被训练。对于每一个载荷,封面图片和stegoimages分为两组;一组用于培训包含5000随机选择封面图片和相应stegoimages 5000。剩下的图片由测试组。隐写式密码解密的性能评估的平均值10测试。计算的假警报,错过了检测如下: 在哪里代表了假警报,即判断的概率作为stegoimage封面图片,和的概率代表错过的检测,即判断stegoimage作为封面图片。此外,平均检测精度 更直观地反映了检测性能。更大的是,隐写式密码解密性能就越好。
4.2。特征选择的有效性分析
本节将探讨之间的关系维度的选择特性和检测性能在更多的方面。中提到的多党民主运动(最大平均差异)(28)将被用来测量覆盖图像的相似性特征分布和stegoimages,以描述所选特征的分类性能。采取和样本为例,多的公式如下: 在哪里代表了特征提取我th封面图片,相应地,代表了特征提取我th stegoimage,和 ,分别代表的封面图片和stegoimages数量,径向基函数(RBF)。当多值之间和比较小,功能分布的封面图片和stegoimages更相似,和性能的分类更糟糕的是,反之亦然。
图3显示多的散点图和检测精度为不同数量的功能组件选择CC-JRM Ah_T3模型特性的隐写式密码解密功能(17提出了选择方法)。结果计算封面JPEG图像及其stegoversions J-UNIWARD载荷为0.5。红色的“▲”表示的多值选择的功能组件,和蓝色的“●”表示相应的检测精度。可以发现,随着选择的功能组件的数量增加,多值和检测精度也会增加。当选择功能组件的数量达到一定范围内,多值和检测精度往往是平的,这意味着后续的强烈相关功能组件不能带来改善多值和检测精度。
图4显示了多值的散点图和检测精度s1_minmax22v_q1选择不同数量的功能组件的子模型特性的SRM隐写式密码解密功能(13]。生成的使用stegoimages S-UNIWARD算法有效载荷为0.5。可以在图中找到相应的结果4。
此外,我们也选择了功能组件Dix2_T2 CC-JRM子模型的隐写式密码解密功能(17)和s1-minmax22h_q1 SRM隐写式密码解密功能的子模型13相比),然后选中的表现特征与随机选择不同的载荷特性。为了获得理想的选择特性,适当的T被搜索算法1。实验结果如表所示1和2。可以看出,所提出的特征选择方法几乎保持原来的检测精度,和检测精度高于随机选择的功能。这应该是由于以下两个原因。一方面,强烈相关功能组件是多余的,他们不会影响检测性能。另一方面,费舍尔标准确保保留功能组件是有效的,而不是随机选择。
4.3。性能测试的特征选择方法CC-JRM隐写式密码解密功能
Fridrich等人提出的隐写式密码解密CC-JRM特性是一个典型的丰富模型为JPEG图像隐写术隐写式密码解密功能,可有效检测出常见的JPEG图像隐写术算法,如J-UNIWARD [29日),发行30.],nsF5 [31日]。不同阈值下T,该方法被用来从CC-JRM选择功能组件特性的封面和stegoimages载荷为0.1。表3显示的数量和检测精度选择的功能组件。
从表可以看出3原的检测精度22510 - d CC-JRM隐写式密码解密是53.06%。选择特性的最优检测精度可以达到53.48%,这是略高于原来的功能。与此同时,这些选定的功能组件的数量是4436,也就是只有19.7%的原始功能组件的数量。这表明,该方法可以有效地降低特征维数,同时保持隐写式密码解密的检测精度。
图5显示了检测精度CC-JRM之前和之后的特征选择与有效载荷为0.1。水平轴代表功能组件的数量,和纵轴代表了检测精度。蓝色的“▲”表示检测精度选择最适当的功能。绿色“▼”表示检测准确性的原始特性。它可以引入图,当功能组件的不足,检测精度性能是不可取的,因为一些不选择有效的功能。与此同时,当功能组件保留太多,一些冗余功能组件可能带来甚至是有害的。此外,保留太多的冗余功能组件将增加培训的时间和空间复杂性和分类。和功能组件的数量逐渐趋于原始特征维度,隐写式密码解密的检测精度不会显著提高。
为了测试方法其他载荷下的性能,本文还进行了实验载荷的0.2,0.3,0.4,和0.5,结果如图所示6。
(一)
(b)
(c)
(d)
数据6(一)∼6 (d)的检测精度CC-JRM之前和之后的特征选择与有效载荷为0.2,0.3,0.4和0.5。一样的图5,横轴代表功能组件的数量,纵轴代表检测精度。从数据6 (b)来6 (d),可以看出隐写式密码解密功能的维数可以有效地降低了检测精度并不是显著影响,和检测精度之间的差异之前和之后的选择是在0.4%。在图6(一),可以发现,检测精度甚至在低负载的情况下改善。
本文提出的特征选择方法也与张et al。25和马等。26]。具体结果如图7和8。图中的四个不同的颜色代表不同的特征选择方法的实验结果。三种选择方法的检测精度是没多大区别的原始特性。然而,由该方法所选特征的维数明显低于其他的方法。原因在于,该方法消除了冗余功能组件保持特性密切相关组件,但是其他两个方法选择有效的功能组件和不考虑冗余功能组件之间的关系。另一方面,马英九的方法从整体功能和选择最佳的功能组件最大化保留有益的功能组件的原始特性。因此,尽管马英九的降维方法不如,张宁的方法,该方法的检测性能选择特性略优于他们的马的方法。
4.4。性能测试的特征选择方法SRM隐写式密码解密功能
前一节中已经测试了该方法的有效性在JPEG域。为了探索方法的泛化能力,本节测试这个方法在空间域的有效性。在JPEG域一样,本节集实验组载荷为0.1,0.2,0.3,0.4,和0.5 (bbp),分别和实验结果如图9。
(一)
(b)
(c)
(d)
(e)
在前一节中,数字9(一个)∼9 (e)提供SRM之前和之后的检测精度特征选择载荷为0.1,0.2,0.3,0.4,和0.5,分别。水平轴代表特征数,纵轴代表检测精度。蓝色“▲”表示检测精度最适当的选择后,特点和绿色“▼”表示检测准确性的原始特性。从图可以看出9,数量逐渐增加的特性,检测隐写式密码解密的准确性也会提高。功能数量增加到一定值时,隐写式密码解密的检测精度稳定。实验表明,检测精度之间的选择特性的不同方法和原始的特性是在0.3%以内。此外,所选特征的维数远低于原来的特性(少于50%)。基于上述分析,提出了在空间域方法仍然有效。
此外,该方法之间的比较结果和方法提出的Zhang et al。25和马等。26)大约是相同的如JPEG域。实验结果如图所示10。
可以看出,选择特征的维数的方法选择特性的明显低于其他两种方法。在低载荷的情况下,比较尤为引人注目。
总之,本文提出的特征选择方法可以有效地减少JPEG域特征维度和空间域特征维度。此外,对于低载荷的JPEG图像隐写术,所选的JPEG域特性相比,检测精度有一定的提高与原功能。此外,JPEG域特征的降维大于空间隐写式密码解密的功能。主要原因是JPEG域丰富模型隐写式密码解密功能较强的线性相关性。
5。结论
目前,富人模型隐写式密码解密功能有良好的自适应隐写术的检测结果;然而,富人模型隐写式密码解密功能有缺陷的高维度和缓慢的训练。为了减少培训成本的计算带来的高维模型隐写式密码解密功能丰富,新富阶层模型隐写式密码解密特征选择方法提出了基于功能组件的相关性。实验结果表明,该方法可以有效地降低特征维数的同时保持隐写式密码解密的检测精度。
虽然本文方法考虑到功能组件之间的关系,积极作用的隐写式密码解密的功能组件之间的互补性仍值得进一步研究。在下一步中,我们也会尝试将该方法与深度学习在隐写式密码解密32),甚至扩展到其他领域,如视觉搜索(33]。
数据可用性
封面图片下载本手稿中使用http://agents.fel.cvut.cz/stegodata/。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作是支持部分由中国国家自然科学基金(61772549号、U1736214 U1804263, 62002103, 61872448, 62002387),中原领先科技创新人才项目(没有。214200510019),河南省重点科技项目(没有。202102210165)。