多媒体的发展 1687 - 5699 1687 - 5680 Hindawi 10.1155 / 2017/8492672 8492672 研究文章 健壮的和可逆的音频水印通过修改时域统计特性 http://orcid.org/0000 - 0002 - 3481 - 7057 广州市仕 1 2 1 1 Khedher Akram M z . M。 1 信息科学与技术学院 暨南大学 广州510632 中国 jnu.edu.cn 2 信息安全国家重点实验室 信息工程学院 中国科学院 北京100093年 中国 cas.cn 2017年 27<米onth> 4 2017年 2017年 10<米onth> 01 2017年 31日<米onth> 03 2017年 04<米onth> 04 2017年 27<米onth> 4 2017年 2017年 版权©2017年广州市香等。 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

健壮和可逆水印是一个潜在的技术在许多敏感的应用程序,例如无损音频或医学影像系统。提出一种新颖的健壮的可逆的音频水印方法通过修改时间域的统计特性,这些统计值的直方图是转移数据隐藏。首先,原始音频分为nonoverlapped大小相同的帧。在每一帧,使用三个样本作为一个群体产生一个预测误差和统计特征值计算预测误差的总和的框架。水印比特嵌入到框架通过将直方图的统计特性。水印是可逆的和健壮的常见的信号处理操作。实验结果表明,该方法不仅是可逆的,也取得了令人满意的鲁棒性64 kbps到MP3压缩和加性高斯噪声的35分贝。

中国国家自然科学基金 61272414 信息安全国家重点实验室 2016 - 07年女士
1。介绍

随着互联网技术的快速发展,数字多媒体出版和传播变得越来越方便。然而,数字多媒体的真实性和安全性的一个挑战媒体所有者( 1]。数字水印技术是一种有效的方法来保护数字媒体的版权。可逆水印的数字水印技术用于数据隐藏。可逆水印可以将秘密数据嵌入到宿主媒体和允许提取的原始媒体和机密数据( 2- - - - - - 4]。它是非常有用的在敏感的应用,如医学图像系统中,军事形象,无损音频( 5]。虽然有如此多的可逆水印方法,它们中的大多数都是在无损的环境设计和无法抗拒任何类型的攻击。结果,原始媒体或机密数据不能恢复后,有水印的媒体经历一些变化( 6]。

在某些情况下,如数字媒体的版权保护、嵌入式数据预计将强劲的有损压缩等攻击或加性噪声。为此,研究人员更加关注健壮的可逆水印。健壮的可逆水印是原始媒体和嵌入的数据可以恢复正确有水印的媒体保持不变时,仍然可以提取和嵌入的数据没有错误,即使有水印的媒体经历一些攻击( 7]。直到现在,几个健壮的可逆图像水印方法被提出,它可以分为两组:

盲水印方案:在 7, 8],Vleeschouwer等人提出了一种盲提取方案基于拼凑理论和模- 256使用灰度直方图旋转。对JPEG压缩这工作是健壮的,但有水印的图像有较低的可见水印嵌入过程由于质量原因会导致噪音花白有水印的图像。此外,负载低。处理满头花白的噪音问题,邹等人提出了一个方案通过转移的绝对平均值整数小波变换(IWT)系数选择部分波段( 9),镍等人提出了一个计划通过修改直方图空间域的一个健壮的统计量( 10]。自嵌入过程可能引入错误比特,纠错编码(ECC)已被使用。除此之外,这两个方法遭受不稳定鲁棒性和不完全可逆性( 11]。在[ 12),曾庆红等人增强镍等人的方案通过引入两个阈值和一个新的嵌入机制。这个方法是盲目的和可逆的。令人满意的性能,这两个阈值必须仔细寻找不同的封面图片。

在[ 16],Coltuc Chassery提出了一个通用框架由多个水印健壮的可逆水印。第一水印嵌入的封面图片,然后一个可逆水印鲁棒性水印方法方法采用嵌入的信息(用于恢复原始封面图片)到健壮有水印的图像。假设<我nline-formula> 和<我nline-formula> 1 原始图像和健壮有水印的嵌入水印后图像吗<我nline-formula> w ,分别。嵌入失真,<我nline-formula> d = - - - - - - 1 压缩,与可逆水印嵌入鲁棒水印图像的方法。在接收端,如果没有攻击,鲁棒水印图像<我nline-formula> 1 和的区别<我nline-formula> d 可以提取自嵌入过程是可逆的。那么原始图像<我nline-formula> 可以恢复<我nline-formula> = d + 1 。此外,可以提取出水印。如果有水印的图像经过JPEG压缩操作,鲁棒水印仍然可以提取。这个框架很有教育意义,达到更高的载荷对JPEG压缩、鲁棒性好。

在[ 17),一个健壮的可逆的音频方法提出了基于扩频和振幅扩张。一个健壮的有效载荷是嵌入式起初使用直接序列扩展频谱调制,与序列在时间和频率振幅扩张的决定修改整数离散余弦变换(MDCT)系数。可逆的载荷是嵌入到光阑的幅度直方图由于整数多层螺旋ct的振幅扩张系数恢复主机音频。该方法实现鲁棒性对一些信号处理如MP3压缩和加性噪声,如果有水印的音频仍然完好无损,宿主音频可以完全恢复。

在本文中,我们提出一个新颖的健壮和可逆的音频水印方案基于统计特征和时域直方图变化。通过将时域直方图的统计特性,该算法取得了较好的鲁棒性和可逆性在同一时间。

剩下的纸是组织如下。介绍了基础工作 2。该水印算法中描述部分 3。实验结果发表在部分 4。部分 5本文总结道。

2。算法的原理

本节将介绍的基础工程提出了健壮的可逆数字音频水印方案。首先,一个健壮的介绍了时域统计特性;那么如何修改嵌入水印位的统计特性是简要描述。

2.1。强大的统计功能

考虑一个离散数字音频信号<我nline-formula> X ;主机信号首先分为nonoverlapped大小相同的帧。我们把<我nline-formula> N 样品每帧;例如,<我nline-formula> N 样品作为框架和三个样品组如图 1。样本组(<我nline-formula> x l , x 和<我nline-formula> x r ),中间的样本的预测价值<我nline-formula> x ^ 计算通过使用两个直接的样品吗 (1) x ^ = x l + x r 2 , 在哪里<我nline-formula> x 意味着舍入的元素<我nline-formula> x 到最近的整数对无穷。的预测误差<我nline-formula> x ^ (2) e = x - - - - - - x ^ 由于样品在一群往往高度相关,预测误差<我nline-formula> e 预计将非常接近于零。为一个框架<我nline-formula> N 样品,<我nline-formula> N / 3 预测计算错误。预测误差的总和在一个框架,用<我nline-formula> E ,称为统计功能。一帧的统计特性计算 (3) E = = 1 N / 3 e , 在哪里<我nline-formula> e 的预测误差<我nline-formula> 集团的框架。该算法的基本思想是基于这个统计属性。

2.2。水印的统计特性

每一帧,一个水印是嵌入通过转移价值的统计特性。改变操作是通过修改样品在一个框架。采取<我talic> 轨道1(从网站下载( 18)为例,图 2显示的分布<我nline-formula> E 值通过使用300个样本作为一个框架和三个样本作为一个群体。规则修改数据值被称为直方图变化法。首先,我们扫描所有帧,找出最大的绝对的<我nline-formula> E 值,用<我nline-formula> E 一个 x 。然后,一个阈值<我nline-formula> T 将一个正整数比吗<我nline-formula> E 一个 x 。因此,所有<我nline-formula> E 值范围内<我nline-formula> ( - - - - - - T , T ] 。例如,从图 2我们可以得到,<我nline-formula> E 一个 x 是446,所以阈值<我nline-formula> T 可以是一个整数,如500。水印的规则是保持内的统计特性<我nline-formula> ( - - - - - - T , T ] 如果水印位为“0”,而统计特性是转向从0变化量<我nline-formula> T + G 如果水印比特“1。“为了实现更强的鲁棒性,参数<我nline-formula> G 是一组阈值通常比吗<我nline-formula> T 。减少嵌入失真,如果嵌入的水印比特“1”,属于原始的统计特性<我nline-formula> ( 0 , T ) ,统计特性转移到该地区<我nline-formula> ( T + G , 2 T + G ] ;如果嵌入的水印比特“1”,属于原始的统计特性<我nline-formula> ( - - - - - - T , 0 ) ,统计特性转移到该地区<我nline-formula> ( - - - - - - 2 T - - - - - - G , - - - - - - T - - - - - - G ] 。在这样一种方式,bit-0地区和第1区域由强劲的地区<我nline-formula> ( T , T + G ) 和<我nline-formula> ( - - - - - - T - - - - - - G , - - - - - - T ) 。例如,图 3显示的分布<我nline-formula> E 通过使用剪辑值后嵌入水印<我talic> 轨道1

修改规则如下。

如果嵌入一些“0”,保持不变。如果嵌入式比特“1”,框架修改的样品 (4) y k = x k + β , 如果 0 E k < T , 国防部 , 3 = 2 x k - - - - - - β , 如果 - - - - - - T < E k < 0 , 国防部 , 3 = 2 x k , 否则 , 在哪里<我nline-formula> x k 是<我nline-formula> th的样本<我nline-formula> k 框架。该指数<我nline-formula> 是在<我nline-formula> ( 1 , 年代 ] 和<我nline-formula> 年代 是样品的数量在一个框架。整数值<我nline-formula> β 转移的数量的样本, (5) β = T + G 年代 / 3

在接收端,如果有水印的音频仍然完好无损,可以提取水印比特 (6) w k = 0 , 如果 E k - - - - - - T , T 1 , 否则 , 在哪里<我nline-formula> w k 是隐藏的<我nline-formula> k th。原始音频可以恢复 (7) x k = y k - - - - - - β , 如果 E k T + G , 2 T + G , 国防部 , 3 = 2 y k + β , 如果 E k - - - - - - 2 T - - - - - - G , - - - - - - T - - - - - - G , 国防部 , 3 = 2 y k , 否则

2.3。防止溢出/下溢

对于一个<我nline-formula> 16 位数字音频、许可范围的样本值<我nline-formula> ( - - - - - - 2 15 , 2 15 ] 。水印嵌入将修改的样本值的值<我nline-formula> β ,所以如果不发生溢出或下溢的原始样本值属于<我nline-formula> ( - - - - - - 2 15 + β , 2 15 - - - - - - β ] 。事实上,作为值<我nline-formula> β 很小,大多数正常的音频的原始样本值属于<我nline-formula> ( - - - - - - 2 15 + β , 2 15 - - - - - - β ] 。因此,在该方法中,在大多数情况下没有溢出或下溢的。如果音频不能满足这个条件,我们可以记录位置和修改样本值的范围<我nline-formula> ( - - - - - - 2 15 + β , 2 15 - - - - - - β ] ;然后可以保存位置信息和嵌入到音频。

3所示。算法

嵌入和提取过程详细介绍如下。

3.1。水印嵌入

4显示了该水印嵌入过程。水印嵌入与以下五个步骤。

步骤1。

把原始音频<我nline-formula> X 为不重叠的帧大小<我nline-formula> 年代 样本。

步骤2。

计算帧的统计特性(<我nline-formula> E 值)指的是( 1)- ( 3)。

步骤3。

设置阈值<我nline-formula> T 和<我nline-formula> G (<我nline-formula> T > E 一个 x ,通常<我nline-formula> G > T )。

步骤4。

如果水印位为“0”,没有什么改变。如果是“1”,把统计特征值变化量<我nline-formula> T + G 嵌入的水印比特通过修改样品架与价值<我nline-formula> β 指的是( 4)。

第5步。

结合帧有水印的音频。

3.2。水印的提取

如果有水印的音频通过一些攻击(如MP3压缩、加性噪声、重采样,或requantization),水印仍然可以检测到。为了提高水印提取的准确性,采用三种提取方法和多数表决系统识别提取的水印值通过计算扭曲的统计特性<我nline-formula> E

(我)提取1。重新定义bit-0地区<我nline-formula> ( - - - - - - T - - - - - - G / 2 , T + G / 2 ] 和水印提取 (8) w 1 = 0 , 如果 E - - - - - - T - - - - - - G / 2 , T + G / 2 1 , 否则

(2)提取2。重新定义bit-0地区<我nline-formula> ( - - - - - - T - - - - - - G / 3 , T + G / 3 ] 和水印提取 (9) w 2 = 0 , 如果 E - - - - - - T - - - - - - G / 3 , T + G / 3 1 , 否则

(3)提取3。<我nline-formula> k ——介绍了聚类算法提取碎片。图 5显示的分布<我nline-formula> E 值MP3压缩后,可以提取水印 (10) w 3 = 0 , 如果 E c l 一个 年代 年代 2 1 , 如果 E 类1和类 3

多数表决系统的工作原理 (11) w = w 1 , 如果 w 1 = w 2 , w 1 = w 3 w 1 , 如果 w 1 = w 2 , w 1 w 3 w 2 , 如果 w 1 w 2 , w 2 = w 3 w 3 , 如果 w 1 w 2 , w 1 = w 3

最终,三种提取方法,多数投票系统采用提取水印。图 6显示了该水印提取过程。如果有水印的音频仍然保持不变,可以正确地提取水印和原始音频可以恢复为以下步骤。

步骤1。

把有水印的音频<我nline-formula> X w 为不重叠的帧大小<我nline-formula> 年代 样本。

步骤2。

计算帧的统计特性(<我nline-formula> E 值)指的是( 1)- ( 3)。

步骤3。

与三种提取方法提取水印和识别水印与多数表决系统指的是( 8)- ( 11)。

步骤4。

可以恢复原来的音频修改框架的样本值<我nline-formula> β 指的是( 7)。

第5步。

把原始音频帧。

如果有水印的音频经过一些攻击,原始音频不能完全恢复,所以我们关注水印提取,提取水印如下。

步骤1。

把有水印的音频<我nline-formula> X w 为不重叠的帧大小<我nline-formula> 年代 样本。

步骤2。

计算统计特征值的帧<我nline-formula> E 指的是( 1)- ( 3)。

步骤3。

与三种提取方法提取水印和识别水印与多数表决系统指的是( 8)- ( 11)。

4所示。实验结果

在本节中,7 WAV音频文件44.1 KHz的采样率和16位/样本(轨道1、2、3、4、5、6和7 ( 18)作为例子剪辑对算法的性能进行评估。有效载荷的方法只取决于一个框架的长度<我nline-formula> 年代 ;离散的数字音频信号<我nline-formula> X 的长度<我nline-formula> ,纯载荷可以通过计算 (12) C = 年代

在实验中,水印是一个伪随机序列长度为1000位。首先分析了细微的标准在不同的信噪比阈值和不同的样本数量每帧。然后,健壮性测试对MP3压缩、加性噪声(AWGN),重采样(44.1 16 - 44.1 kHz),和requantization报告(16-8-16位)通过使用软件CoolEditPro v2.1。

4.1。无法感知测试

细微的嵌入失真。方案,失真是由于样品根据阈值的变化量<我nline-formula> T ,<我nline-formula> G 和一个框架的长度<我nline-formula> 年代 。自<我nline-formula> T 设置,我们只研究的影响<我nline-formula> G 和<我nline-formula> 年代 在信噪比。

7情节和信噪比阈值之间的关系<我nline-formula> G 对于不同的片段在同一阈值<我nline-formula> T 和<我nline-formula> 年代 。从这个图我们可以得出这样的结论:增加<我nline-formula> G ,信噪比的值下降。原因是更大的<我nline-formula> G 使用更大的改变量,所以造成较大的嵌入失真。因此,信噪比价值下降。

8情节的信噪比和长度之间的关系框架<我nline-formula> 年代 对于不同的片段在同一阈值<我nline-formula> T 和<我nline-formula> G 。从这个图我们可以看到大<我nline-formula> 年代 是,高信噪比的值。的原因是增加的<我nline-formula> 年代 ,每一个样本的转移数量下降,所以信噪比的值上升是因为嵌入失真减少。因此,帧长度<我nline-formula> 年代 将会直接影响最大嵌入容量和信噪比的值,最大嵌入容量更高更待何时<我nline-formula> 年代 根据(小 12),和信噪比的值更高<我nline-formula> 年代 根据图更大 8。考虑最大嵌入容量和信噪比之间的平衡值,我们发现的价值<我nline-formula> 年代 在300到600的范围通常可以达到令人满意的效果后一组实验。

4.2。健壮性测试

测试方案的鲁棒性,一组实验一直跟踪1 - 7。表 1显示了结果,其中RP意味着重新取样(44.1 16 - 44.1 kHz)操作中移动而意味着requantization(16-8-16位)操作。从这个表我们可以观察到,所有的片段可以实现鲁棒性对MP3压缩在64 Kbps。为<我talic> 轨道1,可以正确地提取水印比特的MP3压缩下48 Kbps。针对加性噪声的鲁棒性也令人满意。即使有25分贝的噪声强度,误码率(比特误码率)值除了不到10%<我talic> 轨道1。除此之外,对重采样的水印鲁棒性和requantization操作是完美的,没有错误和隐藏的比特可以恢复。

如图 3,该方法的鲁棒性是起源于强劲的地区。取决于阈值的区域<我nline-formula> G 。更大的<我nline-formula> G 强劲的区域越大,和较强的鲁棒性。图 9支持的结论。图 9显示了比特误码率(BER)在不同的阈值<我nline-formula> G 同样的音频与相同的阈值<我nline-formula> T 。低的误码率意味着更强的鲁棒性。我们可以发现作为阈值<我nline-formula> G 增加时,误码率下降,以及鲁棒性上涨。

取<我talic> 轨道1为例夹;图 10显示了提取的水印的比特误码率与不同的阈值<我nline-formula> G 对添加剂的声音是一样的<我nline-formula> T 和<我nline-formula> 年代 (<我nline-formula> T = 500年 , 年代 = 300年 )。我们可以看到,大<我nline-formula> G 误比特率越小,和更好的鲁棒性。作为阈值<我nline-formula> G 增加时,鲁棒性变得更强。在应用程序中,我们可以调整参数<我nline-formula> G 实现理想的鲁棒性。另一方面,增加了<我nline-formula> G ,信噪比的值下降。考虑信噪比价值和鲁棒性之间的平衡,我们发现的价值<我nline-formula> G 在3000年至5000年,通常可以达到令人满意的效果后一组实验。

评估帧长度的影响<我nline-formula> 年代 在鲁棒性性能,一直在拍摄一组实验<我talic> 轨道1,轨道6,和<我talic> 跟踪7。表 2列出了结果。我们可以观察到,同样的音频相同<我nline-formula> T 和<我nline-formula> G ,如<我nline-formula> T = 500年 和<我nline-formula> G = 3000年 为<我talic> 轨道1,因为<我nline-formula> 年代 增加时,鲁棒性对MP3压缩将加强,但是<我talic> 跟踪6和跟踪7,因为<我nline-formula> 年代 增加,对MP3压缩的鲁棒性下降,因此帧长度的影响<我nline-formula> 年代 对MP3压缩的鲁棒性是不稳定的。对AWGN几乎没有影响。

公平的比较的方法( 17),我们使用相同的主机信号(追踪32,65、66和69年)从声音质量评估材料下载(SQAM)集合 19]。表 3显示了对MP3压缩和加性噪声鲁棒性测试结果(AWGN)操作。我们可以观察到的方法( 17)可以携带216位和抵制MP3压缩为128 Kbps,该方法可以抵御MP3压缩与1000位嵌入式64 Kbps。此外,在我们的方法的误码率的情况下35 dB小于的方法( 17]。换句话说,该方法可以提供较大的嵌入容量和获得更强的鲁棒性与MP3压缩和AWGN攻击。无法感知评估使用ODG标准。ODG值越接近于0,无法感知就越好。表它指出,该方法的细微除了剪辑要好<我talic> 跟踪35和<我talic> 跟踪66。原因在于,<我nline-formula> E 一个 x 跟踪35和跟踪66更大的值。因此,阈值<我nline-formula> T 和<我nline-formula> G 也更大更嵌入失真将导致。

5。结论

在本文中,我们提出了一个健壮的和可逆的音频水印方法通过将在时域直方图的统计特性值。统计特性的总和计算预测误差在一个框架。音频剪辑以来大量的样品和每一帧可以持有足够的元素,统计特性是健壮的那些常见的信号处理操作。考虑到分布的统计特征值可能会扭曲在某种程度上,三种提取方法和水印检测的多数投票系统的设计。实验结果表明,成千上万的碎片可以可逆地嵌入的水印比特可以抵御MP3压缩64 kbps,添加剂35分贝的噪音。与现有的优秀方法相比,该方法更能嵌入水印比特,实现更强的鲁棒性。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项工作是由国家自然科学基金委(不支持。61272414)和国家重点实验室开放研究基金的信息安全(没有。2016 - ms - 07)。