健壮的和可逆的音频水印通过修改时域统计特性

文摘

健壮和可逆水印是一个潜在的技术在许多敏感的应用程序,例如无损音频或医学影像系统。提出一种新颖的健壮的可逆的音频水印方法通过修改时间域的统计特性,这些统计值的直方图是转移数据隐藏。首先,原始音频分为nonoverlapped大小相同的帧。在每一帧,使用三个样本作为一个群体产生一个预测误差和统计特征值计算预测误差的总和的框架。水印比特嵌入到框架通过将直方图的统计特性。水印是可逆的和健壮的常见的信号处理操作。实验结果表明,该方法不仅是可逆的,也取得了令人满意的鲁棒性64 kbps到MP3压缩和加性高斯噪声的35分贝。

1。介绍

随着互联网技术的快速发展,数字多媒体出版和传播变得越来越方便。然而,数字多媒体的真实性和安全性的一个挑战媒体所有者(1]。数字水印技术是一种有效的方法来保护数字媒体的版权。可逆水印的数字水印技术用于数据隐藏。可逆水印可以将秘密数据嵌入到宿主媒体和允许提取的原始媒体和机密数据(2- - - - - -4]。它是非常有用的在敏感的应用,如医学图像系统中,军事形象,无损音频(5]。虽然有如此多的可逆水印方法,它们中的大多数都是在无损的环境设计和无法抗拒任何类型的攻击。结果,原始媒体或机密数据不能恢复后,有水印的媒体经历一些变化(6]。

在某些情况下,如数字媒体的版权保护、嵌入式数据预计将强劲的有损压缩等攻击或加性噪声。为此,研究人员更加关注健壮的可逆水印。健壮的可逆水印是原始媒体和嵌入的数据可以恢复正确有水印的媒体保持不变时,仍然可以提取和嵌入的数据没有错误,即使有水印的媒体经历一些攻击(7]。直到现在,几个健壮的可逆图像水印方法被提出,它可以分为两组:(我)盲水印方案:在7,8],Vleeschouwer等人提出了一种盲提取方案基于拼凑理论和模- 256使用灰度直方图旋转。对JPEG压缩这工作是健壮的,但有水印的图像有较低的可见水印嵌入过程由于质量原因会导致噪音花白有水印的图像。此外,负载低。处理满头花白的噪音问题,邹等人提出了一个方案通过转移的绝对平均值整数小波变换(IWT)系数选择部分波段(9),镍等人提出了一个计划通过修改直方图空间域的一个健壮的统计量(10]。自嵌入过程可能引入错误比特,纠错编码(ECC)已被使用。除此之外,这两个方法遭受不稳定鲁棒性和不完全可逆性(11]。在[12),曾庆红等人增强镍等人的方案通过引入两个阈值和一个新的嵌入机制。这个方法是盲目的和可逆的。令人满意的性能,这两个阈值必须仔细寻找不同的封面图片。(2)在[Nonblind水印方案:13),基于小波域的nonblind计划统计直方图变化量和集群(WSQH-SC)提出。起初一个像素调整提出了避免溢出和下溢,和一个位置地图是用来记录改变像素。这种方法取得了良好的鲁棒性与JPEG,如JPEG2000,和加性高斯噪声,但不是盲目的因为改变像素的位置需要被保存的信息并传送给接收者一起为了恢复原始图像。在[14],Slantlet变换(SLT)应用于图像块,修改HL的平均值和LH子带系数中嵌入水印比特,和SLT的第二阶段变换应用于LL1部分波段,嵌入一个水印在HL2 LH2子。因为系数和平均值与更多的小数部分地方,意味着信息作为边信息发送到接收端恢复的原来的封面图片。为了解决nonblind提取问题[14作者在[]15]IWT用于图像和随机选择10系数块中的所有16个系数来计算物体的振幅的意思是,这意味着信息可以嵌入到图像本身的盲提取。

在[16],Coltuc Chassery提出了一个通用框架由多个水印健壮的可逆水印。第一水印嵌入的封面图片,然后一个可逆水印鲁棒性水印方法方法采用嵌入的信息(用于恢复原始封面图片)到健壮有水印的图像。假设和原始图像和健壮有水印的嵌入水印后图像吗,分别。嵌入失真,压缩,与可逆水印嵌入鲁棒水印图像的方法。在接收端,如果没有攻击,鲁棒水印图像和的区别可以提取自嵌入过程是可逆的。那么原始图像可以恢复。此外,可以提取出水印。如果有水印的图像经过JPEG压缩操作,鲁棒水印仍然可以提取。这个框架很有教育意义,达到更高的载荷对JPEG压缩、鲁棒性好。

在[17),一个健壮的可逆的音频方法提出了基于扩频和振幅扩张。一个健壮的有效载荷是嵌入式起初使用直接序列扩展频谱调制,与序列在时间和频率振幅扩张的决定修改整数离散余弦变换(MDCT)系数。可逆的载荷是嵌入到光阑的幅度直方图由于整数多层螺旋ct的振幅扩张系数恢复主机音频。该方法实现鲁棒性对一些信号处理如MP3压缩和加性噪声,如果有水印的音频仍然完好无损,宿主音频可以完全恢复。

在本文中,我们提出一个新颖的健壮和可逆的音频水印方案基于统计特征和时域直方图变化。通过将时域直方图的统计特性,该算法取得了较好的鲁棒性和可逆性在同一时间。

剩下的纸是组织如下。介绍了基础工作2。该水印算法中描述部分3。实验结果发表在部分4。部分5本文总结道。

2。算法的原理

本节将介绍的基础工程提出了健壮的可逆数字音频水印方案。首先,一个健壮的介绍了时域统计特性;那么如何修改嵌入水印位的统计特性是简要描述。

2.1。强大的统计功能

考虑一个离散数字音频信号;主机信号首先分为nonoverlapped大小相同的帧。我们把样品每帧;例如,样品作为框架和三个样品组如图1。样本组(和),中间的样本的预测价值计算通过使用两个直接的样品吗在哪里意味着舍入的元素到最近的整数对无穷。的预测误差是由于样品在一群往往高度相关,预测误差预计将非常接近于零。为一个框架样品,预测计算错误。预测误差的总和在一个框架,用,称为统计功能。一帧的统计特性计算在哪里的预测误差集团的框架。该算法的基本思想是基于这个统计属性。

2.2。水印的统计特性

每一帧,一个水印是嵌入通过转移价值的统计特性。改变操作是通过修改样品在一个框架。采取轨道1(从网站下载(18)为例,图2显示的分布值通过使用300个样本作为一个框架和三个样本作为一个群体。规则修改数据值被称为直方图变化法。首先,我们扫描所有帧,找出最大的绝对的值,用。然后,一个阈值将一个正整数比吗。因此,所有值范围内。例如,从图2我们可以得到,是446,所以阈值可以是一个整数,如500。水印的规则是保持内的统计特性如果水印位为“0”,而统计特性是转向从0变化量如果水印比特“1。“为了实现更强的鲁棒性,参数是一组阈值通常比吗。减少嵌入失真,如果嵌入的水印比特“1”,属于原始的统计特性,统计特性转移到该地区;如果嵌入的水印比特“1”,属于原始的统计特性,统计特性转移到该地区。在这样一种方式,bit-0地区和第1区域由强劲的地区和。例如,图3显示的分布通过使用剪辑值后嵌入水印轨道1。

修改规则如下。

如果嵌入一些“0”,保持不变。如果嵌入式比特“1”,框架修改的样品在哪里是th的样本框架。该指数是在和是样品的数量在一个框架。整数值转移的数量的样本,

在接收端,如果有水印的音频仍然完好无损,可以提取水印比特在哪里是隐藏的th。原始音频可以恢复

2.3。防止溢出/下溢

对于一个位数字音频、许可范围的样本值。水印嵌入将修改的样本值的值,所以如果不发生溢出或下溢的原始样本值属于。事实上,作为值很小,大多数正常的音频的原始样本值属于。因此,在该方法中,在大多数情况下没有溢出或下溢的。如果音频不能满足这个条件,我们可以记录位置和修改样本值的范围;然后可以保存位置信息和嵌入到音频。

3所示。算法

嵌入和提取过程详细介绍如下。

3.1。水印嵌入

图4显示了该水印嵌入过程。水印嵌入与以下五个步骤。

步骤1。把原始音频为不重叠的帧大小样本。

步骤2。计算帧的统计特性(值)指的是(1)- (3)。

步骤3。设置阈值和(,通常)。

步骤4。如果水印位为“0”,没有什么改变。如果是“1”,把统计特征值变化量嵌入的水印比特通过修改样品架与价值指的是(4)。

第5步。结合帧有水印的音频。

3.2。水印的提取

如果有水印的音频通过一些攻击(如MP3压缩、加性噪声、重采样,或requantization),水印仍然可以检测到。为了提高水印提取的准确性,采用三种提取方法和多数表决系统识别提取的水印值通过计算扭曲的统计特性。

(我)提取1。重新定义bit-0地区和水印提取

(2)提取2。重新定义bit-0地区和水印提取

(3)提取3。——介绍了聚类算法提取碎片。图5显示的分布值MP3压缩后,可以提取水印

多数表决系统的工作原理

最终,三种提取方法,多数投票系统采用提取水印。图6显示了该水印提取过程。如果有水印的音频仍然保持不变,可以正确地提取水印和原始音频可以恢复为以下步骤。

步骤1。把有水印的音频为不重叠的帧大小样本。

步骤2。计算帧的统计特性(值)指的是(1)- (3)。

步骤3。与三种提取方法提取水印和识别水印与多数表决系统指的是(8)- (11)。

步骤4。可以恢复原来的音频修改框架的样本值指的是(7)。

第5步。把原始音频帧。

如果有水印的音频经过一些攻击,原始音频不能完全恢复,所以我们关注水印提取,提取水印如下。

步骤1。把有水印的音频为不重叠的帧大小样本。

步骤2。计算统计特征值的帧指的是(1)- (3)。

步骤3。与三种提取方法提取水印和识别水印与多数表决系统指的是(8)- (11)。

4所示。实验结果

在本节中,7 WAV音频文件44.1 KHz的采样率和16位/样本(轨道1、2、3、4、5、6和7 (18)作为例子剪辑对算法的性能进行评估。有效载荷的方法只取决于一个框架的长度;离散的数字音频信号的长度,纯载荷可以通过计算

在实验中,水印是一个伪随机序列长度为1000位。首先分析了细微的标准在不同的信噪比阈值和不同的样本数量每帧。然后,健壮性测试对MP3压缩、加性噪声(AWGN),重采样(44.1 16 - 44.1 kHz),和requantization报告(16-8-16位)通过使用软件CoolEditPro v2.1。

4.1。无法感知测试

细微的嵌入失真。方案,失真是由于样品根据阈值的变化量,和一个框架的长度。自设置,我们只研究的影响和在信噪比。

图7情节和信噪比阈值之间的关系对于不同的片段在同一阈值和。从这个图我们可以得出这样的结论:增加,信噪比的值下降。原因是更大的使用更大的改变量,所以造成较大的嵌入失真。因此,信噪比价值下降。

图8情节的信噪比和长度之间的关系框架对于不同的片段在同一阈值和。从这个图我们可以看到大是,高信噪比的值。的原因是增加的,每一个样本的转移数量下降,所以信噪比的值上升是因为嵌入失真减少。因此,帧长度将会直接影响最大嵌入容量和信噪比的值,最大嵌入容量更高更待何时根据(小12),和信噪比的值更高根据图更大8。考虑最大嵌入容量和信噪比之间的平衡值,我们发现的价值在300到600的范围通常可以达到令人满意的效果后一组实验。

4.2。健壮性测试

测试方案的鲁棒性,一组实验一直跟踪1 - 7。表1显示了结果,其中RP意味着重新取样(44.1 16 - 44.1 kHz)操作中移动而意味着requantization(16-8-16位)操作。从这个表我们可以观察到,所有的片段可以实现鲁棒性对MP3压缩在64 Kbps。为轨道1,可以正确地提取水印比特的MP3压缩下48 Kbps。针对加性噪声的鲁棒性也令人满意。即使有25分贝的噪声强度,误码率(比特误码率)值除了不到10%轨道1。除此之外,对重采样的水印鲁棒性和requantization操作是完美的,没有错误和隐藏的比特可以恢复。


音频				信噪比	MP3 (Kbps)	AWGN (35 dB)	AWGN (30 dB)	AWGN (25 dB)	RP	中移动

轨道1	420年	500年	3000年	54.74	48	2/1000	77/1000	251/1000	0/1000	0/1000
轨道2	600年	6200年	7000年	47.98	64年	0/1000	0/1000	0/1000	0/1000	0/1000
跟踪3	510年	600年	3000年	54.09	48	0/1000	0/1000	44/1000	0/1000	0/1000
跟踪4	300年	9900年	10000年	38.99	64年	0/1000	0/1000	0/1000	0/1000	0/1000
跟踪5	300年	200年	3000年	56.18	48	0/1000	25/1000	77/1000	0/1000	0/1000
跟踪6	600年	200年	3000年	49.5	48	0/1000	0/1000	46/1000	0/1000	0/1000
跟踪7	300年	1600年	4000年	43.78	48	0/1000	0/1000	0/1000	0/1000	0/1000

如图3,该方法的鲁棒性是起源于强劲的地区。取决于阈值的区域。更大的强劲的区域越大,和较强的鲁棒性。图9支持的结论。图9显示了比特误码率(BER)在不同的阈值同样的音频与相同的阈值。低的误码率意味着更强的鲁棒性。我们可以发现作为阈值增加时,误码率下降,以及鲁棒性上涨。

取轨道1为例夹;图10显示了提取的水印的比特误码率与不同的阈值对添加剂的声音是一样的和()。我们可以看到,大误比特率越小,和更好的鲁棒性。作为阈值增加时,鲁棒性变得更强。在应用程序中,我们可以调整参数实现理想的鲁棒性。另一方面,增加了,信噪比的值下降。考虑信噪比价值和鲁棒性之间的平衡,我们发现的价值在3000年至5000年,通常可以达到令人满意的效果后一组实验。

评估帧长度的影响在鲁棒性性能,一直在拍摄一组实验轨道1,轨道6,和跟踪7。表2列出了结果。我们可以观察到,同样的音频相同和,如和为轨道1,因为增加时,鲁棒性对MP3压缩将加强,但是跟踪6和跟踪7,因为增加,对MP3压缩的鲁棒性下降,因此帧长度的影响对MP3压缩的鲁棒性是不稳定的。对AWGN几乎没有影响。


跟踪	年代	T	G	MP3	情况下	情况下	情况下
跟踪	年代	T	G	(Kbps)	(35 dB)	(30 dB)	(25 dB)

轨道1	300年	500年	3000年	80年	9/1000	90/1000	299/1000
轨道1	420年	500年	3000年	56	12/1000	171/1000	320/1000
轨道1	510年	550年	3000年	80年	28/1000	171/1000	158/1000
轨道1	600年	550年	3000年	48	28/1000	221/1000	390/1000
跟踪6	300年	200年	3000年	48	0/1000	0/1000	3/1000
跟踪6	420年	200年	3000年	56	28/1000	0/1000	23/1000
跟踪7	300年	200年	4000年	48	0/1000	0/1000	0/1000
跟踪7	420年	200年	4000年	56	0/1000	0/1000	0/1000

公平的比较的方法(17),我们使用相同的主机信号(追踪32,65、66和69年)从声音质量评估材料下载(SQAM)集合19]。表3显示了对MP3压缩和加性噪声鲁棒性测试结果(AWGN)操作。我们可以观察到的方法(17)可以携带216位和抵制MP3压缩为128 Kbps,该方法可以抵御MP3压缩与1000位嵌入式64 Kbps。此外,在我们的方法的误码率的情况下35 dB小于的方法(17]。换句话说,该方法可以提供较大的嵌入容量和获得更强的鲁棒性与MP3压缩和AWGN攻击。无法感知评估使用ODG标准。ODG值越接近于0,无法感知就越好。表它指出,该方法的细微除了剪辑要好跟踪35和跟踪66。原因在于,跟踪35和跟踪66更大的值。因此,阈值和也更大更嵌入失真将导致。

跟踪

方法(17]

该方法

有效载荷

ODG

MP3

情况下

有效载荷

ODG

MP3

情况下

(位)

(128 Kbps)

(36分贝)

(位)

(80 Kbps)

(64 Kbps)

(36分贝)

追踪32

216年

−2.45

150年

1500年

3000年

1000年

−1.37

0.2%

跟踪35

216年

−1.31

12%

150年

3500年

5000年

1000年

−1.58

0.8%

跟踪65

216年

−1.21

150年

30.

2000年

1000年

−0.23

0.1%

1.2%

跟踪66

216年

−0.24

96年

6000年

1000年

−1.05

0.3%

1.2%

跟踪69

216年

−0.31

300年

400年

2000年

1000年

−0.23

5。结论

在本文中,我们提出了一个健壮的和可逆的音频水印方法通过将在时域直方图的统计特性值。统计特性的总和计算预测误差在一个框架。音频剪辑以来大量的样品和每一帧可以持有足够的元素,统计特性是健壮的那些常见的信号处理操作。考虑到分布的统计特征值可能会扭曲在某种程度上,三种提取方法和水印检测的多数投票系统的设计。实验结果表明,成千上万的碎片可以可逆地嵌入的水印比特可以抵御MP3压缩64 kbps,添加剂35分贝的噪音。与现有的优秀方法相比,该方法更能嵌入水印比特,实现更强的鲁棒性。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项工作是由国家自然科学基金委(不支持。61272414)和国家重点实验室开放研究基金的信息安全(没有。2016 - ms - 07)。

引用

y, Natgunanathan,郭,w•周和s . Nahavandi”Patchwork-based音频水印方法鲁棒de-synchronization攻击,”IEEE音频、语音和语言处理,22卷,不。9日,第1423 - 1413页,2014年。视图:出版商的网站|谷歌学术搜索
j . Fridrich m . Goljan, r·杜“无损数据embedding-new范式在数字水印,”EURASIP在信号处理的发展》杂志上,卷2002,不。2、185 - 196年,2002页。视图:出版商的网站|谷歌学术搜索
y史,z倪,d .邹,c .梁和g .宣“无损数据隐藏:基础、算法和应用程序”继续IEEE国际研讨会的电路和系统,2卷,第336 - 313页,2004年。视图:谷歌学术搜索
李,c, d . Yoo和t .石灰,“基于integer-to-integer可逆水印图像小波变换”,IEEE取证和安全信息,卷2,不。3、321 - 330年,2010页。视图:谷歌学术搜索
x李、杨b和t .曾“高效的可逆水印基于自适应预测误差扩展和像素的选择,”IEEE图像处理,20卷,不。12日,第3533 - 3524页,2000年。视图:谷歌学术搜索
z倪、y .问:施n .安萨里w·苏问:太阳,和林x,“健壮的无损图像数据隐藏,”继续IEEE国际会议的多媒体和世博会(ICME ' 2004),3卷,页2199 - 2202,台北,台湾,2004年6月。视图:出版商的网站|谷歌学术搜索
c . De Vleeschouwer j . Delaigle, b . Macq“可逆水印,环形直方图的解释”继续IEEE 4日研讨会的多媒体信号处理戛纳,页345 - 350年,法国,2001年。视图:出版商的网站|谷歌学术搜索
c . De Vleeschouwer j . f . Delaigle, b . Macq”循环解释双射变换的无损水印对媒体资产管理”IEEE多媒体,5卷,不。1,第105 - 97页,2003。视图:出版商的网站|谷歌学术搜索
d .邹y史,z倪,和w·苏,“提高无损数字水印方案基于整数小波变换,“IEEE电路和系统视频技术,16卷,不。10日,1294 - 1300年,2006页。视图:出版商的网站|谷歌学术搜索
z倪、y .问:施n .安萨里w·苏问:太阳,和林x,“健壮的无损图像数据隐藏设计用于提高图像认证,“IEEE电路和系统视频技术,18卷,不。4、890 - 896年,2008页。视图:谷歌学术搜索
l .一个x高,c·邓,f,“强劲的无损数据隐藏:分析和评价”点火发动机的高性能计算和模拟国际会议上手持电脑”(10)2010年7月,页512 - 516。视图:出版商的网站|谷歌学术搜索
X.-T。曾,L.-D。萍,X.-Z。锅,“无损的健壮的数据隐藏方案,“模式识别,43卷,不。4、1656 - 1667年,2010页。视图:出版商的网站|谷歌学术搜索
l .一个x高,x, d . t c·邓和j·李,“健壮的可逆水印通过聚类和增强pixel-wise掩蔽,”IEEE图像处理,21卷,不。8,3598 - 3611年,2012页。视图:出版商的网站|谷歌学术搜索|MathSciNet
r . Thabit和b·e·邱”能力改进的健壮的无损图像水印,”专业图像处理,8卷,不。11日,第670 - 662页,2014年。视图:出版商的网站|谷歌学术搜索
香和y王”,通过修改和记录iwt意味着免于扭曲健壮的可逆水印的图像块,”进行的第14届国际研讨会(IWDW 15)2015年10月,东京,日本,。视图:谷歌学术搜索
d . Coltuc和j . Chassery”免于扭曲健壮水印:一个案例研究”安全、隐写术和数字水印的多媒体内容卷,6505学报学报圣何塞,页588 - 595年,加州,美国,2007年。视图:谷歌学术搜索
a .西村”可逆和鲁棒音频水印基于扩频和振幅扩张,”国际研讨会上数字水印(IWDW 14)卷,9023在计算机科学的课堂讲稿,215 - 229页。视图:谷歌学术搜索
麻省理工学院(MIT)音频数据库,http://sound.media.mit.edu/media.php。
欧洲委员会,声音质量评估材料为主观测试记录,https://tech.ebu.ch/publications/sqamcd。

多媒体的发展

文摘

1。介绍

2。算法的原理

2.1。强大的统计功能

2.2。水印的统计特性

2.3。防止溢出/下溢

3所示。算法

3.1。水印嵌入

3.2。水印的提取

4所示。实验结果

4.1。无法感知测试

4.2。健壮性测试

5。结论

的利益冲突

确认

引用

版权

更多相关文章

相关文章