迈普gydF4y2Ba
工程中的数学问题gydF4y2Ba
1563 - 5147gydF4y2Ba
1024 - 123 xgydF4y2Ba
HindawigydF4y2Ba
10.1155 / 2018/1732151gydF4y2Ba
1732151gydF4y2Ba
研究文章gydF4y2Ba
用于低比特率语音编码的固定位置脉冲线性预测编码声编码模型gydF4y2Ba
http://orcid.org/0000-0001-8853-7088gydF4y2Ba
马gydF4y2Ba
甄gydF4y2Ba
1gydF4y2Ba
CrippagydF4y2Ba
保罗gydF4y2Ba
信息工程学院gydF4y2Ba
滨州大学gydF4y2Ba
中国gydF4y2Ba
bztc.edu.cngydF4y2Ba
2018gydF4y2Ba
31gydF4y2Ba
12gydF4y2Ba
2018gydF4y2Ba
2018gydF4y2Ba
26gydF4y2Ba
09gydF4y2Ba
2018gydF4y2Ba
04gydF4y2Ba
12gydF4y2Ba
2018gydF4y2Ba
13gydF4y2Ba
12gydF4y2Ba
2018gydF4y2Ba
31gydF4y2Ba
12gydF4y2Ba
2018gydF4y2Ba
2018gydF4y2Ba
版权所有©2018郑马。gydF4y2Ba
这是一篇在知识共享署名许可下发布的开放存取的文章,它允许在任何媒体上无限制地使用、传播和复制,只要原始作品被适当地引用。gydF4y2Ba
提出一种基于多脉冲线性预测编码(MP-LPC)的任意位置脉冲确定算法。该算法可以根据给定的脉冲位置一次性确定脉冲的所有振幅,而无需综合分析。这保证了脉冲在最小二乘意义上是最优的,为提高合成语音的质量提供了理论基础。在任意位置脉冲确定算法的基础上,提出了一种固定位置脉冲线性预测编码(FLP-LPC)方法。在MATLAB中对该算法进行了仿真,结果表明,采用不同位置的脉冲合成和任意位置脉冲判定算法处理的语音质量较好。该算法在不影响编码时间的情况下提高了语音质量,约为MP-LPC编码时间的1.5%。FLP-LPC中的脉冲位置是固定的,不需要传输,只需要LSF、增益和16个脉冲幅度进行编码和传输。FLP-LPC允许以2.5 kbps的速率生成类似于G.729编码语音的合成语音。gydF4y2Ba
中国教育部人文社会科学研究项目gydF4y2Ba
18 yjczh129gydF4y2Ba
山东省自然科学基金资助项目gydF4y2Ba
ZR2014FL005gydF4y2Ba
滨州大学科研基金项目gydF4y2Ba
2016Y29gydF4y2Ba
1.介绍gydF4y2Ba
语音编码作为交流思想最常见的方式之一,多年来一直是广泛研究的主题[gydF4y2Ba
1gydF4y2Ba- - - - - -gydF4y2Ba
4gydF4y2Ba].在移动通信系统中,随着用户数量的爆炸性增长,电话流量的急剧增加导致分配给每个语音信道的带宽有限。gydF4y2Ba
在通信系统中,合成语音的质量和编码速率是相互矛盾的因素。参数编码关注并提取声道模型和激励的参数,可以以低于约4kbps的比特率合成语音。合成语音具有可理解性,尽管听起来不自然。参数编码包括二元激励线性预测、混合激励线性预测(MELP)[gydF4y2Ba
5gydF4y2Ba[McCree and Barnwell, 1995],波形插值(WI) [gydF4y2Ba
6gydF4y2Ba,正弦变换编码(STC) [gydF4y2Ba
7gydF4y2Ba]和多频带激励(MBE) [gydF4y2Ba
8gydF4y2Ba].混合编码可以在4 ~ 16kbps的编码速率下获得较好的合成语音质量,适用于不同的领域。混合编码包括多脉冲线性预测编码(MP-LPC) [gydF4y2Ba
9gydF4y2Ba]码激励线性预测[gydF4y2Ba
4gydF4y2Ba,gydF4y2Ba
10gydF4y2Ba].gydF4y2Ba
MP-LPC是一种典型的综合分析线性预测编码(ABS-LPC)方法,其中选取数十个脉冲作为激励信号[gydF4y2Ba
11gydF4y2Ba]MP-LPC可以在低编码率下获得良好的合成语音质量;然而,其脉冲确定算法比较复杂。通过简化激励脉冲的振幅和位置,改进了MP-LPC。规则脉冲激励线性预测编码(RPE-LPC)[gydF4y2Ba
12gydF4y2Ba例如,使用Equispaced脉冲作为激励信号。因此,只需要确定和发送脉冲的幅度和第一脉冲位置。在多集值最大似然量量化(MP-MLQ)中[gydF4y2Ba
13gydF4y2Ba]时,脉冲的位置可以是全奇或全偶,脉冲的振幅可以是符号(±1)。在RPE-LPC和MP-MLQ中,脉冲的位置或位置和振幅变得更有规律,需要传输的信息更少。在本文中,我们提出了一种基于传统MP-LPC的任意位置脉冲确定算法。在该算法中,脉冲位置可以任意分配,而不需要通过综合分析程序进行搜索。这些具有任意位置和最佳振幅的脉冲可以产生接近于最小二乘意义上的原始语音。在任意位置脉冲确定算法的基础上,提出了一种固定位置脉冲线性预测编码(FLP-LPC)方法。该算法能在较短的编码时间内合成质量较好的语音。FLP-LPC不仅可以得到高质量、短编码时间的合成语音,而且可以降低编码速率。gydF4y2Ba
2.MP-LPCgydF4y2Ba
对于长度的语音框架gydF4y2Ba
NgydF4y2Ba,gydF4y2Ba
米gydF4y2Ba脉冲用作激励信号,表示为gydF4y2Ba
pgydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
∑gydF4y2Ba
kgydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
米gydF4y2Ba
ggydF4y2Ba
kgydF4y2Ba
∗gydF4y2Ba
δ.gydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
kgydF4y2Ba
)gydF4y2Ba
,在那里gydF4y2Ba
ggydF4y2Ba
kgydF4y2Ba
和gydF4y2Ba
ngydF4y2Ba
kgydF4y2Ba
是幅度和位置gydF4y2Ba
kgydF4y2Ba分别th脉冲。MP-LPC的关键是确定gydF4y2Ba
ggydF4y2Ba
kgydF4y2Ba
和gydF4y2Ba
ngydF4y2Ba
kgydF4y2Ba
最小化原始语音和合成语音之间的感知加权误差。gydF4y2Ba
对应的合成语音信号为gydF4y2Ba
(1)gydF4y2Ba
年代gydF4y2Ba
^gydF4y2Ba
ngydF4y2Ba
=gydF4y2Ba
年代gydF4y2Ba
^gydF4y2Ba
0gydF4y2Ba
ngydF4y2Ba
+gydF4y2Ba
∑gydF4y2Ba
kgydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
米gydF4y2Ba
ggydF4y2Ba
kgydF4y2Ba
∗gydF4y2Ba
hgydF4y2Ba
ngydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
kgydF4y2Ba
,gydF4y2Ba
在哪里gydF4y2Ba
年代gydF4y2Ba
^gydF4y2Ba
0gydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
)gydF4y2Ba
是表示前一帧效果的线性预测(LP)滤波器的零输入响应,以及gydF4y2Ba
hgydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
)gydF4y2Ba
是LP过滤器的单位脉冲响应。gydF4y2Ba
之间的误差gydF4y2Ba
年代gydF4y2Ba
^gydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
)gydF4y2Ba
和gydF4y2Ba
年代gydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
)gydF4y2Ba
是gydF4y2Ba
(2)gydF4y2Ba
egydF4y2Ba
年代gydF4y2Ba
ngydF4y2Ba
=gydF4y2Ba
年代gydF4y2Ba
ngydF4y2Ba
-gydF4y2Ba
年代gydF4y2Ba
^gydF4y2Ba
ngydF4y2Ba
=gydF4y2Ba
egydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
ngydF4y2Ba
-gydF4y2Ba
∑gydF4y2Ba
kgydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
米gydF4y2Ba
ggydF4y2Ba
kgydF4y2Ba
∗gydF4y2Ba
hgydF4y2Ba
ngydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
kgydF4y2Ba
,gydF4y2Ba
在哪里gydF4y2Ba
egydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
年代gydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
)gydF4y2Ba
-gydF4y2Ba
年代gydF4y2Ba
^gydF4y2Ba
0gydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
)gydF4y2Ba
是不受前一帧影响的等效语音,即经LP滤波器滤波的激励信号。gydF4y2Ba
egydF4y2Ba
年代gydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
)gydF4y2Ba
被感知加权过滤器过滤gydF4y2Ba
(3)gydF4y2Ba
egydF4y2Ba
ngydF4y2Ba
=gydF4y2Ba
egydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
ngydF4y2Ba
-gydF4y2Ba
∑gydF4y2Ba
kgydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
米gydF4y2Ba
ggydF4y2Ba
kgydF4y2Ba
∗gydF4y2Ba
hgydF4y2Ba
ngydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
kgydF4y2Ba
∗gydF4y2Ba
wgydF4y2Ba
ngydF4y2Ba
=gydF4y2Ba
egydF4y2Ba
-gydF4y2Ba
wgydF4y2Ba
ngydF4y2Ba
-gydF4y2Ba
∑gydF4y2Ba
kgydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
米gydF4y2Ba
ggydF4y2Ba
kgydF4y2Ba
∗gydF4y2Ba
hgydF4y2Ba
wgydF4y2Ba
ngydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
kgydF4y2Ba
,gydF4y2Ba
在哪里gydF4y2Ba
hgydF4y2Ba
wgydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
)gydF4y2Ba
是感知加权滤波器的单位脉冲响应。感知加权均方误差gydF4y2Ba
EgydF4y2Ba
米gydF4y2Ba
是gydF4y2Ba
(4)gydF4y2Ba
EgydF4y2Ba
米gydF4y2Ba
=gydF4y2Ba
∑gydF4y2Ba
ngydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
NgydF4y2Ba
egydF4y2Ba
2gydF4y2Ba
ngydF4y2Ba
=gydF4y2Ba
∑gydF4y2Ba
ngydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
NgydF4y2Ba
egydF4y2Ba
-gydF4y2Ba
wgydF4y2Ba
ngydF4y2Ba
-gydF4y2Ba
∑gydF4y2Ba
kgydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
米gydF4y2Ba
ggydF4y2Ba
kgydF4y2Ba
∗gydF4y2Ba
hgydF4y2Ba
wgydF4y2Ba
ngydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
kgydF4y2Ba
2gydF4y2Ba
.gydF4y2Ba
MP-LPC的主要思想是最小化gydF4y2Ba
EgydF4y2Ba
米gydF4y2Ba
通过选择适当的gydF4y2Ba
ggydF4y2Ba
kgydF4y2Ba
和gydF4y2Ba
ngydF4y2Ba
kgydF4y2Ba
在激励信号中。通过设置gydF4y2Ba
EgydF4y2Ba
米gydF4y2Ba
零,gydF4y2Ba
米gydF4y2Ba线性方程,gydF4y2Ba
米gydF4y2Ba可以得到非线性方程。解决这两个gydF4y2Ba
米gydF4y2Ba时分的方程复杂。因此,在MP-LPC中,顺序方法用于确定每次迭代中一个脉冲的幅度和位置。后gydF4y2Ba
米gydF4y2Ba迭代,振幅和位置gydF4y2Ba
米gydF4y2Ba脉冲可以被确定。的gydF4y2Ba
ngydF4y2Ba
jgydF4y2Ba
的gydF4y2Ba
jgydF4y2BaTh脉冲是使下列公式最大化的位置:gydF4y2Ba
(5)gydF4y2Ba
RgydF4y2Ba
egydF4y2Ba
hgydF4y2Ba
2gydF4y2Ba
ngydF4y2Ba
jgydF4y2Ba
RgydF4y2Ba
hgydF4y2Ba
hgydF4y2Ba
ngydF4y2Ba
jgydF4y2Ba
,gydF4y2Ba
ngydF4y2Ba
jgydF4y2Ba
.gydF4y2Ba
下一个gydF4y2Ba
ggydF4y2Ba
jgydF4y2Ba
是根据gydF4y2Ba
ngydF4y2Ba
jgydF4y2Ba
上述决定如下:gydF4y2Ba
(6)gydF4y2Ba
ggydF4y2Ba
jgydF4y2Ba
=gydF4y2Ba
RgydF4y2Ba
egydF4y2Ba
hgydF4y2Ba
ngydF4y2Ba
jgydF4y2Ba
RgydF4y2Ba
hgydF4y2Ba
hgydF4y2Ba
ngydF4y2Ba
jgydF4y2Ba
,gydF4y2Ba
ngydF4y2Ba
jgydF4y2Ba
,gydF4y2Ba
在哪里gydF4y2Ba
(7)gydF4y2Ba
RgydF4y2Ba
egydF4y2Ba
hgydF4y2Ba
ngydF4y2Ba
jgydF4y2Ba
=gydF4y2Ba
∑gydF4y2Ba
ngydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
NgydF4y2Ba
egydF4y2Ba
-gydF4y2Ba
wgydF4y2Ba
ngydF4y2Ba
∗gydF4y2Ba
hgydF4y2Ba
wgydF4y2Ba
ngydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
jgydF4y2Ba
,gydF4y2Ba
(8)gydF4y2Ba
RgydF4y2Ba
hgydF4y2Ba
hgydF4y2Ba
ngydF4y2Ba
kgydF4y2Ba
,gydF4y2Ba
ngydF4y2Ba
jgydF4y2Ba
=gydF4y2Ba
∑gydF4y2Ba
ngydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
NgydF4y2Ba
hgydF4y2Ba
wgydF4y2Ba
ngydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
kgydF4y2Ba
∗gydF4y2Ba
hgydF4y2Ba
wgydF4y2Ba
ngydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
jgydF4y2Ba
.gydF4y2Ba
3.任意位置脉冲确定算法gydF4y2Ba
从以上,MP-LPC的主要思想是确定gydF4y2Ba
ggydF4y2Ba
kgydF4y2Ba
和gydF4y2Ba
ngydF4y2Ba
kgydF4y2Ba
为gydF4y2Ba
egydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
egydF4y2Ba
-gydF4y2Ba
wgydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
)gydF4y2Ba
-gydF4y2Ba
∑gydF4y2Ba
kgydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
米gydF4y2Ba
ggydF4y2Ba
kgydF4y2Ba
∗gydF4y2Ba
hgydF4y2Ba
wgydF4y2Ba
(gydF4y2Ba
ngydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
kgydF4y2Ba
)gydF4y2Ba
=gydF4y2Ba
0gydF4y2Ba
就是gydF4y2Ba
(9)gydF4y2Ba
∑gydF4y2Ba
kgydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
米gydF4y2Ba
ggydF4y2Ba
kgydF4y2Ba
∗gydF4y2Ba
hgydF4y2Ba
wgydF4y2Ba
ngydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
kgydF4y2Ba
=gydF4y2Ba
egydF4y2Ba
-gydF4y2Ba
wgydF4y2Ba
ngydF4y2Ba
.gydF4y2Ba
以上gydF4y2Ba
米gydF4y2Ba方程可以简写为gydF4y2Ba
(10)gydF4y2Ba
HgydF4y2Ba
βgydF4y2Ba
=gydF4y2Ba
EgydF4y2Ba
,gydF4y2Ba
在哪里gydF4y2Ba
(11)gydF4y2Ba
HgydF4y2Ba
ngydF4y2Ba
1gydF4y2Ba
,gydF4y2Ba
ngydF4y2Ba
2gydF4y2Ba
,gydF4y2Ba
...gydF4y2Ba
,gydF4y2Ba
ngydF4y2Ba
米gydF4y2Ba
=gydF4y2Ba
hgydF4y2Ba
wgydF4y2Ba
1gydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
1gydF4y2Ba
⋯gydF4y2Ba
hgydF4y2Ba
wgydF4y2Ba
1gydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
米gydF4y2Ba
·gydF4y2Ba
·gydF4y2Ba
·gydF4y2Ba
·gydF4y2Ba
·gydF4y2Ba
·gydF4y2Ba
hgydF4y2Ba
wgydF4y2Ba
NgydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
1gydF4y2Ba
⋯gydF4y2Ba
hgydF4y2Ba
wgydF4y2Ba
NgydF4y2Ba
-gydF4y2Ba
ngydF4y2Ba
米gydF4y2Ba
NgydF4y2Ba
×gydF4y2Ba
米gydF4y2Ba
,gydF4y2Ba
(12)gydF4y2Ba
βgydF4y2Ba
=gydF4y2Ba
ggydF4y2Ba
1gydF4y2Ba
,gydF4y2Ba
ggydF4y2Ba
2gydF4y2Ba
,gydF4y2Ba
...gydF4y2Ba
,gydF4y2Ba
ggydF4y2Ba
米gydF4y2Ba
TgydF4y2Ba
,gydF4y2Ba
(13)gydF4y2Ba
EgydF4y2Ba
=gydF4y2Ba
egydF4y2Ba
-gydF4y2Ba
wgydF4y2Ba
1gydF4y2Ba
,gydF4y2Ba
egydF4y2Ba
-gydF4y2Ba
wgydF4y2Ba
2gydF4y2Ba
,gydF4y2Ba
...gydF4y2Ba
,gydF4y2Ba
egydF4y2Ba
-gydF4y2Ba
wgydF4y2Ba
NgydF4y2Ba
TgydF4y2Ba
.gydF4y2Ba
可以推断出gydF4y2Ba
HgydF4y2Ba
将保持不变gydF4y2Ba
ngydF4y2Ba
1gydF4y2Ba
,gydF4y2Ba
ngydF4y2Ba
2gydF4y2Ba
,gydF4y2Ba
...gydF4y2Ba
,gydF4y2Ba
ngydF4y2Ba
米gydF4y2Ba
在搜索开始时确定(即使是任意分配)。因此,公式(gydF4y2Ba
10gydF4y2Ba)可以被视为线性系统。如果gydF4y2Ba
NgydF4y2Ba
=gydF4y2Ba
米gydF4y2Ba
和gydF4y2Ba
HgydF4y2Ba
是非奇形的,然后是线性系统(gydF4y2Ba
10gydF4y2Ba)有一个独特的解决方案。但是,在大多数情况下gydF4y2Ba
NgydF4y2Ba
>gydF4y2Ba
米gydF4y2Ba
这个系统是过度决定的,可能不一致;因此,它并不总是有唯一解。来确定gydF4y2Ba
ggydF4y2Ba
kgydF4y2Ba
等于求最小二乘解吗gydF4y2Ba
βgydF4y2Ba
^gydF4y2Ba
(gydF4y2Ba
10gydF4y2Ba):gydF4y2Ba
(14)gydF4y2Ba
HgydF4y2Ba
βgydF4y2Ba
^gydF4y2Ba
-gydF4y2Ba
EgydF4y2Ba
=gydF4y2Ba
米gydF4y2Ba
我gydF4y2Ba
ngydF4y2Ba
βgydF4y2Ba
HgydF4y2Ba
βgydF4y2Ba
-gydF4y2Ba
EgydF4y2Ba
.gydF4y2Ba
上述线性系统的最小范数最小二乘解可通过以下公式确定:gydF4y2Ba
HgydF4y2Ba+gydF4y2Ba,的Moore–Penrose广义逆gydF4y2Ba
HgydF4y2Ba[gydF4y2Ba
14gydF4y2Ba]gydF4y2Ba
(15)gydF4y2Ba
βgydF4y2Ba
^gydF4y2Ba
=gydF4y2Ba
HgydF4y2Ba
+gydF4y2Ba
EgydF4y2Ba
.gydF4y2Ba
Moore-Penrose广义逆的计算方法有以下几种:正交投影法、正交化法、迭代法和奇异值分解法[gydF4y2Ba
14gydF4y2Ba].gydF4y2Ba
激励信号中脉冲的位置可以任意分配,这对(gydF4y2Ba
10gydF4y2Ba).任意位置脉冲确定算法的过程可以总结如下。gydF4y2Ba
步骤1。gydF4y2Ba
分配脉冲位置gydF4y2Ba
ngydF4y2Ba
我gydF4y2Ba
,gydF4y2Ba
我gydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
,gydF4y2Ba
...gydF4y2Ba
,gydF4y2Ba
米gydF4y2Ba
任意。gydF4y2Ba
步骤2。gydF4y2Ba
计算单位脉冲响应矩阵gydF4y2Ba
HgydF4y2Ba.gydF4y2Ba
步骤3。gydF4y2Ba
计算脉冲幅度向量gydF4y2Ba
βgydF4y2Ba
:gydF4y2Ba
βgydF4y2Ba
=gydF4y2Ba
HgydF4y2Ba
+gydF4y2Ba
EgydF4y2Ba
.gydF4y2Ba
脉冲在激励信号中的位置对(的最小范数最小二乘解的存在没有影响gydF4y2Ba
10gydF4y2Ba); 也就是说,无论脉冲位置如何,合成语音始终可以在最小二乘意义上接近原始语音。此外,脉冲位置的传输会增加编码速率,导致带宽浪费。如上所述,对于不同的语音帧,可以使用固定位置但幅度不同的脉冲作为激励信号。因此,我们开发了一种只对脉冲幅度和LPC参数进行编码,而不需要对脉冲位置进行编码的方法。这种方法称为固定位置脉冲线性预测编码。gydF4y2Ba
4.结果gydF4y2Ba
4.1.任意位置脉冲确定算法的性能评估gydF4y2Ba
为了测试不同脉冲位置的组合对由所提出的任意定位脉冲确定算法处理的合成语音的质量的影响,分析了来自五种不同扬声器的五个词语,具有相同的内容。采样频率为8000 Hz。在演讲的五个部分中有813个帧,每个帧都包括160个样本。在50个试验中分析语音帧,在每次试验中任意选择脉冲的位置;然后使用所提出的任意定位脉冲确定算法计算所有脉冲的幅度。gydF4y2Ba
图中显示了不同位置的脉冲以及每个脉冲对同一帧语音所产生的合成语音gydF4y2Ba
1gydF4y2Ba.残差信号和原始语音如图所示gydF4y2Ba
1(一)gydF4y2Ba和gydF4y2Ba
1 (b)gydF4y2Ba,分别。为了与顺序法进行直接比较,任意位置的脉冲确定算法和顺序法使用相同的脉冲位置。序列法和任意位置脉冲判定算法(位置相同但振幅不同)得到的激励信号如图所示gydF4y2Ba
1 (c)gydF4y2Ba和gydF4y2Ba
1 (e)gydF4y2Ba,相应的合成语音如图所示gydF4y2Ba
1 (d)gydF4y2Ba和gydF4y2Ba
1 (f)gydF4y2Ba.这两种方法能够产生靠近原始语音的合成语音,其具有17.1471和19.9547的信号到噪声比(SNR),表明所提出的方法优于顺序方法。这里SNR被定义为gydF4y2Ba
(16)gydF4y2Ba
年代gydF4y2Ba
NgydF4y2Ba
RgydF4y2Ba
=gydF4y2Ba
1gydF4y2Ba
0gydF4y2Ba
日志gydF4y2Ba
gydF4y2Ba
∑gydF4y2Ba
kgydF4y2Ba
=gydF4y2Ba
0gydF4y2Ba
NgydF4y2Ba
-gydF4y2Ba
1gydF4y2Ba
年代gydF4y2Ba
ogydF4y2Ba
2gydF4y2Ba
kgydF4y2Ba
∑gydF4y2Ba
kgydF4y2Ba
=gydF4y2Ba
0gydF4y2Ba
NgydF4y2Ba
-gydF4y2Ba
1gydF4y2Ba
年代gydF4y2Ba
ogydF4y2Ba
kgydF4y2Ba
-gydF4y2Ba
年代gydF4y2Ba
rgydF4y2Ba
kgydF4y2Ba
2gydF4y2Ba
,gydF4y2Ba
在哪里gydF4y2Ba
年代gydF4y2Ba
ogydF4y2Ba
(gydF4y2Ba
kgydF4y2Ba
)gydF4y2Ba
和gydF4y2Ba
年代gydF4y2Ba
rgydF4y2Ba
(gydF4y2Ba
kgydF4y2Ba
)gydF4y2Ba
分别为原始语音信号和合成语音信号。数据gydF4y2Ba
1(g)gydF4y2Ba- - - - - -gydF4y2Ba
1 (p)gydF4y2Ba给出了在不同位置用5串脉冲合成的语音信号,说明了该方法比顺序法获得的信噪比更好。实验结果表明,利用不同位置的脉冲可以获得高质量的合成语音,并利用该方法计算了合成语音的幅值。进行的40650次试验的平均信噪比为19.2937。序列法的平均编码时间为0.1224,本文方法的平均编码时间为0.0019,仅为序列法编码时间的1.55%。gydF4y2Ba
(a) 剩余信号;(b)原始语音;(c)通过顺序方法获得的多脉冲激励信号;(d)使用(c)中的激励信号合成的语音;(e)通过所述方法获得的与(c)中的信号位置相同的多脉冲激励信号;(f)使用(e)中的激励信号合成的语音;(g–p)位置任意分配的脉冲和合成的语音。gydF4y2Ba
对于上述演讲,对所有的演讲框架进行了50次试验。在每次试验中,提取任意位置的8、10、12、14、16、18、20、22、24、28和32个脉冲,并使用所提出的算法计算振幅。结果如图所示gydF4y2Ba
2gydF4y2Ba,这表明盒高降低,中位数增加(图gydF4y2Ba
2(一个)gydF4y2Ba).所有试验的平均信噪比都随着脉冲数的增加而增加,标准差也随着脉冲数的增加而减小,这表明脉冲数越多,求解过程越稳定,所分配的脉冲位置的影响也越小。正如Ma等人所提到的[gydF4y2Ba
15gydF4y2Ba],对于一定的语音帧,当脉冲数达到一定值时,脉冲数的持续增加并不能提高合成语音的质量。在本算法中,当脉冲数达到一定值时,H的秩没有随之增加,对求解振幅的贡献也不明显。不同脉冲数的平均编码时间如图所示gydF4y2Ba
2 (b)gydF4y2Ba. 脉冲数的增加导致平均编码时间的逐渐增加。32个脉冲的平均编码时间为0.0028s,低于顺序法的0.1224s。用不同脉冲数获得的激励信号和同一语音帧的合成语音如图所示gydF4y2Ba
3.gydF4y2Ba.结果表明,合成的语音与原始语音接近,具有较好的信噪比。数据gydF4y2Ba
2gydF4y2Ba和gydF4y2Ba
3.gydF4y2Ba表明当脉冲数大于16时,合成语音的质量以不明显的方式提高。gydF4y2Ba
(a)不同脉冲数下的信噪比分布;(b)不同脉冲数的平均编码时间。gydF4y2Ba
(a) 剩余信号;(b)原始语音;(c–p)具有16、18、20、22、24、28和32个脉冲的激励信号以及合成的语音。gydF4y2Ba
4.2.FLP-LPC的性能评估gydF4y2Ba
4.2.1.非量化FLP-LPC的性能评估gydF4y2Ba
在该方法中,脉冲的位置可以任意分配,不需要使用算法计算。因此,对于每一帧语音,可以采用位置固定但振幅不同的脉冲作为激励信号。所提出的方法和顺序方法[gydF4y2Ba
11gydF4y2Ba]用于处理来自中国中央电视新闻广播(2534.3950)的女性和男性所说的相同讲话。ITU标准P.862和SNR中指定的PESQ_MOS用于评估语音质量。图中,平均SNR和PESQ_MOS作为脉冲编号的函数如图所示gydF4y2Ba
4gydF4y2Ba.gydF4y2Ba
(a) MP-LPC和FLP-LPC的平均信噪比和(b) PESQ_MOS作为脉冲数的函数。gydF4y2Ba
与MP-LPC相比,FLP-LPC获得的语音更自然易懂。MP-LPC和FLP-LPC的平均信噪比和PESQ_MOS随脉冲数的增加而增加。但当脉冲数超过18时,它们的增加幅度不大。gydF4y2Ba
4.2.2。FLP-LPC编码方案及性能评估gydF4y2Ba
结果表明,对于20 ms的语音帧,16个脉冲足以产生高质量的合成语音。因此,在FLP-LPC编码方案中,激励信号采用16个均匀分布的脉冲。首先对脉冲幅值进行归一化处理,然后对增益和归一化后的幅值进行编码。编码参数是LSF、增益和脉冲幅度。LSF和归一化振幅采用多级矢量量化,增益采用4比特量化。FLP-LPC的具体位分配如表所示gydF4y2Ba
1gydF4y2Ba.gydF4y2Ba
FLP-LPC比特分配。gydF4y2Ba
| 参数gydF4y2Ba |
位gydF4y2Ba |
| LSFgydF4y2Ba |
18gydF4y2Ba |
| 获得gydF4y2Ba |
4gydF4y2Ba |
| 脉冲振幅gydF4y2Ba |
28gydF4y2Ba |
| 总计gydF4y2Ba |
50gydF4y2Ba |
测试演讲包括20组样本,分别来自两名男性和两名女性,样本频率为8000赫兹。录音中还有背景噪音,如门的吱吱声和汽车的噪音。测试演讲稿包括一个数据库,该数据库由83名男性和83名女性的1560句话组成,内容选自《人民日报》。使用FLP-LPC、G.723.1和G.729对这些speech进行编码,计算PESQ_MOS值,如表所示gydF4y2Ba
2gydF4y2Ba.FLP-LPC合成的语音质量与G.729生成的语音质量相近,且优于G.723.1,编码速率为2.5 kbps。gydF4y2Ba
FLP-LPC与G.723.1和G.729的性能比较。gydF4y2Ba
| 编码方法/标准gydF4y2Ba |
编码率(Kbps)gydF4y2Ba |
佩斯库莫斯gydF4y2Ba |
| FLP-LPCgydF4y2Ba |
2.5gydF4y2Ba |
3.731gydF4y2Ba |
| G.723.1gydF4y2Ba |
5.3gydF4y2Ba |
3.497gydF4y2Ba |
| G.729gydF4y2Ba |
8gydF4y2Ba |
3.765gydF4y2Ba |
5.结论gydF4y2Ba
为了解决与MP-LPC相关的问题,在当前研究中开发了任意位置脉冲确定算法。在该算法中,脉冲幅度通过求解在脉冲的任意分配位置的前提下求解方程的线性系统来确定。这种线性系统的最小常规规范溶液的存在不受激励信号中脉冲的位置的影响。在不同语音帧中执行的测试表明,具有不同位置的脉冲组合可以用作励磁信号以合成高质量的语音,从而产生比具有传统顺序方法获得的结果更好的结果。顺序方法一次确定一个脉冲,这确保了在每次迭代时添加的添加脉冲是最佳的,而在所有迭代之后不保证脉冲的组合是最佳的。在所提出的算法中,一次确定的脉冲的组合是最优选的,其为确保合成语音的质量提供了理论依据。所提出的算法不会增加编码时间以改善合成的语音质量,这是MP-LPC中的编码时间的1.5%。为了研究脉冲数对合成语音质量的影响,计算具有不同数量的脉冲的激励信号,用于相同的语音帧。结果表明,16个脉冲足以产生20毫秒的长语。gydF4y2Ba
在改进的MP-LPC方法中,如RPE-LPC和MP-MLQ,脉冲的位置或振幅或两者都变得更有规律,以减少要传输的激励信号上的信息。FLP-LPC进一步降低编码率。该方法的前提是最小二乘意义下的脉冲矢量与激励信号中脉冲的位置无关。在FLP-LPC中,脉冲的位置是固定的,只需要通过任意位置的脉冲确定算法来确定脉冲的振幅。该脉冲位置不需要编码或发送,在不影响合成语音质量的情况下降低了编码率。结果表明,使用FLP-LPC合成的语音的信噪比和PESQ_MOS均高于MP-LPC合成的语音。此外,我们还提出了一种脉冲均匀分布的FLP-LPC编码方案。FLP-LPC可以在2.5 kbps的编码速率下合成与G.729相似、优于G.723.1的语音质量。综上所述,FLP-LPC可以在较短的编码时间内合成高质量的语音,降低编码率;然而,它的缺点是计算Moore-Penrose广义逆需要更大的内存。gydF4y2Ba
数据可用性gydF4y2Ba
用于支持本研究结果的语音数据由中文语言数据联盟授权提供,因此不能免费提供。如需查阅这些数据,请联系孙孟毅(service@chineseldc.org)。gydF4y2Ba
利益冲突gydF4y2Ba
作者宣称他们没有相互竞争的利益。gydF4y2Ba
致谢gydF4y2Ba
教育部人文社会科学研究项目(18YJCZH129);山东省自然科学基金(ZR2014FL005);滨州学院科研基金项目(2016Y29)。gydF4y2Ba
[
拉胡提gydF4y2Ba
F。gydF4y2Ba
Fazel.gydF4y2Ba
a。R。gydF4y2Ba
Safavi-NaeinigydF4y2Ba
a . H。gydF4y2Ba
KhandanigydF4y2Ba
答:K。gydF4y2Ba
使用基于格的量化方案对语音LPC参数进行单帧和双帧编码gydF4y2Ba
IEEE音频,语音和语言处理汇刊gydF4y2Ba
2006gydF4y2Ba
14gydF4y2Ba
5gydF4y2Ba
1624gydF4y2Ba
1632gydF4y2Ba
2 - s2.0 - 34047266599gydF4y2Ba
10.1109/TSA.2005.858560gydF4y2Ba
]
[
穆赫塔里斯gydF4y2Ba
一个。gydF4y2Ba
KaradimougydF4y2Ba
KgydF4y2Ba
TsakalidesgydF4y2Ba
P。gydF4y2Ba
点麦克风信号低比特率编码的多分辨率源/滤波器模型gydF4y2Ba
音频、语音和音乐处理期刊gydF4y2Ba
2008gydF4y2Ba
2008gydF4y2Ba
1gydF4y2Ba
16gydF4y2Ba
10.1155 / 2008/624321gydF4y2Ba
]
[
德瑞切gydF4y2Ba
M。gydF4y2Ba
宁gydF4y2Ba
D。gydF4y2Ba
提出了一种基于扭曲线性预测模型和离散小波变换的音频编码方案gydF4y2Ba
IEEE音频,语音和语言处理汇刊gydF4y2Ba
2006gydF4y2Ba
14gydF4y2Ba
6gydF4y2Ba
2039gydF4y2Ba
2048gydF4y2Ba
2-s2.0-63749118043gydF4y2Ba
10.1109 / TASL.2006.881701gydF4y2Ba
]
[
KugydF4y2Ba
N。gydF4y2Ba
叶gydF4y2Ba
C。gydF4y2Ba
黄gydF4y2Ba
年代。gydF4y2Ba
一种高效的ACELP语音编码器代数码书搜索算法gydF4y2Ba
音频、语音和音乐处理期刊gydF4y2Ba
2014gydF4y2Ba
2014gydF4y2Ba
1gydF4y2Ba
10.1186 / s13636 - 014 - 0030 - 9gydF4y2Ba
]
[
麦克里gydF4y2Ba
答:V。gydF4y2Ba
BarnwellgydF4y2Ba
t P。gydF4y2Ba
一种用于低码率语音编码的混合激励LPC声码模型gydF4y2Ba
IEEE音频,语音和语言处理汇刊gydF4y2Ba
1995gydF4y2Ba
3.gydF4y2Ba
4gydF4y2Ba
242gydF4y2Ba
250gydF4y2Ba
2 - s2.0 - 0029341719gydF4y2Ba
10.1109/89.397089gydF4y2Ba
]
[
Kleijn.gydF4y2Ba
w·B。gydF4y2Ba
使用原型波形进行语音编码gydF4y2Ba
IEEE音频,语音和语言处理汇刊gydF4y2Ba
1993gydF4y2Ba
1gydF4y2Ba
4gydF4y2Ba
386gydF4y2Ba
399gydF4y2Ba
2 - s2.0 - 0027684001gydF4y2Ba
10.1109/89.242484gydF4y2Ba
]
[
McaulygydF4y2Ba
R.J。gydF4y2Ba
QuatierigydF4y2Ba
t F。gydF4y2Ba
基于正弦表示的语音分析/合成gydF4y2Ba
信号处理上的IEEE交易gydF4y2Ba
1986gydF4y2Ba
34gydF4y2Ba
4gydF4y2Ba
744gydF4y2Ba
754gydF4y2Ba
2-s2.0-84863772450gydF4y2Ba
10.1109/TASSP.1986.1164910gydF4y2Ba
]
[
格里芬gydF4y2Ba
d . W。gydF4y2Ba
LimgydF4y2Ba
j·S。gydF4y2Ba
多波段激发声码器gydF4y2Ba
信号处理上的IEEE交易gydF4y2Ba
1988gydF4y2Ba
36gydF4y2Ba
8gydF4y2Ba
1223gydF4y2Ba
1235gydF4y2Ba
2 - s2.0 - 0024060644gydF4y2Ba
10.1109/29.1651gydF4y2Ba
Zbl0825.94212gydF4y2Ba
]
[
阿塔尔•gydF4y2Ba
BS。小gydF4y2Ba
Remde,LPC激励的新模型,用于以低比特率产生自然探测言论gydF4y2Ba
IEEE声学,语音和信号处理国际会议的诉讼程序gydF4y2Ba
1982gydF4y2Ba
法国巴黎gydF4y2Ba
614gydF4y2Ba
617gydF4y2Ba
]
[
施罗德gydF4y2Ba
M。gydF4y2Ba
阿塔尔•gydF4y2Ba
B。gydF4y2Ba
码激励线性预测(CELP):极低比特率下的高质量语音gydF4y2Ba
IEEE声学,语音和信号处理国际会议的诉讼程序gydF4y2Ba
美国佛罗里达州坦帕市gydF4y2Ba
937gydF4y2Ba
940gydF4y2Ba
10.1109/ICASSP.1985.1168147gydF4y2Ba
]
[
SinghalgydF4y2Ba
年代。gydF4y2Ba
阿塔尔•gydF4y2Ba
理学学士。gydF4y2Ba
多脉冲编码器的振幅优化和俯仰预测gydF4y2Ba
信号处理上的IEEE交易gydF4y2Ba
1989gydF4y2Ba
37gydF4y2Ba
3.gydF4y2Ba
317gydF4y2Ba
327gydF4y2Ba
2-S2.0-0024634588gydF4y2Ba
10.1109/29.21700gydF4y2Ba
]
[
克罗恩gydF4y2Ba
P。gydF4y2Ba
剥夺gydF4y2Ba
e . F。gydF4y2Ba
SluytergydF4y2Ba
R.J。gydF4y2Ba
规则脉冲激励——一种有效、高效的语音多脉冲编码新方法gydF4y2Ba
信号处理上的IEEE交易gydF4y2Ba
1986gydF4y2Ba
34gydF4y2Ba
5gydF4y2Ba
1054gydF4y2Ba
1063gydF4y2Ba
2-s2.0-0022792635gydF4y2Ba
10.1109 / TASSP.1986.1164946gydF4y2Ba
]
[
yoon.gydF4y2Ba
S.-W。gydF4y2Ba
康gydF4y2Ba
H.-G。gydF4y2Ba
公园gydF4y2Ba
研究。gydF4y2Ba
的梦想gydF4y2Ba
D.-H。gydF4y2Ba
一种适用于G.723.1和G.729A语音编码器的高效转码算法:移动网络和IP网络之间的互操作性gydF4y2Ba
语音传播gydF4y2Ba
2004gydF4y2Ba
43gydF4y2Ba
1-2gydF4y2Ba
17gydF4y2Ba
31gydF4y2Ba
2 - s2.0 - 2942538629gydF4y2Ba
10.1016 / j.specom.2004.01.004gydF4y2Ba
]
[
SerregydF4y2Ba
D。gydF4y2Ba
矩阵:理论与应用gydF4y2Ba
2002gydF4y2Ba
216gydF4y2Ba
美国纽约gydF4y2Ba
施普林格gydF4y2Ba
数学研究生教材gydF4y2Ba
MR1923507gydF4y2Ba
Zbl1011.15001gydF4y2Ba
]
[
马gydF4y2Ba
Z。gydF4y2Ba
曹gydF4y2Ba
Y。gydF4y2Ba
藏gydF4y2Ba
JgydF4y2Ba
MPLPC激励脉冲抽象算法研究gydF4y2Ba
2009计算智能与设计国际研讨会论文集,ISCID 2009gydF4y2Ba
2009年12月gydF4y2Ba
中国gydF4y2Ba
489gydF4y2Ba
492gydF4y2Ba
2 - s2.0 - 77749327457gydF4y2Ba
]