移动信息系统

在这一页上

文摘介绍相关工作结论数据可用性的利益冲突确认引用版权相关文章

研究文章收缩

这篇文章被收回了。查看这篇文章的细节,请点击上面的“收缩”标签。

特殊的问题

联合学习物联网应用程序驱动的数据分析:挑战和解决方案

把这个特殊的问题

研究文章|开放获取

体积2022年| 文章的ID9033421| https://doi.org/10.1155/2022/9033421

英语口语练习系统基于计算机英语语音识别技术

气高 ¹

学术编辑器: Chia-Huei吴

收到了 2022年2月20日

修改后的 2022年3月06

接受 2022年3月18日

发表 06年4月2022年

文摘

英语口语实践需要相结合的听力,口语,阅读,和写作,听力和口语是最困难的。为了提高从业者的口语能力,英语口语的发音需要及时纠正。然而,人工评估的工作量太大,因此有必要结合智能口语识别的方法。基于英语口语发音的需要修正,本文结合了计算机英语语音识别技术构建英语口语识别和修正模型和编码技术相结合的方法研究英语语音识别技术。此外,本文构建了英语口语练习系统实际需要的基础上的英语口语练习。最后,本文通过实验研究验证该系统的可靠性,它提供了一种可靠的后续手段的智能学习英语口语。

1。介绍

英语口语能力是一个重要的标准来衡量英语学习者的语言能力,和英语演讲教学实践是一个重要组成部分。因此,特别英语演讲实践不仅是一个重要的研究方法,提高针对性和科学性的练习在英语演讲的设计练习也是一种很重要的方式,教师在教学实践中正确地使用它,提高练习的效率(1]。文本仅能证明新语言的单词和句型,并且准确的掌握语言知识必须通过一定的练习。课文和练习口头练习都设置的特殊技能“说话”,并设置为目的的脱口而出。虽然有类似的部分全面阅读教材的练习形式,最根本的目的是不同的,和练习的方向也完全不同(2]。

英语演讲实践的终极目标是培养学习者的语言交际能力。掌握这种能力不同于纯英语语言知识的学习。语言的使用可以分为四种技能:听,说,读,写。神经语言学研究也证明了四种语言技能在人类的大脑机制相应的中部地区。因此,当前的听力课,口语课,阅读课,汉字课,写作课,和其他类的设置是基于技能培训,这是科学的基础。因为学习英语的最终目标学习者使用英语作为第二语言是沟通,这四种技能中,“听”和“说”似乎特别重要。特别是,对于初学者英语学习者,在学习一门语言的最初阶段,他们必须首先学会“听”和“读”为了更好地准备“说”和“写作。“因此,初级英语演讲的编译教材尤为重要,这是有关第二语言英语学习者是否能有一个好的开始在学习英语的过程中(3]。

基于上述分析,本文结合了计算机英语语音识别技术来构造一个英语演讲实践系统,这使得英语演讲实践的过程中更聪明,提高英语演讲实践的影响。

当前计算机英语语音识别技术的研究主要包括英语口语的实践内容是什么类的练习,一定的实践方法的影响,英语口语类的分类练习。从文学语言技能的角度来看,(4]认为在英语口语课堂练习的过程中,要注意单词和句子的选择和应用,句子的凝聚力,组织句子,风格样式的转换,修辞技巧,和语言策略。文献[5]以教训类型为起点,并通过比较不同课型的练习方法,得出英语口语课的课堂实践内容不仅有语音练习,还应该包括词的用法和句子,最后通过实际练习。交际练习使学生真正欣赏英语口语的魅力。这两个总结了英语课的内容从不同的角度练习。在实际的英语口语课堂练习,我们还应该注意练习的全面性,我们不应忽视其中之一。文献[6]分析了利用小组活动在英语课堂口语练习。通过调查和分析,结果表明,集体活动能提高学生参与活动的主动性、积极性,促进老师和学生之间的互动。交流与合作,增加学生参与语言实践活动的数量。在课堂上练习英语口语类的,小组讨论是实践的方式之一。当使用这种做法方法时,我们必须使用我们的优点,避免缺点最大化小组实践活动的优势。文献[7不仅将运动划分为三种类型:“模仿记忆,创造协会,和任务通信,“但也指出这三种运动的特点。文献[8课堂练习分为四类:“理解、模仿记忆、智力发展和交际。“分类结果类似于周健和唐凌,但是在“模仿记忆”练习,更强调“理解”练习。理解练习更容易比其他运动的方法。学生只需要完全理解它。

文献[9)指出,从英语沟通的需要,总结和教学交际语法系统可以帮助英语学习者学习英语口语。也就是说,通信过程中使用的语法教英语口语学习的内容。因为学习英语口语的目的是交流,使用口语交际语法教学内容可以帮助学习者更有效地掌握英语口语。文献[10)提出了教学过程的单身sentence-discourse-discourse文本在教学英语口语部分。相信口语教学是一个循序渐进的过程,和口语教学的内容应该从简单到复杂。它应该遵循“单一sentence-segment-discourse”的过程一步一步学习英语口语。文献[11)指出,口语教学的目的是提高学生的口语交际能力,这是一种综合能力。与此同时,它也指出,口语学习的内容非常广泛,所以它应该分阶段,集中完成目标。换句话说,语法或词汇的发音不能完全作为口语教学的内容。相反,学习内容和学习的焦点应该根据学习者的学习阶段划分。

文献[12)提出,将“交际法”应用于口语表达训练也是一种有效的方法。这种方法的目的是培养学习者的交际能力,使学习者可以训练交际能力在一个特定的语言环境。文献[13)提出,结合英语口语的特点,英语口语教学可以改变从阅读演讲训练,习题课培训,联想句子,口语培训、主题演讲训练,和其他教学方法。这里提到的许多方法仍广泛应用于英语口语课程,这就证明了这些方法的实用性英语口语教学。文献[14)把西方的任务型教学方法在英语口语教学中,主张清晰的沟通任务,建立任务型口语教学。所谓“任务型教学法”是设计一些具体和可操作的任务在沟通和语言项目在教学的过程中,然后,学习者完成任务通过沟通,沟通、表达、和其他方法来达到学习语言的目的。

文献[15)提出了一个句子分割法和动态时间规划(DTW)英语口语识别。基于分割的口语句子,该方法识别重复的和声学特征空间中的子序列通过配对比较序列的特性。然后,这些相似子序列集分为大集合。这些集群被认为是语言单位,可辨认的英语口语翻译源自他们创建的语言单位。发现重复的模式在连续英语演讲需要确定这一对语音序列相似的一部分,这部分是不同的。文献[16)提出了一个算法寻找相似的语音序列。该算法也是基于动态时间规划算法。文献[17)首先定义的起点和终点,然后在预定义的地区比较,发现类似的语音序列是不同的。文献[18)计算所有可能的相似之处,然后改变根据相邻元素之间的相似度。确定子序列的边界。在英国数据集包含许多短语组合,该算法可以更好地识别不同的语言单位之间的细微差异。文献[19)提出了一个单词和短语级语义单元识别算法在13种语言为连续语音识别系统。发现所有的重复语义单位连续语音流需要特征比较的所有语义单位。相似的语义单位发现数量的增加,该算法的计算复杂度将变得越来越不可接受的。文献[20.)提高效率的比较通过改善算法的并行操作。通过研究,发现会有超过一段时间的沉默不同的句子。文献[21)作为连续口语一系列短句子隔开沉默的时间间隔。在实施层面上,本文使用大量的GPU计算单位实现高度的并行算法。

为了提高英语口语语音识别的准确性,提高语音识别的鲁棒性,本文结合了计算机英语语音识别技术的研究,研究智能口头练习系统并采取相应的控制和调整激励信号的能量根据演讲的类型。为了提高编码和解码的鲁棒性,本文采用的控制技术在编码端自适应码书的贡献。

3所示。计算机英语语音识别技术

包传输过程中英语语音、英语语音信息封装在P数据包在包形式和传播使用传输层协议。它没有质量保证,不能避免数据包丢失。目前,数据帧丢失的控制方法有很多,如前向纠错、重传,cross-sequencing。他们都是基于发送方补偿包丢失。隐藏是一个基于接收端丢包补偿技术,它不需要考虑发送端。以下简要介绍了各种帧擦除控制方法。

信道编码采用前向纠错编码比特在传输过程中被错误中恢复过来。现在,它也适用于英语演讲的包传输恢复丢失的信息帧。奇偶校验码是最简单的前向纠错编码。事实上,它只是一个在信道编码错误检测代码。当它用于包英语演讲,如图1,它具有纠错功能。前向纠错的优势是,这种类型的方法无关的内容包,可以完全恢复失去的包。缺点是它增加了额外的系统延迟和带宽。

在英语演讲中传播,数据包的连续亏损是英语演讲质量恶化的主要原因。cross-sorting的方法是一种有效的方法来消除连续丢包。这个想法是为了扰乱数据包传输之前的顺序。例如,如果包长度是20 ms和一个单位是5毫秒,那么第一个包可以包含1、5、9和13个单位,第二个包可以包含2、6、10、14单位,如图2。从图可以看出,一个包丢失而不会产生连续的单位损失。失去了,因为它是一个小单位,英语演讲特点基本上不会改变,所以这种方法可以很容易地实现错误隐藏。包单位交叉的缺点是延迟较大,限制了其在实时传输中的应用。

帧擦除隐藏技术的基本原理是使用一个特定的帧擦除检测方法在接收端接收到的信号帧是否框架是一个正常的英语演讲框架或丢失的帧。如果是一个正常的英语演讲,我们使用相应的解码算法解码英语语音合成语音。如果这是一个失去了框架,我们使用相应的帧擦除隐藏算法进行处理。一般来说,帧擦除隐藏不引入额外的延迟和计数。

早期的选举委员会的技术通常使用波形替代技术,旨在英语演讲波形编码(例如,ADPCM)。英语演讲的开发和广泛应用参数编码和混合编码(CELP编码),隐藏参数外推法和插值等方法应用了这个编码模型。这个编码器的核心层编码器基于CELP编码模型,所以丢失的帧的恢复是通过恢复参数。下一节将详细介绍这个编码器的选举委员会的方法。

图3显示帧擦除隐藏方法的框图在解码器端设计。首先,综合英语演讲nonlost帧分为英语发音,和判断类型是哑巴,表示,无声的,从无声的表达,从有声的无声的。英语语音分类中使用的参数包括平均能量 ,归一化自相关 ,讨论二阶导数过零率 ,和光谱倾斜。图的时候延迟4表明当前估计丢失帧的类型与前一帧的类型nonlost框架。也就是说,如果当前帧丢失帧,帧的类型是一样的类型前nonlost框架。英语语音分类过程如下。

根据公式(1),平均能量计算当前帧的是综合英语演讲(22]。

根据方程(自相关计算2),是综合英语演讲,是整数第四子帧的延迟,然后呢。如果 ,然后将第三子帧的平均值和第四子帧。如果场上延迟小于子帧的长度( ),归一化自相关必须重新计算。的归一化自相关是自相关的平均值计算两次。

讨论二阶导数过零率合成的波形的次数是英语演讲在当前帧穿过零值。

光谱倾斜归一化自相关来近似,计算公式如下,然后呢是综合英语演讲(23]。

然后,该算法法官当前帧的类型基于上面的四个参数计算。具体的判断过程如图4。四个判断条件是获得的经验,和细节如下24]:

条件1 (C1): 。

条件2 (C2): 和或和。

条件3 (C3): 和。

条件4 (C4):前一帧的类型是坐标系或沉默框架。

测试表明,该方法的分类精度在90%以上。如图5,蓝色的波形是一个英语演讲(总共140帧,每帧320个样本),和红色的波形表示分类的结果。“8000”表示表示帧的振幅,振幅的“O”表示沉默的框架,以及“2000”的振幅表示无声的帧。此外,“-2000”是指的振幅框架和振幅的“-6000”的意思框架。从图可以看出,这种分类方法可以正确地判断除了某些过渡帧,但表示框架,沉默的框架,无声的框架,和大多数过渡帧可以正确判断,基本上符合编码器的需要。

综合英语演讲是通过刺激通过合成滤波器。在不丢失的帧,解码器解码收到的安全部队参数代码流并将它们转换为ISP参数,然后通过插值获得每个子帧的ISP参数。合成滤波器的系数是通过将ISP参数转换为LP系数。

安全部队的量化参数,该编码器使用unequal-coefficient帧间预测每个维度的分裂矢量量化方法。如果当前帧丢失,丢失帧的安全部队参数被设置为相同的安全部队参数前面nonlost框架,和其他流程保持不变。实验结果证明该方法效果最好。

自适应码书通过插值得到过去的激励框架与基音周期延迟。的恢复丢失的帧的基音周期这个编码器使用的方法估计丢失的帧的基音周期G722.2标准。根据英语演讲的短期固定特征,丢失帧的基音周期通常是取代了过去的第四子帧的基音周期。技术估计基音周期G722.2丢失帧的标准是判断子帧的基音周期的可用性在过去。如果表示和稳定性强,这意味着失去了框架与过去相比是不太可能改变框架,以及丢失的帧的基音周期可以取代了过去的子帧。否则,丢失的帧的基音周期值是随机生成的一定范围内。流程如下:

首先,该算法法官的可用性之前的子帧的基音周期,用(25]:

其中, ,和存储自适应码书获得的四子帧之前的正常的框架。自适应码书获得的第四子帧之前正常的框架,然后呢自适应码书获得的第三子帧之前的正常的框架。之间的区别是最大值和最小值的四子帧的基音周期值之前正常的框架。

然后,这个丢失的帧的基音周期估计如下基于之前的子帧的基音周期的可用性(26]:

其中,是第四子帧的音高延迟之前正常的框架。我们存储沥青的四子帧的延迟以前正常帧从最小到最大;然后,是最大的价值,是第二大值,是第三大的值。是生成一个随机数的范围。

此外,它是通过实验证明了如果子帧的基音周期过去是可用的,添加1基音周期值的效果比直接使用价值。因此,G722.2标准中采用的技术估计丢失的帧的基音周期略有修改。如果过去的子帧的基音周期可用,该算法增加了1到这个基音周期值,然后使用该值作为整数丢失帧的基音周期。上述过程得到整数丢失帧的基音周期,和分数基音周期设置为0。然后,根据过去恢复基音周期,激励是一个自适应码书插值获得。

传统的CELP模型只有一个独特的激励缓冲区。在本文中使用的嵌入式CELP模块,除了核心层励磁,解码器还生成包含附加层的激励信息。基于这一特殊结构,本文提出一种丢失帧自适应码书复苏方法如图6。如果当前帧是一个失去了框架,相应的激励应该选择插值通过判断前面的帧速率。如果前一帧的速率是8 kb / s,过去激励选择核心层的插值。如果前一帧的速率是12 kb / s,过去激励增强层的选择插值。如果前一帧的速率大于12 kb / s,过去的励磁插值增强层2被选中。

通常,丢帧的固定码书被一个随机生成的序列,这也是由这个编码器。也可以看到,选举委员会只恢复英语演讲的基本信息,虽然英语演讲的细节(增强层)上的信息不能恢复。

自适应码书获得和固定码书增益丢失的帧从过去的子帧的价值了27]:

其中,是过去的自适应码书获得正常帧子帧。是正常帧子帧的固定码书增益在过去。当丢失帧是表示帧的类型, ,否则。同时,自适应码书获得应该是有限的;也就是说,当获得以上> 0.95, 。

此外,能源使用外推法来调整增益的自适应码书丢失帧。这个方法可以被理解为使用的平均能量比两个子帧丢失帧估计获得之前的励磁电流的自适应码书丢失帧。在这里,是前两个子帧的平均能量比激发当前帧丢失。 , 的帧间平滑值吗 ,和表示前面的子帧的帧间平滑值。是前面的n子帧的基音周期,然后呢是以前的激励子帧。

获得的是调整值的自适应码书获得帧丢失,但在前两个方程(8),不能取代原先计算的自适应码书。

通常情况下,激励是自适应码书矢量乘以其增益,加上固定码书矢量乘以其收益。是一个激励获得的矢量和。通常,对于丢失帧,固定码书是一个随机序列所取代。实验表明,如果丢失的帧表示,包含这个固定码书的英语演讲合成有明显的噪音。同时,固定码书将破坏表示激励信号的波形和影响正常的英语语音合成帧丢失帧。因此,本文调整固定码书的能量丢失帧根据不同类型的英语演讲,如下:(1)如果当前帧是一个表示帧,每个样本点的固定码书由0.5减毒(2)如果当前帧是一个“ “过渡帧,固定码书的样本3日和4日的子帧将逐点衰减,衰减系数将逐步改变从1到0.5:(3)如果当前帧是一个过渡帧” ”,第一和第二子帧的固定码书样本将减毒

衰减系数逐渐改变了从0.5到1。

固定码书调整后,激励,最后,失去了框架通过合成滤波器恢复英语演讲是兴奋。

框架的优点和缺点消除隐藏技术是多么有效恢复表示框架。自适应码书表达表达听起来是最重要的组件,并通过插值自适应码书生成过去激励与基音周期延迟。因此,对于丢失帧,如果基音周期参数可以有效地恢复,让它接近或等于价值不会发生丢失帧的情况时,丢失的帧的合成质量可以大大提高。

数据拟合的方法是基于数据之间的相互关系,它们之间画了一个数学公式,绘制一个近似曲线反映了给定数据的一般趋势。英语语音特征表示帧的英语演讲正在慢慢发生变化。在这里,因为未来的基音周期框架不能获得,过去帧的基音周期只能用于估计基音周期的变化趋势的当前帧丢失,也就是说,预测。方法如下。

过去的五节时期 ,在哪里是最早的基音周期。然后预测模型可以定义为

失去当前帧的基音周期

和预测系数,通过吗和 ,公式(11)是最小化(22]:

因此, 和得到了。

这里,有必要判断使用预测方法。如果声音是强大和稳定,它是用于预测;否则,基音周期值是随机生成的。

实验观察表明,如果当前丢失帧的基音周期有一个线性关系前和后续帧的基音周期值,预测是有效的。然而,基音周期的动态范围的宽带英语演讲大,甚至一些表示帧可能不是线性变化。尤其是当帧是一个过渡帧,预测方法显示更多的缺点。之后,通过添加权重方程(11),也就是说,越接近当前帧的基音周期,重量越大,但结果并不显著提高。

然而,通过观察,发现预测方法的有效性取决于判断的准确性在什么情况下采用的预测方法。另一个想法是添加“平滑基音周期曲线”的基音周期搜索过程编码器改善预测效果。

当前与相邻的英语演讲失去了帧相关性最大帧,所以相邻帧的基音周期(过去和未来帧)是用来估计当前丢失帧的基音周期应该更接近真实价值不会发生损失时(基音周期)。这种方法的缺点是,一帧延迟将会介绍。

本文试图利用插值的方法,使用基音周期过去的第四子帧的帧和基音周期未来的第一子帧的帧恢复基音周期当前帧丢失。方法如下:的区别是两帧的基音周期,如以下公式:

然后,的基音周期th子帧的帧估计是丢了

符号””意味着舍入。

实验观察表明,并不是所有的球场时间丢失的帧插值方法是有效的。效果不是很好,如果相邻节时间之间的差异太大,所以插值方法应该受到限制。如果通过实验,该算法使用公式(13),否则基音周期获得的原始方法,这样可以获得更好的基音周期恢复的影响。图7显示的基音周期曲线几段英语演讲。粉色框表明框架发生损失,红色虚线表示正确的基音周期曲线没有帧丢失,绿色虚线表明基音周期曲线获得的原始方法,,蓝色实线表示基音周期曲线插值法获得的。从图可以看出,基音周期获得的插值方法更接近正确的值。相同的主观听也显示,英语演讲恢复的插值方法比原方法。

(一)示例1

例2 (b)

(c)例3

4所示。计算机语音识别技术在英语演讲中的应用

英语演讲的过程评价是先提取评价特征参数经过预处理和分割应考人的英语演讲。然后,特性参数进行测试和pretrained或统计相应的标准评价模型计算以特定的方式来获取每个特性参数的测量。最后,每个特性的评价指标是映射到一个分数通过一定方式的计算模型,该模型已被提前训练,然后输出,如图8。

本文设计的实验来验证和分析模型的性能。本文主要分析和评估英语语音识别的准确性,英语口语实践的影响,以及口语的满意度这个模型的实践者和比较实验研究结果与方法在文献[26),实验研究结果如图9- - - - - -11下面是获得。

从上面的研究成果,基于计算机英语口语实践系统语音识别技术提出了具有良好的实用效果。

5。结论

随着信息技术的快速发展,计算机技术和人工智能技术已经广泛应用于社会生产和生活的各个方面,以及计算机辅助语言学习的作用越来越明显。的自动评估口语是语言的自动评估和诊断质量基于语音信号的生理和行为特征。口语自动评估和诊断技术是基于人的声音和语言特点,使用信息处理信号处理和模式识别等技术手段,整合多学科的理论和知识的语音学、语言学和教育学。与传统手工方法相比,它可以显著提高评价的客观性和公平性测试,大大减少人力和物质资源的成本,并使大规模口语水平测试和评估成为可能。基于上述分析,本文结合了计算机英语语音识别技术来构造一个英语演讲实践系统,这使得英语演讲实践的过程中更聪明,提高英语演讲实践的影响。实验研究结果表明,基于计算机英语口语实践系统语音识别技术提出了具有良好的实用效果。

提出了一种帧擦除掩蔽宽带嵌入式编码的方法,控制和调整激励信号的能量根据声音的类型。为了提高编码的鲁棒性,本文还采用控制技术的贡献在编码端自适应码书。为了提高编码的鲁棒性,本文还采用的方法控制的贡献在编码端自适应码书。

为了需要处理窄带语音和宽带语音编码器同时,如果后处理方案可以单独处理这两个信号,效果应该更好。由于没有时间改变编解码器的设计结构,一些帧擦除隐藏技术是不习惯在这个编码器。

数据可用性

标签数据集用于支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究是由(1)项目名称:混合教学方法研究与实践的伟大的反流行的精神融入外语“课程思想和政治”,项目类别:普通高校人文社会科学研究项目和大学河南省(2022 - zdjh - 00509号),和(2)项目名称:设计、开发和应用的网络开放课程在高职院校教学资源,项目类别:2020信阳职业教育教学改革研究项目(没有。ZJB2018)。

引用

o . Abdel-Hamid a·穆罕默德·h·江,l·邓·g·佩恩,d . Yu,“卷积神经网络语音识别,”IEEE / ACM交易音频、语音和语言处理,22卷,不。10日,1533 - 1545年,2014页。
视图: 出版商的网站 | 谷歌学术搜索
j . Al-Tamimi“重新pharyngealization声学相关的约旦和摩洛哥阿拉伯语:影响正式表示,“实验室音韵学,8卷,不。1,28-40,2017页。
视图: 出版商的网站 | 谷歌学术搜索
崔h . n . s . w . Byun, s . p .李”区别的特征向量选择基于语音的情感分类”朝鲜事务研究所的电气工程师,卷64,不。9日,第1368 - 1363页,2015年。
视图: 出版商的网站 | 谷歌学术搜索
t . Haderlein m . Dollinger诉Matoušek, e·诺斯“目标人慢性嘶哑的声音和语音分析韵律语音样本的分析,“Vocology Logopedics,语音矫正法第41卷。。3、106 - 116年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
c . t . Herbst s Hertegard d . Zangger-Borch, p。Lindestad”房地美mercury-acoustic分析基本频率,颤音,和次谐波,”Vocology Logopedics,语音矫正法,42卷,不。1,第29,2017页。
视图: 出版商的网站 | 谷歌学术搜索
a·k·希尔,r . a . Cardenas j·r·惠特利et al .,“有声音提示人类发展稳定吗?面部不对称波动之间的关系和声音的吸引力。”进化和人类行为,38卷,不。2、249 - 258年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
昌明投资k . m . c . c .许,t . s . Chi和y曹,“强大的语音活动检测算法基于频率调制的谐波特性及其DSP实现,”IEICE交易信息和系统E98卷。D,没有。10日,1808 - 1817年,2015页。
视图: 出版商的网站 | 谷歌学术搜索
t·g·康和n . s . Kim“DNN-based语音活动检测与多任务学习,”Ieice &系统交易信息E99卷。D,没有。2、550 - 553年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
p·h·库马尔·m·n·莫汉蒂,“有效的恐惧状态特征提取分析从人类的声音,“印度科学和技术杂志》上,9卷,不。38岁的1 - 11,2016页。
视图: 出版商的网站 | 谷歌学术搜索
a . Leeman h . Mixdorff m . O ' reilly m·j·科尔和诉Dellwo”Speaker-individuality藤崎模型f0特点:对法医声音比较,”国际期刊的演讲语言和法律,21卷,不。2、343 - 370年,2015页。
视图: 出版商的网站 | 谷歌学术搜索
f . l . Malallah s Knymg s . d . Abdulameer和a . w . Altuhafi“应用控制通过手动换向动作转换成声音,”国际科学与技术研究杂志》上,7卷,不。7,185 - 190年,2018页。
视图: 谷歌学术搜索
m . Woźniak和d . Połap语音识别通过使用伽柏变换和启发式算法,”肾元。临床实践,卷63,不。2、159 - 164年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
g .汉k·汉密尔顿,a·格拉斯伯格a·c·拉默特和j·沃特曼,“实时语音活动和沥青调制喉头切除术传感器使用头部和面部的手势,“美国声学学会杂志》上,卷137,不。4、2302 - 2302年,2015页。
视图: 出版商的网站 | 谷歌学术搜索
m .卧铺,“联系效应在巴塔哥尼亚威尔士嗓音起始时间,“《美国声学学会杂志》上,卷140,不。4、3111 - 3111年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
问:k . Ngoc h . t . Duong, h·t·Duong”审查的音频特性和统计模型用于语音模式设计,“计算机科学,3卷,不。2》,2015页。
视图: 谷歌学术搜索
s . s . Nidhyananthan k . Muthugeetha诉Vallimayil,“人类使用声纹识别实验室认为,“国际应用工程研究杂志》上,13卷,不。10日,8126 - 8130年,2018页。
视图: 谷歌学术搜索
s . Orlandi c·a·加西亚,a .电影g . Donzelli和c·曼”的应用模式识别技术的分类——术语和早产婴儿哭,”杂志上的声音,30卷,不。6,656 - 663年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
r·罗兹”老化影响的声音特性用于法医演讲者比较,”国际演讲语言与法律杂志》上,24卷,不。2、177 - 199年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
m . Sarria-Paja m . Senoussaoui, t·h·福尔克”低声讲话的影响,基于先进的语音生物识别系统”2015年IEEE 28日加拿大电气和计算机工程会议(CCECE)哈利法克斯,页1254 - 1259年,NS,加拿大,2015。
视图: 出版商的网站 | 谷歌学术搜索
c·金和r·m·斯特恩”Power-normalized cepstral系数(PNCC)强大的语音识别,”IEEE / ACM交易音频、语音和语言处理,24卷,不。7,1315 - 1329年,2016页。
视图: 出版商的网站 | 谷歌学术搜索
k .野田佳彦y山口,k . Nakadai h . g . Okuno理事长绪方和t .“视听语音识别使用深度学习,”应用智能,42卷,不。4、722 - 737年,2015页。
视图: 出版商的网站 | 谷歌学术搜索
y钱,m . Bi和k, t . Tan“很深的卷积神经网络噪声鲁棒语音识别,”IEEE / ACM交易音频、语音和语言处理,24卷,不。12日,第2276 - 2263页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
l . j . Li邓、y锣和r . Haeb-Umbach“noise-robust自动语音识别的概述,IEEE / ACM交易音频、语音和语言处理,22卷,不。4、745 - 777年,2014页。
视图: 出版商的网站 | 谷歌学术搜索
l . Besacier e·巴纳德,a·卡尔波夫和t·舒尔茨“资源不足自动语音识别语言:一项调查,“言语交际卷,56号3、85 - 100年,2014页。
视图: 出版商的网站 | 谷歌学术搜索
s .渡边有何利的t, s . Kim j·r·赫尔希和t·哈亚希,“混合CTC端到端语音识别/关注架构,”IEEE选定的主题在信号处理杂志》上,11卷,不。8,1240 - 1253年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
e·文森特·s .渡边答:a . Nugraha j .巴克和r·马克思”的分析环境,麦克风和数据模拟在鲁棒语音识别不匹配,”电脑语音和语言,46卷,不。3、535 - 557年,2017页。
视图: 出版商的网站 | 谷歌学术搜索
p . Swietojanski a Ghoshal, s . Renals“卷积神经网络对遥远的语音识别,”IEEE信号处理信件,21卷,不。9日,第1124 - 1120页,2014年。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

521年

下载

712年

引用