文摘

本文提供了一个深入分析在器乐timbre-speech色,设计一个模型分析康复职业治疗技术分析的基础上在器乐timbre-speech色,和测试模型进行比较。从人类发音的机制,本文模型的过程,人类表达式组成的时变线性系统激发,声道,辐射模型。系统的总体架构设计是根据汉语语音的特点和日常言语康复理论(高速逻辑理论)。的双重判断时间阈值和短时平均能量实现语音长度培训。语气和清晰的语调训练是通过线性预测编码技术(LPC)和自相关函数。使用DTW技术,孤立词语音识别是通过提取Mel-scale频率Cepstral系数(MFCC)语音信号的参数。系统设计相应的培训场景为每个模块根据提取语音参数,结合多媒体语音谱图运动情况与语音参数,最后提出了培训内容语音谱图,并评估培训结果通过人机交互刺激康复治疗的兴趣,实现病人的语言康复训练。在分析预处理和检测后的数据,它发现 - - - - - -所有三组值< 0.05,这是被认为是明显不同的。同时,所有受试者在治疗改变了他们的行为数据。因此,得出的结论是,音乐治疗技术可以改善病人的积极的目光沟通能力,口头命令的能力,能力和主动答疑后总结数据,即。这个实验的假设是有效的。因此,相信在器乐timbre-speech谱图分析技术可以实现康复治疗在一定程度上的影响。

1。介绍

声音是自然界中最常见的一种信号。声音产生的振动物体,甚至它的存在先于现实生活的事情。如果有对象和传播媒体的振动,产生声音信号。自人类诞生以来,声音占领最重要的一部分,人们的生活(1]。例如,自然声音传达信息:听风意味着风来了;听到雨意味着下雨了;听到水流意味着附近有河流或海洋。语言是人类社会中不可缺少的沟通工具是人们之间信号传输消息。方便、自然、高效,并能准确地传达所有消息。至于音乐,其内容已经上升到人体艺术的高度。人们可以使用不同的乐器来玩一千种美丽和愉快的音乐,音乐的帮助,来表达他们的情绪,比如快乐,愤怒,悲伤和快乐2]。基于重要性,效率、准确性和艺术性的声音,声音的研究一直是人类最著名的学科之一。许多学科已经形成,如音响、音乐学、语言学。近年来随着数字技术的发展,所有的机械设备已经开始参与人类社会和生产活动3]。假设机器可以准确地分析信号传达人的声音和做出相应的正确响应根据这些含义来达到相同的人与人之间的沟通。在这种情况下,毫无疑问,人类社会的生活和工作将大大增强。

语音信号处理技术已经成熟,语音识别技术也取得了良好的结果。因此,音色特性,研究语音识别的核心技术,也得到了更多的关注。许多演讲呸颜色特征被用来研究乐器音色,如光谱质量通量,碾轧,反演。然而,由于乐器的发声机制和音高范围不同于演讲中,有一个需要验证是否直接使用语音音色特性乐器的音调是有效的。这个项目首先提取常用的音色特性和提高他们基于现有的通过结合声学理论和音乐理论,提取的音色特征的分类结果比较,然后试图找到组合特性,可以合理地反映乐器的音色,最后使用组合特征进行分类和评估结果的组合特征(4]。仪器名称通过仪器识别的结合和旋律提取可以实现文本信息注释的音乐然后达到的目标自动转录和可视化。此外,仪器识别需要收购乐器的音色表示,技术创新,促进了新数字音乐的形成评估(5]。乐器识别的关键是实际特征提取乐器的音色,其次是instrument-specific名字注释使用机器学习。由于自动识别的难度乐器、人工注释占很大一部分音乐信息的注释(6]。识别的基础乐器是区分不同的音色。不过,没有精确,可计算的物理量,可以合理地描述语气的个人财产,这就是为什么人类的耳朵可以区分不同的乐器比计算机更快(7]。有某种程度的复杂性建模和分析音色。机器识别的乐器和仪器合成目前受制于缺乏音色的研究,所以准确提取乐器音色的乐器的特点是机器识别的关键。

在日常生活中,人类在许多方面可以表达他们的情感,如语言,面部表情,手势和心率。电脑可以获得一个或多个信号,分析它们,然后获得人类情感的变化。的人机交互方法,声音是一种最方便的沟通方式在日常人的生命。随着现代传感技术的成功开发,人们可以很容易地使人类电子设备来获取声音信号准确(8]。同时,由于人工智能和模式识别技术的快速发展,也可以使电子设备获取人类语音情感变化准确并快速作出反应。人类的健康状况不仅指身体健康,还包括心理健康。此外,心理健康会直接影响人的身体健康状况。如果一个人是易怒、焦虑和痛苦的每一天,他们的身体状况也会恶化。在这一点上,必须提供适当的指导,尽快走出负面情绪。然而,当受到负面情绪的影响,人们很少能找到适当的方法来减轻他们,不向心理咨询师寻求帮助。在这个时候,一个化身的存在可以快速帮助人们走出他们的负面情绪9]。因此,康复职业治疗技术的研究和开发的色调语音谱图分析音乐性能可以为我们的日常生活提供很多便利,解决许多社会问题。

当前国家乐器识别研究主要关注五个主要方向:第一是乐器识别基于频率和时域特征提取,二是乐器识别基于cepstral特性,第三是乐器识别基于稀疏表示,第四个乐器识别是基于概率模型,第五是乐器识别基于深度学习(10]。大多数当前的乐器识别使用浅结构,从提取特性来设计分类器。识别结果取决于组件的设计和组合分类器的优化。许多生物无关的特性提出了在工程认识乐器(11]。提供了大量的频域特性(频谱质心,亮度,谱值下降,光谱扩展,光谱斜率,谱熵谱平坦)。这些特性往往与时域特性来实现鲁棒性用于目标识别(12]。时域有很多精心设计的特性,比如起始点,时间和速度。MFCC分析着重于人耳的声学特征。声级人耳听到的不是线性的频率成正比的声音,和Mel频率规模更符合人耳的声学特征。李S H等人使用MFCC及其一阶差分音色特性来构建一个高斯混合模型的乐器13]。张问y提出多尺度MFCC特征,他们发现,多尺度MFCC能达到更好的分类结果与MFCC(二进制和智能化任务通过比较14]。通过研究进展和动态,很容易看到,乐器音色的识别仍受到许多理想化的先决条件,如仪器的类型已知的音频,同时假设工具开始,训练数据具有较高的信噪比和没有混响(15]。因此,认识到单声道和复调仪器研究人员仍然是具有挑战性的。

常用的语音情感特征主要从时域或频域分析语音特点而忽略了时频相关的言论(16]。语音谱图是一个图像代表演讲的变化频率随着时间的推移,横轴表示时间,纵轴表示的频率,连接时频域的言论,为研究提供新的想法和思想言论时频相关(17]。阁下我n .地址声谱图输入脉冲序列输出卷积神经网络和使用web作为语音情感特征和有前景的结果(18]。阴维等人提出了语音谱图的谱模式和谐波的能量特性和层次分类器分类使用语音信号(19]。的分类器使用SHAHZADI判别率进行优化,可以减少分类错误。此外,对于高度混乱的情感类别对串联分级机策略是用于提高识别性能(20.]。实验结果表明,语音谱图和谐波能量特性的光谱模式可以描述演讲的情感信息。根据模仿选择性注意机制,谭L等人提取语音谱图的特征图的三个通道的颜色,方向,和亮度归一化得到特征矩阵,和使用的方法来减少特征矩阵的维数,然后使用一种改进的支持向量机模型对语音情感识别(21]。与传统的语音情感特征相比,前者更容易区分。

可以看出从音色的研究内容的总结,学者们主要的音色特征信号进行研究或部分心杂音信号在不同阶段;然而,也有文献讨论音色信号康复治疗(22]。它们中的大多数都是探索基于一维信号。已经证明,音色信号,作为典型的信号,不挑战时发现迹象表明从一维的角度进行了分析。然而,它已经建立的音色信号,作为一个典型的不平滑信号,挑战是发现当信号从一维的角度进行了分析。当一维信号转化为一个二维谱图,不容易观察到的信息可以用图表表示,哪个更有利于研究信号特征(23]。针对上面的分析和探讨,本文提供了一个新的想法转化,辅助医疗康复治疗的康复治疗音色信号从一维到二维域相关问题研究的角度timbre-speech声谱图。

3所示。康复治疗技术的设计模型的基础上,分析在器乐Timbre-Speech色

3.1。在器乐Timbre-Spectrogram模型的建设

乐器音色的分类是人类认知和听觉过程密切相关,和收购场音色特性乐器音色的核心问题是分类。大脑使用约10000听觉神经纤维在感知乐器声音中提取低维感知相关的功能从高维音色感知功能来区分乐器的音调。删除最乐器声音的有用信息的分类,即。,to find the hidden adequate low-dimensional data to describe instrument sounds and to analyze and explore the intricate patterns of instrument tones accordingly [24]。例如,不同的共振引起的不同弦乐器的弦振动和其他非线性反馈引起的不同色彩的管乐器会导致单独的信封。启发,本文段时域包络,并计算每一段比整个单声部的长度分别是场音色特点。的时域包络信号的均方根(RMS)中提取出来的每一个pa的时域信号。

是时域信号, 是一个框架下标, 帧的总数, 帧长度。(1)找到信封,将得到的时域包络暂停的每个文件(2)实验拟合多项式的时域包络,收益率的配件订单子足以获得拟合曲线 (3)标准化曲线分别然后取对数 在哪里 的最小值 的最大价值 (4) 等于3 dB, -10分贝的位置,得到了什么 , , , 四个分割点,将时域包络线划分为开始,攻击,维持和释放,最终共有五段(5)计算出每段的长度比整个单声部的大小 总间隔的数据 ,第一部分的平衡 ,第二段的百分比 ,第三段的比例 ,第四段的比例 ,和第五段的比例

单音调的频谱不同的乐器千差万别。因此,频域特征对学习乐器音色是不可或缺的。在本文中,我们将计算的频域特征单一乐器的音调三光谱从STFT, CQT和MCQT分别。

短时傅里叶变换),从过滤器银行的角度来看,银行STFT滤波器的中心频率是线性增加,每个滤波器的带宽是常数,和质量因素是不固定的。STFT的信号是: 在哪里 是一个连续的窗口函数,文本采用汉明窗, 外的范围是什么 是0。

CQT的乐音信号具有明显的谐波结构,显著的音色特征提取中受益。实际音高频率上升指数和转换成一个线性关系与人耳的听觉感知。的 CQT的光谱信号的组件 框架是:

是常数,与高频部分和低频分辨率高频决议在低频区域。一个音符的低频分量更重要的是,和 满足这种需要更多关注计算准确计算低频。STFT,另一方面,使用相同的分辨率在整个频率轴,需要更多指向准确计算低频高频但不是很多点,这无疑降低了计算的有效性。CQT的光谱,相对应的下标谐波不再下标对应基本频率的整数倍。之间的间隔 谐波和 谐波是相同的CQT光谱中不同的音高相同的参数。如果基本的频率是:

光谱图是一种信号的时频表示通过傅里叶变换。横轴是时间,纵轴是频率,映射的每个信号帧的声谱图旋转90度不同的色度,然后缝合。谱图的条纹的强度可以描述信号频率的力量。通过比较目标的声音(语言和生成的演讲,时间和频率的差异之间的合成和目标语言可以直观地看到。语音谱图是一种形象,代表了语音频率的变化随着时间的推移,和它的横轴表示时间;连接时频域的言论和建模是一个图像提供了一种新的方法来研究话语的时间和频率域之间的关系。获取语音谱图的原始语音信号,首先,原始语音信号 窗口的框架,并根据方程(离散傅里叶变换1)。

在方程(1) , 的离散傅里叶系数吗 ; 是窗口函数,本文中使用的汉明窗; 是窗口的窗口函数。从这个演讲的 可以获得的 根据方程(2),对数能量谱

在方程(2), ,表示为演讲的水平和垂直坐标频谱图像。然后,log-energy语音谱图 灰度语音谱图图像灰度比例吗 相应的时域语音信号 语音谱图是一种图形化显示的时变语音的频谱特性,可以有效地捕捉语音信号的动态变化。语音谱图,在水平方向上梯度值表明语音能量的转变在一个特定的时刻,不同的频段。同样,在垂直梯度值顺序代表演讲在一个特定的频带能量的变化。在对角线方向和梯度值可以显示语音能量在不同时期的演变和频带。演讲的常用的方法提取纹理特征光谱图log-Gabor小波变换,完全局部二进制模式,韦伯局部特征,和当地的定向功能。语音时域地图和语音频谱图如图1

二维平面图,集成的时间和原始语音信号的频域信息,反映出语音信号的强度变化在不同频率指定波形的随着时间的推移,横轴是时间轴,纵轴是频率轴,和坐标点的值表示的能量演讲。语音谱图使用颜色来表示点的功率的大小。颜色越鲜亮,地址的重要性越高,使用这个描述三维空间中的信息在一个二维平面上(25]。Python工具描述了同一个人的语音谱图解释这个短语“即使下雨我将去”在不同的情绪。可以说,Python是一种简单的语言,很容易读和写。当程序员遇到问题,他们可以将更多的注意力放在这个问题比编程语言或语法。免费Python是免费和开源的。这意味着程序员可以分享、复制和交换免费,Python帮助形成一个强大的社区更加成熟、技术先进。在颜色方面,有更多的深黄色部分的愤怒,恐惧,和快乐的状态,这意味着有更多的能量在演讲中演讲者很兴奋或激动时,少当演讲者是悲伤。情感识别的流程图基于timbre-speech谱图如图2

3.2。康复治疗与Timbre-Speech谱图分析模型设计

软件主要由几个相对独立,但密切相关的功能模块。包括主模块、培训模块,材料管理模块、课程管理模块、病历管理模块,数据统计模块。统计信息,如每个病人的治疗方案和治疗效果的康复治疗,和数据,如医疗记录,可以有效地管理。治疗师与权威可以访问病人的治疗历史数据和打印或档案在任何时候;显示的文本、声音和图像数据用于训练以及图形数据的管理和治疗效果分析统计数据还包括电子医疗记录的管理。治疗师,他们可以根据他们的需求,画出图形,演讲记录,输入文本,等等,并将它们添加到数据库的数据,提供各种类型的康复训练模块,并设计不同的康复训练模块根据各种方法在治疗失语症的实践证明。例如,命名培训、句子填空题训练,谜题训练,朗读训练。有经验的治疗师的责任是制定不同的治疗计划对不同类型和严重程度的患者(26]。通过该系统,治疗师可以快速开发各种有针对性的康复治疗计划,并结合治疗效果评估,治疗师可以很容易地找到最好的治疗方案对一个特定的病人;基于数据的病人在接受多个治疗,他们可以得到的统计信息当前病人的治疗效果评估、图形处理效果图表和统计数据,这可以帮助医生作出安排根据治疗效果并结合治疗周期。图形处理效果图表和统计方便医生创建和调整治疗计划根据治疗效果并结合治疗周期。同时,治疗效果的趋势图可以提高病人对康复治疗的信心。系统的框图如图组件3

真正实现智能辅助诊断和康复治疗系统,从病人的特点众所周知的演讲的异常病人的地址不能有影响力的基础上,分析了语音段(也就是说,言语之间的前端有一个教训,最后的词汇,当它可能有超过两个音节),但必须分析基于音节或押韵,否则大部分患者的语音信息赤字,这直接影响康复训练的有效性。因此,这个项目的重点是研究语音评估系统和人工智能调度功能。

训练模块调用其他模块完成康复过程。培训模块是整个系统的功能中心和几乎所有其他模块调用函数。(1)调用病历信息管理模块获取病人信息目前培训课程计划。(2)调用存储和显示统计信息统计模块。(3)电话语音处理获得声音信号和显示波形。(4)调用图像处理模块生成语音谱图,统计图表,显示。(5)电话培训程序库管理模块获取当前培训的培训材料。开始培训,用户选择特定用户和相应的培训计划。自动或手动收购程序一步一步的材料,显示其文本和目标语音波形,并生成目标语言的语音谱图和其他参数。客户端显示的记录语音信号,和记录的声音波形显示,随着语音谱图和参数记录的语气,如图4

模块操作数据库表添加、删除和修改数据,如医疗记录信息,培训协议,培训材料。这些模块也有相互之间的调用。医疗记录信息的管理包括病人选择的训练治疗计划,而管理的培训计划由每个项目的具体培训材料。同时,物料管理涉及到调用函数如录音、语音播放,图像显示。

管理显示的文本、声音和图像数据用于训练,以及治疗效果管理图形数据和统计数据分析,还包括电子病历的管理(对治疗师,他们可以根据他们的需求,绘制图形,记录声音,进入文本,等等,添加到数据数据库)。有经验的治疗师的责任是制定不同的治疗计划对不同类型和严重程度的患者(27]。治疗师可以快速开发各种有针对性的康复治疗计划通过系统模块。结合治疗效果评价,治疗师可以很容易地找到最好的治疗方案对一个特定的病人;基于多个治疗患者的数据,当前病人的治疗效果评估统计数据。调度、发展和调整治疗方案。

4所示。分析的结果

4.1。康复治疗技术分析在器乐Timbre-Speech谱图分析

由于人体器官的代偿功能,病人视觉图像识别的敏感性优于常人。由于他们的生理缺陷,患者也不同程度的依赖,训练,和使用的愿景。他们从普通人的视觉图形识别灵敏度因其光学补偿的实践以来收到明确的视觉识别的视觉刺激。它也被患者倾向于使用直观的认知策略在他们的心理过程由于语言障碍28]。语音谱图作为教具的使用病人的演讲培训是基于考虑这种认知特点和视觉灵敏度的优势,充分利用残余听力,和最大化他们的视力的补偿功能。每个维度的重要性的语音语音谱图如图5

从认知心理学的角度来看,学习发音是一个自动化程序获取知识的过程。在这个过程中,反馈起着重要的作用;当听到人学会说话,语音信号通过耳蜗和光谱分析由听觉神经传送到大脑;病人很难学会说因为缺乏听觉反馈作为一个必不可少的环节。语音谱图可以传播声音信号通过视神经到大脑,然后替换为光谱分析耳蜗,这样病人可以建立语音信号的反馈。然后,他们真的可以感知发音,理解它,学习它,最后达到掌握发音的目的通过人工反馈系统。光谱图可以为病人提供准确、客观的反馈练习发音。它的优势在于,音素的谐振峰值曲线谱图能准确反映的变化在实时语音声道。病人康复治疗的流程图如图6

本文研究的技术手段病人康复基于频谱图的语言。如果这项研究的对象是病人,他们无法沟通,不仅会直接与他们交谈并完成实验但他们还将有限的理解、支持和合作的机构,家庭,教师,和父母,甚至无法完成一半。使用语言的实验结果图作为教具,病人的语言培训是令人信服的,该项目是可行的,和过程是可信的,以便它可以扩展到病人的指导下语言培训老师或父母。相信随着科学技术的进步和普及,和国家的关注和投资的语言康复训练患者,不久,不仅将音标符号被广泛使用作为一个有效的教学援助但更先进和现代设备和工具可用。

病人是疾病的结果的内部信号来源,故障演讲分析,同步呼吸困难或不协调处理导致演讲。听和看可以刺激人类大脑,刺激响应信号原始记忆和口语能力;更多的演讲可以提高言语交际。根据病人的类型和程度的损伤的辅助诊断、范围、起点,确定康复训练的内容,有针对性的开发培训项目(29日]。康复治疗的培训原则:循序渐进,从简单到复杂,从浅到深,从少到多,从康复训练的基本困难的行为能力训练。康复的内容应该很容易在早期工作,丰富多彩,首选的病人建立和巩固病人对治疗的信心,调动康复训练的动机。重点是分析病人的两个输入:触摸输入和语音信号输入,了解病人的指令和口语表达。失语症患者经历了康复训练后,完成相关培训信息的条目。然后系统分析和评估这些信息根据评分标准的培训主题,从而使培训结果。

4.2。语调语音谱图分析实现康复治疗技术

每一个八度音阶的旋律音乐数据集表示为一个序列包含32个独特的热向量,其中每个独特的热向量有130维度和代表一个季度注意细胞。MIDI是一个缩写乐器数字接口,直接为乐器数字接口,可以被理解为一个协议标准或技术。不过,它不指一个硬件设备。MIDI系统是一个组合、编排和电子模拟系统性能。MIDI数据不是一个数字音频波形但是音乐代码或电子得分。第一个128维代表MIDI音高范围(0 127)四分之一的时间注意细胞。129维代表继续注意,专为长信,最后维度代表其余的,即,没有声音。验证了改进模型的有效性,j象征性的软件被用来计算总共50 chord-related 25实验生成的生理音乐的特点,包括三合会持续时间、七和弦持续时间、小三,和主三和弦时间比率。次要的和重要的三合会持续时间比的比值小三和弦的术语主要三合会的时间(如果一个和弦注意持续时间,那么它的课程将四分之一的共鸣的四倍注意持续时间。当音乐不包含小或大三和弦,这个特征的值是0),三合会是最常见的和弦,和不同的和弦可以显示不同的情感色彩和唤起其他情绪。 Major triads are usually considered beautiful and sunny, while minor triads are gloomy. Therefore, the music with more major triads is generally attractive and bright, while the piece with more minor triads is melancholic. Therefore, by comparing this model feature before and after the improvement, we can see the change in the model’s ability to learn chord information. The comparison of the duration ratio of the effect of the improved model is shown in Figure7

添加情感语音实验的病人倾向语料库,病人倾向语料库分为训练集和测试集的比例8:2,和3535语音样本训练集的获得病人倾向语料库和875年从测试集样本;3535语音样本训练集的健康语料库和875测试集样本输入病人倾向识别的改进模型。从病人的混淆矩阵趋势添加到感情的演讲,在病人倾向样本,688个样本正确预测,187个样本是错误的预测。在健康的样例中,有626个样本预测正确预测错误和245个样本。正确地预测样本的数量在病人倾向组54的正确预测样本数量多健康对照组。在实验中添加图片增强病人倾向语料库,病人倾向语料库与图像增强分为训练集和测试集的比例根据8:2,和21888年样本训练集和测试集的5472个样本病人倾向语料库得到;21888个样本训练集和测试集的5472个样本健康语料库是改善病人倾向识别模型的输入。

在病人倾向样例中,有4538个样本正确预测和934错误的预测。4625年健康模型,样本预测正确,和847年预测。正确地预测块的数量在健康对照组87余正确预测样本的数量在病人组的倾向。通过比较后的混淆矩阵添加负面情感语料库和图像增强病人的趋势,相应的三个评价指标的比较结果准确性、精度、计算和回忆,和康复治疗技术的比较对之前和之后的数据增强如图8

使用SPSS 20.0分析原始数据。由于小样本大小( = 5),在这项研究中使用的数据的总体分布是未知的,因此,威尔克森信号等级测试用于测试实验的影响。这表明预处理和检测后的区别是重要的在注视的目光;通过数据分析,可以看到从图8威尔克森,测试前和测试后的目标行为服从指令符号秩检验, ,这表明预处理和检测后的区别在以下指令是重要的;通过数据分析,可以看到从图8测试前和测试后的目标行为积极回答问题符号秩检验, ,这表明预处理和检测后的区别在服从指令是重要的。这表明,预处理和检测后的区别在活跃的回答是可观的;的跳跃活动答案的数量显著不同。C3是处于增长状态,直到第七治疗但跳得第七,然后从第八治疗在稳步上升到实验的最后。

康复职业治疗技术基于器乐timbre-spectrum图分析是一个重要的工具来巩固和发展语言治疗和韵律训练的结果。语言康复是词的三个主要组件整合训练、句子训练,和现场实践。这个平台是当前选中的内容孤立词训练,使用DTW词语音识别技术识别,并在屏幕上显示的比较结果来实现最初的训练效果。语音信号的端点检测是必不可少的孤立词识别。识别有意义的演讲可以减少操作和显著提高语音识别的准确性。如果一个高输入信噪比可以保证,然后演讲片段可以区别于背景噪声的短时能量的值。然而,在实践中,确保高的信噪比是复杂的,结论是基于能量的粗糙。语音信号的短时在零率远低于背景噪音。当系统法官的演讲,它可以实现康复治疗的效果通过进一步使用短时trans-zero率判断基于短时能量。

5。结论

随着计算机技术的发展,语音信号处理技术,它是一个总趋势结合语言康复训练和计算机技术。在本文中,我们设计和开发一个康复治疗技术在器乐timbre-speech谱图分析的基础上根据言语康复训练的需求。演讲从语音清晰度机制,生产过程建模为时变线性系统包括激励、声道和辐射系统串联。然后,整个设计是基于语音康复理论高速逻辑理论和器乐演奏音色的特点以及系统的定位。三个平台的系统包括:言语治疗,作文训练,和语音训练,并且包含六个模块:发音训练,体积训练,语调训练长度,语调训练,语调训练长度,语调训练,清晰而浑浊的语调训练,和词的训练。系统实现了发音和卷训练使用短时平均能量的值。语音训练的双重判断实现时间阈值和短时平均能量。清晰和浑浊的音素和声调识别的过程被发现使用残余信号的自相关函数法。实验结果更准确清晰,浑浊的音调音调识别更少和更有针对性的算法需要被识别。本文设计和实现了孤立词训练基于DTW这个词语音识别技术在培训过程。 The experimental results showed that the accuracy of isolated word recognition is high, and the training goal is achieved initially.

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有竞争的经济利益或个人关系可能出现影响工作报告。

确认

这项工作是支持的航空服务学院和音乐,南昌香港大学。