研究文章|开放获取
Qianyu曹,韩梅郝, ”优化基于安卓平台的智能英语发音训练系统”,复杂性, 卷。2021年, 文章的ID5537101, 11 页面, 2021年。 https://doi.org/10.1155/2021/5537101
优化基于安卓平台的智能英语发音训练系统
文摘
英语口语,作为一种语言工具,不仅是英语学习的重要组成部分也是一个重要组成部分。对于非本地的英语学习者,有效的和有意义的声音反馈是非常重要的。目前,大多数传统的识别和纠错系统的英语口语培训还在理论阶段。与此同时,相应的高端实验原型也有大型和复杂系统的缺点。在语音识别技术,传统的语音识别技术并不完美的识别能力和识别精度,它过度依赖于识别的语音内容,这是很容易受噪声影响环境。在此基础上,本文将开发和设计一个英语口语发音训练助理系统基于Android的智能手机平台。深入研究和分析的基础上的英语口语语音校正算法和语音反馈机制,提出了一种嘴唇运动判断算法基于超声波检测,用于帮助传统的语音识别算法在双反馈的判断。智能语音培训,反馈机制的双重指标评分机制,全面介绍了评估演讲的演讲教练及时和正确的演讲者的演讲。实验结果表明,语音系统的精度达到85%,使英语口语培训师的水平在一定程度上。
1。介绍
作为最成熟的语言在全球化,英语已经成为不可或缺的交流工具在人们的日常生活。英语口语,作为英语学习的一个重要组成部分,其相应的发音,非本地的英语国家的语言环境,教师的英语口语英语口语的因素限制了发展(1,2]。智能语音识别技术的快速发展,专业的设备和相应的英语口语学习软件相关培训层出不穷。然而,这样的软件通常只有一些单一的功能,它只能帮助英语口语从业者进行一些简单的口语发音训练,因此缺乏有效的反馈一些学习者的口语发音,所以其相应的功能是有限的。培训效果往往不能令人满意(3- - - - - -5]。与此同时,传统的语音识别技术本身是容易受到周围环境的干扰和其他问题。同时,专业英语口语培训机器太复杂和巨大的,它没有便携的特点,所以很难实现民事和轻量级6]。因此,如何设计一个智能英语口语培训设备和设计一个合理的和有效的训练算法是非常重要和有意义的。
在此基础上,大量的科学家和相关研究机构进行的研究英语口语训练算法。传统的英语口语培训主要侧重于研究语音识别算法,主要依赖于计算机技术的快速发展,人工智能技术,信息和通信技术(7- - - - - -9]。在连续语音识别技术的发展,主要有语音信号线性预测编码技术,动态时间规划调整技术,线性预测倒谱技术和动态时间扭曲技术(10- - - - - -12]。在语音识别技术的应用在计算机辅助语言学习,主要的应用信息技术结合语音识别技术与英语口语培训课程,创造一个真正的英语口语英语口语学习者的学习环境,并在此基础上,为了促进英语口语学习的良性循环,我们应该增加相应的多媒体技术,提高英语学习者的兴趣13- - - - - -15]。相关科研机构设计了不同的语言训练算法基于成熟的语音识别系统和设备,如卡内基梅隆大学的语言辅助学习系统在美国,有关国家的教育辅助学习系统在亚洲,和语言辅助教学系统相关的欧美国家的球员(16- - - - - -19]。基于上述研究,传统的英语口语发音练习过度依赖于特定的实现语音识别技术,它也取决于相关的多媒体技术的发展。在此基础上,本文将开发和设计英语口语辅助发音训练系统基于Android的智能手机平台。的基础上,深入研究和分析英语口语发音校正算法和语音反馈机制,提出了一种基于超声波的嘴唇运动判断算法检测,用于帮助传统的语音识别算法,使双反馈的判断。智能语音培训,反馈机制的双重指标得分机制引入全面评估演讲教练的发音和正确的发音。的发音纠正率实验结果表明,该系统达到85%,使英语口语培训师的水平在一定程度上。
基于上述研究背景和意义分析,本文的结构如下:在部分2,我们将分析智能英语发音训练系统的相关研究文献,给现行的相关制度的缺点;节3,我们将把重点放在嘴唇运动判断算法的研究和分析基于超声波检测技术的语音识别算法并给出一些建议。部分4将基于Android的手机开发测试和分析相应的实验结果;最后,本文总结了部分5。
2。相关工作分析:智能英语口语发音训练的研究和分析
智能训练英语口语的发音系统的主要困难在于识别算法的实现和相应的反馈评价机制算法(20.- - - - - -22]。演讲者语音识别方面的算法,识别算法主要有集中在演讲者语音识别算法。大量的研究人员和研究机构研究和分析这类算法。流利的发音训练系统设计的研究人员来自欧美国家采用基于Sphinx引擎自动语音识别技术。系统可以纠正错误的音节和韵律英语口语学习者。然而,系统指出错误相关的音节太有限,和整个系统太机械分析学习者根据单词的发音。日本研究机构开发了一个英语口语辅助发音训练系统,主要为亚洲非本地的英语国家。它有自己的局限性。它只接受非本地的口音,只提供了相应的准确的信息反馈和可视化。系统中使用的模型也是一个特定的模型; the relevant research and development institutions in the United States have designed a software development kit for oral English pronunciation training, which can realize the oral evaluation of English speakers and also provide the pronunciation spectrum and the corresponding duration scoring function, but the system depends on professional auxiliary training equipment. It is not portable and light. At the level of computer-aided pronunciation, computer-aided pronunciation assessment technology can make learners know their pronunciation level and ability at any time, so as to learn more targeted and train in the right direction. On the basis of speech evaluation technology based on statistical speech recognition, related research institutions and linguists have studied the core algorithm of speech evaluation, the adaptive method of acoustic model of speech evaluation, the application of duration and speed in speech evaluation, and the scoring mapping model of speech evaluation system, and many reliable algorithms are given.
3所示。分析和研究嘴唇运动判断算法基于语音识别技术的超声检测
本部分将重点分析英语口语发音训练核心算法设计。本文最初的语音识别算法基于超声波检测的嘴唇运动判断算法,为了帮助整个系统的准确识别。语音识别技术的相应算法核心架构图所示1,我们可以清楚地看到整个核心算法的运行机制。
3.1。分析英语口语发音的双重检测算法
本文的核心算法的英语口语语音识别算法的混合检测方法结合了传统的语音识别算法和辅助唇检测算法。算法主要由语音信号预处理模块,语音功能和议长唇特征提取模块,语音动态时间调整识别算法,算法和语音识别反馈评估机制。相应的识别原理框图如图2相应的模块,技术细节如下。
语音信号预处理模块:当演讲者进行英语口语训练,处理相应的声音通过语音预处理模块。相应的处理步骤主要包括语音信号的数字处理,语音端点检测,语音帧检测、预加重检测演讲窗口检测和演讲。
数字化的预处理部分演讲中,演讲主要是对应的模拟信号转换成相应的数字信号,和相应的数字化过程包括语音模拟采样和数字量化处理。在实际的系统设计中,本文使用Android手机平台的独特平台进行取样和合理分析相应的数字采样率和相应的量化在数字化过程中实现当前的输入声音配置需求。采样和数字量化后,有必要pre-emphasize当前声音文件,以提高输入语音信号的高频信号和低频信号过滤掉相应的语音信号,使信号频谱更平坦。在这个模块中,安装相应的数字滤波器。相应的数字滤波器的核心计算公式见公式(1),W相应的截止频率和我是过滤器的顺序。完成数字滤波后,对应的数字语音文件需要处理框架和窗口。在处理的过程中,相应的语音输入发生在很短的时间内被定义为一个稳态的输入信号,它被认为是一个固定的信号。对于长期信号,短时信号将被用作参考帧分割处理,以实现长期的目标语音输入合理的分析和预处理;在此基础上,本文使用的构造函数对应于公式(2),相应的频率设置为50 Hz,设计相应的采样点到5000点,对应的窗口函数公式fn,相应的语音信号长度设置为N,相应的“公司”代表调整长度,和相应的“重叠”表示重叠的部分。
在语音信号端点检测技术方面,主要有两种算法。语音端点检测部分主要是基于短期能量检测技术来处理声音的部分,而动作检测算法主要用于判断嘴唇动作组件对应于演讲者。在实际的判断,”和“计算结果将结合判断两个组件的结果,只有当结果是不正确的。当有一个问题,做一个语音识别判断。在短期内能量检测语音部分的一部分,它主要是基于规则的语音能量随时间变化。相应的核心计算公式见公式(3),相应的地方n代表了语音信号的帧数,相应的能量是由Wn和相应的b (n)代表了窗函数:
在运动检测算法,它主要是根据说话人的唇移频检测技术,主要包括两个检测步骤,相应的边界扫描和相应的二次频率峰值检索。在相应的边界扫描技术水平,主要的范围来确定相应的频谱唇反思,实现信号的快速傅里叶变换,并迅速变换相应的时域信号。相应的光谱信号处理后,选择相应的主频率峰值为中心的传输频率,和频率分正面和负面的方向扫描。在相应的二次频率峰值检索部分,主要目的是确定二次峰值对应的频率谱的结果。
在语音信号特征提取方面,它主要取决于两个方面,即语音特征提取和嘴唇运动特征提取。在相应的语音特征提取,它主要包括预处理技术,快速傅里叶变换技术、谱线能量处理技术和DCT倒频谱算法。在相应的预处理阶段,它本质上是类似于整个系统的预处理模块。快速傅里叶变换的层面上,它主要是快速提取语音信号的能量信息,并迅速确定相应的能量分布。此外,相应的谱线能量计算根据相应的快速傅里叶变换结果,最后DCT倒频谱的语音特征提取算法(主要语言功能包括声纹,体积,和语气)。嘴唇运动特征识别的主要任务是把嘴唇反射信号,提取的嘴特性相应的单元基于单元,并查询相应的发音表(基于10个基本口中的发音表类型)段相应的信号,提取相应的频移特性。语音信号特征提取的原理图如图3,我们可以清楚地看到语音识别的原理流程图和嘴唇特征提取识别算法。
动态时间调整算法之间的区别主要是解决实际的输入语音和语音评价系统。本文算法的动态时间是用来拉伸或压缩相应的语音输入,直到符合参考。动态时间调整算法的核心原则用于本文如图4。从图可以看出,当动态调整算法运行时间,主要选择相应的参考语音模板和相应的测试语音模板进行成绩分析。它直接项目对应的帧数成相应的坐标轴x和相应的坐标轴y;那么相应的帧数,对应于每个交点在相应的网格可以被定义为相应的匹配程度。此时,相应的动态时间规整算法寻找最佳路径的起点和终点通过每个交点同时确保相应的测量框架的每个交点的距离相应的路径是最低。
(一)
(b)
(c)
(d)
在相应的演讲评价机制,两种不同的标准发音模板(对应模板1和模板2)用于反馈比较。相应的原理图如图5。从图可以看出,相对应的英语口语的发音是测试3。在实际的反馈比较,帧匹配两者之间的距离相应的特征参数主要是相比,和相应的帧匹配距离比较。帧匹配距离图的D1, D2和D3。帧对应的学习者之间的距离和相应的标准发音可以表达的平均距离。基于相应的平均距离,转化为相应的评估分数,计算相应的发音水平的演讲者。
基于上述原理的分析和研究,英语口语的发音训练的核心算法本文基本上是构造。同时,传统的语音识别算法的抗干扰能力差的问题都解决了。相应的双语音特征提取技术使用混合算法传统语音识别和嘴唇的运动识别,使整个语音识别的准确性。双重的判断基准评价机制可以显著提高演讲者的演讲水平,和相应的判断标准也可以帮助提高演讲者自身的口语水平。
3.2。英语口语发音训练的研究和设计基于Android的智能手机平台
为了验证算法的可实现性,本文设计并验证该算法基于安卓移动平台。其主要目的是实现智能英语发音训练系统形式的动画,声音援助,通过安卓移动平台图片和文本。相应的系统组织模块图如图6。从图可以看出,相应的硬件设计主要包括设计I / O模块,分模块设计、反馈模块设计和用户界面设计。对应的I / O模块设计主要是使用内置的麦克风和耳机的Android手机系统实现输入,抽样,和语音信号的处理;相应的评分模块设计层面主要包括双基准评分机制,相应的评分参数生成和相应的分数转换机制是非常重要的;在相应的反馈模块设计水平,两个硬件处理模块主要应用,分别处理语音信号的傅里叶变换和嘴唇运动处理议长和综合信号处理在相应的特定的处理机制。图形化的形式显示发送到安卓移动平台;与此同时,在此基础上,混合处理信号的共振峰对比图是由使用图表引擎开源软件;相应的用户界面主要是开发基于Android平台,和相应的语音助理系统的功能键主要是设置在相应的功能。
在软件层面,相应的开发环境主要是在eclipse集成环境中实现的。相应的开发环境如下:电脑使用Windows XP系统;开发组件使用JDK 6;平台的硬件环境使用Android智能手机的品牌;软件平台使用Android OS2.2;使用Java编程语言。把图像参考函数的发展相应的评分机制作为模板,相应的核心代码如下,和相应的图表活动是图形绘制类功能。目的意图= new意图(FunctionTraining, ChartActivity。类);捆捆包= new ();包。putSerializable {input_p_date "},Factory.get_input_p_data ();Bundle.putSerializable {“file_p_data factory.get_f_p_data {}};Bundle.putInt {“input_frames factory.get_input_frames {}};Bundle.putInt {“file_frames factory.get_input_frames {}};Intent.putExtra {“b”,包};startActivity(意图);
基于上述核心代码,开发其他类似功能。
4所示。实验和分析
为了验证该算法的优势与传统英语口语发音训练算法相比,本文进行比较的实现,和相应的实验平台是一个Android手机。相应的实验水平主要从三个层次的比较分析语音识别速度测试,环境抗干扰测试,口语发音辅助培训效果测试。
4.1。语音识别率测试实验
在实验之前,记录标准的语音数据库放入系统,和10个志愿者用于语音测试。在该测试中,相应的环境变量控制(控制环境噪声水平保持相同的水平)。的平均语音识别精度测试样品如图7。从图可以看出,相应的语音识别算法精度明显高于传统的语音识别,这表明,结合语音识别和语音识别算法的嘴唇运动检测具有明显的优势。
4.2。环境的抗干扰性能测试
在这个实验中,选择60 dB音乐环境噪声,和对应的噪声源距离在相应的环境中是一致的。基于这样的环境下,环境这个算法和传统算法的抗干扰性能测试,以及评价指标的TPR价值系统。环境的抗干扰性能的对比曲线对应于测试样品如图8。从图可以看出,TPR算法下的相应的系统的价值大约是75%,远高于传统算法。
4.3。英语口语发音训练测试
此测试程序的目的是要测试的影响英语口语提高英语口语。相应的培训效果转化为相应的口语测试成绩进行定量评价。十个来自外来的志愿者英语国家选择的测试。实验是基于提高学员的英语口语成绩测试和相应的实验前后一周。培训期间被设置在30、40、50、60天。一般的英语口语成绩之前和之后的志愿者培训如表所示1。从表中可以看出,志愿者们已经取得了很大的进步在不同指标后的英语口语训练。图9提供一个详细的比较图表的影响英语口语的发音训练四个周期。从图表可以看出,本文算法具有明显的优势,而这些优势将变得越来越明显的随着训练时间的发展。
|
||||||||||||||||||||||||||||||||||||||||||||||||||
综合分析表明,该算法和设计系统有明显的优势提高口语发音效果与传统的系统相比。
5。总结
本文主要分析传统英语口语发音练习的缺点,指出相应的核心算法具有严重的噪音问题。基于研究现状的分析英语口语发音的帮助,本文开发和设计英语口语发音辅助训练系统基于Android的智能手机平台。深入研究和分析的基础上,英语口语发音校正算法和声音反馈机制,提出了一种基于超声波的嘴唇运动判断算法检测,用于帮助英语口语发音训练。传统的语音识别算法使双反馈的判断。智能语音培训,反馈机制的双重指标得分机制引入全面评估演讲教练的发音和正确的发音。的发音纠正率实验结果表明,该系统达到85%,使英语口语培训师的水平在一定程度上。在后续的研究中,本文将集中在语音识别的应用混合算法在其他语言学习,进一步促进它的使用。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称他们没有利益冲突或人际关系可能出现影响工作报告。
确认
本研究由试验和技术提高大学英语教学的实践,由四川社会科学研究项目(SC16WY006)。
引用
- x y刘j .沈,“android设计的英语发音训练系统”,应用力学和材料卷,631 - 632。4、427 - 430年,2014页。视图:谷歌学术搜索
- y,“设计学生的口语发音训练系统基于计算机VB平台”国际期刊的新兴技术在学习(iJET),14卷,不。6,41-52,2019页。视图:出版商的网站|谷歌学术搜索
- t·李,j .太阳和l .王”运动的一个智能优化方法基于BP神经网络的管理系统,“神经计算和应用,10卷,不。6,41-52,2020页。视图:谷歌学术搜索
- k . z陈:约翰逊,美国戴et al .,“在android应用程序上下文策略实施许可事件图”遗传,卷110,不。6,586年,页2013。视图:谷歌学术搜索
- z阴”,培训和评估系统的基于语音识别技术的智能口语发音,“国际期刊的新兴技术的学习,13卷,不。4,11-23,2018页。视图:出版商的网站|谷歌学术搜索
- h . s . Lee能剧,j·李,k . Lee)和g·g·李,“外语辅导口语对话中使用口语对话系统中,“IEICE交易信息和系统E95卷。D,没有。5,1216 - 1228年,2012页。视图:出版商的网站|谷歌学术搜索
- j .周”,基于人工智能的英语口语互动教学平台建设基于应用程序的问题,目前的智能产品,”IOP会议系列:材料科学与工程,卷569,不。4 p。052055年,2019年。视图:出版商的网站|谷歌学术搜索
- h . s . Lee能剧,j·李et al .,“外语辅导口语对话中使用口语对话系统中,“IEICE &系统交易信息,卷95,不。5,1216 - 1228年,2017页。视图:谷歌学术搜索
- h . Nakawala、g . Ferrigno和e . De Momi“胸腔穿刺术的智能手术训练系统的发展,“人工智能在医学上,卷84,不。4、50 - 63年,2018页。视图:出版商的网站|谷歌学术搜索
- w·杨,l·金和m .刘”DeepWriterID:端到端的在线text-independent作家识别系统,”IEEE智能系统没有,卷。31日。2,45-53,2016页。视图:出版商的网站|谷歌学术搜索
- j . j . Castro-Schez c . Glez-Morcillo j . Albusac et al .,“支持主动学习的智能辅导系统:一个案例研究在预测解析学习,”信息科学,卷544,不。5,23-31,2020页。视图:谷歌学术搜索
- c·杨,z邓,K.-S。崔,王,“Takagi-sugeno-kang转移学习模糊逻辑系统的自适应识别癫痫脑电图信号,”IEEE模糊系统,24卷,不。5,1079 - 1094年,2016页。视图:出版商的网站|谷歌学术搜索
- h . Akkermans“智能电子商务:从技术价值,”IEEE智能系统,16卷,不。4、8 - 10,2001页。视图:出版商的网站|谷歌学术搜索
- j .红宝石,s . Daenke y元et al .,“自动语音识别和机器学习的机械手臂手术,”《美国的手术,卷2,不。1,10 - 18,2020页。视图:谷歌学术搜索
- g·r·基德和l·e·休谟“语音识别为多个乐队:对语音清晰度指数”《美国声学学会杂志》上,11卷,不。2、112 - 123年,2016页。视图:谷歌学术搜索
- j . a . Beyea k·麦克伦m . s .哈里斯et al .,“人工耳蜗在成人:年龄和耳聋的持续时间对语音识别的影响,“耳科& Neurotology,37卷,不。9日,1 - 12,2016页。视图:出版商的网站|谷歌学术搜索
- j . Shehorn o . Strelcyk, p . Zahorik”之间的关联语音识别在高水平,中耳肌肉反射和噪声暴露在听力图正常的人,”听力的研究,卷392,不。4 p。107982年,2020年。视图:出版商的网站|谷歌学术搜索
- f . De湿,n . Kleynhans d . Van Compernolle et al .,“资源不足的语言语音识别:隐马尔可夫模型系统的数据共享,“南非科学杂志》上,卷113,不。1,11-23,2017页。视图:谷歌学术搜索
- a . Sarma k . s . Kandarpa,“基于机器学习的样本提取自动语音识别使用方言的阿萨姆邦的演讲中,“神经网络:国际神经网络协会的官方杂志,卷78,不。4、97 - 111年,2016页。视图:谷歌学术搜索
- c·w·魏,z . Wang傅et al .,“智能推荐相关的产品基于朴素贝叶斯和协同过滤的组合模式,”物理学杂志》:会议系列。IOP出版,卷1682,不。1,p。012043年,2020。视图:出版商的网站|谷歌学术搜索
- a . Zielonka a . Sikora m·沃兹尼亚克w·魏问:柯,和z呗,”智能物联网智能家居系统最优对流,”IEEE工业信息,17卷,不。6,4308年,页2021。视图:出版商的网站|谷歌学术搜索
- w·魏m . Guizani s h·艾哈迈德和c·朱,“客人编辑:特殊部分集成互联网大数据和人工智能的东西,“IEEE工业信息,16卷,不。4、2562 - 2565年,2020页。视图:出版商的网站|谷歌学术搜索
版权
版权©2021 Qianyu曹和韩梅郝。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。