文摘
“英语热”已经成为一个关键的主题关注大多数人的利益。除了设置英语作为必修课喜欢中国和数学在学校、各种英语培训机构在学校也出现一个接一个。由于英语教学模式在课堂上,会出现哑巴英语。近年来,随着虚拟电子设备的普及,越来越多的研究人员尝试使用虚拟现实(VR)来创建一个浸入式英语学习环境。英语口语教学是整个英语教学的一个重要组成部分。在传统的英语课堂教学实践中,教师的发音是不标准的,学生是很难学习正确的发音标准,这使得英语口语非常被动。最重要的问题在英语口语教学是提高学生对英语口语的兴趣,使学生愿意说,实现英语沟通。英语口语教学是一个重要的链接在中小学和大学。教师在有限的教室,害怕发音不标准,他们害怕说话,不愿说话,导致被动英语口语教学。因此,本文将建立一个智能计算模型来评估和分析英语口语标准和准确。 Artificial intelligence speech synthesis and imitation of voice change are typical applications of decoupling representation learning in speech, the oral evaluation is based on the proposition that speech is a dynamic and complex process. With the help of the rapidly developed computer speech synthesis and imitation technology, an oral evaluation path based on speech synthesis and imitation is proposed, that is, oral evaluation is carried out by using the network parameters and output of deep learning of computer speech imitation.
1。介绍
随着社会的逐渐国际化,英语是世界上通用语言之一,和英语口语的使用已经成为最基本的沟通方式在不同的社会行为,如旅游、对外贸易和学习。然而,许多英语学习太局限于研究在纸上,而忽略了英语口语,可以真正在实践中使用。肖(1)主要描述了形成系统化的评估在中学英语口语教室,而李et al。2)做一个信息化英语口语课堂的动态评估研究。壮族(3]研究非线性系统基于智能计算的识别模型,也可以用于英语口语评估。李(4]阐述了智能计算模型的价值。基于模糊逻辑理论的文献[5),英语口语是建立的评价模型。湾(6)扩大国际教学中英语口语的应用。基于人工智能的背景文献[7),应用程序用于学生的口语学习模式。基于文献[8),学习理论的评价研究高职院校英语口语教学类的构造。通过人工智能在文献[9),人工口语发音是公认的,发音是否排放标准口语是判断。结果可以测量更加方便利用自动语音识别仪在文献[10]。英语口语的学习和评估SELL-Corpus和虚拟现实环境中进行(11]。陈和李12)描述英语口语学习的现状和发展趋势。刘和Zhanji [13)进行动态评估当前英语学习者的口语质量。最后,西安(14和中15]讨论的有效措施和方法在大学和中小学教英语口语。
2。口头评价的发展现状
2.1。英语口语评估在国外的发展
近年来,随着计算机技术的迅速发展,智能语音识别技术的发展,利用智能计算模型评估的标准化语言已成为一个研究热点。然而,在口头评价国外迅速发展,他们设计了一个语言学习系统VILTS语音交互评价语音说话的用户。得分系统智能语音研究从四个不同的方面:相似性,语音的准确性,语音情感,和语言的速度。有许多大型计算机自动评价和人工差异评价,人们不断改进评价方法在不断地探索。Gina-Anne levow列表模拟器建模人工评分所面临的困难来自两个方面:过程和结果,并指出模型综合评估过程是不可能领域的语言特点和目前语音识别。此外,识别器采用广泛的语法形式,使它接受不同的语法和语义变化基于目标语言。在听觉领域,机器学习技术应用于收集人类识别相关的特性。同时,基于网络的英语口语学习也发展迅速,这是现成的语音评估技术固化成口头评估者,大大促进口腔从业者。综上所述,国外进行了深入研究和分析英语口语评估,并涉及更广领域的口语特征。一些系统已经被一些专业语言专家评估等不同层次的英语口语发音句子,单词或音素。
2.2。英语口语评估在中国的发展
研究英语口语评估在中国刚刚开始,只有一些在台湾研究机构开展了相关研究。演讲的评价分为三个部分:说出演讲的内容,发音标准,口语演讲的评价数据库。第一部分是通过计算给定语言规范化的HMM概率。在第二部分中,维特比解码音节由GMM-based音调识别标识。第三部分由贪婪搜索算法实现。没有必要应用语音识别语音评估的整个过程,但只有建立一个基于文本的语音模型的线性网格。然后,维特比解码用于对齐网格模型,用户表示和构建。基于语音识别和口音的适应技术基于隐马尔可夫模型,口头评价在中国大陆研究音素发音的准确性和流畅性信息,给phoneme-level发音质量分数,并进一步获得的得分结果整个句子。这种方法已经得到了大多数认可从一些专业的专家。
3所示。口服模糊逻辑与神经网络相结合的学习
3.1。模糊关系的概念
模糊集的直接产物U×N定义,U和N计算域,R被定义为模糊关系的U在N;R(x, y)表达之间的联系程度x和y(y),u(x)。如果R是一套经典的直接产品U×N的关系,然后R是U和N是一个通用的关系,所以经典的模糊关系扩展关系,和经典的关系是一种特殊的模糊关系。假设U是一种有限计算域组成的吗米元素和N组成的宇宙是有限的n元素。模糊关系R从U来N可以通过一个矩阵表示的米×n,即
它也可以表示为 。不难发现,有一定的映射关系模糊矩阵和模糊关系。定义(模糊关系合成):让U,N,W宇宙,R是一个模糊关系U来N,问是一个模糊关系N来W,然后组成T从R来问也是一个模糊关系。
让 , 两个矩阵与模糊关系,及其复合R×问是一个模糊矩阵年代与n行和列,行的元素我和列k的年代是
3.2。模糊逻辑推理方法
3.2.1之上。德推理方法
让F是一个模糊集U,G是一个模糊集N“如果,模糊蕴涵关系F然后G”是表达的F⟶G。德将它定义为一个模糊关系U×N,即
它属于功能:
当一个模糊关系R是集,确定模糊关系转换。使用模糊关系的合成,有以下推理规则:
考虑到模糊关系R模糊蕴涵关系F⟶G对于给定的∈U,我们可以推断出 N, 。也就是说,当W宇宙是有限的:
3.2.2。Mamdani推理方法
Mamdani的推理方法,模糊蕴涵关系F⟶G所表达的直接产品吗F和G,也就是说,R=F⟶G=F×G也可以写成
3.2.3。它们中的大多数都是输入模糊推理方法
众所周知,“如果推理的主要先决条件一个和B然后C”,一个∈F(x),B∈F(y),C∈F(z),“如果模糊蕴涵关系一个和B然后C”:
3.3。建立模糊系统的过程
(1)模糊系统的构成:模糊系统是指这些系统与模糊必需品和模糊逻辑相关联。它由四个部分组成:模糊接收器,模糊语言库,模糊服务器,和defuzzy处理器,如图1:(2)模糊语言:假设一个变量的值为“X”,F被称为X模糊性如果”X取而代之的是一组函数。常用的模糊化方法包括单因素模糊化、高斯函数模糊化,三角函数模糊化。模糊接收机完成模糊操作。(3)建立模糊语言数据库:模糊言语图书馆是由一系列的“if - then模糊条件句,前奏的输入和状态和控制变量终曲。通常有两种方法来建立模糊规则库,一个是专家的经验,这是总结成一组规则根据专家的经验。另一种是通过自学习方法,如神经网络和遗传算法。(4)模糊推理的言论:模糊推理是将模糊的if - then模糊语言数据库到某种映射根据模糊逻辑规则。模糊推理一般包括三个部分:聚合,也就是说,如果部分的计算规则,构成,计算规则的一部分。(5)去模糊化:模糊推理后,结果仍然是语言表达的数据。我们必须将语言变量转换为一定值,也就是说,一个模糊集映射到某一点。这一阶段被称为去模糊化。语言值和相应的值之间的关系是由隶属函数的定义。去模糊化的一般方法包括两个阶段:首先,每个语言变量的语言值计算得到一个“典型的价值,”和计算每个语言的典型值的方法是找到每一个成员函数的最大值;然后,最好的妥协值计算模糊逻辑推理。
3.4。神经网络的学习方法
(1)学习算法的校正计算错误。它不断调整神经元根据语音数据和输出错误数据的增加强度。让yk(n)等于实际神经元的输出k在时间n当目标输入x(n),k是认为,dk(n)是已知的输出给定的训练样本,然后输出错误可以表示为 修正计算错误的学习算法是基于最小化目标函数值ek(n),所以每个输出神经元网络的实际输出接近某种统计意义上的输出。这个问题也将找到最小值的问题。最常用的误差目标函数的均值平方和的错误,这是 如果重量的神经元的关系我来j是 ,调整数量的重量 的公式,η是学习速率,误差函数的偏导数是神经元的输入j,和的输出是什么我th神经元。(2)”赫学习算法:根据条件反射的机制在生物学上,它属于无监督学习在1949年由心理学家。这条规则意味着,如果同步两个神经元被激活,连接的强度增加,反之亦然数学描述如下: 在哪里美国的神经元连接ωkj分别和最常用的f函数如下: (3)随机学习算法:误差学习算法通常采用梯度下降法,但是该算法的问题是,它可能导致局部最优。随机学习算法实现全球最佳通过引入不稳定因素。(4)竞争学习算法:这意味着互相竞争神经网络的输出,和最强的将被激活。竞争学习规则
3.4.1。BP神经网络算法
标准BP算法的具体实现步骤如下:(1)网络初始化。(2)采取任何 - - - - - -输入样本和对应的预期输出 (3)计算隐层的输入和输出。公式如下: (4)计算输出层的输入和输出。 (5)误差函数的偏导数计算输出层中的每个神经元: (6)利用误差修正算法,在隐藏层神经元的偏导数得到: (7)调整隐层和输出层之间的连接权重。 (8)调整输入层和隐层之间的连接权重。 (9)发现这个错误E整个计算过程,计算公式如下: (10)判断是否继续培训:当E<ε或学习的次数大于设定的最大数量米,培训结束。否则,随机选择另一个学习样本,返回到步骤3,进行循环训练。BP神经网络算法足够日常使用的口头评价和改进的BP算法优于BP算法在复杂的环境。
4所示。实验
4.1。样本的选择
在人工神经网络和自适应模糊神经系统,样品是网络培训的对象,和不同程度的样本选择直接影响模型的评价结果,所以选择的样本必须代表。本研究中使用的样本5男5女相同的年龄和口头文化从不同地区相同的口头评价。因为这个实验是评价英语口语,代表样品必须先会说英语的人但没有英语口语在当地方言,这样他们可以评估正确的英语口语。相关的收集来源在实验中加以解释。本文中的语音信息处理数据,和本文的主要工作是研究口语的识别。目前,有许多语音处理工具,如前置过滤、A / D转换、预加重、框架、窗口、端点检测等等。
4.2。实验测试
基于模糊逻辑与神经网络相结合的智能计算模型,来自不同地区的人们口头评价试验,发现和我们得到的相关数据如下:
分层交叉验证错误如表所示1。
来自五个不同地区的人们口头评价试验,发现准确率是如表所示2:
基于简称ANFIS模型,我们发现同样的一批人的口头评价测试,和我们得到的相关数据如下:
分层交叉验证错误如表所示3。
简称ANFIS模型显示在表的准确性4。
基于bp神经网络,我们发现同样的一批人的口头评价测试,和我们得到的相关数据如下:
分层交叉验证错误如表所示5。
bp神经网络的精度如表所示6。
4.2.1。准备模型比较
我们比较了模糊逻辑与神经网络智能计算模型,简称ANFIS网络模型和bp神经网络模型来评估英语口语如图的准确性2。
这项工作使统计数据的误差和精度等级模型的交叉验证,这样读者可以直观地知道错误率和每个模型的准确性。
4.3。实验分析
口语评价基于模糊逻辑与神经网络相结合的智能计算模型。为了测试的可靠性模型更具体地说,我们决定添加语音情感指数测试语音质量的综合评价结果。我们发现相同的样本评价英语口语在四个州:幸福,悲伤,愤怒,和惊喜,并显示语音情感评价结果的均值和方差不同的手动评级,如图3- - - - - -6。
通过四种不同的情绪状态的口头评价图,我们可以看到,评价结果的方差最小的和最稳定的是惊讶状态。悲伤的心情,方差是最大的,最波动和口头评价结果。
4.4。对比试验
本文根据实验测试中,模糊逻辑与神经网络相结合的智能计算模型取得了最准确的英语口语评估准确性。我们现在进行人工评价和这个模型之间的比较实验,如表所示7。
表7列出了口语评价结果的平均数量的四种语音情感在不同手动评级,这表明,可以区分不同的评级。然而,是否意味着区别不同的手动评级是必要的或随机的,本文采用单向方差分析测试。通过观察值数据结果表中,我们可以看到值下的四种情绪都小于0.05,这表明不同的情感发音质量水平之间的差异有统计学意义。
5。结论
随着社会的逐渐国际化,我们不能避免英语口语沟通与外国同胞不仅在国内,而且在国外。同时,设计的标准化模型测试英语口语已经成为我们需要解决的具体问题。基于智能计算模型,分析了标准化的方法导出语言更准确地评价。研究结果如下:(1)通过比较模糊逻辑与神经网络相结合的智能计算模型、BP神经网络计算模型,简称ANFIS网络模型,众所周知,模糊逻辑与神经网络相结合的准确率高达80%,智能计算模型和错误率小于2%。(2)本文结合了模糊逻辑算法和BP神经网络算法,形成一个计算方法,可以测量语言标准化。(3)通过进一步实验的分析总是特定测试的演讲在四个不同的情绪状态。的准确性和错误率的四种情绪状态不一致。人们的口头评价的方差的惊喜是最小和最稳定的。(4)在对比实验中,智能模糊逻辑与神经网络相结合的计算模型与人工评价四种情绪状态下相比,和智能计算模型远远超过人工评估的标准化。
数据可用性
使用的实验数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称,关于这项工作他们没有利益冲突。