文摘
对于大多数学生来说,英语学习是一个强烈的肯定他们的自主学习能力,虽然没有掌握有效的学习方法和策略使得大多数学生怀疑他们的语言学习能力。英语学习中最重要的能力之一,就是听力和口语能力。如何提高听力和口语能力提高英语水平是很重要的。在这种背景下,本研究分析了英语听说教学中存在的问题通过了解当前形势下学生的英语听力和口语练习。在此基础上,本研究提出了一种基于深度学习答疑(QA)系统来提高英语听力和口语能力。研究中的结果表明,该方法不仅能有效地提高学生的答案的准确性,也提高他们对英语学习的兴趣。新方法可以有效地提高英语听力和口语能力和提供技术参考和方法参考英语听力和口语能力的提高。
1。介绍
随着大数据的时代,学习文件迅速成为电子和数字,互联网上的信息量呈几何倍数增长。它越来越方便人们获取信息通过网络技术,但它是非常困难的从大量的信息来获取有用的知识1]。在信息采集,搜索引擎是一个非常方便的工具,它可以解决许多用户的检索需求。然而,在知识的获取,搜索引擎的缺点也是明显的,搜索引擎的用户给出的关键字作为一个有限的web页面的筛选,但为了进一步获取所需的信息,必须手动浏览网页一个接一个。搜索引擎的性能很大程度上取决于质量的关键词,准确和简洁的关键词是非常必要的,这对用户提出的需求总结的能力。因此,在当前背景下,搜索引擎很难满足人们的要求,准确的知识获取,问答系统(QA)出生,因为运气(2]。问题的答案(QA)是一种新的信息检索方法,允许用户在自然语言提问,搜索并返回准确的答案或文本片段从单语或多语言文档包含答案。当用户使用问答系统,他们可以根据他们的需求描述的问题。系统将根据问题,提取用户的意图并从质量知识和选择答案返回给用户。在某种程度上,它解决了这个问题,用户很难总结他们的目的作为关键字,使系统更准确地捕捉用户的意图。与此同时,它也可以通过系统自动筛选结果和提供更准确和简明的信息系统用户(3]。
与互联网的迅猛发展的时代,每天数以万亿计的tb的数据生成。计算机存储技术变化迅速,面临的最重要的任务如何高效、准确地访问数据,而不是存储和记忆。现在有许多传统的搜索引擎,如谷歌、百度,Bing,等等。然而,由于大量的数据,一个简单的查询只能显示搜索结果根据其词匹配的方法,而不是让用户最理想的答案。因此,人们希望计算机能够理解他们的需求,而不是停留在字面意思的关键词。在这样的刚性需求,越来越多的人工智能服务已经被开发出来,包括本文的主题:QA学习系统(4,5]。回答选择是基于一个QA系统的一个重要组成部分,因为一个QA系统的目的是找到一个准确的回答问题,不要运行第二个查询相关文档。因此,答案选择将进一步分析和完善有关语句问题,以便定位候选答案,从上到下排序候选答案根据重量值。这种排序方法大致可以分为两类:一是基于逻辑分析的方法,另一种是基于统计方法。前者主要通过语义语法信息和比较相似向量的特性,通过相似性和排序。后一种方法主要通过一些特征计算候选答案的评分值,该方法的关键是设计一个合理的模型来准确地把每个特征的重量候选答案,计算每个候选答案的对应的概率值。横向比较的回答选择排序方法基于统计和分析表明,该分析方法具有较高的准确性,而统计方法更有效。
的过程中提高学生的能力,良好的学习策略能提高学生的学习效率。这就提出了一个问题:是不是因为学生的英语成绩和学习能力改进后使用好的学习策略,或因为学生能在长期的学习过程中,听和读,然后他们将制定好的学习策略自然?作为世界上重要的交流工具,英语是非常重要的收购,甚至应用程序的知识(6]。我们在学习策略结合以前的研究结果发现英语学习者的心理特点和处理问题的过程中英语水平考试。英语学习者的学习策略的应用是通过深入调查技术。采用的主要工具包括:基于学习策略的学习策略的调查问卷,讨论与高级英语教师在学院和大学,等等。
英语课堂教学的效果将间接影响学生的英语阅读和写作能力7,8]。英语课注意技巧和实践中,如何提高学生的交际意识应该放在首位,学生敢于说话,敢于表达自己的想法是英语学习的根本目的。只有当学生想用英语传递信息,开展情感交流他们能有更强的动机和学习英语的兴趣。英语课程开放给所有学生,旨在全面提高学生学习英语的兴趣。心理测试表明,知识学习的过程中,人们获得知识主要是通过视觉和听觉,占80%以上的所有知识。因此,从听力教学不仅符合教学规律,也符合语言学习的规律。目前,大部分学生只能通过听学习英语发音和语调。倾听是人际沟通的开始,也是人际交往的首要条件,理解可以使学习者更自信的与别人交流。
学生的英语口语练习时间少,大多数学生没有机会接触外国人,自然没有英语交流的环境。唯一的英语沟通是在课堂上,和没有大气通信在家里。在今天的素质教育,考试仍然是衡量和评估学生的主要手段。但学生失去机会进行口语交际训练教室,也忽视了听力和口语能力的培养(9]。水平的教师口语能力参差不齐,要求学生英语口语相对较低,这使得很多初中教师的英语口语水平下降。日常口头交流基本上存在于阶级和仅限于教学,使教师的英语口语比赛有一定的局限性,并最终使教师的英语口语水平影响学生英语口语能力的发展。近三分之一的中国大学英语学习者能说他们在英语学习中遇到的困难。许多学生花大量的时间和精力,但英语学习的结果仍然不理想。虽然在各个方面可能有复杂的原因,最根本的原因是学生没有有效的英语学习方法和策略。
因此,它是最有可能的,大学英语学习者没有有效的学习策略,不能学英语。在中国大学英语教学的要求已经实现了10年以上。对于英语语言知识、应用技能、学习策略和跨文化交际中提到的需求,以及定性和定量描述的大学英语教学目标、学习困难的学生在普通高校仍无法实施好(10]。其中,仍有很长的路要走才能掌握学习策略,提高英语听力和阅读能力。学习英语学习策略不仅是理论教学与学习理论和参考,最重要的是,在大量的实际水平大学英语学习者提供有效的学习方法,并解决在真正意义上在一定程度上是因为没有掌握学习策略的问题导致长期的阅读和欣赏英语能力不足(11]。面对英语学习的这种情况,本研究基于此背景下探索。(1)QA系统应用领域的第一次英语听力和口语能力提高。(2)该方法在本研究中不仅具有坚实的理论基础,也有广阔的应用前景。
2。相关工作
目前,学习英语作为第二语言在中国是很常见的,它显示了提高英语听力和口语能力的重要性。为了提高英语听力和阅读能力,我们必须有一个完整的理解的学术研究状态。国外学者主要从两个方面研究学习策略,详细调查学习策略的有效性。第一个方面是常见的问题,优秀的学习者的学习策略是什么?第二个方面是探索良好学习策略的实用性拥有优秀的学习者通过数据可视化。良好的英语听力和阅读能力通常有一些共性12,13]。在1990年代,科学统计技术的普及,研究人员采用更科学的方法与早期相比,和实证研究普遍应用。大样本数据处理后,研究人员可以更坚定地探索学习策略之间的差异和英语听力和阅读能力。
QA系统历史悠久的研究(14]。早在1960年代,QA系统被用来解决问题的回复。但一些早期的研究工作已经被困在模板匹配和专家系统水平,QA系统)来回答人们的问题。自然语言处理的不断发展,技术的QA系统也已大大提高15]。研究方法可分为生殖问题回答和检索问题回答。生成质量保证模型通常执行大量的训练数据集问题以适应之间的关系问题和答案,以便完成自动回复未知的问题。检索QA一般匹配用户输入的问题与知识库的问题提前准备。当一个高度类似的问题是匹配知识库中,这个问题的答案将回复用户。文献[16创建和发布一个QA在保险领域的数据集,并使用不同的神经网络结构在这个数据集研究深度学习的能力回答提供事实性问题,证明使用深层神经网络处理的可行性问题,回答系统。这种方法使用一个巨大的快速检索算法进行初步筛选的数据集,然后使用高性能深学习网络进行初步筛选的语义匹配的答案。它不仅保证了问答系统操作的效率,也有很好的质量保证,已被业界广泛关注。
除了这些研究,国内领先的互联网公司也建立了质量保证体系,如吉米,JD的在线客户服务团队的新成员,在2012年推出。阿里小米是每天数以百万计的客户,可以解决85%的问题在日常购物的过程。作为中国领先的搜索引擎,百度也依赖于其搜索引擎的自然优势自然处理技术创造一个智能测试系统。不像JD和阿里,Xiaodu的原型是一个互动的智能议长回家。传统的QA系统主要利用统计机器学习和自然语言处理的方法。基于统计机器学习方法通常定义一系列的词汇和其他相关特性,并使用分类器的分类信心作为答案选择的信心。基于自然语言处理(NLP)的质量保证方法通常句子的表面分析得到句子的表层句法信息,然后根据计算相似的语法树之间的问题和答案,以提高英语听力和阅读水平17,18]。选择模型在传统的问答系统的答案是高度依赖于手册,需要人工注释的大量的数据,这是不利于英语听力和阅读水平的提高。
近年来,深度学习取得了一系列的成就在改善英语听力和阅读水平19,20.]。其中,卷积神经网络(CNN),递归神经网络(RNN),网络(LSTM),长期和短期记忆和注意力机制突出。在图像数据的过程中,卷积的宽度和高度内核设置在卷积层都是一样的。然而,在处理文本数据,有必要确保卷积核宽度和词向量具有相同的尺寸。原因是,在输入层,每个单词都由一个行向量表示。在特征提取,因为单词是句子的最小粒度表示,如果卷积核函数的宽度小于词向量的维数,设置最小粒度的单词句子表示被摧毁。卷积核的高度可以根据需要设置。其次,作为输入的句子,相邻的词之间的语义相关性很大。因此,在卷积计算某一个词,这个词的语义和词序信息可以被认为是在同一时间。池的目的是过滤无关的信息或一些不重要的信息包含在句子后卷积操作,使重要的信息特征更加突出。 Therefore, at the pooling layer, it is necessary to reduce the dimension of each feature vector after convolution. As we all know, an inevitable problem in RNN is how to solve the long and short-term dependence between data. LSTM is the network structure proposed for such long and short-term dependence. At present, the LSTM network is widely used in natural language processing, video understanding and target detection, deep reinforcement learning, and other fields. However, in an LSTM network, the cell internal control logic is more complex. Each unit of the LSTM network contains multiple logical control structures, which process the sequence of information contained in sentences. In addition, each base unit can use a logical control structure to determine whether previous input information is added to the current information.
提出了一种新的CNN模型(21]的作者22)建立了一个新的答案选择模型的词汇之间的差距问题和答案。他们用双向LSTM编码器和译码器桥词法问题和候选答案,差距和改进模型的效果逐渐关注机制。的作者(23)提出了一个新颖的循环单元模型(N-GRUR)检查控制。这个模型审查机制适用于封闭的循环单元,可以定期检查之前的信息,和检查的过程不会影响封闭的单位。最后,实验表明,该方法能有效地提高英语答案选择模型的性能。处理回答选择问题,作者的24)提出了交互式知识网络增强模型回答选择任务,以交互方式学习的句子表示问题对通过引入外部知识图现有的外部问题。通过这种方式,您可以参考更全面的句子特点在选择答案,从而提高你的英语听力和口语能力。与传统的深度学习方法相比,上述改进的深度学习方法执行更好的训练模式效果,但它通常需要更多的数据进行训练。此外,在培训的过程中,大量的标签数据需要手动标记,而semi-supervised深学习方法可以使用无标号数据模型训练(25]。因此,越来越多的学者开始研究英语听力和口语能力的提高基于semi-supervised深度学习。作为一个QA系统由多个模块组成,CNN模型作为一个模块的系统的建模分析。
3所示。深层神经网络对英语听力和口语能力的提高
3.1。前馈神经网络(FNN)的介绍
FFN也被称为多层感知器(MLP)。FFN的目标是获得一个映射函数。传递的参数的一种方法从输入层到输出层。不同的递归神经网络,FFN并不形成一个定向循环里面。每个神经元都安排在层。作为最简单的神经网络,每个神经元连接到上层,上层的输出仍较低的输入层,层间并没有反馈。多层感知器神经网络在图给出1。
当FFNs扩展到包括反馈连接,他们被称为RNNs。此外,FFN神经科学有一定的相关性。我们可以把网络层的数量的并行操作单元,每个代表一个矢量和标量之间的映射。在某些方面,每个单元就像单个神经元。一般来说,FFN有重要影响的研究CNN和LSTM的研究和开发。由于浅网络层和使用线性激活单元,早期完全连接神经网络模型通常很难提高英语听力和口语能力的大数据。
3.2。深CNN模型介绍
CNN模型增加了卷积层和池层形成深CNN模型,如图所示2。它只显示了CNN算法的原理图,它是不可能知道有多少卷积层和汇聚层。在算法的研究中,我们设置两层池层和两层褶积层,分别。
卷积的计算过程如下所示: 在哪里uij是输入图像,米和n输入图像的大小,卷积核的大小,b是偏见常数卷积的内核。CONV (ij)是卷积后的特征图像输出操作。
CNN将激活功能层添加到网络,分析了模型更好地采用特征映射方法的非线性函数。然后,激活功能一一介绍如下。
乙状结肠函数
双曲正切函数
ReLu函数
因为公式(2)- (4)是激活函数,自变量的值范围是整个实数,因变量的范围是[−1,1]。ReLU函数的全名是解决线性单元。函数是一种常用的激活函数,它的特点是低计算复杂度和没有指数操作。然而,值得解释的是,ReLU函数计算过程中有一定的缺陷。当数据通过消极的ReLU函数,输出值等于0。Leaky-ReLu函数可以解决上述问题。
团体和双曲正切的相应方程如下: 在这里,是输入。
的是重量,b是偏见。叉(CE)公式如下:
原始形式的梯度下降方法如下所示: 在哪里是参数。亚当优化器了 在这里,目标函数和吗和是参数。和正则化参数。因为拟议中的QA系统将CNN模型提出在这项研究中,它是一个典型的深度学习模型,它能有效地处理大数据的情况。
QA系统涉及广泛的领域,其中的关键技术是知识提取和表示。这些领域需要学习为了有一个更好的智能答疑系统。不管我们做任何领域的重大突破,不仅为智能问答系统,而且对其他领域,包括文本分类、推荐系统将有一个相当大的促进作用。deep-learning-based QA系统图中给出了改进英语听力和口语能力3。它主要包括CNN模型、向量表示,等等。
4所示。实验结果和分析
4.1。实验数据的介绍
研究,涉及一系列的参数,这将提供一个更好的解释学生的应用学习策略在英语学习的过程中。我们报道的基本参数如下。回答得分:回答问号分为两部分,第一部分是关于英语学习策略问卷得分,根据得分将被分成组,两组,低和高组和低组的每个参与者在英语学习策略问卷得分,可以根据问卷分为32个组件的六个维度分数。第二部分是英语的分数问题解决策略的问题。问题是按照科学的方法设计,分为阅读和听力的问题。
学生从一个省被选为研究对象。考虑到受试者的英语学习后,受试者被选中。许多学生被随机选择基于受试者的英语4级成绩。所有的学生减少了非英语专业的学生,因为他们收到了专业英语培训和学习更接近自然。我们专注于探索英语学习策略的应用水平的影响的过程中解决英语问题。因此,重点是研究高、低组之间的差异。CNN框架系统模型应用于本研究如图4。方法在本研究中是一个传统的CNN模型,其结构和参数设置可以称为图4。
4.2。实验结果分析
首先,人物5给不同的方法的准确性(该方法,传统的QA系统,主成分分析,随机森林,L1正规化,皮尔逊相关性,和套索)对不同数量的问题。从图可以看出,该方法的准确性提出了总是非常高。增加的数量的问题,精度略有减少,但模型性能仍然很好,证明了该方法的有效性在提高英语听力和口语能力。相比之下,其他的算法是不准确的该方法是否小或大的数量问题。主要原因是这些模型是浅的模型,并与该深QA学习系统,这些浅算法不能提取内部信息的大量的英语考试的问题。因此,越来越多的问题,这些模型的准确性往往会下降。因为PCA和套索浅模型,随机森林是一个经典的机器学习模型,本文方法是基于CNN模型,它是一个深度学习模型。因此他们选择算法进行了比较。
进一步证明了该方法的有效性,我们随机抽取8从数据库中英语听力和口语的问题。图6显示了英语答案的混淆矩阵图精度通过传统的QA学习系统和深度上优于QA学习系统关于8英语听力和口语的问题。从图可以看出,本文提出的方法可以达到较高的精度在英语测试性能,无论一个问题的准确性或平均精度。因此,稳定和该方法的有效性验证改进英语听力和口语能力。
(一)
(b)
除了提高英语答案的准确性,该方法可以进一步提高英语听力和口语学习者的兴趣。从图我们可以算出7那些选择非常感兴趣从21%上升到35%。的人选择更感兴趣,从30%上升到48%。选择不感兴趣的学生的数量从32%降低到11%。选择不感兴趣的学生的数量从17%降低到6%。这表明,新的QA学习系统是有效的。
为了从另一个角度证明了该方法的有效性。小学、中学和大学的学生从2015年到2021年被选中来计算提高英语听力和口语能力训练后在QA学习系统设计的。从图可以看出8不同阶段的学生来说,上述方法可以提高他们的英语听力和口语能力在一定程度上。但是没有模式改进的程度。最高的增加在2018年小学生为69.2%,最低的是中学生在2021年为5.4%。然而,中学生的改善程度肯定是最少的。主要原因是有相对较少的时间训练和该系统在中学的作业任务,从而影响模型的改进效果。
自六个维度问卷在本研究分为32个组件的分数。为了验证该方法的准确性在描述不同的维变量的影响在英语听力和口语能力,不同的变量的贡献值如图英语听力和口语能力9,上图是听力和下图的贡献价值贡献价值的表达能力。从图可以看出,QA学习系统设计摘要可以准确地识别变量9和32产生最大的影响在英语听力能力。同时,的变量对英语表达能力影响最大的变量也可以认定为31。这些结果与实际经验相吻合,从而证明了本文方法的可靠性和实用性。
5。结论
人工智能的快速发展,英语学习已经成为人工智能技术的一个重要任务。英语考试的答案选择的基本任务是选择最匹配的答案从候选池对于一个给定的问题和答案池。本研究的重点是提高传统QA基于深层神经网络学习系统,那么该方法应用于英语学习,提高英语测试的准确性,最终提高英语听力和口语能力。
完成研究的过程中,本研究主要集中在学习英语听力和口语能力。然而,本文只选两个。在未来,探索更多模块和具体方式之间的差异对英语学习者提高他们的学习策略是值得探索,为英语学习提供了一些参考。虽然本文提出的方法取得了良好的效果,本文的研究没有考虑学生的个性,生活习惯,和其他因素在建模的过程。这将是未来研究的重点。
数据可用性
使用的实验数据来支持本研究的发现可以从作者要求。
的利益冲突
作者宣称没有利益冲突的这方面的工作。