文摘
机器自动翻译质量评价模型基于深度学习算法建立,目的是实现机器自动翻译质量的准确评价。深上优于自动机器翻译。在无监督和监督学习阶段,语言信息提取执行无监督学习和建构双语词汇使用自动的翻译样本噪声减少自动编码机。改善语言向量特征提取的影响,优化效果的机器语言的矢量特征提取通过导入语言功能和机器自动翻译成双语词汇的信息。机器自动翻译语言向量函数导入到基于深度学习翻译质量评估模型,实现自动机器翻译质量评价。实验结果表明,所构造的模型能够准确地评估质量的机器自动翻译,翻译句子和句子的数量的模式不影响评估模型的性能和模型产生良好的效果正在显现。
1。介绍
目前,翻译产品开发人员需要评估机器自动翻译的翻译产品的有效性和分析,翻译质量的产品。用户需要知道哪个翻译产品优秀的机器自动翻译翻译质量,以确定哪些产品需要使用(1,2]。因此,它是非常重要的评价自动机器翻译的质量。目前,所有翻译评估产品在特定的固定标准评估产品的特定属性。很难评估自动化的质量因为没有固定的标准评估自动化机器翻译的质量。使用高精度机器翻译。目前,许多学者正在进行一些自动机器翻译的质量评价研究。例如,亦未[3)评价中国的被动语态使用谷歌翻译和有道翻译作为例子来解决机器翻译问题。在中国的被动语态加工机器翻译质量的声音,益(4]在调查问卷和数据分析综合评估翻译软件,比较具体指标的差异。在线字典是用于自动化(5),不仅一个词的意义,揭示了相关上下文信息词。在此基础上,我研究了机器翻译的质量评价方法。Wenzhao和Defeng6]。例如,谷歌机器翻译评估机器翻译提供英语短语译成中文。尽管上述研究人员已经进行了一些研究来评估机器自动翻译的质量,当前组件仍然没有解决。机器翻译的质量评估的方法精度低的问题。为了成功地解决这个问题,BP神经网络算法引入了一个深刻的学习算法。
学习和培训的形式机器自动翻译双语词汇,BP神经网络算法,深入学习算法,可以完成,实现高精度的机器翻译的语言向量函数。机器自动翻译是一个语义的翻译质量的评估。为此,本文使用BP神经网络算法建立基于深机器自动翻译质量评价模型的学习算法。深入学习算法用于特征提取和质量评价步骤实现高精度postmachine语言特性。高精度自动翻译提取和评价翻译质量。
2。机器自动翻译质量评估模式
2.1。自动翻译语言信息提取
优化语言向量特征提取的影响,我们使用两种语言为例,将机器的自动翻译质量作为hyperparameter通过混合两种形式的语言信息使用机器的自动翻译语言信息提取方法基于深度学习。学习/培训阶段自动机器翻译的语言信息提取方法基于深度学习包括一个无监督学习阶段和一个监督学习阶段。双语词汇同时学习和训练有素的降噪自动编码机在无监督学习阶段获得的双语语义属性前后两个自然语言翻译。标准的信息自然语言语料库送入双语词在监督学习阶段,微调双语语义方面的两个自然语言(7]。
2.1.1。无监督学习阶段
训练语料库和自然语言翻译的结果必须翻译成自然语言无监督学习阶段的学习目标。自然语言翻译的结果自然语言与自然语言不同吗 。无监督学习的步骤(8图中所示1作为一个学习图。训练语料库和自然语言翻译的结果必须翻译成自然语言是无监督学习阶段的学习目标。你可以训练向量和向量机器自动翻译的例子获得双语对齐的例子 , 机器自动翻译的例子。它代表了双语词。降噪自动编码器来实现无监督学习双语的词汇和重建和向量的样本是使用。为向量的例子 ,获得语言的特征向量在机器自动翻译的例子中,我们需要重建自然语言向量和自然语言在本例中向量。
(一)自然语言向量重建
(b)自然语言向量重建
无监督学习的可靠性,优化减噪autoencoder是用于实现无监督学习双语的单词。在改造之前,向量和向量在样例 ,某种程度上介绍的示例 噪音。后的向量将噪声引入样本对 是 。作为两种语言的编码器,降噪自动编码器可以获得的隐式表达式和的自然语言和自然语言翻译的结果通过乙状结肠激活功能编码,这是
其中,和是编码函数和乙状结肠激活函数,分别;翻译转换矩阵参数和是和 ,分别。和双语词有自己的语言特点;因为没有差异的维度和 ,所以自然语言的编码器和自然语言分享一个偏移值 。
在获得和 ,减噪自动编码器用于解码两种语言的隐式表达式。对于隐式表达式的自然语言 ,自然语言的两个解码器和自然语言翻译的结果本文中解码:顺序是解码成自然语言吗重建的向量和自然语言翻译的结果重建矢量 :
其中,是解码函数;和的译码器补偿两个自然语言。之间没有显著差异的解码步骤隐式表达和隐式表达的解码方法 。解码可以获得 ,和解码可以获得 。
这种类型的编码和解码允许语言输入;向量重建到向量的原始语言,也可以重构向量在其他语言。但两种自然语言之间的信息是不一样的,得到一个重建错误在重建。在这一对输入设置 。例如,重建误差设置为文章的交叉熵模式。设置以下5种重建误差的总和的损失无监督学习阶段损失函数:(我)语言之间的误差向量灾后重建(2)的错误重建原来的向量(3)的错误重构向量的语言在翻译之前 (iv)的错误重构向量的语言在翻译之前 (v)对两个自然语言重构的误差向量 到原始(pretranslation)向量对 。的损失函数是
无监督学习的解码功能设置 ,和梯度下降算法来更新解码功能直到损失函数方法的最小值和通过培训。
2.1.2。监督学习阶段
在监督学习阶段,可以减少自然语言重建错误。这两个向量对自然语言 对这两种语言有所有信息吗 ,因此,自然语言和自然语言向量组 用于转换矩阵,并将 。实时编码需要双语信息隐式表示 。存在一个这样的例子 。
其中,是编码器的偏移值。
的概率通过正面和负面的例子操作
其中,代表了重量;和是正例和负例的概率。
通过监督学习,翻译转换矩阵和嵌入式翻译可以获得的信息,和他们都有双语词汇属于语言特性(9),从而优化自然语言向量特征提取的影响。
2.2。基于深度学习翻译质量评价模型
基于深度学习翻译质量评估模型由一个视觉层,三个隐藏层,和一个回归层。获得的视觉层输入和获得的部分2.1.1。隐藏层的数量是100,三个隐藏层中描述的顺序 , ,和 。回归层是输出层,一个节点。可见和不可见的联合概率分布层
其中, , ,和的概率分别是语言变量的三个隐藏层满足翻译的要求。
评估的过程基于深度学习的翻译质量评价模型如下:(我)深入学习网络、无人监督的培训是实现从上到下,每层设置限制玻耳兹曼机,每一层的重量训练使用贪婪的学习方法和培训是自下而上的。第一层,另一层是建模为高斯二进制限制玻耳兹曼机和二进制限制玻耳兹曼机。在受限制的玻耳兹曼机中,没有每个可见节点和一个隐藏的节点之间的连接,和它的条件概率分布和联合概率分布是
的公式,和分别为高斯密度函数和逻辑函数;可见层的偏见是 ; 代表了隐层节点的数量是1, ;和代表标准偏差。(2)监督微调:输出层实现了整体调整根据输入监督双语词汇和有自己的语言特色(3)每一层的重量和偏见可以生成无监督培训和监督学习。输出翻译功能可以建立的回归模型,该模型可以用来评估机器自动翻译指令。模型是
其中,是机器自动翻译质量评价的结果。
3所示。仿真实验
3.1。模型有效性分析
这个模型的数据集是新闻网站的文本并使用“翻译服务规范第1部分:书面翻译”(GB / T 19363.1 - -2003)由中国翻译协会作为评价指标标准。该模型评估训练句子的翻译质量新闻网站使用。新闻文本的细节图所示2。
在新闻文本是由机器自动翻译的,如图2使用该模型,翻译的质量评估。有5000个翻译句子在语言训练集和测试集,所有句子类型相关的复合语句。详细的翻译不同的翻译类型如图3。
测试指数将评价结果之间的差异和实际场景测试时建议模型的有效性评估自动化机器翻译的质量。该模型的评价结果是描绘在图4。数据之间的比较3和4显示正确的句子由机器自动翻译的数量和实际数量相差一个建议模型评估。因为每种语言都有自己的语法结构,因此可以认为模型评价结果可以有效地计算和评估机器的自动翻译的质量和满足实际应用的需要。
3.2。翻译句型的影响评估模型的性能
宣言的句子,特殊目的的句子,问题的句子,复杂的句子的句子类型用于自动机器翻译和测试和评估自动机器翻译的翻译质量。数据5和6显示评价结果。数据5和6显示为不同的语言和翻译模式,提出了模型的评价结果之间的差异和实际场景很低。只有特定句子的翻译质量评价结果的不同,虽然变化小(1块)。提出模型的评估效果影响宣言的句子,问题的句子,或复合句,评价结果与实际情况一致。
3.3。句子的数量的影响,评价该模型的性能
在双语评估调查(蓝色)得分,有实际的翻译质量信息和模型评估结果为每一个句子。确定的比例 ,这是发现提出模型的评价结果将出现在 。蓝色的分数是基于这一比率。蓝色的分数可以用来计算该模型的评价性能通过添加一个句子的翻译错误在测试集。图7描绘了这些结果。图7说明的数量短语和句子没有提出模型的评价性能产生重大影响。该模型的蓝色得分从96年到98年上升为短语数量的增加从1000年到6000年。结果表明,该模型是有效的。
进一步分析该模型的有效性,这是方法相比Ref。3]和文献[4)获得三种模型的精度比较,如图8。
从图8,我们可以看到,机器自动翻译的准确性提出了模型的质量评价远远高于其他两种方法,即使句子的数量是1000,2000,3000,4000,5000,6000。它是稳定的精度高达97%以上,具有一定的实用价值。更好地分析该模型的应用价值,质量评价效率的三个模型进行比较,结果如图所示9。
从图9可以看出,即使句子的数量是1000,2000,3000,4000,5000,和6000,机器自动翻译质量评价模型的效率要高得多,同时保证质量评价的其他两种方法的准确性。评价最高的效率是95%以上,可在一定程度上证明该模型的可行性。
4所示。结论
由于这项研究中,机器自动翻译质量评价模型建立。模型是基于深度学习算法,并通过实验测试。重要注意的是,评价结果的准确度和精密度高,因为正确的句子的数量之间的差异是由机器自动翻译的,而真正的号码是1的建议模型。实验结果进一步说,该模型的评估结果将从实际情况有所不同,如果语言和翻译句子的模式改变了。特殊的句子的翻译质量的评估结果会有所不同。
建议模型的蓝色得分生长逐渐随着句子的数量增加,最多达到98,准确评估,实现自动机器翻译质量评价。基于评价结果,可以得出结论,该模型适合评估机器翻译的质量和拥有大量的潜在的语言学习和翻译时。
数据可用性
使用的数据集和分析在当前研究可从相应的作者在合理的请求。
的利益冲突
作者宣称他/她没有利益冲突。
作者的贡献
论文的概念被小菁刘完成,并完成了数据处理小菁。小菁刘参与论文的审查。