文摘
人工智能是一个非常具有挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能包括范围广泛的科学;它由不同的领域,如机器学习,计算机视觉。近年来,随着上升和关节驱动技术,如互联网,大数据,物联网,语音识别,人工智能技术的快速发展提出了新功能如深度学习、跨境集成和人机协作。聪明的英文翻译是英语行业的创新和实验领域的科学和技术。机器翻译是电脑程序的使用自然语言转化为一个特定的自然语言。这一边缘学科包括三个主题:人工智能、计算语言学、数理逻辑。机器翻译是越来越受公众欢迎,和它的优点主要是机器翻译的成本远低于人工翻译。从这项研究中,可以看出,传统ICTCLAS方法的准确率是76.40%,而本文研究方法的准确率为94.58%,表明在本文中使用的研究方法是更好。机器翻译翻译成本大大降低了,因为很少有流程,需要人工参与,和翻译基本上是由电脑完成的。 It is also an important research content in the field of English major research. Due to the wide range of language cultures and the influence of local culture, thought, and semantic environment, traditional human translation methods have many shortcomings. Nowadays, the demand for translation is unsatisfactory. Based on this, this paper analyzes the application status of intelligent translation, the prospect of intelligent translation, and realizes the optimization design of the human interface system for the intelligent translation of English. Through experiments, it is found that the multimedia intelligent English translation system based on deep learning not only improves the accuracy of English translation but also greatly improves the efficiency of people learning English.
1。介绍
机器翻译的过程很简单,和翻译时间可以更准确地估计。计算机程序的运行速度非常快,无法跟上手动速度。到目前为止,机器翻译的发展经历了几个关键的转折点,和良好的发展和应用,人工智能在许多方面,特别是在领域的形象,演讲,和自然语言处理、机器翻译再次用神经网络来继续前进。语言和文字是人与人之间沟通的主要工具。不同的国家和民族有不同的语言。语言障碍一直是最大的困难在世界各族人民之间的交流。随着计算机的迅速发展,英语已经成为通用语言。随着中国经济的快速发展,对外交流越来越重要,人们日益增长的对知识的渴望使互联网的最快、最方便的方式为中国人们理解世界。目前,英语是世界上人口最多的语言,从而导致大量的信息在互联网上被用英语。虽然现在英语是广泛的教育在中国,只有少数人有一个更高层次的英语。 For most people, there is still a long way to go to translate English information accurately. With the progress of the translation industrialization process, the research on English multimedia intelligent translation is particularly important in today’s environment. Excellent and accurate translation will make people understand that the world becomes simpler.
基于实例的机器翻译,即时翻译的主要知识来源是图书馆的平行语料库。在图书馆的信息主要有两个领域:一个是源语言句子,另一个是相应的目标语言句子。当输入一个源语言句子,翻译系统发现源语言句子最相似的句子在图书馆和模拟相应的目标语言句子翻译相应的翻译。整个翻译过程是找到和繁殖,只有比较,分析源语言句子。中国经济迅速发展,中国的对外开放也随着新时代的发展。基于全球化的发展,科学技术也在不断创新和进步,从而实现多元化的外语学习途径,包括翻译工具的发展。其实用性和功能的需求也不断提高,同时也使智能英语翻译研究的焦点。例如,2018年5月,王奇奇留下了深刻探讨人工智能语言服务行业的应用现状,分析了它的背景和应用现状,前景和建议(1]。2018年5月,他Liutao讨论一系列问题智能翻译发展的人工智能和提出解决方案的上下文中,它扮演了一个现实的角色发展的智能翻译在中国2]。2018年8月,张风扇使用基于最大熵的统计机器翻译方法来获取相关参数通过直接获得的最大熵模型训练和不同英语语言特性的最佳组合来解决部分结构歧义大量的英语语言。问题是提高英语的机器翻译的准确性(3]。2019年3月,气Qiyu基于时代背景的分析从翻译理论的角度,阐述了人工智能的应用在翻译行业,分析了人工智能在翻译的积极和消极影响,并结合实际的翻译工作者和语言学习者提出相关建议(4]。由于需求和智能翻译在当今社会的重要性,许多领域的研究正在探索智能翻译,取得了好的结果5- - - - - -8]。
与人机界面研究的深入,智能识别、人机界面系统的主要组件的智能识别。很多研究采用人机界面,取得了良好效果。例如,2018年6月,Yinxiang,于康,金Chengqian, Du Juanlin设计开发导航控制器的人机界面测试。结果表明,人机界面可以根据既定的发送操作指令串行通信协议。从导航控制器接收数据和信息。它可以满足人机交互的要求在农业机械的自动导航系统9]。2018年9月,宝嘉明设计一个新的multitank multitemperature热水器控制结构,设计了触摸屏人机交互界面设计的热水器单片机为核心控制器。它能够同时提供高温沸水,滚烫的水,冷水低于10°C (10]。2019年2月,徐心语人机界面的发展趋势分析了人工智能的指导下从三个方面:推荐系统、计算机视觉、语音识别,总结和预测未来发展方向的人机界面11- - - - - -14]。
机器翻译技术用于计算机技术将自然语言转换成另一种语言。它是一个新兴的科学技术,它结合了多学科相互集成。它促进智能领域的翻译。的发展领域的研究取得了大量的成果智能翻译。例如,2019年3月,蕴结,谭如意,刘Gongshen,和太阳Huanrong小语种翻译提出了半监督神经网络模型的基础上,分析coding-decoding框架和注意力机制(15]。周2019年4月,嘉宁学习同声传译的发展历史和目的,语音识别和机器翻译的理论基础进行了探讨,主要集中在语音识别,机器翻译的实现,并设计了一个基于同声传译系统c#语言(16]。现有的机器翻译方法也显示在其他语言中独特的优势(17- - - - - -20.]。
通过研究智能翻译的应用现状和前景的智能翻译,本文发现,智能翻译的实际应用功能和市场需求从现在开始的未来非常高。基于人机界面系统的优点,本文研究了英语多媒体智能翻译。根据机器翻译的层次短语翻译模型,结合自己的学习经历,人机界面翻译系统由四部分组成:预处理,图像分割,特征提取和分类器设计。通过实验测试,本文设计的人机界面翻译系统取得了一定突破正确回忆率值与其他系统相比,和可以用高质量完成翻译工作21- - - - - -23]。
2。人机界面翻译系统的设计
最简单的人机界面的定义是,一个人与机器之间,通过特定的接口,这个人可以给机器指令,机器可以执行状态和系统状态报告给用户通过这个接口。换句话说,正确的人与机器之间的通信信息和指令是主要的人机界面的定义。显示,主要单元,主要和图像采集卡构成一个完整的硬件组件的翻译系统的人机界面。根据功能,软件系统可以分为几个部分:预处理,特征提取,图像分割和分类器设计。处理流程如图1。
人机界面翻译系统的处理流程是它的一个处理流。首先,收集卡片用于获得一个视频检测系统,所以视频中每一帧属于图像处理;第二,灰度图像和背景删除关键图像,然后将文本和字符图像;第三,提取字符特征,提取词的分类器识别结果;第四,显示中国术语对应词。
2.1。预处理
预处理是指制备过程前进行最终处理和完美,这是专门应用于不同的行业或领域。因为得到该系统处理的内容从检测主机接口,通过收集卡片,没有失真,大部分的检测项目接口也由表、字符等。字符被删除的内容获取文本的关键。描述是基于区域增长算法,灰度差异和文本是水平和垂直扫描,分别。当累积值大于预定阈值,它被表示为一个表行,从而获得文本的关键。二值化是最简单的图像分割方法。二值化可以将灰度图像转化为二值图像。灰度的像素灰度值大于临界值设置最大灰度值,像素的灰度设置最小灰度值小于此值,以实现二值化。
Decoder-end体重期间分享可以互补模型训练:
2.2。图像分割
图像分割是将图像分成的技术和流程的特定领域具有独特的属性和提出感兴趣的对象。这是一个从图像处理到图像分析的关键步骤。正确的分割是唯一得到正确的目标和有效实施。在水平投影线之间的差距也是一个空行,和阈值的差距将实现角色的划分线。但是这个算法是复杂和耗时的,特别是在计算量太大,不适合使用这个系统。因此,对于重叠的角色,可以实现切削用破碎的人物。影子的一部分属于重叠的部分性格,不会导致累积误差,识别时,应充分考虑,识别准确率降低。为了使这个阴影部分,您可以扩展的阴影部分。
2.3。特征提取
统计机器翻译是当今主流的机器翻译方法。这可能是由于很多原因,如准确性、可伸缩性、计算效率高,能够迅速移植到新的语言对和域。层次短语翻译模型是统计机器翻译的主流模式之一。该模型结合了传统的短语翻译模型和语法翻译模型,大大提高了翻译性能比传统的短语翻译模型。同时,分析错误和系统造成的负担能力来分析序列是可以避免的。
层次短语规则的提取过程包括常见词的提取规则和规则包含变量的提取。最基本的条件提取一个短语是“对齐一致性。“当提取变量规则,通过列举所有可能的组合的跨度范围内,有三种可能性,包括变量、一个变量,和两个变量。规则主要包括源、目标、双向词汇翻译概率和双向短语翻译概率。计算需要估计每个短语的分数。规则的不变量,分数是1每次规则提取。为规则包含变量,总数的分数是一个变量。当计算双向短语翻译的概率,用于计算分数。因此,该项目实现细节需要注意。当提取规则的数量达到一定水平,你需要输出使用的临时文件和清除内存。
分类器属于识别系统的核心。特征提取和分类器的设置都是核心内容。如果特征提取有一定的确定性,分类器设计和功能可以简化,特征提取是受限制的。为了实现各种类型之间的可分性的判断,提出了各种各样的标准,实现最小特征尺寸来提高分类器的分类的准确性。样本之间的距离和使用的基准是一个函数的分类决策。这个分类器是首选雇主。根据实践,这是一种更直观、有效的分类。
一个英文单词识别的分类器分类错误是不可避免的,因为所以分类的结果是进一步处理。分类器实现的过程中实现单个字符的识别和分类主要是不充分利用上下文信息。重复的字符分割的结果,候选字符纳入的话根据信心从高到低的顺序,然后从字典搜索。搜索成功后,这是识别的结果。如果候选人的性格是非法的,那么这个角色将被拒绝。与拒绝了字符的单词,他们被忽略在词搜索。
为了提高翻译的效果,不仅单词应该解释也一个接一个的翻译复杂,长句子。然后,基于实际的特点,本文将造一个句子或短语组合不能满足中国词序习惯作为一个整体,实现有效的识别。较短的句子,您还可以使用上面的方法。然而,对于长段落或句子,如辅助文件,如果使用这种类型的处理,处理不能满足实时系统的要求。然后,您可以使用样本匹配方法来实现全文匹配和最终实现全文翻译。其中,检测系统的接口和屏幕变化更频繁的为了实现数据收集。在现场开发中,收集的数据的变化通常不影响现场检测系统,和场景切换不会改变太多,这样可以减少系统负担,改善了界面显示效果。
3所示。智能翻译的应用现状
近年来,人工智能技术已经取得了巨大的突破语音识别和语言处理的方向。人工智能语言翻译中也取得新进展,在许多领域得到了广泛的应用。
3.1。技术发展的水平
的声音技术,近年来,深度学习人工智能也取得了很大的进步在语言处理的方向,特别是在机器翻译。2011年2月,IBM的“沃森”系统进行了自然语言问答在危险边缘的一个综艺节目,打败两个人类冠军,表明显著改善计算机自然语言处理的能力。谷歌谷歌应用神经机器翻译(GNMT)系统,使完整的句子的翻译,这是一个里程碑式的突破,人工智能机器翻译。国内科达讯飞、腾讯、网易、百度和其他公司也推出了免费在线翻译机器翻译产品,取得了重大成就,汉英翻译。图2显示了人工智能在自然语言处理的性能。人工智能也取得了很大的进步在语言处理的方向,特别是在机器翻译。其准确性也大大提高,比如Siri,语音搜索和回声。重大突破可以实现不同语言的交流和语言的转换到另一种语言在某种程度上。在美国2016年10月,微软研究院在语音识别技术取得重大突破。这是第一次,人工智能语音识别邻近人类。它取得了跨时代的出错率只有5.9%。图1显示了2010年在语音识别性能的人工智能(图2)。
图3显示性能的人工智能在新闻翻译。
数据3和4显示性能的人工智能在句子翻译和新闻翻译,分别。从图4蓝色的双语翻译质量,机器自动评价方法,可以看到。
3.2。业务应用程序
主要互联网巨头国内外市场不断扩大人工智能翻译和开发商业应用人工智能的翻译。特别是大公司提供的在线翻译工具广泛应用于市场,和语言翻译服务市场的发展如火如荼。一些公司已经关闭了人工智能翻译引擎由于巨大的市场需求,而不是提供翻译服务。
同时,人工智能翻译已经成为最受欢迎的商业产品的人工智能语言和翻译。微软和谷歌之后先后推出了自己的翻译机器,国内网易,搜狗,腾讯,科达讯飞,把塔技术也逐渐推出自己的翻译机器。目前,人工智能翻译取得了良好的销售业绩,市场前景是光明的,功能强大,和语言翻译识别更精确的和聪明的。考虑科达讯飞公司为例:该公司推出了讯飞翻译2.0,它不仅支持中文和英文、日语、韩语、和其他33种语言同声传译也支持广东、四川、河南和其他方言的翻译。与此同时,它也有图翻译和配备了4 g WIFI,离线翻译,和其他模式,英语翻译水平可以达到教学水平。
4所示。智能翻译的前景
4.1。人工智能翻译技术的前景
引进技术,如深度学习之前,人工智能机器花了50年,最初的情报,在2006年,加拿大多伦多大学的教授杰弗里·辛顿提出了深度学习的概念和应用的技术使电脑。6年才确定这只猫。α去零软件,也由深度学习技术,可以通过自学习进化,它只需要3天。
4.2。人工智能的应用翻译市场的前景
随着世界经济的全球化的发展,经济,各国人们之间的交流变得更加频繁和频繁。
4.3。对当前人工语言翻译市场的影响
人工智能的范围不断扩大和加强。目前,汉英翻译的市场价格是200元1000字。在专业和汉英翻译,只有200元是在早期阶段。除了先进的翻译,人工翻译可能很难找到工作。
5。数据源
从本文的示例来自于13689年从互联网上收集的基本中文和英文语法。本文中使用的测试集是一个随机抽取的200的13689个数据。所使用的资源包括167318数据分区表,633年数据密钥表和27个数据表模式。的召回率和F值与ICTCLAS分词进行了测试和比较。结果如表所示1。
在这篇文章中,13689年的数据是随机分为三个部分,即训练集(10166句),开发集(1300句),测试集(2223句),培训四维语言模型使用SRILM工具。本文进行了三组实验。第一组使用ICTCLA部分单词和使用公共层次短语解码模型解码它们。第二组使用通用层次phrase-based解码模型解码它。第三组使用该方法和单元划分方法解码。解码使用dictionary-level短语模型和手册模板。字典包含9555项和495手册模板包含模板。蓝色的分数作为评价指标用于翻译的结果。结果如表所示2。
6。结果与讨论
6.1。数据分析
从表可以看出1ICTCLA的回忆值是68.23%,召回这一研究方法的价值是95.74%。从上面的结果可以看出,该方法比ICTCLA更准确,更好和提取规则,提高翻译质量和远程排序的句子的能力。
本文分析不准确翻译的例子,发现主要有以下类型的错误:(1)不同的语义环境中国人:善意的谎言参考答案:善意的谎言翻译结果:谎言(2)联想是不同的中国人:如鱼得水参考答案:如鱼得水翻译结果:就像鱼对水(3)不同的审美形式中文:你是一个幸运儿参考答案:你是一个幸运的人翻译结果:你是一个幸运儿
在培训之前,我们首先需要配置一些hyperparameters神经网络。的主要参数如表所示3。
模型尺寸之前和之后的内存优化计算。然后,统计结果见表之前和之后的优化4。
从表中的数据4之前,可以看出存储优化向量维度的增加而增加,从4.01 GB 36.93 GB。选择最优模型调整参数,数据集是小。数据集被组织如表所示5。
从表中的数据5可以看出,训练集的规模是500,验证集的规模2,测试集的规模是1。基于的原则在不同的网络模型进行比较实验,除了设置网络模型改变条件,硬件和软件环境和其他实验参数设置都设置为常数的条件。一些参数设置如表所示6。
6.2。智能翻译系统结果的例子
图5智能翻译系统的主页,它默认自动检测到中文和英文语言环境(手动选择所需的语言环境)和进入语句翻译的文本框,系统自动显示翻译结果。边肋骨,手动直接选择区域,然后单击所需的区域,如图6。
通过图的英文翻译6我们可以观察到,翻译系统可以准确地放置在学术句子翻译,所以系统还可以在普通翻译介绍给有良好的性能。
在图7,翻译系统翻译摘录摘要朱自清的著名散文“快点”。以文学作品为参考的翻译系统大大提高了翻译系统的标准和要求,反映了系统的翻译质量。根据图的翻译结果7,该系统还具有良好的性能在中间的英文翻译。
最后,通过实例,系统性能优秀的翻译,直观和准确的翻译。为了进一步丰富语料库,它还可以为用户提供一个非常方便的接口,方便用户提交正确的结果的翻译后台管理员验证。这也遵循翻译记忆的概念,极大地扩展了语料库的来源。
7所示。结论
统计机器翻译的几大优势,如没有人工干预和短的开发周期,使本研究发展非常迅速的在过去的二十年里,尤其是在许多特定字段来满足各种社会生活的需要。外国公司,如谷歌和微软,国内百度,网易有道和其他互联网公司为用户提供了免费的在线多语言翻译系统(22,24,25]。然而,每个公司的主要语言翻译方向是不同的。例如,谷歌主要目标为中心的多语种翻译英语,百度主要目标为中心的多语种翻译英语和汉语。我们不能否认机器翻译已经成为越来越重要的在我们的生活中。目前,在大多数情况下,机器翻译的结果仅仅是帮助用户理解原文的一般含义在某种程度上,翻译结果不能直接发布为一个平滑的翻译。如果你想进一步获得一个完全正确的翻译,你仍然需要专业翻译人员改正。国际关系的和谐发展,国与国之间的交流与合作项目正在增加。英语是世界上常用的语言之一。汉英翻译是学术理论研究的焦点22,26- - - - - -28]。翻译系统的设计包括四个模块:预处理、特征提取、图像分割和分类器设计。特征提取的部分是最重要的。少量的翻译字典和人工模板添加到层次短语模型。翻译的单位然后胶结果在相反的顺序形成最终的翻译(29日- - - - - -31日]。实验表明,本文设计的翻译系统有更好的性能比传统的智能翻译系统,它试图尽可能地消除差异,考虑自动获取关键词的方法,模式,和翻译词典,扩展我们的现有资源32,33]。
数据可用性
的数据支持本研究的发现可以从相应的作者在合理的请求。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作得到了山东艺术科学重点项目(201706499)和山东省文化、旅游研究项目(74年21王(Z))。