文摘
日本,作为一个全球语言,有助于文化交流,增进相互了解。新闻翻译时,译者应注重句子从跨文化交际的角度来看,这样翻译是更准确的和自然。只有日本和中国之间的关系可以帮助翻译更多的新闻报道,对外传播信息,让他们了解更多关于外国的事件。分析语料库使用语料库手段,充分利用技术优势语料库的单词,词汇,文本对应、语义韵特点,等等,突破传统翻译研究与大量的语料库统计数据。的频率和丰富词汇选择不如在原始文本由于语言和翻译语言的语言,但数值差别不大,和高频词汇基本上是一致的,确保原文的核心内容。原句将解决根据文本内容的句子和话语。中文翻译一天原来的词汇是358次,和表的高频模态词1274次。因此,声明中频率最高的“应该”占33%所使用的高频声音。332年日本原始文本,最高频率动词,总共247次。使原文和翻译更有说服力的语言特点,以及翻译和翻译策略的选择。
1。介绍
新闻实时、实用,这个翻译是正确的。在面对不同的新闻,译者需要充分理解新闻内容,使用翻译技巧转化为自己的语言,让更多的人了解新闻。新闻翻译不同于其他类型的英语翻译。它涵盖了一系列广泛的话题,包括政治、经济、文化、外交、军事活动。许多专业术语将用于翻译。如果译者不了解这些事件,新闻翻译的准确性会受到影响,新闻英语翻译的最终目标可能无法实现1]。此外,新闻英语翻译是跨文化的影响主要是由不同国家的文化。例如,尽管英语在澳大利亚,印度和英国,由于国情的差异,不同语言表达式。因此,文化差异的细节需要在具体的翻译过程中,提高新闻翻译的准确性(2]。当来自不同文化背景的人打交道时,译者应该改变这个词的意义和必要时添加一个标记,以便读者更好地理解新闻事件。例如,在中国,红色代表幸福和繁荣,而在其他国家,它代表了暴力和危险。
翻译是一个文本信息和宣传相结合。它的服务对象是普通读者,它的目标是在风力和土壤,为他们提供最新信息以及其他地理、文化、自然、和其他话题。新闻话语的主要功能,从功能的角度来看是传播和行为归纳。中国和西方国家有很大的文化差异,这通常是通过语言交流。中国和西方文化发展自己独特的审美习惯长期文化影响的结果。语言直觉和表情都受此影响的审美习惯。有一些独特的语言表达和目标反映在新闻翻译,给新闻翻译文本独特的风格和表达。日本,作为一个全球语言,有助于文化交流,增进相互了解。新闻翻译时,译者应注重句子从跨文化交际的角度来看,这样翻译是更准确的和自然。只有日本和中国之间的关系可以帮助翻译更多的新闻报道,对外传播信息,让他们了解更多关于外国的事件。
根据统计研究的语料库,在词汇选择方面,频率和丰富的源和目标都不如原来的,但价值并不大,高频词汇基本上是一样的,保证原始核心内容传输的准确性(3]。选择的语义韵,翻译是一个中性的语义韵选择中性的选择语言的语言特征与原始语言月亮的倾向。总的来说,月球节点提供一个积极的混合语言氛围。语义韵的原因是,节点将考虑到语境因素在选择匹配,造成语义偏航气氛(4]。语义韵的分析有助于词汇的正确使用,从而提供一个更符合语言语义氛围。在词汇的选择,你应该用日本语言和语法特征,表达句子,富人利益的目的,更接近的语言特点和阅读习惯的目的。皇帝的态度反映在演讲。不同模态词的语义表达时不同的态度和立场。翻译的时候,特别注意这个词的翻译,尤其是使用情感词。因为翻译是不一样的原始文本或翻译,会有差异如何理解原文和他们的感受。因此,按照翻译规范,探讨语料库的翻译更接近原文。
函数式语言的翻译问题可以通过数据分析发现的语料库在本文的创新点。本文的日文翻译质量评估可以作为翻译质量评估模式研究、语料库是用来评估丰富,词汇密度、和其他因素。根据研究的结果,它有利于发现问题个人翻译,这将为未来的新闻翻译工作有一定的指导意义。
2。相关工作
语料库通常指的是存储在语言研究中的语言材料,用于电子形式,是来自自然的口头语言或书面样本代表特定的语言或语言变体。科学选择和标记后,适当scale-based语料库可以反映和记录实际使用的语言5,6]。人们观察和把握语言事实,分析和研究语言的法律系统通过语料库。语料库已经成为不可或缺的基本资源的语言理论、应用研究和语言工程。
基于文本类型理论,根据布勒公司的三种语言功能分类,刘话语分为信息话语表达话语,话语和感染(7]。Kaur认为翻译质量的评估可以根据功能实现原文和翻译之间的客观评价指出,翻译应当全面分析各种影响因素的翻译文本类型的角度来看,语言要素和非语言元素(8]。Takigawa相信语言的两个函数直接影响翻译的质量。这两个因素被认为是在参数设置,也就是说,是否等同于原文在翻译文本的概念和人际意义(9]。陈提出语言的“学习控制”模式,即LC模型。它是由四个系统:语言的自动控制系统,语言自动学习系统,语言知识自动反馈系统,和主页和文本自动检测系统(10]。Tomyuk等人认为,动态(循环)语料库的所有研究成果的继承之前的语料库,不是反动。只是抽样媒体和文本的语料库增加循环的属性和属性值(11]。张了一篇日本分割系统,结合日本研制的基于统计的分词方法和CRF + (12]。在研究日本的语法分析,陈等人提出了一个方法来分析日本的语法关系,这主要是由使用日本的句子的语法功能标记功能(13]。施了一个日本音节分割和分词系统,采用常规和统计音节分割,分词和词性标注方法(14]。李,李提出一个方法来提取音译相当于对日语和英语双语命名实体从日语和英语结合起来可比语料库[15]。矛提出了一种提取方法双语命名实体等价对基于语义信息和语音信息匹配。这种方法建立的匹配模型语义信息和语音信息的源语言和目标语言。使用这个模型的影响的方法是找到一些命名实体等价对没有在字典里(16在外面)。财富一个建议,在双语可比语料库,当有命名实体等价对,命名实体等价对单词具有相同或相似的语义的文本上下文。前后两个词选择命名实体,这个词是作为实体的上下文信息。然后,候选命名实体等价对的相似度是由词向量相似度的计算环境(17]。金提出,从可比语料库中提取实体等效双时,我们首先需要定义多个特性,包括语音特点,汉英性格特性,和上下文特征。然后,特性是线性融合计算候选命名实体等价对的相似度。然而,这种方法不考虑,主要特征在不同类别的命名实体18]。
还有很少研究东亚国家的语言文字工作,尤其是对日本的研究;它是处于起步阶段。上面的方法都有一个好的语言语料库汉大赋双语的实体。它是一种人造语言。一句话,一个单词是需要形成后单词和多个单词的组合。
3所示。双语平行语料库
3.1。构建一个错误的革命
语料库是语言记录的集合,对语言和翻译的研究是很有用的。语料库是一个大规模的电子文本库和一定能力的文本或话语片段(19),这是使用一个随机抽样方法收集收集自然发生连续的语言。类似的语言库,多语言库和平坦的语言库三个主要类别的语料库。研究翻译风格,使用多语言库。为了研究翻译的文本,它提供了一个有效的参考系数大多数应用潜力在翻译研究中,它主要用于研究深翻译问题,如翻译规范和其他并行语言和主要语言翻译。有单词、句子和段落级别的并行编程语言,以及单向和双向并行库,主要是用于翻译实践、翻译教学、翻译研究、翻译培训、词典编纂、机器翻译。这是一个语料库,是最接近翻译领域20.]。双语平行书写板和其他语料库收集到的语料类型和最大的差异语料库加工过程。双语并行收集双语工作流程对应于原始的原始和目标,包括这个词对应,对应相应的句子或文章,和一些并行语言库需要一个典型的长度对应的长度。信件和翻译的质量将直接影响双语平行的质量和施工过程语言库。双语平行Wrabs。除了收集到的语料,格式,和标记处理,最重要的对齐是必须的。语料库的精度水平的生存有关整个并行库。
用困惑集中的词代替这个词中的每个单词种子词的词库;生成的单词可能是错误的。由此产生的单词可能是正确的单词,这就需要正确的词产生的种子词库中的词获取错误。具体施工过程如图1。
3.2。建立双语并行库
如果没有特殊的并行库或有用的平行支出价值不高,自建双语并行语言图书馆是最好的选择。企业筛选和双语平行语料库之前需要创建一个库。双语文本与文本的语言形式翻译的关系或与另一种语言的文本单元的通信。
并行语言库是一种语言数据库存储原始文本及其翻译。并行语言库中发现两种语言大多是计算机辅助翻译系统。检查计算机的高速处理能力,分析每个原文句子的翻译,然后通过匹配率,把它们分类的原始翻译原始匹配率在图书馆,供译者参考。翻译完成后的辅助翻译。语料库自动形成一个完整的匹配对的原始文本和记录语料库翻译时翻译成一个新的翻译单元,如一个句子和语料库的大小增长(21,22]。并行语言库辅助翻译的工作为主。在收到原来的翻译版本的匹配率,是可以接受的,它可以用来按照当前形势下,也可以被忽略。语料库不会修改现有的翻译或者记录一个新的翻译如果译者选择翻译现有的原始文本匹配率。如果译者改变现有的翻译在使用它之前,语料库将把新的原始和翻译和跟踪。语料库也将提供一个翻译的翻译与原文对它在图书馆新的原始记录,如图2和双语并行语言库。
所有与匹配率精确对齐主体之一语料库在这个过程中被记录。并行语言库跟踪的所有翻译的原始文本和翻译语料库首次使用以来,这是最好的证据翻译翻译的跟踪(23]。两种语言并行语言库将与翻译发挥着越来越重要的作用,无论是个人翻译或翻译团队,只要它不改变翻译领域。当语言进行交互,它在有限的时间内。它改变了翻译增加,翻译变得越来越依赖于语言库。
,因为将会有更多的文化差异在日本翻译,你应该用你自己的语言习惯提高新闻翻译的平滑度,以便读者能理解第一次在文章中包含的信息。是一种有效的翻译方法,翻译的主要目标是将原来的句子结构,句子,等在中国英语,同时确保原文和原文是一致的。这种类型的翻译能让读者更好地了解其他国家的民族特色和语言习惯,导致更小的和更准确的翻译和原始的差距24]。
4所示。建立一个计算机辅助新闻日本翻译系统
4.1。单词的单词的普遍性
有许多词汇在语言词汇但经常使用在日常交流中,那些高频率各领域各空间部分,称为通用词汇。本文分析了多功能性,多才多艺,空间的多功能性。定性检查方法相对比较简单,分配领域的词汇也是一个眼,但它缺乏科学数据支持,因此本文选择从量化的原则。计算领域的词汇,如公式(1)
这个词是文本的使用(2)
其中,代表的相对频率领域的词 ,和代表的平均相对频率所有类。是文本的总数;代表了扩散系数 。
计算各领域分布的均匀性,计算公式是(3)
在上面的公式中,指出了数个月的考试,需要每个月的中国材料图书馆语料库测量:这个词的词频吗月。
4.2。语义相似度
语义相似性度量可以参考向量模型的信息检索。向量空间模型的基本思想是指示不同的文本特征项的权重。表示文本数量可以选择单词或短语作为特征项。人们普遍认为,这个词优先作为功能条目使用单词和短语作为特征项,以及相对词频的组件代表向量;重量计算方法如下:
是系统中的文本的总数,然后呢包含这个词代表文本的数量 。 表明初始频率在文本指的次数出现在文本的文本。
4.3。文件排列
文件排列可以以两种方式进行,根据文件属性;这是对齐的,文件数量的价值是平等的,或工作数据的数量必须被认为是翻译成翻译。第二可以决定通过执行跨语言相似性的对齐关系。对齐的基本流程如图3。
因为需要处理各种各样的语言文件,如果字符串提取方法需要一个彻底的对语言的理解,你会得到更好的精度和分辨率,但是算法的应用表面会非常有限;毕竟,你可以熟悉各种语言。有数量有限的语言。因此,采用与被广泛接受的方法提取特征。该方法假设,除了文章的词没有本文的实际意义,它是消除无效的话说,和句话说的频率越高,越可以表示。这种假设是国家与描述内容更为常见。因此,需要的是理解提取特征字符串。然而,需要辅助词,意思是标签工具在中国和日本。通过标签的话,这个项目可以专注于单词与某些单词,如名词和动词。
提取特征语言之间略有不同;首先,单词出现将进行分析。因为大多数词在一种语言像英语有明确的意义由于它们之间的空间,不需要第四个英语。虽然中国可以考虑的话,嵌套的单词字符经常有单词的意义,在翻译过程中,汉大赋通常是使用,而不是直译。结果,一个单词需要治疗的中国,和这篇文章分为单词而不是单一的考虑。中国社科院的word-visual接口用于这个项目。使用这个词接口,您可以获得每个单词的单词,以及单词,不需要考虑,如代词、等等,为了确定文章中的词的频率,基于词频。本文独特的字符串。
5。翻译质量评估
5.1。基于汉大赋的语义韵分析Pa
Semanti年重要的概念在语料库语言学的研究中,不属于某一个词,但根据上下文的作用,意义的气氛笼罩在词汇,它涵盖了以前的感情色彩。语义韵的表达式是一个趋势的态度,不是绝对的态度。
在大量的复杂和匹配的文本数据,它可能很难找到一个可行的分析,甚至不知道可以遵循。然后,根据提取指数一定的间距,可以解决研究的研究,提取的索引行也有可操作性和代表性。因为选择节点词是名词,其主要集中匹配之前和之后,这个词和词与形容词和动词有关,加上中国表达或象征不同的语气组件,将左和右。距离设置为2。词在日语句子更灵活、翻译和原始类将L5-R5相比文字的间距。因此,统计数据是由提取的左侧的共同匹配节点。确定重要的匹配节点的词,后进入节点词搜索的出现频率最低的标准搜索,匹配的符号表,MI值,MI值意味着交互信息,即一个词一句话同时值相同的发生,简单匹配的强度。
最后,确定了语义韵的高频匹配节点。分析词批评的功能,根据所选词的语义韵;分析原文和翻译方面和技能,结合上下文的使用词汇和功能角度的分析和解释在其结构中,根据节点的“工作”,如表所示1和数字4和5。
可以看到从上面的表中,动词“工作”匹配的节点通常是透过观察,和扩张背景可以看出,通常呈现积极的倾向;“工作”回答可以看到通过分析和扩展上下文。大部分的存在是一个积极的趋势,少量含有负面的意义,和上下文会发现光环的语义。
5.2。日本基于双语并行结构分类
从表可以看出1使用的数量超过20倍的“増加”和“改进。”统计结果的分析和使用,你会发现在日本结构,结构与动词相对应的是更多。其中,动词“增加”是最高的整体比例。形态学、匹配和语义形态的复杂和多样化。因此,它是难以实现全面、准确分析通过模范在传统的翻译方法。仪器的帮助下,我们可以执行更高效,快速检索和分析大量的角落。因此,我们将使用并行语言库来做统计分析比较的统计分析源语言翻译和原文,从而探索翻译的特点和规律。检索的文本,翻译和原文的双语并行库。分析检索几个模态词频率最高的。所示。 Figure6。
具体使用的高效的动词,原词汇的中文翻译一天358次,和表中列出的高频模态词1274次。所以最频繁的语句“应该”占33%所使用的高频声音。中文翻译,中文翻译,原来的高端动词,332年日本的原始文本,频率最高的动词,共247次。
根据上面的数据中,原文的中文翻译,翻译的翻译的翻译高,翻译是更高,作者展示了一个情感渴望理解原文。可以看出,翻译,有更多有用的使用和可能温和的原始文本中使用频率较高,相比,中国和日本的原始文本翻译。原文的内容的影响这一结果负责。译者可以表达译文读者的情感态度反映原理解的情感态度。在日本也可以看到原始文本,不同寻常的使用不可避免的皇帝,展示日本社会科学文本语言的使用是比较软,更少的情感态度。
5.3。分析基于汉大赋的高频词
高频词统计,重要的语言特性,以及意识形态问题隐藏在简单的单词,词汇是排名前十的真实的单词在中文翻译的原始文本和翻译的中国翻译,单词的前10名专家,工作,问题,顾问、政府、技术方面,建议,和帮助。外观如图的频率7。
根据高频词的中文翻译原文和中文翻译的高频单词统计,高频词基本上是一样的,最常见的频率在原文是“专家”,翻译是最常见的频率也“专家:“第二的意思,原来的高频词“工作”,“方面”和“帮助”发生在高频词,翻译和频率高,表明高的内容。但其频率分布数据是不同的。分析可能的原因是,有许多词汇的转换在日本,日本的表达式是用来表达多个同义词,和句子是更加丰富,而不是单调。分析高频词的翻译和原始文本,文本内容的表达高,表明翻译和原文内容类似的价值。第二,我们发现频率相对较高;可以看出,翻译更符合日本原始文本的词汇使用的特点。
5.4。质量分析的新闻翻译从跨文化交际角度看
新闻翻译第一次翻译一篇文章时,新闻语言必须首先完成定位工作,确保原文的语言特点和文化结构。定位后,译者使用他或她自己的知识进行新闻翻译文章的理解为了实现新闻英语翻译的终极目标。新闻等可以划分为不同的文本信息,表达式,以及在正常情况下召唤模型。翻译时必须使用不同的翻译技巧处理各种文本类型为了准确传达新闻的意义。例如,在一个信息新闻文本,译者可以使用目标语言翻译,消除了需要添加个人见解和情感,平移的句子相对比较简单和准确的。表达式文本更关注于句子的翻译,试图反映新闻的“个性”,必须符合原始语言特征表达时,允许更多的扬声器,使其更容易阅读,帮助他们理解新闻的内容。
Wordsmann是自然语言处理的基础学科。更先进的处理的基本技术,在许多领域发挥着重要作用的机器翻译、语音识别、文本学校对信息搜索,等等,广泛应用于各种自然语言处理系统。这个词标签添加解释性语言语料库信息的过程;即句子中的每个单词是一个合适的词,和它的难度是识别并有一个词,那就是,如何给一个上下文环境多个单词。在实验中,大规模的语料库是必需的,但由于条件限制,没有标准马克文本;我们使用新闻人物和预处理等,实验训练文本。为了比较并行性,本文是基于双语教材和分析的一个节点,在固定的语言库迭代20倍。实验结果如图所示8。
不同的训练样本尺寸图8影响培训时间:收购功能函数的时间随样本的规模增长,和迭代计算时间随样本的大小,但增长率正变得越来越小:主要的时间支出是迭代计算。随着训练样本的发展、特性功能需要从所有获得的样品,和时间支出一直线性增加样本的增长:随着训练样本的增加,更多的功能存在前面的前面的文本,从而增加。特征的数量低,迭代过程是特征函数的参数。因此,时间支出的增长速度正变得越来越小,它会趋于平稳的时候样品就足够了。
实验使用GB训练样本规模,但可以看出,作为文本越来越多,可以预计时间的增加支出,最后直到迭代计算不再增加,增加收购功能函数部分的时间。当迭代计算时间不再增长,增加样本没有新的功能函数,和训练样本的增加没有意义。计算不同节点的数量和不同的序列;实验结果如图所示9。
与语义数量的增加,数据的训练时间缩短9和10。结果是一个更大的CRF模型。多个语义可以提高效率:当语义号码是32,翻译的公平调度技术将确保每个节点运行一个语义,而不是采取“最近计算,”的原则,这样一些沟通成本将大于计算价格,导致性能。执行时间略有上升。
6。结论
研究提供基本的语料库收集工作在中国和日本的机器翻译,自动获得双语实体而不是人工收集,从而大大提高了工作效率,增加了数量的角落。原词汇的中文翻译一天358次,而高频模态词表中列出的1274倍,所以频率最高的词”,“使用的高频声音的占33%,根据本文。332年日本原始文本,最高频率动词,总共247次。,因为将会有更多的文化差异在日本翻译,你应该用你自己的语言习惯,提高新闻翻译的平滑度,以便读者理解本文中包含的信息。翻译主要用于原日本句子结构转换为中国,并确保原始语言和文本保持一致。这种类型的翻译能让读者更好地了解其他国家的民族特色和语言习惯,从而减少之间的差距原来翻译和表达。在新闻,更频繁地使用长句。如果译者不能准确分析相应的结构,新闻翻译的质量就会受到影响,原有的新闻不会沟通。为了提高翻译的准确性,译者必须首先明确文章中的句子之前把整个地区。
未来研究方向:提高辅助语料库和量子工具,支持更大程度的自动化,提高了语料库的操作规则,限制语料库的粒度和混乱,为了更好地进行语言研究,并提供高级翻译软件,用质量语料库,改善机器辅助翻译实现相关算法的不足,以达到理论算法的效率。
数据可用性
使用的数据来支持本研究的发现可以从作者要求。
的利益冲突
作者没有任何可能的利益冲突。