文摘

为了实现智能诗歌风格分析的影响,本文应用诗歌风格分析、文本分类算法结合了知识表示执行文本分类和识别算法,提高了算法,并应用到诗歌风格的分析模型。此外,本文结合智能算法来构造一个诗歌风格分析系统,构建了系统的功能模块,语料库中诗歌文档进行预处理,将它们映射到向量空间,可以直接由计算机进行处理。此外,构建系统模型后,本文验证了诗歌风格分析系统基于文本分类算法通过模拟实验。从研究结果,诗歌风格的影响分析方法基于文本分类算法提出了很好,符合实际需要的诗歌风格分析。

1。介绍

目前,很多自然语言处理技术的进展。作为自然语言处理的一个分支,计算机处理的文学语言是现在学术界面前的。国家自然科学基金委的支持下,本文试图在这一领域的初步探索。本文的重点是如何使用机器来实现诗歌的风格。作为中国传统文化的精华之一,古典诗歌意义的意义,简单而深刻的情绪,他们的风格是令人陶醉的。然而,在很长一段时间里,诗歌作品的风格的判断主要是基于读者的判断和认知风格基于经验和感觉。此外,传统上,没有明确量化规则和没有正式的规则。对机器来说,它只能依靠这首诗的文本内容确定风格。从表单,这首诗也是一段文字,和风格的判断也可以视为文本样式的分类。因此,这个问题本质上是转换成一个机器学习的文本分类问题。 That is, under a given style classification system, the machine automatically learns the rules according to the content of the text, and establishes a classification discriminator according to the rules, and the classification discriminator automatically determines the style of the text. Based on this, this paper proposes a model framework for computing the style of Chinese classical poetry based on machine learning. This research is of great significance for expanding the application field of machine learning, for the informatization and excavation of traditional poetry, and for the language understanding of poetry and the computer-aided research of various literary works.

珍宝之一在中国文学的历史,诗歌是古往今来因为它的持久魅力。这种文学形式,深受公众和文人poojas,一直成长,发展,传播和已达到其发展的顶峰在唐宋时期。对唐诗的研究一直是学者们研究的热点和文学爱好者。自古以来,无数专家和学者进行广泛、深入地研究唐诗和诗歌从文学的角度来看。然而,随着信息科技的不断发展,人们已开始尝试利用信息科学和技术来解决工作和生活中遇到的一些语言问题。自然语言学近年来发展迅速。面对胜利现代汉语自然语言处理的一些自然语言处理方法应用于古代诗歌。同时,鉴于中国古代诗歌和现代之间的区别,从计算机的角度,综合数据挖掘、遗传算法,如知网和其他技术和资源,它关注文本分类技术的应用分类的诗歌风格。

创建诗歌的过程中,不同的人才,性情,文学成就,生活经验,意识形态领域,文人的思想感情和墨水的客人会影响的内容和表达文人所写的诗和墨水的客人,他们也将诗歌具有不同特点的能力,因此,没有相同的诗歌风格。然而,在欣赏古典诗歌的过程中,如果你盲目地注意诗歌之间的个体差异,忽略诗歌的共同特征,它可能会导致虚无主义的问题。

本文结合了智能计算机算法的文本分类算法应用到诗歌风格分析和构建一个智能分类系统,为诗歌的智能分类奠定了基础。

使用计算机技术来协助诗歌古典文学领域的研究,一些学者已经开始初步尝试和探索。古典诗歌数据库的建设和文化知识库的计算机研究实验室一些大学和研究机构(1]。越来越进步的自然语言处理技术的研究中国的语言,它甚至可以逐步支持节奏的分析,情感元素,古典诗歌的风格特征2]。提出了“计算诗学”在这种情况下(3]。有许多相关领域研究成果的诗歌风格。根据文献[4”主题基于模型的语料库建设和创造计算机辅助研究,“基于LDA使用主题模型推荐词的方法研究和分析诗歌词特征,词汇语义分析、和风格特征分析。文献[5)使用向量空间模型(VSM)代表诗歌的文本,提出了两种类型的分类模型的古典诗歌,大胆的优雅和优雅。分类模型是基于机器学习和自然语言处理。诗歌风格进行分类,取得了良好的判断力的影响。根据文献[6)分段后根据诗诗指标和统计分词方法,他们建立了一个诗歌词汇表数据库和使用机器学习的方法来分析诗歌风格的特点,分类评价和情感分析。此外,在相关领域的研究都集中在诗歌风格的算法改进机器分类模型,以逐步改善诗歌风格的分类模型的准确性评估。早期语料库建设和计算机处理程序已经很清楚。各种研究工作仍然是深入(7]。可以看出,有相当多的研究分类和判断的诗歌风格,积累了丰富的经验,诗歌风格的分类和判断本文基于机器学习。

诗歌的处理可以被视为一个文本处理问题与一个特殊的内容形式(8]。文献[9)开发出一种“诗计算机辅助研究系统,”在诗中把词汇作为主要研究单元实现词检索,词频统计,和图像索引。文献[10)提出了一种基于词连接的自然语言处理技术和使用诗歌语言的理解。它成功地进行了测试的诗歌词汇材料标签,诗歌语言的初步分析测试,评估测试诗歌语言的大胆和优雅的风格。文献[11朴素贝叶斯与遗传算法结合起来,提出了计算模型判断古典诗歌的大胆和优雅的风格根据每个字符的诗为最小单位,和测试的经典诗歌的语料库。取得了良好的效果。文献[12]介绍了贝叶斯分类技术引入诗歌的研究主题的观点,取得了良好的实验结果。文献[13)提出了一种分类方法基于互信息和LDA的诗歌主题之间的关系,取得了良好的分类效果诗的主题和时代的发展。文献[14)使用向量空间模型(VSM)诗歌文本转换成一个向量并选择这个词功能通过卡方检验。最后,文本分类器构造了基于朴素贝叶斯和支持向量机算法,和平均分类准确率达到74.7%。随着深度学习的兴起,文献[15]应用RNN中国古代诗歌,神经网络的生成和使用整个诗歌的历史语料库训练语料库,添加某些单词和行生成的诗歌之间的约束来实现它有更好的效果比传统的诗歌生成系统。文献[16]采用RNN模型生成四行诗诗,并成功地增加了一个注意力机制,所以诗歌可以学习语义、结构、押韵和其他信息在同一时间。文献[17基于RNN)模型,通过优化这个词向量的诗歌,引入注意机制和混合训练,一个模型可以产生基于关键词获得相关话题的诗歌,并取得了较好的效果。

3所示。聪明的诗歌文本生成系统的知识表示

就像许多其他智能系统,知识表示体系建设期间是一个非常重要的关键决策。我们对待汉字和艺术品图像参数形式。数学上,书法的“形象”C表示为band-shaped图像面积由一连串的省略号。这意味着这一系列C组成 椭圆 , , , 使用为中心、半长轴和半轴段的椭圆 ,分别。我们中国传统诗歌的文本定义为

上面的知识表示方法的启发,本文的方法。摘要band-shaped区域被定义为一个椭圆曲线沿着一个预定义的。

我们现在把等价的概念和使用的形式化定义的层次表示诗歌的文本。如果R是一个定义的等价关系 领域,也就是说,R如下(18]:(1)反射性的,(2)对称的,(3)过去了。

域可以分解成一系列的子集 的关系R,它满足以下属性:(一)如果 ,然后 (b)

等价关系下R,如果 ,我们说 相当于 ,可以表示为哪一个

为了建立的分层表示的诗歌文本,我们介绍了四个等价关系 : :使用的所有结构椭圆形式相同的原始信号是等价的。 :形式相同的组合使用的所有原中风迹象是等价的。 :所有组合中风用来形成相同的激进是等价的。 :所有激进分子用来形成相同的汉字是等价的。

我们假设构造椭圆 分解为 等价类的等价关系 ,可以表示为哪一个 全国矿工工会1被分解成原来的迹象 等价类的等价关系 ,可以表示为哪一个 中风被分解成num相结合3等价关系下等价类 ,可以表示为哪一个 全国矿工工会3激进分子被分解成 等价类的等价关系 ,可以表示为哪一个 (19]。

换句话说,在一个特定的诗歌文本工作C,总共 原始的中风 此外,C包含 结合中风 我们可以说C num3激进分子 我们也可以说,C组成 单词 很明显,当我们使用一个词的粒度应用综合推理, (20.]。

现在,传统的分层表示诗歌文本作品可以正式描述如下: M集的元素数量在哪里 因此,下面的层次关系表现在诗歌文本作品可以表示如下:

这个分层表示描述诗歌文本是由最低水平的结构性椭圆。每一个更高层次的描述如何生成一个表示当前水平的低水平的信息。从本质上讲,它是一个树形的知识表示。

在第0级的层次表示,诗歌文本作品被视为一系列的省略号,表示 这些椭圆称为结构椭圆诗歌文本作品。为每个建设椭圆,它是表示 , 作为其中心,ai和bi作为半长轴和半短轴,分别。然后,诗意的形象文字工作C将一系列的图像区域由一个椭圆。

如果一个低级元素不能与其他元素合并在同一层面上,它将被提升到一个相邻的更高级别的元素。同样的,也有可能彻底将下调到合并的姿态,甚至是原始的。通过这些升级和降级安排,我们获得一个统一6级分级系统,它将用于诗歌文本的生成。

我们表示第一个结构椭圆诗的文字工作 ,及其相应的拓扑结构 包含拓扑信息,通过它, 可用于形式

我们表示图像的边界框区域的元素 作为 在这里, 边界框的左下角的坐标 分别和它的高度和宽度。世界上所有坐标是坐标系统。因此,我们有 在这里, 分别是比例和转移矩阵。严格的数学定义的矩阵

如果 必须结合一个或多个结构元素的一个较低的水平。我们把后者子结构的元素。结合所需的所有信息 存储在 ,的拓扑构造函数

通过拓扑构造函数,我们可以建立一个不同级别的层次代表的一对一的映射。换句话说,任何等级表示像素 s-th的结构元素 属于k水平可以唯一地映射到像素层次表示 cth结构元素 第一级。其中,

如果我们引入算子 ,

然后,会有一个关系:

年代th的结构元素kth级的等级制度来标示 ,和它的参数表示 我们现在推出一个新的矩阵算子 ,可以用来生成一个吗 维矩阵 n - - - - - -维矩阵 如果 ,然后我们有

我们进一步定义一个矩阵算子

然后,诗歌文本作品的层次结构可以被正式表示如下:

其中,

在这个时候,算子定义如下:

其中, 矩阵的列数吗 , 是一个 - - - - - -维零矩阵。

在上面的方程中, 代表一个区域的构造椭圆, + 这个椭圆的标准化版本最初的椭圆 边界框。也就是说,如果 假设,我们有吗

对于一个高于第0个元素水平,如 ,对所有 ,它由 相邻低层元素: 相应的形状矩阵 推导,得到的矩阵呢 通过链接列列。因为构造一个椭圆的参数化表示 - - - - - -维矩阵,上述建议连接方法将准确地生成矩阵只有4行一个更高的水平。生成矩阵的每一行被称为域元素的参数化表示。元素的不同的领域都可以单独推断。

相关的重量年代th的th知识的来源kth水平;的重量th训练例子 表示为 推理的力量吗 在合成推理。因此,一组类似的推理优势安排在秩序构成了当前的“查看序列”综合推理过程。这就是我们说的不同序列的显示培训诗歌文本的例子将会导致不同的结果。

对小说诗歌文本生成的综合推理过程,我们假设n全面的知识来源 kth水平参与这个推理过程。此外,每个综合知识的来源组件, 因此,我们可以使用一个 - - - - - -准尺寸矩阵来表示一个综合推理源和使用 - - - - - -准尺寸矩阵来表示所有活跃的来源在当前综合推理。如果我们应用合成推理在单个字符的层面, 第t属性源知识来标示 ,哪都有一个关联的强度 综合推理的过程中,他们有以下关系:

这种推理智能诗歌文本生成系统,强度可以通过一个图形用户界面调整。合成推理过程中产生的新知识来标示 ,和它的参数化表示为矩阵形式 应用综合推理过程的原则,所有源知识推理必须平等维度。也就是说,如果我们应用合成推理知识来源 ,相应的矩阵形式参数化表示 必须满足的关系 这种平等要求的软约束合成推理过程。如果违反,我们可以引入一个源知识平等算子 放松这种软约束。这非常类似于在类似的推理的映射问题。接下来,我们将介绍一些符号和定义 在一个严格的数学方法。

我们首先表示 ,在哪里

我们也可以获得一个离散曲线组成的所有覆盖椭圆的中心为每个结构元素在智能诗歌文本生成系统,可以表示为 其相应的参数化表示 因此,色散曲线获取方法可以描述如下:

然后,概述的键列矩阵可以介绍和定义。如果一个曲线 要点及其坐标 分别的键列 可以确定为 针对给定的平面曲线的关键点提取 ,摘要介绍了我们使用算法。此外,更精致的关键点提取算法介绍了,但他们可能会导致更严重的计算开销。

我们假设现在我们已经确定了 键列,这是 - - - - - -th矩阵列,通过参数化表示 一个矩阵形式的综合推理的来源 ,在哪里 因此,我们可以定义综合推理的能力平等运营商来源 如下:

其中,

[]是一个整数修剪操作符。具体来说,如果每一列的矩阵 被认为是一个关键列,我们可以使用一个简单的映射定义操作符

其中, ,和[]是一个整数调整功能。基于的定义 ,我们可以进一步定义一个综合推理知识来源叠加运算符

通过操作符 ,我们可以获得叠加综合推理的矩阵表示来源:

这个操作符,我们可以进一步计算特征矩阵的综合推理知识来源:

在上面的方程中,b, ,也不是的矩阵表示标准知识的来源kth水平。

根据用户输入的强度 对于不同的综合推理的来源,我们可以计算综合推理的观点矩阵:

其中, 是一个 维的单位矩阵。

现在,我们可以生成一个综合推理功能的结果 通过综合推理过程描述以下形式:

在上面的方程中, 是一个全面的推理模拟运算符。如果合成推理过程模型人类创造性思维是一个线性的过程, ,在哪里 是一个普通的矩阵乘法运算符。如果综合推理过程模型人类创造性思维作为z值多边形,然后 将定义如下:

我们也可以模型创造性思维作为一种几何平均过程,所示的方程(25):

一般来说,我们可以使用过载综合推理的综合推理模型模拟运算符 实现模拟不同类型的创造性思维的目的。

最后,通过添加的形状 ,这是标准的结构元素相关的推理结果吗 综合推理的过程中,我们获得的参数化表示 ,在哪里 的矩阵形式的参数化表示的形状吗

运算符的定义 可以重载的实现在智能系统不同的新颖的创造性思维活动。一些简单的合成推理模拟运营商拓扑构造函数如下:(1)算术平均是 (2)几何的意思是 (3)谐波的意思是

本文提出的集成推理过程本质上是价值的过程或一个推断的过程。换句话说, 或外推插值重量是重的吗 ,和约束条件 需要满足。

4所示。分析诗歌的风格基于文本分类算法

本文研究的基于机器学习的诗歌风格的判断,也就是说,诗歌文本的模式识别的流程图,如图1

系统的开发和设计如图所示2根据研究和处理序列。

从诗歌的风格类似于文本分类的一般过程。首先,该算法需要进行预处理语料库中的诗歌文件,然后将它们映射到向量空间,可以直接由计算机进行处理。算法选择这首诗文档样式的提前训练语料库和语料库进行测试。随后,该算法使用机器学习的方法来生成模型数据样式分类。最后,该算法构建机器判断工具诗歌风格的基础上,模型数据测试语料库进行测试。这个工具可以判断其他诗歌的风格语料库中的文档。风格评估的流程图如图3

诗歌是由文本内容,属于非结构化数据。使用定量分析方法很难对它们进行分析。有必要引入数据指标,可以测量执行数据分析和处理。常用的方法是段文本内容,然后计数频率数据。高频词如“万里”、“江山”,“东风”,和《暮光之城》经常出现在诗歌,他们通常可以表达情感偏见和风格特点,诗人对诗歌意象的选择。为了进行分类和汇总的流派诗人和诗人,本文主要使用高频词统计分类的方法和聚合诗人的风格特征。词风格的聚类分析如图4

为了获得词向量和更高效的算法,Word2Vec可以有效训练数以百万计的单词列表和数以亿计的数据集。获得培训result-word向量可以衡量词语之间的语义相关性和相似性。Word2Vec包括两个网络模型:CBOW(连续Bag-of-Words)模型和Skip-Gram模型。网络结构如图5。Skip-Gram可以被视为CBOW的逆过程。CBOW模型的本质是一种前馈神经网络语言模型(前馈NNLM)。

RNN神经网络是一个专门为序列化的问题,和它的基本网络结构如图6

本文总结了上述两个序列学习方法的统计语言模型。共同语言的框架基于统计学习的响应模型图所示7

在本文的研究,布里尔的转换学习方法用于处理生成的语言与上下文相关的规则。学习算法的流程图如图8

文本可视化技术主要由三个模块组成:文本分析和处理,视觉设计表现,和交互式设计,如图9。首先,算法收集文本信息,预处理数据和表达的知识,并将它转换成相应的结构化数据格式。然后,该算法直观地呈现出的信息通过视觉图形和色彩的元素编码。视觉呈现,算法应该为用户提供有效和合理的视觉呈现和交互操作基于用户的认知特征。同时,该算法执行数据操作的可视化信息元素通过一个合理的互动方法便于用户快速、清楚地理解信息内容显示,从而实现一个完整的视觉设计实现过程。

构建后上面的模型,验证了模型的影响,并根据实际需要验证了系统功能。此外,本文结合了模拟试验来验证诗歌文本分类的效果和系统的验证本文的诗歌风格。诗歌文本分类如表所示1和图10

从上面的研究,可以看出,诗歌风格分析方法基于文本分类算法提出了具有良好的分类效果。诗歌风格分析的实验结果如表所示2和图11

从上面的研究,诗歌风格的影响分析方法基于文本分类算法提出了很好,符合实际需要的诗歌风格分析。

5。结论

在诗歌文本的分类开始之前,该算法需要代表非结构化文档数据到数据计算机可以理解的形式。这需要算法执行相应文档的预处理和特征表示第一和非结构化或半结构式数据形式转化为一种结构化数据,可以由计算机进行处理。这包括一系列的流程如分词、低频词的过滤和禁止的话说,特征表示、特征提取。所谓的分词是添加一个中文文档中的每个条目之间的分隔符转换的连续字符流形式中国文档转换为一个离散的字流形式。目前,主要分词方法有正向和反向最大匹配方法,词词遍历方法,最佳匹配的方法,和词频统计方法。此外,还有two-scan方法,邻接约束方法,等等。文本分类算法适用于分析诗歌的风格和构造一个智能分类系统。从研究结果可以看出,诗歌风格分析方法基于文本分类算法提出了非常有效且符合诗歌风格分析的实际需要。

数据可用性

标签数据集用于支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究是由河南工业贸易职业学院。