研究文章|开放获取
Ningfeng太阳,程业Du, ”新闻文本分类方法和模拟基于混合深度学习模型”,复杂性, 卷。2021年, 文章的ID8064579, 11 页面, 2021年。 https://doi.org/10.1155/2021/8064579
新闻文本分类方法和模拟基于混合深度学习模型
文摘
本文使用数据库作为数据源,利用文献计量学和视觉分析方法,统计分析有关文件发表在文本分类领域在过去的十年里,阐明发展背景和文本分类领域的研究现状,并预测在文本分类领域的研究重点和研究前沿。基于深入研究的背景、研究现状、相关理论,和在线新闻文本分类的发展,本文分析了年度出版趋势,学科分布、期刊分布、机构分布、作者分布、高被引文献分析和研究热点。前沿等方面阐明发展背景和文本分类领域的研究现状,为进一步发展提供一个理论参考的文本分类领域。然后,在文本分类系统的研究的基础上,深度学习,和新闻文本分类理论,基于深度学习网络新闻文本分类模型,并详细介绍了每个模块的功能,这将有助于未来的新闻文本分类应用和改进提供理论依据。前辈的基础上,本文分别研究并改进了基于卷积神经网络,神经网络模型循环神经网络,和注意力机制,将三个模型合并为一个模型,可以获得当地的相关特性和上下文特征和突出关键字的作用。最后,实验是用来验证模型的有效性提出了与传统文本分类和比较来证明的优越性网络新闻文本分类基于深度学习在本文提出。本文旨在研究的内在联系,新闻评论和投票的数量受新闻评论,并通过该模型,选票的数量为新闻评论可以预测。
1。介绍
与互联网技术和移动通信技术的迅速发展,网络新闻已成为一个重要的信息来源对人们的日常生活,学习,和工作1]。与其他传统媒体相比,网络新闻中丰富的内容和多样的形式,可以实时更新。用户可以获取和阅读在线新闻而不受时间和空间限制,并且可以随时获取。用户可以从网上获得他们根据他们的需求(2]。在线新闻可以给用户带来更好的立体和全方位信息接收体验(3]。作为一种信息资源组织和管理的核心技术,文本分类可以在很大程度上解决信息杂乱的问题,帮助用户信息检索的范围缩小,让用户更方便、高效过滤通过大规模信息资源来满足自己的需求。信息是一种强大的手段来处理大量的信息资源(4]。特别是在大数据时代的背景下,文本分类技术的重要性,大量的文本信息的有效组织和利用更为突出,具有非常重要的研究意义和广阔的应用前景5]。
然而,面对庞大而混乱的网络新闻信息,用户面临的问题不再是如何找到新闻资源,但是如何有效地、准确地获取信息,能够满足自己的需要从大量的新闻资源6]。因此,为了满足用户的多样化和个性化需求在线新闻在大数据时代的背景下,有效的信息组织和管理的在线新闻已成为迫切需要解决的问题(7]。新闻文本分类基于传统机器学习主要包括以下问题:一方面,传统新闻文本表示方法的使用代表新闻文本将忽略词序和语义信息包含在新闻文本;另一方面,它将忽略词序和新闻文本中包含的语义信息。新闻文本的特征提取过程中需要人工参与,这是主观的,消耗更多的时间和精力;同时,使用向量空间模型表示文本消息将导致高的纬度和数据稀疏问题,虽然可以用于降维特征选择方法,但这将进一步加剧的问题,新闻文本的功能丧失,使整个新闻文本分类过程更加复杂。这些问题将会直接影响到新闻文本分类的效果。因此,有必要寻求更巧妙的文本特征表示和文本特征提取模型。
本文主要从两个方面进行研究:文本特征表示和文本特征选择在网络新闻文本分类。传统的文本分类方法有很多难以解决的问题。针对高维稀疏的传统的文本表示方法在自然语言中,嵌入层将文本数据转换为密度低维向量,避免造成的维度灾难高维输入。同时,通过使用词向量,分词错误影响文本分类任务的准确性得以避免,并改善分类器的性能。特征提取的过程需要人工参与,这将影响最终的文本特征提取的准确性;使用向量空间模型的文本表示将忽略的词序和语义的文本。信息影响文本分类的性能;面对高的纬度和数据稀疏问题,尽管特征选择方法可以用来降低维度,这将进一步加剧文本功能丧失的问题,使整个文本分类过程更加困难。为了解决上述问题,本文透过传统的在线新闻文本分类过程基于在线新闻文本分类的研究和使用深度学习方法作为理论依据来重建过程的在线新闻文本分类使用深度学习相关理论和模型来实现传统文本分类的目的是解决问题,提高文本分类的效果。
2。相关工作
一些相关研究文本分类可以追溯到20世纪。Abdi et al。8]提出的概念词频率和词频统计的概念应用于文本分类,首次对文本分类奠定了基础和创造一个先例文本分类研究。文本分类的方法使用关键字分类技术提出的吴et al。9)是具有里程碑意义,这极大地倡导和促进了文本分类的研究工作。随后,越来越多的研究人员开展了一系列研究,取得了许多成果,和文本分类技术已经收到了更多的研究和应用。许多著名的情报的科学家,如示范等。10),进行了分类领域的研究,取得了显著的研究成果。当时,文本分类主要是基于词匹配,确定文档的分类根据常用单词的频率在文本和类别名称。这种分类方法简单直观,分类规则非常机械,分类效果并不好。在未来,文本分类已逐渐从词频统计的概念转换为基于知识工程的方法。这种方法需要依靠专家编制分类规则。与单词匹配方法相比,它有一个更高的理解逻辑规则和分类效果也有所改善。因为文件可能不同的长度(即词的数量是不同的),为了能够养活fixed-dimensional神经网络,我们需要设置一个最大数量的单词。为文档的字数小于这个阈值,我们需要使用“生词”去填充。例如,词汇表中的词与索引0可以设置为“未知的词,”和0用于填写部分小于阈值。然而,这种分类规则的制定需要依赖领域专家手工编译为特定领域,这将消耗大量的时间和精力,不能处理文本信息和大量的数据。 And these rules are usually oriented to specific fields and between fields. The versatility is poor, and the range that can be covered is very limited. Therefore, methods based on knowledge engineering have not been widely used.
与文本信息资源的快速增长在互联网上,文本分类方法得到了前所未有的关注。然而,基于知识工程的文本分类技术已经完全不能满足需求,已逐渐取代了新兴乐此不疲机器学习的文本分类方法,并迅速成为新的主流领域的文本分类方法,它仍然是许多学者研究的焦点。基于统计机器学习的文本分类方法学习已知类别的样本数据。Girgis et al。11)使用学到的类别特征构造一个分类器,然后用分类器进行分类文本信息分类,最后获得的文本信息。与基于知识工程的方法相比,在此方法中,分类器的建设不需要人工参与,这大大减少了人力和物力。Pasupa和大城府12]融合深度学习算法以不同的方式,并与其他几种融合组合。文本分类的效率和准确性,Buabin [13)提出,他们有一个非常重要的进步。正是因为更可靠的理论依据和更好的分类结果,基于机器学习的文本分类方法受到学者们的广泛关注(14],它仍然是重点和主流研究的应用与研究,具有广泛的应用,如文本挖掘、模式识别、信息检索、数据挖掘、学习系统,和其他领域15- - - - - -18]。机器学习方法中,常用的是类中心向量法,K最近的邻居方法,支持向量机方法(19]。对文本分类的研究相对较晚。最早的学者总结和分类技术和研究现状,介绍了学者在图书馆和信息领域的汉语文本分类研究[20.,21]。作为一种信息资源组织和管理的核心技术,文本分类已收到从许多研究人员的重视22- - - - - -24]。从那时起,研究人员结合中国文本的特定知识和吸收英语文本分类的结果。重建和优化使其适合中文文本分类。研究人员经过不断探索和发展的中文文本分类研究体系已经形成25]。
文本分类技术的发展,不仅引起了许多研究者的注意,大学,研究机构,和各级企业在中国也非常关注文本分类技术的研究,不仅相关研究人员和学者研究文本分类技术。许多基金的大力支持,越来越多的论文相关的文本分类,促进文本分类研究的快速发展。中国科学院、北京大学、哈尔滨工业大学、清华大学、上海交通大学和其他大学和研究机构开展了很多研究领域的文本分类。经过不断的探索和研究人员,我的国家取得了丰硕的研究成果在中文文本分类领域。典型代表系统包括Zhiduoxing中文文本分类器的计算技术研究所、复旦大学文本分类、文本分类的北京大学。他们中的一些已经成功地推广和应用(26- - - - - -28]。
3所示。建设新闻文本分类模型的基于混合深度学习
3.1。新闻文本特征选择
特征选择是选择最具代表性的一些特性的文本内容从原始特征空间用于文本分类而不影响原始特征空间的性质。特征选择的基本原理是将原文单词序列的评价函数。通过选择一些相对高分特征作为最后的文本功能,文本特征空间的维数降低,从而提高中国语言领域的在线新闻。
针对贫困问题的网络新闻文本分类等缺陷引起的向量纬度高,稀疏数据,以及缺乏语义在传统机器学习新闻文本分类方法,向量法一词用于表示新闻文本词序列,可以有效的解决这些问题。在优化过程中,动量的引入可以加快收敛,减少无意义的振荡。当梯度点实际的移动方向,增加动量项;当梯度与实际相反方向移动,它会减少。这将确保优化的方向总是向最小值点,减少不必要的更新,提高了优化的效果,同时减少计算开销。这个词向量的主要思想是将每个单词映射到低纬度空间。在新的低纬度特征空间映射后,这个词向量之间的位置关系对应不同的功能词代表它们之间的语义。水平上的协会可以解决向量稀疏和语义缺失的问题。假设任何一件在线新闻文本在实验数据集k话说,
本文中使用的卷积神经网络利用金的论文的模型设计,和具体结构如图1。每个输入元素年代,使用年代(x)来表示后获得的价值x是处理的函数。最左边的卷积神经网络的输入层结构k×n二维词向量矩阵,k是新闻文本的长度由单词组成的k1,k2,k3……k−我,n代表每个词向量的长度尺寸。卷积神经网络结构的特征提取部分主要包括操作如卷积和池。最后,一个相应的模型是建在新闻文本分类的任务。
在回旋的层,新闻文本输入到卷积神经网络的形式一个二维矩阵,u代表编码的结果,然后u是解码模块、解码和卷积操作用于提取新闻文本的特征。卷积神经网络的卷积操作如下:
其中,c−我代表的卷积运算的结果我来我+米−1词向量;f选择ReLu函数作为激活函数,它可以加快训练卷积神经网络的收敛速度;它代表了卷积运算,即特征提取;X−我:我+米−1代表这个词向量的输入我来我+米−1卷积神经网络;和W和B代表卷积神经网络的权重矩阵和偏见,分别。
在新闻文本功能是通过卷积操作,如果这些特征直接用于分类,因为还有很多特性数据,计算量将会非常大,培训过程将是缓慢的。在保留有用的特性的前提下,简化卷积神经网络参数的数量和降低计算复杂性,有必要使用池操作压缩和合并新闻文本语义相似的特性,可以在二次提取中发挥作用的特性。自适应时刻估计可以自动选择合适的学习速率。这个算法存储使用的指数衰减梯度的优化,在优化过程中,动量方法相似。池运行卷积神经网络所示公式(4)。完全连接层,池运行的结果进行了总结,见以下方程:
为了防止过度拟合的卷积神经网络在训练过程中,辍学的策略是采用;,一些隐藏节点丢弃有一定概率模型训练过程中,这是不可能的训练复杂的通过所有隐藏节点的联合行动。输出层将产生CLASS_NUM概率值,分别代表该文档属于当前类的概率。每个培训的网络模型是不同的,这提高了网络模型的泛化能力,从而有效地防止过度拟合现象。在最后的输出层,所有的新闻文本特性映射到类别信息根据公式(6)。
3.2。混合深度学习算法
首先,大量的新闻文本过滤特殊字符的正则表达式,使信息的纯文本格式;作为最基本的语义单位,词汇需要用来表示文本在新闻文本的特征分类。
对于每个新闻文本中的词汇,使用Word2Vec,一个词向量开源工具基于深度学习谷歌发起培训并生成新闻文本向量和新闻文本特性转换成密集的词向量的具体尺寸适合卷积神经网络处理。它表明,训练语料库来自1.02 GB全网发布的新闻文本数据包(SogouCA)搜狗实验室。可变长度的文本。的方法表达文本数字或向量计算机可以运行这个词通常被称为嵌入方法。字嵌入将可变长度的文本转换成固定长度的空间,这是文本分类的第一步。在这篇文章中,新闻文本的词向量维度设置为50,100年,150年,200年,250年和300年,分别选择最佳实验参数。新闻文本词向量的每个维度由Word2Vec训练和生成。
目前,常用的特征选择方法包括文档频率、卡方统计数据(χ统计),和信息增益。而从图特征选择2特征提取,使用更先进的方法,将文本的原始特征空间映射到生成一个新的特征空间和降低维度,每个维度之间更加独立,从而实现优化的文本特性和降维。梯度下降算法是一种常用的优化算法和优化算法的目的是使用一种改进训练方法,以最大化(或减少)的损失函数J(X)。里面有一些参数模型;这些参数用于计算的真实值和预测值的目标价值Y在测试集的程度不同。然而,由于特征提取文本语义的分析,密切相关,这一领域的相关技术还不成熟,降维的效果并不理想。与特征提取方法相比,特征选择的文本特性集选择是原始特征空间的一个子集。语义背景的优势,容易理解,简单的模型,并且很容易实现。因此,它已经吸引了许多学者的关注,已成为功能还原法主要使用方法维度。
3.3。结构优化的文本分类模型
进行比较的实验之前,我们首先训练和调整相关参数的卷积神经网络训练集和验证集上的实验,让最后一个测试消息文本分类的效果在测试集。参数主要包括新闻文本输入的词向量维卷积神经网络,大小的卷积核的卷积神经网络,的辍学参数,和总迭代轮培训卷积神经网络结构。DESEM-AE给了最糟糕的结果。因为堆叠的特征提取去噪autoencoders DESEM-AE取得了显著改善精度和召回。TextCNN模型第十一类的准确性为100%,但注意力模型仅为87%。模型的关注已经召回率91%,第二类TextRCNN只有77%。这表明autoencoders从原始的使用。的加权混合向量事件新闻文章的关键元素是用来提取隐藏的事件特征的重要性。文本分类是一个相对基本和重要的部分。由于中文分词的灵活性和开源数据库,本文使用这段新闻文本和原创新闻文本转换成这个词序列的新闻文本,以便word2Vec培训和词向量可以用来表示这个消息文本。最后,根据停止单词列表,词汇和非中文字符,没有实际意义,但频繁的出现在新闻文本过滤获取新闻文本词序列后停止词删除,这样剩下的单词可以更好地表达新闻文本的特点。
这表明尽管嵌入向量可以捕获这个词的句法和语义规则在某种程度上,一个高层次的特征提取方法是必要的,如果更好的事件线提取性能。由于频繁的迭代计算和参数更新,随机梯度下降法最终会陷入某些局部最小值和波动在这个最小值。同时,实验证明,当我们慢慢地减少学习速率问随机梯度下降法在训练过程中,收敛过程的参数是一样的标准梯度下降法。相比之下,AE +k则,我们可以看到,DESEM召回率有明显改善,这表明,相比k方法,则事件线提取的神经网络方法可以更有效的提取真实的事件。卷积核的大小的影响在卷积神经网络新闻文本分类的准确性是如图3。从图可以看出,当卷积核的大小是3,新闻文本分类的准确性达到了最大值。卷积核的尺寸越小,所需参数少,计算卷积神经网络的训练。因此,卷积核的大小的选择最合适的前提下确保精度高。比较分类效果与传统新闻文本分类模型,使用向量空间模型对新闻文本表示,TF-IDF文本特征选择,支持向量机分类器分类验证新闻文本分类基于深度学习在本文提出的模型的有效性。
4所示。应用程序和分析新闻文本分类模型的基于混合深度学习
4.1。新闻文本预处理
在这篇文章中,网络新闻的文本分类方法的分类效果基于深度学习实验验证。以新浪新闻为例,实验c在谷歌的开源TensorFlow深度学习系统。本文中使用的实验数据集来自公共数据集的一个子集THUCNews新浪新闻的清华大学自然语言处理实验室。实验数据集包含10类:体育、金融、房地产、家居、教育、科技、时尚、时事、游戏和娱乐,6500年的数据在每个类别;实验数据集的标签类别划分如下:500010训练集,500年10验证集,100010测试集,这三个数据集之一。通过分析年度趋势在文本分类领域,我们可以明确的文本分类领域的发展和研究现状从时间的概念,掌握文本分类领域的研究现状,并预测文本分类领域的发展趋势在一定程度上。本文在文本分类领域有关文件的数量随着时间变化的统计数据,如图4。
共40个凸字是通过计算获得。可以清楚地看到,突出价值的三大关键词卷积神经网络,深入学习,单词向量。属性约简的显著值文档频率,特征降维,粗糙集,遗传算法,主题模型,自然语言处理,情绪分析,word2vec,等,和词向量是关键词和高声望值在最近三年。因此,当前的研究领域在文本分类领域主要包括文本分类模型,文本分类应用中,词向量文本表示方法和基于深度学习的文本特征的提取。
4.2。深度学习模块仿真
从图5,我们可以直观地看到文本分类属于多学科交叉的领域。在所有的统计文件,相关文档的数量在文本分类领域是最大的计算机科学领域的。总共1827份文件已经发布,文件的总数占87.88%,表明文本分类的发展离不开计算机技术的支持。我们选择的不同尺度卷积核的标题和文本。标题文本的长度较短,所以卷积内核规模使用2到5,和正文的长度较长,主要是句子的信息,所以选择3到9。从标题和文本中提取的信息结合使用一个线性层和激活函数和发送到最终的输出层。计算机技术是文本分类研究的一个重要支柱。许多学者在计算机领域文本分类的发展作出了重要贡献。接下来为了控制工程,发表了244篇文章在文本分类领域,占总数的11.74%的文档,148篇文章在图书馆和信息档案占7.12%,教育占1.11%,23日的文章等等。其中,相关论文的学科领域的文本分类库,信息,和档案占文献总量的7.12%,仅次于计算机和控制工程的学科,说明图书馆,信息和档案科学是在文本分类领域的一个重要研究领域。 The subject’s research on the technical links involved in text classification is relatively weak. It mainly focuses on related research in text classification theory, such as the development of the text classification field, the basic theories and methods of text classification, and the application in digital libraries. If it can be deeply integrated with other disciplines and developed comprehensively, there will be greater room for improvement and development prospects.
辍学的影响参数变化对新闻文本分类的准确性是图所示6。使用辍学的策略,以避免过度拟合。同时,对模型的内部结构,我们引入了批处理规范化,加快收敛的模型参数,提高模型的稳定性。设置辍学参数从0.1到0.9。从图可以看出6辍学的参数的值增加,新闻文本分类的精度逐渐提高,表明在深入学习。辍学的引入策略过程中非常有效。当辍学参数的值是0.4 - -0.6,精度为0.88,0.895,0.91,0.925,0.94,0.955,0.97,50岁,100年,150年,200年、250年和300年。新闻文本词向量的维数为0.89,0.9,0.91,0.92,0.93,0.94,0.95,0.96,1,2,3,4,5,6,7。核心大小率相对较高,新闻文本分类的精度达到最高时辍学参数值是0.5。这时,辍学,防止过度拟合的效果是最好的。
这也表明,文本分类技术在各领域的应用价值并没有反映。当前文本分类领域的研究主要是基于理论研究。因此,更多的科研院所和企事业单位需要更多地投资于文本分类领域。研究能源促进转化率和应用程序的文本分类领域的研究结果。
4.3。例子的结果和分析
新闻文本的词向量维度的影响在新闻文本分类的准确性是如图7。本文设置文字新闻文本向量维数到50,100年,150年,200年,250年和300年,分别。从图可以看出7与词向量的维数的增加开始,新闻文本的分类的准确性也在提高。当词向量的维数达到150,新闻文本分类的准确性达到当地最大,表明每个词的语义分布在当前新闻文本在低纬度空间可以更准确地代表。随着这个词向量的维数不断增加,新闻文本分类的准确性下降。这可能是因为这个词向量的维数的增加会增加网络结构的参数,增加网络结构的复杂性,增加的计算量。TextCNN, 300 -维使用嵌入维数,每个卷积层使用256卷积核,在线性层隐藏节点的数量是256,学习速率为0.0005,6轮的培训。300 -维嵌入维度用于TextRCNN,内置在LSTM隐藏节点的数量是256,在线性层隐藏节点的数量是256,学习速率为0.0007,培训是5轮。在很大程度上,网络的训练时间延长,导致精度下降。即使这个词向量维数达到300,准确率大大改善,培训时间是将近三倍的时间比150年的词向量,所以150是选为最优词向量维度的新闻文本。在模型训练后,改善算法的准确性。
从图可以看出8发表的有关文件,在文本分类领域在过去的十年里已经显示出法律首次下降,然后上升。它主要分为三个阶段:第一阶段是一个快速增长的时期。在这个阶段,在文本分类领域发表的文章数量逐年增加,2019年达到268年的最高价值。调整后的模型参数通过训练集和验证集的实验数据来获得最优模型,使用测试集,从未参加培训测试的分类性能最优模型。
平均消息文本分类方法的精度和召回率约为97%,基于深度学习,平均精度和传统新闻文本分类方法的平均召回率约为84%。与传统新闻文本分类方法相比,分类方法有一个很大的改善精度和召回。的F1值体育、金融、房地产、教育、技术、游戏和娱乐大大增加,而F1值家具、时尚和时事增加相对较少。基于深度学习新闻的文本分类方法与传统新闻文本。分类方法提高了平均F1值13%。
从图可以看出9在前16个核心期刊领域的文本分类、11期刊属于计算机领域占据主导地位。通过调整模型参数后的训练集和验证集的实验数据,训练集和验证集的准确性。300 -维嵌入维度用于注意力模型。内置的LSTM隐藏节点的数量是256,注意向量的维数是256,在线性层隐藏节点的数量是256,学习速率为0.0003,培训是8轮。后的训练集的准确性是稳定的,它基本上是96%以上,并验证的准确性是稳定在95%左右,如图10。总样本集包含5477个新闻文本的突发事件和2815一般新闻文本。6699新闻文本是随机选择的训练集和1593年作为测试集,训练集是输入到CNN模型。CNN模型的主要参数包括文本长度、词向量维度,卷积核的数量,和完全连接层的神经元数量。
文本分类的效果是很好的训练集和验证集。它可以从数量上的数据的论文在核心期刊上,计算机科学期刊是主流期刊发表在文本分类领域。值得注意的是,5前16的期刊出版卷属于图书馆和信息领域,如数据分析和知识发现、信息科学、图书馆和信息工作,信息杂志,和信息理论和实践。出版物的数量是63。章38岁,37岁,31日和27日表明,图书馆和信息领域的文本分类研究的第二个来源,它扮演了一个重要角色在促进理论发展和实际应用的文本分类领域。
因此,如果相关学者研究需要进行文本分类,他们可以专注于选择文本分类的相关文件发表在这些大容量期刊,这将帮助研究人员快速、准确地获得该领域的研究现状和最新研究动态。然后改变单一模型参数和仿真3次重复精度的平均值,召回和综合价值的模型。参数的最大平均值是最好的参数。可以看出,准确性,记得,CNN和综合价值模型达到99.55%,可有效识别公共事件新闻和紧急新闻,为下一步奠定基础的文本分类的紧急消息。
5。结论
模型主要由四个部分组成,即新闻文本预处理、基于矢量的新闻文本表示,新闻文本特征提取和分类,文本分类结果评估。在实验过程中,致密Word2Vec词新闻文本的向量表示最初是通过学习获得的,以解决问题的纬度高,稀疏数据,缺乏传统文本表示的语义。然后,新闻文本词向量作为输入,和卷积神经网络新闻文本功能是自动学习和提取,从而避免了费时,费力,误差累积的缺点传统新闻文本分类方法手动参与特征提取。实验结果表明,该方法可以有效地提高网络新闻文本分类的效率,使用词向量。解决问题的纬度高,数据稀疏,在传统新闻文本表示和缺乏语义,深度学习的卷积神经网络模型自动提取新闻文本的特性和分类,可以避免手工的问题在传统的特征提取方法。它与传统新闻文本分类方法分析。选择召回率、精确率和F1值作为评价指标。最后,我们提出了一个混合模型,将上述三个模型的功能结构模块到相同的模型,并使用一个共享的嵌入层和线性层,集三种模式的优点,同时减少计算开销。实验结果表明,基于深度学习的网络新闻文本分类方法具有更好的综合性能比传统的新闻文本分类方法和促进更有效的实现信息组织和管理在新闻领域。网络新闻的文本分类模型基于深度学习proposd本文是可行的,可以为用户提供更好的新闻信息服务,并提供了一定参考价值网络新闻文本分类技术的发展。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突。
引用
- n . Ruchansky美国Seo,刘y“CSI:假新闻的混合深度模型检测,”信息和知识管理31卷,第806 - 797页,2019年。视图:谷歌学术搜索
- j·a·纳西尔,o . s .汗,Varlamis,“假新闻检测方法:基于混合CNN-RNN深度学习的方法,”国际期刊信息管理数据的见解,1卷,不。1,p。100007年,2021。视图:出版商的网站|谷歌学术搜索
- x y . Li王,p .徐,“基于深度学习的中文文本分类模型”,未来的互联网,10卷,不。11,113年,页2018。视图:出版商的网站|谷歌学术搜索
- x张她和d”,文本分类基于混合CNN-LSTM混合模型,”关于计算机智能的研讨会设计(ISCID),2卷,第189 - 185页,2018年。视图:谷歌学术搜索
- 郑j . l .郑”混合双向引起递归卷积神经网络模型用于文本分类,“IEEE访问7卷,第106685 - 106673页,2019年。视图:出版商的网站|谷歌学术搜索
- m . n . Asim m·g·汗,麻省理工学院Malik et al .,“文本文档分类,一个健壮的混合方法”程序文档的分析和识别(ICDAR),页1390 - 1396年,悉尼新南威尔士,澳大利亚,2019年9月。视图:谷歌学术搜索
- n .邦萨尔,a·沙玛,r·k·辛格,“一个不断发展的混合深度学习法律文件分类框架,“Ingenierie des系统d信息,24卷,不。4、221 - 231年,2019页。视图:出版商的网站|谷歌学术搜索
- A . Abdi哈桑,s m . Shamsuddin n .伊德里斯和j .混杀丹”混合深度学习架构opinion-oriented多文档摘要基于特征融合,“以知识为基础的系统,第213卷,第106658页,2021年。视图:出版商的网站|谷歌学术搜索
- y y l . Wu Rao h . Yu Wang和a·纳齐尔“虚假信息通过混合深度模型,检测在社交媒体”在计算机科学的课堂讲稿。社会信息4卷,第333 - 323页,施普林格,柏林,德国,2018年。视图:出版商的网站|谷歌学术搜索
- h . s .铁城e . Batbaatar k . o . Kim e . j . Cha, K.-A。金,“肾癌分类数据使用厂商混合深度学习方法,“对称,12卷,不。1,p。154年,2020。视图:出版商的网站|谷歌学术搜索
- 美国Girgis、大肠Amer和m . Gadallah“深学习算法检测假新闻在线文本,“计算机工程和系统(icc),3卷,第97 - 93页,2018年。视图:谷歌学术搜索
- k . Pasupa和t . s . n .大城府,”泰国情绪分析混合深度学习模型,”认知计算,卷1,1-27,2021页。视图:谷歌学术搜索
- 大肠Buabin”,提高了混合复发性神经分类器在路透社新闻文本语料库文本文档分类,“国际机器学习和计算机杂志》上,卷2,不。5,588年,页2019。视图:谷歌学术搜索
- a . Elnagar r . Al-Debsi, o . Einea“使用深度学习阿拉伯语的文本分类模型,”信息处理与管理卷,57号1,p。102121年,2020。视图:出版商的网站|谷歌学术搜索
- j . y . Liu, y道et al .,“基于混合神经网络文本分类,计算科学与工程(CSE)4卷,24-29,2020页。视图:谷歌学术搜索
- h·l .郭d, l . Wang Wang和崔,“凹口:混合CNN-RNN引起模型用于文本分类,“概念建模5卷,第585 - 571页,2018年。视图:出版商的网站|谷歌学术搜索
- l . j . Vaickus a . a . Suriawinata j·w·魏和刘x,”巴黎自动化系统尿液cytopathology-A混合深度学习和应承担的形态学方法,”癌症细胞病理学,卷127,不。2、98 - 115年,2019页。视图:出版商的网站|谷歌学术搜索
- y, j .倪,l·温”混合深度学习方法通过整合LSTM-ANN网络与GARCH模型对铜价格波动预测,“自然史答:统计力学及其应用,第557卷,第124907页,2020年。视图:出版商的网站|谷歌学术搜索
- z h . Kilimci和s . Akyokus“深度学习和词embedding-based异构为文本分类分级机集合体,”复杂性,卷2,14 - 18,2018页。视图:谷歌学术搜索
- f .阴x天雪,c . Zhang et al .,“Multifidelity基因转移:一个有效的框架,用于生产优化,“SPE杂志,22页,2021页。视图:出版商的网站|谷歌学术搜索
- j .张和瞿g“物理unclonable基于函数的关键共享通过机器学习物联网安全,”IEEE工业电子产品,卷67,不。8,7025 - 7033年,2019页。视图:谷歌学术搜索
- j·杨,j .温家宝、江b和h . Wang”Blockchain-based共享和防篡改的框架大数据网络,”IEEE网络,34卷,不。4、62 - 67年,2020页。视图:出版商的网站|谷歌学术搜索
- n . s .杨j . Wang,邓,y彭日成,和m . r . Azghadi”CerebelluMorphic:大规模的神经形态模型和运动学习监管架构,”IEEE神经网络和学习系统,2021年1 - 15页。视图:出版商的网站|谷歌学术搜索
- w·魏问:Ke, j·诺瓦克,m . Korytkowski r·谢勒和m . Woźniak“准确、快捷的URL钓鱼检测器:卷积神经网络的方法,”计算机网络,第178卷,第107275页,2020年。视图:出版商的网站|谷歌学术搜索
- 赵w . Wang x, z锣,z . Chen n . Zhang和w·魏”一种引起深度学习框架旅行目的地预测分享的自行车,”诉讼的IEEE智能交通系统,页1 - 10、澳门、中国,2020年9月。视图:出版商的网站|谷歌学术搜索
- m·陈,美国陆、刘问:“弱解的唯一性Keller-Segel-Navier-Stokes系统”,应用数学的信,第121卷,第107417页,2021年。视图:出版商的网站|谷歌学术搜索
- 答:俄南和美国Korukoğlu特征选择模型基于遗传排名聚合文本情感分类,“信息科学杂志》,43卷,不。1,25-38,2017页。视图:出版商的网站|谷歌学术搜索
- y Narayan和s·库马尔面肌信号的模式识别使用基于DWT的特点和支持向量机分类器,”国际先进的科学和技术杂志》上卷,29号十年代,2257 - 2266年,2020页。视图:谷歌学术搜索
版权
版权©2021 Ningfeng太阳和程业Du。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。