自适应学习情感识别方法的简短文本在线医学知识分享社区

文摘

医学知识分享社区为用户提供了一个开放的平台访问医疗资源和分享医学知识,治疗经验,和情绪。与一般商品的接受者,接受者在医学知识分享社区更加注意强度或综合评价情感词汇的评论,如治疗效果,价格,服务态度,和其他方面。因此,综合评价不是医疗服务评价的关键因素,但情感极性的语义是影响医疗信息的接受者的关键。在本文中,我们提出一种自适应学习情感识别方法(ALEIM)基于互信息特征重量,它捕获特性的相关性和冗余。为了评估该方法的有效性,我们用四个基本语料库图书馆爬Haodf的在线平台,采用台湾大学NTUSD简体中文情感字典对情感分类。ALEIM提出的实验结果表明,我们的方法具有更好的性能,识别低频词的冗余特性在线评论的医学知识分享社区。

1。介绍

越来越多的评论,意见,建议,评级,并反馈生产在社交网络上与互联网的快速发展(1]。而那些在社交网络上是有用的,这部分的内容需要采用文本挖掘和情感分析技术。直到现在,情感分析和评价过程中还面临着许多挑战[2),如表所示1。这些挑战成为障碍,准确分析情感极性。


作者	一年	面向领域的	挑战型	评估结构

贾et al。3]	2009年	健康/医疗领域	理论	半结构化
Hogenboom et al。4]	2011年	电影评论	理论	非结构化
亚历山德拉和拉尔夫5]	2009年	网络新闻评论	理论	半结构式/非结构化
穆克吉和Bhattacharyya [6]	2012年	产品	技术	半结构式
奇和Atul7]	2014年	微博	技术	非结构化
Doaa和奥萨马8]	2015年	科学论文	理论+技术	结构化

近年来,越来越多的研究已经完成情感分析。其中,非结构化的自然语言文本得到学者的广泛关注9]。情感分析推断用户的看法、立场和态度通过口头或书面的内容(10]。解决情感分析任务通常使用基于词典和学习方法(11,12]。基于字典的方法分析了每个单词的相关性特定情感通过使用预定义的字典(13]。上优于方法通常使用标记样本训练特定目的模型(监督下14]。

情感分析正越来越多地用于分析人类情感,但当前情感分析方法的致命缺点是缺乏级别粒度方面改进,也很少应用于在线知识社区,尤其是医学知识社区,因此有必要找到一个情感分类方法对医学知识社区。根据这些考虑,我们提出了一种自适应学习情感识别方法(ALEIM)基于互信息特征重量,它捕获特性的相关性和冗余。其有效性验证数据集上爬Haodf的在线平台,特征值对应的特征的名词被分配根据情感词典编纂的NTUSD台湾大学。最后,实验结果表明,我们建议的ALEIM方法达到更好的性能。

本文的其余部分组织如下。部分2评论我们研究的相关工作。部分3礼物我们提出ALEIM方法,其中包含问题描述和假设,基于互信息的特征选择和情感极性选择基于互信息的重量。部分4介绍了数据集,评价措施,实验性能和讨论。最后,部分5给出了结论。

2.1。特征提取

自然语言处理和文本情感分析技术被用来提取特征情感评论(9]。然而,开发的基于互信息的特征选择方法是获得真正的特性,这是一个信息熵估计方法独立于分类器和数据集和优于其他特征提取方法(15,16]。冗余算法构造提出了互信息特征子集,用来改善情感分类精度(17]。最大相关性和最小冗余(mRMR)算法的基础上提出了互信息的原则,这是与SVM的分类(18,19)和推荐的三种比例分类方法;提出的精度优于传统方法,识别速度快于智能方法(20.]。

2.2。情感分析

情感分析已广泛应用于许多领域(21,22),如消费管理、精准营销、社交网络等非监督学习算法和最重要的监督学习算法被用来分类情感极性的评论(23]。此外,情感分析分为许多层面:文档级别(24),句子水平(25),字/词层面,或水平方面26]。

直到现在,情感分类方法大致可以分为三个领域:机器学习方法,情感词典的方法(27[],深度学习情感分类方法28]。一些常见的机器学习方法是决策树分类器(29日],贝叶斯[30.),和支持向量机(31日]。情感词典的方法是实现分类采用不同粒度的情感词极性。常见的情感词典包括以下:SentiWordNet (32],一般询问者[33],SenticNet [34词汇),意见,知网情感词典,主观的词典,DUTIR情感词汇本体库和NTUSD [35]。然而,很难构建一个完整的情感词典,可能所有情感词的极性。因此,有必要通过上下文获得情感词的极性。深度学习情感分类方法通常用于实现情感分类方面水平。在自然语言处理方面,深度学习远远优于机器学习(18,已经证明在文字识别(36)和语义挖掘(37]。最近,深度学习,尤其是卷积神经网络被广泛用于提高情感分析精度(38- - - - - -40]。

3所示。Semisupervised情感分类方法

3.1。问题描述和假设

我们基本的语料库表示 ,域表明源检查设置存在评论, , 是nth评论,被评论的总数。功能名词的评论表示 , 是评论功能,是名词的总数特性。其中,审查的整体特征(病人满意度,功效)也被称为识别范畴,这是记录为。特征值的范围 ;它形成一个信息功能和 : 。让 ;然后,是特征值向量的评论和 ,和是特征值的数量特征的名词吗。是的特征值评论(特征值与相对应的形容词名词)。新评论记录 ;评论功能矩阵可以被定义为。评论是multiisomerized中的数据,所以需要规范化特征值。

我们每个特性中包含的所有形容词数量和替代数量作为后续计算矩阵特征值的。

让是特征值的评论 ;然后,被转换为。

由于不确定性的形容词语言选择评论图书馆,概率是用来描述其分布特征。功能的概率是值 ;评论员的情感极性决定后,这个词是不确定的,用概率来消除影响评论者的决定。

情感极性的不确定性的评论集中在评论的功能冗余,互信息可以有效地测量变量之间的冗余特性集。因此可能找到一组输入功能,有一个很大的互信息值识别的类别和低冗余之间的其他特性。该功能Relation-Redundancy系数(R²C)用于歧视考虑特征值的范围和分布值。

在特征选择过程中,多个候选特征的联合行动的范畴 ,由于冗余。本文之间的冗余和选择功能和所有特征之间的冗余统称为的冗余特性,用吗。特征值的特性是k;然后,其信息熵可以表示为

如果 , ,和 ,根据联合分布率,条件熵可以表示为

定义1。空间互信息发表评论。
在 ,之间的互信息和在特性集可以表示为更大的是,特性的随机变量之间的关系吗和是;当接近零,两者是相互独立的。互信息之间的关系和信息熵可以表示为

3.2。基于互信息的特征选择

定义2。让互信息的比例之间的选择功能和识别分类信息熵的特性 ;然后, , 。
符合下列特征:(我)当特征值的范围是一样的,统一的价值越多,那么重要(2)特性值均匀分布时,值范围越大,越不重要(3)然后,互信息公式MIFS-U功能冗余的方法表示为的比率之间的互信息最大相关性和最小冗余表示特性的相关性和冗余的比率。当 , 是一个常数用来测量之间的冗余特性的影响程度分类精度的特性集,它可以根据实际情况设置。参数特性Relation-Redundancy系数(R²C)的冗余措施选择的特性集所表达的是一个非负数字 : 在 ,Relation-Redundancy系数具有以下四个作用:(我)当 ,候选人的相关特性和识别分类是零;是一个无关紧要的特点。(2)当 ,候选人的冗余功能和比和其他特性;然后,它是一个冗余特性。(3)当 ,候选人之间的相关特性和识别分类比候选人的冗余特征吗和带来了新的信息分类;然后,它被称为关联特性。这里我们设定一个阈值根据实际值相关的特性。当功能强相关特性 ;否则,他们是弱相关的特性。(iv)当 ,它只需要分析互信息之间的和识别分类 ;相应的的最大价值可以选择设置。根据上述效果,最佳的特性集包括最终获得的特性。考虑到互信息和冗余的特征,实证指数由专家给出。使用互信息方法获取全面的重量的特性在评论的空间 , 作为一个模型的重要参数,扮演着一个重要的角色在分类的准确性。

3.3。情感极性选择基于互信息的重量

基于语料库的基本的数据库中的数据,得到最优特征冗余和最少的子集中的每个功能特性的相对权重集和计算的无名语料库的情感价值显著特点在此基础上的重量。具体步骤如下:(我)从无名语料库中提取情感词,将它们转换为一个基本的语料库。(2)根据基本的语料库,删除冗余特性的最佳功能,包括权重过滤掉。(3)特征值对应的特征的名词被分配根据情感词典编纂的NTUSD台湾大学;积极的单词是分配1 -单词分配−1和情感价值根据重量计算(忽略了副词或语法结构的影响情感价值)和情感阈值基于基本的语料库是集。(iv)法官的极性和准确性测试根据权重和情感阈值基于语料库训练库。

4所示。数值实验

执行我们的实验分析之间的互信息方法和情感词典,TI-IDF和支持向量机。使用四个数据集爬Haodf在线平台的评估我们的提议ALEIM方法的性能,实验分为四个方面:(我)在实验中使用的数据集。(2)整个流程和评价措施的实验。(3)实验细节的描述使用四个数据集从Haodf爬的在线平台。(iv)实验的讨论。

4.1。数据集

实验数据集从Haodf爬的在线平台。这些医疗服务评价提取使用八达通,然后分词使用Java编程中,重组和每个句子在评论的metamatrix结构分为“名词+动词。“我们首先选择100医生和随机收集750年数据在评论区域和构造四个基本语料库训练库基于上述数据与不同的评论,如图所示1。

正面和负面评论的数量在四个基本语料库训练库不同,和积极评价比率高于负面的。由于随机抽取评论数据作为语料库训练库,分布的训练库中的积极和消极的评论是不确定的。这种随机提取的数据作为训练语料库数据,它不仅可以测试的依赖不同的分类算法根据不同类别数量也是学习能力的具体分类基于小样本。400年的数据准备的测试数据表2200,其中包括200名积极评价和负面评论为情感测试的准确性训练库分类在不同的算法。


数据的数量	积极的	负	特征的数量	用于

One hundred.	70年	30.	37	训练语料库
150年	One hundred.	50	39	训练语料库
200年	120年	80年	41	训练语料库
300年	180年	120年	41	训练语料库
400年	200年	200年	42	测试语料库

当进行特征提取,特征与100年从语料库中提取数据都包含在其他卷文集;从语料库中提取的特性与150年的数据都包含在200年的语料库,300年和400年数据;的主体之一,200年和300年数据提取相同的特性;数量特征与400年的数据从测试语料库中提取42岁和一个额外的功能与200年和300年从语料库中提取数据。

由于数据是随机爬的,彼此之间的语料库数据重复性较低,因此可以近似的概率减少迅速出现的新特性选择评论语料库数据增加。因此,评论的数量确定合适的训练语料库的数据,和提取的特征可以包含几乎所有的功能包括在医学评论(由小概率通常不是一些特殊的特征提取相关医疗服务本身)。这表明评论经常有限制的特性与传统的商品评论相比由于医疗服务的一致性和标准化。一般商品的评论并不固定,由于产品的功能属性;产品高度不同,不同的产品通常包含独特的特性,通常影响整个评论的极性。因此,商品评论特征提取有很高的要求,需要不断更新基于大量的数据提取功能实现情感极性的准确分类。由于医疗服务没有一般商品的可变性,评论的功能是有限的,所以选择一定数量的数据提取功能几乎可以涉及的所有特性的医疗服务评论。

4.2。实验设计和评估措施

我们采用台湾大学NTUSD简体中文情感词典语料库对情绪和情感的分类。本文实验的总体流程图如图2。

这个实验中使用的SVM和特征权重算法通过使用MATLAB实现。其中,互信息算法和IDF算法计算特征权重通过使用基本的语料库,然后结合的情感词典NTUSD来计算情感价值的语料库训练库和情感阈值根据语料库数据集(分别计算出正面和负面评论,然后用加权平均两种类型的情感意味着情感阈值)。情感极性测试语料库的基于特征的权重和阈值判断。我们选择以下指标作为评价指标:(我)真阳性:最初积极情绪,分为积极的情感。(2)真正的负面:最初的负面情绪,列为负面情绪。(3)假阳性:原来消极情绪,分为积极情绪。(iv)假阴性:最初积极情绪,分为消极的情绪。

准确反映出分类器来确定整个样本的能力:积极的决定可以积极和消极的决定-,可以表示为

精度反映真阳性样本的比例在积极的情况下由分类器,可以表示为

召回反映阳性病例的比例,正确判断总正面例子,可以表示为

4.3。实现细节的实验

图3表明,以色列国防军的分类算法的准确性和互信息考虑特性重量和情感词典分类算法明显高于使用高斯核函数的支持向量机算法的四个基本语料库库。随着样本数量的增加,情感词典基本上保持恒定的准确性。然而,随着样本数量的增加,互信息的准确性增加迅速,高于其他三种方法。从图可以看出3互信息方法的性能优于其他三种方法。支持向量机算法要求在培训数据库中不同类型的数量必须达到最佳学习完全相同。然而,在线医疗服务评论有很大比例的正面和负面的极性;支持向量机算法很难实现最优的数据率。构建培训图书馆根据实际负极性比率通常会导致识别数据比例较低,导致较低的整体精度。

表3详细说明了重要的测试结果精度之间的互信息和其他的三个方法p价值四个基本语料库库。从表中可以看出,互信息方法优于其他三种方法在150年的数据,200年的数据,300年的数据。结果表明,当样本容量的增加,p互信息和其他三种方法之间的值小于0.05。这意味着互信息方法的分类结果明显优于其他三种方法。


数据集	指标	方法
数据集	指标	MI和情感词典	MI和TI-IDF	MI和SVM (RBF)

100年的数据	p价值	0.0906	0.0063	0.1304
150年的数据		0.0487	0.0197	0.0043
200年的数据		0.0435	0.0437	0.0226
300年的数据		0.0255	0.0432	0.0021

图4表明,以色列国防军的分类算法的精度和互信息考虑功能的重量略高于其他两种算法。互信息算法有较低的精度当训练数据少,和训练数据的精度提高增加但略低于IDF权重算法。

表4详细说明了重要的测试结果精度之间的互信息和其他的三个方法p价值四个基本语料库库。从表中我们可以看到,有一个显著的差异之间的互信息方法,因为情感词典,支持向量机方法p值之间的互信息和其他两个方法都小于0.05,但当样本数量的增加,之间没有显著差异的互信息方法和TI-IDF方法。


数据集	指标	方法
数据集	指标	MI和情感词典	MI和TI-IDF	MI和SVM (RBF)

100年的数据	p价值	0.0413	0.0043	0.0343
150年的数据		0.0387	0.0667	0.0342
200年的数据		0.0234	0.0731	0.0106
300年的数据		0.0055	0.0902	0.0049

图5表明我们的算法认为每个特性的重量比其他两种比较方法性能优越。负面情绪极性数据以来的训练库存较低,其他两个算法的回忆是极低的,和体重的重量特性算法不依赖于体重数据的类别,所以学习效果有限的负极性数据更好,和负面情绪的识别数据的测试数据更高。互信息算法的召回率显著高于IDF算法。这表明互信息算法考虑到功能重量为负面情绪识别能力强。

表5详细说明了回忆的重要测试结果之间的互信息和其他的三个方法p价值四个基本语料库库。从这个表中,可以看出,有一个显著的差异之间的互信息方法,因为情感词典,支持向量机方法p值之间的互信息和其他两个方法都小于0.05,但是没有互信息法和TI-IDF法之间的显著差异。


数据集	指标	方法
数据集	指标	MI和情感词典	MI和TI-IDF	MI和SVM (RBF)

100年的数据	p价值	0.0313	0.1025	0.0034
150年的数据		0.0478	0.0706	0.0147
200年的数据		0.0443	0.0831	0.0321
300年的数据		0.0142	0.0502	0.0079

图6显示了41的比较300年培训图书馆全集在互信息特征权值加权算法和TI-IDF算法。可以看出,两种算法的权重特性,特性25日特性35岁和特性5 41和特性有很大的不同,相应的条件,态度,医生,和副作用和协商。

互信息算法权值明显高于IDF权重前三个特性。这三个特征是医学评论中常见。IDF算法认为,这些评论与高频率低的重要性和过滤给小重量,而互信息算法根据识别的高互信息值和低冗余特性给出了高体重,这样的重量使互信息算法在识别精度低于IDF的积极情感极性。这些特性是作为评论的基本特征;它往往有较低的指导作用的情感极性的评论家积极评价和主要角色情感极性的方向的负面评论。

在后者的两个特性,互信息算法体重明显低于IDF算法。这些特性属于低频特性和出现的6倍和7倍300年数据,分别。IDF算法假定低频词更能影响的情感极性的评论评论图书馆作为一个整体,和互信息算法认为这些特性是小互信息值和高冗余性和低体重。实验表明,这两个特性实际上削弱了评论的情感极性。IDF算法分类中的所有错误6测试评论类别与上述两个特点,和互信息的识别率为100%。

4.4。讨论实验

从上面的实验分析,我们可以获得互信息是最合适的方法来解决这样的问题。它显示了良好的性能方面的准确性,当样本数量的增加,只需要一个温和的计算成本为解决情感分类问题的简短文本在线医学知识分享社区。然而,在精度和召回,之间没有显著差异的互信息方法和TI-IDF方法,但图6显示的准确性IDF算法识别负面情绪极性明显低于互信息算法。实验表明,低频词现有医疗审查数据通常冗余特性,和互信息算法具有更高的精度识别冗余等特点。然而,我们的实验需要进一步改善由于只有四个基本语料库图书馆参与实验。因此,我们计划爬更多不同类型评论在线医学知识分享社区实现参数优化和性能提升方法。

5。结论

情感分析已广泛应用于许多领域,成为一个重要工具提取情感信息的评论。情感分析在医学知识分享社区与一般商品相比仍相对缺乏。信息接受者在医学知识分享社区更关心情感词汇的强度在评论或整体评估。在这个研究中,我们提出一种自适应学习情感识别方法基于互信息特征重量,它捕获特性的相关性和冗余。其有效性验证数据集从Haodf爬的在线平台,我们采用台湾大学NTUSD简体中文情感词典语料库对情感分类。最后,实验结果表明,该ALEIM方法可以实现良好的性能,特别是在低频词特征提取的评论在线医学知识分享社区。

数据可用性

实验数据来自Haodf的在线平台,可以爬https://www.haodf.com。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项研究得到了国家自然科学基金(批准号71571105)和中国人民大学的基础研究基金(批准号63172074)。

引用

x y, y . Rao,詹,h·陈,m·罗和j .阴”情绪和情感在嘈杂的标签分类,”以知识为基础的系统卷,111年,第216 - 207页,2016年。视图:出版商的网站|谷歌学术搜索
d . m . el din和m·侯赛因”调查情绪分析挑战。”沙特国王大学工程科学杂志》上,30卷,不。4、330 - 338年,2018页。视图:出版商的网站|谷歌学术搜索
l .贾、c . Yu和w·孟”否定对情绪的影响分析和检索效率,”学报18 ACM会议信息和知识Management-CIKM ' 092009年11月,香港,中国,。视图:谷歌学术搜索
a . Hogenboom p范Iterson, b . Heerschop”在情绪分析确定否定范围和强度《IEEE国际会议系统美国IEEE,安克雷奇,正义与发展党,2011年10月。视图:谷歌学术搜索
b亚历山德拉和拉尔夫,”反思情绪分析新闻:从理论到实践,”2009年WOMSA学报》上,页1 - 12、塞维利亚、西班牙,Novmber 2009。视图:谷歌学术搜索
穆克吉和p . Bhattacharyya,特色产品评论的情感分析施普林格,柏林,德国,2012年。
k·奇和m . Atul”,一个可伸缩的词汇情感分析技术为基础,“国际期刊在计算机科学与技术的基础,4卷,不。5,267 - 307年,2014页。视图:出版商的网站|谷歌学术搜索
m . Mohey m . o . Hoda, o . Ismael“在线评估分析,国际期刊《先进的计算机科学和应用程序》第六卷,没有。9日,第107 - 99页,2015年。视图:出版商的网站|谷歌学术搜索
b . Agarwal:米塔尔、p·邦萨尔和美国Garg“情绪分析使用常识和上下文信息,”计算智能和神经科学ID 715730条,卷。2015年,9页,2015。视图:出版商的网站|谷歌学术搜索
g·卡茨:Ofek, b . Shapira同意:基于上下文的情绪分析,“以知识为基础的系统卷,84年,第178 - 162页,2015年。视图:出版商的网站|谷歌学术搜索
a . Weichselbraun s Gindl, a . Scharl”丰富语义知识库的意见挖掘大数据应用,”以知识为基础的系统卷,69年,第85 - 78页,2014年。视图:出版商的网站|谷歌学术搜索
f . Bravo-Marquez m·门多萨,b . Poblete“元级别人气大社交数据分析模型”,以知识为基础的系统卷,69年,第99 - 86页,2014年。视图:出版商的网站|谷歌学术搜索
夏e·威尔士舒乐问,y, c . Havasi”意见挖掘和情感分析,新途径”IEEE智能系统,28卷,不。2、15至21,2013页。视图:出版商的网站|谷歌学术搜索
庞,l·李,美国Vaithyanathan“大拇指:情绪分类使用机器学习技术,”实证方法的会议自然语言处理(EMNLP)美国宾夕法尼亚州,费城,2002年7月。视图:谷歌学术搜索
c . Pascoal m·r·奥利维拉a·帕切科和r . Valadas”理论的评价基于互信息的特征选择方法,”Neurocomputing卷,226年,第181 - 168页,2017年。视图:出版商的网站|谷歌学术搜索
y, b . Liu和w·吴“电子管学分级胶质瘤的基于互信息的特征选择,”环境智能和人性化计算杂志》上9卷,1 - 12,2018页。视图:谷歌学术搜索
g .美国曹国伟、y杨和x x张”特征选择对变压器故障诊断基于最大相关准则和最小冗余,“先进技术的电气工程与能源,37卷,不。7,84 - 89年,2018页。视图:谷歌学术搜索
云苓,a . Gelbukh e·威尔士a·侯赛因和G.-B。黄,“Emosenticspace:小说情感常识推理框架,“以知识为基础的系统卷,69年,第123 - 108页,2014年。视图:出版商的网站|谷歌学术搜索
z l .沈h . Chen Yu et al .,“进化支持向量机使用果蝇优化医疗数据分类、”以知识为基础的系统卷,96年,第75 - 61页,2016年。视图:出版商的网站|谷歌学术搜索
诉Loia和s . Senatore“fuzzy-oriented sentic分析捕捉人类情感在基于web的内容,“以知识为基础的系统58卷,第85 - 75页,2014年。视图:出版商的网站|谷歌学术搜索
t . Chalothom和j . Ellman简单的方法通过整体学习情绪分析,信息科学和应用程序施普林格,柏林,德国,2015年。
f·n·里贝罗,m . Araujo, p . Goncalves et al .,“SentiBench-a基准比较情绪分析实践状态的方法,”EPJ数据科学,5卷,不。1,2016。视图:谷歌学术搜索
p·d·特尼,”投赞成或反对票:语义取向应用于非监督分类的评论,”学报40的计算语言学协会年度会议(ACL)美国宾夕法尼亚州,费城,2002年7月。视图:谷歌学术搜索
埃奴依旧y、y Yisong和c·克莱尔“多层次结构化文档级情绪分类模型,”学报2010年大会在自然语言处理的经验方法2010年10月美国剑桥,马。视图:谷歌学术搜索
n .法拉大肠Challita, r . Assi“阿拉伯文字,字面意思和文档级情绪矿业”《IEEE国际会议上数据挖掘研讨会IEEE,温哥华,加拿大,2011年12月。视图:谷歌学术搜索
h .周和f的歌,“Aspect-level情绪分析模型,基于广义概率主题和语法”学报2015年喇叭裤2014年5月,美国佛罗里达州,好莱坞。视图:谷歌学术搜索
w . Medhat, a·哈桑,h . Korashy“情感分析算法和应用程序:一项调查,”AIN Shams工程杂志,5卷,不。4、1093 - 1113年,2014页。视图:出版商的网站|谷歌学术搜索
p·普拉萨德,h·h·a·马格和a . Alsadoon”基于情感分析的深度学习:比较评论,”专家系统与应用程序卷,118年,第299 - 272页,2019年。视图:出版商的网站|谷歌学术搜索
n . Liu E.-S。气,m .徐b高,G.-Q。刘”,一种新颖的智能分类模型对乳腺癌诊断、”信息处理与管理卷,56号3、609 - 623年,2019页。视图:出版商的网站|谷歌学术搜索
k·拉维诉拉维,“调查意见挖掘和情感分析:任务、方法和应用,“以知识为基础的系统,卷89,不。6,14-46,2015页。视图:出版商的网站|谷歌学术搜索
徐j . n . Liu沈,m . et al .,“厂商改进的支持向量机分类器对乳腺癌的诊断,“数学问题在工程ID 3875082条,卷。2018年,13页,2018。视图:出版商的网站|谷歌学术搜索
b·阿加瓦尔和n·米塔尔”,突出的特征提取进行审核分析:一个实证研究,“《实验与理论的人工智能,28卷,不。3、485 - 498年,2014页。视图:出版商的网站|谷歌学术搜索
h·h·张,d . Wang徐,太阳,“人气微博舆论基于卷积神经网络分类,“《中国社会科学和技术信息,37卷,不。7,695 - 702年,2018页。视图:谷歌学术搜索
c .挂“口碑质量分类基于上下文情绪词汇,“信息处理与管理,53卷,不。4、751 - 763年,2017页。视图:出版商的网站|谷歌学术搜索
b·罗哈斯“深度学习情绪分析,”语言与语言学指南针,10卷,不。12日,第212 - 205页,2016年。视图:出版商的网站|谷歌学术搜索
z杨、r . Salakhutdinov和w·科恩,“多任务从头跨语言序列标签,”2016年,https://arxiv.org/abs/1603.06270。视图:谷歌学术搜索
d . Marcheggiani A .弗罗洛夫和季托夫,“一个简单、准确syntax-agnostic神经模型基于语义角色标注,”21会议程序计算自然语言学习(CoNLL 2017)加拿大温哥华,2017年8月。视图:谷歌学术搜索
m .胡锦涛和b . Liu“采矿和总结顾客评论,”ACM国际会议的程序知识发现和数据挖掘美国,西雅图,佤邦,2014年8月。视图:谷歌学术搜索
m . Saeidi g·布沙尔·m·Liakata SentiHood,“情绪分析数据集城市社区为基础,有针对性的方面”第26届国际会议在计算语言学学报》上大阪,日本,2016年5月。视图:谷歌学术搜索
云苓,即查图尔维迪、e·威尔士和l . d . a . Sentic”改善LDA基于情感分析的语义相似度,”《2016年国际神经网络(IJCNN)联合会议IEEE,温哥华,加拿大,2016年7月。视图:谷歌学术搜索

计算智能和神经科学

先进的信号处理和自适应学习方法

文摘

1。介绍

2.1。特征提取

2.2。情感分析

3所示。Semisupervised情感分类方法

3.1。问题描述和假设

3.2。基于互信息的特征选择

3.3。情感极性选择基于互信息的重量

4所示。数值实验

4.1。数据集

4.2。实验设计和评估措施

4.3。实现细节的实验

4.4。讨论实验

5。结论

数据可用性

的利益冲突

确认

引用

版权

更多相关文章

相关文章

计算智能和神经科学

先进的信号处理和自适应学习方法

自适应学习情感识别方法的简短文本在线医学知识分享社区

文摘

1。介绍

2。相关工作

2.1。特征提取

2.2。情感分析

3所示。Semisupervised情感分类方法

3.1。问题描述和假设

3.2。基于互信息的特征选择

3.3。情感极性选择基于互信息的重量

4所示。数值实验

4.1。数据集

4.2。实验设计和评估措施

4.3。实现细节的实验

4.4。讨论实验

5。结论

数据可用性

的利益冲突

确认

引用

版权

更多相关文章

相关文章