讽刺多基于整体特征选择模型类型检测在Twitter

文摘

情感分析旨在推断人们表达他们的意见在任何一段文本或感兴趣的话题。本文处理检测隐式形式的情绪,称为讽刺。讽刺传达相反的人们试图传达幽默的方式为了批评或嘲笑。它在社交网络中发挥着至关重要的作用,因为大多数的tweet或者帖子含有讽刺的细微差别。现有方法对研究讽刺只处理讽刺的检测。本文除了讽刺从文本检测,提出了一种方法来识别类型的讽刺。确定类型的讽刺背后的主要动机是确定水平的伤害或讽刺文本背后的真正意图。拟议的工作旨在改进现有方法中加入一个新的视角,将残酷的讽刺基于水平。该工作的主要应用是一个人的情绪状态有关的类型讽刺,他/她可以提供关于一个人的情感行为的主要见解。一个ensemble-based特征选择方法提出了确定最优的功能需要检测讽刺tweet。 This optimal set of features was employed to detect whether the tweet is sarcastic or not. After detecting sarcastic sentences, a multi-rule based approach has been proposed to determine the type of sarcasm. As an initial attempt, sarcasm has been classified into four types, namely, polite sarcasm, rude sarcasm, raging sarcasm, and deadpan sarcasm. The performance and efficiency of the proposed approach has been experimentally analyzed, and change in mood of a person for each sarcastic type has been modelled. The overall accuracy of the proposed ensemble feature selection algorithm for sarcasm detection is around 92.7%, and the proposed multi-rule approach for sarcastic type identification achieves an accuracy of 95.98%, 96.20%, 99.79%, and 86.61% for polite, rude, raging, and deadpan types of sarcasm, respectively.

1。介绍

自然语言处理(NLP)处理结合计算机理解人类的语言的能力,就像它是口头的。NLP属于人工智能(AI)的领域。开发NLP-based系统的主要挑战是,人类语言并不总是准确由于其复杂的语言结构和难以解释。俚语、方言和上下文发挥巨大作用,这使得电脑有点难以理解。最近的事态发展在NLP可以归因于这样一个事实:大量的信息可用由于社会媒体近年来的巨大影响。情绪可以被视为一种观点,一个人可能拥有。这是一个想法或感觉被一个人。这是感情和观点的结合形成了一个行动的基础。人类的情绪在他们的日常工作中发挥重要作用。情感分析是NLP的一个用例。 Sentiment analysis is generally used by data scientists to assess comments available in social media to determine how a particular business or brand is performing. For example, the reviews of a product can be analyzed to modify the shortcomings and identify the areas of improvements required in the product which in turn can lead to a business growth.

讽刺可以被看作是一个隐式形式的情绪。它通常传达相反的目的的。讽刺挖苦是与和讽刺或智慧,用来反驳,侮辱,取笑,或者娱乐。例如,老师大声说“荣誉你的努力工作。我一生中从来没有更深刻的印象。哈哈!“纯看这个句子可能表明,它是一个升值。然而,演讲者的背景和身体语言表明这个表达式的讽刺性质。没有可见的表情,确定在推特上讽刺是一个挑战。提供的讽刺是一个有趣的观点Deliens et al。1)在两个讽刺的条件进行了分析:自我和非自我中心的。前者术语表明讽刺感到或观察到只有在参与者的角度而不是从收件人的观点来看,后者表示讽刺被观察到的参与者和收件人的观点。通用的解释结果传达韵律特征,涉及模式的压力和声音,更有助于检测讽刺上下文特征。

考虑一下这个例子:“哦我爱如何被忽视#讽刺”。虽然这微博标签来表示讽刺,没有必要一个人总是包括标签指示讽刺。这带来了额外的挑战中提取正确的特性和特征的tweet基于讽刺tweets可以被识别。是很重要的在情感分析和情感计算领域因为讽刺可以完全翻转极性的感情,尽管它可能看起来不同。基本分析文本的情感可能不是有效的了解清楚动机由于存在各种文学设备,如讽刺,讽刺等。2]。因此检测讽刺是非常重要的为了避免任何形式的误解在任何类型的通信,并确保语句理解的目的意义。手动检测讽刺是一个单调乏味的过程可以简化自动化讽刺检测和分析。检测讽刺语句已成为一个至关重要的任务在社交媒体应用程序,因为它影响我的社交媒体信息的组织。尽管存在各种可能的特性,可以从文本中提取,它们可以被分为大类,即词法,务实、双曲线和上下文特性3]。

这项研究的重点是对讽刺成各种类型进行分类有助于理解水平的伤害或意图伤害讽刺语句中存在。讽刺可以调用各种情感的一个人,它可以创建一个有趣的感觉接收器或在最坏的情况下,它甚至可以调用一个深层次的情感伤害。应用程序类型的检测可以帮助理解讽刺背后的情绪反过来甚至可以给出一个洞察人们的情绪状态参与讽刺的对话,即。,使用的人挖苦和讽刺的目的是在谁的人。深入的分析甚至可以提供洞察一个人的情绪状态之间的关系和讽刺,他或她采用的类型。这样的理解水平将提高讽刺检测的过程。最初,一个ensemble-based特征选择方法提出了确定最优的一组功能需要检测的讽刺。

这项工作的主要贡献是讽刺的分类分为4类,除了检测讽刺。为了检测和分类,提出了基于多方法。伴随着这些,一直尝试模型情绪变化基于讽刺表现出由用户的类型。实验结果表明,该方法取得了令人鼓舞的结果在检测和分类的讽刺。本研究工作的主要目标包括以下:(1)讽刺成各种类型进行分类基于情感方面,从而决定一个人的情绪状态影响的类型讽刺展出(2)确定最优的一组功能必不可少的讽刺类型分类提出了集成学习算法(3)提出一种基于多分类方法讽刺到各种类型为了解决模糊性和不确定性的问题体现在自然语言中

2.1。在特征提取文献调查

拉维和拉维4)想出了一个合奏的文本特征选择方法,以识别挖苦和讽刺的评论和新闻文章。讽刺的新闻和AUC的AUC值为91.46% 88.86%的讽刺评论记录。布亚齐兹和Ohtsuki5检测讽刺)开发了一个系统,从而旨在证明检测讽刺增加人气的性能分析。抛开et al。6)建议Twitie软件和微博标签文本分词的词和素描引擎分类系统分为八种情绪:愤怒,期待,厌恶,恐惧,快乐,悲伤,惊讶的是,和信任。罗克韦尔(7)使用了语音数据话语和进行声学分析和知觉编码,发现前者表现好于后者在歧视讽刺和nonsarcasm。Ragini et al。8)开发了一个用于生成救灾与情感分析方法。作者利用POS和词汇特点和观察到的准确性超过30%的历史方法。马斯里et al。9)用阿拉伯语微博情感分析工具申请极性检测。作者使用机器学习和词汇的方法来分析微博的极性。Neppalli et al。10)开发了一个系统识别微博在飓风桑迪的极性。系统实现了75.91%的精度,主要问题是缺乏灾难之间的连接和推特的人。金(11]提出一个系统,使用关联理论方法提供更多的分析账户通过增加认知解释。Yoo et al。12)提出了一种检测系统实时事件从社交媒体。作者情绪分析使用卷积网络执行。精度约为84%,随着微博数量的增加,模型观测精度逐渐减少。

Musoff [13]直言虚伪用作比喻和讽刺的矛盾/挖苦讽刺和挖苦的区别。能够推断出作者讽刺有明显区别,讽刺、比喻。任等。14)开发出一种方法除以过程分为两种方法:通过将一个关键的上下文信息(CANN-KEY)和其他通过整合所有上下文信息(CANN-ALL)。它避免了手动功能工程和使用一个实值词向量导致F-measures 56.37和62.05,分别。Lei et al。15)开发了一个系统来预测情绪通过生成表情符号和词性(POS)新闻文章标签。精度是63.57%。Ghaissi和李16)开发了一种特征选择模块领域的依赖。矢量化信息作为输入导致高度稀疏矩阵。发现情绪分析灵敏度增加但特定于域的过程的本质很难概括以外的选择目标。熊等。17)进行了多层次的情感分析结果,丰富了词的方法嵌入词级别信息集成与推特信息。Karoui et al。18)采用监督学习方法和4个特征用于识别讽刺。的可靠性必须保证标签和实用功能,精度是72.36%左右。Cai et al。19)开发了一个框架基于整体文本特征选择方法检测讽刺,讽刺,讽刺评论和新闻文章。逻辑回归方法被发现实现更高精度值检测91.46%和88.86%的讽刺,讽刺的评论,分别。Jimenez-Zafra et al。20.采用监督学习和情感分析为基础的词汇。金等。21)开发了一个合奏正则化方法相结合三个回归模型。标准误分类率是0.001。

2.2。讽刺文学调查检测

Bharti et al。22)处理实时tweets通过水槽和蜂巢。作者发现讽刺通过开发一个隐藏的马尔可夫模型算法和MapReduce算法。它可以有或没有实现Hadoop框架在那里发现的时间没有使用Hadoop Hadoop 11609年代,而时间是4147年代。穆克吉和巴拉(23)提出了一个系统,使用朴素贝叶斯分类和模糊c均值聚类。上下文词语以来一直使用,发现比方法更有效使用实词。精度是65%被发现。一个小的数据集使用的只有2000条;因此,朴素贝叶斯运行良好。看,Vu (24)开发了一个模型试验-文字语句将如何影响讽刺听觉感知的检测。讽刺识别的方法实现了80%的准确率。Bhan和德25)提出了一个系统使用不同的算法来衡量讽刺如朴素贝叶斯、逻辑回归、线性回归相比,得分为每个算法生成最有效的方式。获得的线性SVC模型精度、召回和f值值为0.86,0.87,和0.86,分别。Chaudhari和Chandankhede26)被认为是基于规则的方法标记标签、挖苦检测、和极性检测也包括统计、分配和深度学习分类技术。统计方法的支持向量机分类器实现64%的精度和召回的39%,而分布语义模型实现了7% - -10% f值,发现没有足够的特性集探索数据集。Dharwal et al。27)利用各种挖苦讽刺语句的文本分析技术过滤。

古普塔et al。28)想出了一个情绪波动分析仪使用k - means聚类进行情感分析。达到85.03%的精度的方法。Lagerwerf [29日)开发了一个系统来检测从广告和公告讽刺和挖苦。AL-Sharuee et al。30.)开发了一个系统使用上下文分析和情感分析无人监督的整体学习为了处理domain-dependency问题。发现了许多数据集的平均精度达到82.45%。Persicke et al。31日自闭症儿童)开发出一种系统的教学方法检测讽刺和回复是一样的。作者为此包括规则以及视频剪辑。代纳尔(32)利用各种学术竞争的方法来检测挖苦和讽刺。蒸机(33)开发了一种方法来检测对演讲者讽刺基于假设和解决的话题。Deliens et al。1)开发了一种noncontextual讽刺策略检测。它被发现是一个有效的策略,但费时。绅士(34]用芯片设计系统应对巨大的数据量为微博可以监视成千上万的twitter账户,提到一个特定的短语。能源效率是构成问题。Fernandez-Caballero et al。35)提出了一个系统来检测病人的情绪状态通过分析他们的行为,生理信号,和表达式。Porshnev et al。36)开发了一个系统来分析twitter用户的心情,从而预测股票价格的运动。Zhang et al ., (37]在微博网络监管机构使用文本分析情绪。网络监管机构分析公众意见和决定了情绪。小梅et al。38情绪一致性和情绪感染)用于讽刺检测。开发模型能够比基线方法持续和显著但时间消费高。

Schuch et al。39)使用一致序列效应和渴望接口范式和stroop-like界面识别冲突适应。歌等。40)卷积网络用于情绪分类框架。它取得了良好的结果相比,最先进的技术。方法严重依赖pretrained的性能特点检测网络。Fardoun et al。41使用RFID标签)收集信息从学生的情绪。它是耗时,效率也在问题。哲人et al。42)开发了一个English-Hindi编码数据集讽刺为目的的检测。总共有5250条使用,n克和讽刺的标签被用作功能。随机森林是用于分类,取得了78.4%的准确性。Rajeswari和ShanthiBala43]讨论了识别讽刺从个人情感。尽管讽刺类型是本文中列出的信息,实现和实验细节没有提供关于讽刺检测以及分类。

这突出了该工作的重要性的问题分类讽刺已经尝试,结果提供了实验证据。

2.3。文献调查和模糊粗糙集

Tran et al。44)开发了一种粗糙集系统角度信息,并观察到比传统的贪婪的方法有更好的表现。女子et al。45)建议知识提取框架和智能专家系统模糊决策系统(FDS)变成直观的FDS (IFDS)以一个固定的程度的踌躇。存在大量的噪声是IFDS的主要问题。Hiai和什46)出来的系统分类讽刺微博使用三级审判过程基于规则,提高规则,拒绝规则。tweet分为8类的方法更有前途,甚至超过基准模型的精确率和召回率是0.028和0.543。方和胡47)开发了一个基于模糊隐含电路系统和co-implicators模糊颗粒。不确定性的措施,减少颗粒的变量,和应用程序的理论结果有待深入探索。钱等。48结合社区和当地的粗糙集方法。近似和属性约简算法进行有限的数据集的标签。作者进行了粗略的基于集合的数据分析与有限的标签和使用各种数据集的性能评估方法。

总的来说,主要的现有方法的局限性包括以下:大多数现有的工作主要侧重于词汇和语法特征方法,缺乏有效的技术来处理自然语言的不确定性和模糊方面数据,原始twitter数据存在噪声,等等。

3所示。建议的方法

拟议的工作的主要目标是确定如果一个给定的句子是讽刺或nonsarcastic一组最优的特性,提出了确定的整体特征选择。这些特性将杠杆进一步分类讽刺语句一种特定类型的提出基于多分类方法。结果使用各种分类算法进行验证。本研究试图找到之间的关联类型的讽刺和可能的情绪变化。图1描述了该工作的总体架构。

给定一组的微博“t”,目标是将特定的状态为讽刺或nonsarcastic。讽刺的tweet再交由提出的基于多分类框架,它将分为适当的类型。在SD⟶讽刺检测;年代⟶讽刺类;NS⟶nonsarcastic类;和MRC⟶基于多分类框架。

3.1。数据采集和预处理

Twitter API用于数据收集的目的。Twitter是一个最受欢迎的社交媒体平台。人们通常使用twitter分享他们的意见,观点,愤怒,不满,对任何事件和各种意见或情绪,让它如此受欢迎。从Twitter微博主要是利用自然语言处理应用程序的各领域。微博是通过Twitter API (Tweepy和Twython)。微博的基础上提取下列散列标签:#讽刺,讽刺,挖苦,和# notSarcasm。总共76799条用于实验的目的。非英语的微博被过滤掉。twitter这样的数据可能是不完整的,不一致的,可能有许多错误。因此,获得的原始数据需要清理,然后变成一个可以理解的格式进行进一步处理。 Hashtags, URLs, and links are removed in preprocessing Algorithm1紧随其后的词类,阻止,词元化执行获得理解的数据。

	输入:逗号分隔生推文件
	输出:预处理和清洁推文件
	创建一个列表preprocessed_docs
	每个tweet S T:
	创建一个列表结果
	每个单词W S:
	如果W不在STOPWORDS:
	茎(W)添加到结果
	如果
	如果
	标记W
	如果
	如果W @, / RT, http
	删除这个词,然后添加到结果
	如果
	结束了
	预处理文档。追加(结果)
	结束了
	结束

3.2。特征提取

特征提取有巨大的作用在决定任何机器学习任务的结果。的质量分类、定性和定量,取决于选择的特性。本节中,在高级别上,侧重于提取微博的功能,可以分为不同的类型,即词法,夸张,务实、情绪和矛盾。词法特性包括n蟋蟀、三元和unigram组合的词从消息中提取标记的援助。加强词也确定为他们在讽刺可能有助于检测过程。务实的表情符号和笑脸符号提取等功能。提出系统提取共有20特点:名词和动词,积极增强器,负增强器,三元,卦,跳过克unigram, emoji情绪,情绪得分,感叹词,标点,感叹词,问号,大写字母,重复单词计数,积极的词频,消极的词频,极性翻转,和词性标记。

从微博中提取各种sentiment-based特性像积极的单词frequency-total数量的积极的单词;消极词汇frequency-total消极词汇;积极intensifiers-intensifiers表现出积极情绪;负intensifiers-intensifier表现出消极情绪;ngrams-set连续发生”n“单词(n= 1 (unigram);n= 2(三元),等等);和跳过克-n克与一个额外的因素称为跳跃距离;被动的敌对意图的计算给出了间接的表达;情绪得分给的人气值“−1”表示负面情绪和“+ 1”表示一种积极的情绪;表情符号的情绪给表情符号的极性;极性翻转了反极性的情绪;共病的条款不需要连续的令牌可以跳过基于跳跃距离值;名词和动词的数量可以从推特的词类;词类是一种标记每个单词出现在推特的适当的词类;感叹词和问号在各种标点检测中最有意义的讽刺。大写词作为特征提取的字迹,因为有时候人们使用资本的词来强调他们想要传达的东西。 These are the prominent set of features which will be useful for sarcasm detection. Once these features are extracted, a numerical value for the features is obtained. These extracted features are categorized into different groups such as linguistic, sentiment based, and contradiction based feature sets. Table1代表一个样本从输入文件中提取卦特性。一旦提取特征,然后传递给该整体特征选择模块,检测讽刺最优的一组特性将被识别。算法2解释了关于上述特征的提取在一次简短的方式。


Unigram	{"它"}	{“是”}	{“应该”}	{”和“}	{“是”}	{a}	{“笑话”}
三元	{“它”,“是”}	{“是”,“应该”}	{“应该”,“要”}	{”到“,“是”}	{'是',' a '}	{' a ',‘笑话’}
卦	{‘它’,‘是’,‘应该’}	{‘是’,‘应该’,’”}	{‘应该’,’”、“‘}	{’”、“是”、“‘}	{'是',' a ',‘笑话’}
1-skip 3克	{‘它’,‘是’,‘应该’}	{‘它’,‘是’,’”}	{‘是’,‘应该’,’”}	{“是”,“应该”,“是”}	{‘应该’,’”、“‘}	{‘应该’,’”、“‘}	{’”、“是”、“‘}	{’’,‘是’,‘笑话’}

	输入:预处理微博
	输出:设置的功能
	(1)从文件读取数据
	(2)为每个功能,必须创建空链表中提取。
	(3)对于每个tweet, t_我,请执行以下操作:
	/ /提取各种特性
	3.1词= nltk.pos_tag (indiv_tokens)
	3.2名词= [“NN”、‘得到’,‘NNP’,‘NNPS’)
	3.3动词= [“VB”、‘VBD’,‘VBG’,‘VBN’,‘VBP’,‘VBZ’)
	3.4如果词在名词之后
	增量noun_count
	3.5其他如果词动词
	增量verb_count
	3.6返回规范化和值的动词和名词。
	3.7初始化pos_int neg_int为0
	3.8 sent_id = SentimentIntensityAnalyzer ()
	3.9指数范围的令牌
	3.10如果在intensifier_list令牌:
	计算sent_id.polarity_scores(令牌)
	3.11如果得分是负的
	增量neg_int计数
	3.12其他
	增量pos_int计数
	3.13返回pos_int neg_int
	3.14初始化sk_value = 0
	3.15 var = (x为x在nltk.skipgrams(令牌,n,j)
	/ /n的程度是n克&j是跳跃距离
	3.16我范围内(len (var)):
	3.17j在范围(n):
	3.18词= sid.polarity_scores (var[我][j])
	3.19如果词对应于正
	增加sk_value
	3.20其他
	减量的sk_value
	3.21返回sk_value
	3.22阅读微博从输入数据集
	3.23负载emojis字典包含受欢迎
	3.24“我”emoji_list:
	3.25如果我微博:
	3.26更新emoji列表和基于价值的增量情绪
	总发生这种emoji
	3.27返回规范化emoji_sentiment值
	3.28初始化感叹词计数为0
	3.29包含列表加载文件列表中感叹词的感叹词
	3.30如果推包含相应的感叹词
	3.31更新感叹词计数
	3.32每一个字的令牌
	3.33如果word.isupper ()
	增量大写数
	/ /正则表达式适用于找出重复的字母
	3.34结果= re.compile (r () \ 1∗)
	3.35文本段的结果(重复字母)
	3.36如果文本片段的长度超过3 / /连续至少3
	发生相同的字母
	增加重复的单词计数
	3.37初始化pos_count neg_count flip_count为0
	3.38在令牌:
	3.39 sent_score = sent_id.polarity_scores(单词)
	3.40如果是负的,那么获得的分数
	增量neg_count
	3.41如果遇到前面的词是积极的
	增量flip_count价值
	3.42如果获得的分数是正的
	增量pos_count
	3.43如果遇到前面的字是负的
	增量flip_count价值
	3.44 pos_count返回。neg_count, flip_count
	3.45 punct = punctuations_counter (tweet, [' !“,”?”、“…”)
	3.46返回exclamation.append (punct [' ! '])
	3.47返回questionmark.append (punct (' ? '))
	(4)提取功能和附加功能最初创建的列表。

3.3。提出了整体特征选择

本节旨在确定最优的特征提取的特性集,可以帮助识别一个讽刺的tweet。整体学习旨在寻找和选择最佳的一组特性,有助于准确讽刺检测。各种分类算法也在确定最优杠杆的功能足以确定一个讽刺。特征提取后,讽刺是被训练和测试个人特性。个人特性的分类的结果进行了比较。然后特性分成不同类别等语言特征,矛盾的特性,和sentiment-based特性。系综是为每个类别的功能完成的。进一步进行合奏的组合类别的特性。训练得到的模型是利用各种分类器如随机森林,朴素贝叶斯,支持向量机,再,梯度推进,演算法,逻辑回归、决策树。

这里列出的分类算法选择基于文献涉及分类任务的详细分析。这些算法表现出更好的性能,在各种实验中,这些算法获得的结果是更好。多个分类算法帮助验证讽刺分类的性能。最初,数据集是注释所有讽刺的“1”微博,“0”nonsarcastic tweet。注释的帮助下进行了手动和标签。带注释的数据集预处理后传递给特征提取模块。一旦提取特征,是经过分类模块在不同的分类算法应用于检测讽刺。上述特征作为输入提供给分类算法,并基于这些特性,微博已经被分为讽刺和nonsarcastic。不同的分类算法的性能讽刺结果部分中讨论。一旦tweet分为讽刺和nonsarcastic特性提出了整体识别最优的特性分类讽刺成各种类型。 The best set of features that provide a better accuracy for the aforementioned classifiers is selected for determination of type of sarcasm (Algorithm3)。

	输入:功能集
	输出:最优的特性
	(1)功能x_我在x₁,x₂、…x_n
	一个。阅读功能x_我到数组名为X
	X= {x₁,x₂,x_3,…x_我}
	b。目标变量读入数组名为Y
	c。设置train-test分流比
	Train_r= 0.8
	Test_r= 0.2
	d。修复的初始种子随机发生器在训练和测试
	random_state =n
	e。将数据集分成x_train、y_train y_train并使用train-test y_test分流比和random_state
	f。训练和分类器的特性x_我和目标
	g。计算精度使用
	精度= (TP + TN) / (TP + FP + TN + FN)
	h。精确计算的
	精度= TP / (TP + FP)
	我。召回率计算使用
	回忆= TP / (TP + FN)
	j。找到f值使用
	f值= 2∗(记得∗精度)/(记得+精度)
	k。重复步骤c j通过设置不同的值的训练测试分流比
	(2)结合特性分类C₁(语言特性(L)), C₂(情绪特性(S))和C₃(矛盾的特性(C))
	一个。为功能类别C_我在C语言中₁C₂和C₃
	b。重复步骤一个通过k
	(3)结合类别的特性(L + S)、(S + C), (L + C)和(L + S + C)
	(4)为每个类别组合C_我在(L + S), (S + C), (L + C)和(L + S + C)
	一个。重复步骤一个通过k
	(5)重复步骤1到4为不同类型的分类器
	(6)选择功能、类别或类别组合出精度高

	输入:各种分类器的精度
	输出:Akaike信息标准
	(1)为每个特性和每一个分类器,读的准确性得到每个分类算法
	(2)计算AIC使用方程
	一个。2 k-2ln(精度)k在这种情况下= 1
	(3)选择最低的分类器AIC计算每一个功能类别;让最低的另类投资会议_最小值
	(4)计算信息损失的各种分类器使用公式
	Exp (AIC_最小值−AIC值)/ 2
	(5)选择分类器和特性接近于1(即信息损失。,the model that can reproduce compared to the given model with very minimal information loss)
	(6)重复步骤1到5的组合功能类别

	输入:功能集
	输出:类型的讽刺
	(1)对每一个模糊输入变量f_我在选定的特性集,F
	一个。定义模糊集对应的值
	b。定义隶属度函数

	(2)定义模糊集随之而来的即类型的讽刺
	(3)定义隶属函数为输出变量
	(4)在类型的讽刺
	一个。定义模糊规则
	(5)使用已定义的规则执行控制系统仿真
	(6)推特t_我∈tweet T的列表
	一个。计算的模糊值类型的讽刺
	b。使用重心法计算defuzzified价值

	(7)Defuzzified价值将决定每个文本所属类型的讽刺。

	输入:功能集
	输出:类型的讽刺
	步骤1:安全部队格式的数据加载
	步骤2:代替缺失值
	步骤3:离散化数据
	第四步:生成割集/权值
	第五步:使用最小生成决策规则扩展覆盖
	步骤6:使用决策规则分类数据

	输入:微博的历史。
	输出:极性和情绪
	(1)对每一个讽刺的tweet, s_我,在推特集,T
	1.1。提取过去推文( )的用户,u_我
	1.2。选择前面的和成功推
	1.3。集合s_我当T0
	(2)对于每一个确定推在步骤1.2
	2.1。找到每条tweet的情绪(t)
	2.1.1。如果情绪得分= 0,极性设置为中性
	2.1.2。其他如果情绪得分> 0,极性设置为正
	2.1.3。其他极性设置为负
	(3)确定水平的情绪变化的各种用户不同类型的讽刺

前面步骤中获得的结果的特性集验证了模型选择Akaike信息准则(AIC)。AIC度量来计算一个特定的质量模型对其他模型下考虑。AIC的理论是基于模型的高质量如果有最小信息损失。如果AIC值为特定的功能越少,那么就更加突出。AIC值计算在哪里k代表的数量估计模型中的参数和似然函数用l .假设有“R”模型和Akaike信息每个模型给出的AIC准则值₁、AIC₂、AIC₃,……、AIC_R。然后,表达表示的概率我^th模型可以减少信息损失。

这个概念应用于特征和分类器的选择讽刺(算法的检测4)。

3.4。提出了基于多讽刺类型检测

本节涉及到开发一个模糊系统基于特征识别的部分在前面的模块,以分类的类型为每个讽刺挖苦。模糊模块估计多少特定的讽刺tweet属于一个特定类型的讽刺基于不同的隶属度函数定义为模糊规则系统(美联储)的一部分。粗糙集理论处理模糊、不精确和不一致的数据。开发一个模糊系统后,粗糙集模型确定的充分性和有效性分类类型的讽刺。

3.4.1。模糊规则系统

模糊逻辑处理系统与模棱两可或含糊不清。现实世界的应用程序可能不适于二进制解决方案。可能有情况近似逻辑会更喜欢清爽的逻辑。在这种情况下,模糊逻辑展现它的实用性。模糊逻辑是它的专业处理不确定性到很好的程度。它雇用了一个“真相”的程度对所有因素而不是纯“true”或“false”案件。模糊关联会员价值。考虑语句中每个元素表示“包含酒的瓶子的概率是0.7”这通常雇有70%的可能性是包含酒一瓶。现在考虑的声明是“会员的价值包含葡萄酒一瓶0.7”这意味着葡萄酒将包含高达70%的整个体积。这基本上是模糊逻辑与概率之间的区别。

一个模糊集,可以表示为 ,“x“任何元素,”μ“代表了隶属函数和“U”表示通用集。

模糊逻辑与模糊集完成任务代表一个语言变量。最初,一组输入和输出变量被确定。一旦确定了变量,然后语言变量设置为所有的输入变量。语言变量包含语言对冲意味着各种近似的对应的输入和输出。一旦设置变量,然后执行模糊化过程与帮助表示模糊集的隶属函数图形的形式。然后制定规则。模糊逻辑是由if - then规则。模糊推理系统然后评估规则,最后进行去模糊化任务使用一个或多个defuzzifying技术。上述过程是在图中描述2。

所涉及的各个步骤定义一个模糊逻辑系统描述如下(算法5):Fuzzificiation:脆输入转化为模糊输入的过程规则引擎:这涉及到发展的if - then规则操作模糊变量推理引擎(也称为控制器):这一步涉及各种模糊规则的执行和确定相关的会员根据输入值去模糊化:由此产生的模糊输出的过程转化为清晰的输出。

3.4.2。模糊规则的讽刺类型检测

在这项工作中,模糊规则系统开发与在前面的标识的功能模块来确定类型的讽刺。在这项工作中,我们试图将讽刺分为四个基本类型:礼貌,粗鲁,肆虐,面无表情。

礼貌是一种讽刺,讽刺的句子在本质上是积极的。例如,“哇,我爱被忽略! !”

粗鲁是一种讽刺,讽刺的句子包含适度的负面影响。例如,“我可以解释给你但我不能理解你!”

狂暴粗鲁的讽刺的延伸,但高度负面的表达。例如,“Person1:你让我觉得世界上最可怕的人。人2:是的,我让你感觉你自己。”

面无表情是一种讽刺这是隐含在性质和难以说如果是积极的还是消极的暗示。例如,“我是困惑的一个好方法!”

基于提出的整体学习法,以下的特征提取作为讽刺最好的一组特性检测,用于确定类型的讽刺。的特性确定如下:(我)积极增强器(2)负增强器(3)积极的单词计数(iv)消极的单词计数(v)情绪得分(vi)Emoji情绪

这些功能是设置为模糊规则的先例。这些术语定义的模糊集。图3代表了模糊定义(隶属函数)的输入变量。

讽刺类型设置为随之而来的,可以采取下列值之一:粗鲁,肆虐,礼貌,面无表情。图4描述了隶属函数的输出变量。

不同的模糊变量隶属度函数定义。定义隶属度函数特征作为输入和后讽刺作为输出类型,构造模糊规则。规则构造的评价的例子如下所示:规则7 = ctrl。Rule(PositiveIntensifier[‘High’] &NegativeIntensifier[‘Low’] & (PositiveWordCount[‘VeryHigh’]|PositiveWordCount[‘High’]|PositiveWordCount[‘Medium’]| PositiveWordCount[‘Low’]|PositiveWordCount[‘VeryLow’]) &(SentimentScore[‘VeryHigh’]) &NegativeWordCount[‘Low’] &EmojiSentiment[‘Medium’], TypeOfSarcasm[‘Polite’])rule24 = ctrl.Rule ((NegativeIntensifier['中']| NegativeIntensifier['低'])& (PositiveWordCount['低']| PositiveWordCount[“非常低”])& (NegativeWordCount['低']| NegativeWordCount(“非常低”)| NegativeWordCount['中'])&SentimentScore['低']&EmojiSentiment['高'],TypeOfSarcasm[“粗鲁”])

上述规则示例规则检测礼貌的讽刺和粗鲁的讽刺。每讽刺tweet,控制器对输入值与各种语言树篱与隶属函数来决定输出。输出获得defuzzified为了得到清晰的输出,这是讽刺的类型。

图5显示了一个示例的输出决定使用模糊逻辑系统对一个特定的输入组合。

3.4.3。粗糙的基于集合的讽刺类型检测

除了模糊规则类型检测,该方法采用粗糙集规则基于集合的验证,以加强和验证分类过程。粗糙集方法是普遍应用的问题或近似信息不足和执行决策。它可以应用为了获得知识抽象之后,决定可以到达。它涉及到开发一个关联规则生成器,搜索整个数据集,发现规则,充分揭示的性质和频率的各种数据元素之间的关系。粗糙的基于集合的知识发现有一些重要的优点在数据中发现隐藏的模式,发现使用统计方法不能发现的关系,找出最小的一组数据和足够的足够的分类(数据减少),获得一组决策规则的数据,等等。

假设一个类的数据,C;粗糙集的定义这个类C是由两个近似:低C和C .粗糙集的上近似逼近涉及确定特性或属性的最小集合足够充分,代表知识更加突出。这减少属性设置被称为一个约简集。常见的属性设置权值被称为核心。粗糙集决策涉及识别充分足够的最小规则集建模系统。

模糊规则基于集合的分类是基于粗糙集的方法进行验证。讽刺的类型预测的模糊规则和规则的特性集作为输入进行粗糙集分析。在ROSE2实施执行。作为一个初始步骤,输入数据文件转换成。安全部队在ROSE2格式。没有缺失值的数据集。图6显示了功能属性和决策属性的应用进行分析。

在图6、列A1 A6代表提出的特征选择的整体学习和最后一列表示分类的结果。权值确定数据集和规则的生成是基于扩展的最小覆盖。分类数据进行使用生成的决策规则。聚类分析是进行讽刺的类型数据集得到的模糊逻辑规则集,这是用于验证分类的正确性和假设在集群的数量数据集(算法6)

3.4.4。模拟用户的情绪变化

本节处理情绪或情感的研究与过去的微博用户之前和之后的一个讽刺。情绪变化预计将显示一个讽刺语句如何影响或反映了情绪的人,反之亦然。尝试这种工作模式的变化心情基于类型的讽刺。预测基于讽刺类型情绪的变化,一系列的历史为各种用户提取的tweet。用户的情绪识别是基于过去的微博用户,和各种类型的讽刺的情绪变化进行了研究。情绪的变化根据讽刺类型建模为个人的图。本节的其余部分地址如何实现上述步骤的情绪分析微博(算法7)。

情绪分析微博的实现进行NLTK和TextBlob。一组样本的选择不同类型的讽刺挖苦的tweet。过去的tweet的用户提取这些tweet。特征提取和分类的类型的讽刺,如前一节所描述的,执行。对于个人用户来说,微博的历史是提取的user_id使用用户名或用户。分析了这些tweet的极性和情绪评分使用TextBlob和NLTK。情绪的变化是模仿积极或消极的变化。使用变化和情绪的波动预测模型作为个人的图。

4所示。结果与讨论

大约76799微博被用于实验的目的。数据分为训练和测试80:20比例。为目的的培训,所有讽刺tweet注释1和nonsarcastic推有0。一旦作为预处理的tweet中提到的部分3所示。1,进行特征提取。特性,提取包括三元、卦,跳过克,缺失值,积极增强器,消极的增强,积极的单词计数,消极的字数,emoji情绪等。提出工作的主要目标是获得一个最优的特性集检测文本输入的讽刺。被训练和测试的特性对其性能进行评估。进一步,功能被分成三类,即基于文本的,感情基础和对比。每个类别的特性是合奏通过使用不同的支持向量机等分类,梯度推进,逻辑回归,演算法,随机森林,再邻居,朴素贝叶斯决策树,装袋。发现sentiment-based特性提供更好的可预测性讽刺其次是矛盾的特性集,如图7。可以看出随机森林收益更好的准确性对各种特性。

从图7,很明显,所有功能类别,情绪特征类别(情感)和矛盾的特性集实现最高精度值。因此,最优特性集的提取特性集包含情绪功能和矛盾的特性。这有助于确定选定的特征识别的正确性和综合性整体学习讽刺检测。AIC值计算,如图8,表明情绪和矛盾的结合特性至少AIC值,从而导致推断,这些特性可以更好地讽刺检测模型。S表示情绪功能集;L表示语言的特性;和C表示矛盾的特性。提出了系统的性能相对于基线的一些方法。

图9显示的准确性提出了系统与现有的基线系统相比。从曲线图可以得出结论,提出系统讽刺检测收益率比基线模型更好的精度。

在图9,最先进的技术相比,该方法检测的讽刺。分类算法,讨论了在上面的方法列出如下:朴素贝叶斯算法与模糊聚类(23];最大熵和朴素贝叶斯方法49];朴素贝叶斯算法(9];随机森林分类(18];和潜水框架(50]。现有方法的比较与拟议的工作列在下表中2。


最先进的方法	精度(%)

(23穆克吉和巴拉	65年
(9马斯里et al。	70年
(18Karoui et al。	72.36
(49Jayasanka et al。	77.28
(50Rajadesingan et al。	83.46
提出工作	92.7

图10显示了不同类型的讽刺被提议的方法为基础的多。在拟议的方法中,讽刺是分为四种类型,即礼貌,粗鲁,面无表情,肆虐。

粗糙的基于集合的分析类型的讽刺是对结果执行模糊系统,和获得的混淆矩阵的粗糙集列在下表中3。


类型	有礼貌的	粗鲁的	愤怒的	面无表情

有礼貌的	3290年	46	85年	7
粗鲁的	66年	4018年	87年	6
愤怒的	24	23	24725年	5
面无表情	2	6	31日	263年

从表中给出的混淆矩阵3,类型非常最小的误分类下的四种类型的研究。表4显示的准确性通过粗糙集的方法验证。推断从混淆矩阵,分类精度高的所有类型的讽刺(礼貌的- 95.98%,粗鲁的- 96.2%,肆虐的- 99.79%,面无表情,86.61%)。为每个类型的讽刺是最小的误分类率也有4.02%,3.8%,0.21%,13.39%,礼貌,粗鲁,肆虐,分别和面无表情类型的讽刺。


平均精度(%)
	正确的	不正确的

总	98.81	1.19
有礼貌的	95.98	4.02
粗鲁的	96.2	3所示。8
愤怒的	99.79	0.21
面无表情	86.61	13.39

基于聚类分析结果,进行讽刺类型和在图表示11。提出系统的性能测量列在下表中5。精度、召回和F-measure计算基于方程中提到的算法3。可以推断出,89.1%的总体精度粗糙集分析证实了模糊规则库的性能开发类型的讽刺。


类	TP-rate	FP-rate	精度	回忆	F-measure

愤怒的	0.983	0.231	0.93	0.983	0.955
粗鲁的	0.809	0.017	0.729	0.309	0.434
有礼貌的	0.931	0.041	0.730	0.931	0.818
面无表情	0.913	0.001	0.869	0.913	0.890
加权平均	0.891	0.181	0.882	0.891	0.874

极性分析前和成功tweet的讽刺推不同的用户研究,和获得的结果数据。数据12(一个)- - - - - -12 (c)描述心情的变化水平获得了用户对不同类型的讽刺。T0代表了讽刺的推特正在考虑和过去的tweet T0表示为(T−1) (T−2)等。

(一)

(b)

(c)

讽刺后的微博微博命名(T1)、(T2)、(T3)等极性分析前进行,成功推为不同的用户和不同类型的讽刺。礼貌的讽刺,微博往往是更积极的极性性质虽然狂暴粗鲁和讽刺,用户往往更消极的情绪。它匹配的假设时表现出礼貌的讽刺,一般用户的情绪往往是积极的,同样的,当表现出粗鲁的和激烈的讽刺,整个用户倾向于负面的情绪他/她的情绪往往是被愤怒或愤怒,表现出的人物12。

5。结论

讽刺是一种隐式形式的情绪。检测讽刺出现在文本有助于理解实际的信息传达的情感。为了检测讽刺,各种特征提取,包括积极的和消极的含硼铁合金,跳过克,人气值、极性翻转,等。一种ensemble-based特征选择方法已提出了确定最优特性集在所有的特性和分类是否推是讽刺,达到92.7%的精度。除了一个文本分类作为讽刺或nonsarcastic小说尝试在这项工作进行了讽刺成各种类型的分类。讽刺被分为四种类型在详细地分析讽刺的属性后,即礼貌,粗鲁,肆虐,面无表情。为了讽刺成各种类型进行分类,提出了基于多方法。提出的基于多的方法包括两个层次:模糊规则类型检测和粗糙的基于集合类型检测和验证。模糊规则构造了模拟各种类型的讽刺和相同的验证和验证了粗糙集理论基础规则。提出的基于多获得以下结果为不同讽刺类型:礼貌,95.98%;粗鲁,96.2%; Raging, 99.79%; and Deadpan, 86.61%. The results obtained have supported the notion that mood levels of the person influence the type of sarcasm they exhibit. When a person is in not so good mood, rude and raging sarcasm tends to be predominant in the outcome exhibited, and when the mood is positive, they tend to exhibit polite sarcasm predominantly. The validation of the results of the type of sarcasm obtained through fuzzy system was carried out with the rough set approach. Finally, after determining the type of sarcasm, user’s mood changes were modelled in the proposed approach. To predict how a user’s mood influences the sarcasm and vice versa, the tweets before and after a particular exhibition of a sarcastic type are obtained. This can help in modelling the emotion change of a user by collecting the past tweet histories of each user. The obtained mood change model demonstrates how the type of sarcasm exhibited by the users affects their mood levels.

数据可用性

使用的实验数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

作者想表达他们的感谢麻省理工学院校园,安娜大学的支持。这项研究的部分支持由安娜纪念研究奖学金。

引用

g . Deliens k .安东尼奥由于大肠中国,m . Kissine“换位思考和节俭的策略:从讽刺检测证据,”《语用学卷。119年,33-45,2017页。视图:出版商的网站|谷歌学术搜索
a·库马尔s . r .从Arora, a .弘和m·阿卜杜拉·巴塞”讽刺检测使用软引起双向长期短期记忆模型与卷积网络,”IEEE访问7卷,第23328 - 23319页,2019年。视图:出版商的网站|谷歌学术搜索
s . k . Bharti和s . b .蔻”讽刺在twitter数据检测:监督的方法,”语义Web科学和实际应用m·d·Lytras, n . Aljohani大肠Damiani和k·t·崔,Eds。,页246 - 272,IGI Gobal,好时,PA,美国,2019年。视图:谷歌学术搜索
k·拉维诉拉维,“讽刺小说讽刺和自动检测使用整体特征选择和数据挖掘,”以知识为基础的系统卷。120年,15-33,2017页。视图:出版商的网站|谷歌学术搜索
m·布瓦吉吉和t . Ohtsuki意见挖掘Twitter:如何利用讽刺提高情绪分析,”《IEEE / ACM国际会议上社交网络分析和挖掘的进步(ASONAM)IEEE,加拿大温哥华,2015年8月。视图:出版商的网站|谷歌学术搜索
m .抛开过去,诉帕蒂·p·罗索,“在社会媒体文本区分讽刺和挖苦:语言的观察”情报学报》国际FRUCT会议、社交媒体和网络(ISMW FRUCT)IEEE,圣彼得堡,俄罗斯,2016年8月。视图:出版商的网站|谷歌学术搜索
p·罗克韦尔,”声音对话讽刺的特点:一个比较的方法,”心理语言学研究期刊》的研究,36卷,不。5,361 - 369年,2007页。视图:出版商的网站|谷歌学术搜索
p . m . r . j . r . Ragini Anand,诉Bhaskar”大数据分析救灾和恢复通过情绪分析,“国际信息管理杂志》上,42卷,24里面,2018页。视图:出版商的网站|谷歌学术搜索
m·马斯里:Altrabsheh、h·曼苏尔和A·拉姆齐“阿拉伯情绪分析一个基于web的工具,”Procedia计算机科学卷。117年,38-45,2017页。视图:出版商的网站|谷歌学术搜索
v . k . Neppalli c . Caragea a . Squicciarini a . Tapia和s . Stehle”飓风桑迪在应急响应期间情绪分析,“减少灾害风险的国际期刊21卷,第222 - 213页,2017年。视图:出版商的网站|谷歌学术搜索
j·金,“韩国英语学习者理解讽刺L2英语,”《语用学,60卷,第206 - 193页,2014年。视图:出版商的网站|谷歌学术搜索
柳,j .歌曲,o .宋”基于社交媒体内容的情感分析和预测系统,”专家系统与应用程序卷,105年,第111 - 102页,2018年。视图:出版商的网站|谷歌学术搜索
a . Musolff”在公共话语隐喻,讽刺和挖苦,”《语用学卷,109年,第104 - 95页,2017年。视图:出版商的网站|谷歌学术搜索
y任,d .霁,h .任“Context-augmented卷积神经网络对于twitter讽刺检测”Neurocomputing卷,308年,页1 - 7,2018。视图:出版商的网站|谷歌学术搜索
李问:,j . Lei y . Rao, x,和l . Wenyin”来建立社会情感探测系统为在线新闻,“未来一代计算机系统37卷,第448 - 438页,2014年。视图:出版商的网站|谷歌学术搜索
m . Ghiassi和s·李,”一个域转移词典设置微博情感分析使用监督机器学习方法,“专家系统与应用程序卷,106年,第216 - 197页,2018年。视图:出版商的网站|谷歌学术搜索
熊,h . Lv, w .赵,d .霁”对twitter的多层次sentiment-enriched字嵌入的情绪分类,“Neurocomputing卷,275年,第2466 - 2459页,2018年。视图:出版商的网站|谷歌学术搜索
j . Karoui f·b·Zitoune诉Moriceau,“讽刺Soukhria:向一个检测系统对阿拉伯语在社会媒体,”Procedia计算机科学卷,117年,第168 - 161页,2017年。视图:出版商的网站|谷歌学术搜索
王j . Cai j·罗,美国,美国,“机器学习中特征选择:一个新的视角,”Neurocomputing卷,300年,第79 - 70页,2018年。视图:出版商的网站|谷歌学术搜索
s . m . Jimenez-Zafra m . t . Martin-Valdivia m . d . Molina-Gonzalez和洛杉矶Urena-Lopez”,我们怎么谈论医生和药物?情绪分析在论坛上表达观点对于医疗领域,“人工智能在医学上卷。93年,50-57,2019页。视图:出版商的网站|谷歌学术搜索
k . y . Kim Schug, s . b .金”一个正则化方法对特征选择质量光谱指纹,”化学计量学和智能实验室系统卷,146年,第328 - 322页,2015年。视图:出版商的网站|谷歌学术搜索
s . k . Bharti b . Vachha r·k·普拉丹,k . s .先生和s . k . Jena”讽刺的情绪推流实时检测:大数据的方法,”数字通信和网络,卷2,不。3、108 - 121年,2016页。视图:出版商的网站|谷歌学术搜索
穆克吉和p·k·巴拉”,讽刺检测微博使用朴素贝叶斯和模糊聚类,“技术在社会卷,48 19-27,2017页。视图:出版商的网站|谷歌学术搜索
d .看和j.p. Vu使用讽刺恭维:上下文、语调和感知与消极的字面意思的语句,“心理语言学研究期刊》的研究,45卷,不。3、615 - 624年,2016页。视图:出版商的网站|谷歌学术搜索
n Bhan和m .德”Sarcasmometer使用情绪分析和主题建模”诉讼的进展国际会议上计算、通信和控制(ICAC3)IEEE,孟买,印度,2017年12月。视图:出版商的网站|谷歌学术搜索
p . Chaudhari和c . Chandankhede“文学讽刺的调查发现,”《无线通信国际会议上,信号处理和网络(WiSPNET)IEEE,钦奈,印度,2017年3月。视图:出版商的网站|谷歌学术搜索
p . Dharwal t . Choudhury r·米塔尔和p·库马尔,“自动讽刺检测使用特征选择,”诉讼第三应用和理论计算和通信技术国际会议(iCATccT)IEEE Tumkur,印度,2017年12月。视图:谷歌学术搜索
e·古普塔g . Rathee p·库马尔,d . s . Chauhan”情绪波动分析器:动态情感探测方法,”美国国家科学院院刊》上,印度部分:物理Sciencesm,卷85,不。1,第157 - 149页,2015。视图:出版商的网站|谷歌学术搜索
l . Lagerwerf”,讽刺和挖苦广告:有关不相称的影响,“《语用学,39卷,不。10日,1702 - 1721年,2007页。视图:出版商的网站|谷歌学术搜索
m·t·AL-Sharuee m . Pratama f . Liu和m . Pratama”情绪分析:自动上下文分析和整体聚类方法和比较,”数据与知识工程卷,115年,第213 - 194页,2018年。视图:出版商的网站|谷歌学术搜索
a . Persicke学监j·塔波克斯兼任,j . Ranick和m .圣克莱尔”教学自闭症儿童发现和应对讽刺,“自闭症谱系障碍的研究,7卷,不。1,第198 - 193页,2013。视图:出版商的网站|谷歌学术搜索
m .代纳尔,”学者与美国人的编剧和学者:争夺etic和位的“讽刺”和“讽刺”标签,“语言与沟通,55卷,第87 - 69页,2017年。视图:出版商的网站|谷歌学术搜索
e .蒸机“讽刺很简单,”网络时代的国际会议信息管理澳门,页459 - 471年,中国,2014年6月。视图:谷歌学术搜索
e .绅士“人工智能学会点讽刺你的微博,“《新科学家》,卷231,不。3086年,p . 2016。视图:出版商的网站|谷歌学术搜索
a . Fernandez-Caballero a . Martinez-Rodrigo j . m .牧师et al .,“智能环境情感检测和监管架构,”生物医学信息学杂志卷。64年,55 - 73、2016页。视图:出版商的网站|谷歌学术搜索
a . Porshnev和i Redkin分析推特用户的情绪预测股市,黄金和白银价格的”学报的国际会议上分析图像,社交网络和短信施普林格,莫斯科,俄罗斯,2014年7月。视图:谷歌学术搜索
王张,z, y, t·廖“中国微博情感分析文本的基础上扩展情绪词典,“未来一代计算机系统卷,81年,第403 - 395页,2018年。视图:出版商的网站|谷歌学术搜索
z小梅,y, z Jianpei, h .宏宇,“微博情感分析弱依赖关系,”以知识为基础的系统卷,142年,第180 - 170页,2018年。视图:出版商的网站|谷歌学术搜索
s Schuch j . Zweerings p·赫希,科赫,“冲突适应积极和消极情绪:应用显现操纵,”Acta Psychologica时间为,卷176,pp。月11日至22日,2017年。视图:出版商的网站|谷歌学术搜索
k歌,t .姚明,问:凌,t·梅,“提高图像情感分析与视觉注意力,”Neurocomputing卷,312年,第228 - 218页,2018年。视图:出版商的网站|谷歌学术搜索
h . m . Fardoun s r·洛佩兹·d·m·Alghazzawi和j·卡斯蒂略,”监测检测学生情绪的弱点在中学,“Procedia-Social和行为科学47卷,第2054 - 2049页,2012年。视图:出版商的网站|谷歌学术搜索
美国偶像,A口诉辛格,s . s .艾克塔和m . Shrivastava”的语料库English-Hindi code-mixed tweet讽刺检测,”2018年,https://arxiv.org/abs/1805.11869。视图:谷歌学术搜索
k . Rajeswari和p . ShanthiBala讽刺的情绪的个人认识社交网络”国际纯粹和应用数学杂志》上,18卷,不。7,253 - 259年,2018页。视图:谷歌学术搜索
公元Tran、美国Arch-int和n . Arch-int”近似微分依赖关系的粗糙集方法,”专家系统与应用程序卷,114年,第502 - 488页,2018年。视图:出版商的网站|谷歌学术搜索
a . k .女子s Shreevastava t . Som和k·k·舒克拉,“承受力直觉模糊粗糙集属性约简方法,”专家系统与应用程序卷,101年,第212 - 205页,2018年。视图:出版商的网站|谷歌学术搜索
Hiai和k·什”,讽刺评价表达式的基于模式的提取方法,”进行第五IIAI国际大会先进应用信息学(IIAI-AAI)IEEE熊本,日本,2016年7月。视图:出版商的网站|谷歌学术搜索
b . w .方和b .问:胡”,细粒度的模糊粗糙集基于模糊隐含电路和coimplicators,”模糊集和系统卷,359年,第139 - 112页,2019年。视图:出版商的网站|谷歌学术搜索
梁x, y钱问:王et al .,”当地粗糙集:一个解决方案在大数据粗略的数据分析,“国际期刊的近似推理卷,97页38 - 63,2018。视图:出版商的网站|谷歌学术搜索
s . Jayasanka t . Madhushani e·马库斯Aberathne,和s Premaratne“情绪分析社交媒体,”2013年,https://www.researchgate.net/profile/Saminda_Premaratne/publication/268817500_Sentiment_Analysis_for_Social_Media/links/5478afec0cf293e2da2b2aa0.pdf。视图:谷歌学术搜索
a . Rajadesingan r . Zafarani h·刘,“在推特上讽刺检测:一个行为建模方法,”学报》第八届ACM国际会议网络搜索和数据挖掘,ACM,上海,中国,2015年2月。视图:谷歌学术搜索

计算智能和神经科学

文摘

1。介绍

2.1。在特征提取文献调查

2.2。讽刺文学调查检测

2.3。文献调查和模糊粗糙集

3所示。建议的方法

3.1。数据采集和预处理

3.2。特征提取

3.3。提出了整体特征选择

3.4。提出了基于多讽刺类型检测

3.4.1。模糊规则系统

3.4.2。模糊规则的讽刺类型检测

3.4.3。粗糙的基于集合的讽刺类型检测

3.4.4。模拟用户的情绪变化

4所示。结果与讨论

5。结论

数据可用性

的利益冲突

确认

引用

版权

更多相关文章

相关文章

计算智能和神经科学

讽刺多基于整体特征选择模型类型检测在Twitter

文摘

1。介绍

2。相关工作

2.1。在特征提取文献调查

2.2。讽刺文学调查检测

2.3。文献调查和模糊粗糙集

3所示。建议的方法

3.1。数据采集和预处理

3.2。特征提取

3.3。提出了整体特征选择

3.4。提出了基于多讽刺类型检测

3.4.1。模糊规则系统

3.4.2。模糊规则的讽刺类型检测

3.4.3。粗糙的基于集合的讽刺类型检测

3.4.4。模拟用户的情绪变化

4所示。结果与讨论

5。结论

数据可用性

的利益冲突

确认

引用

版权

更多相关文章

相关文章