文摘

特点是其惯常的符号系统和简单的和生动的表达模式,网络语言作为不仅方便交流的工具,也丰富情感的载体和导致公众舆论高度关注分析,网络营销、服务监控、反馈和社会应急管理。基于我们的多学科研究,本文提出了一种分类的情感符号在网络语言中,分析不同符号的认知特点,提出了机理模型显示占主导地位的神经活动过程。通过比较研究汉语、英语和西班牙语,这是被世界上最多的人口,论述了情感的表达模式在国际网络语言和情感计算提出了一种智能方法在一个统一的网络语言垫(Pleasure-Arousal-Dominance)的情感空间。

1。介绍

在当今社会,网络空间已成为一个重要的地方的人们分享信息,交换意见,沟通情感。由于其虚拟性、自主性、开放性、包容性和高表达由于各种技术的新媒体,人们的语言创造力激发了极端,导致网络语言的蓬勃发展(1]。

中国传媒大学的余教授指出,网络语言是一种“独特的自然语言”常用在网络空间2]。根据费迪南德·德·索绪尔的符号学理论,中国学者分类网络语言可读符号和不可读的两类符号和研究他们的符号系统,表意功能和形成规则(1,3,4]。然而,没有一个一致的网络语言的定义(网络语言,网络语言,或web语言)。与现代通信和新媒体技术的快速发展,互联网,物联网,和无线通信网络已经融入到无处不在的“无所不在的网络”功能日益多样的网络语言的表达模式,包括图标、音频、视频、文本以及形状、颜色和亮度。基于所有的结果之前的研究,我们将网络语言定义为“一个符号系统,人同意,广泛应用于交流无处不在的环境下。”

网络语言非常丰富的表达情感通过简单的装配可读和不可读符号或文字的复合物,图标,音频或视频信号,混合动力车(5]。任何变化的组件、形状、颜色、布局、或表示序列可能提供不同的情感信息。网络语言发展迅速在世界主要语言如汉语、英语、日语、德语、法语和西班牙语(1- - - - - -3]。在全球化的背景下,网络语言国际语言交流带来了新的活力和强大的表达情感的能力。因此,研究网络语言的情感特征吸引了语言研究的广泛关注公众舆论分析,网络营销、服务监控、反馈和社会应急管理。

情感计算,最初提出的皮卡德在1997年,表明可以感知到的情感信息,处理,计算机器(6),已应用于网络空间在网络舆论分析(7)、智能服务设计(8),心理监控无处不在学习9),和动态情感计算在声乐社交媒体10]。在过去的几十年中,虽然已经取得了很大的进步与情感计算在自然语言,仍有许多困难在处理网络语言由于其复杂性和可变性。同时,情感符号的认知网络语言与人类的神经活动密切相关,受到国籍和文化背景等因素的影响,在这个问题上需要进一步的多学科研究。

首先给出一个分类的情感符号在网络语言根据发现学习理论,然后分析了不同符号的认知特征。根据我们先前的研究发现,一种机制模型显示的主要神经活动提出了这一过程。为了分析情绪的表达模式在国际网络语言,中国的比较研究,英语和西班牙语的语言进行了本文最后提出了一个智能方法对情感计算的可读文本和不可读符号统一垫的情感空间。

2。情感符号在网络语言和神经认知

2.1。情感符号的分类

可以用来表达情感的符号网络语言非常丰富,不断创新,包括简单的装配可读和不可读符号或文字的复合物,图标,音频、视频信号和他们的混合动力车5]。

根据发现学习理论,学习过程是实现了学习者的认知表征,指把知觉的心理过程的外部物质进入内部心理事实。认知心理表征的方式将经历三个阶段,随着人们长大:第一个动作表象,第二个图像表示法,,第三,符号表示,显示序列在人类的认知不同的信息类型,也就是说,法律制定的信息是第一位,紧随其后的是图像信息,然后文本信息。

为了研究不同类型的信息情感认知的影响在网络语言中,我们的情感分类符号分为六类(ECSAGT) [5,7]:法律制定的符号、色彩符号、结构符号、声音符号、图形符号和文字符号,每个传递情感信息按照一定的编码和普遍接受的规则。

2.2。认知特征的情感符号

分析相关的情感符号在网络语言是信息发送者的意图和表达以及知觉和认知信息的接收器。发送者和接收者可能的情绪是不同的,所以我们应该确定我们的目标是确定发送方的情绪从他提出了符号或判断激活情绪的接收者的信息符号,将评估基于统计学意义(10]。在情感计算,我们通常认为后者。

根据认知神经科学的研究,人类情感源于外部信号,通过周边感觉器官和大脑的边缘系统的内部感觉通路快速主要产生情感,紧随其后的是一个相对缓慢的次要情感互动中形成的认知越高边缘系统和大脑皮层11,12]。这个过程是由人类大脑的情感电路控制,会产生相应的脑区激活反应。

最近研究人类情感都很支持更新实验技术,如脑电图(脑电图仪),erp(与事件相关电位),fMRI(功能性磁共振成像)和DTI(弥散张量成像)。特别是,血氧水平依赖功能性磁共振成像(Bold-fMRI),与侵入性等优点,nontraumatic,能够准确定位激活的大脑区域,已应用于语言和情感的神经机制的研究13- - - - - -15]。

在我们先前的研究由复旦大学戴教授等人组织的,我们发现不同类型的认知反应符号变化从一个到另一个通过实验观察脑电图和功能磁共振成像(7]。例如,法律制定的、结构、颜色和图形符号通常需要更少的时间,能增加快速主要情绪,我们称之为主要的情感信息。语义文本符号将占用更多的时间而被高级皮层的大脑。他们通常生成慢二级情绪和属于次要的情感信息。音频符号同时包含表征信息和语义信息,因此承担主要和次要情感信息的特点,但需要更多时间比第一种资源。主要的情感信息的跨文化和语言在很大程度上独立的。一旦情感符号形成的认知规则,二级情感信息起着至关重要的作用在表达更深入的情感。上面讨论的特征应该考虑在情感计算消息组成的混合类型的情感符号,反映了动态符号认知反应。

作为视觉传达的基本原则问题(PVC)、视觉结构的认知特点研究了多年(16]。此外,研究人员和工程师领域的人机交互(HCI)已经开发出有效的计算模型来衡量不同元素在这个过程的时间特征17,18]。

根据人类的处理器模型(也称为民族主义者行动党(MHP)) (19),过程的信息包括三个子过程:感知过程,认知过程,和运动过程,如图1。时间知觉过程和认知过程中的参数可以测量如表1(20.]。

从表1,我们可以发现,视觉信息的处理时间是通常短于听觉信息。然而,在我们的研究中,视觉信息涉及法律制定的符号、色彩符号、结构符号、图形符号、符号,有不同的处理时间。如果只考虑简单的动作、颜色和结构的符号在网络语言中,实验表明,更快的订单处理时间是:法律制定的符号、色彩符号、结构符号、声音符号、图形符号和文字符号表征认知(7]。与音频符号相比,图形符号可以感知的速度,但他们需要更多的处理时间理解的认知过程。然而,人们通常可以认知的语义音频文本符号的符号比这快得多。因此,我们提供一个示意图如图2,它显示了不同类型的情感符号的一般认知特点的网络语言。

2.3。神经机制模型

情绪的脑机制已经被学者们系统地探索领域的情感神经科学(21- - - - - -23]。为了提供系统性的指导分析的神经认知情感符号在网络语言中,总结分析现有理论和研究的基础上,我们提出一种机制模型的主要神经活动过程如图3(5,9]。

情感符号的刺激信号将被交付通过接收机的感官通道边缘系统和产生直观的主要情绪,然后生成慢但更理性的二级情绪的认知活动高级皮层的大脑。最后,情绪的变化会导致被大脑的生理反应,形成特定的情感体验。实际上,情感符号的主观评价的信息接收器的判断他们的情感体验。

在这个过程中,先进的大脑皮层的调节对感官通道的选择性注意,也就是说,它分配的视觉,听觉,和时间资源自主。选择性注意取决于信息接收机的动机、知识、记忆、认知和决策等高级心理活动。在经历多次相同的符号,一个认知规则将内存中创建生产常规反应熟悉的符号。

3所示。网络语言中表达的情感模式

3.1。语料库和情感的词汇

当我们看网络语言,我们会发现它表达的情感与可读的单词或不可读符号有特定的情感取向。他们通常定义为情感词,可以发现在世界上最大量使用的语言如汉语、英语和西班牙语。例如(24),“弟弟”是一个哥哥的缩写。它听起来很温暖而“lol”表达喜悦和指“哈哈大笑”或“裂纹。”此外,也有许多特殊的术语如“pfffffff,“骄傲的词意味着什么或者你喜欢。“咯”是一个“明天”的简称,是指将明天完成。“个新手”是新手还是绿色,通常用来疯狂地描述那些笨拙的某些事情。“W00t”代表谁,是用来描述某事或某人兴奋或惊讶。在一些国家,人们可能会用数字或符号来表达自己的感受。例如,“1337”代表“精英”,一个非常能干的人。这个数字可以传递一种惊喜和快乐的感觉。英语,“56”意味着无聊人数aburrido在西班牙语中,“无聊”在中国。字母“D”是一个很大的笑。符号”:“一个微笑而“(”意味着悲伤。

一个项目由全球网络语言的研究人员旨在建立的语料库收集和整理常用的网络词汇和符号,如一般的调查者,WordNet, SentiwordNet。语料库将包括大量的情感网络术语来说,这是至关重要的情绪取向的分析网络语言。一个例子是中国知网,收集了52000名中国条款和57000个英语单词(24]。在所有出版的,有219个单词描述情感的强度,3116 - 1254贬义,3730例阳性,836承认的,38个命题的命题。知网的语义词典还包括大量的词汇语义条目,每一个都是由一个术语的语义及其描述。它提供指导如何分析上述情感表达在一个特定的上下文。

情绪取向情感网络语言礼物被定义为情绪极性,可以分为三个类别:积极的,负的,中性的。每一个情感词的极性和强度与网络语言的情感表达和认知标准具体的上下文。基准的情感词的极性和强度在典型的上下文可以通过统计对网络语言的研究和确定覆盖了许多主体之一,比如中国的情感词汇本体信息检索实验室整理和注释的大连理工大学。它提供了从不同的角度全面的账户一个词的词性,情感类别,强度和极性,因此提供了重要参数的计算标准与情感相关的网络词汇。

网络语言的特点是广泛的词汇中丰富的情感和更新迅速。利用情感词汇的基本方法是在网络语言的表达情绪。研究人员在全球范围内建立了网络语言的主体之一通过收集和整理常用词汇和符号。

3.2。情绪的表达模式

情感信息的网络语言不仅是决定情感词汇使用的句子,而且在整个句子的表达模式。因此,同样的情感词汇时可以完全相反的意思表示在一个不同的模式。例如,“当我听到这个消息,我很难过。但潜伏一段时间后,我发现徒步旅行者是正确的,所以只是想告诉今天来分享我的欢乐。”这句话有两种情感词,消极的“心烦意乱”和积极的“快乐”连同一个让步词“但。“假设 代表积极情绪词, - 1和 让步,上面的句子的情感表达模式可以广义的:

在网络语言中,连词对情感的理解关键信息在句子和之后是重要的对象被认为是情感分析的结构和表达模式。表2包括一些常用连接器在中国,英语,西班牙语(24]。

当然,一个完整的情感表达模式还包括学位,消极词汇和标点符号。例如,中国话说“不很高兴”、“不高兴”和“高兴”非常不同程度的表达不满。标点符号,如“!”、“吗?”、“…”,表情符号,尤其是展示完全不同的情感取向。此外,情感词的序列在一个句子都会产生一定的影响。例如,英语句子“我们现在疲惫;最重要的是我们为我们的成功感到高兴。“采用的模式” ”。整个句子的情感是由短语后,“最重要的是,如此高兴的原因。“没有严格的规定规范网络语言表达式,它是不断变化的,我们将不得不使用电脑自动捕捉新的条目和修改他们的主观认知为了建立开放主体之一在句子和表达的情感模式分析传递的消息。

仍然是一个研究的问题是什么情感表达通过一些不可读符号如法律制定的符号、声音符号、结构符号、色彩符号,图形符号。与文本符号,情感的最有效的方法计算这些情感符号是建立一个开放和频繁更新图书馆基于知识本体不可读的符号,这是与文化背景、语言环境和社会环境,应该处理情感符号考虑语言应用程序环境(5,9]。那些符号,音频的情感符号主要是反映在速度、强度、频率,和音频信号的光谱参数,可以高度跨文化和跨语言。在网上谈话,一个可以实现高准确率的情感识别的模式识别甚至没有语义分析(10,25- - - - - -27]。

4所示。情感计算在网络语言

4.1。统一垫的情感空间

为了处理机器,情感特征的情感符号在网络语言应该定量描述。基本的描述是其正负极性强度定量。在大多数情况下,研究人员提出了“六大”类型的情绪:愤怒,厌恶,恐惧,快乐,悲伤和惊奇都会行之于色,(28),已被广泛应用于分析图形,音频和视频信号。然而,情感符号在网络语言通常携带混合情感特征和动态变化反映在音频和视频信号。

Mehrabian提出了一个三维模型可以描述任何类型的复杂的情绪在垫情感空间(29日,30.]。它包括三个近独立连续维度:Pleasure-Displeasure (P), Arousal-Nonarousal (A),和Dominance-Submissiveness (D)。实验表明,几乎所有已知的情绪状态可以描述在这个空间很好10,30.]。到目前为止,垫模型已成功应用于多种领域,如视听语音合成(31日),微博情感分析(32),和音乐情绪比较(33]。垫的3 d维度提供一个统一的空间来描述所有类型的混合情感特征的情感符号在网络语言以及它们的动态变化。垫的任何情绪状态空间,也可以被描述为典型的情绪基于百分比转换度量函数(10,34]。

通常,垫常用的情感符号的值应该首先评估主观评价根据典型信息接收者的感知和认知的过程中情感符号和存储在库基于本体知识,因此提供了参考综合计算的机器。为了达到精确和一致的结果在主观评价,Mehrabian设计初始34-item测试问卷(29日]。然而,在实践中应用表明,问卷设计应该根据特定的语言由于语言理解上的差异和文化背景。表3显示了中国版的简化问卷由心理研究所的学者提出,中国科学院(35]。评估是基于什么样的感觉在每一项更强烈。从左边到右边,这是按比例缩小的范围内“−4”到“4。“每一项的得分不得计算转化为P的归一化值,A和D (35]。

4.2。图书馆知识和情感的符号

情感符号的感知和认知网络语言不仅神经认知有关,还受到信息接收器的背景和特征。因此,我们建立一个开放和频繁更新知识图书馆如图4

情感符号以及它们的表达模式是基于本体存储在这个库。常用的符号在图书馆应该首先分配与垫的情感符号值作为基准通过主观评价本文之前已经讨论过。

为了评估其他的值或新的情感符号,我们采用了PMI(点态互信息)方法(36),它是基于概率的知识图书馆的新符号和它的基准。例如,改进HowNet-PMI算法已经成功地应用于情感计算在中国网络语言37]。

如图5在图书馆的知识,我们构建了一个基于本体的语义词典的国际网络语言,其中包括读和不可读符号。情绪的表达模式等句子是由知识的模板和规则描述了常用的结构随着连词,副词和标点符号。

基于知识、情感计算可以进行整个消息可能包含一个或多个句子有额外的不可读符号。

4.3。智能计算方法

在网络语言情感计算的基本过程如图所示6。它包括以下四个步骤(5]:(1)第一步是关键字检索和句子分割。网络语言的信息将被划分为一个或多个句子可能额外不可读符号结构分析进行进一步的处理。汉语、英语和西班牙语在句子不同的模式,可以是结构化的检索关键字如连词、副词和标点符号。(2)第二步是情感符号的表达模式的分析和提取。在这一步中,每个句子分割需要分解成一系列单独的单词通过专用工具,如中文分词系统NLPIR [38]。以后,情绪的表达模式与额外的不可读符号分析句子,和所有的情感符号在信息提取是基于语义词典,结构模板和规则存储在库的知识。(3)第三步是分析计算。在这一步中,可读和不可读情感符号分别计算。为了反映人类认知过程中的动态情感特征,法律制定的符号,如闪光信号和视频信号,以及结构、颜色、和图形符号,计算和远程到主要的情感信息。语义文本符号计算到次要的情感信息。尤其是音频符号包含两个,正如本文之前所讨论的,它包含表征信息和语义信息。前者与声乐情感只能计算和LS-SRV估计量,已成功地应用于微信,QQ10]。后应首先转换成文本句子由语音识别工具,之后计算类似于文本符号。(4)最后一步是合成情感计算。结果分析计算的步骤以后将合成和调整的基础上,分析传统的表达模式,以达到更准确和全面的结果。动态情感特征的信息网络语言可能是由初级和二级情绪以及改变立场在文本的句子。

这个过程在图6可以实现的智能计算方法如图7

在拟议的方法,处理和计算任务被多重代理系统智能地完成。它包括一个监控代理,预处理剂,分析计算代理,和合成情感计算代理。有别于传统的情感计算,考虑神经认知的特点,我们的方法可以给初级和二级情绪,结果分别显示了它们的动态变化。这是进一步分析的重要情感通过社交媒体传播在网络空间39- - - - - -41]。

5。实验和结果

8是一个著名的西班牙报纸体育新闻报道的拉科》和读者在线评论。总有72评论这个消息(24]。一旦看到这个镜头,观众首先吸引的微笑的照片和视频新闻记者和生产主喜悦情感立即的主要情感。计算在网上评论后,我们得到情感的主要类型在不同位置的总评论文本,如图9的动态变化,反映了在线评论中次要的情感。

10感觉中国幸存者描述了1月1日,2015年,在3小时,逃离痛苦的上海外滩踩踏事件发生在二三35 12月31日,2014年,导致36人死亡,49人受伤。幸存者说:“今晚的外滩没有什么我可以想象由于拥挤和踩踏事故。我很幸运活了下来。我看到年轻的生命丧生在我面前,但我不能拯救他们。他们被放在担架,发送到我们一个接一个。我们尝试CPR,一个,两个,三个…直到我们都筋疲力尽了。穷人,希望120年,医院可以做一个更好的工作。感谢医务人员、外国人以及所有其他参与了救援工作。我们已经尽力了…(大声哭泣)。”

11显示板的情感值计算结果的描述。它代表了强大的复杂情绪强度及其变化,包括悲伤,绝望,无助,感恩的人参与救援。

6。结论和讨论

与互联网的快速发展和广泛应用,无处不在的网络,网络空间为人们提供了一个新的虚拟社会和方便生活和工作平台。以其惯常的符号系统和生动的表达模式,网络语言不仅作为沟通的工具,人们在网络空间中,也起着至关重要的作用在情感交流和情感传播以及社会心理学和行为在许多地区近年来已引起了高度重视。

由于开放、虚拟、动态语言环境,情感计算在网络语言需要一个系统性和跨学科研究。本文提出一个分类的情感符号在网络语言,提出了一种机制模型显示的主要神经活动的认知过程。此外,在分析情感的表达模式在中国的语言,英语,西班牙语,本文提出了情感计算智能方法在一个统一的网络语言垫的情感空间,可以处理多符号信息和混合情绪在网络信息和展示他们的动态变化的特点,神经认知过程。实验结果表明,该方法能达到的精度超过70%计算的文本和音频符号和象征的应用提供一种有效的方法很多舆论分析等领域,互联网营销、服务监控、反馈和社会应急管理。然而,其余的处理不可读符号必须在大多数情况下做出的主观评价。

在未来,网络语言的语言生态系统和新媒体技术将不断变化,不断更新。我们建议未来的研究可以从以下方面进行:(1)如何构建一个开放和动态更新知识图书馆协助情感计算应用智能监控和大数据挖掘技术;(2)如何建立更彻底地表达情感模式和提供统计基本参数的详细描述神经认知通过使用先进的实验观测技术;和(3)如何探索一个更有效的方法来计算不可读符号如法律制定的和结构性的符号。

利益冲突

作者宣称没有利益冲突有关的出版。

确认

本研究全面支持由中国国家自然科学基金(没有。91324010),中国的国家社会科学基金(14 bxw046),第二次定期会晤中国和塞尔维亚项目科学技术合作(没有。2-9/2013),上海决策咨询项目(2014 - gr - 55),上海哲学社会科学计划,中国(没有。2014 bgl022),四川省教育部门的科研基金项目(没有。15 sb0219)和项目四川音乐学院(CY2014173)。本文的研究工作是通过我们的跨学科团队基于以前的工作(5,7,9]。黄霜和宣周是这篇论文的共同第一作者。柯薛和Xiqiong Wan联合相应的作者。