文摘
复杂网络最近打开的新方法为研究语言的使用是如何影响心理表征的相似之处。本工作采用多路复用的框架词汇网络调查词汇检索从内存。重点是启动,即。,exposure to a given stimulus facilitating or inhibiting retrieval of a given lexical item. Supported by recent findings of network distance influencing lexical retrieval, the multiplex network approach tests how the layout of hundreds of thousands of word-word similarities in the mental lexicon can lead to priming effects on multiple combined semantic and phonological levels. Results provide quantitative evidence that phonological priming effects are encoded directly in the multiplex structure of the mental representation of words sharing phonemes either in their onsets (cohort priming) or at their ends (rhyme priming). By comparison with randomised null models, both cohort and rhyming effects are found to be emerging properties of the mental lexicon arising from its multiplexity. These priming effects are absent on individual layers but become prominent on the combined multiplex structure. The emergence of priming effects is displayed both when only semantic layers are considered, an approximated representation of the so-called semantic memory, and when semantics is enriched with phonological similarities, an approximated representation of the lexical-auditory nature of the mental lexicon. Multiplex lexical networks can account for connections between semantic and phonological information in the mental lexicon and hence represent a promising modelling route for shedding light on the interplay between multiple aspects of language and human cognition in synergy with experimental psycholinguistic data.
1。介绍
认知网络科学正在迅速上升与定量工具作为一个跨学科的领域探索心理学源自复杂网络(1- - - - - -4]。通过网络理论的视角,许多最近的研究调查的认知表示语言,系统通常称为心理词典(5和深深影响语言学习过程,如6- - - - - -10)、内存(11- - - - - -14],创造力[3,15),和语言认知障碍(下降16- - - - - -18]。必须强调这些研究只是一小部分的更广泛的文学精神从心理语言学词典5,19- - - - - -21]。
网络科学语言的科学家提供了定量的方法表示和分析结构心理词典中的词条(1,4,12,22]。例如,渗滤技术用于检测模式等概念的词confusability音韵学(12,22),语言学习策略在健康和临床人群的儿童(6,23),个人健康受试者的创造力水平的差异(3,11),或生产的差异在失语症患者(17,18)或阿尔茨海默病(24]。然而,上述研究只考虑一个方面语言建立相似的单词,例如,建立单层网络词语(只包括语音相似性12]。虽然这是有价值的调查集中在大尺度上单词成千上万的相似性如何影响过程,如词识别或背诵任务(12,13,25),人类的方式存储和记忆单词本身是multirelational [1,23,26]。多种类型的语义和语音之间的相似性词同时出现,他们可以竞争或以不同的方式帮助特定的语言过程1,5,27,28]。例如,一个最近的实证调查表明,幼儿同时利用单词的语音和语义特征在早期语言学习(23,29日]。
语音和语义关系也可以以不同的方式影响词汇检索。词汇检索是一组相关的认知过程和执行功能的识别一个特定的认知单元(例如,一个词)从语义记忆30.]随后给定的视觉或听觉输入(例如,给定单词听力或阅读)(15,31日- - - - - -33]。可能会导致所谓的概念相似之处启动现象,其中一个词项(主要)促进或抑制另一个词的检索(目标)5,32,34,35]。启动可以发生在不同的形式取决于如何处理'和目标(例如,visual-visual、auditory-auditory或交叉),包括知觉、语义或概念类型的相似之处'和目标(35]。使便利的语义启动时发生的一个目标词(如“鹰”)之前更快和更准确地处理当语义相关的刺激(例如,“鸽子”)比之前一个无关的词(如“假肢”)34]。实证研究表明,乐于助人的语义启动衰退更快地随着时间的推移,当的话单独处理相比,当单词在句子加工(35,36]。这个经验证据已经与之间的语义关联词语的丰富结构在一个句子35,36),表明word-word之间的正相关协会和facilitatory语义启动。另一方面,语义抑制或干扰发生主要通过视觉和知觉模式(35]。例如,忽略图片代表一个“狗”会产生后续放缓时应对“猫”这个词。
语义启动通常只考虑质数和目标属于同一个语义类别(例如,“鹰派”和“鸽派”两种类型的鸟类)。然而,单词可以在其他方面语义相关,这通常是捕获通过自由联想(例如,“床”和“枕头”往往提供自由协会在谈到卧室家具)。实际上,联想启动已被证明最关键的是取决于之间的时间的开始'和目标的开始35,37),也称为一个时间窗口刺激发病异步(SOA)。长之间的SOA主要目标对与较强的乐于助人的启动效应,而非伴生主要目标对抑制启动效应与独立的SOA。而不是利用分类、语义或共存相似之处,知觉启动取决于刺激的形式。发生类似的启动效应与语音的相似之处(28,38]。听到质数会导致容易词汇处理在语音相似的目标(28,35]。
抑制启动依赖机制限制访问特定的概念,以及这种抑制动态的调查仍是一个开放的挑战在相关文献[5,28,35]。使便利的启动是由网络模型来解释语义记忆的5,15,28,35,39,40使用扩散激活机制。尽管它的机制仍然是一个开放的挑战在神经心理学5,11),过去的努力已经成功地模仿语义记忆是一个复杂的网络为了获得有限但有意义的见解使便利的启动效应和词汇检索延迟在词识别任务(1,2,15,39,40]。柯林斯和Loftus代表语义记忆作为一种概念之间的网络链接放置共享功能的概念。给定的刺激激活时(例如,阅读“动物”这个词),然后许多词汇在语义层次的心理词典收到了部分激活,成正比的语义相关度刺激。激活遍布语义相似性和它随之而来,直到聚集在一个单一的目标,或多或少与刺激,然后检索。因此,词汇检索的一个项目是相对于一个网络节点收到一个收敛的激活在其连接。重要的是,激活可以覆盖远距离的传播时间,但强度下降。根据这一模型,目标词的检索是促进通过启动关闭或相邻的基本单词。此外,soa模型可以解释经验证据不再导致更强的乐于助人的启动(37)的激活积累超过给定的词项,导致更快和更准确的概念检索。
在柯林斯和Quillian的实验40),受试者被要求阅读和验证语句相关的两个概念,例如,金丝雀是一只鸟。参与者来验证语句的时间积极与相关概念之间的距离(如金丝雀和鸟类)的概念网络表示语义记忆(39,40),即。,the smallest number of semantic similarities connecting concepts. This represented preliminary evidence that network distance in semantic networks correlates with lexical retrieval patterns, although it was limited only to a rigid network structure encompassing only semantic features of words.
最近的方法模拟一个语义网络作为web的自由概念之间的关联(3,11,15),即。,relationships based on memory rather than on any strict definition of feature sharing. The importance of network distance for quantifying patterns of lexical retrieval was recently underlined in the recent work by Kenett et al. [15]。作者表明,成功在自由和线索回忆实验中急剧减少与增加之间的距离概念网络的自由联想。此外,网络距离预测成功召回远比主流心理语言学实验技术,如潜在语义分析(34]。网络距离也已被证明能够影响词汇检索当考虑语音网络。例如,最近的一项调查表明单词在短意味着网络距离更迅速承认在词汇决定任务14,25]。这些结果强烈表明认知优势处理概念网络的距离缩短。在词汇检索的扩散激活模型中,网络距离可能捕获扩散激活衰变在心理词典结构,进一步推动网络模型和网络的使用距离词汇检索的调查。
额外的经验证据表明,语音相似性可以减少命名延迟在图片命名任务中,被称为语音便利化产生影响(27]。这个证据包含了心理词汇的语音方面获得更精确的模型从听觉输入词汇检索。在听到一个词而不是阅读,最近工作提出了扩散激活机制包括单词语音相似性(12,41- - - - - -44]。在一个自下而上的过程,激活语音邻国之间的利差刺激然后向上在语义记忆,最终导致词识别和检索。
同意上面的方法,本研究采用假设心理词汇库封装不仅语言特征的单词(如他们的意思,他们的拼字法,音系学,等等),但他们的相似之处。然而,目前的调查建立在前面的网络词汇检索方法(14,15,25)通过考虑在相同的网络表示语义和语音之间的相似性单词通过多路复用的框架词汇网络(8- - - - - -10,16,45]。在多路复用词汇网络中,节点代表不同的文字和链接连接文字根据特定的网络层相似之处(8,9,45]。例如,Stella et al。8,10)使用多路复用的词汇联想网络层代表自由,共享语义特征,共存,和语音的相似之处,这成功地预测在幼儿早期词习得。多路复用的首次大规模应用词汇网络从斯特拉et al。9),一个成年人的心理词典被近似为四层的多层网络词的相似之处:自由联想,同义词,一概而论,语音的相似之处。通过数据驱动的方法,对词频相交许多大型数据集,收购的时代,具体性,和反应时间在词汇识别任务,作者确定了多元核心词汇,一组词相互紧密联系,突然出现在规范发展年龄8岁左右。这个核心使整个复合词汇网络非常有弹性的认知障碍模型作为进步的随机字删除。采用多路复用词汇网络也在临床失语症患者人口,揭示了多元结构预测正确的图片命名的重要性(16]。
本文采用多路复用词汇网络学习词汇检索两个特定的语音模式启动:队列启动和押韵启动。这个词队列启动来自群理论,理论的词汇检索Marslen-Wilson和他的同事们(31日]。当听到讲话,第一个音素听到“激活”每一个字在词典音素在访问阶段,导致“群单词”。例如,听力信仰最初从音素激活所有单词/ b /,导致一个非常大的可能的单词。作为下一个音素是听到,群体进一步限制,在这种情况下,单词开始/ bI /等等,音位的音位。随着越来越多的音素,越来越少的单词被发现等候选人,直到达到一个识别点,只有一个词被激活(31日,33]。这也被称为识别点孤立点或独特点(31日]。队列理论假定人群的一个相当严格的定义,它不考虑词汇的影响由于word-word相似性的结构在听到输入(例如,短语上下文)或在心理词典33]。然而,实证研究已经证实,一个词的最初部分激活类似声音识别和竞争,更重要的是,更快地识别当启动词在同一队列(31日,33,46]。这facilitatory队列启动影响检测,以防质数是英语单词或非言词分享与目标(前三个音素46),支持激活词汇项的假设基于他们最初的语音结构。注意,同时激活词汇项对应不仅facilitatory启动效应,而且词汇区别竞争同一组(47]。没有启动,在词识别任务的目标更大的群组研究中被发现被准确地低于目标小群(47]。然而,这种竞争效应消失当的话在一个上下文(短语28),这表明单词提取了句子的语义和语法功能可以与群组结构和交互影响词汇检索词人群。上述实验结果激励进一步调查的群体启动效应也与心理词汇的语义和语法水平。
押韵启动类似于群启动,分享音素的话能增加facilitatory年底启动效应(46]。根据启动效应的相关文献,质数押韵与目标导致更短和更准确的词汇检索相比nonrhyming质数(46]。类似的押韵便利化词汇决定现实的目标也被发现在迟滞型失语症患者48]。押韵启动也有有利影响的背诵单词(49),尤其是年幼的孩子(38]。实证研究表明,这种类型的启动是弱于群组启动但仍然存在在词汇检索(49]。当前的队列调查和押韵启动大大不同于以前的分析队列和押韵启动。这里,通过假设的网络表示心理词汇的语义和语音子组件,主要目的是检测队列和押韵启动效应在成千上万的单词的结构通过直接利用数十数千word-word相似性的不同类型而不是直接测试只有数量有限的话说,在以往实验(31日,33,38,49]。这种多路网络的方法有三个主要优点:(i)它可以量化语义或语音层主要是参与潜在启动效应;(2)它可以占任何潜在的相互作用和非线性效应在启动因结合语义和语音,一个常被忽视的在之前的相互作用网络的研究;(3)它可以在大范围内进行,测试一个样品的话到两个数量级大于在以前的实验(47]。
2。方法和模型
本节提供的信息(我)建设的多路复用词汇网络,(2)语言使用数据集,(3)采用的网络指标及其心理语言学的解释,及(iv)零模型作为参考。
2.1。多路复用词汇网络的建设
成人英语的心理词汇表示成一个多路复用词汇网络包括8546个单词连接在四网络层,类似于以前的方法(9,16]。层已选中听觉输入(根据扩散激活模型12,18,21,41,42),语言处理最先发生在子组件包含单词和语音信息随后在语义记忆。因此,为了结合多路选择词汇网络语言的语音和语义方面。更详细,语音信息是由一层语音的相似之处(4,22),字是连接如果他们不同的添加/替换/删除一个音素,例如,“猫”将被连接到“出租车”,因为上述操作声音相似的定义。注意,其他模式的声音相似不直接被这个指标(例如,“猫”和“棒子”,相距2音素替换)。语义记忆信息封装在三个不同的层次:(我)重叠的意义是封装在一层同义词,哪里的话连接如果他们能有相同的意义,例如,“有意义”和“深刻”有相同的含义(2)语言层次的概念是一概而论的封装在一层,连接的话如果他们属于一个更具体或更一般的语义类别,例如,“鸽子”是一种“鸟”(3)大部分剩余的之间的语义相似性的话封装在一层经验自由协会、地方的话连接如果他们相关的参与者在一个自由联想的任务,例如,“床”提醒参与者的“睡眠”
重要的是强调,自由联想,一概而论,同义词,语音的相似之处都发现深深影响词汇检索在几个独立研究(1,2,12,44,50),因此将它们包含在当前调查的重要性。自由联想网络建成的子图爱丁堡联想词典(50]。同义词、概括,根据数据集语音网络建成由Wolfram研究和基于WordNet 3.0 (51]。所有的层都为无向简单治疗,也没有与层之间的转换被认为是相关成本,类似于以前的研究在相关文献[8,15,16]。词频率等特性得到从大规模存储库Opensubtitles [52),计算词频率字幕的电视剧和电影。
报道在图1,由此产生的多路网络代表了edge-coloured图(53,54]。同一组的节点复制每一层,但不同类型/颜色的链接节点之间可以存在,每个颜色对应于一个特定的层。在这个结构,层间的转换所允许的副本的节点之间的过渡。多路复用结构显著改变布局相似的单词。单词断开连接的上一层可能是高度连接和中央对整个复合结构,比如“说”一概而论,在整个多元词法层网络(见图1)。
模拟多路复用词汇网络的不平衡有三个语义层只有一个音位层是由于(i)的相对重要性区分不同的语义方面的词汇(例如,同义词不同分类关系)和(2)的相对困难考虑声音相似的措施,提供更多的信息比语音相似性的定义采用这项工作(cf。4])。然而,应该注意的是,自由联想层重叠超过随机期望语音相似的层(8协会),表明层并不是纯粹的语义但它也包含一些语音信息。这减少了语义和语音之间的不平衡选择表示。尽管如此,以前相似的结果(9]表明,自由联想的层还包含word-word相似的模式,更类似于编码的同义词和概括层而不是语音层。目前分析,自由联想层被认为是一个语义层,兼容以前的研究认为[什么2,3,15,55]。
2.2。测试队列理论
根据队列模型,词汇检索当孤立点(见介绍),对应于峰值时间失活(31日,33]。音素听到前高峰时间确定这个词的出现,因此,在这个词的字数的队列。而每个单词的高峰时间可能会改变根据其上下文,经验证据表明,一个词的平均峰值时间大约是200 ms从当这个词变得明显31日)和对应信息的第一个3或4音素(这个词28,33]。请注意,上面的数字代表平均估计,由于音素发生的数量在200 ms窗口可以随音素类型(例如,停止对摩擦音与鼻音)。因为在当前数据集考虑发作4音素导致了非常小的群体,重点转移发作3音素,测试也在先前的研究46]。对于每一个出现在当前数据集,一群单词。为了减少由于小样本系统误差大小的程度,只有军团有超过10个词被认为是。这导致了选择的2526字多路复用词汇网络。选择的话分为99群平均大小30±10个单词。
2.3。测试押韵启动
严格定义像只考虑词语的重叠在音素在过去的位置不能捕捉押韵的各种模式在英语49]。押韵不仅取决于音位结构还有其他功能,如压力。为了克服这个问题,在线押韵的字典RhymeZone用于选择押韵词(组56]。RhymeZone部分基于WordNet [51),但它也富含额外的数据引用和歌词。完整的RhymeZone语料库包括语义和语音信息1061多近1900万字字典;因此,它代表了一个大规模的和反复核对当前英语中押韵的来源。当前的分析集中在真正的押韵。,words with identical sounds after a stressed vowel. Homophones, different words having exactly the same phonemes, were not considered as rhyming words. According to this choice, 2247 rhyming words were selected from the multiplex lexical network. Selected words were subdivided into 51 rhyme classes (e.g., all words rhyming with “authorisation”), of average size 40 ± 10 words. In order to reduce the extent of systematic errors due to small sample sizes, only classes with more than 10 words were considered.
2.4。网络指标
在许多关于词汇检索近期调查表明在心理词汇的语义和语音子组件,亲缘网络距离是一个可靠的代理词是词汇检索的预测3,11,15,57]。网络的距离节点之间我和j在一个给定的网络被定义为最短的连接的链接数我和j(58]。在这种情况下,没有道路连接我和j,那么节点我和j据说断开和被认为是等于∞。报道在图1多路复用词汇网络,路径可以链接不同层/颜色。因此,可能会有额外的非平凡的“多元”路径新兴的多元结构,所以网络两个单词之间的距离可以大大不同于任何个体层网络之间的距离同样的话对整个多路网络。例如,床上和睡眠可能在语音层断开但在自由联想层连接。这丰富的网络距离的多路复用网络行为代表了语音和语义之间的相互作用方面的心理词典。注意到整个多路复用词汇网络是完全连接的De Domenico et al。54),即。,there is always a multiplex path connecting any two words when transitions across layers are allowed. However, individual layers are not fully connected, so that some words might be disconnected and hence correspond to a divergent distance 。为了克服这一问题的无限距离,亲密的节点我和j(58),即网络的逆距离: 在哪里 当我和j断开连接。考虑到网络的逆距离摆脱分歧,这样平均有限距离的估计计算。在分析个人提供网络层可能会断开连接,一个有效的代理中央的亲密的分布是由意味着58]: 从0(所有节点都已断开连接的)到1(所有节点都彼此相邻)。代表所有节点对的调和平均数的距离在一个给定的网络,衡量也称为效率(58]。请注意,类似但不等同于亲密中心吗 ,的算术平均值距离的节点对(比较[58])。在断开网络,亲密的谐波的意思是一个更好的估计量比算术平均值;因此,在下面,采用估算距离是多路复用词汇网络词汇。我们假设质数和目标,更接近网络拓扑处理更快更准确地比言语更大网络距离,根据最近的实证研究支持(15,25,57]。计算亲密的话中特定的子集:(i)在相同的队列和(2)拥有相同的韵(即。,组成一个押韵类)。
2.5。零模型
量化的平均亲密的话在军团和韵类需要一个合适的零模型比较和统计测试。由于语音信息是重要的定义两个组别和押韵,考虑随机一大堆单词满足约束在语音层面是一个直观的选择。作为一个可行的方法,随机队列/韵类是由随机抽样实际的话至少分享米音素在任何位置。连续和nonconsecutive共享音素都要考虑,因为限制零模型只考虑连续重叠的音素以外的开始/结束导致样本容量问题,例如,太少的话与军团和韵类统计比较。随机队列/原始的类具有相同的大小。军团,米等于,因为在手术的定义组发作被定义为拥有相同的前三个音素由于平均峰值时间。押韵,米介于2和4之间;适当的值计算通过计算数量的音素韵类中所有的字有结束。相同的米音素定义队列/类用于建立随机。例如,考虑队列“信仰”,“属于”,“被爱”,……由音素/ b /, /我/ / l /。一个随机队列将包括单词分享这些音素但在发病位置不同,例如,“汽车”,“取消”、“装配”,....保留音素的身份是很重要的,因为不同的音素可能导致语音意识的差异和影响词汇处理(20.]。
随机列表上的语音约束保证相同的音素都出现在原始人群/韵类但是在职位不同于这个词的开始/结束。因此,考虑零模型允许我们测试如何音素序列的开始和结束时单词影响词汇加工的复合结构。因此,拟议的方法调查到什么程度影城词汇网络是集群onset-sharing非随机的结构化和rhyme-sharing的话。这一目标,个别音素序列差异平均跨组/韵类和执行统计测试之间的平均亲密同伴/韵类和随机期望从上面的零模型。非参数统计测试,具体测试,标志采用为了获得结果强劲违反常态由于样本量低军团或韵类。层的自由联想,同义词,一概而论,平均亲密词人群的分布和韵类被发现违反常态(Kolmogorov-Smirnov测试,D >0。08年, )在0.05显著性水平。
与零模型还支持一个测试是否潜在差异群体之间的亲密/押韵和随机列表可以解释通过各个方面的语言或它们之间的相互作用,例如,语音和语义和语义的不同方面。这是通过计算机网络来实现距离个人层次和整个多路网络分别表示。然后比较这些结果与另一组零模型的网络层链接是随机的。在每个随机层,单词具有相同数量的连接在相应的实证层但连接精致均匀随机。因此,随机重新保存程度分布上的文字层。因为同一个词可以有不同程度在不同的层9),那么不同的中枢空模型必须采用多路网络的不同层次。这些零模型也称为配置模型在网络文学(59),他们保持总word-word相似单词的数量(即。,nodes degrees) and also the heterogeneity in the number of similarities individual words can have (i.e., degree heterogeneity). Randomly rewiring every individual layer is expected to disrupt both intralayer correlations between nodes and interlayer correlations between links. Therefore, configuration models allow quantifying to what extent differences in closeness between cohorts/rhyme classes and random lists of words are due to either global patterns of network structure (which are disrupted by random rewiring) or just by heterogeneity in link allocation (which is fixed even under random rewiring).
3所示。结果
研究的结果发表在两个阶段。首先,从语言的角度采用表示的适用性(考虑词频)和从网络视角报道。队列和押韵然后对启动效应进行分析利用网络距离,通过考虑特定零模型作为对比参考。
3.1。多路复用的相关词汇表示
选择的心理词汇的多路网络表示由层包括心理词汇的语义和语音方面相关的文献中关于词汇检索(见方法)。然而,这个结构需要进一步的验证,因为它必须:(i)对应于常用的单词,而且(2)对应于一个结构,不能进一步聚合,即。、网络层应该显示不同的词相似为了进一步激励模式的选择考虑他们作为独立的复合层。
图2报告的频率字多路网络词汇和参考数据集从Opensubtitles52]。的概率和频率高于10是一个多路网络的数量级比整个Opensubtitles数据集。影城词汇网络是丰富的常用词汇与电影中使用的语言相比,它也可以包含更具体和更少的频繁的词语(如特定的术语、地理名称,等等)。此外,多元网络词汇中的词是最频繁的单词一样频繁Opensubtitles(见参考找到词的概率与频率高于103在图2)。基于这些结果,得出的结论是,词频、影城词汇网络包括常用单词和代表最常见的语义和英语口语的语音特征。
保持自由的选择关联,同义词,一概而论,和支持语音相似性作为独立结构可约性分析,一种entropy-based技术建立时丢失的信息网络路径层聚合在一个给定的多路网络(见De Domenico et al。60技术细节)。类似于以前的调查与多路复用词汇网络基于其他数据集8,45),目前的研究中使用的复合词汇网络(cf。9])是不可约的。换句话说,大量的模式word-word相似之处可能会丢失,以防任何两个或两个以上层的复合词汇网络只投射到一层。自由联想层相比,也发现不同的概括,同义词和语音的相似之处,因此,它不应该结合这些三层。这一发现证实了考虑层代表心理词典的不同方面,应作为截然不同。
总之,频率分析表明,研究了多路复用词汇网络一样丰富的常用英语单词和贫穷的更频繁的词汇项目相比Opensubtitle措辞更大的样本,其中包括5·105词汇项目,目前英语口语的代表。不可约性分析是另一个重要的元素,因为它激励的选择方面的考虑语义和语音通过多路独立层网络。因此,频率和结构的可约性分析确定的多路复用词汇表示调查模式的适用性心理词典的英语。
3.2。多路复用词汇网络识别组启动
报道介绍,使便利的语义关联,和语音启动效应解释为激活扩散模型在网络短路径word-word相似的心理词典(35,37,39,41]。也有更多的证据表明,抑制语义启动取决于距离的概念语义网络(61年]。此外,最近的研究证实了(15,25,57),亲密是一个可靠的估计量的词汇加工的效率;近词在语义和语音网络检索往往是更快和更准确地比文字之间的距离。
图3(一个)比较亲密的中位数军团(橙色酒吧)和随机列表(蓝色酒吧)对个人层和在整个多元结构。误差线指示误差平均利润率。在显著性水平α= 0。05,单词在队列和单词之间的差异接近零模型不是统计学意义的自由联想层(信号测试,n+= 52岁 同义词层(上)和信号测试,n+= 56, )。统计上显著的差异是观察到的一概而论层(信号测试,n+= 72, ),在语音层(信号测试,n+= 63, )。找到一个统计上的显著差异也在整个多元结构(信号测试,n+= 73, )。
(一)
(b)
词群发现平均小于随机期望在特定层,表明存在认知影响在处理他们在一起,因此启动效应。观察在语音层的差距可以归因于一种趋势相同的单词组坚持相同的连接组件。事实上,较低的反网络距离/零模型的亲密关系的碎片语音网络(cf。22),这样的话在同一队列可以有零个亲密,这最终会降低平均亲密得分。因此,尽管这两种语音链接和军团是基于语音的相似之处,观察到的经验差距和随机平均亲密的话表明集群的军团在同一连接组件的多路复用词汇网络。有趣的是,还军团在概括层比随机更接近期望。军团是基于词形式提供,这个集群在语义层可能form-meaning相关的结果,这种现象称为form-meaning nonarbitrariness和实证追踪用英语和许多其他语言62年]。缺口的大小接近发现多路网络和一概而论,语音层不与队列的大小(Kendallτ ,值> 0。4)。这直接分析是基于成千上万字的布局相似之处多路复用词汇网络常用口语的代表。
注意军团之间的亲密和随机列表仍然存在的差异也当语音层是不包括在分析中。这是一个效应引起的非线性组合的最短路径多元化结构。在个人层次(自由联想和同义词),没有统计差异时一起考虑时一概而论,结果显示一个多路复用表示更高的亲密词群而不是随机列表(信号测试,n+= 71, )。重要的是,这种差异并不是由于一概而论。不同人群之间的亲密和随机期望产生多路网络中也只有自由联想和同义词为网络层(信号测试,n+= 69, )。虽然个别层不显示队列启动的迹象,影城词汇网络结构。由于模型中所有层除了语音一个代表语义记忆,这一发现表明群体启动不仅仅是由于合并后的语音还存在语义方面的英语。
当网络连接重新随机配置模型(见方法),亲密的差异消失在所有个体层。图3 (b)报道经验的平均亲密同伴随机网络结构。层的信号测试得到以下结果:n+= 52岁 免费的关联,n+= 55, 为同义词,n+= 53岁 一概而论,n+= 60, 对语音的相似之处。上述结果表明,亲密表达的认知优势(14,15,25)取决于个人的全球结构层的异质性,而不是分配相似的词可能在每一层单独考虑(例如,异质性对语音社区大小在语音层、员工数量,等等)。在配置模型,然而,即使在军团比随机更接近期望在整个多元结构(信号测试,n+= 63, )。在整个多元结构,个别层的异质性程度被组合在一起,以便保护程度相关性跨层最终仍然会导致队列启动效应的痕迹。这一发现表明,异质性程度决定了可用性词在同一队列之间的捷径。它还进一步表明,启动出现多元组合的语言的不同方面。
3.3。多路复用词汇网络标识押韵启动
与同伴一样,比较平均亲密的词的押韵类对一个词从随机列表执行(见方法)。
图4(一)比较亲密的中位数在韵类(橙色酒吧)和随机列表(蓝色酒吧)对个人层和在整个多元结构。误差线指示误差平均利润率。在显著性水平α= 0。05,单词之间的亲密感的差异在韵类和单词零模型不是统计学意义只在自由联想层(信号测试,n+= 30, )。统计上显著的差异是观察到的同义词层(信号测试,n+= 42岁 ),一概而论层(信号测试,n+= 36, ),和语音层(信号测试,n+= 41岁 )。找到一个统计上的显著差异也在整个多元结构(信号测试,n+= 42岁 )。
(一)
(b)
类似于群韵类词汇的平均小于随机期望,表明认知优势(14,15,25在处理一起,因此启动效应。更多的细节,这个结构显示在词汇加工的认知优势,假设认知是由类似的网络结构和基于词汇相似的假设。的大小差距韵类之间的亲密和随机期望不与班级规模(Kendallτ ,值> 0。5)。
有趣的是,押韵启动持续在一个层组启动。同义词的层不显示启动而是押韵启动特性。也注意到押韵启动持续在语义记忆的结构由自由协会、同义词,一概而论(信号测试,n+= 37岁 ),再次表明多元语言的个体之间的相互作用方面可以提供证据的启动效应可能部分缺席时分别考虑这些方面。
当网络连接重新随机配置模型(见方法),亲密的差异消失在所有个体层。图3 (b)报道经验的平均亲密同伴随机网络结构。层的信号测试得到以下结果:n+= 32, 免费的关联,n+= 32, 为同义词,n+= 29, 一概而论,n+= 33岁 对语音的相似之处。即使在配置模型,话说在韵类比随机期望更接近整个复合结构(信号测试,n+= 35, )。类似于与同伴发生了什么,这一结果表明学位个别层的异构性问题得到组合在一起并提供快捷键押韵的词,仍然与押韵启动效应。必须强调,在配置模型重新布线是随机但总是受制于学位,所以一些网络上的中心-外围结构诱导程度分布仍然可以目前即使在随机的链接。这里,随机重新布线不扰乱捷径rhyme-class单词中相同。这表明异质性的程度的分配word-word相似性和多元化的组合层都是重要的因素来决定押韵(群)启动。
注意单词的亲密是低的语音网络与其他网络层组和韵类。这表明词群/韵类更倾向于集群在语义层而不是语音层,即使认为词是相对于语音启动组。这种差异兼容的音位层包括单词的平均六个音素,所以,即使单词平均分享三个音素发作或在他们可能没有编辑距离等于1,因此他们可能不是相互连接。此外,语音层断开明显多于其他语义层(cf。9,22]),因此较低的亲密可能是因为单词在不同的语音网络连接组件。注意,如果词聚类的结果语音层的定义,然后随机选择的单词应该聚类相似程度相比在军团和韵类单词。相反,亲密差距在语音层的存在表明,单词在军团和韵类属于同一音位层的连接组件。
4所示。讨论
通过多路复用的框架词汇网络,本文提供了一个优雅的模型来解释和预测潜在的认知优势(14,15,25在处理一起共享同一发作或押韵。对零模型比较表明,这些启动效应可以被探测到,但不仅限于,word-word相似性的结构水平当多个来源的语言关系集成在一起,而不是间接测量延迟在实验室的任务。这个分析报告的结果与以前的工作在启动心理语言学文学小说和开放造型挑战通过复杂网络调查的启动。
首先,语音启动模式的持久性也语音层以外的额外确认nonarbitrariness语言的form-to-meaning通讯(5,62年爆发)(例如,英语单词分享“sn -”表达相关的主要概念“鼻子”)。对于一个给定的语言,nonarbitrariness指声音模式之间的统计关系的存在和语义的使用类的单词。此系统性对应facilitatory影响早期词的学习(62年),即。,children learning words more accurately when spotting systematic and language-specific relations between form and semantic category. The result of phonological priming effects arising also from the combination of hundreds of thousands of semantic, multiplex word-word similarities provides quantitative and large-scale evidence of a非随机语义的语言组织受到语音规律,如出现共享或押韵。
重要的是要强调群体和押韵启动效应一直被发现和研究在实验心理学31日,33,38,49),尽管证据对他们来说是只基于小样本与内存相关的成百上千的单词被测试任务。当前方法的新颖性是直接基于成千上万的大型结构word-word相似性在成千上万的常用英语单词相关的跨语言的语义和语音方面。因此当前网络的方法是不同于从心理语言学实验设置;在网络范式尺度和测试成千上万的单词在一个相当简单的方法相比,所需的时间和精力在实验处理对象。同时,依靠网络表示实验,但是一旦建立,网络可以用于测试各种各样的推测。例如,同样的网络自由协会已经多次用于检测模式的学习(7- - - - - -9),确定个人的创造性水平(2,3,11),甚至预测词生产临床人群(16]。增加采用复杂网络模型的认知科学是有益的量化大规模语言使用和习得模式,主要是因为高通用性的网络模型(4,6,11,17,55]。它还必须强调网络表示承担一些假设和他们的确是复杂系统的近似表示。例如,多路复用词汇网络权重假设所有的链接都一样,总是随着时间的推移,但这可能不是在一个结构的动态心理词典(5]。理解程度的方法是有价值的网络总是需要与经验证据,通常由小规模的实验研究。之间的协同理论网络模型和实验心理语言学数据表示为未来的尖端研究有价值的组合,可能由最近的可用性更有吸引力更大的数字全集和大规模在线心理语言学数据集像Opensubtitles52]。
网络方法必须与实验数据协同工作和更具体的实验设置为了回答揭示了网络结构的挑战。一个重要的例子是归因facilitatory或抑制自然亲近的差距确定在当前调查。事实上,较短的距离在军团或韵类单词也意味着更高的词语之间的竞争水平,因此有抑制,而不是facilitatory影响字(词)处理技术(28,38,46]。但是,先前的实验研究发现,群体竞争效应更强更大的群组研究中(28,38]:更多的单词被激活竞争效应越强。这种竞争也出现在语音和语义层次,这导致性能慢词汇决定任务。在目前的调查,这两个小的(即。,包括20字)和更大的(即。,comprising 100 words) cohorts consistently displayed the same priming patterns reported in the manuscript. Differently put, words in cohorts are always closer than random expectation on the multiplex lexical structure and this gap is independent of cohort size. Since competition effects are size-dependent [28,47]虽然启动效应不46),这一发现可能是一个重要的暗示的最短路径长度的差异中找到这个工作代表主要启动效应,而不是词汇的竞争。评估facilitatory或抑制这些启动模式的本质需要额外的经验数据和代表了一个有趣的未来研究方向。
注意队列启动并不是唯一影响驾驶词汇检索。队列模型忽略了语言句法结构的重要方面,它可以大大改变访问语义记忆(3,11,33]。最近,来自认知神经科学实验表明,群体效果和单独处理词汇水平存在竞争而竞争不在的话听见短句子(28]。同时,语义信息辅助语言的歧视过程在更大的群组研究中47]。群竞争效应的消失在句子或语义信息的存在表明,相似词和句法结构都是非常重要的在推动激活特定的目标词,因此最终facilitatory,而不是抑制,影响词汇检索。虽然不能完全重合,从句子同样丰富的语义信息,采用多路复用表示不考虑作为断开连接单元单词,而是提供关于词上下文信息也通过相似之处,例如,“玩”和“行为”之间的联系代表戏剧戏剧和之间的联系的背景下“玩”和“足球”表示游戏的背景。因此,先前发现的上下文(28)和语义词相似之处(47)减少lexico-phonological竞争可能代表一个额外的迹象表明这次调查中发现的模式facilitatory而不是抑制。还需要注意的是,在相关文献中有强有力的证据facilitatory启动积极与相关概念关系(35- - - - - -37并对抑制启动主要由忽略不相关的概念(5,35,61年]。结合这个文学和最近的研究表明距离较短的网络是一个有效的代理更紧密的概念相似度(15,57]进一步表明,启动效应检测到多元结构主要是facilitatory。这是与之前的实验协议还特别关注语音启动,表明群体效应促进单词背诵31日,33,46]虽然押韵促进语音意识,特别是在儿童(38]。为了充分地址模式的本质所反映出的多元结构、心理语言学实验涉及队列/押韵词分析这次调查将是一个重要的未来的研究方向。通过考虑反应时间在词汇决定任务中,这将是有趣的理解如果有任何临界阈值亲密以上词法竞争可能克服便利,例如,词汇条目被如此之近,他们可以被混淆,从而抑制检索正确的项目。另一个有趣的研究方向将在队列关联亲密差距竞争效应启动相互作用产生的特定单词后缀,可以抑制另一个(63年]。
从网络的角度来看,目前的调查提供了额外的经验证据,多元网络可以突出现象无法检测到单层网络。事实上,对于两个组别和韵类,个别层并不总是显示启动效应,而获得的多路网络结合在一起这些层总是强调在统计上有显著差异的网络距离。通过假设这些差异表明认知便利化一起处理的话,许多最近的研究显示[15,25,57),那么上述定量结果表明队列和押韵启动可以来自要么语义记忆的不同方面之间的相互作用(例如,同义词和自由联想)或整个心理词汇的不同方面之间的相互作用(例如,语音相似性和自由联想)。更详细,假设词汇检索由多层网络结构影响的心理词典,语音启动效应可能会采用多路复用的一种自然属性表示的词汇,因为它来自多个词汇在语言的不同方面之间的交互。
注意,军团之间的差距接近/韵类和随机期望经验多路网络几乎是一个数量级大于多路网络随机重组,包含随机单词之间的联系。这表明检测到亲密的缺口主要是由于word-word相似性在现实的经验结构层而不是相结合的行为层,。还需要注意的是,目前的调查不能提供任何因果联系,由于结构本身是无法完全确定启动模式中发现文学的本质,因为这些模式深受词汇检索的其他方面,如关注(35)、形态(28,36],'和目标之间的时间(37]。通过实验解决当前打开的挑战多路网络调查启动也需要更彻底的调查启动影响因素超出了心理词汇库结构,如不同刺激发病异步决定的力量积极启动(35,37)或不同的模式影响的程度-语义启动(35]。这丰富多样的启动模式强调了进一步多层建模工作的重要性与语言任务的启动效应的理解。
原始队列模型的一个限制是它忽视了对词汇语义检索的影响感知任务(31日,41),一个元素更精致的模型中考虑的字(词)处理技术(41,43)也证实了通过实验研究(28]。有趣的是,这一事实自由协会显示显著差距亲密押韵而不是群体可能是音素的不同位置的结果。依靠过去的音素将允许时间正在发生,在此期间的第一部分将获得这个词和它的一些语义特征将用于处理,可用特性,不能当第一个音素是听到。这种差异使发现在押韵启动有一个亲密的差距也在自由联想,一个缺口,当军团被视为缺席。这种定量差异表明,押韵启动更深受语义信息队列启动。
多路复用的方法的局限性是它没有考虑个体差异。预计为词汇检索等个人因素也影响流动智力或其他活动认知搜索策略(28,42,43]。甚至创造力水平最近深深影响词汇检索和显示单词识别健康人群(3,11,55]。克服这个限制可以替换的一种可能的自由联想的层与其他实证层,总是自由协会但从属于一个特定的人口,比如非常有创造力的人。之前的研究表明,更有创造力的人往往会认为语义无关的概念(3,11,55),所以新的快捷键可能出现在自由联想层。这些路径可能会改变结果发现在当前调查规范科目。考虑其他特设层自由协会也可能是一个有价值的研究方向模型为了将老化的通性。最近的研究表明,随着时间的推移,心理词汇经历了一些实质性的变化和word-word相似性迷路(19),所以可能会改变快捷键连接词群或韵类。预计减少启动效应随着年龄的增长,特别是由于押韵的经验已经证明降低强度从童年到成年38]。
同时,调查临床人群为未来的研究可能是有趣的17,24]。以防队列和韵类的快捷键允许弹性进步的话在失语症患者失败,这些word-word协会可用于设计策略的干预恢复或修复心理词典的功能。多路复用词汇网络的框架已经应用于临床人群与失语症(16),这表明,词与失语症受试者的生产至关重要的是取决于语言的亲密的多路复用词法结构。与更高的亲密中心在图片命名任务相比,更容易发音单词较低的亲密。调查潜在的区别词群/韵类和特定零模型将是一个有趣的研究方向。
总之,多路复用词汇网络代表了一个强大的心理语言学模式的定量调查框架在不同语言的语义和语音方面之间的相互作用有关。这些语言的多元结构网络打开新的大规模的重要挑战的理解认知过程驱动语言的用法。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称没有利益冲突。
确认
作者承认Nichol卡斯特罗的洞察力的讨论和建设性的反馈概念和风格方面的手稿。作者也承认马库斯刺绣和Manlio De Domenico刺激讨论这项工作的早期阶段。硕士是由EPSRC支持格兰特博士训练中心(EP / G03690X / 1)。