复杂性 复杂性 1099 - 0526 1076 - 2787 Hindawi 10.1155 / 2017/5785617 5785617 研究文章 小说过程测量语义的协同作用 http://orcid.org/0000 - 0002 - 3920 - 0355 纽曼 实验后 纽曼 Yiftach 科恩 戈麦斯 塞吉奥 以色列内盖夫的本-古里安大学 84105年比尔 以色列 bgu.ac.il 2017年 15 1 2017年 2017年 08年 09年 2016年 03 11 2016年 05年 12 2016年 15 1 2017年 2017年 版权©2017 Yair纽曼et al。 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

一些复杂系统的一个有趣的特点是宏观层面的形成结构视为有特性,无法减少微观层面成分。这种特性被认为是协同作用的联合行动的表达选民产生独特的特性不可约组分分离的行为或简单的成分。描述复杂系统协同作用,已经承认但难以概念化和量化的上下文中计算各种语言的新兴意义和概念结构。在本文中,我们提出一种新颖的测量/过程量化语义的协同作用。这种方法利用一个通用的协同作用,提出了生物学。我们验证这种方法通过提供证据的能力预测语言的语义透明性的化合物(实验<我nl我ne- - - - - -formula> 1 名词)和抽象性评级(实验<我nl我ne- - - - - -formula> 2 )。

1。介绍</t我tle> <p>一些复杂系统的一个有趣的特点是宏观层面的形成结构视为有特性,无法减少微观层面成分。例如,我们认为水“湿”,而“湿润”并不描述氢气或氧气分子水是由。相同的新兴行为是明显的自然语言,词的意义的化合物,如热狗、不能非常减少到他们的选民或/和组合性的意义。这可能被认为是表达的特征<我t一个l我c> 协同作用</我t一个l我c>的联合行动成分产生独特的特性不可约组分分离的行为或简单的成分。</p> <p>各种措施的协同开发自然科学(例如,<xref ref-type="bibr" rid="B1"> 1</xref>- - - - - -<xref ref-type="bibr" rid="B3"> 3</xref>)(全面审查,看<xref ref-type="bibr" rid="B4"> 4</xref>])。他们中的大多数只依靠互信息的概念,为缩影,例如,通过分解框架开发的信息(<xref ref-type="bibr" rid="B3"> 3</xref>]。然而,没有一个同意的协同作用,是重要的应用协同的各种措施,这依赖于互信息,“语义”上下文。换句话说,协同作用,描述复杂系统已经被承认,但难以概念化和量化计算新兴的上下文中<我t一个l我c> 意义</我t一个l我c>各种语言和概念的结构。我们不熟悉任何纸语义结构的协同作用,这里描述为“语义的协同作用,”科学测量。</p> <p>在本文中,我们提出一种新颖的测量/过程量化语义的协同作用。这种方法利用一个通用的协同作用,提出了生物学。我们验证这种方法通过提供证据的能力预测语言的语义透明性的化合物(实验<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M3"> <mml:mrow> <mml:mn> 1</mml:mn> </mml:mrow> </mml:math> </inline-formula>名词)和抽象性评级(实验<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M4"> <mml:mrow> <mml:mn> 2</mml:mn> </mml:mrow> </mml:math> </inline-formula>)。为了清晰起见,我们首先解释和说明语义协同的意义,然后介绍了测量和测试它。相关性的措施是为人们从社会科学和人文学科,他不一定有信息理论的背景下,一直在努力提供一个清晰的博览会的主要想法通过几个固有的例子。</p> </sec> <sec id="sec2"> <title>2。语义的协同作用和化合物</t我tle> <p>引入语义协同的概念,我们使用语言的例子的化合物。语言化合物时形成两个或两个以上的单词,或者更确切地说“词位,”加入产生一个新词。复合句不是边际词汇的语言元素,并认为复合的第一个过程,伴随着语言的出现(<xref ref-type="bibr" rid="B5"> 5</xref>,1页)。</p> <p>程度的成分导致化合物的意义讨论的标题下<我t一个l我c> 语义透明性</我t一个l我c>(<xref ref-type="bibr" rid="B6"> 6</xref>- - - - - -<xref ref-type="bibr" rid="B9"> 9</xref>]。例如,海鲜是一个高度透明的化合物作为大海和食物有助于它的意义。毕竟,海鲜食物,我们从大海。相比之下,狗这个词似乎有点有助于理解这个词的意思复合热狗,除非人能理解之间的视觉相似性香肠用“热狗”和腊肠,理解是建立在一个具体的文化知识。热狗的例子是一个明确的说明语义协同,这种化合物的意义不能减少热或者狗,甚至简单的成分。智能外星人试图理解热狗的意义通过询问炎热和狗在《牛津英语词典》的定义可能会经历失败。一件轶事可能进一步说明这一点。第一作者访问了英国的一个老朋友在60年代早期,他平生第一次看到一个站卖香肠的签下“热狗。“他是震惊,尽管他们伟大的对狗的喜爱,英国吃香肠的狗肉。</p> <p>语义的协同作用明显的热狗也很明显的情况下,复合语义透明性的要高得多。这个词复合指南评为前化合物的语义透明性(<xref ref-type="bibr" rid="B10"> 10</xref>]。然而,即使在这个相对简单的情况下,没有琐碎的计算过程来推断它的意义从其成分的意义,表明其相对收购大约是五岁。在这种背景下,必须澄清,术语“语义透明性”和“语义的协同作用,”尽管是概念上相关的,不是概念上蒙羞。语义透明性是一个象征性的实例化语义的一般机制协同作用。然而,语义透明性不能等同于语义的协同作用。复合的意义的程度可以从它的成分不一样程度的信息封装在复合为我们提供了一个额外的值超出了提供的信息成分。当我们在实验<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M5"> <mml:mrow> <mml:mn> 1</mml:mn> </mml:mrow> </mml:math> </inline-formula>、语义透明性之间的相关性和我们提出的语义的协同作用是重要但远非完美,应该是这样,如果两个概念是相同的。</p> <p>有密集的工作理解的认知过程的理解语言的化合物。此外,有一些引人注目的尝试构建计算模型的“语义成分”(例如,<xref ref-type="bibr" rid="B11"> 11</xref>])。然而,了解化合物的认知过程的理解和发展可行的计算模型的这些过程远非解决问题,完全超出了当前的范围。我们使用上下文的化合物和文字的抽象性水平仅为验证语义协同作用的措施。因此,我们的主要目标是开发和验证的新措施。</p> <p>在这篇文章中,我们首先使用词化合物的情况下为了测试我们的语义的协同作用。虽然语言和计算模型化合物显示成分的贡献语义透明性的化合物(例如,<xref ref-type="bibr" rid="B6"> 6</xref>,<xref ref-type="bibr" rid="B12"> 12</xref>从心理学研究),很明显<xref ref-type="bibr" rid="B7"> 7</xref>)化合物的意义不仅仅是由各部分。因此,语义透明性的化合物可以作为一个测试用例验证我们的语义的协同作用。然而,我们反复强调这一点,这篇论文没有自命不凡模型化合物的认知处理或建立计算模型为理解化合物,虽然可能有一些相关性的这些挑战。</p> </sec> <sec id="sec3"> <title>3所示。意义和分布语义</t我tle> <p>以前,我们已经提到了协同措施严重依赖这一事实互信息的概念。共同的信息化措施协同不需要处理“意义”,因为他们只关注减少不确定性。然而,任何试图开发的措施<我t一个l我c> 语义</我t一个l我c>协同应该解释意义的特定意义上它依赖这种感觉的方法是嵌入在测量过程。在这里,我们采用“分布语义”的概念([<xref ref-type="bibr" rid="B13"> 13</xref>,<xref ref-type="bibr" rid="B14"> 14</xref>)为了澄清如何代表意义。“分布语义是基于假设上下文往往发生在类似的词有相似的含义(哈里斯,1954;弗斯,1957)。这个假设就自然引出向量空间模型,哪些词是由上下文向量(特尼& Pantel, 2010)”(<xref ref-type="bibr" rid="B14"> 14</xref>,1页)。在这种情况下,我们可以考虑热狗的意义,例如,通过使用一个大型语料库中的单词与它并列的英文。例如,搜索当代美国英语语料库(缩写为可口)[<xref ref-type="bibr" rid="B15"> 15</xref>)的话语并置4位置热狗的左/右,我们确定搭配如包子、番茄酱和芥末。我们可以组织这些话<我t一个l我c> 基础</我t一个l我c>对于一个<我t一个l我c> “上下文向量”</我t一个l我c>的值是搭配的频率或概率。这个向量可以用于代表热狗各种实际应用的意义实际上这个简单的分布语义的想法被证明是极其强大的自然语言处理和计算的认知。鉴于热狗的意义和它的成分(即。,Hot and Dog) may be represented by using their context vectors, how can we measure the synergy of a word compound?</p> </sec> <sec id="sec4"> <title>4所示。测量语义的协同作用</t我tle> <p>在基因相互作用的背景下,<xref ref-type="bibr" rid="B1"> 1</xref>建议之间的协同作用<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M6"> <mml:mi> G</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>和<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M7"> <mml:mi> G</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>关于<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M8"> <mml:mrow> <mml:mi> C</mml:mi> </mml:mrow> </mml:math> </inline-formula>可能是形式化如下:<d我年代p- - - - - -formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M9"> <mml:mtable> <mml:mlabeledtr id="eq1"> <mml:mtd> <mml:mtext> (1)</mml:mtext> </mml:mtd> <mml:mtd> <mml:mtext> Syn</mml:mtext> <mml:mfenced separators="|"> <mml:mrow> <mml:mi> G</mml:mi> <mml:mn mathvariant="normal"> 1</mml:mn> <mml:mo> ,</mml:mo> <mml:mi> G</mml:mi> <mml:mn mathvariant="normal"> 2</mml:mn> <mml:mo> ;</mml:mo> <mml:mi> C</mml:mi> </mml:mrow> </mml:mfenced> <mml:mo> =</mml:mo> <mml:mi> 我</mml:mi> <mml:mfenced separators="|"> <mml:mrow> <mml:mi> G</mml:mi> <mml:mn mathvariant="normal"> 1</mml:mn> <mml:mo> ,</mml:mo> <mml:mi> G</mml:mi> <mml:mn mathvariant="normal"> 2</mml:mn> <mml:mo> ;</mml:mo> <mml:mi> C</mml:mi> </mml:mrow> </mml:mfenced> <mml:mo> - - - - - -</mml:mo> <mml:mfenced open="[" close="]" separators="|"> <mml:mrow> <mml:mi> 我</mml:mi> <mml:mfenced separators="|"> <mml:mrow> <mml:mi> G</mml:mi> <mml:mn mathvariant="normal"> 1</mml:mn> <mml:mo> ;</mml:mo> <mml:mi> C</mml:mi> </mml:mrow> </mml:mfenced> <mml:mo> +</mml:mo> <mml:mi> 我</mml:mi> <mml:mfenced separators="|"> <mml:mrow> <mml:mi> G</mml:mi> <mml:mn mathvariant="normal"> 2</mml:mn> <mml:mo> ;</mml:mo> <mml:mi> C</mml:mi> </mml:mrow> </mml:mfenced> </mml:mrow> </mml:mfenced> <mml:mo> ,</mml:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula>,“<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M10"> <mml:mrow> <mml:mi> 我</mml:mi> </mml:mrow> </mml:math> </inline-formula>”意味着选民之间的互信息。当应用于化合物的环境中,这个公式背后的想法是吸引人的在它的简单;协同作用的总和减去之后,剩下的每个组成的独特的信息化合物成分的加入贡献。类比推理,我们建议词语的语义的协同作用<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M11"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>和<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M12"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>,就一个字<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M13"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>可能是概念化时获得的信息使用的独特上下文向量<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M14"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>和<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M15"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>上下文向量的近似<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M16"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>-近似时获得的信息<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M17"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>获得的信息的简单加法<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M18"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>的近似<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M19"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>和在使用中得到的信息<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M20"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>对近似<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M21"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>。这个想法可能会更好地阐明一个玩具我们应用例子<我t一个l我c> Kullback-Leibler散度</我t一个l我c>衡量。</p> <p>让我们假设我们想测量这个词的语义协同化合物海鲜。我们搜索可口的搭配海鲜,海,食物和组这些搭配装进一个袋子里,词作为向量的基础。这个袋子的单词可能包括以下单词:蟹,盐,服务,虾餐厅,水,酒。</p> <p>接下来,我们使用上面的袋子的话,形成一个共享<我t一个l我c> 基础</我t一个l我c>上下文向量的海鲜、大海和食物。我们负载向量的值表明可能每个单词出现在目标词的上下文(即。,海鲜,海洋,和食物)。见表<xref ref-type="table" rid="tab1"> 1</xref>。</p> <table-wrap id="tab1"> <label>表1</l一个bel> <p>海鲜的上下文向量、大海和食物。</p> <table> <thead> <tr> <th align="left"></th> <th align="center">餐厅</th> <th align="center">蟹</th> <th align="center">虾</th> <th align="center">服务</th> <th align="center">酒</th> <th align="center">水</th> <th align="center">盐</th> </tr> </thead> <tbody> <tr> <td align="left">海鲜</td> <td align="center">2</td> <td align="center">0。</td> <td align="center">点</td> <td align="center">02</td> <td align="center">.04点</td> <td align="center">0。</td> <td align="center">02</td> </tr> <tr> <td align="left">海</td> <td align="center">.09点</td> <td align="center">0</td> <td align="center">0</td> <td align="center">口径。</td> <td align="center">。</td> <td align="center">报</td> <td align="center">03</td> </tr> <tr> <td align="left">食物</td> <td align="center">. 01</td> <td align="center">. 01</td> <td align="center">02</td> <td align="center">02</td> <td align="center">0</td> <td align="center">.30</td> <td align="center">.64点</td> </tr> </tbody> </table> </table-wrap> <p>在这一点上,我们可能想近似分布的海鲜(即。,它的意思)通过分布的海洋和食物。根据分布假设,海鲜的意义可以通过使用它的上下文向量。因此,近似分布的海鲜用海和食物的分布可能表明多少信息时,我们获得了修正先验分布(也就是我们的信念。海洋和食品的感官),海鲜的后验分布。如果海鲜的意义是一个协同作用的成分的产品,然后近似海鲜的意思,由其上下文向量,通过感官的成分,作为由上下文向量,表示应该涉及一些获得信息在海鲜不能完全代表的信息通过信息封装在大海和食物。增益越高,越高的协同作用。在这里,我们可以使用Kullback-Leibler散度是一个<我t一个l我c> 不对称</我t一个l我c>测量两个概率分布之间的区别<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M22"> <mml:mrow> <mml:mi> P</mml:mi> </mml:mrow> </mml:math> </inline-formula>和<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M23"> <mml:mrow> <mml:mi> 问</mml:mi> </mml:mrow> </mml:math> </inline-formula>:<d我年代p- - - - - -formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M24"> <mml:mtable> <mml:mlabeledtr id="eq2"> <mml:mtd> <mml:mtext> (2)</mml:mtext> </mml:mtd> <mml:mtd> <mml:msub> <mml:mrow> <mml:mi> D</mml:mi> </mml:mrow> <mml:mrow> <mml:mi mathvariant="normal"> K</mml:mi> <mml:mi mathvariant="normal"> l</mml:mi> </mml:mrow> </mml:msub> <mml:mfenced separators="|"> <mml:mrow> <mml:mi> P</mml:mi> <mml:mo minsize="0.75em" maxsize="0.75em"> ∥</mml:mo> <mml:mi> 问</mml:mi> </mml:mrow> </mml:mfenced> <mml:mo> =</mml:mo> <mml:mrow> <mml:mo stretchy="false"> ∑</mml:mo> <mml:mrow> <mml:mi> P</mml:mi> <mml:mfenced separators="|"> <mml:mrow> <mml:mi> 我</mml:mi> </mml:mrow> </mml:mfenced> <mml:mrow> <mml:mrow> <mml:mi mathvariant="normal"> 日志</mml:mi> </mml:mrow> <mml:mo> ⁡</mml:mo> <mml:mrow> <mml:mfrac> <mml:mrow> <mml:mi> P</mml:mi> <mml:mfenced separators="" open="(" close=")"> <mml:mrow> <mml:mi> 我</mml:mi> </mml:mrow> </mml:mfenced> </mml:mrow> <mml:mrow> <mml:mi> 问</mml:mi> <mml:mfenced separators="" open="(" close=")"> <mml:mrow> <mml:mi> 我</mml:mi> </mml:mrow> </mml:mfenced> </mml:mrow> </mml:mfrac> </mml:mrow> </mml:mrow> </mml:mrow> </mml:mrow> <mml:mo> 。</mml:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula></p> <p>我们可以使用<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M25"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> D</mml:mi> </mml:mrow> <mml:mrow> <mml:mi mathvariant="normal"> K</mml:mi> <mml:mi mathvariant="normal"> l</mml:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>近似分布的复合海鲜这个词用其组成的分布。这里是一个详细的例子说明我们可以通过海洋和近似分布的海鲜食物。</p> <p>表<xref ref-type="table" rid="tab1"> 1</xref>告诉我们,餐厅与海鲜搭配的概率是0.70,它与海并列的概率是0.09。因此,我们首先计算<d我年代p- - - - - -formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M26"> <mml:mtable> <mml:mlabeledtr id="eq3"> <mml:mtd> <mml:mtext> (3)</mml:mtext> </mml:mtd> <mml:mtd> <mml:mn mathvariant="normal"> 0.70</mml:mn> <mml:mi> ∗</mml:mi> <mml:mrow> <mml:mrow> <mml:mi mathvariant="normal"> 日志</mml:mi> </mml:mrow> <mml:mo> ⁡</mml:mo> <mml:mrow> <mml:mfrac> <mml:mrow> <mml:mn mathvariant="normal"> 0.70</mml:mn> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 0.09</mml:mn> </mml:mrow> </mml:mfrac> </mml:mrow> </mml:mrow> <mml:mo> 。</mml:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula>接下来,我们看到这个词的概率蟹与海鲜搭配0.05和海0(转换为0.001)。因此,我们计算<d我年代p- - - - - -formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M27"> <mml:mtable> <mml:mlabeledtr id="eq4"> <mml:mtd> <mml:mtext> (4)</mml:mtext> </mml:mtd> <mml:mtd> <mml:mn mathvariant="normal"> 0.05</mml:mn> <mml:mi> ∗</mml:mi> <mml:mrow> <mml:mrow> <mml:mi mathvariant="normal"> 日志</mml:mi> </mml:mrow> <mml:mo> ⁡</mml:mo> <mml:mrow> <mml:mfrac> <mml:mrow> <mml:mn mathvariant="normal"> 0.05</mml:mn> </mml:mrow> <mml:mrow> <mml:mn mathvariant="normal"> 0.001</mml:mn> </mml:mrow> </mml:mfrac> </mml:mrow> </mml:mrow> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula>等等。我们和这些表达式如下:<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M28"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> D</mml:mi> </mml:mrow> <mml:mrow> <mml:mi mathvariant="normal"> K</mml:mi> <mml:mi mathvariant="normal"> l</mml:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>(<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M29"> <mml:mi mathvariant="normal"> 年代</mml:mi> <mml:mi mathvariant="normal"> e</mml:mi> <mml:mi mathvariant="normal"> 一个</mml:mi> <mml:mi mathvariant="normal"> f</mml:mi> <mml:mi mathvariant="normal"> o</mml:mi> <mml:mi mathvariant="normal"> o</mml:mi> <mml:mi mathvariant="normal"> d</mml:mi> <mml:mo stretchy="false"> ∥</mml:mo> <mml:mi mathvariant="normal"> 年代</mml:mi> <mml:mi mathvariant="normal"> e</mml:mi> <mml:mi mathvariant="normal"> 一个</mml:mi> </mml:math> </inline-formula>)=<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M30"> <mml:mrow> <mml:mo stretchy="false"> ∑</mml:mo> <mml:mrow> <mml:mn> 0.70</mml:mn> <mml:mi> ∗</mml:mi> <mml:mrow> <mml:mrow> <mml:mi mathvariant="normal"> 日志</mml:mi> </mml:mrow> <mml:mo> ⁡</mml:mo> <mml:mrow> <mml:mfenced separators="|"> <mml:mrow> <mml:mrow> <mml:mrow> <mml:mi> 年代</mml:mi> <mml:mn> 0.70</mml:mn> </mml:mrow> <mml:mo> /</mml:mo> <mml:mrow> <mml:mn> 0.09</mml:mn> </mml:mrow> </mml:mrow> </mml:mrow> </mml:mfenced> </mml:mrow> </mml:mrow> </mml:mrow> </mml:mrow> <mml:mo> ,</mml:mo> <mml:mo> …</mml:mo> <mml:mo> ,</mml:mo> <mml:mn> 0.02</mml:mn> <mml:mi> ∗</mml:mi> <mml:mrow> <mml:mrow> <mml:mi mathvariant="normal"> 日志</mml:mi> </mml:mrow> <mml:mo> ⁡</mml:mo> <mml:mrow> <mml:mfenced separators="|"> <mml:mrow> <mml:mrow> <mml:mrow> <mml:mn> 0.02</mml:mn> </mml:mrow> <mml:mo> /</mml:mo> <mml:mrow> <mml:mn> 0.30</mml:mn> </mml:mrow> </mml:mrow> </mml:mrow> </mml:mfenced> </mml:mrow> </mml:mrow> </mml:math> </inline-formula>。</p> <p>同样,我们计算散度测量对食品和海鲜。<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M31"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> D</mml:mi> </mml:mrow> <mml:mrow> <mml:mi mathvariant="normal"> K</mml:mi> <mml:mi mathvariant="normal"> l</mml:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>(<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M32"> <mml:mi mathvariant="normal"> 年代</mml:mi> <mml:mi mathvariant="normal"> e</mml:mi> <mml:mi mathvariant="normal"> 一个</mml:mi> <mml:mi mathvariant="normal"> f</mml:mi> <mml:mi mathvariant="normal"> o</mml:mi> <mml:mi mathvariant="normal"> o</mml:mi> <mml:mi mathvariant="normal"> d</mml:mi> <mml:mo stretchy="false"> ∥</mml:mo> <mml:mi mathvariant="normal"> 年代</mml:mi> <mml:mi mathvariant="normal"> e</mml:mi> <mml:mi mathvariant="normal"> 一个</mml:mi> </mml:math> </inline-formula>)= 2.85,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M33"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> D</mml:mi> </mml:mrow> <mml:mrow> <mml:mi mathvariant="normal"> K</mml:mi> <mml:mi mathvariant="normal"> l</mml:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>(<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M34"> <mml:mi mathvariant="normal"> 年代</mml:mi> <mml:mi mathvariant="normal"> e</mml:mi> <mml:mi mathvariant="normal"> 一个</mml:mi> <mml:mi mathvariant="normal"> f</mml:mi> <mml:mi mathvariant="normal"> o</mml:mi> <mml:mi mathvariant="normal"> o</mml:mi> <mml:mi mathvariant="normal"> d</mml:mi> <mml:mo stretchy="false"> ∥</mml:mo> <mml:mi mathvariant="normal"> F</mml:mi> <mml:mi mathvariant="normal"> o</mml:mi> <mml:mi mathvariant="normal"> o</mml:mi> <mml:mi mathvariant="normal"> d</mml:mi> </mml:math> </inline-formula>)= 4.70。这些结果表明,近似的上下文向量海鲜更容易通过使用海,而不是通过食物。</p> </sec> <sec id="sec5"> <title>5。实验</t我tle> <sec id="sec5.1"> <title>5.1。实验1</t我tle> <sec id="sec5.1.1"> <title>5.1.1。方法</t我tle> <p>在下面的部分中,我们介绍我们的数据集和程序申请测量语义的协同作用。</p> </sec> <sec id="sec5.1.2"> <title>5.1.2中。数据集</t我tle> <p>在第一个实验中,我们使用[提供的数据集<xref ref-type="bibr" rid="B10"> 10</xref>]。这个数据集包括629语言化合物及其评级由人类法官根据一些相关措施如熟悉(FAM),收购(AoA)的时代,语义透明度(反式),和象性(IMG)。语义透明性问题的程度意义的化合物可以推断从它的成分。象性的担忧程度的化合物可能的想象。反式可能被认为是语义的表达协同作用,这是第一个实验的重点。</p> </sec> <sec id="sec5.1.3"> <title>5.1.3。过程</t我tle> <p>我们每个单词象征化合物<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M35"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>,左边的单词<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M36"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>,正确的单词<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M37"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>。对于每一个单词,我们搜查了可口的搭配表现出4位置我们的目标词的左/右。这个列表,我们过滤最频繁的300字的前题形式(<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M38"> <mml:mrow> <mml:mn> 1</mml:mn> </mml:mrow> </mml:math> </inline-formula>)只属于词类的名词,动词,形容词和(<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M39"> <mml:mrow> <mml:mn> 2</mml:mn> </mml:mrow> </mml:math> </inline-formula>)互信息与我们的目标词(≥3<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M40"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M41"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M42"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>)。第二个约束的目的是过滤掉高度频繁和嘈杂的搭配。每个列表存储为一袋单词和单词的袋子<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M43"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M44"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M45"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>联合成一个独特的单词列表(即。,lemmas) that can have a maximal cardinality of 900. From this list, we remove<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M46"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M47"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M48"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>。独特的列表被组织为一个字母词上下文向量的基础形式。此基础上用于描述<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M49"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M50"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M51"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>。接下来,我们构造特定的向量<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M52"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M53"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M54"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>通过加载基础与每一个引理的频率和频率转换成概率。我们定义三组单词和四个向量:<l我年代t> <list-item> <label>(1)</l一个bel> </list-item> </list></p> <p> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M55"> <mml:mrow> <mml:mi> W</mml:mi> </mml:mrow> </mml:math> </inline-formula>1<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M56"> <mml:mrow> <mml:mi> W</mml:mi> </mml:mrow> </mml:math> </inline-formula>2:向量组成的词搭配的概率<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M57"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula></p> <list-item> <label>(2)</l一个bel> <p> <italic> 集</我t一个l我c>_<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M58"> <mml:mrow> <mml:mi> W</mml:mi> </mml:mrow> </mml:math> </inline-formula>1:<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M59"> <mml:mo stretchy="false"> (</mml:mo> <mml:mi> W</mml:mi> <mml:mn mathvariant="normal"> 1</mml:mn> <mml:mo> ∩</mml:mo> <mml:mi> W</mml:mi> <mml:mn mathvariant="normal"> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn mathvariant="normal"> 2</mml:mn> <mml:mo stretchy="false"> )</mml:mo> <mml:mo> - - - - - -</mml:mo> <mml:mo stretchy="false"> (</mml:mo> <mml:mi> W</mml:mi> <mml:mn mathvariant="normal"> 2</mml:mn> <mml:mo> ∩</mml:mo> <mml:mi> W</mml:mi> <mml:mn mathvariant="normal"> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn mathvariant="normal"> 2</mml:mn> <mml:mo stretchy="false"> )</mml:mo> </mml:math> </inline-formula></p> </list-item>这意味着,首先,我们识别单词的十字路口<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M60"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>和<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M61"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>和和他们的频率。从这个单词列表,我们“删除”的话,也存在<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M62"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula> <italic> ∩</我t一个l我c> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M63"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>。独特的单词后剩下的这个过程已经完成识别与价值观形成的基础和加载题为一个向量<我t一个l我c> Unique_</我t一个l我c> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M64"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>。<l我年代t> <list-item> <label>(3)</l一个bel> <p> <italic> set_</我t一个l我c> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M65"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>:<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M66"> <mml:mo stretchy="false"> (</mml:mo> <mml:mi> W</mml:mi> <mml:mn mathvariant="normal"> 2</mml:mn> <mml:mo> ∩</mml:mo> <mml:mi> W</mml:mi> <mml:mn mathvariant="normal"> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn mathvariant="normal"> 2</mml:mn> <mml:mo stretchy="false"> )</mml:mo> <mml:mo> - - - - - -</mml:mo> <mml:mo stretchy="false"> (</mml:mo> <mml:mi> W</mml:mi> <mml:mn mathvariant="normal"> 1</mml:mn> <mml:mo> ∩</mml:mo> <mml:mi> W</mml:mi> <mml:mn mathvariant="normal"> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn mathvariant="normal"> 2</mml:mn> <mml:mo stretchy="false"> )</mml:mo> </mml:math> </inline-formula></p> </list-item> </list> <p></p> <p>它是计算set_一样<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M67"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>但这一次我们识别存在的单词<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M68"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula> <italic> ∩</我t一个l我c> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M69"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>但不存在<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M70"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula> <italic> ∩</我t一个l我c> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M71"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>。再一次,最后向量,名为<我t一个l我c> Unique_</我t一个l我c> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M72"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>900字,由相同的基础形式,但我们只从0值不同的词存在<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M73"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula> <italic> ∩</我t一个l我c> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M74"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>但不存在<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M75"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula> <italic> ∩</我t一个l我c> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M76"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>。<l我年代t> <list-item> <label>(4)</l一个bel> </list-item> </list></p> <p> <italic> set_Joint</我t一个l我c>=<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M77"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula> <italic> ∩</我t一个l我c> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M78"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula> <italic> ∩</我t一个l我c> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M79"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula></p> <p></p> <p>这次,我们识别单词存在三个字的十字路口(即,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M80"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula> <italic> ∩</我t一个l我c> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M81"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula> <italic> ∩</我t一个l我c> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M82"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>)和向量,名为<我t一个l我c> 联合</我t一个l我c>包括900个单词,但只有包含在<我t一个l我c> set_Joint</我t一个l我c>从0值不同的和他们的频率是什么<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M83"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M84"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M85"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>转化为概率。</p> <p>每个向量转换为向量的值为0的概率转化为0.001。在下一步中,我们生产三个措施,是基于“软”版本的Kullback-Leibler散度。这些措施的信息<我t一个l我c> 获得</我t一个l我c>,因为他们给我们一个指示的信息时,我们获得了修改我们的信念的上下文向量先验分布的选民,或他们的共同的语义空间,上下文向量的化合物。这些措施的总体结构非常简单:<d我年代p- - - - - -formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M86"> <mml:mtable> <mml:mlabeledtr id="eq5"> <mml:mtd> <mml:mtext> (5)</mml:mtext> </mml:mtd> <mml:mtd> <mml:mrow> <mml:munderover> <mml:mstyle displaystyle="true"> <mml:mo stretchy="false"> ∑</mml:mo> </mml:mstyle> <mml:mrow> <mml:mi> 我</mml:mi> <mml:mo> =</mml:mo> <mml:mn mathvariant="normal"> 1</mml:mn> </mml:mrow> <mml:mrow> <mml:mi> N</mml:mi> </mml:mrow> </mml:munderover> <mml:mrow> <mml:mfrac> <mml:mrow> <mml:mi> p</mml:mi> <mml:mfenced separators="|"> <mml:mrow> <mml:mi> P</mml:mi> <mml:mi> 我</mml:mi> </mml:mrow> </mml:mfenced> </mml:mrow> <mml:mrow> <mml:mi> p</mml:mi> <mml:mfenced separators="|"> <mml:mrow> <mml:mi> 问</mml:mi> <mml:mi> 我</mml:mi> </mml:mrow> </mml:mfenced> </mml:mrow> </mml:mfrac> </mml:mrow> </mml:mrow> <mml:mo> ,</mml:mo> </mml:mtd> </mml:mlabeledtr> </mml:mtable> </mml:math> </disp-formula></p> <p>在哪里<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M87"> <mml:mrow> <mml:mi> P</mml:mi> </mml:mrow> </mml:math> </inline-formula>总是<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M88"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>和<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M89"> <mml:mrow> <mml:mi> 问</mml:mi> </mml:mrow> </mml:math> </inline-formula>要么是Unique_<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M90"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>,Unique_<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M91"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>或联合。<l我年代t> <list-item> <label>(1)</l一个bel> </list-item> </list></p> <p>第一个措施是标题<我t一个l我c> Gain_</我t一个l我c> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M92"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>,在那里<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M93"> <mml:mrow> <mml:mi> P</mml:mi> </mml:mrow> </mml:math> </inline-formula>=<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M94"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>和<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M95"> <mml:mrow> <mml:mi> 问</mml:mi> </mml:mrow> </mml:math> </inline-formula>=<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M96"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>。在这种情况下,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M97"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>独特的向量<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M98"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>正如我们之前计算的。</p> <list-item> <label>(2)</l一个bel> <p>第二个标题是测量<我t一个l我c> Gain_</我t一个l我c> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M99"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>,在那里<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M100"> <mml:mrow> <mml:mi> P</mml:mi> </mml:mrow> </mml:math> </inline-formula>=<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M101"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>和<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M102"> <mml:mrow> <mml:mi> 问</mml:mi> </mml:mrow> </mml:math> </inline-formula>=<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M103"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>。在这种情况下,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M104"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>独特的向量<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M105"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>正如我们之前计算的。</p> </list-item> <list-item> <label>(3)</l一个bel> <p>第三个措施是标题<我t一个l我c> Gain_Joint</我t一个l我c>,在那里<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M106"> <mml:mrow> <mml:mi> P</mml:mi> </mml:mrow> </mml:math> </inline-formula>=<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M107"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>和<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M108"> <mml:mrow> <mml:mi> 问</mml:mi> </mml:mrow> </mml:math> </inline-formula>=<我t一个l我c> 联合</我t一个l我c>。</p> </list-item>一个词的语义协同测量复合计算如下:<l我年代t> <list-item> <label>(5)</l一个bel> <p>SemSyn =<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M109"> <mml:mo stretchy="false"> (</mml:mo> <mml:mi mathvariant="normal"> G</mml:mi> <mml:mi mathvariant="normal"> 一个</mml:mi> <mml:mi mathvariant="normal"> 我</mml:mi> <mml:mi mathvariant="normal"> n</mml:mi> <mml:mo> </mml:mo> <mml:mo> </mml:mo> <mml:mi mathvariant="normal"> J</mml:mi> <mml:mi mathvariant="normal"> o</mml:mi> <mml:mi mathvariant="normal"> 我</mml:mi> <mml:mi mathvariant="normal"> n</mml:mi> <mml:mi mathvariant="normal"> t</mml:mi> <mml:mi> ∗</mml:mi> <mml:mfenced open="|" close="|" separators="|"> <mml:mrow> <mml:mi mathvariant="normal"> 年代</mml:mi> <mml:mi mathvariant="normal"> e</mml:mi> <mml:mi mathvariant="normal"> t</mml:mi> <mml:mo> _</mml:mo> <mml:mi mathvariant="normal"> J</mml:mi> <mml:mi mathvariant="normal"> o</mml:mi> <mml:mi mathvariant="normal"> 我</mml:mi> <mml:mi mathvariant="normal"> n</mml:mi> <mml:mi mathvariant="normal"> t</mml:mi> </mml:mrow> </mml:mfenced> <mml:mo stretchy="false"> )</mml:mo> <mml:mo> - - - - - -</mml:mo> <mml:mo stretchy="false"> (</mml:mo> <mml:mi mathvariant="normal"> G</mml:mi> <mml:mi mathvariant="normal"> 一个</mml:mi> <mml:mi mathvariant="normal"> 我</mml:mi> <mml:mi mathvariant="normal"> n</mml:mi> <mml:mi> W</mml:mi> <mml:mn mathvariant="normal"> 1</mml:mn> <mml:mi> ∗</mml:mi> <mml:mo> |</mml:mo> <mml:mi mathvariant="normal"> 年代</mml:mi> <mml:mi mathvariant="normal"> e</mml:mi> <mml:mi mathvariant="normal"> t</mml:mi> <mml:mo> _</mml:mo> <mml:mi> W</mml:mi> <mml:mn mathvariant="normal"> 1</mml:mn> <mml:mo> |</mml:mo> <mml:mo> +</mml:mo> <mml:mi mathvariant="normal"> G</mml:mi> <mml:mi mathvariant="normal"> 一个</mml:mi> <mml:mi mathvariant="normal"> 我</mml:mi> <mml:mi mathvariant="normal"> n</mml:mi> <mml:mi> W</mml:mi> <mml:mn mathvariant="normal"> 2</mml:mn> <mml:mi> ∗</mml:mi> <mml:mfenced open="|" close="|" separators="|"> <mml:mrow> <mml:mi mathvariant="normal"> 年代</mml:mi> <mml:mi mathvariant="normal"> e</mml:mi> <mml:mi mathvariant="normal"> t</mml:mi> <mml:mo> _</mml:mo> <mml:mi> W</mml:mi> <mml:mn mathvariant="normal"> 2</mml:mn> </mml:mrow> </mml:mfenced> </mml:math> </inline-formula>)。</p> </list-item> </list>语义的协同作用从而定义为<l我年代t> <list-item> <label>(1)</l一个bel> <p>获得的信息在近似分布的复合使用元素的先验分布共享<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M110"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M111"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M112"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>的基数乘以<我t一个l我c> set_Joint</我t一个l我c>,-</p> </list-item> <list-item> <label>(2)</l一个bel> <p>获得的信息的总和<我t一个l我c> 独特的</我t一个l我c>先验分布的<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M113"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>乘以set_的基数<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M114"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>+的增益<我t一个l我c> 独特的</我t一个l我c>先验分布的<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M115"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>乘以set_的基数<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M116"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>。</p> </list-item> </list> <p></p> <p>我们没有用过Kullback-Leibler散度的对数函数凝结的差异我们想使用为了识别协同作用的效果。当尝试的一个版本上面的函数使用<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M117"> <mml:mrow> <mml:msub> <mml:mrow> <mml:mi> D</mml:mi> </mml:mrow> <mml:mrow> <mml:mi mathvariant="normal"> K</mml:mi> <mml:mi mathvariant="normal"> l</mml:mi> </mml:mrow> </mml:msub> </mml:mrow> </mml:math> </inline-formula>,结果略差。此外,我们的信息增益的基数乘以每个相关集,数量的单词存在相交的语义领域的单词被发现与语义透明性的化合物,发现这是符合文献表明选民的角色在决定化合物的透明度(<xref ref-type="bibr" rid="B12"> 12</xref>]。</p> </sec> <sec id="sec5.1.4"> <title>5.1.4。分析和结果</t我tle> <p>表<xref ref-type="table" rid="tab2"> 2</xref>介绍了各种措施之间的皮尔逊相关性语言化合物(<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M118"> <mml:mi> N</mml:mi> <mml:mo> =</mml:mo> <mml:mn> 616年</mml:mn> </mml:math> </inline-formula>)。只有结果显著<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M119"> <mml:mi> p</mml:mi> <mml:mo> <</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 001年</mml:mn> </mml:math> </inline-formula>报告和反式的相关性是强调。</p> <table-wrap id="tab2"> <label>表2</l一个bel> <p>培生语言化合物的措施之间的相互关系。</p> <table> <thead> <tr> <th align="left"></th> <th align="center">FAM公司</th> <th align="center">农产品协定的</th> <th align="center">反式</th> <th align="center">IMG</th> </tr> </thead> <tbody> <tr> <td align="left">FAM公司</td> <td align="center"></td> <td align="center"> <inline-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M120"> <mml:mo> - - - - - -</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 672年</mml:mn> </mml:math> </inline-formula></td> <td align="center"> <bold> .288</bold></td> <td align="center">.495</td> </tr> <tr> <td align="left">农产品协定的</td> <td align="center"></td> <td align="center"></td> <td align="center"> <bold> −.397</bold></td> <td align="center"> <inline-formula> <mml:math display="block" xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M121"> <mml:mo> - - - - - -</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 642年</mml:mn> </mml:math> </inline-formula></td> </tr> <tr> <td align="left">反式</td> <td align="center"></td> <td align="center"></td> <td align="center"></td> <td align="center">。<bold> 396年</bold></td> </tr> </tbody> </table> </table-wrap> <statement id="hyp1"> <title>假设1。</t我tle> <p>我们假设,如果我们的语义协同作用(即测量。,SemSyn)我年代valid, then a negative correlation should be expected between SemSyn and TRANS (Hypothesis<xref ref-type="statement" rid="hyp1"> 1</xref>)作为协同作用的化合物是这个词越多,越不透明的语义,更多的时间学习(更高年龄的收购)(假设<xref ref-type="statement" rid="hyp1"> 1</xref>b),不太熟悉(假设<xref ref-type="statement" rid="hyp1"> 1</xref>c),少的(假设<xref ref-type="statement" rid="hyp1"> 1</xref>d)。<xref ref-type="table" rid="tab3"> 3</xref>提出了协同作用的相关性测量上述措施。</p> </statement> <table-wrap id="tab3"> <label>表3</l一个bel> <p>皮尔森之间的相关性<我t一个l我c> SemSyn</我t一个l我c>和语言成分的措施。</p> <table> <thead> <tr> <th align="left"></th> <th align="center">FAM公司</th> <th align="center">农产品协定的</th> <th align="center">反式</th> <th align="center">IMG</th> </tr> </thead> <tbody> <tr> <td align="left">SemSyn</td> <td align="center">−.397</td> <td align="center">.439</td> <td align="center">−.400</td> <td align="center">−。<bold> 483年</bold></td> </tr> </tbody> </table> </table-wrap> <p>所有结果具有统计显著性<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M122"> <mml:mi> p</mml:mi> <mml:mo> <</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 001年</mml:mn> </mml:math> </inline-formula>。你可能想知道反式之间的相关性和SemSyn频率的影响<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M123"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>和<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M124"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>在我们的语料库。为了解决这个问题,这次我们再次测量相关性,通过控制的频率<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M125"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>和<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M126"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>。由此产生的皮尔森相关仅略低于前一个了(<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M127"> <mml:mi> r</mml:mi> <mml:mo> =</mml:mo> <mml:mo> - - - - - -</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 392年</mml:mn> </mml:math> </inline-formula>)表示的频率成分没有对反式和SemSyn之间的关系产生重大影响。</p> <p>我们可以看到,我们的第一个假设它的各种变体已经支持。有趣的是注意到,在这些措施的化合物,反式和AoA是最高的相关性<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M128"> <mml:mo stretchy="false"> (</mml:mo> <mml:mo> - - - - - -</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 397年</mml:mn> </mml:math> </inline-formula>)和IMG (.394)。这意味着更高的语义透明性的化合物,是儿童学习的,越早越的。在这种背景下,有趣的是在桌子上<xref ref-type="table" rid="tab3"> 3</xref>语义协同测量与反式,<我t一个l我c> 相同的程度</我t一个l我c>反式是与AoA和IMG。这一结果表明,语义协同的新措施可能预测语义透明性相同级别的复合的年龄收购及其程度的象性。</p> <p>另一种测试的主要研究假设(即。,假设<xref ref-type="statement" rid="hyp1"> 1</xref>)是通过比较协同化合物额定高或低的分数语义透明性的措施。在本例中,我们应用<我t一个l我c> 极端组织研究设计</我t一个l我c>。我们已经识别出25%的得分最高的化合物反式(H)和他们25%的化合物相比,得分最低的(L)。使用单向方差分析,发现两组之间的差异具有统计学意义(<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M129"> <mml:mi> F</mml:mi> <mml:mo stretchy="false"> (</mml:mo> <mml:mn> 1299年</mml:mn> <mml:mo stretchy="false"> )</mml:mo> <mml:mo> =</mml:mo> <mml:mn> 85.82</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M130"> <mml:mi> p</mml:mi> <mml:mo> <</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 001年</mml:mn> </mml:math> </inline-formula>与部分η= 0.223平方),根据科恩的规范行为科学被认为是<我t一个l我c> 大</我t一个l我c>影响的大小。正如所料,化合物没有语义透明(L)平均得分更高<我t一个l我c> SemSyn</我t一个l我c>测量(−−541年相比,250年职责)。</p> <statement id="hyp2"> <title>假设2。</t我tle> <p>SemSyn这一事实被发现与反式不是线性相关的能力成功地分类化合物是透明的。使用SemSyn在分类任务中,通过应用机器学习程序,可能会进一步支持其有效性。因此,我们还测试了语义的协同作用的有效性衡量在一个分类任务中,在SemSyn用作分类的唯一功能语义透明性的化合物L、H。</p> </statement> <p>我们假设SemSyn将为我们提供一个显著增加预测的化合物被评为低透明度。这显著增加的概率预测是通过比较来判断一种化合物是评价低透明度,因为这类(即分类器预测它。分类器的精度)。相比精度预测我们可能获得使用L的基准利率情况下在我们的数据集。在我们的数据集,50%的化合物是标记为L,因此任何测量的精度高于50%将被认为是重要的。我们使用两个机器学习分类程序:<l我年代t> <list-item> <label>(1)</l一个bel> </list-item> </list></p> <p>分类和回归树(CRT)模型与一个十倍交叉验证过程</p> <list-item> <label>(2)</l一个bel> <p>的<我t一个l我c> k</我t一个l我c>最近邻居算法(<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M131"> <mml:mrow> <mml:mi> K</mml:mi> </mml:mrow> </mml:math> </inline-formula>nn)的欧几里得度量距离计算和10倍交叉验证过程</p> </list-item> <p></p> <p>这项研究的结果发表在表<xref ref-type="table" rid="tab4"> 4</xref>规范后,机器学习,自然语言处理,精密,回忆,和准确性的分类器是用来评价其性能。</p> <table-wrap id="tab4"> <label>表4</l一个bel> <p>分类过程的结果(圆形的百分比)。</p> <table> <thead> <tr> <th align="left"></th> <th align="center">精度</th> <th align="center">回忆</th> <th align="center">精度</th> </tr> </thead> <tbody> <tr> <td align="left">阴极射线管</td> <td align="center">72年</td> <td align="center">87年</td> <td align="center">76年</td> </tr> <tr> <td align="left"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M132"> <mml:mrow> <mml:mi> K</mml:mi> </mml:mrow> </mml:math> </inline-formula>神经网络</td> <td align="center">69年</td> <td align="center">78年</td> <td align="center">72年</td> </tr> </tbody> </table> <table-wrap-foot> <fn> <p> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M133"> <mml:mrow> <mml:mmultiscripts> <mml:mrow> <mml:mi mathvariant="normal"> 一个</mml:mi> <mml:mi mathvariant="normal"> l</mml:mi> <mml:mi mathvariant="normal"> l</mml:mi> </mml:mrow> <mml:mprescripts></mml:mprescripts> <mml:none></mml:none> <mml:mrow> <mml:mi> ∗</mml:mi> </mml:mrow> </mml:mmultiscripts> </mml:mrow> </mml:math> </inline-formula>测试结果是在圆形的百分比和涉及意义很重要<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M134"> <mml:mi> p</mml:mi> <mml:mo> <</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 001年</mml:mn> </mml:math> </inline-formula>。</p> </fn> </table-wrap-foot> </table-wrap> <p>精确的比例是真正的单词的单词识别为L的病例。召回的比例情况下的分类器识别为L的L情况下在我们的数据集。精度的总体衡量分类器的正确识别L情况下(即。,compounds that were correctly identified by the classifier as characterized by low semantic transparency) and correct identification of non-L cases, out of the total cases. The measures of precision and recall refer to the success in predicting compounds with low transparency. We can see that both classifiers produced a significant improvement in prediction over the base rate (50%) with an average improvement of 20%. These results further support the validity of our measure.</p> <p>在第一个实验中,我们测量验证语义协同词上下文中的化合物。高度重要的是强调这样一个事实:我们使用上下文的化合物来验证我们的测量和没有任何意图与目标预测的算法各方面竞争的化合物,如语义透明度。我们已经提到了一些这些尝试(例如,<xref ref-type="bibr" rid="B11"> 11</xref>摘要]),但有一个完全不同的目的。然而,有趣的是检查我们的预测价值语义协同措施对语义距离的预测能力的措施。它是合理的假设语义透明性的化合物可以预测基于化合物及其成分之间的语义距离。语义协同措施是否超出了这些语义距离的预测价值贡献是一个开放的问题。要回答这个问题,我们使用了向量空间模型的语义(<xref ref-type="bibr" rid="B14"> 14</xref>通过专门使用<我t一个l我c> term-to-context</我t一个l我c>矩阵由(<xref ref-type="bibr" rid="B16"> 16</xref>]。我们喜欢这个矩阵在term-to-document LSA的模型,因为它保留了term-to-lexical-context协会共同的感知相似性而言的意义,因为它已成功地应用于各种认知和社会计算的研究。使用term-to-document矩阵,每个词之间的语义距离测量化合物及其组成和《新措施<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M135"> <mml:mi> w</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>_compound。同样,我们测量了复合和第二个词之间的语义距离和《新措施<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M136"> <mml:mi> w</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>_compound。回忆,我们协同之间的皮尔逊相关测量和语义透明性的复合−0.40。之间的皮尔逊相关<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M137"> <mml:mi> w</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>_compound和反式<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M138"> <mml:mi> r</mml:mi> <mml:mo> =</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 325年</mml:mn> </mml:math> </inline-formula>(<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M139"> <mml:mi> p</mml:mi> <mml:mo> <</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 001年</mml:mn> </mml:math> </inline-formula>之间),<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M140"> <mml:mi> w</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>_compound和反式<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M141"> <mml:mi> r</mml:mi> <mml:mo> =</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 299年</mml:mn> </mml:math> </inline-formula>(<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M142"> <mml:mi> p</mml:mi> <mml:mo> <</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 001年</mml:mn> </mml:math> </inline-formula>)。SemSyn是负相关的<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M143"> <mml:mi> w</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>_compound (<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M144"> <mml:mi> r</mml:mi> <mml:mo> =</mml:mo> <mml:mo> - - - - - -</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 496年</mml:mn> </mml:math> </inline-formula>),<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M145"> <mml:mi> w</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>_compound (<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M146"> <mml:mi> r</mml:mi> <mml:mo> =</mml:mo> <mml:mo> - - - - - -</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 547年</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M147"> <mml:mi> p</mml:mi> <mml:mo> <</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 001年</mml:mn> </mml:math> </inline-formula>),这意味着更高的语义成分的协同作用,向量和向量之间的距离较低的化合物,非常期待。一个更好的方法测量的相对贡献<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M148"> <mml:mi> w</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>_compound,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M149"> <mml:mi> w</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>_compound, SemSyn预测化合物的语义透明性是通过重复CRT分析和分类化合物进入低透明度的化合物和高透明度的化合物。使用CRT和10倍交叉验证分类器<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M150"> <mml:mi> w</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>_compound和<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M151"> <mml:mi> w</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>_compound特性给了我们更好的精度比我们只获得了通过使用SemSyn(分别为76%和72%,分别地。),但较低的召回(分别为69%和87%,分别地。)和精度略低(分别为74%和76%,分别地)。当进入<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M152"> <mml:mi> w</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>_compound,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M153"> <mml:mi> w</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>_compound SemSyn到模型中,我们获得了最高精度(82%)和准确性(77%),但略低召回(71%)。规范化的重要性特征表明SemSyn规范化模型中的重要性最高(100%)紧随其后<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M154"> <mml:mi> w</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>_compound(89%)和<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M155"> <mml:mi> w</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>_compound (40%)。再次,设计最好的算法预测语义透明性是完全超出了当前论文的范围。然而,我们进行了补充分析证明我们的语义协同措施可能有助于预测之外的语义透明性的贡献的语义距离的选民,以一种强大的模式。</p> <p>另一个补充分析的主要研究问题可能涉及语义意义的角色优势(<xref ref-type="bibr" rid="B10"> 10</xref>]。语义意义的主导地位(LMD)措施的相对优势第一/第二语义决定整个化合物的意义。在我们的数据集,LMD测量规模从0(即。,the meaning of the entire compound is in the first lexeme) to 10 (i.e., the meaning of the entire compound is determined by the second lexeme). In [<xref ref-type="bibr" rid="B10"> 10</xref>),化合物4分或更低的LMD测量被名为“领导”和那些得分6或更高的题为“尾随。“在我们的数据集,139种化合物已经被识别为“领导”(45%),其余的,167年,被认定为“尾随”(55%),表明第二语义的统治地位。</p> <p>回忆,我们在试图近似计算得到的信息化合物通过向量的向量的第一个词位(即。,Gain_<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M156"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>)和第二个词位(即。,Gain_<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M157"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>)。获得的分数越高,就越难近似的意义使用向量组成的化合物。LMD可以解释通过使用这些措施,第一次和第二次的相对优势应该表达的语义信息获得近似时,化合物的意义通过使用每个组成的向量。因此,我们可以假设显著差异会发现当比较收益措施和跟踪的化合物。</p> <p>(即使用MANOVA LMD的因素。,Headed versus Tailed compounds) and the two gain measures as the independent variables, a statistically significant difference was found between the groups (<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M158"> <mml:mi> F</mml:mi> <mml:mo stretchy="false"> (</mml:mo> <mml:mn> 2303年</mml:mn> <mml:mo stretchy="false"> )</mml:mo> <mml:mo> =</mml:mo> <mml:mn> 9.82</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M159"> <mml:mi> p</mml:mi> <mml:mo> <</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 001年</mml:mn> </mml:math> </inline-formula>)。然而,Gain_只是统计上显著的区别<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M160"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>测量(<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M161"> <mml:mi> p</mml:mi> <mml:mo> <</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 001年</mml:mn> </mml:math> </inline-formula>)跟踪化合物得分较低(<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M162"> <mml:mi> 米</mml:mi> <mml:mo> =</mml:mo> <mml:mn> 1674年</mml:mn> </mml:math> </inline-formula>与<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M163"> <mml:mi> 米</mml:mi> <mml:mo> =</mml:mo> <mml:mn> 2038年</mml:mn> </mml:math> </inline-formula>、职责)。这意味着尾随化合物,第二个词位决定了整个意义的化合物,化合物中,上下文向量的第二个语义是“近”的意义的上下文向量整个化合物。有趣的是,没有对称性对第一个语义的信息增益,说明词汇语义的主导地位不对称,非常与提供的信息有关的第一和第二个语义。</p> </sec> </sec> <sec id="sec5.2"> <title>5.2。实验2</t我tle> <p>在第一个实验中,我们使用词化合物为了验证我们的措施。我们假设如果语义协同作用的化合物是有效的,那么应该发现显著负相关语义协同得分和语义透明性之间的分数。提供一些实证结果支持我们的测量的有效性。然而,验证测量不能由单个案例作为语义协同疲惫不需要一定表达语义的化合物。另一个测试用例包括抽象性和具体性评级的话,在下一节中解释。</p> <p>所显示(<xref ref-type="bibr" rid="B17"> 17</xref>),单词的意义可能归因于两个维度:经验和分配。经验维度的感知方面的意义。例如,樱桃的意义在很大程度上取决于知觉方面的樱桃,红色的,小的,圆的,甜的,等等。可以立即理解,具体词的意义似乎多他们的知觉经验维度或感知维度的单词并置。识别的搭配樱桃可口和分组他们一点,我们很容易识别,他们自然都是围绕这个主题(例如,树)和食品(如馅饼)。</p> <p>分配维度的意义问题的一个词的意义是源自其连接与其他单词。例如,民主这个词代表一个概念,没有可察觉的实体引用。民主的含义完全取决于与其他词的关系确定它的意思同特定的形式的政府。我们可以看到,分配维度意义的深入与抽象性的一个字。单词的意义更抽象更依赖分配的维度。在这种情况下,我们可以假设一个词的具体性/抽象性评级应该与它的分数相关的语义协同的含义抽象词不能平凡地减少任何感性实体或句话说通过它定义的意义;而民主的含义可能是句话说定义其语义网络的协同作用的产物,樱桃的意义可能是不合作的,因为它依赖于一个简单的和感性的成分(例如,颜色,形状,大小和口味)或单词的意义它在语义网络链接(例如,苹果,草莓)。因此,我们假设一个词的抽象性将积极与我们的测量语义的协同作用。</p> <sec id="sec5.2.1"> <title>5.2.1。数据集</t我tle> <p>我们使用一个数据集,包括37058个英语单词的具体评级,从超过4000个参与者(<xref ref-type="bibr" rid="B18"> 18</xref>]。每个参与者都要求这个词使用5点量表从抽象到具体。我们已经确定了数据集的名词,选择前150名具体词和抽象词汇150强。</p> </sec> <sec id="sec5.2.2"> <title>5.2.2。过程</t我tle> <p>让我们表示每个目标词我们已经分析(<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M164"> <mml:mi> N</mml:mi> <mml:mo> =</mml:mo> <mml:mn> 300年</mml:mn> </mml:math> </inline-formula>),Abs,首次发现每个目标词的搭配按照相同的程序用于实验<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M165"> <mml:mrow> <mml:mn> 1</mml:mn> </mml:mrow> </mml:math> </inline-formula>。接下来,我们选择了两个最受好评的搭配(名词)表示<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M166"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> </mml:math> </inline-formula>和<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M167"> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>,并递归地确定自己的搭配。从这一点上,过程是完全相同的实验中使用<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M168"> <mml:mrow> <mml:mn> 1</mml:mn> </mml:mrow> </mml:math> </inline-formula>,但与Abs近似地代表<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M169"> <mml:mi> W</mml:mi> <mml:mn> 1</mml:mn> <mml:mi> W</mml:mi> <mml:mn> 2</mml:mn> </mml:math> </inline-formula>。他们的想法是,根据分配维度的意义,更新我们的信念从之前上下文向量形式的单词的语义上下文的目标,目标的后验上下文向量,需要更多的努力。因此,抽象性将积极与语义的协同作用。</p> </sec> <sec id="sec5.2.3"> <title>5.2.3。分析和结果</t我tle> <p>有<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M170"> <mml:mi> N</mml:mi> <mml:mo> =</mml:mo> <mml:mn> 296年</mml:mn> </mml:math> </inline-formula>词汇在我们的数据集,其中149人表示最具体的名词在数据库中(51%),其余最抽象词汇(49%)。抽象性和之间的皮尔逊相关<我t一个l我c> SemSyn</我t一个l我c>被发现统计学意义(<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M171"> <mml:mi> r</mml:mi> <mml:mo> =</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 537年</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M172"> <mml:mi> p</mml:mi> <mml:mo> <</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 001年</mml:mn> </mml:math> </inline-formula>),SemSyn已经转向的标志-为了提供一个简单的抽象解释结果的排名从具体到抽象。线性回归计算预测的抽象层次词根据其协同得分。发现了一个统计上显著的回归方程(<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M173"> <mml:mi> F</mml:mi> <mml:mo stretchy="false"> (</mml:mo> <mml:mn> 1292年</mml:mn> <mml:mo stretchy="false"> )</mml:mo> <mml:mo> =</mml:mo> <mml:mn> 118.23</mml:mn> </mml:math> </inline-formula>,<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M174"> <mml:mi> p</mml:mi> <mml:mo> <</mml:mo> <mml:mo> 。</mml:mo> <mml:mn> 001年</mml:mn> </mml:math> </inline-formula>),<我nl我ne- - - - - -formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M175"> <mml:mrow> <mml:msup> <mml:mrow> <mml:mi> R</mml:mi> </mml:mrow> <mml:mrow> <mml:mn> 2</mml:mn> </mml:mrow> </mml:msup> </mml:mrow> </mml:math> </inline-formula>0.288。为了检查SemSyn的预测能力,我们应用这两个机器学习分类程序。这项研究的结果发表在表<xref ref-type="table" rid="tab5"> 5</xref>。</p> <table-wrap id="tab5"> <label>表5</l一个bel> <p>分类过程的结果(圆形的百分比)。</p> <table> <thead> <tr> <th align="left"></th> <th align="center">精度</th> <th align="center">回忆</th> <th align="center">精度</th> </tr> </thead> <tbody> <tr> <td align="left">阴极射线管</td> <td align="center">72年</td> <td align="center">85年</td> <td align="center">76年</td> </tr> <tr> <td align="left"> <inline-formula> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML" id="M176"> <mml:mrow> <mml:mi> K</mml:mi> </mml:mrow> </mml:math> </inline-formula>神经网络</td> <td align="center">70年</td> <td align="center">76年</td> <td align="center">71年</td> </tr> </tbody> </table> </table-wrap> <p>鉴于抽象词汇在我们的数据集的基准利率是49%,平均预测精度是71%的这意味着22%的改善。这些结果表明预测能力的协同作用,因此提供了另一个层次的实证支持其有效性。</p> </sec> </sec> </sec> <sec id="sec6"> <title>6。结论</t我tle> <p>著名的完形的口号“整个不同于它各部分的总和”是一个明确的迹象的新兴结构的指纹协同作用的过程。必须指出的是,这种协同作用是困难的,至少从理论上讲,通过措施依赖互信息来捕获。协同作用涉及到尺度的转变的分析而互信息的测量不直接解决这个比例的变化。这种理论观点解释可能是通过物理计算和蓝道的原则<xref ref-type="bibr" rid="B19"> 19</xref>]。文献[<xref ref-type="bibr" rid="B19"> 19</xref>)认为,当一个系统消除一些信息然后这个过程是不可逆的,是伴随着熵的最小价格发布环境。这个价格是明显的过程计算,一个特定的输出是由特定的输入,如形成抽象的语义类别从特定的实例<xref ref-type="bibr" rid="B20"> 20.</xref>]。例如,计算热的热狗和狗需要一些选民的信息就会丢失当热狗的新结构计算。换句话说,化合物的形成要求一些信息丢失和信息获得不同尺度之间转移时不可逆转的自然的过程的分析计算。在这种背景下,一个共同的信息化程度的协同不能用于直接代表<我t一个l我c> 获得</我t一个l我c>和<我t一个l我c> 损失</我t一个l我c>伴随出现的语义结构。</p> <p>在这篇文章中,我们取得了第一步发展中一定程度的语义的协同作用。这个措施,考虑了信息增益(损耗)陪同上下文向量之间的转变,保存信息增益/损失的概念,伴随着一个协同作用的过程以及语义表示的向量操作语义上下文中的协同作用。</p> <p>这种程度的语义协同各种应用程序超出了特定的和有限的情况下,在这个特定的验证研究。例如,你可能有兴趣研究的某些概念的含义(如神,爱,和达尔文主义)通过改变了历史。应对这一挑战的一个可能的方法是通过跟踪的变化经历了由这些概念的语义领域上下文向量实例化。然而,量化这种变化远非微不足道。一个可能的方法来源于我们的语义协同跟踪一个概念的语义协同的方式改变了。轨迹的分析这个措施可以被用于识别“临界点”概念的演变和历史地标,它的意义已经改变了。这个想法和其他人可能是谁开发研究价值的概念语义的协同作用可能是有价值的。</p> </sec> <back> <sec> <title>相互竞争的利益</t我tle> <p>作者宣称没有利益冲突。</p> </sec> <ref-list> <ref id="B1" content-type="article"> <label>1</l一个bel> <element-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Anastassiou</年代urname> <given-names> D。</given-names> </name> </person-group> <article-title> 计算分析在多个相互作用的基因之间的协同作用</一个rt我cle-title> <source> <italic> 分子系统生物学</我t一个l我c> <year> 2007年</year> <volume> 3</volume> <issue> 1,第83条</我年代年代ue> <pub-id pub-id-type="doi"> 10.1038 / msb4100124</pub-id> <pub-id pub-id-type="other"> 2 - s2.0 - 33847015674</pub-id> </element-citation> </ref> <ref id="B2" content-type="phdthesis"> <label>2</l一个bel> <element-citation publication-type="thesis"> <person-group person-group-type="author"> <name> <surname> 格里菲思</年代urname> <given-names> V。</given-names> </name> </person-group> <source> <italic> 量化协同信息[博士。论文)</我t一个l我c> <year> 2014年</year> <publisher-name> 加州理工学院的</publisher-name> </element-citation> </ref> <ref id="B3" content-type="misc"> <label>3</l一个bel> <element-citation publication-type="other"> <person-group person-group-type="author"> <name> <surname> 威廉姆斯</年代urname> <given-names> p . L。</given-names> </name> <name> <surname> 啤酒</年代urname> <given-names> r D。</given-names> </name> </person-group> <article-title> 多元信息的非负分解</一个rt我cle-title> <comment> <ext-link ext-link-type="url" xlink:href="https://arxiv.org/abs/1004.2515"> https://arxiv.org/abs/1004.2515</ext-link> </comment> </element-citation> </ref> <ref id="B4" content-type="article"> <label>4</l一个bel> <element-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Timme</年代urname> <given-names> N。</given-names> </name> <name> <surname> 阿尔弗德</年代urname> <given-names> W。</given-names> </name> <name> <surname> 雀斑</年代urname> <given-names> B。</given-names> </name> <name> <surname> 贝格斯说</年代urname> <given-names> j . M。</given-names> </name> </person-group> <article-title> 协同、冗余和多元信息的措施:一个实验物理学家的观点</一个rt我cle-title> <source> <italic> 计算神经科学杂志》上</我t一个l我c> <year> 2014年</year> <volume> 36</volume> <issue> 2</我年代年代ue> <fpage> 119年</fp一个ge> <lpage> 140年</lp一个ge> <pub-id pub-id-type="doi"> 10.1007 / s10827 - 013 - 0458 - 4</pub-id> <pub-id pub-id-type="other"> 2 - s2.0 - 84896542522</pub-id> </element-citation> </ref> <ref id="B5" content-type="article"> <label>5</l一个bel> <element-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 西门</年代urname> <given-names> C。</given-names> </name> <name> <surname> Luzzatti</年代urname> <given-names> C。</given-names> </name> </person-group> <article-title> 结合单词在大脑:复合句的处理。介绍了特殊的问题</一个rt我cle-title> <source> <italic> 认知神经心理学</我t一个l我c> <year> 2014年</year> <volume> 31日</volume> <issue> 1 - 2</我年代年代ue> <fpage> 1</fp一个ge> <lpage> 7</lp一个ge> <pub-id pub-id-type="doi"> 10.1080 / 02643294.2014.898922</pub-id> <pub-id pub-id-type="other"> 2 - s2.0 - 84899695606</pub-id> </element-citation> </ref> <ref id="B6" content-type="article"> <label>6</l一个bel> <element-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 贝尔</年代urname> <given-names> m·J。</given-names> </name> <name> <surname> 谢弗</年代urname> <given-names> M。</given-names> </name> </person-group> <article-title> 造型语义透明性</一个rt我cle-title> <source> <italic> 形态</我t一个l我c> <year> 2016年</year> <volume> 26</volume> <issue> 2</我年代年代ue> <fpage> 157年</fp一个ge> <lpage> 199年</lp一个ge> </element-citation> </ref> <ref id="B7" content-type="article"> <label>7</l一个bel> <element-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 战栗</年代urname> <given-names> 年代。</given-names> </name> <name> <surname> Niswander-Klement</年代urname> <given-names> E。</given-names> </name> <name> <surname> Pollatsek</年代urname> <given-names> 一个。</given-names> </name> </person-group> <article-title> 语义透明性的角色在处理英语复合词</一个rt我cle-title> <source> <italic> 英国心理学杂志上的</我t一个l我c> <year> 2008年</year> <volume> 99年</volume> <issue> 1</我年代年代ue> <fpage> 87年</fp一个ge> <lpage> 107年</lp一个ge> <pub-id pub-id-type="pmid"> 17535465</pub-id> <pub-id pub-id-type="doi"> 10.1348 / 000712607 x181304</pub-id> <pub-id pub-id-type="other"> 2 - s2.0 - 39449092617</pub-id> <pub-id pub-id-type="other"> 17535465</pub-id> </element-citation> </ref> <ref id="B8" content-type="article"> <label>8</l一个bel> <element-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Libben</年代urname> <given-names> G。</given-names> </name> </person-group> <article-title> 在化合物的处理语义透明性:后果表示,处理和障碍</一个rt我cle-title> <source> <italic> 大脑和语言</我t一个l我c> <year> 1998年</year> <volume> 61年</volume> <issue> 1</我年代年代ue> <fpage> 30.</fp一个ge> <lpage> 44</lp一个ge> <pub-id pub-id-type="doi"> 10.1006 / brln.1997.1876</pub-id> <pub-id pub-id-type="other"> 2 - s2.0 - 0031778460</pub-id> </element-citation> </ref> <ref id="B9" content-type="article"> <label>9</l一个bel> <element-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Libben</年代urname> <given-names> G。</given-names> </name> <name> <surname> 吉布森</年代urname> <given-names> M。</given-names> </name> <name> <surname> 尹</年代urname> <given-names> y . B。</given-names> </name> <name> <surname> 桑德拉</年代urname> <given-names> D。</given-names> </name> </person-group> <article-title> 复合骨折:语义透明度和形态headedness的角色</一个rt我cle-title> <source> <italic> 大脑和语言</我t一个l我c> <year> 2003年</year> <volume> 84年</volume> <issue> 1</我年代年代ue> <fpage> 50</fp一个ge> <lpage> 64年</lp一个ge> <pub-id pub-id-type="doi"> 10.1016 / s0093 - 934 x (02) 00520 - 5</pub-id> <pub-id pub-id-type="other"> 2 - s2.0 - 0037285421</pub-id> </element-citation> </ref> <ref id="B10" content-type="article"> <label>10</l一个bel> <element-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Juhasz</年代urname> <given-names> b . J。</given-names> </name> <name> <surname> 赖</年代urname> <given-names> 中州。</given-names> </name> <name> <surname> 伍德考克</年代urname> <given-names> m . L。</given-names> </name> </person-group> <article-title> 的数据库629个英语复合字:评级的熟悉,语义意义的主导地位,语义透明性,收购的时代,象性、感官体验</一个rt我cle-title> <source> <italic> 行为研究方法</我t一个l我c> <year> 2015年</year> <volume> 47</volume> <issue> 4</我年代年代ue> <fpage> 1004年</fp一个ge> <lpage> 1019年</lp一个ge> <pub-id pub-id-type="doi"> 10.3758 / s13428 - 014 - 0523 - 6</pub-id> <pub-id pub-id-type="other"> 2 - s2.0 - 84947017373</pub-id> </element-citation> </ref> <ref id="B11" content-type="misc"> <label>11</l一个bel> <element-citation publication-type="other"> <person-group person-group-type="author"> <name> <surname> 特尼</年代urname> <given-names> p D。</given-names> </name> </person-group> <article-title> 语义成分和分解:从识别到的一代</一个rt我cle-title> <comment> <ext-link ext-link-type="url" xlink:href="https://arxiv.org/abs/1405.7908"> https://arxiv.org/abs/1405.7908</ext-link> </comment> </element-citation> </ref> <ref id="B12" content-type="inproceedings"> <label>12</l一个bel> <element-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> Reddy</年代urname> <given-names> 年代。</given-names> </name> <name> <surname> 麦卡锡</年代urname> <given-names> D。</given-names> </name> <name> <surname> Manandhar</年代urname> <given-names> 年代。</given-names> </name> </person-group> <article-title> 复合名词的组合性实证研究</一个rt我cle-title> <conf-name> 第五届国际会议上自然语言处理学报》</conf-name> <conf-date> 2011年11月</conf-date> <conf-loc> 泰国清迈</conf-loc> <fpage> 210年</fp一个ge> <lpage> 218年</lp一个ge> </element-citation> </ref> <ref id="B13" content-type="book"> <label>13</l一个bel> <element-citation publication-type="book"> <person-group person-group-type="author"> <name> <surname> 克拉克</年代urname> <given-names> 年代。</given-names> </name> </person-group> <source> <italic> 词汇意义的向量空间模型。手册的当代语义</我t一个l我c> <year> 2012年</year> <edition> 2日</ed我t我on> <publisher-loc> 纽约,纽约,美国</publisher-loc> <publisher-name> 著名</publisher-name> </element-citation> </ref> <ref id="B14" content-type="article"> <label>14</l一个bel> <element-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 特尼</年代urname> <given-names> p D。</given-names> </name> <name> <surname> Pantel</年代urname> <given-names> P。</given-names> </name> </person-group> <article-title> 从频率的意义:向量空间模型的语义</一个rt我cle-title> <source> <italic> 人工智能研究杂志》上</我t一个l我c> <year> 2010年</year> <volume> 37</volume> <fpage> 141年</fp一个ge> <lpage> 188年</lp一个ge> <pub-id pub-id-type="doi"> 10.1613 / jair.2934</pub-id> <pub-id pub-id-type="other"> 2 - s2.0 - 77952700189</pub-id> </element-citation> </ref> <ref id="B15" content-type="article"> <label>15</l一个bel> <element-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 戴维斯</年代urname> <given-names> M。</given-names> </name> </person-group> <article-title> 当代美国英语的+ 385词语料库(1990 - 2008 +):设计、体系结构和语言的见解</一个rt我cle-title> <source> <italic> 语料库语言学的国际期刊</我t一个l我c> <year> 2009年</year> <volume> 14</volume> <issue> 2</我年代年代ue> <fpage> 159年</fp一个ge> <lpage> 190年</lp一个ge> <pub-id pub-id-type="doi"> 10.1075 / ijcl.14.2.02dav</pub-id> <pub-id pub-id-type="other"> 2 - s2.0 - 68549101775</pub-id> </element-citation> </ref> <ref id="B16" content-type="inproceedings"> <label>16</l一个bel> <element-citation publication-type="confproc"> <person-group person-group-type="author"> <name> <surname> 特尼</年代urname> <given-names> p D。</given-names> </name> <name> <surname> 纽曼</年代urname> <given-names> Y。</given-names> </name> <name> <surname> 艾瑟夫巴德</年代urname> <given-names> D。</given-names> </name> <name> <surname> 科恩</年代urname> <given-names> Y。</given-names> </name> </person-group> <article-title> 字面和隐喻的意义识别通过具体和抽象背景</一个rt我cle-title> <conf-name> 实证方法的会议自然语言处理(EMNLP 11)</conf-name> <conf-date> 2011年7月</conf-date> <conf-loc> 苏格兰爱丁堡</conf-loc> <fpage> 680年</fp一个ge> <lpage> 690年</lp一个ge> <pub-id pub-id-type="other"> 2 - s2.0 - 80053255626</pub-id> </element-citation> </ref> <ref id="B17" content-type="article"> <label>17</l一个bel> <element-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 安德鲁斯</年代urname> <given-names> M。</given-names> </name> <name> <surname> Vigliocco</年代urname> <given-names> G。</given-names> </name> <name> <surname> 文森</年代urname> <given-names> D。</given-names> </name> </person-group> <article-title> 集成经验学习语义表征和分布数据</一个rt我cle-title> <source> <italic> 心理评估</我t一个l我c> <year> 2009年</year> <volume> 116年</volume> <issue> 3</我年代年代ue> <fpage> 463年</fp一个ge> <lpage> 498年</lp一个ge> <pub-id pub-id-type="doi"> 10.1037 / a0016261</pub-id> <pub-id pub-id-type="other"> 2 - s2.0 - 67651176167</pub-id> </element-citation> </ref> <ref id="B18" content-type="article"> <label>18</l一个bel> <element-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> Brysbaert</年代urname> <given-names> M。</given-names> </name> <name> <surname> Warriner</年代urname> <given-names> 答:B。</given-names> </name> <name> <surname> 库珀曼</年代urname> <given-names> V。</given-names> </name> </person-group> <article-title> 具体评级通常为4万英文单词前题</一个rt我cle-title> <source> <italic> 行为研究方法</我t一个l我c> <year> 2014年</year> <volume> 46</volume> <issue> 3</我年代年代ue> <fpage> 904年</fp一个ge> <lpage> 911年</lp一个ge> <pub-id pub-id-type="pmid"> 24142837</pub-id> <pub-id pub-id-type="doi"> 10.3758 / s13428 - 013 - 0403 - 5</pub-id> <pub-id pub-id-type="other"> 2 - s2.0 - 84900022860</pub-id> <pub-id pub-id-type="other"> 24142837</pub-id> </element-citation> </ref> <ref id="B19" content-type="article"> <label>19</l一个bel> <element-citation publication-type="journal"> <person-group person-group-type="author"> <name> <surname> 班尼特</年代urname> <given-names> c . H。</given-names> </name> <name> <surname> 蓝道</年代urname> <given-names> R。</given-names> </name> </person-group> <article-title> 计算的基本物理限制</一个rt我cle-title> <source> <italic> 科学美国人</我t一个l我c> <year> 1985年</year> <volume> 253年</volume> <issue> 1</我年代年代ue> <fpage> 48</fp一个ge> <lpage> 56</lp一个ge> <pub-id pub-id-type="other"> 2 - s2.0 - 0022092665</pub-id> </element-citation> </ref> <ref id="B20" content-type="book"> <label>20.</l一个bel> <element-citation publication-type="book"> <person-group person-group-type="author"> <name> <surname> 塔米尔</年代urname> <given-names> B。</given-names> </name> <name> <surname> 纽曼</年代urname> <given-names> Y。</given-names> </name> </person-group> <source> <italic> 物理的分类</我t一个l我c> <year> 2015年</year> <publisher-name> 复杂性</publisher-name> </element-citation> </ref> </ref-list> </back> </article> </body> </html>