文摘
零代词的挑战型逻辑语法在两个方面。,TLG显示语义构成一个线性资源管理制度,也就是说,代词的要求特殊待遇,如果他们想做资源倍增。2的语法lexicalism TLG只适用于在语音意识到词汇条目,非法在句法推导语音学上空项。Jagor扩展库存category-forming TLG三分之一的连接词的含义创建类别的项目和解决上面的第一个问题。本文更进一步解决第二个问题。为了形式化与零代词的建筑,我们设计一个三元的类别和包括后者Jagor的系统。提出系统proof-theoretically彬彬有礼的。它是完整的,声音,可决定的。更重要的是,零代词的系统中各种形式可以派生。
1。介绍
自然语言是经济,可以说在所有有形的水平,来传达更多的信息以更少的努力(1,2]。在句子层面上,利用各种资源重用策略避开重复。reflexives,有时采取多种的资源代词和助剂,如(1)-(3),有时是隐蔽的,的主题在第二个坐标(4)和控制结构的优点(5)和(6)。有趣的是,然而,相反的故事在语义方面。每个重复的资源,即使是在零形式,可以增添其先行词的意义,重新出现在语义。例如,这两个优点(5)和(6)接控制器的逻辑意思表示解释。它们在逻辑上表示为琼′(主体乔′和对象大胆的),分别,楼上的动词,如(7)和(8)所示。(1)乔声称他将win.代词(2)乔喜欢他自己。反射性的(3)乔走和琼做过省略(4)乔散步和谈判。协调(5)乔我承诺让[职业我待)控制(6)乔问琼我(箴我保持)。对象的控制(7)JEAN′′(JOE′′(待乔′))(8)问′(JOE′JEAN′′呆(琼′))
如何计算的问题这些资源重用机制TLG对语法是一个明显的挑战因为TLG假定monostratal模型对自然语言,这意味着他们只能结合周边物品或建筑。然而,所有上述重用语言(1)-(6)项,包括搞笑,non-constituent协调、控制、不连续结构,照应语/职业定位的几个单词远离其前期/控制器。因此,语法必须能够应对不连续为了成为一名合格的自然语言语法。主要有两种方法可以处理逐字结构类型逻辑设置。一个是代词的治疗是由某些词汇项目包含的语义表示λ运营商绑定多个变量发生(3- - - - - -7]。然而,这种力量的战略高度复杂的词汇条目和强制强大的机制,像二次包装5),到语法。另一种方法是引入语法一个专门设计的操作安全的代词的语义解释简单的恒等函数。海柏尔排列运营商Δ[8免费),雅各布森的变量语义(9,10],Jagor Lambek微积分限制收缩(LLC) [11)所有的尝试,其中去年吸引了最多的关注,产生一系列的逻辑扩展其理论简单(12- - - - - -15]。
Jagor [11)包括一个有限的版本的结构规则的收缩规则1所示。规则1不超过允许前期公式增多。导致系统有限责任公司强调其垂直削减|创建类别的物品。有类别标志A |敌我识别需要分类的前提B如果找到一个,像一个条目的类别一个。因此,(1)中的代词和反身代词(2)身份的功能λx.x的类别np | np。利用|消除规则2,简单的反射性的句子(2)派生如图1。我们使用自然规则或语法派生的税前扣除以下由于原因所11)之间有一个紧密的对应关系证明的结构和句法结构Curry-Howard条款。
规则1。有限的后继表示收缩1
规则2。|消除 尽管这些成功的治疗在不连续,我们发现当前范围的机器难以合理地获得关于零代词的结构,例如,(5)和(6)的优点。省略成分的优点是不同的协调。后者可以推导出广义协调规则(规则3)如图2,而专业人士在嵌入式条款而非协调建设,因此没有资格获得谓词协调。
规则3。广义布尔协调计划
这是在TLG推导代词的的困境。一方面,零代词的必须显式进行适当的语义推导其意义,而另一方面,Lambek微积分不允许零代词的显性化,因为它将引起结构单调性和危害系统的可判定性,允许添加一些公式,类似于一个先行词。
因此,一个理想的系统目前的目的是进一步扩展公司允许公开的秘密逐字物品而不伤害系统的可判定性。这是我们的目前的研究目标。它不同于之前的延伸LLC以这样一种方式,它是一个直接的逻辑扩张,而不是一个类别的词汇丰富,包括逐字削减控制动词(12),并可能提供更细致的版本的注意热门作品连接TLG计算分布语义(16- - - - - -20.]。节2flash,我们将我们的理论假设零代词的,然后现在公理化报告,Gentzen样式后继配方和标记的自然演绎新系统LLCM部分3- - - - - -5分别完成证明LLCM,健全,可决定的。更多关于零代词的语言现象也将讨论部分5。
2。主线槽和LLCM
我们要遵循Jager照应语的方法(11)和扩展公司在某种程度上,它可以容纳两个可取的属性:1,系统应该允许公开的秘密项目;2、明确项目应该逐字。这意味着系统应该允许代词的和零代词的。通过这种方式,控制建筑的优点可以占用一个实际的逻辑形式以及在句子推导解释。因此,(5)和(6)可以推导出理想的数据3和4,在那里待可以拿起正确的主题相同的控制器,而不是抢劫楼上predicate-its左邻居的直接对象是它的主题。(为了简化推导,我们忽略了形态区分有限和无限的VPs和治疗待作为一个单一的词汇条目。)
我们名字的位置零代词的驻留”主线槽。“因此,在胚胎应该像一个主线槽介绍规则规则4。
规则4。主线槽的介绍
下类型逻辑的角度来说,引入一个主线槽在语法意味着语法成分的逻辑允许有点“冗余”(因为他们是秘密在实际话语),但不是任意类别在一个有效的演绎。这相当于一个假设:单调性的结构规则的语法以这样或那样的方式。因此,我们名字系统LLCM,意义有限责任公司与有限的单调性。
我们提出了一个三元范畴
,在这是一个搞笑槽操作符(有时简化为
)。这可能有助于揭示如何介绍了零代词的分类,删除,或连接与类别向左或向右。与控制结构和优点,根据我们的经验有一个更好的衔接顺序在相邻的字符串“a, B, C,”B将连接C(如果有一个C来B的右),结果将进一步连接在左边的左邻居一个。因此,零代词的,公开的,应该遵守限制收缩2(5)规则的结果表示。
规则5。后继REPRENTATION有限的收缩 在接下来的两个部分,我们将定义LLCM公理的版本和Gentzen风格后继配方,并且证明它是合理的、完整的、可决定的在这样的扩张。
3所示。LLCM模型理论
现在我们延长LLC的库存category-forming三元操作符连接词 。所以组LLCM类别ℱ原子类别下面的集合。
定义1。LLCM类别
如果F是一个格式良好的LLCM类别呢F/F,F\F,F|F,F·F和[F< F >F]也格式良好的LLCM类别。
所有格式良好的LLCM类别是递归地定义为在定义1。接下来,一个声音和LLCM成套model-theoretic解释。
定义2。LLCM模型(该模型是基于有限责任公司(11)和一个初步的版本系统是在我们以前的工作21]。)
一个模型LLCM是一个元组<W,R,年代,T、∼f, g>,W是一个非空的语言符号,T⊆W4是第四纪关系W;(R, S)⊆W3是三元关系W;∼⊆W2是一个二元关系W;f从原子是一个函数类别的子集W;和是一个函数从LLCM-categoriesW。验证点之间的关系W和LLCM类别定义如下:║p║=f(p)⊆W║一个•B║= {x|∃yz(Rxyz&y
║一个║&z
║B║]}║一个\B║= {x|∀yz(Rzyx&y
║一个║⇒z
║B║]}║一个/B║= {x|∀yz(Rzxy&y
║B║⇒z
║一个║]}║一个|B║= {x|∃y(Sxyg(B)&y
║一个║]}║一个
C║= {x|∃yzu(Txyzu&y
║一个║&z
║B║&u
║C║]}三元关系R可以作为普通语法语言符号之间的连接。Rxyz意味着,如果y和z相邻的顺序发生,两者的结合得到一个x。关系年代是一种三元关系(11]。它类似于R但它负责逐字决议。Sxyz意味着x是变成了y如果有一个元素相似z(注意y∼z在意义公设)可以用来解决前期。关系T模型和主线槽操作Txyzu意味着x是插入的结果吗z在这两者之间y和u。
以下假设持有意义:MP1∀xyzwu(Rxyz&Szwu⇒∃(Sxvu&Rvyw]]MP2∀xyzwu(Rxyz&Sywu⇒∃(Sxvu&Rvwz]]MP3∀xyzwuv(Rxyz&Sywu&Szvu⇒∃r(和&Rrwv]]MP4∀xyzwu(Rxyz&Szwu&y∼u⇒Rxyw]里∀一个
(
为每一个为⇒∼
(一个)]MP6∀xyzu(Rxyz⇒Txyuz]MP7∀xyzu(Txyzu⇒∃(Rxyv&Rvzu]]MP8∀xyzuvw(Rxyz&Tzuvw⇒∃t(Txtvw&Rtyu]]MP9∀xyzuvw(Rxyz&Tyuvw⇒∃t(Txtvw&Rtuz]]MP10∀xyzuvw(Rxyz&Tzuvw⇒∃t(Txuvt&Rtyw]]MP11∀xyzuvw(Rxyz&Tyuvw⇒∃t(Txuvt&Rtwz]]MP12∀xyzuvwst(Rxyz&Tyuvw&Tzsvt⇒∃ab(Txavb&劳&Rbwt]]MP13∀xy(Rxyy⇒y⊆x]MP14∀B(
≠]MP1-5意味着假设关系年代(11]。议员6 - 7有关系TLLCM,表现出一个重要的特性。他们说如果x包含一个主线槽x由y和z,然后x也可以由吗y和其中是连接的结果吗z和秘密u。换句话说,一个复杂的信号与一个主线槽可以表示同样要么有或没有照应语参与它的句法成分。在三元操作符MP8-12展示类别组成与周边类别。MP13说,扩展了一套语言符号下封闭R。最后一个假设是一个结构假设互补MP6, MP7。
定义3。公理化的版本LLCM
的公理版本LLCM时获得的系统以下12个公理和4规则添加到L的公理化的版本:A1一个•B|C⟶(一个•B)|CA2一个|B•C⟶(一个•C)|BA3一个|C•B|C⟶(一个•B)|CA4一个•B|一个⟶一个•BA5一个•C⟶[一个〈B〉C]A6(一个〈B〉C]⟶一个•(B•C)A7D•(一个〈B〉C]⟶[(D•一个)〈B〉C]A8(一个〈B〉C)•D⟶[(一个•D)〈B〉C]A9D•(一个〈B〉C]⟶[一个〈B〉(D•C)]A10(一个〈B〉C)•D⟶[(一个〈B〉(C•D)]A11(一个〈B〉C)•D〈B〉E]⟶[(一个•D)〈B〉(C•E)]A12一个•一个⟶一个(单调性)演绎规则:D1
D2
D3
D4
然后我们可以证明公理版本的可靠性和完整性,密切遵循的证明l在[22)和有限责任公司(11]。我们将开始与公理6和D2。其余病例已经证明在11]。
定理1。稳健
如果LLCM├一个⟶B,然后对所有模型米,║一个║⊆║B║
。
证明。一个•C⟶
假设x
║一个•C║
。还有y
║一个║和z
║C║这样Rxyz。根据MP14 MP6,u
║B║这样Txyuz。因此,对x
║一个•C║
,有y
║一个║
,u
║B║
,和z
║C║这样Txyuz,从而x
║║
。
现在证明(一个〈B〉C]⟶一个•(B•C)。
假设x
║║
。还有y
║一个║
,z
║B║
,和u
║C║这样Txyzu。根据假设7,有一个这样Rxyv和Rvzu。因此
║B•C║
,因此x
║一个•(B•C)║
。
公理7 - 11的规定结合性三元范畴。这里我们将证明公理7只。
现在证明D•(一个〈B〉C]⟶[(D•一个)〈B〉C]。
假设x
║D•║
。还有y
║D║和z
║║这样Rxyz。此外,有一个y
║D║这样Rxyz,u
║一个║
,
║B║
,和
║C║这样Tzuvw。MP8需要有一个t这样Txtvw和Rtyu。因此t
║D•一个║
,然后x
║[(D•一个)C]║
。
最后,我们证明•一个⟶一个。
假设x
║一个•一个║
。然后有一个y
║一个║这样Rxyy。MP13需要,y⊆x。由于⊆W下封闭,因此x
║一个║
。
证据推理规则是相似的。我们将留给读者作为练习。
定理2。完整性
对于所有LLCM-models米,如果║一个║⊆║B║
,然后LLCM├一个⟶B。(我们可以使用├代表LLCM├当没有误解的产生)。
证明。我们开始构建一个规范模型厘米= <W,R,年代,T、∼f, g>,W仅是一组所有LLCM类别。
所有原子的种类p,f(p)= {一个|├一个⟶p}。RABC敌我识别├一个⟶B•C,南非广播公司敌我识别├⟶B|C,TABCD敌我识别├一个⟶[B〈C〉D),和一个∼B敌我识别├一个⟶B,和g (一个)=一个对所有类别A和B。一个iff├⊆BB⟶一个那么我们下面的引理证明真相。
3.1。真理引理
在标准模型厘米,它适用于所有LLCM类别一个和B那一个 ║B║C 敌我识别├一个⟶B。
证明。我们证明这个通过感应的复杂性B。如果B是原子,它是直接从建设f。如果B由三个Lambek连接词或LLC的逐字连接,感应的证明步骤,在11,21]。我们将只显示感应步骤三目操作符。
⇒假设B= (C<E>D)和假设一个
║[C<E>D]║C
。还有y
║C║C
,z
║E║C
,和u
║D║C
这样TAyzu根据定义的]。这意味着一个1
║C║C
,一个2
║E║C
,和一个3
║D║C
这样TAA1一个2一个3。由此可见,├一个1⟶C,├一个2⟶E,├一个3⟶D,├一个⟶[一个1<一个2>一个3)的规范化模型定义。通过D2、D3、D4,它遵循[一个1<一个2>一个3]⟶[C<一个2>一个3]、[C<一个2>一个3]⟶[C<E>一个3),(C<E>一个3]⟶[C<E>D),分别。因此├一个⟶[C<E>D]。
⇐假设├一个⟶[C<E>D]。顺便说一下模型构造,有tac。归纳假设,C
║C║C
,E
║E║C
,和D
║D║C
。因此,有一个这样的tac。顺便说一下()定义,因此一个
║[C<E>D]║C
。
然后我们必须证明所有假设LLCM的定义2由该模型实现。他们遵循直接从模型建设、单调性的产品,和上面的真理引理,从而不会这里提供。■
最后,我们将显示所有LLCM有效公式在LLCM可诱导的。让║一个║C
⊆║B║C
。假设LLCM⟶B不是可诱导的。应该有一个一个∉║B║C
引理的真理。身份公理,├一个⟶一个。因此总有一个
║一个║C║,情况就不一样了一个║C
⊆║B║C
,这与我们的假设。因此,在LLCM⟶B是可诱导的。
从今以后,LLCM的公理系统是合理和完整。
4所示。后继的LLCM
为了描述LLCM的可判定性,我们需要其Gentzen-style后继演示。的后继表现LLCM延伸,LLC的提议R和L为主线槽操作符 ,和单调性。为简单起见,我们将省略标记λ后继表示在目前的部分条款。
定义4。后继的LLCM 证明结果演示相当于公理版本,引理1是必要的。而且,一个函数σ映射中所有逗号后继产品•利用确保类别类型对应。因此,σ(一个)=一个;σ(X,Y)=σ(X)•σ(Y)。
引理1。箭头σ(ΔΓ[一个1 C1),Y1,Z1,…一个n Cn),Yn,Zn)⟶[σ(Γ一个1,Y1、…一个n,Yn)σ(ΔC1,Z1、…Cn,Zn)是可诱导的LLCM公理的版本。
证明。为n= 1,箭头σ(ΔΓ[一个1
C1),Y1,Z1)⟶[σ(Γ一个1,Y1)σ(ΔC1,Z1)是由公理7 - 10和方式”σ”的定义。
如果箭头时n=k。通过归纳假设,箭头σ(ΔΓ[一个1
C1),Y1,Z1,…一个k
Ck),Yk,Zk)⟶[σ(Γ一个1,Y1、…一个k,Yk)σ(ΔC1,Z1、…Ck,Zk)持有的公理化的版本。很明显,有σ([一个k+ 1
Ck+ 1),Yk+ 1,Zk+ 1)⟶[σ(一个k+ 1,Yk+ 1)σ(Ck+ 1,Zk+ 1A8和A10)]。通过“•”的单调性,有:σ(ΔΓ[一个1〈B〉C1),Y1,Z1,…一个k〈B〉Ck),Yk,Zk)•σ([一个k+ 1〈B〉Ck+ 1),Yk+ 1,Zk+ 1)⟶[σ(Γ一个1,Y1、…一个k,Yk)〈B〉σ(ΔC1,Z1、…Ck,Zk))•σ(一个k+ 1,Yk+ 1)〈B〉σ(Ck+ 1,Zk+ 1)]
通过σ的定义和A11,我们得到σ(ΔΓ[一个1〈B〉C1),Y1,Z1,…一个k〈B〉Ck),Yk,Zk,(一个k+ 1〈B〉Ck+ 1),Yk+ 1,Zk+ 1)⟶[σ(Γ一个1,Y1、…一个k,Yk,一个k+ 1,Yk+ 1)〈B〉σ(ΔC1,Z1、…Ck,Zk,Ck+ 1,Zk+ 1)]
引理1。因此证明。
定理3。等价公理和GENTZEN演示
LLCM├X⇒一个敌我识别├σ(X)⟶一个是可诱导的公理化的版本。
省略了证明当前的目的。LLCM的等价性证明的公理和后继版本同样的原因Lambek证明了L的等价的后继版本和公理。可判定性是可决定的减少消除在后继表示,这个结果可以在其中进一步渗透其公理的版本。
定理4。减少消除
如果LLCM├X⇒一个,然后有一个驱散后继证明LLCM├X⇒一个。
为了证明这个定理,我们必须区分三种情况:(1)的至少一个前提削减是一个身份公理;(2)这两个前提是逻辑规则的结果,和削减公式是活跃的公式在这两个前提;(3)这两个前提产生引入逻辑规则,和削减公式不是活跃的公式在一个前提。证明是留给读者作为练习。
定理5。可判定性
可判定性LLCM可决定的。
证明。对于每个规则的“后继微积分,每个规则的结论结果包含更多的比它的前提,因为每个符号公式前提发生子公式的结论,每个逻辑规则引入了一个连接。此外,只有有限的方式来匹配特定的结果与一些后继规则的结论。结果,总是在最有限的选择做一个自底向上的搜索和证据证明树的每一个分支是有限的。可判定性LLCM因此可决定的。
5。测试更多的语言现象
5.1。在树状LLCM自然演绎
在测试之前更多的语言现象,我们提供LLCM标记的自然演绎在树状。部分1和2所示,标签在树状有助于可视化type-logical扣除扣除一个句子。假设Δ是一个n必要的运营商,ΔE和Δ我分别代表其消除规则和规则。在这里,我们将提供< >我只。
定义5。< >介绍规则树状 〈〉我使秘密或省略代词的插入之前结构构造。然而,E,不是因为是一个临时的符号说明零代词的策略。的符号将会消失当零代词发现其先行词,增加其解释|E。现在我们可以展示的魅力LLCM更多的语言结构,允许零代词的。
5.2。推导优点
我们列表的搞笑和控制结构(1)-(6)展览只有冰山一角的零代词的使用自然语言。生成语法区分两种类型的零代词的。除了优点,仅限于非谓语形式的条款的主题位置的控制结构(5)和(6),零代词有限制的举止比其他地区发生的优点。语言经济允许了代词在许多语言。他们被称为小箴。例如,主语代词用西班牙语可能从紧张的条款(9),在中国,主体和客体代词可能下降在类似的情况下(10)和(11)。显然,type-logical系统准备获得正确阅读句子这些语言将能够插入主线槽中的省略代词和增加语义资源合理。(9)何塞·萨比(el /箴ha sido visto将作为这些活动的穷玛丽亚]。(22]。何塞知道他看到了/∅玛丽亚。何塞知道(他)一直被玛丽亚”。(10)Zhangsan我烁[Lisi母鸡西环箴 我/ j]。(23]。乔说李非常喜欢[他]。“乔我Lisi说喜欢他我/ j]。(11)Zhangsan我烁[助教/箴母鸡西环箴 我/ j]。乔说他/∅非常喜欢∅乔说,(他)喜欢他/它…。”
因此,当Lambek系统配备逐字削减和搞笑的槽位操作符,就和我们预期一样强大。例如,推导(见图9)5。
在中国,主体和客体代词的紧张的条款可以删除。但是,下降对象不能把矩阵主体作为它的先行词,但其他一些人的话语。例如,在下面的中国话语(12),箴发言人B的回答只能参考对象的问题。理想情况下,如果我们的系统允许插入的代词的搜索其先行词在句子边界,它可以获得(10)相同的方式(图12)6。推导等句子(11),主体和客体是同样的。(12)演讲者:Zhangsan西环华聚吗?乔喜欢舞台剧Q吗?“乔喜欢舞台剧吗?”发言人B: Zhangsan烁ta母鸡西环箴。乔说他非常喜欢它。
6。讨论
LLCM标记的自然演绎在LLCM树状显示,与不同程度的零代词的句子都是可诱导的,无论是专业限制发生,或pro-drop限制较少语法。将会呈现出一种非常有前途的图片。然而,诗歌,因为它似乎是,优点是更复杂的比我们认为的情况,因为它们是在不同的限制pro-drop语言。如何调整系统根据不同的语言的需求仍然是一个问题。这可能是一个好主意建立通用模型和分配不同的参数对不同语言在多通道2024]。我们将把它未来的工作。(25]。
从子结构逻辑、系统与三元复杂LLCM类别是一个特定的子结构逻辑系统。它不仅股票结构规则如结合律和交换律,但也包含单调性和有限的收缩的变种,其公理相对应一个•C⟶一个•(一个•C)。这条规则可以插入左边的类别一个,正是需要零代词的表征。然而,语言事实也证明类别B五月利于槽与类别以外的槽。换句话说,省略或秘密类别可能承担一个逐字与槽外的类别。因此,我们规定的三类利于槽不同于彼此并提出收缩的变体。这还需要进一步的研究在理论意义从子结构逻辑的角度的变体。
数据可用性
用于支持的数据分析研究可从相应的作者在合理的请求。
的利益冲突
作者宣称没有利益冲突。
确认
这项研究是由主要的国家社会科学基金项目(批准号17 zda027)和中国国家社会科学基金(批准号21 fzxb020)。