文摘gydF4y2Ba

算法是一项具有挑战性的自然语言处理(NLP)与应用程序的一部分,在机器翻译,语义搜索和其他信息检索,和决策支持系统。算法需要语言预处理和丰富的语言资源来自动识别和解决这样的表达式。许多罕见的和资源不足的语言(比如立陶宛)缺乏所需的语言资源和工具。我们提出算法的一种方法,在立陶宛语言及其申请处理e-health记录医院接待。我们的新奇的过程以最少的语言指称相同资源的能力,这是重要的稀有和濒危语言在语言应用中。实验结果表明,算法适用于NLP-powered在线医疗服务的发展在立陶宛。gydF4y2Ba

1。介绍gydF4y2Ba

数字医学信息的手段,特别是当应用自然语言处理(NLP),应用程序中是不可或缺的e-health和数字化的医疗记录和流程(gydF4y2Ba1gydF4y2Ba]。NLP已经证明的使用作为一个低成本的替代传统的医疗方法在许多情况下,如预测压力症状和自杀风险在自由文本响应通过手机发送gydF4y2Ba2gydF4y2Ba),或通过监控发现季节性疾病暴发的搜索引擎查询(gydF4y2Ba3gydF4y2Ba从社交媒体,发现医疗知识(gydF4y2Ba4gydF4y2Ba,gydF4y2Ba5gydF4y2Ba]。gydF4y2Ba

语义Web技术的发展,网络信息检索(IR)对基于红外正在改变。检索到的文档与用户相关的质量也高度依赖信息提取(IE)方法应用。一般来说,即侧重于自动提取结构化信息从非结构化源。标准文档文本预处理步骤中使用IE是词法分析、形态分析、和命名实体识别(尼珥),可辅以指称相同分辨率和语义注释。这里的主要问题是自然语言的模糊性和复杂性,从而使进展即依赖NLP技巧的发展。而广泛使用的语言(如英语),IE-related NLP研究已经达到成熟的水平和大规模实际应用(例如,IBM Watson项目)gydF4y2Ba6gydF4y2Ba),但资源贫乏的语言,比如立陶宛(gydF4y2Ba7gydF4y2Ba),保持一个开放的NLP研究领域。基准应用程序通常是引向自动化概念提取(gydF4y2Ba8gydF4y2Ba,gydF4y2Ba9gydF4y2Ba),通常结合文本挖掘(gydF4y2Ba10gydF4y2Ba,gydF4y2Ba11gydF4y2Ba]。gydF4y2Ba

尼珥在应用到生物医学文本是一个关键的步骤开发智能医疗保健的决策支持工具。示例如下:药物知名度(医嘱)承认药理物质(生物医学文本和把他们发现的药物之间的相互反应gydF4y2Ba12gydF4y2Ba,gydF4y2Ba13gydF4y2Ba];生物命名实体识别(bn)中提取生物医学概念感兴趣的基因和蛋白质等(gydF4y2Ba14gydF4y2Ba];和医疗实体识别,从非结构化信息提取电子健康记录(gydF4y2Ba15gydF4y2Ba- - - - - -gydF4y2Ba17gydF4y2Ba]。这些研究包括临床描述映射到系统化的医学术语的规范(gydF4y2Ba18gydF4y2Ba)或其他医学词典。非结构化文本在医学领域包含有价值的医疗信息,还有很多错误,比如拼写错误,语法使用不当和语义含糊不清,这阻碍了数据处理和分析(gydF4y2Ba19gydF4y2Ba]。结构化的医学领域知识使用的生物医学本体和受控词汇表提供支持数据标准化和互操作性,医疗管理和临床决策支持gydF4y2Ba20.gydF4y2Ba]。丰富的语义关系相关的概念如在统一的医学语言(uml)导致医疗数据集成系统,从电子医疗纪录模式挖掘,临床医学实体识别文本和临床数据共享gydF4y2Ba21gydF4y2Ba]。在线医疗保健服务的发展强大的平台为用户提供了一个机会来解决健康问题,如改善以病人为中心的护理和支持自我管理。用户考虑在线医疗服务作为一个重要的卫生信息来源,但仍需要更强大的语义搜索引擎到达明智的决定在他们自己的健康和更积极参与医疗过程(gydF4y2Ba22gydF4y2Ba]。然而,这些服务很大程度上依赖于所提供的支持自然语言处理。gydF4y2Ba

我们以前的工作包括语义搜索的发展框架(gydF4y2Ba23gydF4y2Ba)回答问题提出了结构化立陶宛语言,基于语义的业务词汇表和业务规则(SBVR)表述语言。我们的结果(gydF4y2Ba23gydF4y2Ba)显示,有一种强烈的需要补充的NLP管道语义搜索算法。这样的算法工具尚未为立陶宛语言开发,尤其是非常sector-important数字医疗应用程序中,我们应用我们的算法过程的数字记录医院接待。因此,创建这样的工具是一个先决条件进一步改善NLP-supported健康决策的立陶宛语言,而经验可以扩展到对其他资源不足语言开发语义搜索工具。gydF4y2Ba

剩下的论文结构如下。节gydF4y2Ba2gydF4y2Ba,我们分析算法领域的相关工作,包括最先进的和方法提出了语言的语法类似于立陶宛。部分gydF4y2Ba3gydF4y2Ba和gydF4y2Ba4gydF4y2Ba目前指称相同分辨率算法及其实验评估。部分gydF4y2Ba5gydF4y2Ba提出结论和讨论未来的工作。gydF4y2Ba

机器学习和基于规则的方法是有效的方法在语义加工,特别是加强与外部知识和指称相同的线索来自于结构化文档,而通常仍执行更好的(与经典的实现相比)算法时提供地面实况提到[gydF4y2Ba24gydF4y2Ba与脚手架方法[],而进一步扩大gydF4y2Ba25gydF4y2Ba]。无监督的方法可以应用于大规模场景(gydF4y2Ba26gydF4y2Ba,gydF4y2Ba27gydF4y2Ba]。或者,可以使用一个混合策略基于一组统计措施和句法和语义信息(gydF4y2Ba28gydF4y2Ba]。“现成的”类型的IR算法可以利用相当成功的场景,尤其是集中有限的地区(在医学意义上)gydF4y2Ba29日gydF4y2Ba]。通过分析可以进一步提高准确率卦频率(gydF4y2Ba30.gydF4y2Ba)和应用graph-style算法(gydF4y2Ba31日gydF4y2Ba在上下文敏感的语料库碎片。gydF4y2Ba

一般来说,指称相同分辨率的方法可以分为知识和知识贫富。这两种方法都需要大量资源,如语义信息语法注释或preannotated全集的医院记录从医院接待。的资源下,罕见的语言,像立陶宛,通常不会有这样的资源。gydF4y2Ba

而最新的,没有研究已经完成在立陶宛解决指称相同,但对其他语言提出了许多解决方案,主要用于英语(表gydF4y2Ba1gydF4y2Ba)。注意,评价结果不具有直接可比性,正如作者使用不同的全集。gydF4y2Ba

考虑语言或多或少的语法类似于立陶宛(波罗的海的语言之一),我们总结相关工作在拉脱维亚(只有其他波罗的海语言)和斯拉夫语言如波兰、俄罗斯和捷克在表gydF4y2Ba2gydF4y2Ba。gydF4y2Ba(我)gydF4y2Ba对于拉脱维亚,唯一的解决办法是LVCoref [gydF4y2Ba45gydF4y2Ba]。它是一个基于规则的系统,使用一个entity-centric模型。它关注的是命名实体匹配(精确匹配,首字母缩写),并使用霍布斯对代词的算法。gydF4y2Ba(2)gydF4y2Ba对波兰来说,基于规则的统治者(gydF4y2Ba46gydF4y2Ba)评分的候选人使用指称相同性别/数量和包括(删除嵌套组)规则,引理,Wordnet名义规则表达式和专门针对代词代词规则。BARTEK [gydF4y2Ba47gydF4y2Ba)是巴特的适应,这是专为英语,波兰。混合波兰指称相同分辨率的方法结合了神经网络的体系结构和sieve-based方法(gydF4y2Ba48gydF4y2Ba]。gydF4y2Ba(3)gydF4y2Ba对俄罗斯,俄罗斯- eval - 2014 (gydF4y2Ba49gydF4y2Ba)是一个评估活动的主线和指称相同分辨率工具,采用各种各样的方法。评价了俄罗斯指称相同语料库(RuCur)。机器学习方法(gydF4y2Ba50gydF4y2Ba)也使用。gydF4y2Ba(iv)gydF4y2Ba捷克,指称相同注释在布拉格的tectogrammatical层依赖树图资料库(PDT)和他们的第一个指称相同分辨率的方法是基于规则(gydF4y2Ba51gydF4y2Ba]。起初,所有可能的候选人被收集并使用8缩小了过滤器列表,然后从剩余的接近corefering对象选为前提。Nguy et al。gydF4y2Ba52gydF4y2Ba)两种老英语的方法适应捷克语言和使用决策树的C5 classifier-based方法,而ranker-based方法采用平均感知器算法。这两种方法都是训练和评估在输配电数据ranker-based方法提供更好的结果。Treex CR (gydF4y2Ba53gydF4y2Ba)是为捷克语言和开发适应英语,俄语,和德国,尽管俄罗斯和德国,英语指称相同标签预计,结果明显降低(gydF4y2Ba54gydF4y2Ba]。gydF4y2Ba

总之,基于规则的解决方案的优势更容易适应能力和良好的培训数据时提供可比的结果不能作为是立陶宛。许多更高级的解决方案不能完全适应少和资源不足的语言由于缺乏可用的语言资源,与立陶宛语言一样。例如,64年巴特当时支持特征提取器,但由于缺乏对波兰语言的特定于语言的资源,只有13可以利用。不重语言资源的解决方案可以为资源贫乏的语言通常是非常有用的。gydF4y2Ba

3所示。一个基于规则的算法:立陶宛gydF4y2Ba

3.1。定义和框架gydF4y2Ba

算法(或重复法)是一个表达式,这取决于另一个词或短语的解释提出了早些时候在文本(前期)。例如,“汤姆有背痛。他受伤。”“汤姆”和“他”指的是同一个实体。不解决这两个结构之间的关系,不可能确定为什么汤姆背痛,也没有人受伤。在这种情况下,语义信息将会丢失。gydF4y2Ba

逐字表达对象有代词,不能单独解释没有回到它的先行词。在这个工作中,这样的表达式称为指称相同,除非应区别。使用这些表达式可以取决于文本的类型和风格。在这里,我们专注于文本从医疗领域。gydF4y2Ba

在语义搜索算法框架的作用是提供额外的语义信息命名实体识别后语义注释(图gydF4y2Ba1gydF4y2Ba)。gydF4y2Ba

3.2。概念模型的算法gydF4y2Ba

在这一章,一个概念化的算法。一个给定的模型,即表示为UML类图(图gydF4y2Ba2gydF4y2Ba),指定中扮演一定的角色的概念提取某种类型的指称相同。模型给我们以下的理解:gydF4y2Ba(我)gydF4y2Ba什么功能的文本、句子和单词帮助我们识别指称相同的存在(它们包中指定的输入流)的概念gydF4y2Ba(2)gydF4y2Ba什么样的文本预处理是必需的gydF4y2Ba(3)gydF4y2Ba需要哪些额外的资源解决某些类型的指称相同(它们包中指定数据库公共人员和职业分类)gydF4y2Ba

例如,从提供的模型,很明显,在算法开始之前,重要的是对文本进行预处理,获得以下:gydF4y2Ba(我)gydF4y2Ba文本分割成句子和词位gydF4y2Ba(2)gydF4y2Ba词位的形态学特征识别gydF4y2Ba(3)gydF4y2Ba命名实体识别gydF4y2Ba

文本预处理的算法本身并不是一个任务,这超出了本文的范围。gydF4y2Ba

值得提及的是模型是相当抽象的,独立于语言和技术无关的。因此,它不仅适用于立陶宛但语法上类似的语言。这个模型用于概念的形式化算法规则在下一节。下面更详细地解释这些概念。gydF4y2Ba

算法的主要概念gydF4y2Ba文本gydF4y2Ba,gydF4y2BaLexical_UnitgydF4y2Ba,gydF4y2BaNamed_EntitygydF4y2Ba。这个概念gydF4y2Ba文本gydF4y2Ba假设一个文本文档的内容应该是分析。每个测试都有一个关联的出版日期,这对解决指称相同很重要。每个文本包括至少一个gydF4y2BaLexical_UnitgydF4y2Ba,包括段落、句子、单词和标点符号,分为gydF4y2Ba句子gydF4y2Ba和gydF4y2Ba语义gydF4y2Ba类别。gydF4y2Ba语义gydF4y2Ba假定词法单位如文字、标点符号和数字。每个语义的特征是一个引理和演讲的一部分,其中一些(名词和代词)语法性别和数字。的语义可以通过POS专业类别:gydF4y2Ba名词gydF4y2Ba,gydF4y2Ba代词,gydF4y2Ba和gydF4y2BaOther_Part_Of_SpeechgydF4y2Ba。特殊情况的gydF4y2BaOther_Part_Of_SpeechgydF4y2Ba是gydF4y2Ba逗号gydF4y2Ba和gydF4y2Ba结合,gydF4y2Ba所需的一些算法规则条件的描述。gydF4y2Ba

一个gydF4y2BaNamed_EntitygydF4y2Ba概念定义了一个对象,代词或某些名词可以参考。尼珥算法通常识别三种类型的实体:一个人(gydF4y2BaPerson_NEgydF4y2Ba),一个组织(gydF4y2BaOrganization_NEgydF4y2Ba)和一个位置(gydF4y2BaLocation_NEgydF4y2Ba)。人的命名实体类型需要特别关注一个人可以使用代词不仅提到但也使用他/她的位置(gydF4y2BaPosition_HeldgydF4y2Ba)和一个专业名称(gydF4y2Ba职业)gydF4y2Ba。对一个人的额外信息可以帮助解决这种指称相同更精确。作为一个例子,这样的信息来源可能是一个公众人物的数据库,其中包括gydF4y2BaKnown_PersongydF4y2Ba——著名的人提到gydF4y2BaPerson_NEgydF4y2Ba在文本中。算法的输出算法gydF4y2Ba指称相同gydF4y2Ba——coreferents之间的关系。对于每一个指称相同,其类型(名义和代词的)亚型(关系代词和名词重复)、位置(点向后、向前或无关紧要的重复),和组(单数,指的是指称相同组或模棱两可)指定。每个referent至少指一个coreferent(一个概念gydF4y2Ba提到gydF4y2Ba)。每一个gydF4y2Ba提到gydF4y2Ba在文本是从一个特定的位置,一定长度,符合至少一个gydF4y2Ba语义gydF4y2Ba。他们中的一些人可以适应一定的gydF4y2BaNamed_EntitygydF4y2Ba。gydF4y2Ba

3.3。指称相同分辨率的算法gydF4y2Ba

指导方针的决策表的应用一定的分辨率算法如图所示gydF4y2Ba3gydF4y2Ba。检查条件连续文本中的每个词位,,如果条件满足,相应的算法被激活。例如,如果是满足C2条件立即A1算法被激活。gydF4y2Ba

为解决特定类型的引用,我们建议以下算法:gydF4y2Ba(我)gydF4y2BaA1:具体规则解析算法解决某些代词的使用gydF4y2Ba(2)gydF4y2BaA2:一般代词分辨率算法关注的情况下,代词指代的名词(或名词短语)被认为是“人”类的命名实体gydF4y2Ba(3)gydF4y2BaA3: PRA(部分、重复和缩写)分辨率算法分辨率名词公认为命名实体及其重复使用相同的文本gydF4y2Ba(iv)gydF4y2BaA4:美国卫生和公众服务部(上义词、下义词同义)分辨率算法分辨率名词公认的职业名称包括同义词和上义词和下义词gydF4y2Ba(v)gydF4y2BaA5:特性解析算法解决名词表示某些功能(目前只有公共位置被关押)命名实体的一个人gydF4y2Ba

指称相同分辨率从每个词位的序列分析寻找某种类型的代词和名词。根据确定语义的特点,决定进一步分析。决策表(图gydF4y2Ba3gydF4y2Ba)总结条件一定分辨率的应用算法。左上象限中列出的条件;列出了决定选择在左下象限。右上象限显示了可能的替代条件相应的行。在右上象限,答案“na”代表“不相关的。”在右下象限,“✓”意味着算法应该应用和“✗”意味着它不应该被应用。gydF4y2Ba

的想法是pronoun-related指称相同顺序应该首先解决通过检查条件C1, C2, C3。然后noun-related指称相同分辨率C4顺序应该首先检查条件,C6, C7。gydF4y2Ba

3.4。正式的描述算法算法gydF4y2Ba

一阶逻辑(符合)公式是用来定义算法的主要条件时应检查解决指称相同。指称相同分辨率的概念模型(图gydF4y2Ba2gydF4y2Ba)成为了谓词或常量符合公式:类成为一元谓词的名称相同的类;之间的关联的类名称相同的二进制谓词协会;同名的属性的类二元谓词属性+动词”“初;和enumerations-constants的文字。gydF4y2Ba

算法遵循立陶宛语言的语法规则是基于形态特征的分析词位及其秩序的句子和文本。立陶宛语言的例子句子尽可能被译成英语。专有名词都改为通用缩写遵守GDPR。gydF4y2Ba

3.4.1。A1:特定规则解决gydF4y2Ba

在某些情况下,存在一个相当刚性结构对代词的使用,它可以很容易地通过使用特定的规则定义,例如,gydF4y2Ba(我)gydF4y2Ba(LT)Šiandien buvo atėjęsgydF4y2BavyrasgydF4y2Ba(名词)gydF4y2BakurisgydF4y2Ba(代词)skundėsi nugaros skausmu。gydF4y2Ba(EN)gydF4y2Ba男人。gydF4y2Ba(名词)gydF4y2Ba谁gydF4y2Ba(代词)有背痛今天来。gydF4y2Ba(2)gydF4y2Ba(LT)Šiandien buvo atėjęsgydF4y2BavyrasgydF4y2Ba(名词)gydF4y2Ba苏gydF4y2Ba(介词)gydF4y2BakuriuogydF4y2Ba(代词)aptarėme nugaros skausmą。gydF4y2Ba(EN)gydF4y2Ba男人。gydF4y2Ba(名词)gydF4y2Ba与gydF4y2Ba(介词)gydF4y2Ba谁gydF4y2Ba(代词)今天我们讨论了背痛。gydF4y2Ba

两个例子是相似的在他们的建筑:(名词)(逗号)(可选的介词)(具体的代名词)。在这两种情况下,代词指的是名词“kuriuo vyras。“在第一个例子中,我们没有一个可选的介词“苏,“虽然我们有第二个。gydF4y2Ba

这样的条件存在的参考正式定义如下:gydF4y2Ba

对于每一个句子gydF4y2Ba年代gydF4y2Ba的文本gydF4y2BatgydF4y2Ba每“相对”类型的代名词gydF4y2BapgydF4y2Ba,这是包含在这句话中gydF4y2Ba年代gydF4y2Ba和有一个起始位置gydF4y2Basp1gydF4y2Ba长度是gydF4y2Baln1gydF4y2Ba,遵循逗号gydF4y2BacgydF4y2Ba或者是介词语义gydF4y2Bal1gydF4y2Ba,它遵循逗号gydF4y2BacgydF4y2Ba,每一个名词gydF4y2Bal2gydF4y2Ba,开始的位置gydF4y2Basp2gydF4y2Ba长度是gydF4y2Baln2gydF4y2Ba,之前逗号gydF4y2BacgydF4y2Ba是相同的性别gydF4y2Ba 和相同的号码gydF4y2BangydF4y2Ba的代词gydF4y2BapgydF4y2Ba,唯一一个指称相同关系gydF4y2BargydF4y2Ba解决在文本gydF4y2BatgydF4y2Ba“代词的”类型的,“相对”型、“落后”的位置和代词之间的“单身”组gydF4y2BapgydF4y2Ba和名词gydF4y2BangydF4y2Ba,它的referent开始的位置gydF4y2Basp1gydF4y2Ba和长度gydF4y2Baln1gydF4y2Ba,适合只有一个语义gydF4y2BapgydF4y2Ba是指只有一个提到gydF4y2Ba米gydF4y2Ba开始的位置gydF4y2Basp2gydF4y2Ba,长度gydF4y2Baln2gydF4y2Ba,只适合一个语义gydF4y2Bal2gydF4y2Ba,存在gydF4y2Ba(1)规则。gydF4y2Ba规则1:∀t, s, p, l1, c, l2, g, n, sp1, sp2, ln2。(文本(t)⋀句子(s)⋀添加consists_of (t, s)⋀代词(p)⋀包含(s, p)⋀has_type (p,相对)⋀has_start_position (p, sp1)⋀has_length (p ln1)⋀逗号(c)⋀(遵循(p c)⋁(语义(l1)⋀has_pos (l1,介词)⋀遵循(l1, c)⋀遵循(p, l1))⋀名词(l2)⋀遵循(l2, c)⋀has_gender (p, g)⋀has_gender (l2, g)⋀has_number (p, n)⋀has_number (l2, n)⋀has_start_position (l2, sp2)⋀has_length (ln2 l2)⟶∃!r∃! m。[指称相同(r)⋀resolved_in (r, t)⋀has_type (r,代词的)⋀has_subtype (r,相对)⋀has_position (r,向后)⋀has_组(r,单)⋀has_start_position (r, sp1)⋀has_length (r ln1)⋀适合(r, p)⋀提到(m)⋀refers_to (r、m)⋀has_start_position (m, sp2)⋀has_length (m, ln2)⋀适合(m, l2)]]gydF4y2Ba

关系代词可能是复数,指多个单一的(或多个复数名词):gydF4y2Ba(我)gydF4y2Ba(LT) Komisija nerado panašumųtarpgydF4y2Ba灰岩洞gydF4y2Ba(名词)gydF4y2Ba利诺gydF4y2Ba(名词)gydF4y2Ba佩特罗gydF4y2Ba(名词)gydF4y2Ba红外gydF4y2Ba(连词)gydF4y2BaEglėsgydF4y2Ba(名词)gydF4y2BakuriųgydF4y2Ba(代词)sužalojimai atrodėpanašūs。gydF4y2Ba(EN)委员会没有发现gydF4y2Ba汤姆gydF4y2Ba(名词)gydF4y2Ba如果这样gydF4y2Ba(名词)gydF4y2Ba彼得gydF4y2Ba(名词)gydF4y2Ba和gydF4y2Ba(连词)gydF4y2BaEglėgydF4y2Ba(名词)gydF4y2Ba谁gydF4y2Ba(代词)共享类似的伤害。gydF4y2Ba

在这种情况下,一个复数代词“kurių”指的是四个不同性别的单数名词。前面的规则将无法解决这种指称相同。对于这种情况,建设将是:【名词】(逗号)(名词)(逗号)(名词)(联合)(名词)(逗号)(可选的介词)(具体的代名词)。gydF4y2Ba

在这种情况下,必须定义一个特殊的条件:gydF4y2Ba

对于每一个句子gydF4y2Ba年代gydF4y2Ba在文本gydF4y2BatgydF4y2Ba每“相对”类型的代名词gydF4y2BapgydF4y2Ba“复数”的数量,这是包含在这句话中gydF4y2Ba年代gydF4y2Ba和有一个起始位置gydF4y2Basp1gydF4y2Ba长度是gydF4y2Baln1gydF4y2Ba,遵循逗号gydF4y2Bac1gydF4y2Ba或者是介词语义gydF4y2BalgydF4y2Ba,它遵循逗号gydF4y2Bac1gydF4y2Ba,每一个名词gydF4y2Ban1gydF4y2Ba先于逗号gydF4y2Bac1gydF4y2Ba起始位置gydF4y2Basp2gydF4y2Ba长度是gydF4y2Baln2gydF4y2Ba之前,一起gydF4y2BajgydF4y2Ba,每一个名词gydF4y2Ban2gydF4y2Ba结合工作之前gydF4y2BajgydF4y2Ba起始位置gydF4y2Basp3gydF4y2Ba长度是gydF4y2Baln3gydF4y2Ba,每一个现有的名词gydF4y2Ban3gydF4y2Ba,它遵循逗号gydF4y2Bac2gydF4y2Ba,每一个现有的名词gydF4y2Ba陶瓷gydF4y2Ba先于逗号gydF4y2Bac2gydF4y2Ba起始位置gydF4y2Basp4gydF4y2Ba长度是gydF4y2Baln4gydF4y2Ba,唯一一个指称相同关系gydF4y2BargydF4y2Ba解决在文本gydF4y2BatgydF4y2Ba“代词的”类型的,“相对”亚型,“落后”的位置和“多个”小组,其referent开始位置gydF4y2Basp1gydF4y2Ba和长度gydF4y2Baln1gydF4y2Ba,适合只有一个语义gydF4y2BapgydF4y2Ba,是指只有一个gydF4y2Bam1gydF4y2Ba开始的位置gydF4y2Basp2gydF4y2Ba,长度gydF4y2Baln2gydF4y2Ba,适合名词gydF4y2Ban1gydF4y2Ba,是指只有一个gydF4y2Ba平方米gydF4y2Ba开始的位置gydF4y2Basp3gydF4y2Ba,长度gydF4y2Baln3gydF4y2Ba,只适合一个名词gydF4y2Ban2gydF4y2Ba,是指至少一提到gydF4y2Bam3gydF4y2Ba开始的位置gydF4y2Basp4gydF4y2Ba,长度gydF4y2Baln4,gydF4y2Ba和适合的名词gydF4y2Ba陶瓷gydF4y2Ba,存在gydF4y2Ba(2)规则。gydF4y2Ba规则2:∀t, s、p、l, c1, n1, sp1, ln1, sp2, ln2, j, n2, sp3, ln3。[文本(t)⋀句子(s)⋀添加consists_of (t, s)⋀代词(p)⋀包含(s, p)⋀has_number (p,复数)⋀has_type (p,相对)⋀has_start_position (p, sp1)⋀has_length (p ln1)⋀逗号(c1)⋀(遵循(p, c1)⋁(语义(l)⋀has_pos (l,介词)⋀遵循(p l)⋀遵循(l, c1))⋀名词(n1)⋀遵循(c1, n1)⋀has_start_position (n1, sp2)⋀has_length (n1, ln2)⋀连词(j)⋀遵循(n1, j)⋀名词(n2)⋀遵循(j, n2)⋀has_start_position (n2, sp3)⋀has_length (n2, ln3)⋀(∃n3 c2,陶瓷,sp4, ln4。(名词(n3)⋀逗号(c2)⋀名词(陶瓷)⋀遵循(n3 c2)⋀遵循(c2,陶瓷)⋀has_start_position(陶瓷,sp4)⋀has_length(陶瓷,ln4))⟶∃!r∃!m1∃!m2 ∃m3. [Coreference(r) ⋀ resolved_in(r, t) ⋀ has_type(r, Pronominal) ⋀ has_subtype(r, Relative) ⋀ has_position(r, Backward) ⋀ has_ group(r, Multiple) ⋀ has_start_position(r, sp1) ⋀ has_length(r, ln1) ⋀ fits(r, p) ⋀ Mention(m1) ⋀ refers_to(r, m1) ⋀ has_start_position(m1, sp2) ⋀ has_length(m1, ln2) ⋀ fits(m1, n1) ⋀ Mention(m2) ⋀ refers_to(r, m2) ⋀ has_start_position(m2, sp3) ⋀ has_length(m2, ln3) ⋀ fits(m2, n2) ⋀ Mention(m3) ⋀ refers_to(r, m3) ⋀ has_start_position(m3, sp4) ⋀ has_length(m3, ln4) ⋀ fits(m3, n4)]]

虽然例子说明立陶宛和英语中的某些指称相同的情况下,解决这些指称相同的规则可以应用其它语言。例如,规则1可以成功申请算法在波兰或俄罗斯语言。让我们以同样的一个句子在波兰和俄罗斯的例子:gydF4y2Ba(PL) Dzisiaj przychodziłmężczyzna(名词),ktory(代词)skarżyłsięna bol plecow。gydF4y2Ba[俄文]Сегодняприходилмужчина(名词),который(代词)жаловалсянабольвспине。gydF4y2Ba

我们可以看到,一个句子的结构(数量和顺序的词位)是相似的,逗号后一个代词,它指的是一个名词,和兼容性的形态学特征(性别、数量)的名词和代词保留。从给定的例子中,我们了解到,指称相同关系代词和名词存在条件等存在相同规则1中指定。gydF4y2Ba

3.4.2。A2:通用代名词决议gydF4y2Ba

这个算法关注的情况下,代词指代的名词(或名词短语)被认为是“人”类的命名实体尼珥。识别的算法从指示代词。下面在给定的例子,这样一个代词在第二句——“Jis”(“他”)gydF4y2Ba(我)gydF4y2Ba(LT)gydF4y2Ba乔纳斯JonaitisgydF4y2Ba(人名词短语)skambinoįregistratūrą。gydF4y2BaJisgydF4y2Ba(代词)skundėsi检流计skausmu。gydF4y2Ba(EN)gydF4y2Ba乔纳斯JonaitisgydF4y2Ba(名词短语的人)称为接待。gydF4y2Ba他gydF4y2Ba(代词)抱怨头痛。gydF4y2Ba

如果代词关系从句,向后移动的算法分析词代词前。在一个给定的例子中,代词在句子的开头,所以剩下的部分句子不分析,和算法向后移动一个句子。gydF4y2Ba

存在的条件等参考正式可以定义三个选择。第一个描述参考现有条件相同的句子gydF4y2Bas1gydF4y2Ba前代词gydF4y2BapgydF4y2Ba:gydF4y2Ba

每个文本的gydF4y2BatgydF4y2Ba句子gydF4y2Bas1gydF4y2Ba和代词gydF4y2BapgydF4y2Ba不是说明句子中包含的类型gydF4y2Bas1gydF4y2Ba和性别gydF4y2Ba克,gydF4y2Ba数量gydF4y2BangydF4y2Ba,开始的位置gydF4y2Basp1gydF4y2Ba和长度的gydF4y2Baln1gydF4y2Ba,命名实体gydF4y2Bae1gydF4y2Ba这是在相同的句子gydF4y2Bas1gydF4y2Ba语义表达的是l,性别gydF4y2Ba 、数量gydF4y2BangydF4y2Ba,开始的位置gydF4y2Basp2gydF4y2Ba和的长度gydF4y2Baln2gydF4y2Ba代词之前,gydF4y2BapgydF4y2Ba(gydF4y2Basp2gydF4y2Ba低于gydF4y2Basp1gydF4y2Ba),但接近代词gydF4y2BapgydF4y2Ba比可能命名实体gydF4y2Bae2gydF4y2Ba和gydF4y2Bae3gydF4y2Ba(gydF4y2Basp2gydF4y2Ba高于gydF4y2Basp3gydF4y2Ba和gydF4y2Basp4gydF4y2Ba),只有一个指称相同的关系gydF4y2BargydF4y2Ba解决在文本gydF4y2BatgydF4y2Ba“代词的”类型的,“相对”型、“落后”的位置和代词之间的“单身”组gydF4y2BapgydF4y2Ba和命名实体gydF4y2Bae1gydF4y2Ba,它的referent开始的位置gydF4y2Basp1gydF4y2Ba和长度gydF4y2Baln1gydF4y2Ba,适合只有一个代词gydF4y2BapgydF4y2Ba是指只有一个提到gydF4y2Ba米gydF4y2Ba开始的位置gydF4y2Basp2gydF4y2Ba,长度gydF4y2Baln2gydF4y2Ba,只适合一个命名实体gydF4y2Bae1gydF4y2Ba,存在gydF4y2Ba(3)规则gydF4y2Ba。gydF4y2Ba规则3:∀t, s1, p, l, e1, g, n, sp1, ln1, sp2, ln2。[文本(t)⋀句子(s1)⋀添加consists_of (t, s1)⋀代词(p)⋀包含(s1, p)⋀¬has_type (p,示范)⋀has_gender (p, g)⋀has_number (p, n)⋀has_start_position (p, sp1)⋀has_length (p ln1)⋀Person_NE (e1)⋀包括(s1, e1)⋀语义(l)⋀expressed_by (e1, l)⋀has_gender (e1, g)⋀has_number (e1, n)⋀has_start_position (e1, sp2)⋀has_length (ln2 e1)⋀sp2 < sp1⋀¬(∃e2、e3 sp3, sp4。(e1≠e2⋀e1≠e3⋀e2≠e3⋀Person_NE (e2)⋀包括(s1, e2)⋀has_gender (e2, g)⋀has_number (e2, n)⋀has_start_position (e2, sp3)⋀Person_NE (p3)⋀包括(s1, e3)⋀has_gender (e3, g)⋀has_number (e3, n)⋀has_start_position (e3, sp4)⋀sp2 > sp3⋀sp4 > sp2))⟶∃!r∃! m。[指称相同(r)⋀resolved_in (r, t)⋀has_type (r,代词的)⋀has_subtype (r,通用)⋀has_position (r,向后)⋀has_group (r,单)⋀has_start_position (r, sp1)⋀has_length (r ln1)⋀适合(r, p)⋀提到(m)⋀refers_to (r, t)⋀has_start_position (m, sp2)⋀has_length (m, ln2)⋀适合(m, e1)⋀适合(m, l)]]gydF4y2Ba

第二个替代描述当一个代词gydF4y2BapgydF4y2Ba指的是命名实体在前面的句子gydF4y2Bas2gydF4y2Ba:gydF4y2Ba

每个文本的gydF4y2BatgydF4y2Ba句子gydF4y2Bas1, s2gydF4y2Ba,在那里gydF4y2Bas1gydF4y2Ba遵循gydF4y2Bas2gydF4y2Ba、代词gydF4y2BapgydF4y2Ba不是说明句子中包含的类型gydF4y2Bas1gydF4y2Ba和性别gydF4y2Ba克,gydF4y2Ba数量gydF4y2BangydF4y2Ba,开始的位置gydF4y2Basp1gydF4y2Ba和长度的gydF4y2Baln1gydF4y2Ba,命名实体gydF4y2Bae1gydF4y2Ba这是包含在句子gydF4y2Bas2gydF4y2Ba语义表达的是l,性别gydF4y2Ba 、数量gydF4y2BangydF4y2Ba,gydF4y2Ba起始位置gydF4y2Basp2gydF4y2Ba和的长度gydF4y2Baln2gydF4y2Ba,接近代词gydF4y2BapgydF4y2Ba比可能命名实体gydF4y2Bae2gydF4y2Ba和gydF4y2Bae3gydF4y2Ba(gydF4y2Basp2gydF4y2Ba高于gydF4y2Basp3gydF4y2Ba和gydF4y2Basp4gydF4y2Ba),只有一个指称相同的关系gydF4y2BargydF4y2Ba解决在文本gydF4y2BatgydF4y2Ba“代词的”类型的,“相对”型、“落后”的位置和代词之间的“单身”组gydF4y2BapgydF4y2Ba和命名实体gydF4y2Bae1gydF4y2Ba,它的referent开始的位置gydF4y2Basp1gydF4y2Ba和长度gydF4y2Baln1gydF4y2Ba,适合只有一个代词gydF4y2BapgydF4y2Ba是指只有一个提到gydF4y2Ba米gydF4y2Ba开始的位置gydF4y2Basp2gydF4y2Ba,长度gydF4y2Baln2gydF4y2Ba,只适合一个命名实体gydF4y2Bae1gydF4y2Ba,存在gydF4y2Ba(4)规则。gydF4y2Ba规则4:∀t, s1, s2, p, l, e1, g, n, sp1, ln1, sp2, ln2。[文本(t)⋀句子(s1)⋀句子(s2)⋀添加consists_of (t, s1)⋀添加consists_of (t, s2)⋀遵循(s1, s2)⋀代词(p)⋀包含(s1, p)⋀¬has_type (p,示范)⋀has_gender (p, g)⋀has_number (p, n)⋀has_start_position (p, sp1)⋀has_length (p ln1)⋀Person_NE (e1)⋀包括(s2, e1)⋀语义(l)⋀expressed_by (e1, l)⋀has_gender (e1, g)⋀has_number (e1, n)⋀has_start_position (e1, sp2)⋀has_length (ln2 e1)⋀¬(∃e2、e3 sp3, sp4。(e1≠e2⋀e1≠e3⋀e2≠e3⋀Person_NE (e2)⋀包括(s2, e2)⋀has_gender (e2, g)⋀has_number (e2, n)⋀has_start_position (e2, sp3)⋀Person_NE (p3)⋀包括(s2, e3)⋀has_gender (e3, g)⋀has_number (e3, n)⋀has_start_position (e3, sp4)⋀sp2 > sp3⋀sp4 > sp2))⟶∃!r∃! m。[指称相同(r)⋀resolved_in (r, t)⋀has_type (r,代词的)⋀has_subtype (r,通用)⋀has_position (r,向后)⋀has_group (r,单)⋀has_start_position (r, sp1)⋀has_length (r ln1)⋀适合(r, p)⋀提到(m)⋀refers_to (r, t)⋀has_start_position (m, sp2)⋀has_length (m, ln2)⋀适合(m, e1)⋀适合(m, l)]]gydF4y2Ba

第三种方法描述当一个代词gydF4y2BapgydF4y2Ba在这个句子gydF4y2Bas1gydF4y2Ba指的是句子中的命名实体gydF4y2Bas3gydF4y2Ba,前面的句子gydF4y2Bas2gydF4y2Ba和gydF4y2Bas1gydF4y2Ba:gydF4y2Ba

每个文本的gydF4y2BatgydF4y2Ba句子gydF4y2Bas1gydF4y2Ba,gydF4y2Bas2gydF4y2Ba,gydF4y2Bas3gydF4y2Ba,在那里gydF4y2Bas1gydF4y2Ba遵循gydF4y2Bas2gydF4y2Ba和gydF4y2Bas2gydF4y2Ba遵循gydF4y2Bas3gydF4y2Ba、代词gydF4y2BapgydF4y2Ba不是说明句子中包含的类型gydF4y2Bas1gydF4y2Ba和性别gydF4y2Ba ,gydF4y2Ba数量gydF4y2BangydF4y2Ba,开始的位置gydF4y2Basp1gydF4y2Ba和长度的gydF4y2Baln1gydF4y2Ba,命名实体gydF4y2Bae1gydF4y2Ba这是包含在句子gydF4y2Bas3gydF4y2Ba语义表达的是l,性别gydF4y2Ba 、数量gydF4y2BangydF4y2Ba,gydF4y2Ba起始位置gydF4y2Basp2gydF4y2Ba和的长度gydF4y2Baln2gydF4y2Ba,接近代词gydF4y2BapgydF4y2Ba比可能命名实体gydF4y2Bae2gydF4y2Ba和gydF4y2Bae3gydF4y2Ba(gydF4y2Basp2gydF4y2Ba高于gydF4y2Basp3gydF4y2Ba和gydF4y2Basp4gydF4y2Ba),只有一个指称相同的关系gydF4y2BargydF4y2Ba解决在文本gydF4y2BatgydF4y2Ba“代词的”类型的,“相对”型、“落后”的位置和代词之间的“单身”组gydF4y2BapgydF4y2Ba和命名实体gydF4y2Bae1gydF4y2Ba,它的referent开始的位置gydF4y2Basp1gydF4y2Ba和长度gydF4y2Baln1gydF4y2Ba,适合只有一个代词gydF4y2BapgydF4y2Ba是指只有一个提到gydF4y2Ba米gydF4y2Ba开始的位置gydF4y2Basp2gydF4y2Ba,长度gydF4y2Baln2gydF4y2Ba,只适合一个命名实体gydF4y2Bae1gydF4y2Ba,存在gydF4y2Ba(5)规则。gydF4y2Ba规则5:∀t, s1, s2、s3, p, l, e1, g, n, sp1, ln1, sp2, ln2。[文本(t)⋀句子(s1)⋀句子(s2)⋀句子(s3)⋀添加consists_of (t, s1)⋀添加consists_of (t, s2)⋀添加consists_of (t, s3)⋀遵循(s1, s2)⋀遵循(s2、s3)⋀代词(p)⋀包含(s1, p)⋀¬has_type (p,示范)⋀has_gender (p, g)⋀has_number (p, n)⋀has_start_position (p, sp1)⋀has_length (p ln1)⋀Person_NE (e1)⋀语义(l)⋀expressed_by (e1, l)⋀包括(s3, e1)⋀has_gender (e1, g)⋀has_number (e1, n)⋀has_start_position (e1, sp2)⋀has_length (ln2 e1)⋀¬(∃e2、e3 sp3, sp4。(e1≠e2⋀e1≠e3⋀e2≠e3⋀Person_NE (e2)⋀包括(s3, e2)⋀has_gender (e2, g)⋀has_number (e2, n)⋀has_start_position (e2, sp3)⋀Person_NE (e3)⋀包括(s3, e3)⋀has_gender (e3, g)⋀has_number (e3, n)⋀has_start_position (e3, sp4)⋀sp2 > sp3⋀sp4 > sp2))⟶∃!r∃! m。[指称相同(r)⋀resolved_in (r, t)⋀has_type (r,代词的)⋀has_subtype (r,通用)⋀has_position (r,向后)⋀has_group (r,单)⋀has_start_position (r, sp1)⋀has_length (r ln1)⋀适合(r, p)⋀提到(m)⋀refers_to (r, t)⋀has_start_position (m, sp2)⋀has_length (m, ln2)⋀适合(m, e1)⋀适合(m, l)]]gydF4y2Ba

的另一个示例提供了一个例当coreferent代词“男人”(在英语中,“我”)在下列句子:gydF4y2Ba(我)gydF4y2Ba(LT) Pastebėtina科安达ligoginėse apsilankė10 mln。pacientų,nepaisant科安达2016 m . jųbuvo 4% mažiau (apsilankėbeveik 9日5 mln。)。Tai labiausiai lėmėskaitmeniniųpaslaugųpadidinimas:„KiekgydF4y2Ba男人。gydF4y2Ba(代词)teko analizuoti padidinus skaitmenines paslaugas下来nedidelė大理gydF4y2Ba立陶宛gydF4y2Ba(方位名词)ligoniniųsumažino etatųar atleido darbuotojus,阿泰lėmėnemažąpapildomąindėlįįpaslaugos kokybę”teigėJ。gydF4y2BaJonaitisgydF4y2Ba(名词短语的人)。gydF4y2Ba(EN)值得注意的是住院病人总数已经达到1000万人,即使在2016年,这一数字低于4%(约950万名患者)。这是受到e-health服务的数字化。“就gydF4y2Ba我gydF4y2Ba(代词)分析,只有一小部分gydF4y2Ba立陶宛gydF4y2Ba(方位名词)医院已经减少了他们的帖子或解雇员工,但数字化服务已经导致了大量额外的贡献的质量服务,”J说。gydF4y2BaJonaitisgydF4y2Ba(名词短语的人)。gydF4y2Ba

如果算法没有找到任何命名实体向后移动,向前移动回到代词和收益。算法继续前进,直到定位“J。Jonaitis”实体,这被认为是一个人。由于性别的代词“男人”是模棱两可(它可以指男性和女性),只有他们的语法比较数字。两者都是单数;因此,该算法选择“J。Jonaitis”作为postcedent corefering对象”的男人。”条件的存在等参考正式可以定义两种选择。第一个描述参考现有的条件相同的句子gydF4y2Bas1gydF4y2Ba代词后提到:gydF4y2Ba

每个文本的gydF4y2BatgydF4y2Ba句子gydF4y2Bas1gydF4y2Ba和代词gydF4y2BapgydF4y2Ba不是说明句子中包含的类型gydF4y2Bas1gydF4y2Ba和性别gydF4y2Ba克,gydF4y2Ba数量gydF4y2BangydF4y2Ba,开始的位置gydF4y2Basp1gydF4y2Ba和长度的gydF4y2Baln1gydF4y2Ba,命名实体gydF4y2Bae1gydF4y2Ba这是在相同的句子gydF4y2Bas1gydF4y2Ba语义表达的是l,性别gydF4y2Ba 、数量gydF4y2BangydF4y2Ba,开始的位置gydF4y2Basp2gydF4y2Ba和的长度gydF4y2Baln2gydF4y2Ba,代词后gydF4y2BapgydF4y2Ba(gydF4y2Basp2gydF4y2Ba高于gydF4y2Basp1gydF4y2Ba),但接近代词gydF4y2BapgydF4y2Ba比可能命名实体gydF4y2Bae2gydF4y2Ba和gydF4y2Bae3gydF4y2Ba(gydF4y2Basp2gydF4y2Ba高于gydF4y2Basp3gydF4y2Ba和gydF4y2Basp4gydF4y2Ba),只有一个指称相同的关系gydF4y2BargydF4y2Ba解决在文本gydF4y2BatgydF4y2Ba“代词的”类型的,“相对”型、“落后”的位置和代词之间的“单身”组gydF4y2BapgydF4y2Ba和命名实体gydF4y2Bae1gydF4y2Ba,它的referent开始的位置gydF4y2Basp1gydF4y2Ba和长度gydF4y2Baln1gydF4y2Ba,适合只有一个代词gydF4y2BapgydF4y2Ba是指只有一个提到gydF4y2Ba米gydF4y2Ba开始的位置gydF4y2Basp2gydF4y2Ba,长度gydF4y2Baln2gydF4y2Ba,只适合一个命名实体gydF4y2Bae1gydF4y2Ba,存在gydF4y2Ba(6)规则。gydF4y2Ba规则6:∀t, s1, p, l, e1, g, n, sp1, ln1, sp2, ln2。[文本(t)⋀句子(s1)⋀添加consists_of (t, s1)⋀代词(p)⋀包含(s1, p)⋀¬has_type (p,示范)⋀has_gender (p, g)⋀has_number (p, n)⋀has_start_position (p, sp1)⋀has_length (p ln1)⋀Person_NE (e1)⋀包括(s1, e1)⋀语义(l)⋀expressed_by (e1, l)⋀has_gender (e1, g)⋀has_number (e1, n)⋀has_start_position (e1, sp2)⋀has_length (ln2 e1)⋀sp1 < sp2⋀¬(∃e2、e3 sp3, sp4。(e1≠e2⋀e1≠e3⋀e2≠e3⋀Person_NE (e2)⋀包括(s1, e2)⋀has_start_position (e2, sp3)⋀Person_NE (e3)⋀包括(s1, e3)⋀has_start_position (e3, sp4)⋀sp2 < sp3⋀sp4 < sp2)⟶∃!r∃! m。[指称相同(r)⋀resolved_in (r, t)⋀has_type (r,代词的)⋀has_subtype (r,通用)⋀has_position (r,向前)⋀has_group (r,单)⋀has_start_position (r, sp1)⋀has_length (r ln1)⋀适合(r, p)⋀提到(m)⋀refers_to (r, t)⋀has_start_position (m, sp2)⋀has_length (m, ln2)⋀适合(m, e1)⋀适合(m, l)]]gydF4y2Ba

第二种方法描述了代词时的情况gydF4y2BapgydF4y2Ba指的是命名实体在以下句子gydF4y2Bas4gydF4y2Ba:gydF4y2Ba

每个文本的gydF4y2BatgydF4y2Ba句子gydF4y2Bas1, s4,gydF4y2Ba在哪里gydF4y2Bas4gydF4y2Ba遵循gydF4y2Bas1gydF4y2Ba、代词gydF4y2BapgydF4y2Ba不是说明句子中包含的类型gydF4y2Bas1gydF4y2Ba和性别gydF4y2BaggydF4y2Ba,gydF4y2Ba数量gydF4y2BangydF4y2Ba,开始的位置gydF4y2Basp1gydF4y2Ba和长度的gydF4y2Baln1gydF4y2Ba,命名实体gydF4y2Bae1gydF4y2Ba这是包含在句子gydF4y2Bas2gydF4y2Ba语义表达的是l,性别gydF4y2Ba 、数量gydF4y2BangydF4y2Ba,开始的位置gydF4y2Basp2gydF4y2Ba和的长度gydF4y2Baln2gydF4y2Ba,接近代词gydF4y2BapgydF4y2Ba比可能命名实体gydF4y2Bae2gydF4y2Ba和gydF4y2Bae3gydF4y2Ba(gydF4y2Basp2gydF4y2Ba高于gydF4y2Basp3gydF4y2Ba和gydF4y2Basp4gydF4y2Ba),只有相互引用关系gydF4y2BargydF4y2Ba解决在文本gydF4y2BatgydF4y2Ba“代词的”类型的,“相对”型、“落后”的位置和代词之间的“单身”组gydF4y2BapgydF4y2Ba和命名实体gydF4y2Bae1gydF4y2Ba,它的referent开始的位置gydF4y2Basp1gydF4y2Ba和长度gydF4y2Baln1gydF4y2Ba,适合只有一个代词gydF4y2BapgydF4y2Ba是指只有一个提到gydF4y2Ba米gydF4y2Ba开始的位置gydF4y2Basp2gydF4y2Ba,长度gydF4y2Baln2gydF4y2Ba,只适合一个命名实体gydF4y2Bae1gydF4y2Ba,存在gydF4y2Ba(7)规则。gydF4y2Ba规则7:∀t, s1, s2, p, l, e1, g, n, sp1, ln1, sp2, ln2。[文本(t)⋀句子(s1)⋀句子(s2)⋀添加consists_of (t, s1)⋀添加consists_of (t, s2)⋀遵循(s1, s2)⋀代词(p)⋀包含(s1, p)⋀¬has_type (p,示范)⋀has_gender (p, g)⋀has_number (p, n)⋀has_start_position (p, sp1)⋀has_length (p ln1)⋀Person_NE (e1)⋀包括(s2, e1)⋀语义(l)⋀expressed_by (e1, l)⋀has_gender (e1, g)⋀has_number (e1, n)⋀has_start_position (e1, sp2)⋀has_length (ln2 e1)⋀¬(∃e2、e3 sp3, sp4。(e1≠e2⋀e1≠e3⋀e2≠e3⋀Person_NE (e2)⋀包括(s2, e2)⋀has_start_position (e2, sp3)⋀Person_NE (e3)⋀包括(s2, e3)⋀has_start_position (e3, sp4)⋀sp2 < sp3⋀sp4 < sp2)⟶∃!r∃! m。[指称相同(r)⋀resolved_in (r, t)⋀has_type (r,代词的)⋀has_subtype (r,通用)⋀has_position (r,向前)⋀has_group (r,单)⋀has_start_position (r, sp1)⋀has_length (r ln1)⋀适合(r, p)⋀提到(m)⋀refers_to (r, t)⋀has_start_position (m, sp2)⋀has_length (m, ln2)⋀适合(m, e1)⋀适合(m, l)]]gydF4y2Ba

该算法忽略了示范代词,因为他们通常是指实体不存在的书面文本。这些代词不携带任何额外的语义信息和不参考任何名词短语。它们主要用于语法原因,由于算法通常被忽视。gydF4y2Ba

3.4.3。A3: PRA的决议gydF4y2Ba

该算法是基于精确(或部分)字符串匹配和几个缩写规则。一旦第一个命名实体,可以发现与最初的命名实体,然后算法停止让注释简单:B⟶a, C⟶B和D⟶C。这允许指称相同链连接的形成都提到相同的实体在文本语义分析以后,可以重用,例如,gydF4y2Ba(我)gydF4y2Ba(LT)gydF4y2BaTomaitisgydF4y2Ba(命名实体)patekoįavariją。阿宝pietųgydF4y2BaTomaitįgydF4y2Ba(命名实体)išvežėįoperacinę。gydF4y2Ba(EN)gydF4y2BaTomaitisgydF4y2Ba命名实体发生了一场车祸。在下午,gydF4y2BaTomaitisgydF4y2Ba(命名实体)手术被带到一个房间。gydF4y2Ba

在这个例子中,两个提到相同的实体是:“Tomaitis”和“Tomaitį。“他们在不同的情况下,但他们的前题是一样的。这样的条件存在的参考正式定义如下:gydF4y2Ba

每个文本的gydF4y2BatgydF4y2Ba句子gydF4y2Bas1gydF4y2Ba这包括命名实体gydF4y2Bae1gydF4y2Ba,开始的位置gydF4y2Basp1gydF4y2Ba和的长度gydF4y2Baln1gydF4y2Ba语义表达的gydF4y2Bal1gydF4y2Ba这个引理gydF4y2BalgydF4y2Ba和每个相同的文本gydF4y2BatgydF4y2Ba句子gydF4y2Bas2gydF4y2Ba这包括命名实体gydF4y2Bae2gydF4y2Ba,有一个起始位置gydF4y2Basp1gydF4y2Ba和的长度gydF4y2Baln1gydF4y2Ba语义表达的gydF4y2Bal2gydF4y2Ba这个引理gydF4y2BalgydF4y2Ba,唯一一个指称相同关系gydF4y2BargydF4y2Ba解决在文本gydF4y2BatgydF4y2Ba,“名义”类型的子类型“重复”,“无关紧要”地位和“单身”集团之间的名词gydF4y2Ban1gydF4y2Ba和名词gydF4y2Ban2gydF4y2Ba,它的referent开始的位置gydF4y2Basp1gydF4y2Ba和长度gydF4y2Baln1gydF4y2Ba,适合只有一个名词gydF4y2Ban1gydF4y2Ba是指只有一个提到gydF4y2Ba米gydF4y2Ba开始的位置gydF4y2Basp2gydF4y2Ba,长度gydF4y2Baln2gydF4y2Ba,只适合一个名词gydF4y2Ban2gydF4y2Ba,存在gydF4y2Ba(8)规则。gydF4y2Ba规则8:∀t, s1, s2, e1, e2, sp1, ln1, sp2, ln2。[文本(t)⋀句子(s1)⋀句子(s2)⋀添加consists_of (t, s1)⋀添加consists_of (t, s2)⋀Named_Entity (e1)⋀包括(s1, e1)⋀has_start_position (e1, sp1)⋀has_length (e1 ln1)⋀Named_Entity (e2)⋀包括(s2, e2)⋀has_start_position (e2, sp2)⋀has_length (e2 ln2)⋀e1≠e2⋀(l2 l1∃∃∃l。(语义(l1)⋀语义(l2)⋀expressed_by (e1, l1)⋀expressed_by (e2, l2)⋀has_lemma (l1, l)⋀has_lemma (l2, l))⟶∃!r∃! m。[指称相同(r)⋀resolved_in (r, t)⋀has_type (r,名义)⋀has_subtype (r,重复)⋀has_position (r,无关)⋀has_group (r,单)⋀has_start_position (r, sp1)⋀has_length (r ln1)⋀适合(r, l1)⋀适合(r, e1)⋀提到(m)⋀refers_to (r, t)⋀has_start_position (m, sp2)⋀has_length (m, ln2)⋀适合(m, l2)⋀适合(m, e2)]]gydF4y2Ba

缩写规则取决于类型的命名实体(目前人员、位置和组织)。gydF4y2Ba

3.4.4。A4:美国卫生和公众服务部决议gydF4y2Ba

该算法是基于职业分类。它试图解决同义词和上义词和下义词的使用。gydF4y2Ba(我)gydF4y2Ba(LT)gydF4y2BaGydytojaigydF4y2Ba(名词指职业)skundžiasi dideliu darbo krūviu。gydF4y2BaChirurgųgydF4y2Ba(名词指职业)darbo krūvis拍didžiausias。gydF4y2Ba(EN)gydF4y2Ba医生gydF4y2Ba(名词指职业)抱怨沉重的工作量。gydF4y2Ba外科医生的gydF4y2Ba(名词指职业)工作负载是最大的。gydF4y2Ba

职业分类的算法决定了“医生”的下位词“外科医生”,他们也同意在性别和数字;因此,该算法增加了他们对注释。这样的存在条件参考正式定义如下:gydF4y2Ba

每个文本的gydF4y2BatgydF4y2Ba句子gydF4y2Bas1gydF4y2Ba这职业gydF4y2Bap1gydF4y2Ba,这是比职业更广泛或窄gydF4y2Bap2gydF4y2Ba、名称gydF4y2Bav1gydF4y2Ba表达名词gydF4y2Ban1gydF4y2Ba,性别gydF4y2Ba 、数量gydF4y2Ba米gydF4y2Ba,开始的位置gydF4y2Basp1gydF4y2Ba和的长度gydF4y2Baln1gydF4y2Ba同样,对于每个文本的gydF4y2BatgydF4y2Ba句子gydF4y2Bas2gydF4y2Ba这职业gydF4y2Bap2gydF4y2Ba,这是比职业更广泛或窄gydF4y2Bap1gydF4y2Ba、名称gydF4y2Bav2gydF4y2Ba表达名词gydF4y2Ban2gydF4y2Ba,性别gydF4y2Ba 、数量gydF4y2Ba米gydF4y2Ba,开始的位置gydF4y2Basp2gydF4y2Ba和的长度gydF4y2Baln2gydF4y2Ba,唯一一个指称相同关系gydF4y2BargydF4y2Ba解决在文本gydF4y2BatgydF4y2Ba“名义”类型的,“Hypernym_hyponym”亚型,“无关紧要”地位和“单身”集团之间的名词gydF4y2Ban1gydF4y2Ba和名词gydF4y2Ban2gydF4y2Ba,它的referent开始的位置gydF4y2Basp1gydF4y2Ba和长度gydF4y2Baln1gydF4y2Ba,适合只有一个名词gydF4y2Ban1gydF4y2Ba是指只有一个提到gydF4y2Ba米gydF4y2Ba开始的位置gydF4y2Basp2gydF4y2Ba,长度gydF4y2Baln2gydF4y2Ba,只适合一个名词gydF4y2Ban2gydF4y2Ba,存在gydF4y2Ba(9)规则。gydF4y2Ba规则9:∀t, s1, s2, n1、n2, sp1, ln1, sp2, ln2, v1、v2, p1, p2。[文本(t)⋀句子(s1)⋀句子(s2)⋀添加consists_of (t, s1)⋀添加consists_of (t, s2)⋀名词(n1)⋀包含(年代,n1)⋀has_start_position (n1, sp1)⋀has_length (n1 ln1)⋀名词(n2)⋀包含(s2, n2)⋀has_start_position (n2, sp2)⋀has_length (n2, ln2)⋀n1≠n2⋀职业(p1)⋀职业(p2)⋀p1≠p2⋀Profession_Name (v1)⋀Profession_Name (v2)⋀表达(n1 v1)⋀表达(n2 v2)⋀描述(v1, p1)⋀描述(v2, p2)⋀(扩大(p1, p2)⋁扩大(p1, p2))⋀has_gender (n1, g)⋀has_gender (n2, g)⋀has_number (n1, n)⋀has_number (n2, n)⟶∃!r∃! m。[指称相同(r)⋀resolved_in (r, t)⋀has_type (r,名义)⋀has_subtype (r, Hypernym_Hyponym)⋀has_position (r,无关)⋀has_group (r,单)⋀has_start_position (r, sp1)⋀has_length (r ln1)⋀适合(r, n1)⋀提到(m)⋀refers_to (r, t)⋀has_start_position (m, sp2)⋀has_length (m, ln2)⋀适合(m, n2)]]gydF4y2Ba

同义词给出的一个例子如下:gydF4y2Ba(我)gydF4y2Ba(LT) j . Jonaitis buvo operacijosgydF4y2BavadovugydF4y2Ba(名词指职业)。记忆,gydF4y2Bavyr。chirurgogydF4y2Ba(名词指职业)vykdoma operacija buvo nesėkminga。gydF4y2Ba从现在j . Jonaitis是(EN)gydF4y2Ba头gydF4y2Ba外科医生(名词指职业)的操作。不幸的是,最后的操作gydF4y2Ba首席外科医生gydF4y2Ba(名词指职业)是不成功的。gydF4y2Ba

“外科医生”和“首席外科医生”是同义的;因此,条件等存在的参考正式可以定义如下:gydF4y2Ba

每个文本的gydF4y2BatgydF4y2Ba句子gydF4y2Bas1gydF4y2Ba有专业的gydF4y2BapgydF4y2Ba的名字gydF4y2Bav1gydF4y2Ba,这是表达的名词gydF4y2Ban1gydF4y2Ba有性别gydF4y2Ba 、数量gydF4y2Ba米gydF4y2Ba,开始的位置gydF4y2Basp1gydF4y2Ba和的长度gydF4y2Baln1gydF4y2Ba同样,对于每个文本的gydF4y2BatgydF4y2Ba句子gydF4y2Bas2gydF4y2Ba同一行业的gydF4y2BapgydF4y2Ba的名字gydF4y2Bav2gydF4y2Ba表达的名词gydF4y2Ban2gydF4y2Ba有性别gydF4y2Ba 、数量gydF4y2Ba米gydF4y2Ba,开始的位置gydF4y2Basp2gydF4y2Ba和的长度gydF4y2Baln2gydF4y2Ba,唯一一个指称相同关系gydF4y2BargydF4y2Ba解决在文本gydF4y2BatgydF4y2Ba,“名义”类型的子类型“同义词”,“无关紧要”地位和“单身”集团之间的名词gydF4y2Ban1gydF4y2Ba和名词gydF4y2Ban2gydF4y2Ba,它的referent开始的位置gydF4y2Basp1gydF4y2Ba和长度gydF4y2Baln1gydF4y2Ba,适合只有一个名词gydF4y2Ban1gydF4y2Ba是指只有一个提到gydF4y2Ba米gydF4y2Ba开始的位置gydF4y2Basp2gydF4y2Ba,长度gydF4y2Baln2gydF4y2Ba,只适合一个名词gydF4y2Ban2gydF4y2Ba,存在gydF4y2Ba(10)规则。gydF4y2Ba规则10:∀t, s1, s2, n1、n2, sp1, ln1, sp2, ln2, v1、v2, p, n g。[文本(t)⋀句子(s1)⋀句子(s2)⋀添加consists_of (t, s1)⋀添加consists_of (t, s2)⋀名词(n1)⋀包含(s1, n1)⋀has_start_position (n1, sp1)⋀has_length (n1 ln1)⋀名词(n2)⋀包含(s2, n2)⋀has_start_position (n2, sp2)⋀has_length (n2, ln2)⋀n1≠n2⋀Profession_name (v1)⋀Profession_name (v2)⋀职业(p)⋀表达(n1 v1)⋀表达(n2 v2)⋀描述(v1, p)⋀描述(v2, p)⋀has_gender (n1, g)⋀has_gender (n2, g)⋀has_number (n1, n)⋀has_number (n2, n)⋀n1≠n2⟶∃!r∃! m。[指称相同(r)⋀resolved_in (r, t)⋀has_type (r,名义)⋀has_subtype (r,同义词)⋀has_position (r,无关)⋀has_group (r,单)⋀has_start_position (r, sp1)⋀has_length (r ln1)⋀适合(r, n1)⋀提到(m)⋀refers_to (r, t)⋀has_start_position (m, sp2)⋀has_length (m, ln2)⋀适合(m, n2)]]gydF4y2Ba

3.4.5。A5:分辨率特性gydF4y2Ba

这个算法的时间试图解决只有那些情况下,当一个人被他称为公共职位(特性),他拥有其他类型的功能目前不解决,比如,gydF4y2Ba(我)gydF4y2Ba(LT) Kąrekomenduoja s Suskelis(人名词短语)?Aptarkime kardiologo[名词指持有位置]siūlomągydymo planą。gydF4y2Ba(EN)什么美国Suskelis(人名词短语)推荐的吗?让我们讨论治疗方案提出的心脏病专家(名词指持有的位置)。这里一个名词“心脏病”被选中时,该算法向后移动直到它到达的。Suskelis”和检查知识库如果当时出版的医疗记录他举行了心脏病的位置. .因为“他”算法检查”。Suskelis”和“心脏病”同意在性别和数字。他们同意,他们两人被添加到注释作为一个功能的参考。这样的条件存在的参考正式定义如下:gydF4y2Ba

每个文本的gydF4y2BatgydF4y2Ba句子gydF4y2Bas1gydF4y2Ba认识人gydF4y2BakgydF4y2Ba在出版日期gydF4y2BadgydF4y2Ba有一定地位gydF4y2BahgydF4y2Ba(出版日期gydF4y2BadgydF4y2Ba是相同或晚于职位gydF4y2BahgydF4y2Ba开始日期gydF4y2BafdgydF4y2Ba和相同或比早些时候的位置gydF4y2BahgydF4y2Ba结束日期gydF4y2Ba道明gydF4y2Ba),提到命名实体gydF4y2BaegydF4y2Ba,有一个起始位置gydF4y2Basp1gydF4y2Ba和的长度gydF4y2Baln1gydF4y2Ba同样,对于每个文本的gydF4y2BatgydF4y2Ba句子gydF4y2Bas2gydF4y2Ba提到的名词gydF4y2BangydF4y2Ba,有一个起始位置gydF4y2Basp2gydF4y2Ba,长度gydF4y2Baln2gydF4y2Ba命名实体后,提到gydF4y2BaegydF4y2Ba(名词gydF4y2BangydF4y2Ba有一个更高的开始位置吗gydF4y2Basp2gydF4y2Ba命名实体的gydF4y2Basp1gydF4y2Ba),其引理gydF4y2BalgydF4y2Ba与职位的匹配gydF4y2BahgydF4y2Ba引理gydF4y2BalgydF4y2Ba,号码是单数和性别g匹配已知人的gydF4y2BakgydF4y2Ba性别gydF4y2Ba ,唯一一个指称相同关系gydF4y2BargydF4y2Ba解决在文本gydF4y2BatgydF4y2Ba“名义”类型的,“特性”型、“落后”的位置和名词之间的“单身”组gydF4y2BangydF4y2Ba和命名实体gydF4y2BaegydF4y2Ba,它的referent开始的位置gydF4y2Basp2gydF4y2Ba和长度gydF4y2Baln2gydF4y2Ba,适合只有一个名词gydF4y2BangydF4y2Ba是指只有一个提到gydF4y2Ba米gydF4y2Ba开始的位置gydF4y2Basp1gydF4y2Ba,长度gydF4y2Baln1gydF4y2Ba,只适合一个命名实体gydF4y2BaegydF4y2Ba,存在gydF4y2Ba(11)规则。gydF4y2Ba规则11:∀t, s1, s2, n, k, h, l, d, fd, td, g, sp1, sp2, ln1 ln2。[文本(t)⋀句子(s1)⋀句子(s2)⋀添加consists_of (t, s1)⋀添加consists_of (t, s2)⋀Person_NE (e)⋀包括(s1, e)⋀名词(n)⋀包含(s2, n)⋀Known_Person (k)⋀mentioned_as (k, e)⋀Position_held (h)⋀持有(k, h)⋀has_lemma (h、l)⋀has_lemma (n, l)⋀has_publication_date (t, d)⋀has_from_date (h, fd)⋀has_to_date (h, td)⋀fd td≥d≤d⋀⋀has_gender (k, g)⋀has_gender (n, g)⋀has_number (n,单数)⋀has_start_position (e, sp1)⋀has_start_position (n, sp2)⋀sp1 < sp2⋀has_length (e ln1)⋀has_length (n, ln2)⟶∃!r∃! m。[指称相同(r)⋀resolved_in (r, t)⋀has_type (r,名义)⋀has_subtype (r,特性)⋀has_position (r,向后)⋀has_组(r,单)⋀has_start_position (r, sp2)⋀has_length (r, ln2)⋀适合(r, e)⋀提到(m)⋀refers_to (r, t)⋀has_start_position (m, sp1)⋀has_length (m ln1)⋀适合(m, n)))gydF4y2Ba

在这种情况下,它也是有关跟踪如果指称相同指向后退或前进。我们可以把相同的例子和开关一个已知的人与他的职位:gydF4y2Ba(我)gydF4y2Ba(LT) kok yra马诺gydF4y2Bašeimos gydytojasgydF4y2Ba(名词指持有位置)?T。gydF4y2BaTomaitisgydF4y2Ba(人名词短语)yra labai patyręs jūsųšeimos gydytojas。gydF4y2Ba(EN)谁是我的gydF4y2Ba家庭医生gydF4y2Ba(名词指持有位置)?T。gydF4y2BaTomaitisgydF4y2Ba(人名词短语)非常有经验的医生给你。gydF4y2Ba

作为一个结果,gydF4y2Basp1gydF4y2Ba高于gydF4y2Basp2gydF4y2Ba和指称相同不同的位置常量值:gydF4y2Ba

每个文本的gydF4y2BatgydF4y2Ba句子gydF4y2Bas1gydF4y2Ba认识人gydF4y2BakgydF4y2Ba在出版日期gydF4y2BadgydF4y2Ba有一定地位gydF4y2BahgydF4y2Ba(出版日期gydF4y2BadgydF4y2Ba是相同或晚于职位gydF4y2BahgydF4y2Ba开始日期gydF4y2BafdgydF4y2Ba和相同或比早些时候的位置gydF4y2BahgydF4y2Ba结束日期gydF4y2Ba道明gydF4y2Ba),提到命名实体gydF4y2BaegydF4y2Ba,有一个起始位置gydF4y2Basp1gydF4y2Ba和的长度gydF4y2Baln1gydF4y2Ba同样,对于每个文本的gydF4y2BatgydF4y2Ba句子gydF4y2Bas2gydF4y2Ba提到的名词gydF4y2BangydF4y2Ba,有一个起始位置gydF4y2Basp2gydF4y2Ba,长度gydF4y2Baln2gydF4y2Ba命名实体后,提到gydF4y2BaegydF4y2Ba(名词gydF4y2BangydF4y2Ba较低的起始位置吗gydF4y2Basp2gydF4y2Ba命名实体的gydF4y2Basp1gydF4y2Ba),其引理gydF4y2BalgydF4y2Ba与职位的匹配gydF4y2BahgydF4y2Ba引理gydF4y2BalgydF4y2Ba,号码是单数和性别g匹配已知人的gydF4y2BakgydF4y2Ba性别gydF4y2Ba ,唯一一个指称相同关系gydF4y2BargydF4y2Ba解决在文本gydF4y2BatgydF4y2Ba“名义”类型的,“特性”型、“转发”地位和“单身”集团之间的名词gydF4y2BangydF4y2Ba和命名实体gydF4y2BaegydF4y2Ba,它的referent开始的位置gydF4y2Basp2gydF4y2Ba和长度gydF4y2Baln2gydF4y2Ba,适合只有一个名词gydF4y2BangydF4y2Ba是指只有一个提到gydF4y2Ba米gydF4y2Ba开始的位置gydF4y2Basp1gydF4y2Ba,长度gydF4y2Baln1gydF4y2Ba,只适合一个命名实体gydF4y2BaegydF4y2Ba,存在gydF4y2Ba(12)规则。gydF4y2Ba规则12:∀t, s1, s2, n, k, h, l, d, fd, td, g, sp1, sp2, ln1 ln2。[文本(t)⋀句子(s1)⋀句子(s2)⋀添加consists_of (t, s1)⋀添加consists_of (t, s2)⋀Person_NE (e)⋀包括(s1, e)⋀名词(n)⋀包含(s2, n)⋀Known_Person (k)⋀mentioned_as (k, e)⋀Position_held (h)⋀持有(k, h)⋀has_lemma (h、l)⋀has_lemma (n, l)⋀has_publication_date (t, d)⋀has_from_date (h, fd)⋀has_to_date (h, td)⋀fd td≥d≤d⋀⋀has_gender (k, g)⋀has_gender (n, g)⋀has_number (n,单数)⋀has_start_position (e, sp1)⋀has_start_position (n, sp2)⋀sp1 > sp2⋀has_length (e ln1)⋀has_length (n, ln2)⟶∃!r∃! m。[指称相同(r)⋀resolved_in (r, t)⋀has_type (r,名义)⋀has_subtype (r,特性)⋀has_position (r,向前)⋀has_组(r,单)⋀has_start_position (r, sp2)⋀has_length (r, ln2)⋀适合(r, e)⋀提到(m)⋀refers_to (r, t)⋀has_start_position (m, sp1)⋀has_length (m ln1)⋀适合(m, n)))gydF4y2Ba

4所示。结果和评价gydF4y2Ba

节中给出的算法算法和规则gydF4y2Ba3gydF4y2Ba是作为一个单独的组件实现和集成到语义搜索框架NLP管道(图gydF4y2Ba1gydF4y2Ba),因为它要求词汇、形态和不应该分析文本的注释。其他语言的解决方案不应遵循相同的NLP管道架构。但与词汇的算法组件,文本的形态和NE信息必须保证。gydF4y2Ba

立陶宛算法是使用Java编程语言实现和注释的JSON数据格式存储。但该方法不依赖技术,为其他语言,它可以在其他平台上实现。gydF4y2Ba

评估是由分析100篇文章被preannotated和可用立陶宛语言指称相同语料库[gydF4y2Ba55gydF4y2Ba),除了转录记录医疗接待,我们不能透露由于隐私需求。gydF4y2Ba

进行评估,我们使用精度、召回和gydF4y2BaFgydF4y2Ba1指标。回忆gydF4y2BaRgydF4y2Ba的比例是正确解决逐字表达吗gydF4y2BaCgydF4y2Ba总数量的表达式gydF4y2BaTgydF4y2Ba。精度gydF4y2Ba 的比例是正确解决逐字表达吗gydF4y2BaCgydF4y2Ba解决逐字的数量表达式gydF4y2BaFgydF4y2Ba。gydF4y2BaFgydF4y2Ba1是一个调和平均数的gydF4y2Ba 和gydF4y2BaRgydF4y2Ba:gydF4y2Ba

五个实验进行不同组合的指称相同算法提出了部分gydF4y2Ba3gydF4y2Ba。表中给出的实验结果gydF4y2Ba3gydF4y2Ba。gydF4y2Ba

请注意以下威胁我们的结果的有效性:gydF4y2Ba(我)gydF4y2Ba公共人员的数据库必须不断更新新的信息。否则,回忆会明显降低当注释新的文本。gydF4y2Ba(2)gydF4y2Ba的情况下使用复数代词和名词,他们很难被识别,因为许多变体可能经常忽略语法规则的兼容性。gydF4y2Ba

连接的命名实体职位考虑文本的出版日期是有限的考虑到文本可能今天发表但关于过去发生的事情。没有工具可以识别文本的某一部分的时间。gydF4y2Ba

5。结论gydF4y2Ba

医疗实体识别和指称相同困难的任务在立陶宛的自然语言处理(NLP)。我们提出了立陶宛语言指称相同分辨率的方法。指称相同分辨率取决于形态和命名实体识别算法(尼珥)注释和既存数据库。由于该方法脱离具体实现和规则被形式化,不会很难适应语法上类似的语言。我们新奇的过程以最少的语言指称相同资源的能力,这是非常重要的考虑在语言应用程序资源不足和濒危语言。虽然该方法提供了令人鼓舞的成果,在分析转录医疗记录和其他全集,他们与其他作者的成果应用在其他语言不同的解决方法,它具有一定的局限性:它是特定于域的,只能够解决指称相同类型的一个子集,在相对较小的数据集用于实验。尽管如此,我们希望我们的方法能有助于NLP-powered在线医疗保健服务的可持续发展在立陶宛。gydF4y2Ba

数据可用性gydF4y2Ba

本研究中使用的数据是可用的。gydF4y2Ba

的利益冲突gydF4y2Ba

作者宣称没有利益冲突。gydF4y2Ba