文摘
临床决策支持(CDS)执行搜索来检索关键医学文献可以帮助医学专家通过提供适当的医疗信息的实践与医学相关案例。在本文中,我们提出一个新颖的cd搜索框架设计通过检索从生物医学教科书为了支持临床决策使用实验室的测试结果。框架利用两个文本的独特特征报告来自测试结果,这是语法变异和否定的信息。拟议的框架由三部分组成:领域本体,索引库,查询处理引擎。我们首先创建了一个领域本体来解决语法变异将本体应用于检测医学概念的测试结果与语言翻译。然后我们预处理和执行索引的生物医学教科书建议临床医生通过检索。我们终于建立了将处理引擎为cd,包括翻译,概念检测、查询扩展,pseudo-relevance反馈在当地和全球的水平,与微分否定信息的权重和排名。评估拟议的框架的有效性,我们跟着标准信息检索评价过程。创建一个评估数据集,其中包括28581文本报告实验室测试结果和56228段广泛应用生物医学教科书、临床医生推荐的。总的来说,我们提出通过检索框架,GPRF-NEG,优于基线36.2,100.5,69.7%,MRR、R精度和精度分别为5。我们的研究结果表明,该cd搜索框架专门为通过生物医学文献检索临床医生实际上代表了一种可行的选择,因为它支持他们的决策过程提供相关段落从他们喜欢引用的来源,通过改进表现。
1。介绍
在病人保健,近70%的临床决策使用临床实验室测试结果(1]。由于病人的大量测试,包含3000分析物,基于实验室结果的解释通常复杂且容易出错,经常导致灾难性故障在临床决策(2]。各种研究[3,4)表明,这些错误非常频繁,和一些错误(6.4 -12%)可能对病人护理产生不利影响。这些统计数据强调迫切需要一个合适的cd的临床决策支持系统,是指一个系统设计,协助临床医生通过提供相关和及时的医疗信息5]。在现代背景下的信息检索,光盘系统的一个重要功能是检索关键医疗信息可以帮助医学专家在检查实验室测试结果,通常被称为cd搜索(6]。
在临床,临床医生有非常有限的时间搜索和吸收的信息需要在执行医疗实践7,8]。这个时间压力的形势需要的相关信息搜索检索,提出了一个更简洁的形式,如在短通道,而不是整个页面或文档。在这项研究中,我们提出一个新的cd搜索框架适用于常见的诊断上下文使用临床实验室测试结果的制定医疗从业者的意见和建议。这些实验室测试结果通常有两个独特的特征,没有发现一般查询:语法变化(9)和否定指标(10]。
首先,语法变异主要发生在使用缩写,缩写词和同义词(11]。在执行测试结果,根据临床诊断实验室医学从业者经常使用各种缩写以任意方式(12,13]。例如,实验室测试之一,甲胎蛋白,主要是缩写为法新社文本报告但也有差异,例如AFP-L3百分比,法新社,等等。这些语法变化存在一个严重的挑战,从查询检测正确的医学概念,这是关键的一步搜索性能(6]。此外,我们在一段水平和执行查询扩张过程文档级别连续,为了减少查询漂移的影响。passage-level扩张,词共现与初始查询发现额外的医疗的概念;文档级,相关性的概念是对文档进行编码脉冲再次验证了语料库,这比通过语料库覆盖医药领域。
其次,专家在临床实验室花大量的时间写临床报告基于测试结果异常而不是正常的测试结果,因为假阴性错误导致医生错过的机会适当的治疗(14]。事实上,当测试结果是正常的,cd搜索的用户意图是相当简单如指测试的范围值。另一方面,当临床医生请求一个cd搜索任务寻找分表异常测试用例,他们的搜索意图变得更复杂,因为他们经常寻找副作用和相关疾病的具体实验室检测(15),这意味着段落包含解释异常的相关测试应该排名更高的检索结果。例如,异常查询,例如“嗜酸性粒细胞增加“应该把更多的权重等段落包含异常情况。据我们了解,没有研究试图区分异常和正常的情况下,他们也没有重量段落检索不同取决于案件的类型。
在拟议的cd搜索框架,涵盖的领域本体语法变异和语言翻译以及利用现有医疗包括本体。查询执行扩张的通道和文档级别过滤无关的概念被扩大。此外,当给定查询来自异常情况下,排名过程更大重量的那些段落包含异常描述利用否定信息的查询和段落。拟议的框架显示显著改进的基线和其他方法相比,包括变异的一些先进的方法(8,16,17]。
综上所述,本研究的贡献如下:(1)提出一个新的段落检索框架根据临床环境实验室测试结果作为基础来形成医疗从业者的意见和建议,(2)框架解决两个问题,在临床医疗实践意义:语法变化和否定指标,和(3)拟议的框架是经验为其生存能力评估在临床的设置。该cd搜索框架被应用到实际使用的组织,产生积极的结果。
2。相关工作
近年来,研究的一个重要身体了cd在网上搜索关于各种资源从传统的信息检索技术不能直接应用于生物医学信息检索由于特定领域生物医学文献的特点:[6)检查的可能性使用长的长度从叙事结构的查询。此外,•库普曼et al。18)自动生成一个查询从减少病人详细叙述使用查询方法。在这项研究中,我们关注从实验室测试结果,生成查询比叙事文本更具体的描述病人的条件。
在生物医学文献检索,有两个领域被广泛研究:概念提取和查询扩展。概念提取、手动医生的努力(19,20.)选择医学术语统一医疗语言系统(uml) Metathesaurus概念显示出有前途的检索性能。由于国家医学图书馆(NLM) MetaMap [21)然后发展到生物医学文本自动映射到统一医疗语言系统(uml) Metathesaurus概念。目前,MetaMap积极采用各种生物医学的概念检测在大多数任务(6,22- - - - - -24]。MetaMap的特点之一是它生成每个词的变体。生物医学文献文本映射到临床与uml概念标识符标记,另外他们的同义词、缩写,缩写,井斜变体。
cTAKES [25)也为临床概念提取另一个广泛使用的应用程序。cTAKES是专为临床叙事与MetaMap针对生物医学文献。结果尼珥等cTAKES包含语义类型的注释器疾病、症状、药物,否定注释。小王和方26)使用cTAKES和MetaMap检测名词短语,进行缩写扩张,分别;它显示改善的空间解决歧义识别多个条件时在相同的自由文本。
之间的技术来提高性能的生物医学文献检索,查询扩展是最常见的一种技术。查询扩展的目标是找到同义词和其他相关条款增加召回相关文件(27]。扩大技术采用生物医学红外(信息检索)到目前为止主要分为两类:外部资源的使用和pseudo-relevance反馈技术。
作为外部资源,uml (24),谷歌(16],MediLexicon [26),和网20.)词汇知识资源和积极的例子用来找到相关条款。马丁内斯et al。28)使用uml表示,建造了一个图。通过使用随机游走图中,他们有效地进行查询扩展的任务。Yu et al。29日使用由用户显式相关性反馈标记,为了运行RankSVM [30.)排名初始搜索列表。
然而,这些本体只包括一些代表性的词汇表的某些概念和不包括所有的变化在临床环境中频繁出现的(13]。此外,这些本体只覆盖概念英语;因此,用不同语言编写的一些变化不能覆盖(12]。随着医疗查询模糊性和复杂性,使得利用自动翻译困难(31日),一个高质量的、特定领域的本体,可以处理语法变异和语言翻译是必要的组件cd搜索框架为了帮助领域专家等医护人员(11]。
在获取隐式相关性反馈,pseudo-relevance反馈(脉冲)是一个基本的查询扩展技术,通常使用外部资源完成了最初的扩张。众所周知,找到潜在的有关条款首先查询索引和寻找新的相关条款从排名靠前的文件27]。脉冲重复频率的缺点是增加的可能性更少的有关条款,增加噪音。然而,它被广泛使用,因为它很简单和直接,它还有助于发现不相关术语中可用的资源。大多数当前先进的cd搜索(6,23,24,32,33)研究了医学信息检索与pseudo-relevance反馈方法。他们在不同类型的数据集进行综合评估;研究清楚地显示脉冲在生物医学文献检索的有效性。
不可避免的是,CDS搜索基于脉冲重复频率也患有一个著名的脉冲重复频率问题称为主题漂移,这会降低检索性能作为查询主题的意图可能会改变在一个意想不到的方向由于错误提取的概念被扩展34]。为了减少查询漂移的影响,字嵌入方法是利用词扩张(35)和搜索多样化(36]。同时本文passage-level扩张,与最初的查询词共现发现额外的医疗的概念;文档级,相关性的概念可以通过对文档进行编码脉冲再次验证语料库,覆盖在医学领域比通过语料库。
此外,没有之前的研究提出了一个框架,致力于通过检索在临床设置。大多数当前的cd搜索研究[16,17,33]只有专注于改善检索性能的相关文件,这通常是web上可用学术期刊文章如PubMed (https://www.ncbi.nlm.nih.gov/pubmed/),一个开放获取的生物医学文章集合。这些光盘检索搜索方法并不是有效的通道,更不用说一些最有用的生物医学,临床医生积极利用资源未被充分代表的开放获取集合。卡里et al。37)提供了一个cd红外搜索平台人员使用统一的数据集和cd搜索算法。然而,他们只局限于文档语料库。相反,在本文中,我们专注于通过检索从医学教科书。
3所示。方法
图1显示了我们的总体体系结构框架,它包括三个核心组件之间的交互:(1)领域本体(和前面的本体创建所需的过程),(2)索引库(和之前的流程需要索引库),和(3)查询处理引擎(包括从预处理排名)。
首先,克服语法差异和语言差异,提出框架包括一个领域本体。是非常常见的在实践中有几个关键的医学概念的变异。有时organizational-specific变体。因此,它不能完全覆盖的公共本体。此外,用于该系统的输入数据都写在韩国的段落书是用英语写的,有必要建立一个本体提前将最初的文本报告翻译成英文单词的列表。技术术语的领域本体需要完全覆盖临床实验室测试结果和一个适当的结构适合翻译和概念检测。它还应该被转换成一个DB模式存储在数据库系统中实现。
第二,passage-level指标生物医学教科书应该为我们的生物医学文献检索。文献索引转换成一组快速访问相关信息的通道。参考信息也应提取额外的数据收集。除了索引生物医学教科书,额外的文档收集从web应该为两个主要目的:索引(1)收集用于查询扩张提出了cd搜索框架和(2)相关的文章也在随着通道返回我们的web服务。用户可以很容易地访问资源根据类型的资源检索(教科书与文章),这些资源提供了不同的选项卡的用户界面。
最后,一旦领域本体和索引都准备好了,我们建议的cd搜索框架可以通过这三个组件之间的交互操作。每个句子翻译成英语后,我们只使用医疗条件,可以获得通过领域本体或外部医学本体。我们称这一步检测(CD)的概念。根据检测到的概念,这些概念的同义词添加到初始查询通过UMLS-based扩张(UMLSE)。一个众所周知的查询扩展技术pseudo-relevance反馈(38),发现潜在的相关术语,首先查询索引,然后找其他相关条款从高排名文件,然后执行检测检索段落中经常使用的术语。PRF在拟议的框架有两个层次:检测重要术语在一段水平然后reweighing条款根据它们的重要性在文档级别,为了充分利用的优势有多个语料库在索引库中。鉴于扩张进行针对性的段落,我们称之为一步当地pseudo-relevance反馈(LPRF)。我们又进一步扩展这个过程执行编码脉冲在一组外部医疗文档在网上收集。这一步被称为全球pseudo-relevance反馈(GPRF)条款添加医学领域。最终检索,小说排名方法利用否定信息的重要性是必要的为了更重视相关段落包含异常条件的描述给定的测试结果。
应该注意的是,领域本体创建和索引处理执行离线在线执行其他步骤,以确保快速执行查询处理。在随后的部分,我们首先解释的程序和架构领域本体的创建。然后我们描述索引处理目标生物医学教科书和外部文档集合医学学术论文。最后,我们详细解释查询处理组件。
3.1。领域本体创建
领域本体的质量,如覆盖的领域,是cd搜索性能的重要因素[11]。更重要的是,因为本文的本体也用于翻译阶段,本体不仅要覆盖所有使用的缩写和词汇,而且在特定的医疗机构,这个系统的目的是在实践中使用。在选择医疗机构,位于韩国,根据临床诊断实验室测试结果的监督下执行部门进行肝脏疾病的医学实验室测试,hematology-related测试,糖尿病引起的测试,kidney-related测试,关节炎/ venereal-related测试,和癌症/ thyroid-related测试。因此,案例中的内容可以分为疾病,测试与每个疾病相关,具体测试所需标本。这些类别被定义为类的领域本体。此外,为了使我们的框架可再生的其他研究人员,现有外部医学本体uml和KOSTOM等(https://www.hins.or.kr/cmm/main/mainPage.do)连接到我们的本体包括他们独特的实例标识符(即。计算),如果这个词在我们的本体和共存外部本体。
我们简化了领域本体的设计,以确保快速访问的本体系统,如图2。类命名为“测试”是指临床实验室测试组件报告病人的健康状况,表明它连接领域本体中的每个类。例如,血清淀粉酶试验是进行检查病人是否有fructosuria。等其他类“标本”,“类别”和“疾病”被用来定义属性的相应部分。“标本”是用来定义标本用于执行给定的测试,如血清或尿液。“类别”是用来定义给定的测试属于哪一类。最后,“疾病”疾病信息,如疾病名称和身体部位的疾病的影响。
我们从资源中提取所有条款如内部测试参考手册,硬拷贝的医疗报告,和其他文件提供有针对性的医疗机构。提取后,进行每一项映射到相应的类类型来创建实例。分组时,实例有相同的意义被重新审视词典。在一个群体,一个学期被选为代表,和其他人是分配给该实例,定义为词汇关系。例如,表1提出了多语言(即。,Korean and English) synonyms of some representative instances.
创建领域本体的最后一步是手工检查本体。在这一步中,领域专家检查的有效性实例和它们之间的关系。此外,条款,不习惯在实践中,但可以在查询中使用,被添加到本体等合作医院的名字。
所有的步骤都完成后,我们获得了一个本体,包括4类,4属性,668实例,1961词汇的同义词。除了在本体中定义的信息,可以进一步扩展到外部本体实例是否存在于所选择的外部本体匹配的惟一标识符。例如,“淀粉酶”,这是一个测试类的实例可以扩展到外部uml本体,因为它有自己的uml代码(C0002712)创建的本体。应该注意的是,我们只使用术语表中定义的本体研究,虽然本体包含更多有用的信息,比如关系。本体是公开的其他研究人员对其他应用程序(http://kirc.kaist.ac.kr/datasets/)。
3.2。索引处理
我们采用生物医学教科书通过检索。一段的长度可以是一个句子或段落根据情况。在报道8)、医疗从业者喜欢读一段相关信息包含在一个迅速消化的形式而不是整个文本页面。因此,我们专注于检索一组候选段落段落。
首先,我们处理三个著名的生物医学教科书时通常由多个临床医师推荐目前诊断决策。图3显示了整个流程获得一组通道的书。在文本和图像提取、转换特定格式的纯文本的文学是进行进一步处理。
基于文献的转换版本,我们提取的元数据,包括标题、作者、章节,参考,表标题、内容和图片的书籍通过使用PDFBox (https://pdfbox.apache.org/)。提取的图像展示给读者点击相应通道时。然后提取所有的段落和句子从一个连续的文本块列表通过斯坦福NLP (39]。我们丢弃的那些段落句子总数的不到两个,因为他们更有可能标题或标题。参考条目然后提取如果他们匹配预定义的格式参考section-reference头表情如“引用”“参考书目”,引用和笔记,或结束的章节。自动提取的所有属性,其次是手动执行检查来验证提取。表2礼物描述性统计我们用于通道的医学文献检索。临床医生推荐的,我们选择三个教科书那些标题缩写如下:HCDMLM2017 [40],PGDT2003 [41],RCPBD2014 [42]。它指出,没有图像PGDT2003 [41),因为它是一本口袋书格式没有一个图像作为一个连续的表列表。
最后,进行了索引段的段落。因为指数时间、空间和存储的重要因素的实际使用情况提出了框架,我们使用土地(http://terrier.org/开源搜索引擎)候选人。它提供了有效的索引创建和快速访问内置查询扩展技术的文章。如果一段包含图片或表、链接等资源索引以及段落。
除了选择生物医学文献索引进行了额外的文档集合的查询中使用扩张过程中提出的框架。集合是开放获取的子集PubMed Central (PMC) (https://www.ncbi.nlm.nih.gov/pmc/)。PMC是一个在线数字图书馆的免费全文生物医学文献。快照包含733138篇文章。每一篇文章的全文都被表示为一个XML文件。图像和其他材料也可用。集合中的每一篇文章都有一个唯一的标识符(PMCID)在其XML文件。索引文件,我们开发了一个简单的java程序来从XML文件中提取内容和土地使用索引摘要和内容用于查询扩展。
3.2.1之上。查询处理
在本节中,我们介绍红外技术包括查询扩展和排名方法纳入拟议的框架。对于检测概念,我们使用一个特定于域的工具,MetaMap [21)检测医疗术语。同义词的条件查询中添加使用定义域和外部本体扩张过程。我们还引入一个精致的最初版本的pseudo-relevance反馈(脉冲)检索段落和外部医疗文件。应该注意的是,这些步骤是查询扩展的最先进的技术。最后,typology-aware排名方法提出了要充分利用否定信息从案例报告基于实验室的测试结果。
(1)预处理和翻译。当一个最初病例(json javascript对象表示法,轻量级数据交换格式)输入,“报告正文”头标识。标题的文本然后分成词语或符号称为令牌)。都写在韩国的经文;因此,形态分析韩国另外需要令牌。这样做,一个开源韩国形态分析仪,Komoran (http://www.shineware.co.kr/products/komoran/),用于检测只测试结果的名词。对于英语术语,大写字母转换成小写字母,如果他们有任何。这些术语然后翻译成英语,每个韩国术语映射到一个相应的代表英语术语词汇本体中定义的关系之前。如果没有相应的英语术语,这些韩国人被丢弃。
(2)概念检测(CD)。这一步检测概念的术语列表前面步骤中获得的。领域本体包括同义词条件测试、疾病、类别,和样品用于检测初始概念。多亏了有代表性的本体术语的概念,所有检测到的概念可以改变其代表的概念。然后,MetaMap [21),广泛用于检测概念在各种生物医学检索任务22- - - - - -24),是用来注释每个概念各自统一医疗语言系统(uml)的概念。作为uml语义类型有超过100,我们的观察表明,映射应该局限于以下类型:疾病或综合征(T047)迹象或症状(T184),病理功能(T039),诊断程序(T060),解剖异常(T190),实验室程序(T059)药理物质(T121),肿瘤过程(T191),治疗或预防程序(T061)。初始的查询,然后重新构造通过删除所有的条款没有任何映射到uml的概念。
(3)UMLS-Based扩张(UMLSE)。最近的cd搜索模型表明,查询系统扩张与统一医学语言(uml)的概念可以显著影响生物医学文献检索的一般性能28,29日,32]。因此,我们也利用外部医疗资源为了扩大的初始列表查询中的概念。在现在的研究中,对所有从前面步骤映射uml概念,同义词使用BioPortal提取(https://bioportal.bioontology.org/),586年由医学本体包括一些受欢迎的网格和snom)等。BioPortal提供web API服务浏览本体,同义词仅仅可以通过查询获得每个映射的概念。注意扩展条款设置权重较低,每个重量为0.5,比术语映射的概念。
(4)当地Pseudo-Relevance反馈(LPRF)。UMLSE的一个限制是,只有同义词添加到查询而不是原始查询密切相关的条款。例如,因为“酮”和“糖尿病”是高度相关的专业的医护人员,检测潜在的信息而不是只有扩大同义词的两项对检索性能有积极的影响。因此,对于一个给定的查询,pseudo-relevance反馈(脉冲)38),初始检索文章,提取从顶部N文章,然后再申请扩大了最终的检索查询,收集执行附加的条款。更具体地说,它获得候选术语copresented passage-distance水平内k段落检索。脉冲重复频率只探索了本地存储的语料库,没有考虑外部资源,我们称之为一步当地pseudo-relevance反馈(LPRF)。
我们调整了“IDF查询扩张”方法(32)符合我们的实验通过计算每个术语的提高系数扩大查询如下:该算法首先标记k段落检索查询问。然后建立根集 ,由联盟的一组包含所有条款问和所有检索到的文章中的词汇的集合问。为每一个词 ,的重量得到如下: 在哪里是j届任期k的段落,的数量是在根集 ,N上面的数量条款k的段落,是一个指标项的存在吗在问,是一个指标项的存在吗在通道 ,和的反向通道频率吗j届任期k段落。最后,α和β是平滑的因素。我们设定的参数α= 2,β= 0.75,k= 5,建议在32]。
3.2.2。全球Pseudo-Relevance反馈(GPRF)
我们进一步扩展框架,以反映更广泛的临床领域知识(医学术语)。全球pseudo-relevance反馈(GPRF) LPRF相似。唯一的区别是,它执行在不同的语料库,PMC的一组文件。它检索顶部k文档,构建根集查询的,计算分数为每个术语使用方程根集(2),然后可实现分数使用方程(1)。让我们表示分数 。通过这样做,不像UMLSE从预定义的本体,只添加同义词GPRF可以发现潜在的文档和通道全集。最后一项的分数计算跟随: 的参数λ设置为0.65,这是观察在实验中表现最好的价值。一旦所有的权重已经决定,在条款由他们的分数排名,顶部米条款不被添加到原始查询问,米对我们的实验将35。我们适应土地执行LPRF GPRF因为它提供了一个可定制的脉冲重复频率的函数。最后,新配方中的每个词查询然后用于最终通过检索。
3.2.3。排名
我们也使用否定概念检索到的文章中发现的信息。否定列表包括表达式如“正常”,“负”,“不,”和“,”表示没有问题的相关概念。表3显示了一些例句的正常和异常情况下的概念是研究NegEx (http://code.google.com/p/negex/否定的状态。在表3时,值得注意的是,一个概念否定一个案例是正常的。与此同时,本案概念时肯定是不正常的。这意味着,关注假阴性错误预防、排名函数应该体重更多章节包含异常情况下确认的概念。
前差加权根据查询情况下的极性,我们第一次将“不——”前缀附加到从概念negation-necessary在扩大问。例如,在查询文本“法新社是正常的,”“法新社”的扩展条款通过附加UMLSE一步是否定“不——”前缀。应该注意的是,最初的术语,“法新社”,不是改变,以防止原始查询意图。前缀附件的目的是更有利的潜在条件,通过GPRF发现,在查询时不必要的否定概念的同义词是正常情况。然后使用这些查询检索初始相关章节。
我们采用了土地运行多个红外模型包括TF-IDF BM25, LM(语言模型)。对LM,我们使用贝叶斯滤波之前使用狄利克雷默认值的参数(μ= 2500)在土地上。结合之前,0 - 1正常化(https://en.wikipedia.org/wiki/Feature_scaling)对每个分数。通过分对于查询问,表示 ,结合红外的分数计算模型如下: 在哪里是通过的分数吗使用IR模型 ,N使用IR模型的总数,米检索到的文章的总数。请注意,N和米分别设置为3,100。基于原始查询的否定信息文本问,得分最终权重如下: 在哪里和表示否定的数量概念,而不是否定概念(即。确认)对于一个给定的原始查询文本问,分别。与此同时,和表示否定的概念和确认的数量概念的通道 ,分别。γ是一个促进因素。这是一个简单但有效的方法对体重的段落,可能包含描述异常情况下临床实验室测试结果问。然后我们等级降序排列的段落根据自己的分数并将结果返回给临床医生来支持他们的决策。
4所示。结果
在本节中,我们首先介绍我们创建真实数据集的实验以及度量和比较方法。然后我们报告检索该框架的有效性之后,参数敏感性的结果。最后,我们引入一个基于web服务的框架安装在医疗机构,以确保框架的可行性。
4.1。实验装置
目前还没有合适的基准数据集包含临床实验室测试结果和生物医学教科书通过检索,可以用来评估该cd搜索框架的有效性。NIST的TREC [27提供30医学案例报告查询列表和生物医学2014年以来文学语料库。这是本研究最相关的数据集,但学术研究论文的主体是一个列表,这是生物医学教科书和段落。因此,在本文中,我们的实验的另一个数据集构建包括30文本报告(包括实验室测试结果)和段落从三个著名的生物医学临床医生建议的教科书。
表4提出了一个完整的列表的报告,用于查询评估拟议的框架,包含描述的患者及其数量的语法变化。这些文本报告从实验室医学学系获得Seegene说医学基金会(SMF) (https://www.seegenemedical.com/eng/index.jsp),位于韩国。语法变异的数量为每个文本报告获得通过检查引用值相应的测试。例如,一个文本报告”AFP-L3百分比是正常的”被认为是正常的一个变体在甲胎蛋白实验室测试结果,如果报告引用值连接在正常范围内。给定一个病例报告,我们的目标是检索文章,可以帮助临床医生诊断病人。创建一个基准数据集的评估,我们提取15正常情况下15异常频率降序排列的情况下,分别与30例。分类的情况下的原因是是否有正常和异常情况下之间的性能差异。在实践中,异常情况下不应忽视做出医疗决定时,因为它可能导致误诊的关键。因此,一个健壮的cd搜索框架应该没有显著的性能正常和异常情况下的区别。总共28581个变异的文本报告30例被用于实验。
比较表演,五个检索模型(UMLSE没有领域本体作为基线,UMLSE, LPRF, GPRF,和GPRF-NEG)建造了我们的实验如表所示5。基于基本NLP技术捕捉名词的报道,基线模型和UMLSE旨在观察领域本体概念检测的影响。同义词扩张后在网上利用外部资源,LPRF和GPRF分化在查询扩展测量的影响执行编码脉冲语料库在当地和全球水平。最后,GPRF-NEG包括领域本体、多级脉冲重复频率,否定差加权评估拟议的框架的整体性能。
我们的评估框架为临时模拟标准TREC评价程序检索任务(27]。这些模型提交单独运行每个话题,每次运行组成的500通道的排序列表/主题。每个主题由至少两个评估判断,以确保评估的可靠性。基线,我们只检测到名词概念运用基本NLP技术和基于名词进行扩张。评估是由20个陪审员,他们大多数都是在韩国医学专家从不同的机构。医务人员包括临床病理学家和护士。方便,我们开发了一个web服务评估的段落,也可以通过移动设备访问。完成三个查询每一个评估员,每一个查询是由至少两个陪审员,以衡量评分者间信协议。从陪审员避免潜在的偏见,这些段落是随机排序的前评估。
给定一个查询,评估判断段落是“肯定有关,”“可能有关,”或“不相关的。”“肯定有关,“一段应该提供相关信息(即特定病人描述的主题。、病例报告)。的信息将提供诊断、测试和治疗病人的描述的主题。另一方面,一段判断”可能是相关的,“如果是一个评估员认为这是自己没有立即的,但它可能是上下文相关的更广泛的文献回顾。最后,判断一段“不相关”如果他们不提供任何相关的信息的特定方面的病人所描述的主题。数据集,interannotator协议0.63,这表明实质性的协议43]。最后,对于每一个查询,我们获得平均为236.8,62.38和78.38的文章数量“无关”,“可能是相关的,”和“肯定有关,”分别。CDS搜索评价,可能是相关的和绝对相关集被合并成一组(“相关”)。
我们使用精度N,归一化累积折扣(nDCG),R精密,意思是互惠的等级(MRR)评估cd搜索的有效性。首先,精度N段落((电子邮件保护)措施有多少相关段落中检索N段落。同样的,R精确定义如下: 在哪里r相关文章的数量吗R和R的总数相关段落对于一个给定的查询。
第二,nDCG措施的平均性能cd搜索的排名方案。它分配更多的权重高排名的文章如下: 在哪里p表示排名位置,表示常规心电图价值积累的排名位置p,表示获得的价值和它的值是固定的,如果通过相关p。然后,最后一个常规心电图得分由IDCG规范化从0到1,这是最好的常规心电图价值如下:
最后,MRR措施如何建议的方法级别的资源。这是定义如下: 在哪里n的查询和数量吗是目标资源的位置在结果列表中。大MRR、更快的为用户访问资源的列表。
比较方法是先进的模型的基线和三个(8,16,17),类似于UMLSE LPRF, GPRF。应该注意的是,这三个最先进的模型被证明是一个表现最佳的模型cd搜索(27]。
4.2。效能评估
cd搜索集中在精密而不是回忆框架旨在帮助临床医生确定下一步行动照顾一个病人。图4介绍了精密性能在第十个点,然后到50点,为了观察整体精度性能趋势。我们专注于精密五个段落检索((电子邮件保护))为主要指标,每个方法的性能是一致的50分,更重要的是,医生可能会阅读段落检索实践。出于这个原因,表6介绍了基于MRR性能结果,R精度,(电子邮件保护)评估拟议的框架的质量。我们进一步分析了精密的趋势随着精度从1到50。值得一提的是,我们使用一个配对t以及测量任何两种方法之间的区别是否静态显著( )。
(一)
(b)
一般来说,基线表现很差,这意味着利用名词的一般方法,概念本身拥有一个明确的限制只在使用cd搜索。更重要的是,基线未能检测到当地语言concepts-another解释性能下降发生在缺乏领域本体。作为证据,UMLSE,包括概念检测(CD) synonym-oriented扩张基于这些概念,显示显著提高性能基线6.9,7.1,3.2%,MRR、R精度,(电子邮件保护),分别。
LPRF超过基线的13.0,43.2,22.8%,MRR、R精度,(电子邮件保护),分别。它还显示UMLSE显著提高了6.9,33.6,18.9%,每个指标,表明包含潜在的信息导致CDS搜索更有效。例如,对于查询“尿酸浓度增加,”LPRF发现“痛风”从最初段落检索相关的术语,也就是,事实上,这种疾病诊断的临床医生根据给定的查询。
GPRF进一步取得更好的性能基线。它超过基线的30.5、45.4和59.1%,MRR、R精度,(电子邮件保护),分别。此外,它取得了显著改善LPRF MRR和15.5和29.5%(电子邮件保护)分别表明利用潜在的信息基于外部文档主体积极有助于搜索性能。结果也强调了有限覆盖的部分通道中存在的潜在信息语料库相比外部文档语料库。
我们实现了通过使用GPRF-NEG最值得注意的性能。它超过基线的36.2、100.5和69.7%,MRR、R精度,(电子邮件保护),分别。此外,它优于GPRF 4.3, 37.9, 14.0%, MRR、R精度,(电子邮件保护),分别。否定的结果表明,将导致一个更有效的cd搜索排名函数。例如,查询“嗜酸性粒细胞增多,“GPRF未能发现“增加”作为潜在的相关术语检索,这是诊断的关键标识符“寄生虫感染”或“过敏性疾病。”
分析基于nDCG在第一个10分(图5(一个))表明,提出的方法、GPRF-NEG一贯优于基线(电子邮件保护),(电子邮件保护),(电子邮件保护)分别为41.3、38.7和36.1%。因为有限大小的相关性判断的结果,显示只有边际差异(电子邮件保护)和(电子邮件保护)并无显著差异(电子邮件保护)(图5 (b))。其余的改进率表中给出7。
(一)
(b)
另一方面,排名方案也是另一个重要因素,影响搜索效率。确保提出的质量等级方案,结合前面所提到的三种排序方案与否定微分权重,我们比较了nDCG每个方案在异常情况下的性能。表8显示不同的组合排名方案取得了显著提高每一个计划。它还实现最佳性能否定信息时使用。
我们进一步研究了基于精度和性能差异nDCG结果之间GPRF和GPRF-NEG将病例分为正常和异常,为了验证利用否定的影响信息查询和段落。我们特别关注的性能差距异常和正常情况下由不同的案件类型的差距是如何缓解利用否定信息的病例报告和检索段落。
(图的精度6(一)),对于GPRF性能差异的平均值之间的精度在第一个5分正常和异常情况下大约是0.104,表明一个大大大性能差距。另一方面,GPRF-NEG则为0.048,下降了53.07%,表明该方法表现更好无论案例报告的类型。值得注意的是,正常的性能结果也增加了利用否定信息虽然方程(6)时往往会不会影响排名的结果是正常的;我们认为这种改善的影响包括“不——”前缀的否定概念。通过这样做,查询过滤被扣除处理不恰当的概念,否定,从查询列表。方面的差距是边际nDCG(图6 (b))。然而,趋势是一致的,GPRF-NEG显示更多的浓缩和更高的性能对整个nDCG点。因此,大幅减轻性能差距是导致结合案例报告的两个主要特征基于临床实验室测试结果:首先,通过扩大的条款被认为是重要的在多个领域特定的语料库;其次,文章根据类型学的权重查询。
(一)
(b)
最后,我们观察到不同的结果影响最大的参数的有效性提出了框架在精度方面,五个,十个。首先,图7(一)介绍了参数米术语的数量,这是为查询添加扩张。其次,图7 (b)介绍了参数 ,平衡PRF影响不同语料库,图吗7 (c)提出了提高参数的影响γ控制利用否定信息的影响。根据结果,表演时达到最好的精度米= 35,λ= 0.65,γ= 2.0。
(一)
(b)
(c)
4.3。服务实现
我们实现了一个基于web的cd搜索服务的基础上,提出了临床医生Seegene说医学框架基础。图8说明了web服务添加到当前实验室诊断过程。当病人的标本送到临床实验室(图8()),机器在实验室产生测试结果并返回到诊断系统连接到临床医生使用的台式电脑(图8(b))。与当前的实验室诊断流程如图8临床医生后,该框架是利用输入初始文本报告基于结果。在这个扩展过程,及时报告发送到该cd搜索框架通过光盘检索相关文章搜索web接口和API(应用程序编程接口),提供搜索结果以JSON格式(图8(c))。临床医生可以确定他们最初的报告或寻找额外的相关信息通过阅读检索到的文章(图8(d))。最后,病人报告写的医学专家咨询期间用于病人护理(图8(e))。拟议的系统安装在与现有的诊断系统的实验室医学Seegene说医学基金会(SMF) (https://www.seegenemedical.com/eng/index.jsp),临床实验室中心在韩国的多个位置。服务还包括api返回一个JSON的相关文章和PMC文章列表查询通过输入文本。由于这种宁静的耦合,为服务数据库和web服务器可以管理在不同的物理位置。实现的系统是基于JSP / Tomcat 8.0。
图9礼物的快照的诊断系统的接口和本体管理。提出系统设计工作与现有的诊断系统,而不是作为一个独立的系统,为了减少与新系统相关的学习曲线。在图9(一),诊断系统,用户可以激活cd搜索功能在一个新的浏览选项卡中点击相应的初步报告。通过单击工具条上的“设置”图标,列表项领域本体可以通过搜索和浏览,编辑,如图9(b)。
图10提出了界面的搜索结果和详细的快照视图。图10(一个)显示,返回一个相关文章的片段列表以及相应的缩略图和表。发现的概念从提出框架突出显示。如果检索段落包含一些图片或表格,它的缩略图。另一方面,数字10(b)表明,“文章”选项卡提供PMC相关文章的列表。每一篇文章与浏览的PMC的位置。一旦一段从列表中点击,元数据,比如标题、作者和出版日期显示如图连同他们的详细内容10(c),阅读前一个和后一个段落,临床医生可以点击相应的按钮。图10(d)显示了通道的下一个页面呈现在图10(c)。
5。讨论
我们引入了一个cd搜索框架,它有效地匹配关键词确定临床实验室检测结果相关的生物医学的段落。拟议的框架是区别于之前的检索模型通常用于检索web文档或在拟议的框架侧重于学术期刊检索文本内容迅速消化的形式(即。短的段落),实际使用在临床设置。有效地检索相关段落诊断案例问题,框架强调了由概念检测的重要作用,通过本体扩张,pseudo-relevance反馈操作在当地和全球的水平,和微分否定信息的权重。经验评估这些组件的增量影响在搜索性能,我们已经检查了五个检索模型:基线,UMLSE, LPRF GPRF, GPRF-NEG。实验结果表明,每个添加组件正面影响搜索性能和最佳的性能是通过拥有所有这些组件。事实上,当前的主流生物医学文献检索主要涵盖了三个部分:概念检测、查询扩展和排名(44]。我们的研究结果表明,概念检测并与本体查询扩展都得到增强。同时,局部和全局pseudo-relevance反馈和否定微分权重都是另外重要的措施,可以进一步提高生物医学文献的检索性能。
更具体地说,UMLSE,利用领域本体概念检测过程中,超过了基线。这项发现强调了特定领域的本体建设的重要性在检测医学概念从最初的查询。的另一种方式处理语法变异最小化的负面影响查询漂流是执行编码脉冲在不同语料库来验证扩展方面的相关性。在实验中,GPRF执行编码脉冲在不同语料库,优于LPRF指标,表明过滤噪声方面运用多级编码脉冲技术积极影响检索的性能。最后,所有的功能,包括否定微分权重包含在拟议的框架应该放在一起实现最佳性能GPRF-NEG优于所有竞争模型在这个实验中。
拟议的框架已被实现为一个基于web的cd搜索服务与现有的诊断系统实际使用的大型医疗机构。我们所知,这是第一个研究将cd搜索带入诊断决策实际使用。为了使该框架完全适合目标特定临床领域,我们把两个独特的优势特征的文本报告来源于临床实验室测试结果。
首先,我们注意到,频繁使用的缩写和语法变异可能导致潜在的退化概念的检测过程。尽管研究[6,22,23,26]表明,概念检测一些改善,这些方法还不足以涵盖所有的语法变化只包含一组有限的条款和代表他们的一些同义词。因此,我们创建一个定制的本体领域的专业临床实验室检测。实验结果表明,构建的领域本体通过调查域文件和资源合作实验室从业者能够有效覆盖变化和缩写用于临床。
在处理语法变异通过查询扩张,我们还强调了利用执行混合使用passage-level和文档级查询扩展不同语料库。查询扩展是处理大部分的cds相关研究(最少6,23,24,28,29日,32,33]。然而,查询扩张只是表现在文档级语料库的大多数研究主要关注文档检索,而不是通过检索。
在目前的研究中,由于脉冲重复频率的缺点是增加的可能性更少的有关条款,增加噪音,我们更多的加权如果条款被认为是重要的语料库。passage-level扩张(本地编码脉冲),高接近查询扩展条款。此外,相关术语不是发生在通道都被通过文档级扩张(全球脉冲重复频率)。实验结果表明,这种组合的两种扩张的方法是非常有效的检索通过过滤不相关的条款从候选术语的列表。
第二,我们发现否定信息查询和段落应该小心处理得到进一步改进检索的信息是一个重要因素。处理否定在cd的搜索一直在处理一些研究[16,45- - - - - -47]。然而,它不是直接用于排序函数。李等人。16)简单的修剪否定概念在概念检测过程中,哦,荣格(45和翼和阳47]不同的加权文件如果有polarity-matched概念的查询和检索文档;但是他们没有把查询基于其类型不同。魏et al。46]研究可能是最接近我们的工作,因为它还添加了前缀否定概念,因此只有polarity-matched概念会被发现。但是,与之前的研究[16,45- - - - - -47),我们充分利用否定信息到我们的排名函数以及检测过程的概念,当给定的查询应该是不正常的。所示的实验中,这种方法被发现增加检索列表中相关段落的数量以及影响排名列表本身。
总之,实验结果是三倍的重要性。首先,研究结果证实特定领域的本体cd搜索的重要性虽然已经存在几个医学本体。结果表明,特定领域的本体可以弥合外部本体和应用程序之间的差距解决语法变异的限制,从而提高检测的概念。第二,研究结果突出脉冲重复频率的意义表现在当地和全球的水平。通过基层的查询扩展,附近发生的条件查询可以被进一步扩大。这些术语然后再加权的程度的医疗环境测量通过全局级别的查询扩展。这种组合方法减轻查询漂移的影响,减少的可能性,嘈杂的扩展条款插入查询。最后,尽管这是一个简单的方法,采取否定信息框架的一个优势是一个重要因素来实现进一步改进通过检索。由于其简单的方法,提出的评估可以即时执行,这意味着实际的cd搜索应用程序基于框架仍然承诺快速执行,没有延迟的检索效率的提高。
有进一步改善的空间。首先,在这项研究中,我们只处理的案例报告临床实验室测试结果。然而,有更多的医疗任务,可以应用于拟议的框架。我们的未来工作的目标是扩展数据集采用尽可能多的医学领域。进行未来的工作,额外的查询集从组织病理学和段落其他医学文献的过程中收集。其次,通过检索可以进一步提高合并距离信息,因为它强加了一个距离约束在一段匹配的查询项的水平。利用邻近的一个可能的扩展是使用知识结构(48),图形可视化关键概念及其关系在特定的域节点概念的关联关系。在[49),知识结构被证明是有用的对proximity-aware信息检索通过探索丰富的概念在一个特定的域之间的关系。未来的研究可能利用它来进一步提高的效率提出了框架。在[50),一式两份的图生成文档检索和实体之间从文档中提取测量实体候选实体的重要性,和那些重要性评分被用来搜索结果排名第一。虽然我们更关注查询扩展而不是评估,这种基于方法仍然可以适应从知识结构中提取候选术语另外通过测量项条款的重要性以及共生。最后,正如我们的主要目标是提出一个新的框架来提高检索cd搜索,通过提出cd的可用性服务安装在该机构没有调查。这些正式的可用性测试将在我们未来的工作进行观察的有用拟议的框架是通过用户调查和日志数据分析领域的专家。尽管有这些限制,我们的研究仍然在设计领域特定的cd搜索系统提供了重要的见解,利用独特的临床特征,以确保性能可靠的cd搜索服务。
6。结论
这项研究表明,拟议中的cd搜索框架专门为通过生物医学文献检索提高检索性能,通过相对于现存的检索方法。实验结果实证表明,该概念框架组件检测加上领域本体,UMLS-based扩张,本地pseudo-relevance反馈,全球pseudo-relevance反馈,与否定微分权重和排名都有优点和整体性能加上独特的段落检索在临床的设置。特别是,我们的研究结果强调的重要性考虑独特的特点(即语法变异和否定信息)的临床领域进一步发展cd搜索性能。此外,我们的研究结果表明,pseudo-relevance反馈执行本地和全球各级都有重大影响的搜索。我们打算发布的所有数据集,我们已经创造了一个真实包括领域本体和公众,这样的数据集可以被其他研究人员使用促进临床决策的支持。
数据可用性
本研究的数据集用于支持这些发现是可用的http://kirc.kaist.ac.kr/datasets/。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作是支持的工业战略技术开发计划,10052955,经验知识平台开发研究领域专家知识的获取和利用,由贸易部、工业和能源(MI、韩国)。