研究文章|开放获取
李建,Jung-wei风扇,伊夫·a·西尔, ”语义建模与探索性Exposomics评估在临床环境”,医疗保健工程, 卷。2017年, 文章的ID3818302, 10 页面, 2017年。 https://doi.org/10.1155/2017/3818302
语义建模与探索性Exposomics评估在临床环境
文摘
Exposome精密医学模式是一个关键维度。有效的表示exposomics知识是工具,融合nongenetic因素为临床研究数据分析。还有有限的工作(1)与适当的集成建模exposome实体和关系主流本体和(2)系统地学习他们的存在在临床上下文。通过选择本体论关系,我们开发了一个模板驱动的方法来识别exposome概念从统一医疗语言系统(uml)。派生的概念进行评估的文献报道和协助临床文本注释的能力。生成的语义模型代表了丰富的领域知识对曝光事件(454双曝光和结果之间的关系)。此外,5667障碍概念的列表创建微生物病因推断病原体的风险敞口。模型始终覆盖大约90%的PubMed文献exposure-induced医源性疾病超过10年(2001 - 2010)。模型导致的效率exposome注释在临床文本过滤掉78%的机器无关的注释。50注释放电分析总结帮助推进我们的理解exposome临床信息文本。 This pilot study demonstrated feasibility of semiautomatically developing a useful semantic resource for exposomics.
1。介绍
精密医学代表一个范式进行生物医学研究和实践的考虑个人variation-genes,环境和生活方式(1]。环境和生活方式因素发挥重要作用众所周知,我们的健康和通过表观遗传与基因组件交互过程(2]。exposome[的概念3),它在2005年第一次出现,代表所有nongenetic因素,一个人暴露在整个一生。常见的例子是污染物,烟草和酒精的使用,职业危害,甚至心理社会应激如被虐待的受害者。Exposome精密医学和科学已经收到了越来越多的关注已经演变成一个跨学科的领域在生物学、基因组学、公共卫生、统计数据和信息4]。为了捕获各种与健康有关的上下文的全貌,有必要exposome参数合并到知识工程和数据分析5]。
每当提到exposome时,共同的理解是指在社会历史环境条件和自我暴露。事实上,已经被越来越多的使用社交兴趣历史信息(例如,物质使用和职业)从临床文本(6- - - - - -8]。另一方面,经常被忽视在临床设置曝光,其中许多是医疗活动的结果。考虑到简化方程“表现型=基因型×环境,“广泛的研究都集中在表现型(9从电子健康记录(病历)。同样,我们认为这是同样重要的调查中所有可用信息exposome电子医疗纪录,任务称为“expotyping”[10]。小Vertosick博士的引用,当空气,“你不是再也不一样了你的大脑”(11)很容易解释暗示任何程序,尤其是一个主要颅骨切开术(加上麻醉的并发症),可能有一个挥之不去的对健康的影响(例如,术后认知功能障碍(12])。此外,研究显示,即使是拯救生命的程序可能矛盾导致不良结果(例如,ventilator-induced肺损伤),根据病人的遗传易感性的微妙的相互作用[13]。幸运的是,现代电子医疗纪录可以作为主要数据源跟踪所有类型的临床exposome病人。另一个值得注意的类别是病原体的风险敞口,这常常发生在伪装,疾病可以确定性归因于特定的微生物。然而,挑战仍然等如何模型和提取丰富的exposome信息电子医疗纪录。
尽管不同exposome数据在电子医疗纪录,目前仍缺乏系统的建模和提取工作。可能的解释(1)许多医疗活动不视为风险,(2)大多数研究只集中在一个狭窄的一些具体的风险敞口,或(3)缺乏语义资源用于协助exposome信息的识别在电子医疗纪录。我们发现的最相关的建模框架接触本体(挂式)[14),地图等关键exposome概念接触事件,压力,和它们之间的关系。然而,房屋是一个光秃秃的骨骼尚未满是交叉引用在其他主要术语和概念目前覆盖感兴趣的各种临床exposome有限。弥合这些差距的关注在临床情况下系统地调查曝光,我们旨在半自动地推导出一个语义框架以及探索其可用性在促进exposome注释的叙述电子医疗纪录。我们的语义建模包括统一医学语言系统的一个子集(uml),因此,可互操作的主要生物医学术语。叙述电子医疗纪录是基于经验知识的兴趣,课文不仅作为一种良好的源环境/生活方式因素也文档广泛临床风险(例如,程序)。注释是为了获得通用评估什么exposome是临床中描述的文本信息,这将为发展中提取奠定基础工具和发现疾病的关联。
本研究的目标是(1)创建一个exposome-oriented从现有本体语义网络实体和关系,(2)对语义进行勘探评价充分性和可用性在临床情况下,和(3)总结exposome概念的属性在电子医疗纪录。总之,我们exposome子网代表丰富的领域知识,包括454对曝光和结果的语义类型。子网的概念始终覆盖大约90%的PubMed文献exposure-induced医源性疾病十年为一个周期。子网的过滤掉无关机输出的78% exposome注释50放电的总结。注释的分析提供了洞察exposome出现在临床环境中对现有本体资源和反馈。
2。材料和方法
2.1。uml和语义网络
uml (15)是世界上最大的综合生物医学术语框架由美国国立医学图书馆(NLM)。uml有三个主要组件:Metathesaurus(元),语义网络(SN)和专业词汇。元统一从多个源术语和概念本体成单个概念惟一标识符(崔)。截至2016年年底,它包含超过三百万个概念从199年来源。元包括文件主机丰富的语义信息。MRCONSO。RRF的主要文件,收集全面的崔在每个实体的来源。MRSTY。崔RRF文件链接每个相应的SN语义类型(s)。MRREL。RRF file preserves fine-grained semantic relations from source ontologies such as SNOMED-CT [16]。SN目前包含127的语义类型(例如,T037受伤或中毒)和54个不同的语义关系。SN关系可以追溯到他们的起源从NLM的医学主题词(网),分为层次(是一个)或无(例如,输入一个原因B型)[17]。用例不需要细粒度,还有一个映射,骨料SN类型分为粗语义组(18]。
2.2。语料库的i2b2 NLP挑战
为研究exposome概念在临床文献的分布和性质,我们使用消除识别信息的笔记从i2b2 NLP(自然语言处理)研究的数据集,包括合作医疗等机构的医疗记录。有大约十年的历史,i2b2挑战[19从基本]促进临床NLP研究不同(例如,指称相同分辨率)结束应用程序(例如,确定肥胖)。2006年的语料库(20.]de-identification和吸烟状况分类任务当前study-specifically选择合作伙伴的一个子集889原始排放总结没有任何注释。2006年被选中,是因为部分子集头发生主要与明确的大写模式,简化自动检测计算section-wise分布概念的注释。进一步,语料库句子边界predetected因此减少了NLP的努力。在概括性评价,我们也用73个独立的放电总结从贝斯以色列女执事医疗中心(或简称为“贝丝”以后),这是2010年i2b2语料库的一部分。
2.3。提取相关敞口语义类型
识别相关敞口的语义类型,我们开始与disorder-related语义类型。这种策略是基于假设任何暴露事件通常会导致一定的负面健康影响。图1(一)说明了我们的推理过程使用事件驱动的模板已经被陷害到问题:障碍nongenetic因素可能会导致什么?模板被用来搜索SN的SRSTRE2文件,包含完全继承了语义类型之间的关系。障碍的语义类型获得通过的障碍(DISO) SN语义组(18]。所有DISO语义类型包括除了T050疾病实验模型,它表明一种人工设置。我们手动确定四个语义关系,将涉及DISO类型在一个曝光(缩写为世博会)事件:(1)DISO是result_of世博会。(2)DISO是associated_with世博会。(3)世博会原因DISO。(4)世博会复杂DISO。
(一)确定曝光语义类型通过与疾病的关系
(b)识别疾病概念与微生物接触关系
许多候选人世博会语义类型匹配的模板;然而,并不是所有人也融入一个曝光的事件。例如,T019先天性异常associated_withT040生物功能不符合,后者不是一个合格的世博会类型。人工管理对所有候选人进行世博会类型模板,建议的,只有那些真正含义世博会→DISO事件保持。
2.4。提取微生物病因疾病的概念
识别微生物接触,只有疾病所提到的,我们使用细粒度语义关系元MRREL。RRF文件。的文件包含uml概念之间的语义关系从源本体填充。我们回顾了MRREL所有关系。RRF,选择了causative_agent_of从SNOMED-CT形成一个模板。图1 (b)使用模板的说明了我们的推理过程。我们手动确定三个特定的语义类型代表最常见的微生物暴露:T004真菌,T005病毒,T007细菌。使用模板搜索相当于问“微生物是一个概念causative_agent_of什么?“结果槽是由选择任何概念,属于DISO语义组如前一节所述。因此,每个确定障碍实际上代表了“接触”负责任的微生物,在SNOMED-CT基于领域知识建模。
2.5。计算语义充足率覆盖临床Exposome文学
评估如果语义建模合理覆盖临床exposome领域知识,我们使用PubMed文献关于exposure-induced医源性疾病在2001 - 2010。2010因为PubMed记录使用范围最最近几年可能仍在文献的索引,而不是反映了稳定视图的目的。基准设置由1248 PubMed id (PMIDs)查询:“副作用”(sh)和医源性(ti)和(“2001/01/01”[PDAT]:“2010/12/31”[PDAT])。网格的PMIDs自动提取和映射到使用MRCONSO崔。RRF和同义词信息来源。鉴于崔网格的术语,我们可以计算,网格计算属于接触或疾病的语义类型的派生exposome子网。注意,一个网有资格作为一个接触,我们还要求其次是副标题“副作用”或它的任何孩子“毒性”和“中毒。”PMID算作子网所能涵盖,至少一个网格必须属于一个接触语义类型(加上适当的副标题)和至少一个网属于疾病语义类型的覆盖EXPO-DISO关系(参见补充可以在网上https://doi.org/10.1155/2017/3818302)。时间趋势进行了综述的PMIDs和exposure-disease对覆盖,以及PMIDs覆盖的百分比和平均每个PMID exposure-disease对数量。
2.6。执行Exposome注释和分析在临床文本
对于批量preannotation, MetaMap [21)计划(2016年版)被用来确定889名合伙人放电中的uml概念总结。从MetaMap-identified概念,我们过滤通过保持只有那些microbe-caused的语义类型曝光或障碍。此外,正则表达式(大写词后跟冒号)被用来纪念节头的计算section-wise分布的概念。获得更可靠的总结exposome注释,第一作者(生物医学信息学博士学位)手动策划machine-identified候选人概念在50个随机排出一个显式的社会历史部分的总结。就规模而言,这subcorpus平均115句(或1124令牌)每个文档,和平均句子长度为9.5令牌。涉及的内容管理验证曝光,给病人和纠正任何错误的部分。这个过程被使用了乳臭未干的小孩注释工具(22]。根据策划的注释,我们计算概念的描述性统计分布在不同的章节和语义类型。作为再现性的一个粗略的评估,我们使用了策划暴露注释(不区分大小写)执行精确匹配到73年独立的贝丝放电总结和比较中含有那些暴露部分的分布。最后,定性分析了exposome概念的理解特点和现有的本体资源的限制。
3所示。结果与讨论
3.1。建模Exposome语义类型和概念
图的方法1(一)获得454 EXPO-DISO对通过关系联系原因,复杂,associated_with,results_of。有41个不同语义类型参与这些关系。策划的语义类型的完整列表对可在补充。EXPO-DISO对代表全面的语义类型参与网络曝光事件。提供一个了解模型的内容,人物2可视化部分网络只显示曝光语义类型直接关系到T020获得异常。指向外在的关系result_of和associated_with例如,获得异常result_of治疗或预防的程序。相反,接触节点指向中心的关系原因和复杂例如,药物的物质原因获得异常。我们颜色暴露节点根据其广泛的uml语义组。可以看出,化学品和药物(绿色)主导大约一半的类型,其次是程序(紫色),然后活动和行为(靛蓝)。图中描述的方法1 (b)确定5667年microbe-induced障碍的概念。示例如表所示1,可在补充完整列表2。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
做了发生在研究语料库的概念。 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
结果显示,可以提炼出丰富的领域知识,从现有的本体。派生的子网模型综合互动参与曝光事件。使用uml的一个优点是它允许链接的语义框架,个人生物医学概念和多功能集成的源术语。我们的方法的应用程序提供丰富现有资源潜力巨大,如房屋系统,它提供了一个核心骨架但缺乏主要的集成概念术语。我们交付的微生物疾病的概念可以作为有用的资源本身,尤其是对用例处理传染病。在列表中,我们还观察到一个有趣的障碍,C0014522 Epidermodysplasia verruciformis,这是一种常染色体隐性遗传性皮肤病,wart-like病变由于感染人类乳头瘤病毒(HPV)。它回声调查我们的基因组之间微妙的关系的重要性和exposome为了充分理解特定的健康状况。从方法论的角度来讲,我们的语义过滤基于关系模板演示了一个有用的本体论方法选择感兴趣的特定于任务的实体。
3.2。派生的语义充足率Exposome子网
评估我们的语义框架是否充分适应不断发展的循证医学,人物3显示了文学的趋势在exposure-induced医源性疾病在临床exposome代表主要感兴趣的领域。在图3(一个),红线表示的PMIDs稳步增加至少有一对exposure-disease网覆盖了我们的子网。不同exposure-disease对而言,蓝色线表示相应增长10年。表2提供实际的例子覆盖网格对和它们的宿主PMIDs。更重要的是,不仅计算表明覆盖鳞片与知识增长,但橙色线在图3 (b)表明,与覆盖exposure-disease PMIDs的比例对保持一贯高(意味着= 90.59%,标准偏差= 0.02%)。绿线显示的平均数量覆盖exposure-disease对每PMID爬温和。至于绿线的峰值,目前尚不清楚为什么在2004年突然激增的研究成果。尽管bibliometrics-oriented边际的错误评估,我们认为合理证实我们的语义建模的可靠性和可伸缩性。此外,由于我们的子网来源于uml,任何更新在SN(虽然罕见)可以定期注册。
(a) exposure-disease网对和的PMIDs数量至少有一对这样的覆盖的派生exposome子网
(b)的百分比PMIDs至少有一对exposure-disease覆盖网格,网格的平均数量每PMID配对
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.3。Exposome注释在临床文本
过滤器exposome语义类型和概念的数量持续减少实体所需的人工检查。专门为50个随机放电总结,77.72%的平均大概无关(即。nonexposome) MetaMap注释被过滤掉。人工管理后,平均每注的注释数量是36(分钟:9,马克斯:118)。根据数据使用协议,我们将提供注释回i2b2临床NLP库。通过聚合计算指出,前20名与策划exposome注释部分如表所示3。由于卸货住院环境的总结,前部分是医院,基本上涵盖了所有程序和药物在病人住院管理。适度调整与期望,社会历史排名高(8日)在列表中。有六个与部分在前20位,反映药物作为一个卓越的暴露在临床设置。现病史的部分(第二)和过去的病史(7)也举办了一场像样的exposome注释。作为普遍性的评估独立机构/数据集,表4表明我们不仅发现了许多相同的曝光条件的贝丝语料库(列“#注释”是基于正确的字符串搜索),但部分托管这些术语也表现出很高的相似的名称和等级(比较表3)。例如,前两个部分,医院和现病史,是相同的。在表5,我们列出排名前20位的语义类型策划的概念。两大类型,T121药物物质和T109有机化学,从药物、一致的高患病率与部分如表3。第二个集群包含T061治疗或预防过程和T060诊断过程,其中大多数医院中提到(表中未显示)。T055个人行为类型(例如,使用酒精和烟草)大多居住在社会历史。进一步检查,补充3包含注释的细节方面排在两个层面:第一节,然后通过语义类型。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
结果表明,我们的exposome语义建模帮助预滤器无关的概念在人工管理的78%左右。microbe-based暴露我们的注意力是合理的:尽管在比例小,两种类型,T047疾病或综合征(微生物病原学的)和T007细菌,进入下半年表5(11日和15日,职责)。药物被发现大多数临床exposome形式,这也反映了先前的工作,提出了药物作为一个“环境”因素在电子医疗纪录(23]。鉴于风险主要是药物和手术,有人会说,使用结构化的电子健康档案数据将保存从文本中提取他们的多余的精力。然而,它需要进一步调查了解多少数据会错过如果只使用结构化数据。例如,先前的研究表明,提供者笔记是互补的结构化数据记录药物强化(24),我们应该考虑任何非处方产品记录在历史叙事。值得注意的是现病史、既往史表排名前十名的部分3,这表明历史部分,通常包括在大多数临床讲义(不仅仅是出院小结)主机exposome丰富信息。exposome-containing之一部分,天生的社会历史应该被认为是不同的,因为它完全覆盖大部分的“临床前”exposomes中遇到病人的日常生活。在一个特定的注意,甚至社会历史记录暴露于核事故在病人的过去的住所。
一个相关问题研究中出现了“到什么程度我们可以概括exposome的定义吗?“我们带注释的概念,如退休和守寡曝光(T033发现),考虑到研究显示他们与健康协会(25,26]。然而,会有意义也把任何重大生物事件,如妊娠作为接触吗?这仍然是一个开放的未来研究的主题。有趣的是,这一罕见的类别的风险揭示语义建模一个盲点,这可能部分是由于限制在uml语义分类。我们遇到几个暴露等概念C3496069可卡因使用和C0206073家庭暴力,这是分类类型T048心理或行为障碍。然而,过滤标准错过了他们,因为我们没有考虑T048因果角色(曝光槽)在我们的事件模板,微生物病原学和这些健康问题。这肯定需要更多的考虑将这些虐待行为和建模(影响自己或他人)。
3.4。限制
虽然我们相信高级的趋势是可靠的,PubMed-based覆盖评估可能涉及一些边际错误不可避免。唯一的出院小结是利用在这项研究中,这并不代表所有类型的临床文本。为勘探评价,exposome注释被只有一个策划注释器(摩根富林明),因此从偏见不是免费的。的目的只是评估exposome概念存在,我们没有参与注释任何先进的属性,如强度(剂量)、持续时间和频率。同理,我们没有试图优化NLP的方法提取exposome概念;相反,我们专注于理解高层最后的注释的分布和特征。
3.5。未来的工作
我们将考虑与外挂式寻求合作开发团队统一的解决方案,使它成为一个可持续资源exposome科学社区。超出服务范围的评估,我们将建立一个知识库的临床exposome通过精炼PubMed查询和后处理管道。严格的注释,多个注释器将使用指标计算和协议。注释标准是由包括扩大相关的属性(例如,暴露强度)和记录在一个正式的指导方针。注释可用于列车NLP系统在临床exposome研究队列标识。最终,更彻底的expotyping方法应该追求结构化和非结构化电子病历系统的数据集成。
4所示。结论
我们开发了一个半自动的方法建模exposome语义和评估可用性在临床环境中。建模杠杆活动模板识别暴露与疾病的关系本体论的概念的结果。子网是来自uml,代表454双曝光和结果之间的关系的语义类型。子网能够覆盖90%的PubMed文献exposure-induced医源性疾病,从2001年到2010年。在50个放电识别exposome概念总结,子网效率提高了过滤掉78%的机器无关的注释。exposome概念表现出不同的语义类型和部分标注语料库。分析的结果扩大我们的理解临床叙述和本体资源。这项工作证明的价值semantics-powered推进exposome科学和医学等精度的方法。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作的部分支持由亚利桑那大学的健康科学CB2, BIO5研究所,国立卫生研究院(U01AI122275, HL132532 CA023074 1 ug3od023171, 1 r01ag053589-01a1,和1 s10rr029030)。作者感谢科琳Kenost博士帮助英语编辑。消除识别信息提供的临床研究中使用记录i2b2国家生物医学中心的计算由U54LM008748和最初准备共享任务挑战NLP临床数据由博士Ozlem Uzuner, i2b2和纽约州立大学。
补充材料
引用
- “精密医学项目群项目——构建21世纪医学研究基金会,2016年9月,“2015年,https://www.nih.gov/sites/default/files/research training/initiatives/pmi/pmi - -集团工作报告- 20150917 - 2. - pdf。视图:谷歌学术搜索
- s·m·朗之万和k·t·凯尔西”,命运并不总是写在基因:表观基因组学在流行病学研究中,“环保分子诱变,54卷,不。7,533 - 541年,2013页。视图:出版商的网站|谷歌学术搜索
- c . p .野生“补充的基因组“exposome”:优秀的挑战环境暴露测量分子流行病学、”癌症流行病学,生物标记与预防》上,14卷,不。8,1847 - 1850年,2005页。视图:出版商的网站|谷歌学术搜索
- a . k . Manrai y崔,p . r .蒲式耳et al .,”信息和数据分析来支持exposome-based发现对公共卫生,”在线发表的年度回顾公共卫生,38卷,第294 - 279页,2017年。视图:出版商的网站|谷歌学术搜索
- f·马丁·桑切斯k .灰色,r . Bellazzi和g . Lopez-Campos”Exposome信息学:考虑未来生物医学研究信息系统的设计,“美国医学协会杂志》上,21卷,不。3、386 - 390年,2014页。视图:出版商的网站|谷歌学术搜索
- e . s . Chen s Manaktala i n . Sarkar g·b·梅尔顿,“社会历史信息的多站点内容分析在临床所指出的,“AMIA年会论文集华盛顿特区,页227 - 236年,美国,2011年。视图:谷歌学术搜索
- e . s . y . Wang Chen s Pakhomov et al .,“从临床文本自动提取物质使用信息,”AMIA年会论文集旧金山,页2121 - 2130年,CA,美国,2015年。视图:谷歌学术搜索
- r . Aldekhyyel e . s . Chen s Rajamani y . Wang和g·b·梅尔顿“占领自由文本文档的内容和质量电子健康记录”AMIA年会论文集,页1708 - 1716年,芝加哥,美国,2016年。视图:谷歌学术搜索
- k·m·牛顿p l . Peissig许思义et al ., a . n .“电子医疗记录的表现型的验证算法:结果和教训出现网络”美国医学协会杂志》上,20卷,不。e1, pp. e147-e154, 2013年。视图:出版商的网站|谷歌学术搜索
- f . j . Martin-Sanchez和g . Lopez-Campos生物医学信息学的新角色的年龄数字医学”医学信息的方法,55卷,不。5,392 - 402年,2016页。视图:谷歌学术搜索
- f . t . Vertosick Jr .)当空气达到你的大脑:故事从神经外科W W Norton &公司,2008年版。
- 美国葡萄,p .艾瑞克,罗西,c·科恩和l·a·施泰纳“术后认知功能障碍,”麻醉和重症监护的趋势,卷2,不。3、98 - 103年,2012页。视图:出版商的网站|谷歌学术搜索
- c . t . Wang总值,a . a .德赛et al .,“内皮细胞信号和ventilator-induced肺损伤:分子机制,基因组分析,和治疗目标,“美国Physiology-Lung细胞和分子生理学杂志》上,卷312,不。4,L452-L476, 2017页。视图:出版商的网站|谷歌学术搜索
- m·a·c·j . Mattingly t.e. McKone卡拉汉,j·a·布莱克和e·a·Hubal”提供缺失的环节:接触科学本体外,“环境科学与技术,46卷,不。6,3046 - 3053年,2012页。视图:出版商的网站|谷歌学术搜索
- d·a·b·林德伯格b·l·汉弗莱斯和a·t·麦克雷“统一医学语言系统,”医学信息的方法32卷,第291 - 281页,1993年。视图:出版商的网站|谷歌学术搜索
- “IHTSDO。snom CT。snom CT, 2017年3月,“2015,http://www.ihtsdo.org/snomed-ct/what-is-snomed-ct。视图:谷歌学术搜索
- a·麦克雷“uml语义网络”第13届研讨会上计算机应用在医疗护理,503 - 507页。视图:谷歌学术搜索
- a·t·麦克雷a Burgun, o . Bodenreider“聚合uml语义类型减少概念复杂性,”研究卫生技术和信息,216 - 220页。视图:出版商的网站|谷歌学术搜索
- w·w·查普曼,p . m . Nadkarni l .赫希曼l . w . D 'Avolio g·k . Savova o . Uzuner,“克服障碍NLP临床文本:共同的任务和角色的需要更多的创造性的解决方案,“美国医学协会杂志》上,18卷,不。5,540 - 543年,2011页。视图:出版商的网站|谷歌学术搜索
- O。罗Uzuner, y, p .医学信息学”评估最先进的自动de-identification。”美国医学协会杂志》上,14卷,不。5,550 - 563年,2007页。视图:出版商的网站|谷歌学术搜索
- a·r·阿伦森和F.-M。朗,“MetaMap的概述:历史视角和最新进展,”美国医学协会杂志》上,17卷,不。3、229 - 236年,2010页。视图:出版商的网站|谷歌学术搜索
- “乳臭未干的快速注释工具:网络环境对于协作文本注释,2017年3月,“2012年,http://brat.nlplab.org。视图:谷歌学术搜索
- g . x Wang Hripcsak和c·弗里德曼,”描述环境和表型关联使用信息理论和电子健康记录,“BMC生物信息学,10卷,补充9日向,2009 p。视图:出版商的网站|谷歌学术搜索
- a . Turchin m . Shubina e . Breydo m·l·潘德葛雷斯和j·s . Einbinder”比较的信息内容的结构化和叙事文本数据源在药物强化的例子,”美国医学协会杂志》上,16卷,不。3、362 - 370年,2009页。视图:出版商的网站|谷歌学术搜索
- j . r .月亮,m . m .针对美国诉萨勃拉曼尼亚,m .阿根廷和i Kawachi”过渡到退休和心血管疾病的风险:未来的美国健康和退休研究,分析”社会科学与医学,卷75,不。3、526 - 530年,2012页。视图:出版商的网站|谷歌学术搜索
- a . Daoulah m . n . Alama o . e . Elkhateeb et al .,“寡妇和冠状动脉疾病的严重程度:一项多中心研究中,“冠状动脉说在线发表,28卷,不。2、98 - 103年,2016页。视图:出版商的网站|谷歌学术搜索
版权
版权©2017 Jung-wei风扇等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。