文摘
在医学可视化、护理记录病人的病理条件含有丰富的信息。然而,他们并没有广泛应用于临床结果的预测。与自然语言处理的发展,信息开始从大规模非结构化数据中提取像护理记录。本研究中提取的情绪信息在护理记录和探索其与住院28天脓毒症患者的死亡率。病人和护理记录的数据提取MIMIC-III数据库。COX比例风险模型用于分析情绪得分之间的关系在护理记录和住院28天死亡。基于COX模型,计算个体预后指数(PI),然后,分析了生存。合格1851脓毒症患者中,580例患有住院28天死亡(死亡组),而1271年幸存下来(集团)幸存下来。显著差异显示两组之间在情绪极性,简化急性生理学得分II (SAPS-II)得分,年龄和重症监护室(ICU)(所有类型 )。多变量COX分析表现出这种情绪极性(人力资源:0.499,95%置信区间CI: 0.409 - -0.610, )和情绪主体性(人力资源:0.710,95%置信区间CI: 0.559 - -0.902, )与住院28天死亡率呈负相关,而SAPS-II评分(人力资源:1.034,95% CI: 1.029—-1.040, )死亡率呈正相关,住院28天。患者的平均死亡时间 患者明显比早些时候吗 (13.5vs。49.8天, )。总之,情绪在护理记录相关的住院28天死亡率和脓毒症患者的生存。
1。介绍
综合症的败血症危及生命的生理、病理和生化功能障碍由于失控对感染的反应,是死亡的主要原因之一,在重症监护病房(icu) [1]。尽管医疗的进步,脓毒症仍然是最昂贵的疾病之一,约占超过200亿(5.2%)的美国(美国)医院总成本(2]。在美国,录取为脓毒症已经取代,中风和心肌梗死(3]。据统计,脓毒症的患病率是每100人535例100000人年和在上升4]。群体的流行病学数据显示,有3150万例败血症和1940万例严重脓毒症在世界范围内,每年有530万潜在的死亡(5),住院死亡率达到-30% (25%6]。
目前,疾病严重程度评分(SOI)通常是用来预测死亡率在icu。SOI系统的编码数据建立病人的人口、生命体征和实验室结果通常从电子健康记录的访问,但也存在非结构化数据在电子健康记录,如临床医生写的不常用的预测死亡率(7]。研究已经证明,临床医生可以正确地预测死亡率在icu (8,9]。因此,他们的笔记可以提供病人的健康状态评估的一些重要信息。先前的研究表明,临床医生对患者的情绪可以通过情绪分析,评估方法分类的主观属性书面文本(10]。情绪以临床指出根据不同人口特征和临床结果10]。有研究表明,情绪以临床笔记与再入院和死亡率相关11,12]。
在这项研究中,我们调查了协会的情绪与住院病历28天脓毒症患者的死亡率基于医疗信息集市的重症监护(MIMIC-III)数据库,可自由使用急救护理数据库,旨在提供一些改进的证据在icu病人的结果。
2。方法
2.1。研究人群
病人和护理记录的数据从MIMIC-III数据库访问麻省理工学院实验室开发的计算生理学。作为一个公开可用的数据集,MIMIC-III包含大约60000个ICU招生相关鉴定健康数据,包括人口统计,实验室测试,药物,生命体征,转录的病历、诊断和程序代码,液体平衡,滞留时间,生存数据等13]。本研究的入选标准如下:(1)患者诊断为败血症,严重脓毒症和脓毒性休克(国际疾病分类9 (ICD-9)代码:99591年,99592年和78552年)在MIMIC-III数据库和(2)在住院15岁或以上。排除标准如下:(1)指出医生认定错误,(2)笔记写不到12个小时之前死亡的时间,和(3)病人护理记录没有任何数据。
本研究中使用的数据从MIMIC-III获得数据库(https://mimic.physionet.org/),一个公开可用的数据集。数据收集在MIMIC-III伦理审查委员会批准的贝斯以色列女执事医疗中心的所有私人信息已经麻木了。
2.2。情绪分析
两种技术(句法和语义)主要用于分类和计算文本的情感极性(14]。语义提取方法意味着情绪普遍得到使用基于文本的意义和分类器(14]。基于文本结构特点作出推论,本研究采用句法技术提取的情绪。
Python编程语言和自然语言处理TextBlob图书馆采用计算情绪得分的护理记录(15]。文本字符串的情绪在TextBlob使用模式计算模块。模式由一个词汇的各种英语副词和形容词能够映射到三维空间的情绪得分:极性、主体性和强度(16]。情绪极性返回使用TextBlob得分从1到1,返回主体性和情绪得分从0到1。更高的分数显示更积极,主观情绪。在这项研究中,极性得分和主体性为每个护理注意分数被分配,和分数计算与护理注意通过建立TextBlob对象初始化字符串和提取情感属性的对象(7]。情绪极性和主体性的平均成绩计算住院期间护理笔记写第一每个病人的住院,然后作为预测模型的研究。例如使用TextBlob情感极性的分数,见下表1。
2.3。死亡和生存的评估
ICU的共同预测死亡率,简化急性生理学分数II (SAPS-II)是一个综合分数,包括17个变量(年龄、12生理变量,类型的承认,和3潜在疾病变量)(17]。在这项研究中,SAPS-II分数计算的数据从MIMIC-III数据库和SQL脚本计算生理学在麻省理工学院实验室git存储库。此外,性别和ICU类型也为自由变量,因为他们从MIMIC-III数据库访问,但没有参与SAPS-II。被定义为生存的天数从住院到死亡或right-censoring时间。
2.4。统计分析
使用SPSS 22.0软件进行统计分析(美国、IBM公司,纽约Armonk)和Python文本分析(版本3.7)。正态分布数据的比较 - - - - - -测试和表现为 ( );异常与Mann-Whitney分布式数据比较rank-sum测试和作为中位数和四分位数((Q1, Q3))。枚举比较的数据测试,(%)的表现。COX比例风险模型被用来分析情绪得分之间的关系在护理笔记和脓毒症患者的住院死亡率28天。我们的研究为0.858的功率大小。
COX模型是常见的一种 ,在这和代表了数据风险函数和风险函数时间点分别协变量矢量,的未知向量回归系数。个人的公式预后指数(PI) 。基于COX模型,个人π计算。个人π越大,预后越差。使用生存率较存活曲线进行了比较。箱线图、柱状图和森林情节在我们的研究中与Python软件绘制。的权力分析统计能力进行评估( )使用通过15.0软件(摘要,LLC)。结果表明,情绪的力量值极性分数和情绪主观评分都是1.000。这是表明我们的发现表现良好的可靠性。在一个重要的区别 。
3所示。结果
3.1。研究人口的基线特征
在MIMIC-III数据库中,总共有3567名患者ICU。在这些患者中,1128名患者没有脓毒症,356例缺乏情绪极性和主观评分,与失踪SAPS-II 172, 60与失踪的生存数据被排除在外。完全,1851脓毒症患者都有资格在这项研究中,其中580名患者患有住院28天死亡率的日期入住ICU(集团)死了,而1271例存活(集团)幸存下来。两组的基线特征比较如表所示2,给出了流程图如图1。
病人的情绪极性分数存活组显著高于死亡组( ),虽然SAPS-II得分明显低于死亡组( )(表2,图2)。两组之间的差异显著的年龄( )和ICU类型( ),而不是情绪主观评分( )和性别( )(表2,图3)。
3.2。COX回归分析的观点和28天死亡率之间的联系
如表所示3单变量分析表明,逆情绪极性和28天死亡率之间的联系(风险比(人力资源):0.458,95%置信区间(95%可信区间:0.401 - -0.524, )和主体性和28天死亡率之间没有联系情绪(人力资源:0.863,95% CI: 0.657—-1.133, )。28天脓毒症患者的死亡率的风险将增加0.04倍SAPS-II得分增加1点时每次(人力资源:1.040,95% CI: 1.036—-1.045, )。没有性别和28天死亡率之间的联系(人力资源:1.104,95% CI: 0.936—-1.301, )。
在多变量分析,发现情绪极性(人力资源:0.499,95% CI: 0.409—-0.610, )和情绪主体性(人力资源:0.710,95%置信区间CI: 0.559 - -0.902, )与住院28天死亡率呈负相关,而SAPS-II评分(人力资源:1.034,95% CI: 1.029—-1.040, )死亡率呈正相关,住院28天。≥80岁患者的风险增加住院28天死亡率与年龄< 40年(人力资源:1.612,95% CI: 1.032—-2.520, )。没有住院28天死亡率差异的年龄40岁至59岁(人力资源:1.217,95% CI: 0.781—-1.886, ),60 - 69(人力资源:1.479,95%置信区间CI: 0.943 - -2.321, ),70 - 74(人力资源:1.048,95% CI: 0.637—-1.723, ),75 - 79(人力资源:1.030,95% CI: 0.629—-1.687, ),和< 40年。此外,性别和28天死亡率之间没有发现显著差异(人力资源:1.104,95% CI: 0.934—-1.306, )。病人住在创伤/外科重症监护室(TSICU)是最不可能死后28天内录取(人力资源:0.280,95% CI: 0.190—-0.414, )(表3,图4)。
3.3。生存分析
根据个人π,患者分为高危组( )和低收入和middle-risk集团( ),和生存曲线见图5。它可以观察到,高危人群的平均死亡时间明显早于低收入和middle-risk的组(13.5vs。49.8天, )。
4所示。讨论
在目前的研究中,共有1851个脓毒症患者都有资格根据纳入和排除标准,其中580例患有住院28天死亡率,而1271例存活。多变量COX分析表明,情绪极性和情绪主体性与住院28天死亡率呈负相关。基于个人的四分位数π,患者分为高危组和低收入和middle-risk组。生存分析表明,高危人群早前平均死亡时间较低收入和middle-risk组。这些都表明,情绪的定量测定护理记录与脓毒症患者的住院28天死亡率和生存;护理记录包含丰富的信息可以作为一个潜在的预测在ICU临床结果。
我们所知,简短的文本片段有利于对给定主题反映作者的感受。最近,语言处理工具已经开发出来,让感情的描述,如情绪在文本文档18]。情绪通常被描述为一个文本字符串的相对积极性或极性和测量数量从1(非常消极的)到1(积极的)14]。也可以解释为估计的“积极的”或“消极”的概率分类器。情绪分析允许我们获得洞察临床医生的病人通过主观表达情感和态度由临床医生在临床的文本笔记,从而预测病人的结果(19- - - - - -22]。在健康领域,情感分析已被广泛应用于癌症幸存者网络(CSN)乳腺癌和结肠直肠癌的讨论文章23在Twitter上,医疗改革(24),遇到的关键疾病患者(25)等。本研究旨在识别情绪之间的关系在护理笔记和脓毒症患者的住院死亡率28天。结果表现出情绪极性和情绪主体性与住院28天死亡率呈负相关,支持的麦科伊等人的情绪测量结果出院记录有关医院风险发生率和死亡率(11]。基于COX模型,患者 被发现有更高的死亡风险比那些吗 ,在生存分析强调情绪的潜在价值。先前的研究表明强烈的情绪之间的联系和甚至死亡的风险调整后的严重性疾病和基准信息(25]。
本研究的优越性,这是第一个研究调查情绪之间的关系在护理笔记和脓毒症患者的住院死亡率28天。护理记录书写少于12小时前死亡的时间被排除在外,使结果更加可靠。然而,目前的研究也有一些局限性,应谨慎解释。从MIMIC-III数据库首先,护理记录单中心样本可能表现不同的特色,因为变化的临床医生、经验、培训或工作环境中,容易导致结果nongeneralizable。其次,本研究的方法用来测量情绪并不是唯一的方法。其他技术可以产生不同的结果,如那些基于机器学习模型的语义推理。第三,意味着情绪得分只能描述变化的患者,而不是水平的句子,段落,或文档。,护理人员的护理笔记记录研究护士,医生,或等等(可用https://mimic.mit.edu/docs/iii/tables /照顾者)。它不能确定的情绪是否基于护理记录是基于过去或个人经历。此外,在情感上的细微差别并不是随着时间的推移获得。在未来,护理记录的时间模式将检查获得更多见解。
5。结论
情绪在护理记录与脓毒症患者的住院28天死亡率和生存,表明情绪在护理的重要性,指出在ICU临床结果的预测。虽然预测临床结果仍然是一个复杂的问题,从非结构化数据中提取的信息像护理笔记可能有助于进一步改善预测性能。
缩写
| PI: | 预后指数 |
| SAPS-II: | 简化的急性生理得分第二 |
| 加护病房: | 重症监护室 |
| SOI: | 疾病严重程度评分 |
| MIMIC-III: | 医疗信息集市为重症监护 |
| ICD-9: | 国际疾病分类9 |
| 人力资源: | 风险比 |
| TSICU: | 创伤外科重症监护病房 |
| CSN: | 癌症幸存者网络。 |
数据可用性
可用的数据用来支持这些发现从相应的作者。应用于本研究的数据来自MIMIC-III数据库(https://mimic.physionet.org/),一个自由访问数据库。
伦理批准
收集到的数据在MIMIC-III伦理审查委员会批准的贝斯以色列女执事医疗中心的所有私人信息已经麻木了。
的利益冲突
作者宣称没有利益冲突有关这篇文章的出版。
作者的贡献
QYG造成了研究设计和写作手稿。展示DW、PPS和WFW导致了数据收集和分析。XRL监督造成了研究设计和研究。展示QYG DW, PPS, WFW, XRL导致重要内容的重要修订。所有作者修订和批准最后的手稿。
确认
这项研究是由山东省社会科学规划研究项目- 2019 (19 ccxj05)。