文摘

本文比较症状监测和预测气候模型估算急诊科(ED)与热相关的疾病(HRI)的访问。回顾气象站观测时间序列分析和ICD-coded HRI ED访问十医院在东部安大略省南部,加拿大,从2003年4月到2008年12月执行国家门诊使用医院数据报告系统(NACRS)数据库,ED患者主诉症状监测系统采集的数据,从加拿大环境和天气数据。泊松回归和快速正交搜索(FOS)提交,非线性时间序列建模技术,用于构造模型的预期数量HRI ED访问使用天气预测变量(温度、湿度和风速)。估计HRI访问的回归模型使用天气变量和访问计数被综合征监测预测略高与NACRS HRI ED访问比只使用天气预测回归模型或症状监测。

1。介绍

相关的发病率和死亡率与极端高温事件如1995年在芝加哥(12003年),欧洲(2- - - - - -4),加州2006年(5)强调热对人群健康的潜在影响。气候变化的威胁提出了公共卫生关注极端高温事件(6]。准备极端高温事件和监测他们的影响因此重要公共卫生当局。

制定公共卫生的热响应计划应该考虑群体反应热量除了安全指南个体层面的热接触。回顾性分析医院的记录和实时监测的急诊可以提供全民热响应的信息。每个人都有自己的优缺点。

抽象病人图表可以提供准确的postdiagnosis热医院急诊的识别。然而,延迟获取数据从这个来源可以超过一年由于抽象的病人所需的时间记录,报告和传播。有时只有有限的历史数据可用于分析。依靠回顾性分析的结果通知热响应计划假定人口的反应热量不会改变随着时间的推移,忽视长期适应的可能性(6]。历史上发生的反应可能不代表未来的热事件如果这些将来事件的响应特征,不同于那些在过去,如高强度热或更长时间(7]。此外,有证据表明,热对人口健康的影响不同地理位置(8),提高研究结果的普遍性的担忧来自其他地方。

克服的局限性的方法只使用回顾性分析告知公众健康热响应,实时群体与热相关的疾病(HRI)监视可以提供态势感知,使更好的决策。然而,有一个成本建立和维护这样的系统,尽管热表和预警系统的经济效益一直认为[9]。与热相关的疾病监测使用急诊科(ED)和紧急服务调度(911)建议(10,11]。虽然不一定全面衡量完成热对人口的影响,因为它未能捕获所有保健寻求中暑,热急诊可能提供一个及时的指标其急性和严重的影响。因高温引发的死亡率已被证明是与急诊(12]。由于死亡率可以急性热滞后效应(13)和死因信息可以花时间去建立和传播,监控急诊会比死亡率监测目的。来自医院的数据通常可以获得电子允许他们使用症状监测实时监控(11,14]。不幸的是有两个潜在的问题使用急诊科综合征监测。第一个是误分类的访问,由于非特异性和非敏感综合症prediagnosis信息的定义和使用。这可能导致错误的访问。第二,这样的系统不提供所需的预警采取预防措施。

由于监测的优缺点互补,全民热响应模型由热急诊回顾性数据,公共卫生可能会考虑使用两种方法。因此本研究的目的是调查和比较热的症状监测急诊,热急诊使用天气变量的预测模型作为预测构造使用回顾性数据在南东部安大略省,加拿大,从2003年到2008年。

这些发展中热响应计划面临的问题是什么设置的环境变量或热措施是最好的用于发出警告和构建模型,预测个人影响的预计数量与热相关的疾病。热的直接影响在个人的层面上都进行了广泛的研究,通过换热的物理模型15,16]和生理研究[17]。这些研究表明,热量通过汗水的蒸发和辐射热源的影响(如太阳)扮演重要的角色在一个单独的热应力。因此,除了环境空气温度、热暴露的措施应考虑太阳的影响,湿度和风力。多种措施的热接触,结合这些影响已经创建,用于开发职业健康安全曝光的指导方针和公共卫生热警告阈值包括炎热指数、湿润指数(衡量类似于在加拿大使用的热量指数),和湿球全球温度(WBGT) [15,16,18]。本研究探讨的问题似乎天气变量群体意义而不是先验选择这些暴露措施之一。

热的群体效应的研究表明,存在滞后热暴露和疾病和死亡率之间的关系,也就是说曝光,提前几天可能会影响发展的疾病或热与热有关的死亡率(8,13]。非线性和阈值效应也被建议(8,19]。群体适应,通过行为等机制(例如,增加使用空调)或生理适应,和生存偏差可能季节性修改全民热的影响(6,8]。因为这些因素的潜在重要性,本研究利用非线性时间序列建模技术,允许滞后的影响,非线性和阈值的影响天气变量与热相关的疾病被捕获。

总而言之,本文的目标是(1)构建预测模型估算热访问,(2)开发一个简单的综合症症状监测的定义热访问,和(3)预测模型和综合症定义比作一个黄金标准衡量热访问(NACRS)。

2。方法

2.1。研究设计

研究使用了一个生态回顾时间序列分析热医院急诊十医院四个卫生单位辖区在南安大略省东部,加拿大,和天气数据从五个气象站在同一地区由加拿大环境从4月1日,2003年到2008年12月31日。覆盖面积包括彼得伯勒在西方在东方Brockville班克罗夫特在朝鲜南部安大略湖。结合这些卫生部门000年大约有655人口,约2006安大略人口的5% (20.]。只在研究区医院的急诊科主诉数据和国家门诊报告系统(NACRS)数据被包括在内。

2.2。定义和测量结果

医院急诊从NACRS数据库了。安大略省的所有医院都必须提交信息急诊加拿大健康信息研究所(CIHI)列入NACRS。这个数据库中的信息包括访问的原因,从病人抽象图表和使用国际疾病分类编码,10日修订,加拿大增强(ICD10-CA)编码系统。CIHI定期评估数据的质量在这个数据库使用的方法21]。post-diagnosis原因,因为它提供信息访问,NACRS数据集访问被认为反映了真正的原因,因此作为黄金标准热急诊的实际数量。从NACRS数据库字段使用包括访问ICD-10CA编码的原因,机构参观,年龄、性别、访问日期、部分邮政编码,和nonidentifying遇到数量,可以用来识别访问同一个人同日,从而防止重复计数。

主诉的患者登记在医院的急诊科得到包括在这项研究中。当个人礼物到急诊室,分诊护士进入短(约五到十个字)自由文本描述患者的主诉前病人诊断和治疗。这个信息,访问日期和时间、年龄、性别、从医院和部分邮政编码发送到中央数据库中使用的实时综合征监测系统。这个系统已经详细描述了在其他地方(22]。

先前的流行病学研究表明,医疗条件,似乎与医院(招生以及急诊)与热相关的疾病不仅包括其直接影响但也不适11],一些肾条件[4,5,11),电解质和液体失衡3,5,11)、糖尿病(5,11),慢性呼吸系统疾病、心血管疾病和脑血管疾病(4,5,8,23,24]。热与死亡率增加有关的这些条件(4,13,23)和生理证据证实这些协会(17]。然而,由于大部分急诊的这些条件可能不热,我们只与热相关的疾病定义为那些访问直接归因于热:ICD-10CA编码T67.0-T67.9, X30 [10接受的限制),这个数字可能低估了真实的热急诊服务。

2.3。曝光测量

研制了许多措施的热接触:炎热指数(15,25),湿润指数(加拿大)15,25),和湿球全球温度(WBGT) [15]。因为这些措施结合不同天气变量(部分或全部温度、湿度、风速、太阳辐射),和不同权重的每一个变量,本研究分别考虑每个天气变量。这避免了任何先验假设中的个别天气变量的相对重要性。

每小时测量天气的从环境中获得五气象站坐落在加拿大安大略省东南部附近的医院包括在这项研究中。测量包括温度、露点压力和风速。不幸的是,没有太阳辐射的直接测量,因此在本研究中没有考虑这个变量。最大、最小和平均每日值的温度、露点,风速,计算每个五个气象站的数据在每天的24小时内。失踪的观察从这些计算被省略了。变量的平均值在气象站是用于分析。为了评估这样做的错误,在气象站计算每个变量的变化。

湿润指数(胡)和热指数(HI),也称为表面温度,可以计算(15,25]: 在哪里 °C的空气温度(从环境辐射屏蔽), 是露点°C, 是水的蒸气压在hPa下面。

最大的水蒸气压力, 来自最大的露点 这个变量可以被认为是露点的转换,并可能更直接关系到湿度的影响个人的经验的热量(25,26]。它被认为是衡量湿度的分析。

2.4。分析

访问数之间的关系、最高温度、平均风速、水蒸气和最大压力评估使用泊松回归模型可能占overdispersion使用SAS软件。当天天气变量的测量进行泊松回归模型;不考虑滞后影响。交互也不考虑。预测变量在模型中包括一个指示符变量微分春天和初夏(4月/ 5月/ 6月)从其他个月调查的可能性适应时期的一年。这个选择是根据初步探索性分析,包括一个单独的指示符变量为每个月和假设适应可能会影响加热的响应。周末的指示符变量还包括在模型中控制的影响每周的急诊模式(27]。

调查滞后和非线性关系的可能性,阈值效应,和天气预测之间的交互建模协会与热急诊服务方面需要考虑大量可能的候选人的条件在一个回归模型。为了解决这个挑战,方法为非线性时间序列建模,开发快速正交搜索(FOS)提交,采用(28)(详细的方法给出了该引用,而不是重复)。这种技术允许建设的一个非常灵活的非线性模型描述天气热急诊,变量之间的关系通过选择从一个潜在的非常大的候选术语集。目标是类似于回归,提出选择除了安全系数算法含蓄地表达了作为一组正交函数选择候选术语。与选择相关的均方误差减少任何给定的候选人是发现没有真正找到正交函数。安全系数还允许模型系数选择的条款被发现没有找到这些正交函数。这个最小化所需的计算和允许大量的候选术语(几万至几十万)快速搜索,否则需要长时间的计算时间。

安全系数模型可以表示为 在哪里 是时候指数, 是一个标量系数, 代表的错误, 是一个选定的候选人函数。

方法可能是有用的在研究时间序列之间的关系因高温引发的急诊,环境变量,因为除了处理非线性和滞后效应,它允许阈值效应列入候选集。例如,如果我们只期望温度超过25°C的值是相关的,一个函数描述步骤发生在这个温度可以作为候选人。

在分析执行在这项研究中,每个候选人的一般形式 在哪里 预测。可能会有 给定的预测因素, ,在每一个候选函数。每个因素的滞后的预测可能是不同的,是表示 在哪里 指的是预测 是指每个因素的预测。

另外,步功能,引发了的一个预测因素的价值,一个术语是可能的因素。允许阈值效应建模的步骤。在一个正确的一步,表示 ,当阶跃函数的参数的值阈值,它的值是零;否则,它就是其中之一。相反,离开一步, ,当阶跃函数的参数的值更大的比一个阈值,值为零;否则,它就是其中之一。的 参数的参数阶跃函数给出了阈值的过渡;在这里, 类型和下标指的一步 下标指的是预测。预测的值用于触发步骤相比 。这个预测的延迟, ,被允许的最小延迟预测(例如, )。每个预测只有一个阶跃函数被允许在每个候选项。安全系数算法被作者利用MATLAB编程,和实现验证了拟合关系。

每个候选术语模型中可以包含多个因素。对数转换访问被认为是作为模型的输出。预测因子包括相同的天气变量用于泊松回归模型。表1描述了组件因素可能在给定候选术语给予限制的参数值(4为每个预测)。步功能可能发生,没有发生任何相应的预测因素。在初步的探索性分析,最高温度和水蒸气压力滞后7天被允许作为候选人。表中的值1根据以往的文献选择和探索性分析。访问数量对数转换之前拟合模型。候选术语集搜索包含所有可能的组合的每个因素,大约有140 000个可能的候选项,安全系数在几分钟内获得简洁的模型在一个标准的笔记本电脑。

2.5。与热相关的疾病综合症的定义

开发一个综合症定义基于急诊科主诉与热相关的疾病,NACRS访问(金标准)匹配急诊科主诉使用日期和时间的访问,医院参观,部分邮政编码,年龄,性别,因为没有一个惟一的标识符之间的匹配记录的数据集。通过评估,阳性预测值(PPV)的最常见的文本字符串出现在急诊室首席投诉相对于NACRS金本位制,一组字符串识别可能因高温引发的访问了。热产生的时间序列的访问数量是由计算每日的急诊科首席投诉包含至少一个文本字符串的集合。这个时间序列相比NACRS热访问数量的时间序列。

2.6。模型的评估和比较

第二个模型估计急诊使用安全系数作为预测两个日常计数各种文本字符串的投诉中发现与热相关的疾病除了天气变量创建。如果天气监测数据提供了额外的好处之外的变量,那么这样一个模型应该提供更好的热访问的实际数量的估计。

比较上述三种模型的预测能力(泊松回归,”丛书包含天气变量预测模型,包含天气变量和安全系数模型,和主诉文本字符串作为预测),数据分为训练和验证数据集。训练数据集(2003年4月1日到2006年12月31日)被用来适应模型,并验证数据是用来评估模型(2008)2007年1月1日至12月31日。模型估计比较金本位(NACRS热急诊服务时间序列)使用均方误差(MSE)和皮尔森相关系数。

2.7。道德

伦理批准这项研究是获得女王大学健康科学和附属教学医院研究伦理委员会。

3所示。结果

热急诊范围从67年到161年每年完成年包括在这项研究(2004 - 2008)。热疾病患者的平均年龄是29岁,和一半的急诊科的18 - 49岁之间的。百分之十是71岁以上,百分之十是在11岁。

天气变化变量在研究区五个气象站在桌子上2

3介绍了参数估计,标准误差有关, 值的泊松回归模型包括最高温度、最大水蒸气压力,平均风速,周末和春天或初夏指标变量的预测。结果表明,天气变量纳入模型中,只有最大水蒸气压力和最高温度是显著的,而平均风速并不是。

1显示了天的比例与给定数量的紧急访问各种炎热指数范围总数的天在研究期间热量指数范围。炎热指数被选中,因为它是一个函数的温度和湿度,唯一发现天气变量显著相关热在上面的模型中。

方程(5)给出了模型估计热急诊, ,使用天气变量使用安全系数: 上面的符号变量在模型中给出了表的第一列的标题吗1

1 444 519应急部门的监视记录含有主诉在研究期间,95 945(6.6%)访问可以匹配NACRS数据库中访问基于可用的变量。在这个匹配的数据集,225条记录代表访问与热相关的疾病,ICD10-CA规范定义的。最频繁发生的从这些证实了热访问字符串被确定。表4礼物的数量访问从包含每个字符串匹配的数据集,对访问,为与热相关的疾病与热相关的疾病,而不是基于相关ICD-coded访问的原因。这个表进行排序根据阳性预测值(PPV)的字符串。字符串“太阳”、“排气”,“热”的阳性预测值最高访问与热相关的疾病频繁发生的字符串,因此定义了热综合征。然而,使用这三个字符串组合标记只有81的225(36%)真正的访问与热相关的疾病,而萎靡不振的另一个40访问,并不热。

当计数为每个14的时间序列中最常出现的字符串包含在一组候选人所使用的安全系数除了天气变量上面使用,安全系数的差分方程发现是: 在哪里 是项紧急处长投诉的时间序列包含字符串“热”和其他符号再次定义在表的标题1。请注意,这是唯一的字符串的14个候选人中发现通过安全系数减少模型MSE当天气变量也包括在模型中。

5比较了各种方法估算热访问数量上面提到的验证时间。FOS-derived模型产生略好估计比回归模型训练和验证数据集,最好的模型估计真正的访问被模型包括两个急诊科主诉字符串统计时间序列和天气预测变量。

数据2,3,4,5目前提供额外的视觉对比综合症的时间序列统计和安全系数模型,金本位NACRS ICD-coded热急诊的时间用来验证模型。

4所示。讨论

回归模型的结果表明,温度和湿度是最有用的估计急诊科热访问,尽管风速也表现较佳的安全系数的预测模型。这些发现意义时,考虑到个人更有可能暴露于室内湿度和温度,可以现在甚至比风很容易被屏蔽的物理障碍,更可能是高度变量在给定的地理区域。不准确的测量风力不够捕捉其变异研究地区可能导致了这个结果。类似地,可能是热暴露措施,包括变量有很高的可变性在个人和或地理位置,因此不能充分衡量,可能不会提供任何更好地衡量人口与热相关的疾病的风险比省略这些变量的简单措施。不幸的是,这项研究并没有精确的太阳辐射的措施足以让这个变量进行评估。

这项研究的结果显示的可能性“早期热效应”,即热经历了春天或初夏(定义为四月、五月、六月)会导致更多的访问。这是符合适应和/或其他研究提出的适应效应(8,13,17]。公共卫生当局可能考虑这个计划,什么时候发出警告。

FOS-derived差分方程模型(5)和(6)提供更好的适应比泊松回归模型这两个培训和验证数据。这表明,安全系数模型不仅仅是过度学习的数据。然而,它更难以解释这些模型方面,由相互作用的许多预测变量。模型条款(5)和(6)表明,热滞后效应的热急诊是相对较短的(有一天),符合发现住院[4),但与滞后提出了死亡率(8,13]。注意,前两个方面在这两种模型都是相同的(除了他们的系数大小相似)。温度的正确步骤功能的存在和广场在温度和湿度符合其他建议的阈值和非线性效应研究[8,13]。左边的阶跃函数在风出现在前两个方面在这两个方程,具有积极的系数在两种模型,是有意义的,我们期待更多的访问当风速低如果风冷却效果。

渴望发现天气变量之间复杂的关系和热相关的急诊,包括阈值,非线性,和天气变量相互作用,积极使用安全系数。测试所有的滞后和交互方面使用标准回归模型和技术是非常乏味的最多,和使用的安全系数提供了一种方法来检查重要关系没有错过。然而,这种类型的模型的性能的差异相比,标准的回归技术可能并不证明其使用。在实践中,简单的回归模型可以提供类似的性能明智选择的适当形式的预测变量。

这项研究的结果表明,利用气象变量预测模型预测和症状监测可以提供热急诊的估计。小的改进预测模型的性能(6)和(5包括症状监测信息显示,测量后)后者可能提供额外的信息没有提供天气预报。自急诊科主诉前输入病人被医生检查,是一个短暂的非结构化的描述,从综合征着手的首席兼容的数据代表一个潜在的非敏感和特异性的热急诊的信息来源。结果试图创建一个热综合征定义表明,很难得出准确地识别热急诊的字符串。许多字符串中出现热急诊的主诉阳性预测值较低,这些条款有足够高的值使其有用综合症定义只出现在一小部分的访问。因此毫不奇怪,这些术语所产生的时间序列热互访是嘈杂的,如当比较与热相关的疾病综合症时序NACRS热访问时间序列。提高性能可以通过使用更复杂的分类器(29日]国旗可能因高温引发的访问,而不是使用一组简单的字符串作为是在这里完成的。未能在这项研究中使用这种算法是一种限制,很难比较模型估计的精度与热有关的急诊访问计数被综合征监测。

本研究的另一个主要的限制是潜在的暴露错误分类。平均在气象站天气变量。在理想的情况下,天气变量之间的关系将会为每个区域分别进行了最大接触精度。然而,这将会导致很少数量的每一层分析。表2显示错误分类的风可能是最重要的。

的另一个弱点评估热之间的关系和紧急访问在本研究未能执行协变量包括已知修改热量的影响(如年龄)或潜在疾病(如糖尿病),这可能会改变空间。这也可能偏见热的观察效果。虽然这些限制的影响结果的普遍性,他们不影响研究目标依赖比较在相同的人口。

一个完美的衡量真正的热没有急诊和错误出现在NACRS数据量不是可衡量的。有人建议,一些管理数据源可能低估热病例:失败的情况下也低估了,因为临床医生评估患者认识到热的原因,未能记录在病人记录,或未能代码热作为一个根本原因,当医疗记录被抽象列入健康数据库如NACRS [25,30.]。因为我们只热急诊定义为那些heat-specific ICD-10CA代码,很可能我们低估了真正的访问。这也许可以解释低数量的热急诊在这项研究的结果。为了克服这些问题,其他研究人员已经检查了死亡的数量过剩热量(25)计算通过删除访问已知的可变性来源的访问总数;然而,我们选择了保守而不是高估了数字的风险。除了丢失的访问,我们也可能包括一些访问与环境热暴露:T67群ICD编码可能包括暴露在热源强迫的相关(例如,职业暴露),提供一个可能的解释访问在冬天。因为限制结果的定义与热相关的疾病在我们的研究中,使用结果可能只是“冰山一角”的热量对人口的影响。

只有少数的首席投诉可能与NACRS数据(少于7%),和一些这些访问可能不匹配,因为独特的个人标识符并不可用。匹配和困难这一事实热访问比较少见,减少了可用的数据创建一个综合症的定义。由于缺乏数据,综合症定义并不验证一组数据不同于一个用于创建它。这影响研究的内部效度:具体的性能与热相关的疾病综合症定义可能甚至比报道在表不准确5。然而,不会有影响的有效性的模型(6因为所有的字符串表4同样被认为是构建模型时使用安全系数,随后在一个单独的数据集进行验证。

5。结论

温度和湿度,并显著增加热急诊虽然没有证据支持一个风速的协会。热在春天和初夏似乎具有更多的访问,可能由于随后的适应。很短的滞后(0和1天)似乎是重要的解释。即使在天气变量与潜在的测量误差,利用天气变量时间序列模型预测,适合使用区域历史数据,可以构建与未来高度相关的急诊不习惯适应模型。这些模型可以用于区域天气预报预测访问,因此可以作为一个以证据为基础的人口风险指标发出热量警告。症状监测与热相关的疾病可能补充预测模型估算和监测群体与热相关的疾病。

确认

这项工作的部分资金由加拿大自然科学和工程研究理事会(NSERC) CGS奖学金由a·g·佩里和由加拿大卫生部资助。