研究文章|开放获取
Peter Congdon, ”Mid-Epidemic COVID-19病例和死亡的预测:二元模型应用于英国”,跨学科视角传染病, 卷。2021年, 文章的ID8847116, 15 页面, 2021年。 https://doi.org/10.1155/2021/8847116
Mid-Epidemic COVID-19病例和死亡的预测:二元模型应用于英国
文摘
背景。COVID-19流行病的发展一直伴随着努力提供类似的国际数据新病例和死亡。也有越来越多的证据在流行病学基础COVID-19参数。因此,有潜在流行病模型提供中期预测的流行轨迹使用此类信息。封锁的有效性或封锁放松也可以评估建模后流行阶段,可能使用多相流行病模型。方法。一般应用方法分析流行轨迹或使预报包括现象学增长模型(例如,理查兹家族的密度)和变异susceptible-infected-recovered(先生)室模型。在这里,我们专注于一个实际的预测方法,应用到英国COVID临时数据,使用二元雷诺兹模型(病例和死亡),与基于贝叶斯推理的实现。我们在发展中显示信息先验的效用,评估模型和比较误差密度(Poisson-gamma、Poisson-lognormal Poisson-log-Student) overdispersed数据新病例和死亡。我们使用交叉验证评估中期预测。我们也考虑到长期postlockdown流行病资料评估疫情控制,使用一个两阶段模型。结果。适合临时mid-epidemic数据显示更好的适合训练数据和更好的交叉验证Poisson-log-Student模型的性能。估计长期流行的数据锁定后放松,特点是长期缓慢下滑然后好转的情况下,怀疑在有效的遏制。结论。许多应用程序的现象学模型完成流行。然而,评估这些模型只是基于他们的适合观测数据可能只给出部分照片,和交叉验证实际趋势也是有价值的。同样,它可能是更可取的模型而不是累积发病率数据,尽管这让人质疑适合模型的误差密度通常不稳定的波动。因此,可能存在效用评估替代错误的假设。
1。介绍
流行预测在决策不可或缺的元素对于COVID-19流行病,如锁定实施和放松。预测已经被组织良好的协助努力提供国际数据新病例和死亡。这些包括每日更新的比较数据提供的欧洲疾病预防和控制中心(ECDC) (https://www.ecdc.europa.eu/en/publications-data),和监测资料提供的约翰霍普金斯大学(1]。也有越来越多的文献提供证据COVID-19感染的参数(例如,病死率比率和串行间隔)。因此,潜在的发生流行病模型,适用于定期收集数据,利用积累的证据,可以提供预测流行病观察到中期发展阶段。在许多国家政策决定(实施封锁,随后,放松)进行了基于趋势观察病例和死亡人数,而承认这些可能是测量误差,例如,确定情况下可能低估了感染总数;每日新病例由于有波动变化在日常检测中,而且可能有COVID-19诊断错误。
在这里,我们专注于一个实际的预测方法使用常规可用数据新病例和死亡(从ECDC)来估计参数的二元版本雷诺兹现象学模型。实现基于贝叶斯推理的原则,将通过信息先验证据积累相关的参数。这种方法的操作和实用程序演示了使用数据新病例和死亡在英国(英国),重点预测20-day-ahead病例和死亡的预测精度,基于mid-epidemic数据。其他政策等相关参数的有效繁殖率和病死率也在分析长期流行的数据估计。
双变量的使用方法提供了创意与现有研究相比,这对于现象学模型,只是限于分析发病率。一些研究提到死亡率曲线比较流行曲线(2),我们形式化这些联系在一个二元的方法。二元方法的好处包括监控和预测的能力严重等措施的病死率。我们也考虑造型的日常问题发生率和新的死亡,而不是累积发病率和死亡率。方法论的问题在分析累积的结果,下面讨论,而且问题(不是迄今为止被认为是在文献中)如何代表overdispersion出现在uncumulated结果。下面的分析提供了新的证据的相对适合和预测性能不同的方式代表泊松overdispersion和显示,通常采用负二项执行上远远低于其他选项。
研究的影响是有效的中期COVID-19发病率和死亡率的预测可以提供的建议方法。这样的预测和评估是有用的在计划提供的医疗接近满负荷在病床上占用3,4]。在撰写本文时,每日COVID-19住院数据不能用于英国。然而,扩展的二元方法包括发病率、死亡率和住院治疗上提供了额外的空间预测指标与严重程度评估(5,6]。多变量模型的另一个可能的结果是恢复情况(cf。4]),然后关注预测恢复到预测确诊病例的比例作为保健需要的指标和干预措施的有效性。方法也提出了一种监测长期感染数字导致早期发现早期感染人数的上升,通过持续的监控和预测的有效的繁殖率。
在下面几节中,我们回顾相关文献和研究缺口(第二节)和方法论出发(第三节)。然后我们考虑英国方面的案例研究应用程序(第四节),目前的结果(第五节),并讨论了影响的研究结果和方法更广泛的研究(第六节)。第七节提供结论。
2。相关研究和研究缺口
一般应用方法定量模拟流行病数据不同的数据输入他们要求,他们假设,estimability、实际应用范围做出预测。一般应用方法包括现象学增长模型(7),如理查兹家族的密度(8],susceptible-infected-recovered的变体(先生)舱模型(9]。现象学模型parameterised的流行轨迹和提供至关重要的流行病学的估计参数(10,11),同时避免更正式的机械模型的复杂性疾病的传播,它可以很难估计并提供预测,并可能是不现实的近似真实的流行病动力学(2,9,12]。
如前所述,Chowell et al。13],现象学模型是“特别适合当重大不确定性云传染病的流行病学。“相比之下,正如14)、区划的传输模型可能是基于未经测试的假设,如随机混合所有个体之间在一个特定的人口,可能敏感的假设开始,可以提供估计模型之间的差别很大。这样的模型往往依赖于预设参数,这可能意味着预测不确定性是低估了。他们也可能是复杂的指定当流行病有多个阶段,而多相现象学模型(15)是可用的。
关于预测,赵等人的研究。10)是应用现象学模型来预测2015年Zika病毒流行。自回归建模的新病例,与潜在的短期预测,说明(手足口病)的一阶自回归模型劳森et al。16),而(多个空间单元)的模型啊,(17)指定了一个一阶自回归基于平均发病率在邻近地区。
特别是关于COVID-19流行,研究不同的方法,其中一些预测COVID流行的不同方面或相关的卫生保健需要。在对政策制定的影响在英国和美国,也许最有影响力的是模型(帝国理工学院18]。这是基于微观与通过接触敏感和传染病传播的个体在不同的设置,或随机在社区,这取决于接触之间的空间距离。许多流行的参数(例如,潜伏期和基本再生数)是预设的。预测提供了死亡和病床。同时,各国提供预测的模型是健康指标和评估研究所(14]。这没有潜在流行病动力学的代表,但基于装配的分级参数模型观察累积死亡率在不同的国家,然后将这些前进。
各种类型的时间序列的预测COVID-19流行也,利用ARIMA模型(4,19,20.],指数平滑法[21),或自回归的情况下;例如,研究Johndron et al (22]假设每天死亡的滞后作用早期的新病例。现象学COVID-19发病率预测模型包括的应用研究[23,24]。
你可以识别一些研究现有文献的空白。因此,现有的应用程序(例如,23]在COVID-19)最常见的是发病率数据并没有考虑相互作用结果的二元模型。然而,潜在的例子从COVID-19相连的双变量的结果,和其他传染病,包括发病率和死亡率和发病率和住院治疗上。这项研究在25)转换COVID-19发病率、死亡率、病死率为β变量和β一元回归模型适用于每一个结果。这项研究在4)单独的ARIMA模型适用于发病率和康复情况。然而,单独的单变量回归或时间序列模型不能反映潜在的过程之间的联系,促进模型假设的设定,在贝叶斯分析的情况下,便于先验模型参数的设定。关于预测,更广泛的时间序列建模的经验(与nonepidemic应用程序)显示的好处借贷强度/结果(26]。
此外,许多现有的应用程序,比如研究[11,25在COVID-19的情况下,研究[27]在H1N1和埃博拉病毒,研究[10在Zika病毒的情况下,已经累计发病率。然而,学习累积发病率一直指出的缺点[28,29日]。累积发病率数据序列相关测量误差,导致参数不确定性的轻描淡写。所(29日),”独立连续测量错误,…显然是违反当观测是通过时间积累的。“然而,估计使用新病例或死亡(uncumulated)将更加关注如何处理随机变化的数据。对于日常数据,新事件的波动可能是相当大的(包括每日“峰值”),而累积病例和死亡通常光滑函数。在如何选择模型的overdispersion新事件,基于泊松混合物(30.),但在流行文学,使用负二项的标准,没有评价的相对性能可用文学到目前为止。
3所示。方法
3.1。现象学模型
流行性轨迹基本现象学模型包括物流、龚珀兹,和Rosenzweig一系列一概而论的基础(7,8]。应用程序的逻辑模型COVID-19以巴蒂斯塔的研究[31日和沈32]。时间 ,新病例的逻辑模型和累积病例是 在哪里最大数量的情况下(最后流行大小), 措施的强度指数增长的情况下在早期流行阶段,和就是新病例的拐点是最高的。理查兹模型(33)修改物流发病率函数 与解决方案
的参数 修改物流的发病率下降阶段,也就是说,措施的程度偏离标准对数曲线。的转折点 ,当发病率高峰,当获得=(34]。发病率高峰对于医疗保健计划很重要,例如,将预测峰值与病床能力(35]。
其他常用的模型是龚帕兹模型(36)与 尽管Rosenzweig模型(27)
发生率由函数可用于定义意味着发病率统计新病例数据的可能。因此,入射时间序列数通常可以令人满意地作为一个泊松模型,用定义的方式函数(37,38]。同样,累积病例的功能可用于定义意味着疫情规模模型对于累积情况统计(27,39]。
而对于小流行,泊松密度意味着发病率可能应用,等大流行病COVID-19,负二项密度通常是首选,因为大型发病率计数和代表经常不稳定的波动导致overdispersion发生率相对于泊松(29日]。然而,文学不包含任何负二项代表overdispersion的评估。有许多其他overdispersed版本的泊松,可以通过与合适的混合泊松密度(如对数正态密度)30.,40),这可能是有益的在检测不寻常的观察。
3.2。模型说明:泊松Overdispersion
考虑到理查兹模型参数。让和有时表示发病率和累积发病率计数 (天COVID ECDC的数据)。我们在第一种情况下条件或情况下(即。,the first observation) and take incidence at time作为一个函数的累积病例 ,所以,泊松模型情况下(下标参数)
在实践中,许多流行的数据集overdispersed相对于泊松,和流行病研究通常采用负二项模型代替。我们可以指定一个overdispersed模型(包括负二项)通过引入乘法随机效应([40),方程(2)),这样所指定的泊松意味着对发病率 在哪里随机效应是积极的。Poisson-gamma模型(相当于一个负二项),伽马分布的意思是1,即 在哪里 提到的是overdispersion参数(29日]。注意,假设随机变量参数化的伽马密度是
其他选项(7)采取 为正态分布40]: 或学生t分布式(41), 在哪里是一个自由度参数。这两个选项定义Poisson-lognormal (PLN)和Poisson-log-Student (PLS)选项,分别为(30.]。PLN和请表示可以提供一种更健壮的替代Poisson-gamma [40- - - - - -44),尾巴比伽马分布,更重和更善于发现的离群值(如每日“钉”在一个流行应用程序)。
3.3。联合模型新的病例和死亡
在下面的分析中,我们应用双变量估计新病例和死亡理查兹模型使用规范。因此,表示和随着新和累积死亡时间 。联合的可能性overdispersed泊松模型的结果然后指定
对于贝叶斯应用程序,我们需要指定密度之前,简称先验的参数。流行的尺寸参数 ,扩散之前仅限于积极的价值观,如散射伽马密度,例如, 或 ,与小,被发现导致收敛性问题。如前所述(31日),”…在早期阶段,对数曲线遵循一个指数增长曲线,所以估计几乎是不可能的。“这困难继续当一个流行的高峰已经过去,但早在衰退。
然而,巴蒂斯塔(31日]提到关系(物流模型)之间的连续累积情况可能协助提供之前的数量 。具体来说,间隔为3分时间单位,你可以获得一个点估计量的关系 ,也就是说,
前一个可能使用这个点估计量来定义的意思理查兹模型(这是物流的概括)。具体来说,可能需要一个对数正态密度之前 ,与的意思是,和一个合适的方差,这样前仍相对分散。例如,假设是250000,和方差对数正态设置为1。然后,对数正态之前是177万的97.5百分比。
在二元规范(共同为新病例和死亡),我们寻求分享之前的信息之间的结果。之前的一个选择(最后的死亡总数)的函数 ,也就是说, 在哪里是一种病死率(CFR)。的信息之前可以基于COVID相似的国家的经验,或类似的疾病流行的经验。考虑第一个选项,一个适当的英国分析数据之前,一个信息之前可以提供的病死率在欧盟(英国不再是一个欧盟成员国)。国际病死率提供信息https://ourworldindata.org/mortality-risk-covid the-current-case-fatality-rate-of-covid-19。
或者,你可以链接和用点估计量和病死率;也就是说, 。这时,一个对数正态密度可以采取之前 ,与 的意思是,和一个合适的方差,之前仍相对分散。
之前另一个可能的环节最终病例和死亡将涉及时间序列是有时限的病死率比率,如一个自回归 ,与估计从死亡和累积数据情况。一些流行的分析表明,在流行病早期病死率可能低估后值(45),在这种情况下,之前可能会限制超过最后基于观测数据。关于COVID-19,这种模式不一定适用,与美国(例如)在后来流行阶段就显示下降。也有证据表明,感染的死亡率比(更精确的测量比CFR)下降(46]。允许这种情况下,前会集中在最后发现呢 ,而不是限制超过它。
其他参数可以考虑联合先知先觉,例如,二元正态先验的日志和 ,或的日志和 。在下面的实证分析中,我们关注先验链接最后流行和死亡总参数,和 ,这些预测是一个重要的影响。
3.4。中期预测
许多应用程序现象学模型对历史数据的流行,流行的跑到它的全部。在这里,我们考虑应用程序不完整的流行(例如,流行病观察到它们的中点或早期衰退),并使用这些数据来预测。预测在一个中间点在观察跨在自己感兴趣的政策目的。然而,他们也可以用于比较模型评估通过使用交叉验证,只有一些数据用于估计模型,以及一些进行验证。
因此,假设训练样本是由观测时间 ,而后续观察有时 ( )被用作验证样本。预测和新病例和死亡时间 是基于观察累积计数和 。像往常一样在贝叶斯推理,预测得到的复制数据采样后预测密度 和 ,在哪里 新病例和死亡数据,联合模型的参数吗3.3节(47]。
预计累计计数 然后获得, 和 。预测新病例和死亡 ,也就是说,和 ,然后从适当的现象学模型采样形式,基于和 。累积病例和死亡 然后通过添加预测新病例和死亡 来和 。这个过程一直持续到时间 。
适合可以评估是否可信区间预测的交叉验证包括实际发病率和新时期死亡。还有关概率overprediction或underprediction。例如,考虑预测新病例验证段 ,和获得样品 ,验证期间,让新的预测病例平均(平均天)在迭代人们用 。我们想要比较平均预测新病例平均观察新病例, ,在验证期间。overprediction的概率可以从二进制指标: 在哪里 如果条件是真的, 否则。因此,在每次迭代中,我们比较平均新病例(模仿)在验证期间与实际平均新病例。
概率overprediction新病例, ,估计是 。underprediction可以获得的概率 。一个令人满意的预测 ,与超过0.95指示overprediction的高概率在0.05意味着underprediction的高概率。Underprediction意味着underforecasting未来的情况下,可能导致错误的推论关于流行病的控制,因为它意味着减少发病率比实际发生的还要早。
3.5。长期流行监控,有效的繁殖率和病死率比率
战略决策对于遏制COVID-19流行,在英国和其他国家,依靠新感染和死亡的趋势,但也有效的繁殖率。因此,在英国,选择是否放松初始COVID封锁限制是基于五个标准,有两个数字:首先,“持续一致的每日死亡率下降”和第二”的感染率降低到可控的水平,”这意味着有效的繁殖率明显低于1。繁殖率也可能变得特别流行后期的相关(postlockdown),从最初的峰值和低迷后封锁措施后放松。在这里,关心的是防止感染的复兴,暗示的好转 。
在旷日持久的经济衰退,但由于新病例仍然发生,可能会有大量的问题尤其复苏的情况下,也可能死亡,在某种程度上。这个场景是俗称“第二波”,而且在大多数欧洲国家,有明显的第二波COVID-19流行在2020年期间,尽管在不同的时间。这样的复苏表明使用多相模型(15),后与另一个现象学模型应用于数据之间的潜在switch-point流行机制。请注意,在撰写本文时(2020年8月),一个完全开发的第二波尚未发生在英国,虽然是好转的迹象 ,如下分析证实。
在规划医院护理,长期趋势在疾病严重程度可能是相关的。例如,一个回升的情况下可能反映了更多的病例在年轻人中死亡率较低。因此,趋势,和病死率的预测是企业战略管理的一个重要方面。在病例和死亡的二元模型,在这里,我们可以通过时间跟踪模仿病死率,模仿病死率在天是由预测预测总死亡人数的比例情况下吗 。在一个二元模型包括住院治疗上的自然延伸,趋势,预测,住院率(住院病例占总病例的比例)也可以被估计。
假设有证据表明新病例数据好转的情况下,甚至在第二波疫情完全建立。考虑一个模型仅供新病例。然后,一个两阶段模型来反映了好转将涉及两个现象学模型,之前和之后的一个潜在switch-point,每个模型都有不同的参数。表示单一switch-point ,理查兹这样的两阶段模型, 在哪里 当条件是真的,否则和0。参数,比如 ,结果和波进行了区分。的参数可以分配一个统一之前(在积极的间隔)或积极的价值之前,如一个指数密度。如果有第二波死亡也好转,那么可以使用一个二元模型,开关点假定后死亡比情况下,由于死亡率的上升可能延误后发病率的上升。三相模型情况下会有两个开关点,与的意思
一个有效的繁殖率的估计量在时间从这个现象学是基于预测模型和连续区间估计的密度。连续出现症状之间的间隔时间在受感染的主题和infectee症状出现。连续间隔密度可以discretised权重的形式 ,应用于串行间隔长度(天)最大 。这些可以用来估计有效的繁殖率在现象学模型分析新病例;看到论文(37,48,49]。因此,可以被估计为 在哪里预计新病例数据从现象学模型。由于密度采样策略的使用,我们可以很容易地获得的95%置信区间 ,和的概率 ,为评估流行遏制战略是很重要的。
4所示。模型应用程序
我们认为上述方法的应用英国新病例和死亡数据从2020年2月1日(当第一个报告了两例英国COVID-19根据ECDC)。观察ECDC中指定的日期数据,与时间天从2020年2月1日。数据1(一)和1 (b)显示每天的趋势在2020年8月8日,这些结果与结果不稳定的波动明显。然而,有普遍下降的趋势在这两个结果从天70年到80年,尽管有更多的旷日持久的衰退而陡峭的最初的好转。数据2(一个)和2 (b)的相对顺利进化累积病例和死亡。
(一)
(b)
(一)
(b)
4.1。中期预测
理查兹的中期预测,我们关注的二元模型(3.3节)和比较三个替代错误假设的讨论3.2节:Poisson-gamma (PG)、Poisson-lognormal (PLN)和Poisson-log-Student (PLS)。学生密度是由规模的法线的混合物(50,51]。因此,对于新病例,而不是索取 在哪里自由度参数和吗 ,我们把
这些指标平均1,但明显低于1更偏远的观察,如每日峰值的情况下。
交叉验证估计是在点 。因此,我们在三个不同的阶段考虑twenty-day-ahead预测英国COVID-19流行病。第一交叉验证,估计是基于训练数据 与 (即。,the cross-validation period consists of days 81 to 100). Cross-validation estimations with 也为 ,和 ,合作数据与预测精度基于比较预测好几天 。
4.2。模型的假设
之前密度未知的中期预测,指数与1是假定先验 , , ,和 。的精度 和 PLN,请选择,参数和Poisson-gamma模型中,伽马之前假定。请选择我们 作为一个预设的选择。自由度很难估计相对较小的数据集,和选项的预设值 是一个健壮的选择(52,53]。最大的情况下(流行大小)参数 ,我们假设对数正态之前,集中和方差1中讨论3.2节。
参数的最大死亡 ,我们假设 ,在之前的β分布与由欧盟病死率定义意味着什么 。测试之前的总数设置为5, 。因此,之前是 。例如,在20-04-2020(在一天 ),欧盟病死率为0.101,之前的设置 。这说明相关的外部信息的使用,而不是扩散先验。
4.3。模型,估计
适合观察到的训练数据评估使用Watanabe-Akaike信息准则(WAIC) [54]。这是一个适合测量,考虑适合还对模型的复杂性。观察样品的交叉验证符合(符合)评估的概率预测overprediction,和 ,和预测性报道:是否可靠的预测区间病例和死亡(平均每个验证段)包括观察到的平均水平。估计使用了错误程序(55),与后验估计基于第二部分两个链运行100000次迭代,并使用Brooks-Gelman-Rubin融合评估标准(56]。
4.4。造型后流行阶段
提供一个长期视角流行遏制,我们申请最好的执行模型分析的第一波观测的全套在2020年8月8日(T= 190),当第一个流行高峰已经过去。所以这个应用程序是一个流行第一波已经过去,但是仍然存在不可忽视的新病例的数量,和可能的上升潜力,进一步波。
新病例和死亡(7天移动平均线)4850年和950年达到最大值,分别在英国流行在2020年4月达到顶峰。由于封锁措施实施3月下旬,每日平均每天超过500个新病例在7月。然而,锁定7月松口,伴随着复苏的风险。的好转是明显的在这方面在7月底和8月初新病例平均每天超过800(参见图3),虽然死亡人数持续下降,平均每天大约50在8月初。
完整的时间序列模型,由于没有好转明显死亡2020年8月初,我们只关注新病例。反映了证据好转的情况下,应用两阶段模型。对于这个模型,改变参数之前被分配一个指数密度是150。先验的参数二理查兹模型作为指数上升之前和物流修改参数。为(波下的预测总病例2),我们假设 与1的意思是之前指定一个指数。兴趣是流行遏制政策,总结有效的繁殖率:专门的政策相关性的问题是这个比例一直低于1,和其95%可信区间是否也完全是低于1。如果这个比率不低于1,这表明显著好转。
提供有效的繁殖率的估计,我们使用累积证据COVID连续间隔从五个研究[57- - - - - -61年]。伽马密度连续间隔(SI)认为,和信息在SI的平均值和标准偏差,或如果分位数,转化为伽马密度参数;如果使用分位数在这方面,看到62年]。从每个五大样本(一百万)密度,和参数的集中伽马密度估计从五百万年的合并样本;汇集伽马密度形状1.38和0.36。这个密度转换为discretised形式(16箱)提供一个信息之前的SI模型白色和Pagano [63年),更新之前连续间隔密度对英国使用新病例数据。这项研究在64年]建议的初始,大约指数,用于估计流行阶段,我们使用英国新病例数据时间24-04-2020,当英国新病例(见第3页55)达到顶峰。更新的意思是连续区间估计与标准差3.5天3.1。discretised连续区间估计是在63年),与在3.5节设定在 。
5。结果
表1从观察到的比较参数估计(培训)数据在三个错误假设的三个交叉验证分析米=80年,米= 100,米= 120(即。,nine scenarios). It should be noted that predictions of cases and deaths should be based not on the posterior mean or median parameter values in Table1,但在采样后预测在每个迭代中复制数据。这些都是基于从泊松采样的新数据意味着(13)和(14从理查兹模型),在每个特定的迭代参数剖面。病例和死亡的预计值非常接近实际值:例如,请模型米= 120,平均绝对偏差(超过 )实际的新病例和预测新病例之间在1。表2比较了WAIC适合九个选项下的观测数据,而标准关于20-day-ahead预测如表所示3。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
5.1。中期预测
表1显示了广泛的一致性方面的三个分配选项估计最终流行大小和最终的死亡总数 。这些参数的后验密度可能会倾斜,与后意味着超过中值。PLN和请选项,估计的增加所做的事。这反映了英国经济衰退的情况下在第一波高峰后。后平均估计的转折点和略有不同,往往是高的 和 ,但是结果和所有72和86之间的值。新病例估计转折点也请选择下普遍走高。
表2显示,请选择有更好的配合,WAIC较低的值。因此,流行的规模和转折点的估计是首选,并提供一个更好的描述从峰值缓慢下降的情况下。表3请选择显示通常更好的交叉验证性能。正如上面所讨论的,令人满意的预测会 ,和 ,与或超过0.95指示overprediction,或在0.05 underprediction指示。PG和PLN选项显示underprediction更高的值 ,和在政策方面,可能误导暗示速度下降比实际发生的病例和死亡。相比之下, 和 ,95%的区间预测平均情况下请模型轻松包括实际平均新病例。
5.2。长期的场景
政策相关参数的估计也来自于长期的场景当log-Student理查兹模型应用到英国COVID新病例数据T= 190(8月8日,2020)。转变的两阶段模型估计为179.1与95%间隔从179.0到179.3。
图4情节后意味着估计有效的生殖率(5天移动平均线),区分这些估计显著高于1。估计徘徊在1在上半年6月和7月,但7月下旬/ 8月初,往往超过1。是成功的印象完全有效的控制是在怀疑。繁殖率的估计,他们的路径通过6月和7月,是英国在类似https://epiforecasts.io/covid/posts/national/united-kingdom/ national-summary和基于方法(65年]。
说明潜在的长期预测的严重程度指标,我们也使用观测数据提前40天的时间进行预测150天到190天。该分析使用请混合泊松模型选择。图5显示了预测结果的病死率为95%。的时间间隔 包括观测值为0.151。
6。讨论
现有的流行造型文学认识到需要overdispersed分布处理不稳定的发病率统计(29日,66年,67年]。因此,研究[67年]表明,使用负二项分布比泊松更合适用于描述新兴感染overdispersed情况分布由于superspreading事件。然而,到目前为止,作者都知道,没有评价的负二项与其他方法相比代表overdispersion流行。因此,本文基于比较的一个贡献的负二项(Poisson-gamma混合物)与替代混合泊松模型30.]。例如,泊松对数正态分布分布不再尾随替代负二项分布,可以更好地适应overdispersed计数数据(68年,69年]。这里的分析表明这种选择可能有用的被视为替代负二项,可以改善适合实际观察和提供更准确的预测性能。
解决overdispersion是一个问题出现在模型计算数据与流行相关联。另一个是结果集中:发病率之间的选择是(通常的方法),或在考虑相关的发病率和结果。我们开发了一个二元联合建模方法流行的结果,使用链接的先验参数之间的结果。例如,在这里,最终死亡之前联系(通过贝叶斯规范)最终流行的尺寸吗 。这种方法被使用来研究发病率和死亡率之间的相互关系,但可以很容易扩展到更多的结果,如发病率、死亡率和住院治疗上。从这样的联合预测模型使疫情严重程度的预测结果(例如,致死率,case-hospitalisation比率,deaths-hospitalisations比率,和有效的繁殖率),协助大流行严重性评估。严重程度评估,以及总结的疫情严重程度指标的发展,被公认为疫情监测和建模的一个重要方面(70年,71年]。
本文还考虑将现象学模型应用于后期的增益不完整的流行,特别是(对于COVID-19)锁定计划生育政策放宽后,那里可能是一个长期的非零发生率或进一步更加明显的感染。以上分析因此Poisson-log-Student已故流行数据申请英国(2020年8月初),当有一些证据的发病率上升,但尚未成熟的第二波。这种分析的重点是有效的繁殖率和病死率,疫情严重程度的指标。(所72年),”COVID-19大流行已经表明,病毒的有效的繁殖率不仅是一个至关重要的决定因素的公共卫生,也是公共政策。“有多种方式估计这个量,使用谷歌移动数据(包括新方法如73年]。在这里,分析使用的估计理查兹基于两阶段模型显示传输的好转在英国7月下旬/ 2020年8月初。
因此,研究的附加价值是由以下几点:(a)提出一个多元框架容易申请评估严重性,(b)提供一种方法来评估替代方法代表overdispersion和(c)提供一种方法来评估长期趋势,使长期预测(例如,病死率和有效的繁殖率)在多波的情况。
7所示。结论
许多应用程序的现象学模型完成流行。然而,评估这些模型只是基于他们的适合观测数据可能只给出部分图片。也与流行病模型评估,特别是对于政策的应用程序,是不完整的流行的中期预报的准确性。可以说,评价在这种情况下,最好使用交叉验证的方法,只有一些观测数据被用来估计参数,和在抵抗样本可以评估预测的准确性。英国流行的分析在2020年上半年的数据显示,适合训练数据和交叉验证符合一致的首选的选择模型的选择。
本文的贡献是为了说明两个流行的二元方法的结果,以及先验信息(根据贝叶斯方法)可以应用于连接参数管理每一个结果。二元的好处(和潜在的多元)方法包括预测的能力严重等措施病死率,借贷的力量在使预测结果(26]。另一个贡献是关注发病率和新的死亡而不是累积的结果显得更加突出的问题充分代表泊松overdispersion。后者经常是由不稳定的波动在观察到的系列中,明显在英国COVID数据新病例和死亡。相对适合的分析提供了新的证据和预测性能不同的方式代表泊松overdispersion流行病统计数据,并通过使用潜在收益重尾负二项的替代品。我们也认为是长期的贝叶斯分析流行趋势,可能存在多个波,说明监测的病死率和流行繁殖。
研究的影响(例如,在规划医疗条款),有效期内COVID-19发病率和死亡率的预测可以提供的建议方法。二元方法的扩展(例如,包括发病率,死亡率,和住院治疗上)提供了预测其他指标范围相关的严重程度评估。方法也提出了一种监测长期感染数字导致早期发现早期感染人数的上升,通过持续的监控和预测的有效的繁殖率。评估后者是否仅限于值低于1战略流行病控制是很重要的。
本研究有一些可能的局限性。比较分析的替代方式代表overdispersion已经来英国数据有限,第一波COVID-19流行,并与其他流行时间序列,将需要验证COVID-19和其他传染病。警告,尽管本质上不是一个限制是,关于贝叶斯估计,相对信息可能需要先验来保证稳定的评估,确保收敛。例如,分散伽马先验最终流行大小参数引起的收敛问题分析报告。
对于未来的研究,只是指出,方法比较overdispersion方法应该与其他流行的数据集评估。等泊松混合物可以考虑泊松对数skew-normal [74年与其他密度[]或泊松混合物75年,76年]。其他类型的分析关于预测潜在的也可以设想,如预测的组合,例如,预测的基础上结合物流,理查兹,和龚珀兹曲线77年,78年]。会非常有用,尤其是在规划医院护理能力,应用二元方法COVID-19发病率和住院治疗上,或者一个小方法,发病率、死亡率和住院治疗上。小的方法将提供模型估计和预测指标严重程度评估的核心。
数据可用性
使用的数据来支持这个研究的发现获得欧洲疾病预防和控制中心(https://www.ecdc.europa.eu/en/publications-data/download-todays-data-geographic-distribution-covid-19-cases-worldwide)。
的利益冲突
作者宣称没有利益冲突。
引用
- e .董、h·杜和l·加德纳“交互式网络实时追踪COVID-19仪表板,”《柳叶刀传染病,34卷,2020年。视图:谷歌学术搜索
- j·马”,估计流行指数增长率和基本繁殖数量,”传染病模型5卷,第141 - 129页,2020年。视图:出版商的网站|谷歌学术搜索
- j .李东旭d Donoho h·福尔曼,“医院2019年冠状病毒病能力和操作(COVID-19)大流行规划第n个病人,”JAMA健康论坛,1卷,不。3,2020。视图:出版商的网站|谷歌学术搜索
- m . Maleki m . r . Mahmoudi d .幽灵,K.-H。越南河粉”,时间序列建模预测COVID-19的确认和恢复情况,”旅行医学和传染病37卷,2020。视图:出版商的网站|谷歌学术搜索
- 疾病控制和预防中心(CDC),大流行严重性评估框架(PSAF)疾病控制和预防中心(CDC),伦敦,英国,2020年。
- c·里德m .带给l . Finelli et al .,“小说框架评估流行病学流感流行和大流行的影响,“新发传染病,19卷,不。1,p。85年,2013。视图:出版商的网站|谷歌学术搜索
- r .汉堡,g . Chowell g . Chowell, l . Yissedt Lara-Diıaz,“现象学增长模型的比较分析应用于流行疫情,”数学生物科学与工程,16卷,不。5,4250 - 4273年,2019页。视图:出版商的网站|谷歌学术搜索
- 大肠Tjørve和k . m . Tjørve”,一个统一的方法来Richards-model家庭用于增长分析:为什么我们只需要两个模型形式,“理论生物学杂志》上,卷267,不。3、417 - 425年,2010页。视图:谷歌学术搜索
- w·c·又m . b . Varughese d·汉和m . y .李,“为什么很难准确预测COVID-19流行?”传染病模型5卷,第281 - 271页,2020年。视图:出版商的网站|谷歌学术搜索
- 赵,穆萨,h .傅d .他和j .秦”简单的框架,用于实时预测data-limited情况:Zika病毒(ZIKV)暴发在巴西从2015年到2016年为例,“寄生虫和向量,12卷,不。1,p。344年,2019。视图:出版商的网站|谷歌学术搜索
- A, A .伯明翰的g . Duarte-Filho f·阿尔梅达,r . Ospina和g·塞·伐斯冈萨雷斯,他“SIRD间室模型之间的比较分析和理查兹的增长模式,”2019年。视图:谷歌学术搜索
- Loberg和c·雷曼”,应用生态学的统一模型预测流行病,与应用程序COVID-19,”2020年。视图:谷歌学术搜索
- g . Chowell l . Sattenspiel美国邦萨尔,c . Viboud”数学模型来描述传染病早期增长:复习一下,”生活的物理评论18卷,第97 - 66页,2016年。视图:出版商的网站|谷歌学术搜索
- 健康指标和评估研究所(健康),“预测COVID-19影响医院病床上面度过,ICU-days,通风机天我们和死亡的状态在接下来的4个月,“2020人。视图:谷歌学术搜索
- 中州。谢长廷和Y.-S。程”,实时预测多相爆发。”新发传染病,12卷,不。1,p。122年,2006。视图:出版商的网站|谷歌学术搜索
- a·b·劳森g . Onicescu, c . Ellerbe“口蹄疫的再现:利用贝叶斯空间susceptible-infectious-removed模型的再次“空间和时空流行病学,卷2,不。3、185 - 194年,2011页。视图:出版商的网站|谷歌学术搜索
- 分支和l .举行“Endemic-epidemic模型与离散时间序列的间隔分布传染病预测,”2019年。视图:谷歌学术搜索
- 帝国理工学院COVID-19反应小组,“非药物干预的影响(npi)降低COVID-19死亡率和医疗需求,”2020年。视图:谷歌学术搜索
- n . Chintalapudi g . Battineni, f . Amenta”COVID-19病毒疫情预测注册和恢复情况下60天之后锁定在意大利:数据驱动模型的方法,”《微生物学,免疫学和感染,53卷,不。3、396 - 403年,2020页。视图:出版商的网站|谷歌学术搜索
- l . Bayyurt和b . Bayyurt COVID-19病例和死亡利用ARIMA模型预测,”2020年。视图:谷歌学术搜索
- f . Petropoulos和美国Makridakis预测新型冠状病毒COVID-19。”《公共科学图书馆•综合》,15卷,不。第三条ID e0231236, 2020。视图:出版商的网站|谷歌学术搜索
- j . Johndrow k .亮度、m . Gargiulo和p .球,“估计的数量SARS-COV-2感染和社会距离的影响在美国,”2020年。视图:谷歌学术搜索
- r·k . Roosa y . Lee罗et al .,“短期预测的COVID-19流行在广东和浙江,“临床医学杂志,9卷,不。2,p。596年,2020年。视图:出版商的网站|谷歌学术搜索
- r . Pancrazi”,估计和预测COVID-19进化在英国和它的地区,”2020年。视图:谷歌学术搜索
- r . De Oliveira j . Achcar, a . Nunes”建模COVID-19流行病的发病率和死亡率在世界的不同地区,”流行病学方法,23卷,2020年。视图:谷歌学术搜索
- j·杜Preez和s·f·威特”,单变量与多变量时间序列预测:申请国际旅游需求,”国际期刊的预测,19卷,不。3、435 - 451年,2003页。视图:出版商的网站|谷歌学术搜索
- s . w . Liu唐,肖y”模型选择和评估基于新兴传染病数据集包括甲型H1N1和埃博拉病毒,”计算和数学方法在医学,34卷,2015年。视图:谷歌学术搜索
- 黄懿慧研究生、j·c·米勒和m . Lipsitch“霍乱建模、”流行病学,23卷,不。4 p。523年,2012年。视图:出版商的网站|谷歌学术搜索
- 答:国王,m·多梅内奇德细胞f . Magpantay和p . Rohani”暴发的造型中可以避免的错误,新兴的病原体,特别提到埃博拉病毒,”《皇家学会学报B:生物科学,34卷,不。1806年,文章ID 20150347, p . 282, 2015。视图:谷歌学术搜索
- d . Karlis和大肠Xekalaki混合泊松分布,”国际统计审查,卷73,不。1,35-58,2005页。视图:谷歌学术搜索
- m·巴蒂斯塔,“估计最终大小的冠状病毒流行的物流模式,”2020年。视图:谷歌学术搜索
- c . y .沈,“物流增长造型COVID-19扩散在中国及其国际影响,”国际传染病杂志》上卷,96年,第589 - 582页,2020年。视图:出版商的网站|谷歌学术搜索
- y谢长廷,”理查兹模型:一个简单的过程,实时预测疫情的严重程度,”2009年。视图:谷歌学术搜索
- X.-S。王、吴j . y .杨,”理查兹模型重新审视:验证应用程序感染动力学,”理论生物学杂志》上卷。313年,19,2012页。视图:出版商的网站|谷歌学术搜索
- o·林惇,”冠状病毒大流行高峰?2020。视图:谷歌学术搜索
- 李k, l·贾,江y、x郭,“冠状病毒疾病的预测和分析,2019年。视图:谷歌学术搜索
- g . Chowell d . Hincapie-Palacio j . Ospina et al .,“用现象学模型描述传播性和预测模式和最终的负担Zika病毒流行,”PLoS Currents,34卷,2016年。视图:出版商的网站|谷歌学术搜索
- c . Viboud l·西蒙森和g . Chowell”generalized-growth模型描述传染病暴发的早期提升阶段,“流行15卷,27-37,2016页。视图:出版商的网站|谷歌学术搜索
- c . Bauckhage”疫情暴发的数学和扩散(3)部分最小二乘拟合的增长模式,”2016年。视图:谷歌学术搜索
- d . m .周l . Li Dunson, l . Carin“对数正态和伽马混合负二项回归,”机器学习的国际会议卷,2012年,第1350 - 1343页,2012年。视图:谷歌学术搜索
- d . p .给和i . g . O 'Muircheartaigh“健壮的经验贝叶斯分析的事件,”技术计量学卷,29号1、1 - 15,1987页。视图:出版商的网站|谷歌学术搜索
- 美国孙”,四个估计的比较研究分析随机事件的泊松过程,”杂志的统计计算和模拟卷,49号1 - 2、1 - 10,1994页。视图:出版商的网站|谷歌学术搜索
- g .陈c . Rungie m·赖特c . Driesener和j·道斯,”与泊松对数正态分布模型预测未来购买。”营销信,25卷,不。2、219 - 234年,2014页。视图:出版商的网站|谷歌学术搜索
- s r·康诺利m . Dornelas d·r·Bellwood t·p·休斯,“测试物种丰度模型:一种新的引导方法应用于印度太平洋的珊瑚礁,”生态,卷90,不。11日,第3149 - 3138页,2009年。视图:出版商的网站|谷歌学术搜索
- l . Bottcher m .夏,t .周,“为什么死亡率估计以人群为基础的流行期间可能会误导,”2020年。视图:谷歌学术搜索
- a·沃恩“越来越少致命吗?”《新科学家》,卷247,p . 2020。视图:谷歌学术搜索
- A >“贝叶斯公式的探索性数据分析和配合测试,善优先车道”国际统计审查,卷71,不。2、369 - 382年,2003页。视图:出版商的网站|谷歌学术搜索
- A·科里n·m·弗格森,c·弗雷泽和s . Cauchemez”一个新的框架和软件估计时变生殖流行期间,“美国流行病学杂志》,卷178,不。9日,第1512 - 1505页,2013年。视图:出版商的网站|谷歌学术搜索
- h . Nishiura和g . Chowell”有效的繁殖数量作为统计估计时间流行趋势,”数学和统计估计方法在流行病学施普林格,页103 - 121年,多德雷赫特,荷兰,2009年。视图:谷歌学术搜索
- d .皮和g . j .克劳克兰“健壮的混合模型使用t分布,”统计和计算,10卷,不。4、339 - 348年,2000页。视图:出版商的网站|谷歌学术搜索
- b . Moravveji z Khodadadi, m . Maleki”两件套分布的贝叶斯分析基于正常的家庭的规模混合物,”伊朗科技期刊、事务:科学,43卷,不。3、991 - 1001年,2019页。视图:出版商的网站|谷歌学术搜索
- d . p .给p·a·雅各布斯和i . g . O 'Muircheartaigh”层次Poisson-like事件率数据的回归分析:superpopulation对预测模型的影响,“通信在统计理论和方法,19卷,不。10日,3779 - 3797年,1990页。视图:出版商的网站|谷歌学术搜索
- a > j·卡林·h·斯特恩,d . Dunson a . Vehtari d·鲁宾,贝叶斯数据分析查普曼&大厅/ CRC),伦敦,英国,2013年。
- 答:渡边,“广泛适用的贝叶斯信息准则,”机器学习研究杂志》上,14卷,第897 - 867页,2013年。视图:谷歌学术搜索
- d . j . Lunn a托马斯:最好的,和斯皮格尔霍尔特d,“WinBUGS-a贝叶斯建模框架:概念、结构和可扩展性,”统计和计算,10卷,不。4、325 - 337年,2000页。视图:出版商的网站|谷歌学术搜索
- s p .布鲁克斯和a >“一般监测收敛迭代模拟方法,”计算和图形统计杂志》上,7卷,不。4、434 - 455年,1998页。视图:出版商的网站|谷歌学术搜索
- 问:Bi, y,美国梅et al .,“流行病学和传播COVID-19 391例和1286年在深圳的密切接触者,中国:一项回顾性队列研究,”2020年。视图:谷歌学术搜索
- d . Cereda m . Tirani f . Rovida et al .,“COVID-19暴发的早期阶段在伦巴第,”2020年。视图:谷歌学术搜索
- Y.-W。d . Chan s Flasche T.-L。t . Lam et al .,“传播动力学,连续间隔和流行病学COVID-19疾病在不同的控制措施,在香港”威康开放研究,5卷,不。91,91年,页2020。视图:出版商的网站|谷歌学术搜索
- h . Nishiura n·m·林惇,a . r . Akhmetzhanov”系列小说的间隔冠状病毒(COVID-19)感染,”国际传染病杂志》上卷,93年,第286 - 284页,2020年。视图:出版商的网站|谷歌学术搜索
- z Du, x, y, b . j .整流罩l . Wang和l·a·迈耶斯”系列间隔COVID-19在公开报告确诊病例,”新发传染病,26卷,不。6,1341 - 1343年,2020页。视图:出版商的网站|谷歌学术搜索
- 由gamma.parms.from.quantiles p . Belisle”计算γ分布参数(),“2012人。视图:谷歌学术搜索
- l·f·怀特和m . Pagano”基于可能性方法实时估计的串行间隔和生殖的一种流行病,”医学统计,27卷,不。16,2999 - 3016年,2008页。视图:出版商的网站|谷歌学术搜索
- t . Obadia r .汉尼弗,p . y . Boelle”R0包:疫情暴发的工具箱来估算繁殖数量,”BMC医学信息学和决策,12卷,不。1、1 - 9,2012页。视图:出版商的网站|谷歌学术搜索
- 美国雅培,j . Hellewell r·n·汤普森et al .,“估计时变繁殖数量的SARS-CoV-2国家和地区情况下,使用“威康开放研究,5卷,不。112,112年,页2020。视图:出版商的网站|谷歌学术搜索
- 问:一个,j .吴x粉丝,l .锅和w .太阳,“使用负二项回归模型预警的一只手足口病流行在大连,辽宁,中国,“《公共科学图书馆•综合》,11卷,不。6篇文章ID e0157815 2016。视图:出版商的网站|谷歌学术搜索
- a . r . Tuite和d . n . Fisman”一个单一方程模型:埃博拉预测方法的挑战,”流行22卷,第77 - 71页,2018年。视图:出版商的网站|谷歌学术搜索
- r . Izsak“泊松对数正态分布的极大似然拟合”,环境和生态的统计数据,15卷,不。2、143 - 156年,2008页。视图:出版商的网站|谷歌学术搜索
- m . s . Williams和e·d·伊贝尔,”微生物测试方法拟合Poisson-lognormal分布数据,”食品控制,27卷,不。1,第80 - 73页,2012。视图:出版商的网站|谷歌学术搜索
- a . Freitas m . Napimoga和m . Donalisio“评估COVID-19的严重程度,”Epidemiologia e Servicos de Saude文章ID e2020119卷。29日,2020年。视图:出版商的网站|谷歌学术搜索
- f·m·a . Mansuri”情况分析和洞察的评估大流行COVID-19,”Taibah大学医学科学杂志》上,15卷,不。2,p。85年,2020年。视图:出版商的网站|谷歌学术搜索
- r·霍顿·d·桑顿,“随机繁殖率的病毒。”COVID经济学41卷,第128 - 100页,2020年。视图:谷歌学术搜索
- j·帕尔,”COVID-19数据分析,第6部分:从预测COVID-19传播率与谷歌在墨西哥迁移数据,”2020年。视图:谷歌学术搜索
- f . Hassanzadeh和大使,”over-dispersed统计数据的分析与额外使用泊松分布log-skew-normal 0,”杂志的统计计算和模拟,卷86,不。13日,2644 - 2662年,2016页。视图:出版商的网站|谷歌学术搜索
- a . Hoseinzadeh m . Maleki, z . Khodadadi“异方差的非线性回归模型使用非对称和重型尾随两件套分布,“旅行社,23卷,2020年。视图:谷歌学术搜索
- e . Mahmoudi h . Zamani, r . Meshkat”Poisson-beta指数分布:属性和应用,“《统计研究》杂志的伊朗,15卷,不。1,第146 - 119页,2018。视图:出版商的网站|谷歌学术搜索
- k . Hubrich和f . Skudelny预计欧元区通货膨胀:结合治疗在危机时期?”杂志的预测,36卷,不。5,515 - 540年,2017页。视图:出版商的网站|谷歌学术搜索
- g . Chowell r·罗k .太阳,k . Roosa a .塔里克和c . Viboud”流行轨迹的实时预测使用计算动态乐团,“流行,30卷,2020年。视图:出版商的网站|谷歌学术搜索
版权
版权©2021 Peter Congdon。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。