文摘

科学的网络交互元素的动力学的研究有了翻天覆地的变化。可以这样说,特别是流行病学拥抱网络理论的潜力比其他任何学科。我们审查越来越多的研究有关传染病的传播网络,专注于网络之间的相互作用理论和流行病学。评审分为四个主要部分,检查:网络相关流行病学的类型;多种方法可以将这些网络特征;统计方法可以应用于推断流行病学在意识到网络参数;最后,仿真和分析方法,以确定一个给定的网络上流行动态。鉴于区域覆盖的广度和出版物数量不断扩大,全面审查所有的工作是不可能的。相反,我们提供一个个性化的概述的区域网络流行病学已经看到近年来取得的进展最大或有最大的潜力提供新颖的见解。因此,相当大的重要性放在分析方法和统计方法都是快速增长的领域。 Throughout this review we restrict our attention to epidemiological issues.

1。介绍

科学的网络交互元素的动力学的研究有了翻天覆地的变化。相关技术在一系列领域产生了巨大的影响,从神经学计算机科学,社会科学统计物理。然而,可以说,流行病学拥抱网络理论的潜力比其他任何学科。流行病学之间存在着极为密切的关系和网络理论可以追溯到1980年代中期(1,2]。这是因为个人(个人或团体)之间的联系,使传染病传播自然定义一个网络,而网络的生成提供了洞察流行病动力学。特别是,传输网络的结构的理解让我们改进的预测可能的感染分布和感染的早期增长(入侵后),以及允许完整的动力学的仿真。然而网络之间的相互作用和流行病学更进一步;因为网络定义了潜在的传播途径,知识的结构可以作为疾病控制的一部分。例如,接触者追踪旨在识别可能传输网络连接从已知的感染病例,因此治疗或包含联系人从而减少感染的传播。接触者追踪是一个高度有效的公共卫生措施,因为它使用底层传输动力学目标控制工作和不依赖于详细了解感染的病因。很明显,因此,研究网络和他们如何与传染病的传播是一个重要的工具来理解疾病传播,因此,通知疾病控制。

在这里,我们审查的越来越多的研究传染病的传播网络,专注于网络之间的相互作用理论和流行病学。本文分为四个主要部分检查网络相关流行病学的类型,这些网络的多种方法进行描述,统计方法,可以应用于推断可能的网络结构或流行病学参数对意识到网络,最后仿真和分析方法,以确定一个给定的网络上流行动态。鉴于区域覆盖的广度和不断扩大的出版物(超过七千篇论文已发表有关传染病和网络)的全面审查所有的工作是不可能的。相反,我们提供一个个性化的概述的区域网络流行病学已经看到近年来取得的进展最大或有最大的潜力提供新颖的见解。如此可观的重要性放在分析方法和统计方法都是快速增长的领域。我们注意到一系列其他基于网络的过程(如思想或恐慌的蔓延)可以用类似的方式建模的传播感染;然而,在这一背景下,传播过程更清晰;因此,在这篇文章中,我们限制我们的注意力流行病学问题。

2。网络、数据和模拟

有一个广泛的网络结构和类型,利用在考虑传染病的传播。在这里,我们考虑最常见形式和解释他们的使用和限制。之后,我们讨论这些结构的影响和控制传染病的传播。

2.1。理想的网络

我们开始考试的网络形式通过考虑理想的网络让我们完整地描述任何传染性病原体的传播。这样一个网络将由一个无所不知的知识的个人行为。我们定义 是时变的,真实的,高维变量,通知所有潜在的传播途径从个体的力量 个人 在时间 。任何特定传染病可以表示为一个函数( )将这个高维变量转换成一个瞬时概率传输速度(一个真正的变量)。在这个理想, 贯穿了所有可能的传输网络,从性关系亲密的身体接触,面对面的交谈,或短暂的邂逅,量化的时变强度接触。疾病函数然后挑出这些元素(结合) 与传输相关的病原体,送去一个新的(单值)时变infection-specific矩阵( )。这个infection-specific矩阵然后允许我们定义的随机动态给定病原体的感染过程。(更大的普遍性,我们可能想让pathogen-specific函数 也依赖于个体以来被感染,这样时变传染性甚至可以适应时变传输路线。)

显然,网络传播的现实远非理想。潜在的信息传播途径在一个人口往往是有限的在很多方面。首先,它是罕见的整个人口的信息;大多数网络依赖获取个人信息的参与者,因此参与通常是有限的。其次,信息通常只记录在单个传输线路(例如,面对面的谈话或性伙伴关系),通常这只是记录作为一个联系人的存在与否,而不是试图量化的力量或频率交互。最后,数据很少接触网络是动态的;什么通常是记录一个联系人是否存在一个特定的时期而很少考虑这种模式如何随时间变化。根据这些偏离理想的,重要的是要考虑不同网络的细节被记录或生成和理解他们的结构,使用,和局限性。

2.2。意识到遇到网络

为数不多的例子,许多潜在的传播途径在一个人口已经记录了来自的传播性传播感染(性病)。与空气感染相比,性病有非常明显的传播routes-sex行为(或共用针头在静脉注射毒品),因此这些潜在的传播途径(图要容易记住1(一))。通常采用的方法复制,在接触者追踪,让一个人的名字可以在给定的时间内所有他们的性伙伴,这些伙伴跟踪和要求他们的伙伴,和重复这个过程被称为滚雪球抽样(4)(图1 (b))。一个相关的方法是被调查者- - - - - -驱动的抽样,个人支付他们的参与和参与他们的联系人同时保护每个人的匿名5]。这种方法,虽然适合隐藏和难以到达的人群,有很多限制,实践和理论:招聘的人走进书房,让他们披露此类高度的个人信息,从参与者不完美的回忆,无法找到所有合作伙伴和联系人的集群。此外,还有这个算法的理论问题只会找到一个连接组件内的人口,这很可能存在多个不相交的网络(6]。

尽管存在这些问题,出于希望更好地了解艾滋病毒和其他性传播感染的传播,几个进行了开创性的研究。最早讨论了Klovdahl [1),利用收集的数据从19病人疾病控制中心在加州患有艾滋病,导致一个40个人的网络。其他大规模的研究已经在温尼伯,加拿大马尼托巴省(7和科罗拉多斯普林斯,科罗拉多州,美国(8]。在这些研究中,参与者被检测性传播感染,感染的分布与底层网络结构。工作在这两个网络通常集中在网络属性和这些可以解释观察到的情况的程度;没有尝试使用这些网络在模拟预测。此外,在科罗拉多斯普林斯的研究中,跟踪是通常只表现为一个迭代虽然在高危人群为许多最初的参与者,在马尼托巴省的研究,跟踪执行的日常公共卫生护士所收集的信息。因此,虽然性接触,提供大量的信息还不清楚结果是真正全面的网络和抽样偏差可能腐败产生的网络(9]。此外,理想的网络相比,这些性接触网络缺乏任何形式的时间信息;相反,它们提供了一个集成的网络在一个固定的时间段,通常缺乏信息的潜在力量是个体之间的联系。尽管有这些困难,他们继续提供一个宝贵的人类性网络的信息来源和性传播感染的潜在传播途径。特别是,他们指出,异质性的极端水平性接触的数量在给定的时间和方差联系人的数量已经被证明能够发挥重要作用在早期传播动力学(10]。

为数不多的早期疾病传播的模拟一个观察到的例子网络来自一个小的研究网络22注射吸毒者和性伴侣的3)(图1(一))。在这个工作中,两个人之间的网络传播的风险估算是基于风险行为的频率和类型连接这两个人。艾滋病毒传播是使用月度时间步和单指数模型情况下,和模拟运行时间长短不一的(模拟)。这使得网络中一个节点的位置(如以多种措施)与频率相比这是感染在模拟过程中,又有多少其他节点通常负责感染。

一种不同的方法收集社交网络和行为数据是由麻省理工学院人类动力学组,说明了现代技术可以帮助确定传输网络的过程。第一个方法是利用这一事实,大多数人携带手机(11]。2004年、100年诺基亚6600智能手机预装软件有麻省理工学院学生使用的2004 - 2005学年。在其他事情上,数据收集使用蓝牙感觉其他移动电话在附近。这些数据做了一个非常详细的个人行为和联系模式。然而,这项工作是限制蓝牙射程高达25米,这样网络推断从这些数据可能不是流行病学意义。

最近的一个研究遇到野生袋獾之间Narawntapu在塔斯马尼亚北部国家公园利用类似的技术方法(12]。在这项工作,46个袋獾装有接近伐木工能够检测和记录的存在其他伐木工在30厘米的范围内。因此,这些伐木工能够提供详细时间信息潜在的这些46动物之间的相互作用。本研究开始理解袋獾面部肿瘤疾病的传播,导致通常致命的肿瘤,可以传播之间的魔鬼,如果他们打架,互相咬。虽然只有27个伐木工和完整的数据恢复,尽管这个方法只记录之间的交互46魔鬼在这项研究中,结果是高度信息(从随机生成的网络远、异构,和详细的时间分辨率)。基于这个网络的结构分析表明,有针对性的措施,集中在最高度连接的年龄或性别,不太可能减少感染的传播。也许更大的相关性是确定潜在的这种方法说明了接触网络的其他物种(包括人类)——只有限制的部署一个合适数量的邻近伐木工。

2.3。推断遇到网络

鉴于捕获完整的巨大的后勤困难群体中的个体之间的交互网络,开发了各种方法来生成合成网络从已知的属性。一般来说,这样的方法可以分为两类:那些利用自我中心信息和那些试图模拟人的行为。

自我中心的数据通常由一定数量的个人信息(自我)和他们的联系人(改变)。这样收集的信息非常类似于在性接触网络研究在马尼托巴和科罗拉多斯普林斯,但只有滚雪球抽样的初始步骤进行;所不同的是,对于大多数自我中心数据合作伙伴的身份(改变)是未知的,因此无法推断出自我之间的联系(图1 (c))。数据,因此存在多个独立的“明星”链接的自我改变,它本身提供了有价值的信息在网络中的异构性问题。两个主要的研究试图收集这种自我中心的信息:英国NATSAL性接触的研究(13- - - - - -16],POLYMOD研究社会互动在8个欧洲国家(17]。从这些数据生成网络的关键是概率分配每个改变一组联系人的信息可以从自我;从本质上讲,使用自我数据执行下一步的滚雪球抽样算法。最简单的方法是生成的多个副本的所有自我,考虑每个自我的接触“half-links”;网络可以连接中的half-links随机生成一个配置网络(18- - - - - -20.];如果有更多的信息可以在状态(年龄、性别等)的自我和改变,那么这也可以包括将减少的half-links集可以连接在一起。然而,在绝大多数的建模研究,以自我为中心的数据仅仅是用于构造WAIFW (who-acquires-infection-from-whom)矩阵15,17,21]通知关于不同群体之间的相对水平传输(例如,基于性活动或年龄)但忽视隐含的网络属性。这种依赖的方法通常是可靠的:性传播感染是极端异质性联系人的数量(这是接近幂律或无标度分布;参见3所示。2感染),驱动动力学(22虽然大规模的结构确实起到了重要的作用[23];之间的社会互动,assortativity(年龄)组织控制行为,与联系人作为负二项分布的数量(17]。POLYMOD矩阵因此被广泛应用于2009年H1N1大流行性流感的研究,提供重要的信息具有成本效益的疫苗接种不同的龄级(21,24]。

随机连接在一起的一般配置模型方法从每个自我“half-links”(18,19)已经采用和修改考虑性病的传播。特别是,模拟被用来考虑并发性网络的重要性(25,26),并发性是指在两个活动同时性伙伴关系。性网络是一个动态的模拟,伙伴关系被打破和改革,这样网络密度随时间保持不变。两个节点形成伙伴关系的可能性取决于他们的程度,但这种关系可以使并发或多或少地普遍,使混合选型或非选型基于两个节点的度。性病的传播(如淋病和衣原体(25)或艾滋病毒(26)模拟在这个动态网络,显示增加并发的增长率在早期阶段增加了流行病(,因此,它的大小在一个给定的一段时间)。这个更大的增长率与巨大的增加组件的大小(见部分3所示。1),是由于增加了并发性。

一个稍微一般方法性网络的生成模型受雇于甘尼et al。27]。在网络模型中,个人有一个喜欢的伙伴关系,并发合作伙伴数量和持续时间及其assortativity水平可调。gonorrhoea-like感染是模拟生成的动态网络。回归模型来考虑网络结构之间的关系(无论是快照的状态网络的模拟或累积过去90天的模拟)和感染的患病率。这些模拟表明,增加水平的并发合作使入侵网络更有可能而且最性活跃节点的混合模式是最重要的在确定最终的感染发生率在人口(27]。同一个模型后来被用来考虑不同的结构措施和采样策略的重要性,表明它是重要的努力把感染者和大量的性伴侣为了正确定义高危人群干预措施(23]。

的替代方法,模拟人的行为显然是高度复杂的,充满了大量的不确定性。尽管存在这些问题,三组试图这样一个方法:Longini集团埃默里大学(28- - - - - -31日帝国[],弗格森的组32,33],Eubank集团洛斯阿拉莫斯/弗吉尼亚理工大学(34,35]。Longini和弗格森的模型主要是基于代理模型,人们被分配一个家和工作地点在他们一起infection-relevant接触频繁随机传播当地的社区。Longini模型独立的整个人口的子单元2000人(美国)或13000个人(东南亚)构成了当地人口随机传输可以操作;相比之下,弗格森模型为每个人分配一个空间位置和随机发生传播通过内核空间。原则上,这两种模型可以用来生成一个显式的网络模型可能的联系。Eubank模型也是基于代理的目标捕获的运动有150万人在波特兰,俄勒冈州,美国;但是这些运动然后用于定义一个网络基于是否两个人出现在同一个地方(有18万个地方代表模型)在同一时间。这是网络,然后用来模拟感染的传播。虽然原则上这个Eubank模型可以被用来定义一个暂时的不同和实值网络(连接的强度将混合的类型有关的位置和位置)的人数;在流行病学杂志35),网络被认为是一个静态接触网络的极端异质性的联系人再次预测,和网络具有“小世界”特性(见下文)。类似的方法生成人工网络随机模拟的个人呼吸道疾病最近应用于流感在美国的规模,并软件(36]。这个软件更现实的动态网络的方法,结合飞行数据在美国,但足够资源密集型要求专家计算设施(一个模拟约192小时的CPU时间)。这三个模型被用来考虑最优控制策略,确定最佳部署资源的限制与不同的路线传播。因此,各种控制策略的预测成功关键取决于接触的力量在家里,在工作中,在社会群体中,随机发生。

虽然天花已经被根除,关切仍故意释放疾病的可能性。Longini集团的随机模拟模型的控制方法主要专注于这种感染(28,31日]。二千人的早期作品利用网络与现实的年龄、家庭规模、上学率分布,每个被感染的可能性是来自接触传染性个体的数量和类型(28]。本文侧重于使用疫苗包含一个小规模爆发天花和得出结论,早期大量的整个人口比目标更有效的疫苗接种人群中如果有很少或根本没有免疫力。后来模型(31日结合这些子网的二千人成一个更大的网络,五万人(医院),和成年人能够通过工作场所和学校联系对方。在这里,重点是监测和控制的一般结论足以控制暴发。流行病学Eubank小组的工作也集中在释放天花虽然这些模拟表明,鼓励人们呆在家里就开始感到不适比选择更重要的疫苗接种协议(35];这可能在一定程度上归功于网络的无尺度结构,因此一些人的superspreading性质。

弗格森模型主要被用于考虑大流行性流感的传播与控制,研究其潜在传播从最初源在东南亚(32),它的传播在美国和英国(大陆33]。东南亚的模型主要是基于泰国,包括人口统计信息和卫星空间人口密度的措施。它专注于遏制目标使用抗病毒药物,建议只要生殖率( )的一种新型应变低于1.8,它可以包含目标的快速使用抗病毒药物和社会距离。然而,这种策略可能需要约300万的储备抗病毒药物剂量。模型基于美国和英国,被认为是更大范围的控制措施,包括关闭学校,家庭预防使用抗病毒药物和疫苗接种,并预测不同的政策可能带来的影响。

2.4。移动网络

另一种网络信息来源来自个人记录的动作。等数据经常描述一个相对较大的网络信息收集的运动通常是国家或国际机构。网络运动,因此,节点代表的位置(而不是个人)和边加权捕捉动作的数量从一个位置到另一个网络很少是对称的。四个主要的运动形式网络发挥了重要作用在理解传染病的传播:航空运输网络(37,38),个人上下班的运动(39,40),美元钞票的运动(运动的人可以推断)(41),和牲畜(尤其是牛)的运动30.,42]。虽然这些网络的结构进行了分析在某些细节,开发一个流行病学模型需要一个基本的假设疫情进展如何在每个位置。本节中的所有例子被认为是使简化假设流行病动力学在每个位置是由随机(平均场)的相互作用,与网络只通知个人的流动或仅仅感染populations-such配方之间的流动称为metapopulation模型(43]。

最早使用详细的运动数据驱动模拟来自1918年加拿大亚北极大流行性流感的传播,根据记录的哈得孙湾公司(44]。传统爵士metapopulation模型结合网络模型(节点在三个地区的毛皮贸易站:上帝的湖,挪威的房子,房子和牛津),有些人仍然在家里的位置而其他位置之间移动,根据记录的出境入境记录在《华盛顿邮报》期刊。虽然只有一个小人口描述这个模型,它能够很详细地parameterised由于人口和历史数据的质量和显示运动模式观测与模拟流行病的开始位置改变的相对时间流行的三个社区,而不是疾病的总体影响。

客机的运动所整理的国际航空运输协会(IATA)提供关于个人的长距离运动非常有用的信息,因此如何迅速感染可能环游世界(37,45,46]。与许多其他网络模型随机个体层面的模拟,Hufnagel等的工作。37)和Colizza et al。45)是基于随机朗之万方程(包括有效的微分方程与噪声)。的早期作品Hufnagel et al。37)关注SARS的传播和表现出显著的预测和全球之间的相似程度,这种疾病的传播。这项工作还表明,对初始条件极端敏感来自网络的结构,与从不同的位置开始爆发感染产生不同的空间分布。Colizza的工作更多的是关注于H5N1流感的传播出现在东南亚及其潜在容器使用抗病毒药物。然而,从墨西哥发起2009年H1N1流感大流行,但同样,IATA飞行数据提供了一个有用的预测早期的传播(47,48]。虽然这样的全球运动网络显然是非常重要的在理解的早期传播病原体,他们不幸的是忽视更局部的运动(49)和个体层面的传播网络。然而,最近的研究旨在解决第一个问题,包括其他形式的当地人口之间的运动(40,50]。这项工作再次关注流感的传播,混合长途航空旅行与较短的通勤运动范围和模型预测的Viboud et al。40]显示季节性流感的好协议与观察到的模式。移动网络已经推断出的另一种形式的“乔治”的研究在美国流通钞票(38];这提供了更多的信息关于短程运动,但又没有真正告诉个体之间的交互。

各种(和在实践中绝大多数)的动作不是由飞机但是很规律的上下班通勤运动。网络这样的动作也被研究在英国和美国的一些细节39,40,51]。方法采用平行客机的工作使用网络,但操作的规模要小得多,再一次,流感和天花已经被认为是病原体。与飞机网络特定的地点作为主要的中心吸引很多上班族每天;但是,与飞机网络,有网络的趋势有很强的每日签名与乘客搬到白天工作但旅行回家在晚上52]。这样交通网络可以被认为是异类,本地集群,时间,和每个联系人都有不同的长处(根据乘客的数量使每个旅程);然而,提供人口流动的完整描述,因此疾病传播需要运动的其他原因包括(51),需要对强假设个体层面的交互。很容易解决的关键问题从这些commuter-movement模型局部爆发是否可以包含在一个地区或是否可能蔓延到网络上的其他节点(39]。

毫无疑问,其中一个最大和最全面的数据集之间的运动位置来自家畜跟踪计划运行在英国和其他欧洲国家采用。牛跟踪方案尤其引人注目地详细,包含信息的运动之间的所有牲畜的农场在英国;因此,这个方案生成每日超过30000工作农场之间的关系网在英国42,53- - - - - -56)(图1 (f))。类似的数据还存在批羊和猪的运动(57]虽然这里动物个体的身份做每个动作不是记录。这个数据源有几个关键的优势超过其他运动网络:它是动态的,在这个动作每天记录;牲畜的运动的一个主要机制之间传输许多感染农场,和metapopulation假设牛在农场是非常合理的混合均匀。原则上,牛跟踪方案中的信息可以用来形成一个更全面的网络,将每头牛作为一个节点并创建一个边缘如果出现两头牛在同一个农场在同一这将生成一个方面的个人网络每天,可以用来模拟感染扩散的(52]。

的早期传播2001年口蹄疫(FMD)主要是由于牲畜的动作,尤其是羊(58]。出于这种流行病,亲吻等。57]进行短模拟口蹄疫的爆发在羊运动网络基于4周的运动开始于2004年9月8日和模拟合成网络度分布。由于短时间尺度考虑(目的是模型手足口病的传播之前被发现),节点是敏感,暴露或感染但从来没有恢复,网络连接保持静态。羊运动网络模拟流行病小于随机网络,一大部分原因要归咎于非选型羊运动的混合网络。同样,纳塔尔et al。59意大利牛的农场)使用一个静态的网络仿真。这里,农场不仅被表示为节点,但常微分方程被用于模型的确定性SI系统感染在每个节点上生成metapopulation模型。唯一的随机模型的一部分是传染性个人之间移动的数量在每个时间步连接农场。这个仿真模型强调了种子节点的中心地位的影响(以几种不同的方式)在随后的流行病”。

使用静态网络模型的动态运动牲畜是有问题的。扩大在早期研究、绿色等。53通过运动模拟的手足口病的早期传播的牛,羊,猪。这里,牲畜网络动态治疗,感染只能传播边缘边缘发生的那一天;额外的网络传播,局部传播也可能发生。这些模拟使区域模式的新的口蹄疫入侵风险评估,以及识别市场适合加强监测的目标。弗农和倾覆55牛]认为流行预测之间的关系从动态网络和静态同行更多细节。他们比较牛的不同的网络表示运动在英国在2004年,模拟流行病在一系列感染性和传染性的时期参数对不同的网络表示。他们得出的结论是,网络表示其他比完全动态(每天运动网络变化)无法复制的动力学模拟流行病的完全动态网络。

2.5。接触者追踪网络

接触者追踪,因此这种方法生成的网络可以有两种截然不同的形式。第一个是当接触者追踪用于发起主动控制。这通常是性传播感染的情况,确定情况下被问及他们的最近的性伴侣,和这些人是跟踪和测试;如果发现被感染,然后重复接触者追踪这些次要的病例。这样一个过程与前面讨论的滚雪球抽样,跟踪的例外只有从已知的情况下进行。类似的接触者追踪可能操作机载流行的早期阶段(如被认为2009年甲型H1N1流感大流行的),但在这里,跟踪不像联系人通常一般迭代跟踪和治疗如此之快,他们不太可能产生二次病例。接触者追踪的另一种形式是当所有确认病例之间的传播途径是寻求(1,60,61年]。这种形式的接触者追踪很有可能在未来成为日益重要的改进的分子技术和统计推断允许感染树决定从感染病原体的基因样本之间的差异62年]。

这些形式的网络有两个主要优势但有一个主要缺点。网络往往伴随着测试结果中的个人网络,因此,我们不仅有信息接触过程,而且在合成的传播感染。此外,当接触者追踪只定义一个执行感染树,还有额外的好处,感染过程本身定义的关系网,因此不需要人工解释的形式的接触可能是相关的。不幸的是,感染过程驱动跟踪的依赖意味着网络只反映一个流行过程的实现,因此,可以忽略潜在的重要性和需要的联系人如果流行模拟;因此,当他们可以告诉过去的暴发,他们没有预测能力。

2.6。代理网络

获得大规模的和可靠的信息谁联系谁显然是非常困难的;因此,有一种诱惑,依靠替代数据集,可以提炼出网络信息更容易,和已经收集的数据的地方。因此运动网络和接触者追踪网络上面所讨论的就是这样的代理网络的例子虽然他们连接到感染传播的物理过程更清晰。其他网络的例子比比皆是22,63年- - - - - -65年];虽然这些都不是直接相关的感染的传播,他们确实提供了深入了解网络形式和grow-structures常见于代理网络可能出现在网络的类型与疾病传播有关。一个源的网络信息极其丰富和高度信息(如果没有立即相关)是在社交网站上的友谊和关系网络(如Facebook);一些网站取得了他们的社会网络数据,这些数据被用来检查一系列社会问题在线互动(66年]。

2.7。理论结构

考虑到巨大的复杂性real-transmission网络参与获得大规模的和可靠的数据,许多研究人员而不是依靠理论上构造网络。这些网络通常是高度简化但目标捕捉一些已知(或假设)的特点real-transmission网络往往简化是如此极端,一些分析可以获得牵引力。这里,我们简要概述的一些常用的网络理论和识别他们捕获的特性;的一些结果如何感染传播等网络是在部分更充分地讨论4.2

2.7.1。配置网络

最简单形式的网络之一是允许每个人拥有一组联系人,它希望让每个节点(在更正式的语言有一组half-links),然后将这些联系与其他个体随机根据联系人的数量,他们希望让(half-links是随机连接)19]。这显然会创建一个网络联系人(图1 (c))。这些配置网络的优势,因为它们是由许多随机连接的个人,没有短循环内的网络和一系列的理论结果可以证明从入侵条件(18,67年,68年)时间动力学的描述(69年]。不幸的是,元素使这些网络服从理论分析缺乏assortativity短循环或clustering-are精确因素被认为是真正的网络的重要特征。

另一种配方,提供了一个妥协的温顺和现实主义发生在个体之间存在充分互联的派系有随机分配环节在整个人口69年,70年)(图1 (d))。因此,这些网络模拟在家庭和强烈的交互作用较弱的联系。尽管这些模型提供了一个显著的改善优于配置网络和捕获已知的家庭传播的重要性,他们之间没有免税额集群家庭由于空间距离。分层metapopulation模型(71年)允许这种形式的附加结构,家庭(或其他组织)是一个提升自己分组聚类的层次结构。

2.7.2。格和小世界

两种晶格网络和小世界网络开始同样的配方:个人定期间隔一个网格(通常在一个或两个维度),和每个连接到他们的 最近的neighbours-these连接定义一个格子。这种网络的优点是,他们保留许多元素的初始点,三维空间的排列,因此同时包含许多短循环以及房地产在本地感染会扩散。之间有明显的联系等lattice-based网络和概率领域的元胞自动机(72年,73年]。这种晶格模型的基本困难是短循环和局部扩散的存在意味着很难(如果不是不可能的话)是准确的结果,因此大规模的多个模拟是必需的。

小世界网络改进晶格的刚性结构,允许低数量的随机接触(图在整个空间1 (e))。这样的长期接触让感染迅速传播虽然人口和大大减少个人之间的最短路径长度(74年]这是俗称六度分离的概念,地球上任何两个人都与最多通过六个朋友或联系人(75年]。因此,小世界网络提供了一个现实一步,捕捉当地传播的性质和潜在的长期接触76年,77年];然而,他们遭受忽视异质性的接触和联系的紧密聚集在家庭或社会设置。

2.7.3。空间网络

生成空间网络,顾名思义,使用人群中所有个体的空间位置,因此格是一种特殊形式的空间和小世界网络。最初位置每个的通用方法 在一个特定的位置 ,通常;这些位置是随机选取的,但集群空间分布也被使用(78年]。两个人(比如 )然后从概率连接基于它们之间的距离;的概率是一个连接内核通常随着距离的衰减,这样连接主要是局部的。这些空间网络(特别是点集群)的潜在分布有许多功能,我们希望从疾病网络虽然还不清楚如果这样简单的公式可以真正代表。

第2.7.4。指数分布随机图

近年来,已经有越来越多的兴趣指数随机图模型(ergm)社交网络,也被称为 类的模型。ergm在1980年代初首次推出由荷兰和Leinhardt [79年基于Besag[工作]80年]。最近,弗兰克和施特劳斯研究那些简单的属性的一个子集,两个节点之间的连接的概率是独立于其他任何一对截然不同的节点之间的连接。(81年]。这允许任何节点连接的可能性条件图上的计算有一定的网络属性。马尔可夫链蒙特卡罗等技术可以用于创建一系列合理的网络,同意各种网络结构即使完成网络收集的信息是未知的82年,83年]。由于其简单,ergm广泛使用的统计学家和社会网络分析84年]。尽管近年来重大进展(例如,85年]),ergm仍然遭受简并和计算棘手的问题对大型网络的大小,这限制了他们的使用流行的造型。

2.8。预期的网络属性

在这里,我们表明,各种各样的网络结构测量或合成了解传染病的传播。显然,这样广泛的网络,没有明确的共识可以画在底层网络结构的类型通常呈现;在某种程度上,这是因为不同的研究都集中在不同的传染病和疾病需要不同的传播途径。然而,关键部件的三个因素出现的流行病学网络:异质性联系人的数量,这样一些人的风险更高的捕获和传输感染,集群的联系人,这样组织的个人往往是高度相互关联,和一些反映了空间分离,这样本地联系人通常形式,但偶尔发生远程连接。

三个基本问题仍然存在于网络的研究。首先,有相对低维的方法来捕捉网络的关键方面的结构?什么是一个关键方面将随问题被研究,但是对于流行病学的应用程序,它应该希望可能会出现一组通用的网络特征。然后评估合理的任务,为这些关键变量基于现实的范围值计算已知传播networks-unfortunately很少传输网络已经记录在任何程度的细节尽管现代电子设备在未来可能简化过程。其次,有相关的统计推断问题合理的完成网络部分的接触者追踪等方法收集的信息。这相当于寻求网络连接的底层模型和已知的部分信息是一致的,因此,具有较强的共鸣更多的机械化动机模型部分2.3。即使网络完全意识到(流行病观察),有相当大的统计困难风险归因于特定接触类型。最后,还有感染的动态预测的关键问题在任何给定的网络),而对于许多复杂网络,直接模拟是唯一的方法,为其他一些简化网络分析可以实现牵引,这有助于提供更一般的见解,网络结构最重要的元素。下面讨论这三个关键领域。

3所示。网络属性

真正的网络可以表现出惊人的水平的复杂性。研究人员所面临的挑战是试着理解这些结构,减少复杂性以一种有意义的方式。为了任何意义的复杂性,几十年来研究人员定义各种各样的可测量的属性,可以用来描述某些关键方面(63年,65年,86年]。在这里,我们描述复杂网络描述的最重要的特征的定义(在我们看来),和大纲对疾病传播的影响模型。

3.1。组件

总的来说,网络是不一定连接;换句话说,网络的所有部分都不可以从所有其他人。组件一个节点所属的节点可以达到通过路径沿着边缘的网络。据说有一个网络巨大的组件如果单个组件包含大部分的网络中节点。在定向网络(一个每条边都有一个关联的方向),一个节点有一个在组件的节点可以达到和一个out-component从该节点可以达到。一个强连通分量(SCC)是一组节点在网络中的每个节点可以从其他节点的组件。

一个巨大的概念组件是中央在考虑疾病传播网络。流行病的程度必然是有限的节点数量的组件,它开始于,因为没有路径节点在其他组件。在指导网络,对于一个最初被感染的个体,只有节点的out-component感染风险。更普遍的是,强连通分量包含了这些节点可以互相联系。强连通分量的成员从感染风险最大进口随机节点,因为一个介绍的感染能够达到组件中的所有节点。

3.2。度、分布和相互关系

学位被定义为数量的邻居这和通常表示为一个节点 。在指示图,学位有两个组件,传入的边的数量 (入度)和边的数目 (学位)。度被定义为一组概率分布, ,一个节点随机程度 。绘制节点的度分布是最基本和最重要的方法之一的描述一个给定的网络(图2)。此外,有用的特征是通过计算程度分布的时刻。的 th的时刻 被定义为 第一时刻, 的平均程度,第二个, 让我们来计算方差 ,等等。

度分布是描述一个网络最重要的方法之一,因为它自然捕捉个体的异质性的潜在感染以及造成进一步感染。直观地说,边缘节点的数量越高,越有可能是一个已经感染节点的邻居。邻居节点越多,越有可能导致大量的起病例。因此,了解的形式 来说是至关重要的理解疾病的传播。在随机网络的类型研究了鄂尔多斯和Renyi, 有效地遵循一个二项分布,泊松的大型网络。最真实的社会网络分布显著不同的随机的情况下。

的极端的例子 后一个无界的幂律和假设等于传输所有边缘,Pastor-Satorras和Vespignani87年)表明,经典流行阈值的结果从平均场理论10分解。在real-transmission网络中,度的分布往往是严重倾斜,和偶尔遵循幂律22),但总是有限,导致流行阈值的恢复,但在均匀混合的数量比预期的要低得多(88年]。

度分布提供了非常有用的信息不相关的网络产生的此类配置模型。然而,真正的网络一般与尊重程度;也就是说,找到一个节点的概率给定的程度, 依赖的程度,该节点的邻居, 被条件概率 。描述这种行为,提出了几种测量。最直接的,可能最有用的指标,是考虑的邻居节点的平均度 度的总和在哪里做的邻居(nbr) 。一个可以计算的平均值 在所有节点上的程度 这是一个直接衡量的条件概率 ,因为 增加而 据说,网络选型的程度;即高度节点倾向于链接到其他高度节点,一个行为经常观察到社交网络。其他类型的网络,如互联网路由器水平,显示相反的行为;也就是高度倾向于连接到节点的节点度较低(63年,89年]。

描述程度相关性对理解疾病传播很重要。经典的例子是强相关性的存在性网络被证明是一个关键因素在理解艾滋病传播(90年]。最近,意味着领域解决方案的SIS模型网络表明流行病的速度和程度都是依赖于衬底网络的关联模式(91年,92年]。

3.3。距离

在一个网络中,最短路径两个节点之间 是路径需要达到最小数量的步骤 之后,在网络边缘。可能有(通常是)不止一个一对节点之间的最短路径。任何一对节点之间的距离 达到所需最小数量的步骤吗 ,也就是说,在最短路径的步骤。平均距离, 的意思是所有成对的节点之间的距离和措施的典型节点之间的距离 在哪里 是网络中节点的数量。网络被定义为最大直径的一对节点之间的最短路径距离网络,max ( ),该措施最极端的网络中任意两个节点的分离。

描述网络的步骤的数量需要达到任意节点与其他也很重要。真正的网络经常显示小世界属性;也就是说,绝大多数的节点可以在一个小数量的步骤。这清晰的对疾病传播的影响和控制。渗流方法表明小世界现象可以深刻的影响93年]。如果只需要一个短的步数达到每个人人群中,疾病传播快得多。

最短的距离的概念通过网络可以用来量化如何在网络中心给定节点。许多措施已经使用(94年),但这些是最相关的中间状态中心。中间性捕获的想法通过节点最短路径越多,越中央的网络。所以,中间性只是定义为比例通过单个节点的最短路径 在哪里 是网络中节点的数量和分母量化网络中最短路径的总数。在疾病传播方面,识别具有很高的中间性的节点将是很重要的。中央节点容易被感染早期的流行,也是关键的干预目标(3]。

3.4。聚类

一个重要的例子可见属性的任何网络聚类系数, 的测量当地的密度的图。在社交网络方面,这种量化的可能性的朋友你的朋友也是你的朋友。它被定义为节点的概率两个邻国也将邻居彼此,可以表示如下: 一个连接的三倍意味着一个节点与边的一对。 测量三元组的分数也构成一个三角形的一部分。三因素占每个三角形的事实中发现三个三元组和保证 (和它包含取决于网络中三角形的计算方式)。

在当地,每个节点的聚类系数, 的分数,可以定义为通过的直接邻居三角形组成 (74年] 网络的聚类特性对传播过程的理解至关重要。在集群网络,快速的地方消耗易感个体在传播的动力学中扮演一个极为重要的角色(95年,96年];更分析治疗,看到部分4.2在下面。

3.5。子图

度和聚类描述网络结构的某些方面在个体水平。考虑节点之间的距离提供了有关全球组织网络的信息。中间尺度上也存在,以及描述这些可以帮助我们理解网络结构,因此扩散的动力学。

在最简单的层面上,网络可以被认为是组成的子图的集合。最简单的子图,集团,被定义为一群超过两个节点,所有的节点相互连接的两个方向的边缘。换句话说,一个集团是一个完全连接的子图,用最小的例子是一个三角形。这是一个强烈的定义和一个只有数量有限的情况下,完成最著名的家庭(见图1 (d),部分4.2和房子,倾覆70年])。n-cliques放松上述约束,同时保留其基本前提。中所有节点之间的最短路径集团就是其中之一。使这个距离采取更高的价值,一个到达的定义n-cliques被定义为一个图的子组包含两个以上节点的最大最短路径组中任意两个节点之间的距离 。多年来,许多变异的这些基本思想已经正式社会网络文学和良好的总结中可以找到瓦瑟曼和浮士德94年]。

考虑高阶结构可以很丰富但更多的参与。米洛和同事开始寻找特定模式之间的连接节点在小的子图,称为图案。给定一个连通子图的大小,例如,有13个可能的主题。统计上,其中一些经常出现在某些真正的和发现的过多网络与随机网络相比(97年]。理解的主题组成一个复杂的网络被证明提高确定性模型的预测能力传播主题时显式地建模(见部分4.2和房子等。98年])。

在上面的定义中,只定义了子图引用本身。另一个方法是比较的数量内部边缘的外部边缘,起源于一个直观的概念社区将密度比周围的边缘。一个这样的定义,定义的社区强大的意义上,被定义为子图中,每个节点拥有更多的边缘子图内的其他节点比任何网络中其他节点。这个定义非常严格,为了放松这些限制,最常用的和最直观的定义社区组织的节点有一个高密度的边缘和一个低密度之间的边缘群体。这个直观的定义是最广泛使用的方法在网络学习社区结构。纽曼和Girvan正式的模块化测量 (99年]。给定一个特定的网络划分为社区,模块化测量比较预期的边数社区内边缘社区内的实际数量。

尽管社区的影响在传输过程中没有被充分研究,一些研究表明,它能对疾病有一个深远的影响动力学(One hundred.,101年]。另一种的“结实的”图,名叫电导(102年),最广泛使用的计算机科学文献中也被发现是重要的网络(103年]。

3.6。高维网络

上面的定义都集中在网络边缘随时间保持不变,所有边都相等的重量。这两种约束自然可以放松,但是一般来说,这需要一个高维描述网络内的边缘。这是一种常见的经验,社会互动从而导致感染做改变,一些联系人经常被重复,而另一些则更多的零星的。的频率、强度和持续时间的联系人都是时变的。如何表示这些固有的动态网络的建模可以对模型结果产生重大影响55,104年]。然而,捕捉这样的动态网络结构的一个简洁的方式仍然是一个重大的挑战。加权网络更多的工作已经完成,这是一个更直接的扩展的古典presence-absence网络(105年,106年]。在疾病传播方面,移动网络中讨论部分2.4通常认为是加权(37,40,107年]。

在下面几节中,我们将讨论如何将这些网络属性可以推断统计和改善我们的理解的感染的传播网络。

4所示。模型公式

4.1。仿真技术

的关键优势之一疾病过程的模拟网络,它使系统过于复杂的研究分析方法容易处理。考虑到这一点,值得简要地考虑高效的方法来模拟疾病网络。

有两种主要类型的仿真模型对传染病网络:离散和连续时间模型;其中,离散模拟更常见,所以我们首先讨论它们。离散仿真,在每一个时间步,疾病可能会沿着每条边从传染病传播节点易感节点与一个特定的概率(可能是相同的所有现存的边也可能根据不同属性的两个节点或边缘)。此外,节点可能会恢复(成为免疫,或恢复到敏感)在每个时间步。在一个时间步,假定每个感染和恢复事件同时发生。在动态网络仿真、网络通常是每次更新一步的例子中,在一个牲畜移动网络,在时间步 、感染传播边缘,仅可能发生在时间步 。很明显,在一个有向网络,感染可能只发送一条边的方向。

同时算法离散模拟并不复杂,一些简单的实现技术(流行病学的观察,大多数网络带来的利益是稀疏)可以显著提高软件性能。在一个有向网络 节点,有 可能的边缘;在一个稀疏网络平均节点度 ,有 边缘。因此,而不是作为一个代表网络 通过 数组,每个数组中的元素是0,如果不在,非零否则,它通常是更有效的保持每个节点的邻居列表。然后,如果感染节点的列表保持在模拟运行期间,它是简单的考虑每个受感染的易感的邻居节点,节点的测试如果感染传播。此外,快速高质量的伪随机数生成器应该使用如梅森素数捻线机(108年]。“传染”软件包实现这些技术和其他),是免费的109年]。

模拟网络上疾病进程的替代方法是模拟一系列随机马尔可夫过程的事件连续时间的方法。从本质上说,考虑到系统的状态,可以计算时可能的后续事件的概率分布(即。,复苏的传染性节点或感染的易感节点)。然后随机从这些分布,以确定哪些事件发生时,系统的状态更新,这一过程重复进行。这种方法是由Gillespie研究化学反应的动力学110年];然而,计算量,所以近似已经开发出来。的 飞跃法(111年),允许多个事件发生在一个时间周期 ,显然是与上面讨论的离散时间制定。然而,允许的能力 改变在模拟账户的过程(112年有潜在的好处。

连续时间的方法显然是更紧密的协议与标准的疾病模型的理想;然而,利用这种方法可以计算禁止尤其是大型网络。离散时间模型可以提供一个可行的选择三个主要原因。首先,随着时间离散时间模型所涉及的步骤变得足够小,我们希望这两个模型收敛。其次,由于离散时间不准确的制定可能会大幅减少网络模型相比,random-mixing模型,提供两个事件不发生在同一地区在同一时间步。最后,接触的日常周期调节我们的大部分生活意味着使用时间不到24小时的步骤可能错误地代表了时间的准确性,可以归因于任何模拟现实世界。

4.2。分析方法

在本节中,我们用“分析”这个词,意味着直接数值可积模型,不使用蒙特卡罗模拟方法,而不是系统的所有结果都可以写在基本功能方面,很少有流行病学。分析方法的传播感染网络分为三大类。首先,有方法计算精确阈值和最终尺寸特殊网络入侵。其次,有准确的瞬态动力学计算方法,包括流行峰的高度和时间,但是,这些只有在特殊的网络。最后,有方法基于时刻关闭大约给正确的动态类广泛的网络。

在考虑这些方法网络之前,值得考虑是什么意思nonnetwork混合和显示明确如何推导出标准的传输从熟悉的微分方程模型。Nonnetwork混合可以有两种含义:要么是每个个体的人口是弱连接到其他(平均场假设),或者一个Erdos-Renyi随机图定义了传输网络,取决于上下文。看看这个决定了传染病动力学,我们考虑一个人口 个人,有均匀的独立概率的 ,任何两个人在网络上有关,这使每个人平均数量的边缘 。然后,我们假设感染整个边缘的传输速度 而传染性的人口比例 ;然后,经历的力量感染易感人群中平均 。的数量 因此,定义了一个全民传播率,可以解释两种方式中的一种 。的情况下的人口被认为是完全连接,限制 是统一举行,所以 被降低了 增加持有 常数。人口的情况下连接在一个随机图, 是减少了 增加持有 常数。

在这两种情况下,定义一个合适的群体传输速度,传播的随机susceptible-infectious模型通过马尔可夫链的定义是,一个人口 受到个人和 传染性个人转换随机人口 受到个人和 传染性个人在速度 。然后,这样的一个系统的确切意思是行为的限制 然后有其传播行为了 在哪里 , 分别是个人敏感和传染性的比例。背后的数学形式主义产生这样的常微分方程从马尔可夫链是由库尔特113年],应用这种方法的摘要传染病模型中给出了克曼和Heesterbeek [114年]。然而,它应该清楚,(8)熟悉所有random-mixing流行病学模型的基础。

在指数分布的情况下感染期和恢复从感染提供持久的免疫力,标准先生方程提供了一个精确的描述意味着这个系统的行为。然而,减弱免疫的存在,个体之间的潜伏期感染和传播感染,和非指数的分布式恢复时期流行病学应用也很重要(10,42,115年]。这通常可以被纳入分析方法通过添加额外的疾病隔间,需要额外的代数和计算工作,但通常不需要基本概念的重新评价。有时,重要的额外的复杂性甚至不修改定量流行病学结果的例子,无论免疫力减弱,潜伏期的长度,或传染性周期分布,如果意思是传染期 ,那么基本生殖比率 这个数量的估计对于复杂疾病的历史,从数据可能是可用的,被认为是由沃利咖和Lipsitch [116年]。因此,我们专注于传播过程,因为这是最受网络结构,和其他元素的生物现实主义通常表现在个体层面。一个重要的警告,但是,当一个受感染的个人的传播能力水平不同的感染期,这之间建立相关性传输和恢复的过程,给分析工作带来一个特别的挑战,尤其是在结构化的人群,例如球et al。[注意到的117年]。

4.2.1。准备确切的入侵

nonnetwork混合,入侵的门槛是由基本繁殖率 ,定义为预期的二次感染病例主要由平均感染情况否则完全易感人群。在结构化种群,这种语言的定义通常是改变是次要的情况下由一个典型的主要案件一旦动力系统进入其早期渐近行为。因此,入侵的门槛 :对于超过这个值,感染可以生长在人口和疾病能够成功入侵;感染的价值低于它,每个链最终注定要灭绝。的值 可以直接测量过程中流行病详细追踪接触者;然而,有相当大的统计问题审查和数据质量。

没有短的封闭循环提供了网络, 可以通过定义下一代矩阵 在哪里 定义了患者的病例数 从个体与联系 联系人在疫情的早期阶段。在这里和其他地方在这一节中,我们使用方括号代表不同类型的数据在网络上;因此, 患者的数量吗 网络和边缘 是人与人之间的边的数量 分别联系。此外, 感染的概率是最终通过一对susceptible-infectious之间的边缘(马尔可夫过程的回收率 和传输速率 这是由 )。基本繁殖率是由下一代的主导特征值矩阵 这个量对应的标准语言定义基本繁殖率,和相应的入侵阈值

一旦一个可观数量的短封闭循环出现在网络,有时还可以定义精确的阈值参数,但这些通常离开标准语言的定义 。例如,球等。117年考虑一个分支过程在派系(家庭)彼此连接通过配置模型edges-cliques随机相互连接(图1 (d))。通过考虑次要派系集团感染的数量与一个最初被感染的个体,一个阈值 可以定义。(家庭,每个家庭的配置模型是相同的大小和每个人都有相同数量的随机连接在家庭之外,阈值 (后面给出了20.);然而,更一般的方法)。最近的入侵阈值的计算定义三角配置模型(118年,119年)涉及计算预期的二次感染的个体数量和三角形而不仅仅是在个人层面上。Trapman [120年)处理这些类型的结果如何与更普遍的网络边界。集群网络的一般特性的精确阈值已经衍生到目前为止是local-global区别在传播途径,这给球的一般理论和尼尔121年),一个“重叠组”和“大圈”模型也进行了分析。然而,还需要小心阈值参数的数学表现好,容易计算(e。g (122年])。

4.2.2。最终的尺寸

最复杂的和通用的方法获得准确结果的预期的最终大小主要爆发在网络被称为磁化率设置参数和最一般的版本目前由球等。117年]。我们举例说明这些参数从Diekmann et al。123年),考虑简单的情况,每个人都有一个网络 联系人。哪里有一个概率 感染通过在一个给定的网络链接(对于传输和恢复速度 分别地, 的概率),是由个体避免感染 在这里,一个两步的过程是必要的,因为在一个未聚集,正则图两代人的感染需要稳定网络的相关性和辅助变量 还必须解决。一旦这个和 众所周知,预期的攻击速度是什么

4.2.3。近似的最终尺寸

计算近似最终大小的主要方式是由percolation-based方法。综述了这些由邦萨尔et al。124年)和(125年]。假设我们删除一个分数 从网络的链接,可以获得分数的表达式节点剩余的巨人网络的组件, 。然后, 和入侵阈值的值 这最后的大小成为非零的热力学限制非常大的网络规模。这种方法不是完全用于集群图,但是等未聚集的图形精确的结果(12)复制。

4.2.4。精确的动力学

最早的一些传染病工作涉及主方程的精确解的概率(人口在每个可能的配置计算)在小,完全连接图,总结在贝利126年]。的系统的主方程的复杂性迅速增长意味着这些方程变得过于复杂的最一般的网络集成。网络中对称性的存在,然而,意味着automorphism-driven将是一种操纵主方程(同时保留完整的随机信息系统)的解决方案(127年]。目前,这种技术只适用于相对简单的网络;然而,没有其他高度通用的方法推导的低维系统方程从主方程。

然而,其他具体路线确实存在,允许精确的系统方程维数较低的特殊网络派生而来。为静态网络构造使用配置模型(个人异构程度随机但连接这样短的循环可以忽略的存在在一个大型网络,见图1 (c)),一个精确的方程组先生动力学在大型网络规模的限制提供的球和尼尔69年]。这个建筑包括将每个节点一个“有效的程度”,开始流行的实际程度,和连接仍然可用的感染途径和措施,因此,减少了传输和恢复。本文使用符号符合其他地区(包括和忽视全球感染方面的球和同事)这个收益率相对简洁的一组方程 在这里, , 有效度的比例吗 分别易感个体和传染性。因此,对于一个configuration-network最大程度在哪里 ,我们需要 获取准确的动力学方程。

可以使用表达式如(派生11早期增长率),计算渐近 需要系统的常微分方程(14)。如果我们假设传输和恢复与利率的马尔可夫链的过程 分别两个早期行为的措施 在哪里 告知关于平均度分布。这些数量告诉我们,网络容易入侵的增加与程度分布的均值和方差。这对risk-structured密切遥相呼应。结果模型(10),但与一个额外项−1由于网络,代表这一事实的路线个体获得感染封闭未来传播事件。

更加结构化网络local-global区别,有两个精确的动态也可以派生的限制。如果网络组成 社区的大小 混合,不同社区(全球)由一个泊松过程速率决定 混合和within-community(本地)由一个泊松过程速率 ,然后在限制社区变得很大, ,系统上的流行动态 在哪里 在社区个体易感和传染性的比例 , 因此,我们有一个经典metapopulation模型(43),定义泊松的地方和全球联系和大型社区大小。

在极限情况下, ——有无限多的社区同等大小和每个社区的形式完全互联集团——“自洽方程如戈沙尔et al。128年和房子,倾覆70年是恰当的。这些方程演化派系的比例 易感人群, 感染, ,以及人群中感染的比例, ,如下所示: 在哪里

这两个两个local-global模型,metapopulation模型(16)和小派系模型(18),合理的数值,对现代计算资源提供了相关有限( 、职责)并不是太大。基本的繁殖数量显然是第一系统 第二,家庭模式,是由入侵 在哪里 流行的是预期的最终大小规模的家庭吗 有一个最初的感染。当然,真正的网络内,不同社区混合可能是更复杂的比可能被一个泊松过程,但这两个极端之间可以提供有用的见解。这些模型表明,网络的结构形式的社区减少潜在的传染病传播,因此,需要更大的传播率的疾病超过入侵阈值。

4.2.5。近似动力学

虽然上面所有的结果是一个重要的指南的直觉,他们只拥有非常专业的网络。存在一个大型的模型,形成了“平均场”模型和模拟之间的桥梁使用空间或网络时刻关闭方程。这些都是高度通用的模型。一般来说,入侵阈值和最终的大小可以严格计算,但瞬态动力学的精确计算只是可能非常特殊的网络。如果想计算瞬态效应一般网络models-most重要的是峰值高度和下,然后关闭时刻真的是唯一的方法计算所需数量的不依赖完整的数值模拟。

同样值得注意的是,有许多结果派生通过这些“近似”的方法,是一样的精确结果或数值的精确结果和仿真。下面我们举些例子,也注意动力PGF方法(129年)是数值的精确模型(14)对某些参数值(130年]。目前缺少的是一个严格的数学证明的精确ODE模型以外的其他部分中概述4.2.4以上。而对于许多实际用途没有这样的证据并不重要,我们保留的概念区分的结果证明地准确,和那些数值准确的在所有情况下测试到目前为止。

关闭时刻的想法是首先精确但未结束的时间演化方程的不同单元的结构。在这里,我们表明,这些可以通过考虑利率变化的两种类型的个体和类型的连接。这样成对时刻关闭模型自然延伸到标准(random-mixing)模型,考虑到感染之间传递对感染者 在这里,我们使用方括号来表示网络中不同种类的流行。我们也使用了一些非标准的符号呈现几个不同的方法在一个统一的框架:普遍指数 , 代表一个节点的任何属性(如学位),而箭头表示感染的方向(所以为一个有向网络的必要性,在适当的方向存在),见下表1

很明显,系统(21)不是封闭的,因为它依赖于连接三元组的数量,因此必须引入某种形式的近似闭合与三元组对和节点,这取决于网络的基本属性。大多数情况下,这些关闭的假设处理节点的异质性程度,assortativity,集群的三角形。例子包括基林(95年)和埃姆斯基林(96年),普遍变量 , 代表节点度以上( 关闭),三是对称的感染的方向,和网络被认为是静态和非指导性。一个通用的方法写假设是关闭 在哪里 再次的平均度分布和 措施的比例三角形三元组作为一种获取集群网络内(见部分3所示。4)。分析了封闭系统的典型方法是直接数值积分;然而,一些分析可以获得牵引力。一个例子是使用使直线化拟设获得早期的动力系统的渐近行为。有趣的是,当这样做是为了 (没有三角循环网络)的埃姆斯和倾覆(96年),早期的渐近增长率的结果同意的确切结果(10)。在[95年),的微分方程 正则图也操纵为最终尺寸同意给一个表达式的结果(12)

方程(22),然而,并不是唯一可能的网络时刻关闭政权:靴子和佐佐木(131年和胃痛132年)认为政权的关闭取决于疾病状态(即。,triples composed of different arrangements of susceptibles and infecteds close differently) to deal with spatial lattice-based systems and early disease invasion respectively. For example Boots and Sasaki [131年使用闭包 在哪里 代表空网站在网络中目前不被个人和参数 占lattice-based中的集群网络。房子和倾覆133年认为是感染传播的模型和接触者追踪网络,关闭方案 三元组是不对称的 这允许数量的自然保护在一个高度集群系统。

工作动力PGF模型(129年)可以被看作是一个优雅的简化成对SIR-type感染有效的方法动态配置模型网络。方程可以新配方 在哪里 度分布的概率生成函数, 对应的联系人数量敏感的敏感或感染,分别 被定义为的概率随机选择的链接从整个网络尚未与感染的传播。在这里,假设是隐式定义的关闭 ;也就是说,一个人只有依然敏感,如果所有的链接没有见过感染的传播,每个链接的概率是独立的,与潜在的假设制定的球和尼尔69年),方程(14)。精确这PGF配方和两两之间的联系方法是在房子更充分地讨论和倾覆134年]。

还有许多其他扩展的通用方法是可能的。写作时间演化的常微分方程三元组和关闭在一个高阶允许不同主题的流行病学后果的考虑结构(98年]。Sharkey et al。135年]认为闭包在三水平定向网络,涉及更复杂的治疗三阶集群由于更大的曲目three-motifs定向(比无向)网络。还可以结合随机和网络时刻关闭(136年]。时变,动态网络,特别适用于性传播感染流行病的伙伴关系不同,使用近似ODE-based模型被认为是由埃姆斯和倾覆(137年),中场和迈耶斯(138年]。Sharkey [139年)考虑模型适合当地网络最短路径的长度,在通用指标 在(21)代表节点数 而不是节点度

另一种方法是近似标准(平均场)的传播动力学微分方程模型。从本质上讲,这是一种时刻关闭双层面的,而不是三元组。例如,在罗伊和帕斯卡140年传输速率将多项式形式 指数, 通常安装在模拟数据,但被认为捕获易感,感染节点的空间排列。同时,吻et al。141年)建议 作为一种会计为每个感染“失去”传染性母公司的边缘。

最后,一个最近的研究(142年)提出了一种动力系统捕捉流行动态三角配置模型网络;这和其他歌唱方法之间的关系可能是一个活跃的主题为未来的工作。

这种多样性的方法会导致一些重要点方法基于闭包。这些方法非常一般,可以应用于考虑网络结构的几乎所有方面或疾病自然历史;他们不可以应用于人口目前适合直接仿真由于其尺寸,他们不需要一个完整的网络只运行特定的统计特性的描述。然而,目前没有通用的方法适当的建议关闭政权也不限制的任何派生动力偏差引入闭包。因此,关闭方法坐介于两者之间确切的结果高度专业化的各类网络和随机模拟,直观的了解和综合分析更加困难。

4.3。比较分析与仿真模型

在报纸上介绍,上述differential-equation-based近似动力系统比较合适的网络随机模拟。最新的两篇论文做一个比较不同的动力系统与模拟邦萨尔et al。124年)和林奎斯特et al。130年]。然而,有几个问题,试图比较确定性模型和仿真也彼此。

首先,有必要定义是什么意思协议顺利,确定性流行曲线和仿真产生的粗糙的轨迹。限制结果的准确性不同的ODE模型假设两个人传染性和网络规模的数量很大,所以早期的行为模拟,当很少有传染性的个人,通常是由随机效应。有不同的方法来解决这个问题,但是即使这已经完成,有两个来源的模拟偏差确定的极限。第一个是模拟实现的数量。如果有一个汇总统计的平均数等传染性个人随着时间的推移,然后在这样一个置信区间统计可以任意小通过运行额外的模拟,但协议确定的限制和给定的认识可能仍然是穷人。偏差的第二个来源是网络的大小。通过增加节点的数量,感染曲线的预测区间将下降可以任意小;然而,所需的计算资源来模拟极大型网络可以迅速成为压倒性的。

更普遍的是,每一个近似模型是设计时考虑到不同的应用程序。模型表现良好在在另一个上下文往往会表现不佳,这意味着“性能”一个给定的模型与仿真的协议将主要由离散模拟执行的网络系统。

上述考虑激励的例子比较模拟显示在图3。这个集合的阴谋的目的是展示各种不同的网络,和动力系统旨在捕捉他们的行为。

在数据3(一个)- - - - - -3 (e),连续时间模拟有其起源时间转移,这样他们达成一致的时间累积发病率为200,然后在均值置信区间的感染是通过引导。95%置信区间显示为红色阴影区域(虽然通常情况下,这是十分狭窄的它就像一条线)。六种不同的确定性模型模拟的比较:HomPW倾覆的成对模型(95年集群)为零,HetPW是埃姆斯和倾覆的异构成对模型96年),ClustPW改善集群成对关闭房子和倾覆133年],PGF是中场的模型[129年Sharkey), Pair-based的模型(139年Sharkey),综合使用辅助代码(143年),mba是Pastor-Satorras的模型和Vespignani [87年]。

3(一个)显示了两个风险组,组成的异构网络构造根据配置模型(18]。在这种情况下,模型将异质性HetPW和PGF(数值难以在这种情况下,数人)与模拟非常接近达成协议,而只是把HomPW的平均程度是一个好的选择。在图3 (b),assortativity添加到两组模型方法后纽曼(89年],HetPW优于PGF。数据3 (c)3 (d)每个节点显示与四正则图的链接,但同时图3 (c)是静态的图3 (d)的制作和打破链接流行过程要快得多。模型HomPW和PGF因此更好的为前和mba模型更好的委员会还表示,现实网络速度的比值变化的速度传达可能不是事业大或小,所以更复杂的方法可能是最好的137年,138年]。图3 (e)显示了一个图有四个链接每个节点在集群已经被重新布线的方法介绍了邦萨尔et al。144年)有时被称为“大V”(133年]。在这种情况下,显然比HomPW和PGF ClustPW性能更好,但峰值周围地区的患病率有显著的准确,所以这个模型捕获定性的影响集群没有似乎是完全精确的网络。最后,图3 (f)考虑的情况下一维next-nearest-neighbour晶格(所以有四个链接每节点)。这介绍了长路径长度节点之间除了集群,这意味着系统不收敛到一段时间的渐近增长和早期实现。作为一个密度图所示,而不是一个置信区间。ClustPW占集群而不是长路径长度和协议仿真欠佳而pair-based曲线捕获的定性行为流行病晶格而被定量合理的近似。

5。推理网络

为了预测流行病模型依赖于参数的有效值控制疫情动态,有条件的人口结构。然而,获取这些参数是复杂的事实,即使知道底层网络结构接触,感染事件被检测到审查是只有当疾病的症状或实验室测试,变得明显。在试图克服这个困难,参数估计通常是通过做出强烈的假设的传染期或与不确定性通过特别的方法。测量的不确定性这些估计获得估计本身一样重要在提供一个诚实的风险预测。鉴于这些困难,流行过程的推理可能已经收到很少注意相比,其仿真。

联系网络数据人口的存在提供了一个独特的机会来估计各种疾病传播模式的重要性从疾病发病率或接触者追踪数据。例如,鉴于知识两个个体之间的接触率,可以推断出接触导致感染的概率。如果仅仅是连接(即数据。,a 1 if the individuals are connected and 0 otherwise) is available, then it is still possible to infer a rate of infection between connected individuals. Thus, the detail of the inference is determined to a large extent by the available detail in the network data [145年]。

5.1。可用性的数据

流行病模型定义的感染状态之间的转换,例如一个进程从易感,感染,(即删除。与终身免疫,恢复或死)所谓的“先生”模型。统计推断需要首先观察疾病的过程是:至少,这包括侦查破案的时候,记住的是,感染时间总是审查(你只知道你感冒了几天之后你抓住它)。此外,协变量数据的个人提供了人口结构,开始启用统计学家来表述个人关系的重要性的疾病传播。因此,任何协变量数据,然而轻微,实际上意味着疾病传播的网络结构可以叠加。

只要数量相对较小(例如,农场的牲畜疾病的人群分析),它是常见的操作模式在个体层面,提供详细信息的情况下检测时间,甚至流行病学重要历史事件联系信息(146年- - - - - -148年]。在其他人群,然而,这些详细的数据可能不是由于实践和道德原因。相反,数据被提供在一个聚合的空间和/或时间的基础上。对推理的目的,因此,这可以被视为一个家庭模型,构成家庭领域。

在异构的人口,流行病的行为在任何特定的位置是由感染和易感个体之间的关系。推理的流行病的早期阶段,重要的是量化不确定性的数量在底层接触网络的早期发展流行是当地subexponential由于损耗的易感人群。与此形成鲜明对照的指数增长中观察到大量均匀混合人口(10]。当网络是已知的和个人的细节感染,接触者追踪数据可以用来推断网络;这些数据也可以用于推断流行的参数(116年,149年]。相反,如果网络是完全未知的,流行的将是有用的估计参数和参数指定网络的结构是可能的。这是一个困难的问题,因为观察流行包含底层网络的信息非常有限,因为证明了布里顿和奥尼尔150年]。然而,随着适当的假设,可以获得一些结果;现有的有限部分中描述的工作在这一领域5.3.1下面虽然显然值得进一步研究的问题。

5.1.1。推理齐次模型

齐次模型基本的繁殖数量,或 ,有几种等价定义和可以定义的传输速率 和删除率 。对于非齐次模型,定义并不相同;看到例如[122年]。

虽然推理 对于真实的应用程序是很困难的(见下文),事实证明,使推理吗 (的函数 )是更简单。霍夫曼et al。151年总结评估的各种方法 从流行病学数据基于地方病平衡点,平均年龄在感染,疫情最终大小和固有增长率(114年,152年,153年]。然而,这些方法都依赖于观察一个完整的流行,因此实时分析疫情期间,我们必须强大的假设有关的数量目前未被发现感染。推理的一个例子 基于完整的流行病数据是由斯蒂et al。154年),2003年爆发的数据高致病性禽流感H7N7安装到chain-binomial模型使用一个广义线性模型。

显然,完全或几乎完全流行病数据是罕见的,因此需要执行推理基于局部观察。这特别适用于实时估计 。例如,Cauchemez et al。155年]试图估计 实时统计模型,通过构造一个离散时间背景产生的继发病例数每个主要情况。这是基于沃利咖和Teunis[的方法156年)制定的似然函数推断谁感染症状出现日期的 在哪里 的概率密度函数是世代间隔 ,即传播者之间的时间 的时间和infectee感染 的感染。当然,感染时间从来没有在实践中观察到的症状出现时间作为一个代理,与假设的分布感染症状出现时间时间为每一个人都是一样的。贝叶斯方法是用来推断“晚”案件从已知的“早发性”情况下,当然大不确定性仍当推断生殖比率接近当前时间存在很大不确定性的情况下检测到在不久的将来。此外,一个模型 必须选择(见[157年])。

简单的估算的权衡 然而,在这些方面,尽管人口宽 给出了一个衡量是否控制在大规模流行病,它没有给出任何提示区域级,甚至是个体层面的风险。此外,上面的两个例子引用甚至不尝试包括人口异质性进他们的模型虽然要求包含很难确定没有模型的诊断结果。这是假设,因此,一个简单的衡量 虽然简单的获得,是不够为了战术控制策略决策。在这些情况下,传输速率和去除率的知识是必需的。

5.2。推理对家庭模式

推理家庭模型相比发达为其他“网络”模型推理。从本质上说,这是三个主要原因:首先,这是一个合理的初始近似假设感染发生在家里或在人口从一个随机源。其次,整个家庭可以流行病后血清样本,这样情况下的分布可以确定在给定大小的家庭。最后,它通常是一个合理的近似后感染引入家庭,within-household流行将灭绝之前任何进一步introductions-which大大简化了数学。

第一个方法提出了这样的推论是最大似然程序基于chain-binomial模型,如Reed-Frost模型,或随机Kermack-McKendrick模型的制定考虑巴特利特(158年]。这些早期的方法总结了贝利(126年]。他们,大部分家庭推理方法提出了到目前为止,使用最终尺寸数据,可以方便地从家庭获得血清学结果。一个简化的假设来促进推理在大多数方法是流行在各种家庭独立发展(例如,看到贝克的鞅方法(159年),这需要时间的潜伏期是实质性的实际实现)。

此外,固定的概率 ,对应于一个易感个体逃离社区获得性感染流行期间,感染暴露在一个受感染的家庭成员,分别,最初认为160年]。两个重要的、现实的扩展这个框架是将不同级别的风险因素为个人(161年和介绍的依赖关系 在一个传染性的时期(162年]。后者包含被吸引的结果使球等。163年]。这些类型的方法主要是基于能力生成闭型公式的最终大小分布模型。

进一步放松假设一直主要由于使用马尔可夫链蒙特卡罗(密度)方法作为第一考虑奥尼尔et al。162年]因为家庭模型在早期研究吉布森和Renshaw [164年和奥尼尔和罗伯茨165年)关注单身,大暴发。这种方法已被用于结合模拟和数据扩增方法裁缝推理方法感兴趣的特定数据集;例如,尼尔和罗伯茨(166年)考虑模型与家庭之间的距离的空间组成部分和数据包含日期皮疹的症状和外观和细节也导致越来越多的小说推理方法,例如克兰西和奥尼尔(167年考虑一个拒绝抽样程序和Cauchemez et al。168年)引入约束模拟方法。更大的现实主义可以被捕获在家庭模型,考虑到不同的家庭和成分,因此,家庭内接触的加权性质。例如,Cauchemez et al。169年]认为家庭Epigrippe数据研究1999 - 2000年的流感在法国,表明孩子扮演一个关键的角色在流感的传播和感染的风险进入家庭。

虽然新发展正在以越来越快的速度出现,大部分方法都是基于最终尺寸数据和开发先生疾病模型,也许部分原因是参数的简化推导最终大小分布。从这些分析的一个关键,但仍然没有答案的问题的家庭流行是家庭中的任何两个人之间的传输速度尺度与个人家庭的总数(比较Longini和•库普曼(160年)和Cauchemez et al。169年])。直觉认为在较大的家庭混合任何两个人之间却降低了,但这个比例的精确形式仍不清楚,和更多的数据需要在大型家庭大小提供一个明确的答案。

5.2.1。推理完全不同种类的人群

也许在流行病统计推断的圣杯是利用一个个体层面的模型来描述异构数量限制的粒度。在这方面,贝叶斯推理获得随机机械模型使用模型可能显示最承诺,允许推理在传输参数和使用数据增加估计传染期。

分析1861年麻疹爆发Hagelloch尼尔和罗伯茨(166年)演示了使用获得可逆跳转模型算法来推断和传染性疾病传播参数,同时另外允许正式之间比较几个嵌套模型。与不确定性模型的选择,这样的方法是至关重要的,使准确理解和预测。这种方法已经被结合的算法奥尼尔和罗伯茨165年),用于分析疾病暴发禽流感、手足口病等在牲畜数量146年,147年,170年和耐甲氧西林金黄色葡萄球菌医院疫情171年]。

同时代表前沿传染病的推理过程,这些方法是目前计算能力的限制,其算法扩展infectives的数量乘以易感人群的数量。然而,随着计算机技术的发展将以越来越快的速度,和小的近似计算的统计可能获得所需的模型算法,这些技术很可能形成流行推断未来的支柱。

5.3。推理从接触者追踪

在牲畜疾病,标准反应的一部分病例检出率是收集从农民接触者追踪信息。结果数据的联系人列表,已经受感染的农场在规定时间前通知疾病(172年]。疾病控制的地方,这的目的确定感染源和任何假定的易感者,可能是由于接触感染。它已经表明,提供的效率追踪所有接触者寻找疾病的迹象是高;这是一个非常有效的方法减缓流行病的传播,最后包含它。

已经写了很多关于接触者追踪可以用来减少感染和检测的时间间隔(通知)流行期间。然而,这主要集中在理论方面的接触者追踪效率是如何与流行动态和种群结构(见,例如,埃姆斯和倾覆173年]吻et al。174年),克林肯伯格et al。175年])。相比之下,使用接触者追踪数据推断流行病动力学似乎并没有被很好地利用虽然被农业部、渔业和食品现在(Defra)直接推断内核空间的风险在2001年手足口病。这个假定的感染源是正确确定现场调查人员,从而使实证估计的感染的概率距离的函数(148年,176年,177年]。引人注目的是,这显示了高度的相似性内核空间估计基于Diggle的统计技术178年]和Kypraios [179年)不使用接触者追踪信息。然而,Cauchemez et al。155年]这一点不完美的接触者追踪数据的分析需要更复杂的统计方法,尽管他们完全放弃了之前的接触者追踪信息的分析,在中国2003年的非典。然而,最近出版的研究表明承诺在同化不完美接触者追踪数据和病例检出时间大大提高推理,因此仿真技术的预测能力。

5.3.1。推理从分布的家庭网络

定性模拟的结果表明,流行于网络,对于一些参数值,显示功能,区别于齐次模型。主要功能是一个可变长度增长缓慢的阶段,紧随其后的是一个快速增长后的感染率和较慢的下降峰(180年]。然而,在定量方面,通常有非常有限的底层网络的信息和参数往往不识别。当网络的细节不得而知,但对其形成是已知或假定,估计的流行网络本身的参数和参数使用密度技术原则上是可能的。所有的随机模型生成网络部分中描述2.7意识到以上分布的全部或部分 可能的网络。在大多数情况下,这种分布是不容易处理;获得技术原则上仍有可能但实际上会太慢没有精心设计的算法。

然而,随着适当的假设可以获得一些结果,提供一些了解更多可以实现。当网络成为Erdos-Renyi图与未知参数 和流行是一个马尔可夫链的先生,布里顿和奥尼尔150年]显示,可以估计参数,尽管他们突出了无处不在的挑战理清流行病学网络参数。密度算法改善了Neal和罗伯茨(181年)和扩展从爵士到西珥开发了Groendyke et al。182年]。然而,网络的扩展,更现实的家庭仍然是一个具有挑战性的问题,无疑会成为令人兴奋的未来研究的主题。

6。讨论

网络的使用显然是流行病学的一个快速增长的领域。通过评估和量化的潜在人群中不同个体之间的传播途径,研究人员都能够更好地理解观察到感染的分布以及创造更好的未来流行的预测模型。我们展示了多少常用接触网络的结构特点可以量化和越来越理解这些特性如何影响感染的传播。然而,各种各样的挑战依然存在。

6.1。开放式的问题

几个开放问题依然存在是否继续影响预测流行病学网络。其中多数源于困难获得现实的一系列病原体的传播网络。虽然有些工作已经完成,并阐明的互连结构的性接触性传播网络(因此),这些仍然相对小规模的人口规模相比,遭受一系列潜在的偏见。确定机载感染类似的网络是一个更大的挑战由于更少的精确定义一个潜在的联系。

一个实际的问题是是否可以开发新技术允许接触网络远程进行评估。接近伐木工,比如那些用Hamede和他的同事们(12),提供了一个潜在的大道虽然需要技术成为足够强大,便携式和廉价,很大比例的人口可以说服携带一个。对许多人类,使用手机(可以探测到对方通过蓝牙)足够广泛,有可能使用它们来收集网络information-although足够通用软件开发带来的挑战不应被低估。虽然这些远程感知网络将提供无与伦比的信息,可以用最小的努力,获得仍有一些不确定性的本质联系。

现在有一个不断增长的diary-based集研究试图记录大量的个人的个人联系;其中,POLYMOD是目前最全面的17]。尽管这样自我中心的数据显然提供广泛的个人信息的行为,由于匿名的调查尚不清楚如何改变应该连接在一起。随机连接half-links的配置方法提供了一个潜在的解决方案,但理想情况下需要的是一个更全面的方法,将允许集群、空间局部连接和assortativity程度分布包含与指定。

与渴望现实的联系网络整个人口,来描述这种网络的需要在一个相对简洁的方式提供了重要的见解流行病动力学的类型,可能是意识到。这样的描述将允许不同的网络(从不同时间或不同位置)比较的方式是流行病学重要和将允许人工网络创建匹配特定的已知的网络特性。这显然依赖于现有的网络结构措施(如部分中概述3)和一个健壮的理解这些特性如何影响瞬态的流行动态(如部分中概述4.2)。然而,这样的一个通用的理解所有的网络特性不太可能出现很多年了。一个更直接的挑战是了解当地的网络结构的方法(集群、派系和空间局部连接)流行病动力学的影响。

迄今为止绝大多数的工作在疾病传播网络集中在静态网络,所有的链接都平等的力量,因此,与相同的基本传输速率有关。然而,很明显,接触网络随时间变化(在我们的短期规模满足每一天,和长时间尺度上的我们的主要工作和社会交往),和连接不同的权重(这样一些接触更有可能导致感染的传播比其他人)。而感染等时变加权网络的模拟是可行的,目前尚不清楚如何现有的网络属性的现有文献分析方法可以扩展到高维网络。

任何方法有任何实质性的使用,是非常重要的建立一个有效的数据收集协议和统计技术来分析它。在这里,三个问题可能是最关键的。首先,数据采集资源总是有限的。因此,精心设计的随机抽样模式应该用来最大化的力量所使用的统计技术来分析数据,而不必回复数据增强技术来解决在临时数据集的问题。这方面尤为重要,当工作在网络数据来源于人口样本。其次,任何推理网络和传染病模型应该备份通过仔细的分析模型。尽管最近流行病学统计方面的进展给我们前所未有的能力来衡量人口/疾病动态基于现成的现场数据,流行病模型诊断目前处于起步阶段比较技术在其他领域的统计数据。因此,预期的增长受欢迎网络模型分析疾病的蔓延,许多研究工作需要等设计方法。

6.2。结论

我们已经强调,接触网络的研究基本上是重要的流行病学和提供丰富的工具对于理解和预测各种病原体的传播。上面列出,许多挑战仍然存在,但这种高度跨学科领域的兴趣的增长和日益复杂的数学、统计和遥感工具被使用,这些问题很快就会被克服。我们得出结论,因此,现在是一个令人兴奋的时间网络流行病学研究的许多实际困难是克服和应用重要性理论概念转化为结果的感染控制和公共卫生。

确认

这项工作是由英国医学研究理事会(l . Danon m·j·基林m . c . Venon),生物技术和生物科学研究委员会(c·p·朱厄尔·m·j·基林g . o . Roserts),工程和物理科学研究委员会(t .房子,a·福特·m·j·基林),统计方法研究中心资助的工程和物理科学研究委员会(工资)、传染病动力学的研究和政策(RAPIDD)计划的科学技术理事会(m·j·基林),和澳大利亚研究理事会的发现项目资助计划,项目没有。DP110102893 (j . v . Ross)。我们想感谢Kieran夏基使用前置MATLAB代码和两个匿名评论者的评论。所有作者的贡献同样这个手稿。