文摘

理论和数据之间的联系是一个迭代的一个。原则上,每个由其他通知:数据提供的基础理论,进而产生对新信息的需要。这个循环是反映在绑架的概念,这个概念侧重于感应之间的空间(从数据生成理论)和扣除(测试理论与数据)。爱因斯坦,在1920年代,科学创造力的空间。在社交网络领域的分析,一些非凡的理论发展,伴随着成熟的工具来开发、扩展和测试这个理论。同时,重要的经验数据已经生成,提供洞察传播动力学。不幸的是,它们之间的联系往往是脆弱的,磨损的迭代循环。这种情况下可能出现缺陷的数据和从的数据可以由仿真。但不管是什么原因,理论和经验数据通常占据不同的轨道。幸运的是,这种关系,而磨损,不是坏了,最近的一些分析合并理论和现存的数据将证实。 Their further rapprochement in the field of social network analysis could provide the field with a more creative approach to experimentation and inference.

1。介绍

理论和实证数据原则上紧密交织在一起。然而在社会网络分析的实践,似乎有一个脱节:理论和经验主义似乎常常占用单独的轨道,而这些可能很难单独讨论之间的关系。问题的根源可能在于所需要的不同的技能,或者在人类网络数据的集合的实质性障碍。以下的探索之间的距离的理论和经验主义表明和解将相当大的好处。

19世纪中叶美国哲学家查尔斯•皮尔斯杜撰了一个术语“绑架”(也称为“retroduction”)来填补缺口,他认为在香港被归纳和演绎。蒸馏的教授伯奇(1),皮尔斯用三段论解释这个词,用规则,情况下,和结果更熟悉的大前提,小前提和结论。但也许更有趣的流行病学家和社交网络分析师,他有关这一逻辑过程抽样。伯奇教授解释说,一个标准的有效的三段论进展如下。规则:所有的球都是在这个瓮是红色的。情况下:所有的球都是在这个特定的随机样本取自这骨灰盒。结果:因此,所有的球都是在这个特定的随机样本是红色的。

皮尔斯又问如果我们改变订单的推理,通过交换结果和规则。结果:所有的球都是在这个特定的随机样本是红色的。情况下:所有的球都是在这个特定的随机样本取自这骨灰盒。规则:因此,所有球在这个瓮是红色的。

伯奇指出,这不是一个有效的三段论,但皮尔斯的核心概念的归纳。与众不同,它抓住了流行病学的心态是多么的相似。但把它一步远,交换的结果。规则:所有的球都是在这个瓮是红色的。结果:所有的球都是在这个特定的随机样本是红色的。情况下:因此,所有的球都是在这个特定的随机样本取自这骨灰盒。

不是一个有效的构造,但是如果我们用“替代假说”代替“规则”,我们似乎捕获假说的测试,因为它的本质是现在练习2]。伯奇认为,这是归纳和演绎,但一种新的论点,皮尔斯称为绑架。皮尔斯继续使用这三个“-ductions”来描述作为一种科学方法圆形的合成的科学方法。这个过程始于猜想或假设是基于一些观察认为(绑架)。假说可以派生的后果,这些可以进行测试。由此产生的测试观察可以用来证实或反驳的假设,或更普遍的是,得出真理或返回的诱导的过程造成一个新的假设。

波普尔不同意(3]。他降级假设生成过程的心理学和公开声明,他是不感兴趣339页)。相比之下,阿尔伯特·爱因斯坦拥抱它。如亚当所述4),爱因斯坦在1919年写了一个简短的报纸文章,托管的绑架与创造力的过程固有的科学事业。爱因斯坦说:“直觉的理解要点对大型复杂的事实导致研究者构造一个或几个假设的基本定律…他(研究员)不到达系统的思维有条理,归纳方法;相反,他躺(原文如此)通过直观的事实中选择的公理化理论。”

因此,皮尔斯和爱因斯坦之间提供一个直接连接理论,观察,结论和修正。这种观点强调理论和观察是相互依存的,迭代,通过创造力。不幸的是,这种连接(虽然不一定是创造力)似乎已经减毒的应用社会网络分析的疾病传播。

2。理论和经验主义的联系

一些因素阻碍了理论和实证方法之间的紧密联系。首先,阐明社会经济的网络结构的成本和时间,特别是难以接触到的人群,如那些风险最高的可能是艾滋病毒或其他传染病,通常被视为禁止的。第二,实证社会经济的网络确定是不完美的。由于感兴趣的群体的边界是不知道,总是变化和我们了解的方式连接不是标准化的,一些个人或网络节点之间的联系在那些人口总是错过,通常在未知的方式呈现非难和解释问题。第三,没有黄金标准,没有真正的或已知的网络来衡量经验充足。这些担忧都归入网络抽样的一般问题。因为经验确定的网络需要一个可信的抽样程序,最好是一个证明的使用标准的统计理论,观察可能会怀疑。一个结果是一个运动对基于理论的网络仿真中研究者控制采样,知道(实际上创建)的黄金标准,可以测试实施条件的影响。过去十年见证了迅速发展的工作和大量的新的见解的结构、功能,和许多类型的网络的动力学(5,6]。

一个持续的问题,然而,是网络结构相关理论的困难回到一些经验现实。固有的理论偏差抽样的例子。抽样问题不可能有问题,如果一个是有一个可靠的数学基础统计网络推理(7,8]。建模方法演示了从缺失的数据产生的偏见9]。在他的文本,纽曼(10列举了一些偏见:滚雪球抽样发现的人比例特征向量中心(即。,the centrality of their contacts), but the large number of waves required to reach equilibrium may preclude unbiased estimates. Contact tracing suffers from the same problem, with the additional issue of seeking only infected persons, who are a biased sample of the population. Random walk sampling may offer some advantages, since sampling is proportional to degree, and equilibrium can be reached quickly in small groups, but issues of contact recall, unfindable partners, and nonparticipation persist. These assertions are all readily verifiable using mathematical and simulation approaches. There has been little or no empirical validation, however, of many theoretical conclusions that are taken as true. In fact, the assumption of theoretical validity is often so strong that many may find empirical verification unnecessary.

3所示。重新连接理论数据

但如果皮尔斯/爱因斯坦的观点是夺回,伪造理论构造有意义的努力是必要的。如上所述,这样的努力通常不是尝试,也许因为他们的困难,或者因为先天的假设他们的不足。(你不知道如果你有正确的答案,那么,为什么麻烦。)这也许是在皮尔斯第二syllogism-the球在我的随机样本都是红色的,所以那些他们必须red-needs的骨灰盒被调用。虽然逻辑上的缺陷,它集中体现了“归纳问题”以来有关哲学家Hume-it归纳推理的基础,如上所述,驱动流行病学思维方式。提出有力的皮尔斯和Crawford-Brown11),即falsifiability是科学的特点未能认识到“可证伪性“不确定性,可至少那样强烈的感应。此外,这些作者压力至高无上的复制和验证结果(12),以多种方式成熟理论研究的必要性,以及观察的重要性的不断更新和解释是理论的工作。

因此,完成理论验证的循环,我们需要重复演示在现实生活中,理论预言成真。实证检验的理论构造肯定他们的有效性,提供不断改进的参数,提供了一个真正的应用干预措施的依据。在当前社会网络分析领域,看起来,实证研究提供参数理论家,而不是其他。

4所示。一些其他的例子

另一方面,它也是,那些参与描述实时社交网络更侧重于发现和传播影响比的具体验证的理论结构。例如,15经验网络研究中使用的合成研究(13产生了超过100的出版物,但主要集中在测试理论发现。有一些例子,然而,实证试图研究的理论结构。例如,纽曼的断言,随机抽样,在小群体可以快速达到平衡。两个实证观察说话这个问题。首先,在直接测试抽样方法(14),网络确定链条随机漫步(中链中的下一个人是随机选择的联系人当前应答者)或提名(提名的链中的下一个人被申请人从他/她的联系人)是没有区别的。第二,使用相同的网络,网络配置的基本模式是前10的采访(206)(表1),支持模式的概念迅速变得清晰。

比较中心的措施(15),这是证明了不完美的样本数据估计在各种情况下产生稳定的网络。比较的八个类型的中心措施,高一致性[16)被发现在措施确定通过一个复杂的混合抽样方案尽管预期,这些措施会有所不同,因为不同的底层抽样法的关系。

许多研究,观察后,巴斯和他的同事们“无尺度”的网络结构在万维网(17- - - - - -19),试图表明,网络的人艾滋病毒和性传播感染的风险可以通过一个幂律曲线符合2和3之间有一个系数(scale-freeness统计要求)13,20.]。几位严谨的统计分析7,21]的经验数据从10 9统计模型研究发现,所有的测试一直提供最好的适合度分布的研究。此外,最优满足幂律模型预测没有艾滋病毒和性传播感染的流行阈值在美国,一个理论观察真实的状况形成鲜明对比。这个结果(21),通过提供经验证据对提出的理论,体现了上述过程的“循环合成。”

作为最后一个例子,并发性的历史作为艾滋病和性病传播的一个重要特性是有用的。尽管脱节的,尖刻的,之间来回讨论了理论和数据,并提供了两个相互作用的极好例证。并发的角色在非洲首次提出近20年前,都是基于观察(22,23理论问题和模拟]和[24]。全面跟踪(25- - - - - -27),数学发展的一个简单公式计算网络并发性和一个简单的模拟建立并发性传播的重要性。十年过去了,广泛的说法也适用于并发性传播艾滋病毒的压倒一切的重要性在非洲(28,29日),与多个站点的断言,以多种方式进行评估,有大量的并发性的证据。尽管这些说法受到了挑战的经验证据(30.,31日),和挑战竞争(32),长期高并发的模式和详细程度相对较低的分布已经证明至少在一个全面的研究,在马拉维Likoma岛(33]。这种非线性的连锁事件不过说明猜想之间的相互作用的重要性,经验数据和理论发展。下一步,还没有完成,将是一个快速流行传播的理论论证在非洲,合并一个低度高并发性配置和合理参数基于新兴的传播经验信息传染性急性HIV感染(34]。(concurrency-its潜在作用的另一个方面说明了种族差异在感染艾滋病毒在美国州这类型的理论和实证的相互作用一直试图证实它的重要性(35]。)

5。联锁的角色

尽管还有其他的例子圆形实证和理论交互的过程,他们仍然很少。大多数实证研究(例如,大规模的调查)的参数通常theory-free。反过来,理论和仿真研究,如上所述,使用这些参数,但通常都是数据和上下文无关。(也许不公平的描述,但很难否认,人种学家通常不讲数学和数学家不讲街上的语言。)

但从这些考虑,更清晰的角色理论,可能会出现经验主义,他们的相互关系。在他1974年的诺贝尔获奖感言,Frederich·冯·哈耶克,通常称为复杂性理论的父亲,说:“…当我们从相对简单的领域渗透法律为准(物理科学)现象的范围,组织复杂性规则通常…所有我们能预测一些抽象的特征模式,会出现…但是…我们仍将实现预测可以伪造,因此具有实证意义“(36]。尽管所有这些困难,经验的描述网络,这两个定性和定量,有可能找到那些抽象的模式特点,任务的理论和仿真研究并不适合。理论研究很适合探索模式,他们经常做最好的方式,使虚假的现实(37),但齿轮传动,而展示机制和测试观察。更大的协同效应理论和数据之间可以为现场提供更系统的实验和推理方法。

幸运的是绑架的过程是一个方法同样平易近人的科学家。理论家可以一样好绑架者经验主义者。任何人都是在自由的想法,但那些“依偎事实”可能成功的最好机会。

承认

这部分工作是支持由格兰特一下R21 DA024611-01国家药物滥用研究所,国立卫生研究院。