文摘

科学造型的主要手段产生理解和提供急需的信息来支持公共决策在流体区域的可持续发展。越来越多,造型多样的可持续性文学,然而,不容易适合标准验证程序,这通常是植根于经验验证的实证主义原则和预测成功。然而,对决策者有用,模型,包括其输出和他们建立的过程是必须的,并且必须被视为“有效。“这项研究探讨了模型有效性的含义在问题空间联系日益紧密和快速变化的挑战。我们检查验证通过本体论的观点、认识和方法论的镜头,对一系列的建模方法,可以视为“complexity-compatible。“世界观在complexity-compatible造型离开的标准模型假设完整的客观性和可预测性。利用不同的见解从复杂性科学,系统思考,经济学,数学,我们建议ten-dimensional发展框架模型有效性在调查可持续性的担忧。因此,我们开发一个视图模型有效性的意义扩大可持续性。它包括(i)承认的验证是至关重要的几个方面的可持续性的成功造型复杂的系统;(2)解决棘手问题的不确定性,主体性,和不可预测性;(3)探索模型假设和机制的现实主义;(iv)拥抱利益相关方参与和监督的角色造型过程; and (v) considering model purpose when assessing model validity. We wish to widen the debate on the meaning of model validity in a constructive way. We conclude that consideration of all these elements is necessary to enable sustainability models to support, more effectively, decision-making for complex interdependent systems.

1。介绍和背景

1.1。可持续发展的挑战和复杂性

随着工业革命的到来,机械化生产和技术模式可以显著提高经济生产力和物质福利,伴随着一个一致的人口增长和消费的商品和服务。同时减少贫困和提供很多福利,这些趋势将自然环境面临越来越大的压力,减少其健康和未来的生存能力。自1960年代以来,环境问题已经越来越紧迫的方面讨论了许多有影响力的思想家(1- - - - - -5]。可持续发展的概念的重要性的增长(6,7),作为一个国家,破坏自然系统和社会凝聚力降低到低于一个危险的水平,现在整个社会的核心重要性,从政府、行业和个人。例如,可持续发展概念被看作是“行星健康,”承认“人类健康和人类文明依赖繁荣的自然系统”(8),或在可持续发展的理念目标,覆盖整个范围的人类和环境卫生挑战[9]。作为可持续性挑战世界各地不断被发现,通过直接观察或造型等未来的气候模型,许多学科都增加他们的研究致力于了解和解决这些问题。虽然这项研究是至关重要的,单一的学科和/或实证主义方法只能解决部分有限的完整的可持续性问题。

可持续性,同时作为一个概念和实际问题空间,是自然的液体,高度复杂的,难以理解,难以处理。广泛损害自然环境如气候变化和生物多样性的丧失,伴随增加社会不平等,不是,一般来说,故意行为但不受欢迎的涌现性或意想不到的结果从工业化的变革性的变化;因此,可持续发展实践者有时只使用二阶效应(10]。问题空间的可持续性挑战可以包括自然系统的长期管理和人文的关系,社会技术系统的基本变换(11),和政治经济的变化12]。这个广泛而复杂的问题空间可能具有挑战性的特点,如是多方面的、综合,相互依存,紧急,系统性的和长期的。可持续发展被描述为一个super-wicked问题[13),它可能很难建立一个清晰的边界在可持续发展研究中“系统感兴趣的”。

对可持续发展城市的转型,这些问题的一个例子。例如,(我)城市可持续发展植根于不断发展科学学会对话和由矛盾和两厢情愿的社会地位之间的各种各利益攸关者(包括人民从政府、行业、非政府组织、公民和学术界14]。(2)即使设置一个具体的目标,认为减少温室气体(GHG)排放的净零,问题可能不是straightforward-which定义类型的可以测量和减少温室气体排放(有限公司2、甲烷等)和排放责任是否应该利用生产型和消费型会计(15]。商定的协议以消费为基础的温室气体排放计算不是建立在许多情况下,呈现跨城市比较困难(16]。(3)问题边界设置在一个开放的系统是很困难的。目前尚不清楚如何处理温室气体排放车辆,仅仅通过一个城市或助长了城外,占城市交通排放(17]。

实证主义研究范式,关注实证验证和生产客观知识从独立观察根据普遍规律,发现缺少了涉及复杂的社会之间的相互作用,研究生态、技术系统未来路径的影响因素如社会价值观、伦理和美学18]。可持续性研究,部分地区,开始远离确定性和客观性的观点(19)和对概念的共识,共享人类行为的认知方面20.,21),需要考虑转型,突然,或颠覆性改变(22]。例如,重要的是要强调决策的必要性在深或基本不确定性可以“准备和适应”,而不是假设总是有可能“predict-then-act”[23]。因此,在一些学科“客观主义的方法论的控制放松…[时]解释维度成为相应丰富”([24),页92 - 93)。在生态系统的研究中,这种变化被描述为一个“分解的机械的世界观”关系的世界观的复杂自适应系统(25]。

1.2。造型为可持续发展

缓慢的转变从可持续发展必然影响了研究方法和实证主义特别是建模方法。造型的主要手段生成、理解和支持学习和可持续发展领域的决策。它支持的发展有效的公共政策回应通过提供系统性的理解因果因素可持续性的挑战和潜在的二次影响的分析不同的行动来解决这些。下面的术语26),在这项研究中使用的术语“造型”是用来描述两个(i)模型,编码的计算机模型,数学模型,仿真模型,和(2)软模型、隐性思维模式、世界观,或广泛的场景和战略分析。我们在讨论包括两个应用模型和学习模型(比喻、知觉或信息):定量,定性、半定量的,纯粹的概念模型。表1呈现了五个文献来源,回顾了可持续发展领域的造型。

1.3。Complexity-Compatible造型

确保良好的质量信息提供给决策者参与可持续发展的挑战,建模者可能需要包括表示一些更困难的这个复杂的问题空间的特征。本研究使用术语“complexity-compatible模型”(CCMs)作为一个总括的术语涵盖了广泛的“硬”和“软”建模方法可持续性挑战,可以实现这一点。综述文献的基础上,作者的跨学科的经验可持续性造型,我们提出三个相互依存的哲学基础是核心塑造和定义CCMs:本体论、认识论、方法论(表2)。

1.4。背景模型有效性的依据

造型过程通常包括几个阶段,这取决于方法和上下文。例如,对于环境模型确定了十个步骤41):定义模型的目的;指定模型上下文、范围和资源;概念化的系统;指定数据;选择模型的特性;选择模型结构和参数值的来源;选择性能标准;有条件的验证包括诊断检查;量化的不确定性;和模型评估和测试(例如,比较选择)。 Model validation can be done during the development and test phase of modelling and also throughout the lifetime of the model as it is used and updated.

确认和验证的区别应该指出。验证确保模型反映了开发人员的概念设计和已经变成了一个工作模型有足够的准确性(模型建立正确的),而验证确保模型是足够准确的为它建造的目的(42]。而“准确性”一词被罗宾逊,他指出模型只有“足够准确”作为理解和探索现实的一种手段。确认和验证过程倾向于使用不同的工具和技术。验证可以通过正式的和数学方法,如行为模型及其之间的直接比较正式的设计规范。验证方法可以更加非正式,包括各种类型的比较模型的结构和行为和真实世界的系统。标准模型验证主要是追求通过测试模型输出与定量证据或观测数据;科学理性保护知识来解释和控制对观察到的现象43]。在这项研究中,我们使用“有效性”这个词在一般意义上意味着模型被认为是有效的,足以用来通知决策。换句话说,是一个有效的模型,模型的结果可以使用,至少在理论上,改善决策的实际结果。

模型代表复杂系统可能不符合标准的验证方法,然而,他们需要接受某种形式的适当的审查,即使基于一组不同的评估标准(44]。缺乏历史优先可持续性挑战是担心因为造型基本社会技术系统的变化,作为可持续性转换可能会需要,不能仅仅通过比较与当前或历史观察验证。一些新的和更多的实验模型被用于可持续性可能被认为主要是学习或探索性的工具,而不是工具预测的能力。这些问题质疑什么尺寸和有效性原则是适合这样的模型,这是本研究的主题。

我们的论文采用评论的角度,利用四个关键领域的科学研究和建模可持续性的挑战。它旨在培养共同理解和建设性的辩论模型的建模者和受益者,包括决策者负责领导应对可持续性的挑战。下了如下研究。部分2讨论一些相关的可持续性造型方面,利用领域的见解复杂性科学、系统思维、数学和经济学。部分3需要进一步我们的跨学科观点探讨凸的概念,尺寸,和原则类似于CCM的有效性。它还提出了一个指导框架,推进讨论的意义可持续性模型的有效性。部分4总结道。

2。Complexity-Compatible造型的科学见解

实证研究,需要直接实验实际系统往往不可行或决策的安全使用,因此,需要更好地理解通过造型代表系统。这需要一个翻译的先天的描述问题空间为模型的实验可以进行(45]。一旦一个后验描述真实系统的充分保证,模型可以被用来改善我们的系统的理解。然而,见解总是由建模方法的局限性,造型形式的相关过程和替换规则之间的映射现实世界及其数字表示(46]。

2.1。为可持续性研究方法论的注意事项

大多数定量模型中使用的可持续性有数学基础,和数学的语言形式越来越部署在造型应对可持续性挑战[47]。数学模型一般是分析或计算:(我)分析模型描述动态系统的数学函数关系或实体;他们的数学形式主义。如果之间的联系一个复杂的动态的数学模型及其计算机实现清晰,主题是简单的模型分析审查(48- - - - - -50]。分析模型来源于数学微分包含理论和可行性理论(51,52]。微分方程的微分包含一个概括的关系方程的右边是一个多值映射而不是一个点。可行性理论微分包含的概念扩展到一个动态的控制系统概念化的模型,以便系统的轨迹保持无限期地在一个地区;他们从一组所有可能的初始状态开始,称为可行性内核。这种控制策略确保了动态系统可持续发展的因为它是局限于规定区域的可持续发展。可行性理论已广泛应用于研究的可持续性生物、生态、工程、金融和经济系统(53,54]。(2)在计算类型模型,描述的基础数学关系的一系列数学算法或计算机代码。计算模型可能并不总是有数学形式主义,但它可能是考试所需的模型从不同的角度,而不需要执行一套详尽的计算机模拟。方法可用于制定计算模型的数学形式包括以下:(i)系统动态模型可以转化为微分方程,微分方程,和可能的积分微分方程。(2)基于代理模型和多主体系统都可以使用马尔可夫链(制定55代数),随机过程(56),和范畴论57]。(3)模糊集合理论(58和正式的方法在计算机科学包括Kripke结构和标记转换系统(59和数理逻辑60)可以用来分析和验证其他通用类型的计算模型。

科学范式的概念61年)在讨论可持续性模型的性质是很重要的。具体理论(s)一个(或多个)方面的可持续性、系统的概念,通常在一个知识领域中形成一个特定的模式。然而,可持续发展是自然的一个多维的问题。造型为可持续发展需要考虑的几个相互依存的话题,诸如目标可持续性改进,这类型的干预可能不工作,为什么,什么因素影响环境破坏,和角色的公共,私人和第三部门可持续发展行动。高水平的可持续性挑战的复杂性不仅可以产生从互联技术系统的系统62年),但也从政治、社会和认知元素在系统进化中发挥作用。

例如,在能源供应系统的“能源三难选择”是一个公认的多维问题,需要同时提供能源安全、能源股票,和环境的可持续性,而每个解决方案有时二分(63年]。需要研究多维和很多方面是复杂性科学的解决问题。复杂性科学建模方法允许足够的变化和非线性进行实验结果和紧急行为(s)是引起和观察。通过多维模型,它捕获这些类型的问题,同时允许替代系统的概念。它还可以容纳多个模型的集成形式来表示对象的多样性研究调查的范围内。

许多现有的模型中使用的可持续性规划设计技术经济,因为他们通常应用于经济领域。,typically in the form of optimisation models that search for “best” solutions under differing constraints, targets, and natural system changes (e.g., integrated assessment models). These models are trusted and useful within the techno-economic paradigm that they assume, but less useful for dealing with complex situations. Large planning models tend to be prescriptive rather than descriptive and must therefore include large numbers of assumptions on technology development, economic behaviour, ecosystem responses, and societal responses to interventions. This means they inadequately explore the full complexity of the problem space in which interventions must be made. These models reduce the reliability of the prescriptive recommendations being generated, while “known unknowns” are usually acknowledged but not adequately included.

元素之外的技术、环境和经济领域,如信息流动、政治变革,公众的态度,和社会观念,是重要的可持续性,但经常缺少造型。这一领域非常活跃在可持续性模型是系统思考。认识论系统思维包含多个视图,从定量模型的假定为简化,而是现实的表征系统的核心部分(例如,64年,65年]),使用的模型与伟大的意识构造性质,当用来减少冲突,产生共识66年]。系统思考寻求“替换一个还原主义者,狭窄、短期、静态与整体的世界观,广泛的、长期的、动态的观点,重塑我们的政策和相应的机构”((67年)页509)。思想家们倾向于认为人类决策者和系统是动态链接的一部分,受自适应交互和演化动力学(例如,68年])。

2.2。Complexity-Compatible建模方法

经验和数值数据加上分析或计算方法往往发挥主导作用,建立定量模型的有效性解决可持续性的挑战。然而,定性和参与式方法与潜在的增强模型的实用性和利益相关方参与一般不太明显,被低估了69年]。

2.2.1。定性的方法

(1)软系统方法。软系统方法,通常意味着这些人共事的方法系统,如果他们创建模型,他们纯粹是(或主要)定性。例如,这些可能包括软系统方法论的概念模型(70年,71年),在关键系统启发式评估矩阵(72年],它可以作为一个实用的框架,实施关键系统思考(73年),和批判现实主义的哲学,这可以作为一个框架来探讨现实的不同层次之间的关系(33,74年]。

(2)本体模型。模型作为本体可以用来确定重点和空白领域的可持续性,使技术创新可持续发展从整体的角度来看,系统和系统75年]。在这种方法中,目标的概念结构是理解通过其本体,后者是知识结构的结果:平滑涉众之间的沟通和支持系统性思考[76年]。建模者可以使用本体来选择合适的变量,以构建一个模型。通过应用本体论分析可持续发展转变,系统性的,动态的,复杂系统的规模、过程,和其他维度可以突出显示77年]。

虽然系统思维和复杂性科学更具包容性的定性方法,经济很大程度上保持着定量和嵌入在数学形式主义。经济学需要更加注意定性方法研究人类经济环境维度交互,如公众接受、认知偏差、社会规范,或非市场壁垒。目的、有关政策、更多的定性的方法可以描述和探索,例如,部署替代能源过渡的愿景,经济故事,或故事,包括利益相关方参与78年,79年],历史案例研究[80年],或观察人种学研究[81年]。

2.2.2。定量方法

有数学CCMs可持续性越来越感兴趣。它需要一个专注于量化系统的不确定性和不可预测性,捕捉大自然提供形式和严谨。例子包括出现现象的数学研究由自治代理(82年),细胞自动机(学习的行为83年),和城市复杂动态系统(84年]。城市代表了一个复杂的相互关联的实体由微观和宏观的交互。他们可以使用物理模拟与分析方法的原则(85年)或通过使用元胞自动机的计算方法86年),基于代理模型(87年),系统动力学(88年双胞胎),或数字(89年]。

复杂性科学已经发展出了一套原则,方法和工具几十年来从许多学科和跨学科的调查,提供一种描述、解释和干预方面(包括身体、行为和社会)的现实世界。这交叉科学公开的共同进化系统,大量的交互和反馈的非线性影响,新奇出现的能力,和系统self-organise和适应,特别是有关可持续发展的主题。该框架在90年)提供了一个典型的复杂系统的方法论,有5个部分:(1)系统表示,(2)外源场景,(3)设计变量转换组合,(4)系统进化,和(5)影响评估。复杂性科学的关键原则包括自我组织(91年自我组织临界]和[92年),出现(例如,群集)和共同进化93年),路径依赖和反馈(94年),相互依赖和耦合95年),和权力的法律96年]。复杂性科学模型的例子包括网络模型(97年),基于代理模型(98年),细胞自动机(99年),和人工智能One hundred.]。复杂系统模型开发和应用这些原则来理解和通知的干预措施在实际系统的例子,对弹性和可持续性26)生存和系统35]。现存的知识,对新知识的需要,和熟悉的概念系统和建模方法指导建模工具的选择。

术语“系统模式”与可持续性的覆盖各种类型的表示真实世界的系统,支持决策为可持续性开发行动减少温室气体排放,保护生态环境,减少废物和废物管理,减少有毒物质污染,和更多的社会关注指标可访问性等绿色空间来改善健康。系统跨越其个人目的(101年),所以系统思考需要强烈problem-focused造型方法。这意味着边界设置问题分析的一个重要组成部分和边界不一致与那些被工作人员等不同领域的工程或政策。所有因素被认为是重要的问题需要被包括,甚至那些没有通常测量,这就需要从许多学科。跨学科理论建立模型之前,可能还需要建设,可以通过问题结构化方法的使用(102年]。困难,模拟真实系统的复杂性使系统建模者有时关注理解和代表模式和阈值,而不是产生精确的数值结果。敏感性测试和场景分析常用于探索不同的外生条件下系统的行为,和工作正在进行深刻的不确定性(103年]。从方法论的角度,有效地捕获反馈系统组件之间的相互作用是至关重要的。非线性和多环动力学,延迟系统内和有限理性决策都是核心模型(67年,104年,105年]。

主流学术经济学家们的贡献不够解决可持续发展的挑战,与顶级经济期刊发表的几篇文章中关于气候变化(106年]。分支经济可持续发展等相关生态、环境和资源经济学和复杂性和演化经济学是经济研究的一小部分107年]。经济模型,解决可持续性主要遵循的方法论的格式标准的优化模型,假设基线经济处于平衡状态,因此,有扭曲成本经济当政府干预,以保护气候或环境。强有力的方法论的偏见存在向量化,预测维度(24]。大多数经济模型是用于识别的场景,可持续性和一些说明性的影响(28]。反应这一现状在经济模型方法导致逐渐更多元经济的方法,提出了一种反思人类福祉,远远超出一个以消费为基础的福利的概念108年]。例如,经济模型,利用复杂性科学通常是放置在一个共同的进化,失去平衡,相互关联的本体性质的复杂系统(109年]。经济学在这种情况下,复杂的动力学描述经济是在不断的变化,预测并受基本不确定性,开放的反应,和嵌入历史考虑,和次优,异构行为多样化的代理(110年]。因此,关注异构交互代理(111年)可以说是提供了一个更现实的和有用的替代标准经济学([112年],p . 92)。仿真模型(29日)可以提供更多的自由在定量探索扰动的传播系统。

3所示。推进讨论Complexity-Compatible模型的有效性

3.1。模型有效性概念的概述

在数学中,有几种方法可以证明定理(113年使用分析推理和逻辑的)。还有几个方法来证伪定理(114年]。证伪一个定理有时可以比证明一个定理,因为简单定理可以通过提供至少一个反例无效。反例也可以用来定义的边界条件和一个定理的有效性。尽管CCMs不是数学定理,它们有时可以通过调整方法验证中使用数学。

总是对现实的简化模型(115年];因此,总有一些省略或捆绑在更高层次的抽象。由于每个模型的特质,验证模型必须考虑诸多方面,包括它的数据如何生成(116年]。验证在复杂性科学主要集中于模型和分析模型的逻辑输出为一系列不同的场景。以下七个方面涵盖主要考虑复杂系统建模与模型有效性:对利益相关者的有效性,信誉,透明、可解释性,再现性,外部效度和内部效度。仿真模型能够充分满足所有这些方面具有更大的效度符合只有部分或全部,但部分。

在系统思维,验证模型的偏离更通常的观点,认为有效性作为一个概念模型本身所固有的。相反,有效性的关系视图,包括模型,模型的目的,用户模型。模型利用系统思维被认为是有效的,如果他们是可靠的和有用的117年]。不仅注重对模型的预测能力行为的信心水平还模型及其输出时用于特定目的和/或用户使用特定的模型。目的,例如,防止失败在一个系统中,提高系统实现所需的行为,设计一套政策干预系统,和了解系统结构和许多其他类似的例子模型通知决策。即使有理由的模型理论和利益相关者的参与,是不可能证明模型真正代表问题的因果关系,和可诱导的谬误的指控118年]的模型创建正确的系统行为而是为了错误的理由。因此,全部或部分interpretivist模型的验证,并告知决策的可接受性,仍然是一个持续的挑战的造型可持续性社区。模型是跨学科的,验证流程本身可能需要跨学科的。

没有普遍的共识理解或经济学验证过程的实现策略,当涉及到复杂系统模型的上下文中可持续性的挑战。有效性可能更广泛的解释对模型结构在更广泛的观点和行为,而不是仅仅强调模型的输出。基于模型的有效性研究结果与其支撑相关认知立场(和相应的本体),这决定了其效用,信誉,和结果的可靠性119年]。越来越多的考虑到验证CCMs经济学方法需要多元化和经济考虑标准和非标准的适用性验证方法。模型机制的有效性、输入和假设基于定量数据和解释定性信息需要得到更多的关注,而不是专注于内部效度和预测模型的成功输出,通常是在标准的经济模型。

3.2。内部效度

从数学的角度来看,CCMs的内部验证需要几个步骤。首先,确保数学模型是一致的:确定性模型(任何模型可以分为确定性、随机或模糊),应该存在一个独特的解决方案模型方程从任何一组初始条件。高度非线性模型,展览分岔和混沌行为,没有独特的解决方案,和超定的集方程往往是不一致的。模型检测方法起源于计算机科学理论可以用来分析CCMs如并发分布式系统(120年]。其次,测试模型的整体宏观特性,比如它的渐近行为,稳定,和存在的紧急行为:这有助于理解模型的长期行为。稳定的另一个关键特点是模型,它可以通过执行微扰分析测试(121年]。第三,评估模型鲁棒性:这个认证模型的结果尽管模型参数的不确定性和小随机扰动模型的存在。确定性和概率方法可用于这一目的。如果模型是用于决策支持,鲁棒优化方法可以用来使强大的不确定性条件下的决策(122年]。

在复杂性科学,内部效度一般指的逻辑(分析和计算)一致性模型的内部结构,这意味着模型做它应该做的事情。的声音选择造型形式,定义组件和交互,并替换规则,从系统感兴趣的复杂系统模型,内部效度的基础。实现细节和验证模型的选择也会影响内部效度:如果这些是有限的或不充分的景观模型的可能性,然后测试可能导致假阳性。内部效度可以通过试图“破坏”测试模型,例如,使用异常值或数字,不能与国家相关的组件,如0,或通过改变模型中的一些假设(123年]。

在经济学中,内部效度通常是通过deductivist追求逻辑一致性的方法。为了达到这个目标,标准经济学依赖于数学的形式嵌入在确定性模型,基于强大的假设和无可辩驳的公理经济人行为,极端理性、优化和平衡。替代经济方法(例如,后凯恩斯主义经济学、复杂性经济学)审问,然而,这样的假设决策的有用性,例如,逻辑时间和完整的可逆性与历史时间和现实的不可逆性124年]。说到这儿,当经济利用复杂性科学的见解,它的模型(例如,基于主体计算经济模型)是很难验证内部和数学,因为这些不是分析制定,而是通过模拟,解决和倾向于优先考虑外部经验验证。

一些作者在系统动力学模型的验证提供了指南,例如[125年,126年]。结构验证发生在每一个阶段的建模过程,旨在确保每个元素与现实世界模型中有一个对应(但不是现实世界的每一个方面是在模型中表示)(127年];最相关的变量,特别是反馈关系,包括内生解释出现问题时128年];,从一个真实的有严谨和透明度问题模型结构(129年,130年]。许多系统模型结合内生观测系统的因果关系行为,计划内和计划外。例如,在社会技术系统、能源反弹效应等干预措施可以产生不必要的结果(131年)和所需的能源需求减少的结果。然而,任何声称在复杂系统因果关系的理解很难证明,需要强大的理论模型设计的理由。

3.3。外部Validity-Modeller的角度来看

在数学建模、模型性能检查与外部来源。如果经验数据可用,这一步涉及比较模型的预测数据的观察。否则,模型的预测相比,另一个独立的预测模型模拟相同的系统。如果多维模型的输出和时变,有几个指标等这些比较最大绝对误差,残差平方和,偏见,和其他几个人之间输出之间的相关性。模型的信心,在缺乏经验数据的情况下,可以推断其他维度的模型验证的例子中,一个模糊集测量模型的信心(132年]。在数据丰富的环境中,贝叶斯方法可以用来量化的信心与别人相比,模型(133年]。最后,需要确保模型的透明度。这是实现如果所有的根本和基础数学方程和/或计算规则是明确定义的,所以该模型可以被复制。这未必是一件容易的事,因为它是已知的例如,基于代理模型是难以复制的134年]。

系统思维模式,行为验证包括寻找模型结构,从内部复制行为模式。在某种程度上,它反映了标准验证实践与过去相比,该模型输出通常是时间序列数据,有时使用校准时间序列的一部分,另一部分反复核对。实际上,校准的历史数据可以通过多次迭代轮的测试和调整,通过特别的方法和/或通过模型优化,以减少误差。小规模的集合系统原型模型(135年- - - - - -137年)开发和验证多年来通过使用许多模型(有时称为“分子”)。他们可以在许多不同领域的研究和应用提供完善的造型结构,这需要更少的比全新的验证。

在经济学中,外部实证效度通常专注于预测输出成功,确定性和可量化的风险。这已经实现,至少自1960年代以来,通过实证检验的结果对宣称独立客观数据或事实——“唯一有关测试的有效性的假设是比较其预测与体验”(138年]。追求传统经济学的预测能力培育了“封闭系统”的世界观,与封闭系统外的非随机影响描绘成一个冲击外生变量(19,139年]。Deductivists开发模型结构根据“机械认识论”[140年]内部驱动的议程,这是有效的,只要一些实证模型输出的测试执行(19]。尽管波普尔的接受经济学",模型验证主要是做的早期验证的原则(19]。

考虑到现实主义的输入和过程也很重要,这是反映在最近的经济思想,如生态经济学、行为经济学、经济学或复杂性,后者在很大程度上画硬复杂性科学方法(141年]。与复杂性经济学,尽管没有共识存在于合适的评价标准模型的验证代表复杂系统(44,142年),越来越多的人关注实证验证的建模规则强加给代理和基于代理模型的底层的因果机制。如果因果结构整合,在基于个体模型是一个很好的与支撑现实世界的数据,然后模仿的数据生成机制可以被视为一个适当的表示real-data-generating机制,提供了一个严格可靠的实证支持决策(143年]。

对于复杂模型,再现性是产生一致的结果,模型的能力,另一方面,之间的符合程度模型结果和它所代表的真实世界的系统。系统上收集的数据感兴趣的可能是统计与数据由一个复杂的系统模型。通常,现实世界的数据分成不重叠的校准(或培训)数据集和验证数据集,前者生成算法相关的输入输出,而后者在模型验证144年]。公开源代码,可用数据的初始条件,初始变量,数据和软件版本与种子一起为伪随机数字生成器提供最好的再现性。然而,基于代理模型经常从人口分布数据生成初始条件,即随机选择嵌入模型,所以复现性范围内是我们能期待的最好结果145年]。验证模型的自然系统是不可能的(146年),尽管验证可以通过逐步迭代过程来确认(147年]。

3.4。外部Validity-Users的角度看

在系统思考,利益相关方参与结构验证中起着重要的作用,特别是在参与造型。利益相关者通常是模型的面向的用户,在问题空间方面有经验的人,人们以某种方式相关的问题空间。利益相关者的参与和他们的知识建立在丰富的经验148年)使用要么通过提供外部有效性改进模型结构,或者模型涉及人员系统,以确保模型合理地代表所有相关的思想和世界观。用验证通常包括在模型设计让利益相关者参与其中,构建和测试阶段。方法如组模型构建提供一个结构化的方法(149年]。模型没有利益相关方参与更有可能歪曲问题建模,由于缺乏深入了解的现实系统的工作原理和不太可能被利益相关者和用于earnest-although信任这不是纯粹的理论探索性模型。模型的信心和信誉可以随着时间的推移,构建模型和更新。如果用户发现决策没有模型是更糟糕的是,这表明该模型的有效性。定量系统建模的结果往往是决策者更容易使用比定性见解。然而,他们也风险决策者低估的不确定性量化结果和不够承认这样的模型的重点是更多的情景分析和理解而不是预测。

与涉众进行数学模型,接触发生在两个模型的两端:最初问题公式化和最后的解释结果。利益相关者的定义问题,分析员将问题转化为一组数学或计算规则,然后模拟模型得到的结果。结束时的链,利益相关者解释结果。利益相关者可以重新定义问题的结果,因为他们可能表明问题是不明确的或不可行。

复杂系统模型的有效性可以通过确定模型的有效性结果在各自的真实决策系统(144年]。共同创造是一个利益相关方参与的方法有助于利益相关者有效性验证(150年]。模型更有用、使用和可用的如果利益相关者参与系统的范围和描述现实世界的兴趣,可以把这些抽象的模型联系起来。所省略的透明度、合并或抽象模型开发期间将提高有效性,虽然更大的真实性并不一定导致更好的理解现实世界的司机151年]。的模型不能显示捕获机制负责测量系统的输出,其有效性可以通过其本体论结构评估(组件及其之间的交互)152年]。概述、设计和细节(奇数)已经成为事实上的基于主体建模的标准的透明度(153年]。可解释性的概念模型是可以理解的,而这只能在模型组件和连接器组件之间的明确描述和理解(45]。来自真实世界的替换规则的定义和模型极大地增加了可解释性。许多机器学习技术很难解释(154年),但尝试可辩解的人工智能(155年)提供了一个机会来提高复杂系统模型的可解释性。一旦模型的外部效度,它可以用来看看将来会发生(或过去发生的可能)如果输入改变,即。测量输出结果的敏感性,对改变输入变量(154年]。当模拟复杂系统的变化与大投资和长寿命周期,告知决策模型的时间需要延长到未来;然而,这增加了不确定性模型输出的有效性。

在经济学中,这个模型的外部有效性从用户的视角通常被忽略。尽管如此,有几股经济思想,强调主体间性意义的角色,故事,历史推理,说服,和修辞,在驾驶行为和经济,努力实现可接受的经济解释和可行的,裨益政策结论(24,156年]。方法验证在这种情况下更容易追求通过解释,承认主观价值的作用,和启发式,除了典型的科学关注实证验证139年]。它的工作原理对模型有效性的意义转移从追求结果过程验证和证明很难合理的论证为目的,灵活性,深度,多元化的观点。

3.5。更好的验证可持续性模型的指导框架

我们的讨论强调了到目前为止的趋势CCMs缓慢渗入研究处理可持续性的挑战和需要更新的方法建立了其有效性,更适合他们的哲学基础。很明显,目前还没有普遍商定的方法模型有效性CCMs,可以适用在所有学科和建模方法。图1青蒿酸,进一步扩展了我们之前的讨论,通过四项原则和十个维度,我们认为需要解决在考虑CCMs的有效性。它可以被视为一种指导框架,提高开发、测试和CCMs的使用。预期利益包括增加的可能性模型被视为有效工作在可持续性的挑战。

3.6。有效性原则

一组通用的四项原则从我们先前的讨论,往往会出现形状模型有效性的过程,当应用于CCM和可持续性的挑战:(我)首先,模型有效性不是一个全有或全无的状态。它可以是模糊和它的意义是液体的或暂时的。它可能需要重新审视的特点系统或演化建模的挑战。换句话说,它往往是上下文、问题、和/或特定于用户。(2)其次,模型验证是一个过程,跨越整个生命周期的模型。它是不够的,例如,只验证模型输出(例如,预测成功)。验证模型的输入、假设、机制、流程和适用性,至少,同样重要的是验证模型输出。(3)第三,模型有效性依赖于模型和/或其应用程序的目的。在许多情况下,建模的过程学习或探索为其使用者和受益者(如政策社区)更有价值比使用模型作为预测工具来生成未来状态的估计。(iv)最后,有很强的interpretivist特征模型有效性。这意味着,在某些情况下,模型用户必须应用自己的专业判断反思模型假设和机制。模型用户解释的意义模型输出,然后将其应用到可持续挑战他们寻求解决。此外,任何专业的判断并非完全客观,但在时间和空间有限,和文化的影响157年]。这带来了一个元素合理的论证或可信的推理,当传达的含义的解释模型验证。

3.7。合成有效性方面

效度维度构成一个指示性的篮子模型开发人员、用户和受益人可以选择取决于类型的模型被开发和应用的目的。他们被分组在图1在十岁以下标题和可能追求通过定性和/或定量的方法。应用有效性维度的数量越大,模型越有可能被认为是有效的和可信的。他们解释如下,按照顺时针的顺序显示在图1从顶部开始:(我)(1)内部模型一致性和可靠性:这需要检查公式的正确性和逻辑模型,例如,有关单位在基本层面上的一致性。这个尺寸很大程度上代表了一个正式的模型(如数学)检查,不管它是否匹配的真实世界。(2)(2)外部输出验证,(3)现实主义的模型输入,和(4)的现实模型机制:这些三维显示模型代表观察到的系统的能力和可靠的代表实证或实验数据,定量或定性。他们可能在很大程度上实现经验或统计(按标准方法),但也通过参与式和两厢情愿的方法。模型一直保持一个简化的现实,大部分元素旨在反映了现实世界中,但并不是每一个现实世界的元素是代表(127年]。(3)(5)模型鲁棒性:它意味着模型功能和输出通常保存尽管模型参数和外生不确定性的扰动。换句话说,建立模型鲁棒性在处理复杂系统处理模型不确定性时才有意义(参数和/或结构)和模型假设。但是,在某些情况下non-robust行为可能是合理的和有趣的阈值和分岔点的行为模式模型,增加见识,而不是无效的模型。(iv)(6)模型重复性和复现性:模型的鲁棒性、再现性、和复现性主要是通过混合实现的数学,经验,和计算方法。这些都是相当简单的在处理确定性模型。然而,需要仔细考虑当处理CCMs需要特性转化,非线性和不确定性。在模拟环境中不可预知的行为(例如,的出现颠覆性低碳创新消费实践),一个是寻求建立总紧急行为的再现性(或复现性),而不是单独的代理行为。例如,在基于代理模型,随机选择是由初始条件或描述代理行为的异质性,因此准确的再现性的现实世界应该几乎不可能。可复制性范围内是最好的希望(134年]。在许多CCMs,复现性与特性转化可以使用计算机方法来保证修复的随机数序列或随机性的模式。(v)(7)模型的信心和信誉:这些指示是多么容易的解释或理解建模结果和他们的司机,以及在多大程度上相信一个适用于实际系统模型旨在表示。它可以通过实现所有的四个验证方法如图1。造型的发现基于方法超出标准的实证验证和实证验证的实证主义世界观和可预测性更难以解释。出于这个原因,他们可能更需要指导和信心在造型结果的可解释性。这方面与随后的第八和第九验证方面先进的图1(vi)(8)模型透明度:这涉及到清晰的审计跟踪模型的假设、输入、机制和结果;即。,the model’s structure and behaviour are clearly conveyed to stakeholders and other modellers for scrutiny. Nonetheless, since models are simplified representations of reality, there is a need to safeguard that simplicity or parsimony, fostering transparency, must not come at the cost of ignoring key features of the system under investigation [151年]。这是很重要的,因为CCMs往往可能是不透明的。有浓厚的兴趣,最近,在发展中框架等进行模型透明(如基于代理模型,ODD-overview,设计概念,details-protocol [153年),或者,最近,它的扩展将描绘人类的决策,即。,the ODD + D framework, or for system dynamics models, which have a tradition of openly portraying model structure visually and mathematically such as the SDM-Doc tool) [158年]。(七)(9)利益相关方参与:这是与共同创造相关的模型设计、可用性、功能迭代,版本控制,提高描述因果关系的确立,并限制无意识的偏见,在可能的情况下,适用。在实践中,这转化为使参与广泛的利益相关者的建模过程。利益相关者包括各种各样的决策者,连同社会演员可能会受到的挑战是解决的方式。这是特别重要的在参与式造型如参与系统动力学模型159年)和组模型建立(149年]。涉众买进沿着模型发展的每一步都是至关重要的,测试和发布的结果或释放模型的使用。此外,复杂系统建模和可持续性挑战有时可能涉及重大利益相关者的语言和学习努力工作的复杂系统。(八)(10)模型实用性:CCMs可能被视作有用的各种原因。首先,它们允许更多的多功能性捕捉现实生活中的复杂性。第二,如果利益相关者参与模型的生命周期,他们可以提出更紧密地与抽象的模型,从而提高其实用性。总的来说,CCMs是为了更少关心预测成功,更多关注生成定制和帮助通知决策的见解。因此,部署各种验证方法主要取决于模型运动的目的或应用程序。

不用说,这十个维度并不详尽。他们也有其局限性,因为他们是基于不同的,广泛的,但不一定全面的科学的观点。

3.8。对可持续性模型选择

应用程序和造型形式的多样性增加了模型验证需要一个共享的多学科的理解。在网上学科发展和计算模型被应用于新的问题和纳入业务流程(例如,数字双胞胎)。主席Zinov打开一个正式的可能性meta-methodology各种造型形式,其具体用途,和验证实践(45]。这正式meta-methodology变得必要,多个模型允许多个视角的“object-original”和多个相互关联的原始对象需要多个相互关联的模型是有效的和支持分布式同步模型。

可持续性研究,这意味着模型的验证过程需要更加跨学科本身,匹配到底层的跨学科性质可持续性问题。使用和应用框架的有效性都回顾和未来模型可以进一步改善,以及理解的局限性过去的模型对其有效性。换句话说,以上模型有效性框架可以作为指导起点为未来新兴方法论的选择,将提供一个更合适的或可靠的混合模型和方法解决可持续性的挑战。

作为一个例子,当应用到经济领域,CCM有效性需要多方面的方法,即追求经济标准和非标准的验证方法。它将超越检查逻辑的一致性模型的内部结构分析和计算,传统经济学是多才多艺的。也推模型开发人员和用户将他们的想法远离米尔顿•弗里德曼(Milton Friedman)是典型的“似”方法论的“实证经济学”,即“一个假设的有效性的唯一相关的测试是比较预测的经验,“不管现实主义的假设使用(138年]。

进一步针对经济领域,我们建议在图的指导框架1支持complexity-compatible造型本体论基础,因此,有助于形成多元的经济思维。它也鼓励考虑主观价值经济模型及其有效性,忽略了大片的经济学研究。例如,经济思想的主要学校,如凯恩斯主义,奥地利经济学(老)制度经济学、生态经济学、股进化和行为经济学,长期以来主张的作用参数,价值观、伦理、文化、和美学原则,在添加丰富的知识生成通过正式的定量模型。主观要素的贡献,想象力和创新人类情感和市场转换(可持续发展具有至关重要的影响)在经济学温顺,尽管他们承认在经济学文献的部分复杂的系统思考(例如,在160年- - - - - -162年])。新兴经济的可持续性研究议程的一些复杂性科学与系统思考(例如,163年])将受益于他们的混合的有效性定量/ analytical-interpretivist /定性建模方法通过多维框架被审问和塑造。

4所示。结束语

的有效性我们贴上“complexity-compatible模型”(CCMs)可能会保持一个开放的研究问题有一段时间了。与计算机模拟的发展,人工智能,我们的经济的复杂性,社会,和日益全球化,相互联系,和破坏性的自然我们面临的可持续发展问题,很可能有一个可信的需求,更现实,更透明、更有用的模型被用来引导各级决策。从多维和跨学科的角度考虑他们的有效性将会无情地紧迫。

CCMs的一个关键差异是有效性的概念不是绝对意义上的模型有效性或真或假。这取决于系统的模型和它的目的应该代表。这一事实有效性不是绝对的有效性意味着责任不能完全委托给一个技术的过程,如与经验数据进行比较。仍然是模型建设者的共同责任,用户,和受益者,他们需要运用合理的判断。总的来说,模型验证需要价值判断的过程。价值判断是不一样的,不同类型的模型,也为被模仿不同,包括可持续性本身的价值。这一过程将得益于更正式的验证方法的发展更适合建立CCMs的有效性。

本研究设定的过于雄心勃勃的目标质疑模型有效性的含义,当应用于研究可持续发展的挑战。希望,通过批判性质疑模型有效性的含义从本体论、认识论、方法论的视角,并通过塑造CCM ten-dimensional框架的有效性基于不同的科学见解,这项研究将刺激和引导讨论,如何更加复杂的模型的有效性调查进展更加紧急的可持续性的挑战。

的利益冲突

作者宣称没有利益冲突有关这项研究的出版物。

确认

作者感谢大卫Shipworth通知辩论的意义模型验证;安德烈Postnikov对他的评论和建议的较早的一份草案数学角度;和Brunilde威耶分享她的观点在模型验证和利益相关方参与。这项工作是由英国工程和物理科学研究委员会(EP / P022405/1格兰特数字,建筑环境系统思考,和EP / R017727/1,基础设施和城市,研究英国Collaboratorium UKCRIC)及其经济和社会研究委员会(格兰特ES / N012550/1数量,评价中心的整个关系的复杂性,CECAN)。