文摘
煤矿安全管理涉及很多当事人以及它们之间有复杂的关系。根据博弈理论,建立多党进化博弈模型来分析策略的选择。这时,一个简化的三方模型为例进行详细的分析和解决方案。基于动力系统的稳定性理论和相图分析,本文研究复制因子动态演化模型进行优化分析的相关方的行为、安全管理政策的调整机制和决策。结果表明,政府部门负责监督和检查煤矿企业安全管理的效率和效果的影响和激励约束措施和其他措施在安全管理。
1。介绍
2016年10月31日,一个特别严重的瓦斯爆炸发生在Jinshangou煤炭工业有限公司,有限公司,中国重庆永川区,导致33人死亡和受伤,直接经济损失超过3600万元。不久之后,12月3日另一个特别严重的瓦斯爆炸发生在宝马矿业有限公司,有限公司,内蒙古自治区赤峰市,导致32人死亡,20受伤,直接经济损失超过4300万元。调查小组建立了由国务院确定这两个事故是安全生产的责任事故。Jinshangou煤矿和宝马煤矿卷入了非法跨境矿业很长一段时间。他们采用巷道类型煤矿技术国家明令禁止的,拒绝实施监督监管当局签发的订单。他们使用了错误的图纸和虚假信息和其他非法手段来避免安全监察。调查小组还认为,地方政府有关部门未能认真履行职责。的调查和监督跨境煤矿开采是无效的,他们违反了法定程序的采矿许可证的年检1]。
情况下的事故仍然发生在今天的中国。管理混乱,非法经营,可怜的政策的实施,和监管混乱已成为突出的煤矿生产安全的影响因素。这些问题的出现是激烈的赌博的结果在生产和安全的利益和福利的相关利害关系方在煤矿生产。有多个级别的安全检查和监督参与煤矿安全管理的过程中,如同事之间相互监督,检验组煤矿企业、地方政府和监管部门和社会团体(新闻媒体、志愿者等)。这些政党有不同的利益和愿望,从而形成一个复杂的矛盾的身体,既相互依存又相对独立,相互统一,相互对立的。输入和收入的差异导致当事人玩这个游戏的安全监管(2,3]。安全管理的过程本质上是监管利益再分配的过程。如何调整监管利益的再分配是提高安全管理的效率的关键,也是本研究的主要原因。博弈论的广泛应用在社会经济和安全管理,许多学者已经意识到游戏行为的研究可以更有效地发现安全管理的基本法律(4- - - - - -11]。
本文的其余部分组织如下。节2,我们建立一个基本的多方博弈模型在煤矿生产安全监管,讨论之间的利益关系每个兴趣组的收入和费用,罚款也许收到了,和错误行为的检出率在安全管理的过程。节3以三方博弈模型为例,我们进行进一步的理论分析和解决模型和三方游戏系统的定性分析的进化。节4基于进化稳定策略的理论分析,我们将调查激励措施和约束措施在煤矿安全管理通过考虑激励和约束措施。我们最后总结论文部分5。
2。多方博弈模型的煤矿生产安全监管
2.1。基本假设和符号约定
假设兴趣组参与游戏过程的煤矿安全管理系统。第一个参与者(球员I)是煤矿工人在前线和其余各级煤矿安全监管部门在企业内部和外部。这样,监管机构和被监管对象之间的关系将形成网络结构的层次结构(见图1)。我们还假设各级监管机构直接参与的规定球员我(矿工),虽然他们间接执行监督所属安全监察部门。例如,他们直接执行检查矿工们的日常考勤、技术标准和工作效率,等等。只要监管机构发现了一些矿工的不安全行为,下级安全监管部门也会受到惩罚,因为下属部门被认为是无法正确执行安全监督的责任。
考虑到煤矿安全之间的关系感兴趣的团体,我们也作出以下假设。
玩家的游戏策略我(矿工)安全操作和安全操作,分别。安全投资成本(人力、物力、时间等),生产1单位的正常利益如果安全运行的策略选择。如果球员我选择不安全操作的策略,相应的安全投资成本是零。然而,他们将接受罚款当检出不安全的操作。
其他参与者的博弈策略(各级安全监管部门)安全监管和监管(或安全监督,也没有监督),分别。监管成本 , 分别,如果安全监管的策略选择。当上级监管部门发现的不安全行为的球员,我也会惩罚下级监督部门;好将 , 。
检查和监督各级煤矿安全管理工作是独立的,而监管相互共享的结果。当一个检查员检查球员我的不安全行为,他将立即停止不安全行为和惩罚,所以在上层监督没有必要重复执行。
检出率的球员我的不安全行为,各级监管部门而著称 的概率,分别代表相应的监管机构发现球员我的不安全行为。
根据实际情况的过程中,煤矿生产和煤矿安全监管,我们假设上述参数满足下列条件:
(我) ;(2) , ;(3) 。
2.2。收入的功能感兴趣
比赛双方在煤矿安全管理的过程主要是相关利益的分布和安全责任。球员的概率(或比例)我选择指出安全操作的策略 ,的概率(或比例)各级监管机构选择的策略检查或监督而著称 ,分别。因为煤矿工人的工资,补贴的安全检查/监督部门,和其他福利是固定的值在一定的时间内,我们将忽略它们的便利。
球员的收入功能我(矿工)
其他玩家的收入功能(各级监管机构),分别 在哪里 分别是,各级安全监管部门的收入从低到高的煤矿安全管理系统。例如,代表收入的监管机构的最高水平。很难量化社会组织的收入函数如新闻媒体和周围的群众,以及企业声誉的损失,所以我们没有特别考虑。
2.3。多方博弈模型的分析
我们假设有兴趣的各方在游戏中都是理性和所有目标最大化自己的利益。由于信息不对称,虽然游戏行为序列的选择(通常是煤矿工人首先做好自己的本职工作;然后监管机构检查),它是一个很难知道其他玩家的游戏行为选择和选择的概率。此时,博弈模型可以被看作是不完全信息下的静态博弈。简单的游戏理论分析模型(见公式(1)和(2)可以得出一些重要的结论。(1)在游戏中每一方的总收入 。这说明以下几点:(我)安全监管是昂贵的,和安全检查的水平越高,支付的总成本就越大。(2)在过去,一想到强调经济效率和忽视安全管理了煤炭企业内以及一些地方政府部门。为了减少经济损失,当事人相互妥协,减少安全检查工作( ),甚至减少安全监督(监督位错),并寻求实现一个双赢的经济效益。这正是中国效率低下的内在原因的煤炭安全生产管理和安全管理水平低。(3)为了减少当事人的复杂性和妥协和提高安全管理的效率,煤矿安全监管不应该保持在企业。它还需要政府部门和社会组织的外部监督力量,加强煤矿企业的安全意识。(2)收入函数的导数为变量是 这表明每个参与者的收入负相关安全操作的成本(或安全监管),和收入函数将增加时降低成本。(我)玩家我,减少成本()要求煤矿工人提高生产力水平,包括煤矿技术水平、安全操作技能和安全知识,等等。(2)各级监管机构,以减少安全监管的成本( , )意味着他们应该有较强的安全监察和执法能力。与此同时,它还要求煤矿企业积极配合安全监管部门的监督检查工作在煤矿生产过程中,没有对抗,没有隐瞒。(3)收入函数的导数为变量是 每个参与者的收入负相关的罚金吗他们可能会收到。惩罚措施是非常重要的煤矿安全管理的过程中。然而,高强度的惩罚性措施将导致损害玩家的利益,这可能会导致参与者(特别是煤矿工人)失去了他们的工作热情,甚至可能影响生产效果和安全管理。(4)收入函数的导数 为变量 是 这表明监管机构对监管对象的罚款(包括所属管理机构和煤矿工人)的驱动力是他们的工作的规定。这也表明,监管机构不仅监督煤矿工人的生产(球员),但也促进下属的工作主管部门的安全监管。(5)通过计算收入函数的导数为变量 ,我们可以获得 )。这表明每一个参与者的收入是正相关的,其检出率的球员我的不安全行为。这意味着所有有兴趣的各方在煤矿生产和安全管理做出自己的收入会增加,如果他们有更多的先进的生产技术、安全操作技能和安全意识。所以有必要煤矿企业提高他们的专业资格和技术能力通过职业技术培训和引进高素质员工。政府部门的监管强度应保持在一定水平以达到预期的监管效果。
2.4。一阶优化博弈模型
收入函数的导数为变量 是
从上面的公式可以很容易地得出结论,模型参数 (罚款和检出率)是正相关的 ,而安全检查成本和分别负相关 。
让 ;我们得到的一阶优化条件博弈模型: 由于多方博弈模型包含太多的模型变量和参数,其解决方案和分析变得非常困难。因此,对于更清晰和更精确的描述,本文以下部分主要以三方游戏(三方游戏)模型作为一个例子来解决和分析。
3所示。三方游戏的解决方案,分析煤矿安全管理
3.1。三方在煤矿安全管理
即使我们忽视的社会团体自愿监督煤矿生产的外部性,煤矿安全管理通常包括至少三个参与者:煤矿工人(作为球员我表示),安全检查组织在煤矿(表示球员II),当地政府和安全监管部门(表示球员III)。我们也假设如下:
(我)有一个相互监督在同一个群工人及时和有效地诱导前完成。
(2)监督检查各种科学和严格的监管机构。一旦进行监督检查,他们肯定会找到球员我的不安全行为。
在这种情况下, 和 , 。三方博弈模型可以简化如下: 相应的三方博弈模型的一阶最优条件 计算一阶最优条件(见公式(9)),我们得到的解决方案的三方博弈模型;也就是说, 在哪里 。
引理1。根据模型的参数值的假设,这是显而易见的 (见公式(10))。
引理2。模型解的存在性的必要条件(见公式(10)), ;也就是说, 。
纳什均衡(NE)是博弈论中一个传统解决方案的概念。纳什均衡是所有参与者的属性可以预测一个特定的纳什均衡的出现,和没有人动机采取不同的选择行为与平衡。假设玩家意识到游戏的结构和有意识地试图预测对手的行为,最大化自己的回报。此外,据推测,所有的球员都知道这一点。然后使用这些假设解释了为什么球员选择纳什均衡策略(12,13]。
例如,如果给出参数值 混合策略的纳什平衡点的三方博弈模型可以获得 。混合策略纳什均衡是一个随机稳定的状态。当人们参与战略选择偏离混合策略均衡,对手选择产生更好的结果的概率会增加。在这一点上,游戏是动态的。通过模拟不同参数值下的博弈模型,发现非简并混合战略的纳什均衡(纯策略纳什均衡被认为是一种退化混合策略均衡)可能也可能不存在。
因为游戏的长期的过程,人们犯错误的机会总是可能的。因此,最可能的结果的游戏实际上是由获得的信息的完整性程度参与者,如多少体验游戏的参与者和参与者的预期他人的游戏行为(14- - - - - -17]。
因此,除了严格执行的监督检查工作,依照法律、法规的要求,煤矿企业必须充分发挥安全培训、安全意识教育、和其他辅助手段,提高员工的安全意识和自我保护能力在日常管理过程中。此外,企业应该充分利用广播、电视、报纸,图片,和其他形式宣传安全知识和安全教育的开展广泛的活动。
3.2。游戏选择和演化稳定策略
在传统的博弈论,假定参与者是完全理性和信息不完全的情况下,这是非常难以实现的经济生活(13,18]。的来源不完全信息和有限理性参与者之间的差异和经济环境的复杂性和游戏本身。一旦参与者改变他的选择策略,其他参与者会不断改变。因此,我们应用进化博弈理论来研究各方的战略选择的稳定安全规则的游戏。进化博弈模型的结果可以是一个理论基础建立的规则调整机制和措施在煤矿安全管理系统。
进化稳定策略(ESS)是一个纳什均衡的细化,不能入侵任何替代战略,是最初罕见(12,13,19]。1980年代后,与新古典经济学和博弈论的固有缺陷逐渐认可,有限理性的概念被普遍接受和广泛应用于行为生态学和经济学和其他科学领域(20.- - - - - -22]。进化博弈理论,每个参与者动态调整他的决策通过学习、模仿和其他行为。不仅是平衡的结果依赖于初始状态的游戏,还有外部环境的变化会影响游戏的进化路径。基于有限理性的参与者,进化博弈理论结合一些经典博弈理论和生态理论的研究成果,采用动态分析方法来分析各种因素影响参与者的行为和研究群体行为的演化趋势13]。传统游戏理论告诉人们,有很多可能在一场比赛的纳什均衡。进化博弈理论进一步指出哪一个是真正的平衡在现实中,它并不一定是帕累托最优均衡(23- - - - - -25]。
复制因子动态(RDs)是一个重要的概念来描述种群进化博弈论的进化优势12,19]。人口的进化优势反映在参与者的比例;也就是说,经济增长率 每个玩家等于其适应性和平均适应性之间的区别 。所以我们获得 很明显,
3.3。进化博弈模型动力系统的稳定性分析
动力系统(见公式(11)有8个纯策略均衡分: , 。系统也可能有一个混合策略平衡点我们部分3.1。
构造动力系统的雅可比矩阵博弈模型, 特征值方法可以用来确定动态系统的稳定平衡态的点(26- - - - - -29日]。计算的结果表明,动态系统的平衡分都是鞍点和全球稳定在当前无法实现参数的假设。游戏的动态系统不满足自我控制。
4所示。调整机制的政府政策和企业决策在煤矿安全管理系统
在过去,中国的安全管理政策的制定主要是临时措施根据某些事故的具体情况。政策总是调整以及事故,和相关的监管措施也倾向于事故类型的特点。缺乏一个全面的分析煤矿安全系统的一个重要安全事故频繁发生的原因。多方博弈模型得出的结论的基础上,本文试图研究行为的优化策略相关的球员在煤矿安全管理和分析稳定的战略选择,以揭示内在机制和煤矿安全系统的操作规程。考虑长期和重复性质的煤矿安全的游戏和游戏参与者的有限理性,似乎合理制定约束和激励措施基于进化博弈的结论。比较分析当前安全管理系统的安全政策和措施提供了一个理论依据政府部门制定和完善政策措施。
4.1。激励和稳定的游戏策略选择
在当前模型的参数值,平衡的动力系统(见公式(11)没有进化稳定。考虑到本文的目的是为了提高煤矿生产的安全管理,我们选择改变模型中的参数的值,然后使用雅可比矩阵(见表1)来分析(ES)的进化稳定均衡的安全操作策略(例如, )。
和 分别代表球员二世的检查成本和球员三世的监督成本是消极的,这可能发生在检验/监督成本负担和煤矿企业或政府补贴。从表可以看出1,当 ,平衡点 稳定的动力系统三方游戏;当 ,平衡点 是稳定的;和 是稳定的,当 和 同时得到满足。在这种情况下,球员II(检验组)或玩家III(政府监管部门)选择安全检查/监管策略的概率1,和球员我(矿工)会选择安全操作策略的概率1;然后煤矿可以保证稳定的过程。理论上来说,平衡点 也稳定在三方游戏如果 生产力成本是负的,但是这种情况下是不合理的,与实际情况不一致。
通过上面的分析,我们发现适当的激励补贴和津贴降低监管成本,可以有效地鼓励煤矿工人增加安全生产投入,加强安全意识。
4.2。选择下进化稳定策略的约束措施
我们主要考虑两种约束措施的影响游戏的发展策略:一是煤矿安全相关政府部门可以使用约束,如指定的监管行为的次数在一定时期;另一个是内部检查的选择组煤矿企业安全检查也可以限制规定在一定时期内不会经常低于下限。
4.2.1。准备约束措施的安全监察战略玩家三世
在本部分中,我们考虑一个特定情况下,它是强制性的规定球员三世时期的安全监督;也就是说,模型参数的值固定为一个常数。在这一点上,只有两个游戏参与者的安全监督:煤矿工人(球员I)和安全检查组织在煤矿企业(球员II)。
球员我和球员的收入功能,分别
对应的双方博弈模型的一阶条件
博弈模型的解决方案 显然,公式(16)表明,是正相关的 , ,和 。我们也能发现是负相关和的衍生品在变量 , ,分别得到了;也就是说, 和 。
复制因子动态方程(复制因子动态)相应的博弈模型 动力系统的相空间是一个空间的所有可能状态的系统表示每个可能状态对应于一个独特的点(30.- - - - - -33]。我们可以看到从动力系统的相图(见图2),平衡点 是一种不稳定的中心双方博弈的动力系统模型。
让 ;我们得到两个稳定状态: 和 。进化稳定策略要求 。所以 是一个ESS如果 和 是一个ESS当 。这表明当监管策略的概率大于 ,煤矿工人倾向于选择安全生产策略。另一方面,当监督强度相对较小,煤矿工人可能没有增加安全投资的愿望。
同样,让 ;我们得到了两种稳定状态 和 。当 , 是一个ESS;和 是一个ESS当 。这意味着主管部门将继续加强安全监督,直到煤矿工人安全操作选择的比例超过一定水平,和主管将倾向于选择没有监督策略虽然矿工将选择的概率超过安全生产战略 。
4.2.2。约束措施安全检查策略的球员
在本部分中,它是强制性的规定球员第二次的安全检查;也就是说,固定为一个常数。在游戏中也有只有两个参与者的安全监督:煤矿工人(球员)和政府安全监察部门(表示球员III)。
球员我和球员的收入功能三世,分别 对应的双方博弈模型的一阶条件 博弈模型的解决方案
显然,公式(22)表明,是正相关的 , 。然而,是负相关和 ,因为 和 。
相对应的复制因子动态方程(RDs)博弈模型 动态系统的雅可比矩阵博弈模型 在哪里 。很明显, 。 也获得了因为 和不是近似为1。如表所示2点,所有的平衡 和 是不稳定的,除非大于 。所以讨论的具体分析了两种情况: 和 。
例1 (
)。的价值相对较小(
),和平衡点
内部动力系统的中心,但不是一个ESS(参见图吗3和表2)。这时,煤矿工人的劳动成本是相对较大的,而检查的强度()和惩罚()相对较低。
让
;我们可以得到两个稳定状态:
和
。进化稳定策略要求
。所以
是一个ESS如果
和
是一个ESS当
。这表明,只有当监管强度超过一定水平(
)将煤矿工人(我)球员渴望提高他们的安全投资和倾向于选择安全操作的策略。
同样,让
;我们得到了两种稳定状态
和
。当
,
是一个ESS;和
是一个ESS当
。这表明,政府部门的监督(球员III)将继续加强,直到安全投资的煤矿工人的比例(球员I)超过一定水平。
例2 ( )。在这种情况下,价值的是相对较大(例如, );没有内部均衡博弈模型(参见图的动态系统4, )。让 ;我们可以得到两个稳定状态: 和 。其结果是, 是一个ESS因为 , 。这个结果在表也可以看到2;纯策略是动态系统的稳定的节点,也是进化稳定策略的博弈模型。这意味着煤矿工人(球员I)更愿意选择安全操作的策略不管主管的策略选择的概率。原因在于,球员的监督强度二世()和安全操作的惩罚也许在选择策略()相对较大(准确地说,产品的两个生产者的成本相比是相对较大的输入;也就是说, )。因此,煤矿工人(球员)不再愿意选择不安全的操作策略。
5。结论
考虑到在中国煤矿安全管理的现状,有兴趣的团体之间的复杂关系,多党首次建立进化博弈模型来分析策略的选择。多方博弈模型的分析,得出了安全管理的基本缺陷和问题的原因现在和过去。以三方博弈模型为例,研究其进一步理论分析和模型解决和研究进化博弈模型的稳定性。数值模拟的结果表明,进化博弈模型的均衡分都是鞍点在当前模型假设和游戏的动态系统模型不能自控。因此,基于理论分析的进化稳定策略,一些激励措施和约束提出了煤矿安全管理的措施。发现游戏的策略选择是可控在这些相应措施。所以适当的激励和约束措施充分调动主动检查和监督机构和督促煤矿工人安全生产积极加大投入。然后煤炭生产安全管理的效果和相关过程可以得到保证。
一些细节在进化平衡也有一个重要的影响游戏平衡的选择。基于动力系统的稳定性分析结果,证实了以下结论:
(1)一个好的安全监察系统的政府将鼓励煤矿企业采取措施改善他们的专业素质。
(2)如果监督强度不高,减少投资的煤矿企业将出现安全情况;和监督强度增加,企业将不得不增加安全投资煤矿。监管的力量太低时,安全管理的稳定性受损,这可能会导致安全管理的混乱。
(3)从长期来看,煤矿企业的安全培训为员工是一项长期战略投资,这是一个重要的措施为企业提高安全管理水平。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作是由中国国家自然科学基金(批准号51574157):研究多边游戏和煤矿安全系统的控制策略。