一个方法来提取安全事件的因果关系在化学事故故障树和事故报告

文摘

化学事件进化图(CEEG)是一种有效的工具进行安全分析,化学事故预警和应急处置。然而,它是一个复杂的工作找到CEEG事件之间的因果关系。本文提出一种方法来准确地提取事件因果关系通过使用神经网络和结构分析。首先,我们确定事件及其组件元素从故障树通过自然语言处理技术。然后,因果关系在事故事件分为明确的因果关系和隐含的因果关系。明确的因果关系是通过分析事件节点的层次结构关系和语义的组件故障树的逻辑门。通过整合内部结构特点的事件和事件的句子的语义特征,我们提取隐含的因果关系,利用双向封闭的复发性单元(BiGRU)神经网络。提出了一种算法,名叫CEFTAR,提取安全事件的因果关系在化学事故故障树和事故报告。与现有的方法相比,实验结果表明,我们的方法具有更高的精度和召回率提取因果关系。

1。介绍

近年来,化学工业经济和社会发展做出了巨大的贡献。然而,一系列的安全事故频繁发生与化工企业带来的巨大的经济效益。例如,七十八人死于爆炸盐城化学工业园区3月21日,2019年。事故发生后,十六个化工企业在这个工业园区被关闭(1]。化学事故的发生给企业和个人带来了巨大的经济损失,做出无法挽回的环境破坏,甚至导致重大人员伤亡(2]。因此,事故预防和应急处理已经成为日常生产化工的重点。

在化工行业提升生产规模和大量的化工产品,生产过程越来越复杂,和生产的所有方面的风险因素也增加(3]。控制和预警的不安全因素,如高温、高压、易燃、爆炸、和中毒在化工生产能有效防止未来化学事故(4]。Versaci提出一个模糊的方法来实现缺陷的检测和分类。它认为类缺陷在一定深度的特点是典型的范围模糊相似之处(5]。文献[6)覆盖的实际实现超声无损检测技术在工业环境中,可能会出现讨论几个问题,并提出解决策略成功。它提供的许多技术可以应用于探测危险化学品生产信息。

通过分析事故的原因,挖掘潜在的因素,进化规则,和保护措施,我们可以减少事故发生率,减少事故损失,提高安全管理水平和应急处置能力的化工企业。故障树分析是最常用的方法之一,在安全分析,预防和紧急处理(7]。故障树可以描述事故的原因及其时序逻辑关系(8]。所以,我们可以找到化学事故的关键事件和预测潜在危险的化工生产现有的故障树。

然而,只有偶然的进化过程可以得到故障树。时间、地点和环境的这些事故并不简洁的描述故障树的结构。因此,它可能会导致缺乏重要的信息在分析事故的原因。因为大多数故障树建立了基于专家的事故分析经验,可能存在语义歧义,不完整的信息,混合信息,信息融合的故障树。与此同时,对于复杂的故障树,我们可能面临高复杂性和不完整的进化在分析事件演化机制的信息。也很难准确定位或匹配事件演化序列。

为了弥补上述缺陷安全故障树的分析,预警和应急处理,事件进化图(EEG)介绍了在化学事故模型的事件演化过程。脑电图是一种图形信息载体的基础上开发知识图(9]。插图作为一个有向图,它描述了因果关系和时间依赖性事件链的一个意外。一个脑电图描述化学事故被称为化学事件的演化过程进化图(CEEG)。通过遍历CEEG,我们可以很容易地获得化学事故事件的演化序列。我们也可以预测潜在的事件在一次事故中通过评估事件因果关系和转移概率。

一个场景的事件“石油和天然气爆炸波动”CEEG图所示1。第一个节点是说:“阀门泄漏的事件从阀泄漏储罐。然后“油气蒸发”和“爆炸性气体收敛”按顺序发生。当爆炸性气体的浓度超过一定数量时,就会引起爆炸。爆炸需要一些触发条件。因此,我们可以看到节点“爆炸性气体收敛”成功连接有三个节点。“用火爆炸”、“与雷爆炸,”和“与静电爆炸”代表爆炸引起的火灾,雷电和静电。“爆炸冲击”和“火打破”是两个主要的破坏场景。因此,节点“爆炸冲击”和“火打破”分别与爆炸三种类型的节点。因为事故发生的事件是由他们的时间或因果关系,我们可以很容易地实现与CEEG事件跟踪和预警。

这是一个复杂和富有挑战性的任务构建CEEG。提取、事件识别、事件关系和事件实体链接的主要任务是构建脑电图的过程。在这项研究中,我们建立CEEG基于现有的故障树和事故报告。在化学事故中的大多数事件都是因果关系,以及因果关系也是主要的链接CEEG安全事件之间的关系。所以,我们担心如何识别事件和提取这些事件之间的因果关系。本研究的主要贡献如下:(1)我们提出一个有效的方法来提取事件元素通过结合故障树与事故报告。故障树和事故报告极大地降低事件提取基于NLP的复杂性。(2)我们获得明确的因果关系通过分析事件节点的层次结构关系,在故障树逻辑门。隐含因果关系生成基于BiGRU神经网络通过喂养内部结构特点的事件和事件的句子的语义特征。因果关系提取的精度和效率都提高了因果关系划分成明确的因果关系和隐含的因果关系。(3)我们进行了几轮的实验来验证该方法的有效性。的精度和召回率,实验结果表明,我们的模型和方法比最先进的方法提取因果关系。

本文的其余部分的结构如下。节2,我们引入故障树和脑电图的正式定义。部分3提出了一种实现事件识别方法。如何提取安全事件之间的因果关系是节中阐述了吗4。节5,实验显示我们的方法的有效性。我们结束我们的工作6。

本文的主要目的是提供一种有效的方法寻找潜在事件和他们的因果关系。在得到事件及其因果关系后,我们可以构建CEEG然后应用事故分析,推理和早期预警。准确、自动获取知识构建CEEG,我们提出一个方法来从故障树中提取和因果关系的事件和事故报告。我们将故障树的定义和脑电图,以便更好地说明我们的方法在以下部分中。

故障树是常用的分析与安全相关的风险,他们可以描述事件的时序逻辑发生安全事故(10]。有两种类型的节点:事件和盖茨在故障树。事件的故障树是用来代表的主要事件导致事故和他们可以分为三种类型:基本事件,中间事件和事件。盖茨表示事件传播通过系统而边缘是如何用来表达这些事件的发生顺序关系(11]。

故障树图2描述了一种“油罐爆炸的场景。“我们可以看到基本事件”空洞出现在板的槽”和“裂纹出现在盘柜”是与或门O₁。这意味着事件“变形或断裂发生在坦克”将被触发,如果上面的一个基本事件发生了。与门的一个₁事件”20吨柴油罐,填写““变形或破坏发生在坦克,”和“储罐逾期维修”是它的输入事件,和“柴油泄漏槽”是其输出事件。所以,只有所有的输入事件同时出现,和输出事件会发生。同样,我们可以推导出一系列事件为“火灾发生火花,”“点火来源出现,”和“油箱爆炸。”

2.1。定义1(故障树)

故障树是一种4-tuple英国《金融时报》= (V,G,E, ),包括以下组件:(1) 节点的集合在吗英国《金融时报》;每个节点在用于表示一个事件(2)G逻辑门的集合。∀∈G,T( )是一个函数,描述每个门的类型(3)E弧的集合在吗英国《金融时报》,E⊆×G∪G×(4) 的根节点吗英国《金融时报》

故障树中有三种类型的节点:根节点,叶节点、中间节点。根节点代表了最高的事件。V_l= {∈V∧( ∈G酸处理( , )∈E)};∀∈V_l,是一个叶节点,它是用来表示一个基本事件。V_米= {∈V∧(∃∈G酸处理( , )∈E)};∀∈V_米,是一个中间节点,它是用来表示一个中间事件。

轻松地获得输入事件和逻辑门的输出事件,我们提出两个函数:(1)我:G⟶Ψ(E)描述了每个门的输入事件;(2)O:G⟶(E)描述每个门的输出事件。

从图中的例子1,我们可以看到,一个事件的进化图是有向图。节点事件进化图是用来表示事件,采取了相应的弧来表示这些事件之间的依赖关系。现在,我们给脑电图的定义。

2.2。定义2(事件进化图)

事件的进化图(脑电图描记器)= (V,E)。在这里,V是一组节点;∀∈V,是一个事件,它是由抽象的、广义和语义完整的动词词组。E是一组弧形;∀e_ij∈E,它表示事件之间存在依赖关系和。

有两种类型的事件之间的依赖关系:顺序关系和因果关系。两个事件之间的顺序关系指的是他们的部分时间排序。因果关系是一个事件之间的关系(原因)和第二个事件(效果),第二个事件在哪里理解为第一的结果(9]。在这项研究中,我们使用了象征“⟶”来表示因果关系。对两个事件e_我和e_j,e_我⟶e_j意味着e_我的原因是e_j。很明显,必须连续事件之间的因果关系。找到两个事件之间的因果关系是困难和具有挑战性的工作。

3所示。事件识别

事件识别,也称为事件识别或事件提取过程发现组件元素(因素)的一个事件从不同来源的信息。在最近的一项研究中,Skarlatidis解决不确定性问题的基于逻辑的事件识别通过扩展事件微积分和概率推理(12]。陈介绍word-representation模型获取有意义的词语的语义规律。他收养了一个框架基于动态multipooling卷积神经网络(DMCNN)捕获字面意思的线索和保留关键信息13]。冯开发了一个独立于语言的神经网络来捕获序列和从特定的上下文和块信息他们火车事件检测器用于多种语言没有任何手动编码特性(14]。廖提出了一种新的基于积极和消极事件识别方法提出的权重构建一个触发器表(15]。Hogenboom总结了事件抽取的文本数据的技术,区分数据驱动,知识,和混合方法,提出了一个定性评估这些方法(16]。

在这项研究中,我们将提取事件,调查他们在化学事故的因果关系。我们的信息来源事件识别故障树和事故报告。现在,我们给事件的正式结构用于本文。

3.1。定义3(事件)

一个事件在一次事故中被正式定义为4-tuplee= {o, ,p,t},o, ,p,t用来表示事件的参与者,事件触发词,位置,和事件发生的时间戳。

简洁地展示一个进化过程,故障树通常设计摘要信息的事件。我们不能找到一个详细描述信息的时间,地点,和环境状态。这些信息是在事故中阐述了报告。所以,我们可以获得这些事件元素的自然语言处理技术故障树和事故报告。事件的提取元素包括以下工作:语料库切分、词性标注,语义角色标注(SRL),语义依赖解析(SDP),和依赖解析(DP) [17,18]。为每个节点故障树,我们可以通过以下步骤获得事件的元素:(1)参与者⟵SRL(故障树节点)(2)触发字⟵SRL(故障树节点)(3)地方⟵SDP(事件的句子)和(的地方。semantic-dependency(触发字)= LOC)(4)时间⟵SDP(事件的句子)和(时间。年代e米antic-dependency (Trigger-word) = Time)(5)句子主题⟵DP(事件)和(Subject.dependency-parsing(触发字)= SBV)(6)事件对象⟵DP(句子)和(Object.dependency-parsing(触发字)= VOB)

SRL首先是用来识别事件触发词和参与者的故障树。时间戳和姿势SDP技术获得的事件可以触发词。整个事件的信息后将生成“包含主语、谓词和宾语”结构由DP解析。上述处理功能(SRL SDP, DP)通常封装应用程序服务。这里,开源开发的自然语言处理系统的社会计算与信息检索研究中心调用哈尔滨工业大学在我们的研究解析事件的句子(19]。

在图2,都有一个节点标签“喷气燃料泄漏”故障树。这个节点的事件句相应的事故报告”在11点钟,喷气燃料管道泄漏出来。“SDP的处理结果,SRL, DP (a)所示,(b)和(c)的人物3。我们可以看到,“喷气燃料”是事件参与者而“溢出”是一个事件触发词。

(一)

(b)

(c)

SDP可以识别语义角色及其关系在事件的句子。不同的角色之间的主要关系包括代理关系,病人关系,体验者的关系。SDP图的结果3 (b)表明参与者“喷气燃料”和触发字“溢出”与体验者的关系。“管道”和“11点”的语义依赖触发字。“管道”的角色,“11点”的位置和时间,分别。因此,参与者在这个句子是“喷气燃料”,触发字“泄漏出去,”发生时间是在11点钟,和在管道发生的地方”。“不同的单词在句子的关系见图3 (c)DP。到目前为止,我们可以得到所有事件的元素和4-tuple句子e={喷气燃料,洒了出来,在管道中,11点钟}。

4所示。提取事件因果关系

故障树是一种逻辑因果关系有向图包括事件符号、逻辑门,和转换。它可以显示系统状态的各种基本事件的逻辑演进。事件因果关系在故障树可以分为两类:明确的因果关系和隐含的因果关系。

4.1。提取明确的因果关系

明确的因果关系可以通过分析中提取事件节点的层次结构关系和语义的组件逻辑门。有各种类型的故障树的逻辑门。通常情况下,以下三种类型的逻辑门,即与门,或门,和嗓音起始时间(k/N),基本盖茨。通过上面的逻辑门的组合,我们可以得到所有其他的语义逻辑门用于故障树(11]。

让F故障树,让是代表基本事件的集合F。的语义F是一个函数π_F:Ψ(是)×E⟶{0,1}π_F(年代,e)表示是否e失败的设置年代失败的是。这是定义如下:(1)为e∈是,π_F(年代,e)=e∈年代(2)为∈G和T( )=,让π_F(年代, )= (3)为∈G和T( )=,或者让π_F(年代, )= (4)为∈G和T( )=嗓音起始时间(k/N),让π_F(年代, )=

语义的逻辑门,我们知道发生在低层节点是上层节点的事件的原因。图4说明了故障树的基本结构。两个事件e_我和e_j通过逻辑门和相连,和事件吗e_米位于上层节点。所以,我们可以得到两个明确的因果关系规则:e_我⟶e_米和e_j⟶e_米。对于一个给定的故障树,我们可以获得明确的因果关系规则通过遍历所有的逻辑门。

4.2。提取隐含的因果关系

明确的因果关系可以很容易地歧视事件节点的层次结构的故障树。然而,可能会有一些混合事件节点的信息。同时,多个事件偶尔中描述一个事件节点。因此,一些隐含的因果关系可能隐藏在事件的故障树。提取隐含因果关系应该以建立一个正确的CEEG。有两个步骤,找到隐含的因果关系。一个是调查两个事件之间是否有因果关系,另一个是确定因果关系的方向。的因果方向是用来描述事件的原因和结果。在这项研究中,每两个事件的事件对故障树节点被组装为候选人。通过分析事件的内部结构和语义特征的事件的句子,我们可以确定因果关系及其方向的帮助下我们的因果分类器。

刘提出了一个经验学习因果关系框架。与传统方法相比,它试图处理因果关系问题依靠文本线索和语言资源,他们首先使用因果关系学习的经验信息(20.]。Riaz关注识别和使用名词和动词的语义类编码的倾向高的原因或noncause关系21]。赵设计抽象因果关系网络和双因果转换模型。是有效的发现高层背后的因果关系规则具体因果事件(22]。赵和刘提出了一个新的限制隐朴素贝叶斯模型从文本中提取出因果关系。它可以应付部分之间的交互功能,避免过度拟合问题隐朴素贝叶斯模型,特别是连接类别之间的交互和句子的语法结构23]。一个框架,结合直觉模糊集理论和专家提出了启发式,使定量分析的时间不确定的动态系统故障树的数据(24]。

近年来,各种类型的神经网络和深度学习模型的推广应用提供了有利的支持,机器学习。例如,邓小平提出了一种改进的量子激发微分进化方法所构建一个最优的深层信念网络,这是进一步应用于提出一种新的故障分类(25]。一种改进的蚁群优化算法基于multipopulation策略,共同进化机制、信息素更新策略和信息素扩散机制提出了平衡收敛速度和解决方案多样性和提高优化性能在解决大规模优化问题(26]。类似的工作对提高共同进化蚁群优化算法与多策略提出了文献[27]。赵扩展广泛的学习系统基于流形正则化框架的semisupervised学习提出semisupervised广泛的学习系统。它可以实现更高的分类精度不同的复杂的数据,操作速度快,泛化能力强28]。这些方法是我对我们具有重要意义,利用神经网络优化的因果关系。

在这项研究中,我们提出一种新的方法来获取隐含的因果关系,因果关系提取转换成二进制分类问题。四个步骤包括内部结构特点提取事件,事件的句子语义特征提取,特征融合,softmax分类采用故障树发现隐含的因果关系。

如图5字(词)向量是首先用来表达词汇事件的序列特征的句子。然后,BiGRU神经网络用于我的事件的上下文语义特征的句子。提高上下文语义的准确性,我们添加的关注机制到BiGRU模型的词和句子。最后,语义特征和内部结构特征都是输入softmax分类器来确定是否有因果关系和给定的事件之间的因果关系的方向。

4.2.1。准备提取事件的内部结构特征

事件的内部结构特征指组件元素事件的特征对的关系。让e_我= {o_我, p_我t_我}是一个事件,0≤我< =n。E= {e_我}是一组事件。∀e_我和e_j∈E,<e_我,e_j>可以形成一个事件。三个事件的内部结构特征对研究在本节中:(1)出现的概率:P(e_我)是用来代表的出现概率e_我。个人电脑(e_我,e_j)被定义为的同现概率e_我和e_j。此外,个人电脑(e_我⟶e_我)的同现概率e_我和e_j的条件e_我原因而e_j是结果。对于事件的元素,我们现在一群出现的概率。P(e_我。o)是用来表达的出现概率的参与者e_我。o。同样的,P(e_我。 ),P(e_我。p),P(e_我。t)的出现概率触发词,位置,分别和时间戳的事件。(2)点态互信息:点态互信息(PMI)通常是用来计算两个词之间的语义相似度(29日]。PMI的基本思想是计算的概率两个词同时出现在文本中。正常情况下,两个词总结有高度的相关性更高的采购经理人指数。因此,PMI的事件和它们的元素可用于确定两个事件之间的关联度。采购经理人指数的定义为事件组和事件元素可以引用,分别 (3)位置之间的相关性事件:事件中包含故障树节点可能存在于不同的句子。两句话通常被认为是与更多的依赖或因果关系是否密切。句子之间的距离成反比的程度之间的关系的句子。段落句子包含事件从零顺序编号。让TS是句子的总数在事故报告。SP(e_我)是用来表示句子包括的数量e_我。相对位置为一个事件对<e_我,e_j>,即SPe_ij,被分配SP(e_我)−SP(e_j)。相关性是指位置精准医疗_ij,精准医疗_ij= 1−SPe_ij/TS。

我们构建一个19-v向量ISFe_ij表达事件的内部结构特性对<e_我,e_j>。在这里,ISFe_ij= (P(e_我),P(e_j),P(e_我。o),P(e_j。o),P(e_我。 ),P(e_j。 ),P(e_我。p),P(e_j。p),P(e_我。t),P(e_j。t),个人电脑(e_我,e_j),个人电脑(e_我⟶e_j),个人电脑(e_j⟶e_我),采购经理人指数(e_我。o,e_j。o),采购经理人指数(e_我。 ,e_j。 ),采购经理人指数(e_我。p,e_j。p),采购经理人指数(e_我。t,e_j。t),采购经理人指数(e_我,e_j),精准医疗_ij)。

4.2.2。提取语义特征在事件的句子

(1)BiGRU神经网络。两个事件的语义依赖可以从事件中获得的句子。事件的语义特征的句子作为一个特征来识别事件关系在我们的研究中。工具“Word2vec”是用来训练语料中的词汇的词嵌入化学事故(30.]。然后,这个词所表达的事件的句子可以嵌入序列。这个词向量来自事故报告的训练集文本和一些去噪后网络事故新闻。给定一个句子组成的n话说,每一个字由实值向量,向量表示为句子的年代= ( , ,…, )。

格勒乌的神经网络是一个流行的变体LSTM神经网络。与LSTM相比,格勒乌更简洁的结构(31日]。格勒乌只有两个控制盖茨:更新和复位登机口。信息传播的格勒乌可以描述如下:(1)门更新:更新门z_t(见公式(3)用于控制程度前一时刻的状态信息带入当前状态。更新门的价值越大,越可以将前一时刻的状态信息: (2)重置门:重置门r_t(见公式(4)用于控制程度的忽略前一时刻的状态信息。盖茨重置价值越小,越忽略前一时刻的状态信息:

得到一个新的隐藏状态;z_t和r_t共同控制如何获得新的隐藏状态h_t−1从先前隐藏状态h_t如下:

与LSTM相比,格勒乌具有结构简单、参数少、训练速度快。它比LSTM已经显示出优越的性能。我们使用事故文本设置来训练神经网络。事件的句子在事故报告中首次获得根据故障树。向量的这些事件的句子然后输入到神经网络提取事件的语义特征的句子。

神经网络的单向传播,这只能包含之前的传播信息。后者的反向传输信息不能传播。双向神经网络由两个神经网络训练序列前后,分别输出两个结果序列包含完整的上下文信息(32]。在这里,我们使用element-wise总和将向前或向后通过输出:

(2)注意机制。细心的神经网络最近展示了巨大的成功在一个广泛的任务,如问答、机器翻译和图像识别。我们可以应用注意计算任何两个单词一个句子中通过引入self-attention机制。因此,单词在句子的依赖关系可以学到更精确。句注意周等人提出的机制。33能注意语句)和林提出的机制等。34为文本表示已经被广泛关注。在本节中,我们将上述两种方法生成向量的句子。

一般来说,一个事件对<e_p,e_问>,e_p和e_问是位于不同的句子。假设有l句子之间的事件e_p和e_问。L一组句子形式Se_魁人党。给定一个句子Se_我在Se_魁人党,T_我在句子的字数Se_我。与t [1,T_我)代表了t^th词Se_我。我们获得给定单词的注释通过连接向前隐藏状态,向后隐藏状态。一旦与重量分配每一个字,我们可以给一个注释的句子。

一个激活函数谭h(x在公式()10)是用于处理。然后,我们测量的重要性和训练参数向量W₁规范化的重要性权重α_它通过一个softmax函数。句子向量年代_我可以获得通过使用加权和的所有单词注释与体重以下:

在这里, ,d^w词向量的维数,W₁是一个训练有素的参数向量,然后呢是一个转置, ,和。

我们第一次喂的单词注释年代_我成一个单层MLP得到u_我作为一个隐藏的表示年代_我。公式(13)是用来计算一个句子的重量。我们计算出向量为Se_魁人党总结所有的信息的句子包含事件对:

(3)层正常化。深入学习网络在训练过程中,参数的变化将导致在随后的网络输入数据的分布变化。解决问题的数据分布变化的训练过程中产层,约飞提出了BN算法(35]。对于每一个批处理,输入分布和用于计算均值和方差,用于规范化输入每个训练样本的神经元的数目。这种方法可以显著减少的前身神经网络的训练时间。然而,批处理标准化的影响取决于minibatch的大小。需要统计每个minibatch的一阶和二阶统计在运行过程中,不能广泛应用于RNN网络。因此,英航等人提出的概念层正常化(LN),减少了训练时间的均值和方差的计算输入和单层神经元(36]:

在这里,在每一层的输入参数,μ^t是输入数据的平均值,然后呢σ^t是输入方差。和b偏见是常数,f是一个线性变换,然后呢ζ是一个正则化参数。在这项研究中,LN方法引入到公式(4)- (6)提高格勒乌神经网络的训练速度。

4.2.3。融合的特性和分类的事件

我们提出一个方法来获取事件的内部结构特征和语义特征在事件的句子。在本节中,我们实现融合的特性和分类的因果关系。

有三种分类结果softmax分类器,标明两个事件是否有因果关系和因果关系的方向。是一个句子向量得到公式(14),事件结构特征的向量,W_f模型训练参数。y(见公式(16)是用来表达两种类型的特征融合的分类结果:

与此同时,介绍了熵作为训练目标函数(见公式(17))。在公式(17),n是句子和的数量吗θ代表所有的参数模型:

4.3。因果关系提取算法

在本节中,我们总结我们的主要操作步骤方法。提出了一种算法,即CEFTAR,从故障树中提取的因果关系和化学事故报告。

在te算法1,我们首先构造三组。他们(ES)的一组事件,事件对(EPS),和事件对因果关系(ECS)。这些设置都初始化为空集。从线(3)(4),我们使用流行的分词工具“Jieba”来获得所有的单词在化学事故报告。所以,我们可以根据这些词语料库。同时,工具“Word2vec”是用来生成向量对语料库中的词。通过遍历所有FTS的故障树,我们可以将所有的事件添加到ES(见(5)线(8))。(9),生成事件对ES事件的任意组合。所有的事件对每股收益。

	输入:故障树的集合(FTS)和事故报告(ARS)。
	输出:事件对因果关系的集合(ECS)。
(1)	构造一组事件(ES)和事件对(EPS)。
(2)	ECS =每股收益= ES =Φ;
(3)	ARS的实现分词语料库CA工具“Jieba”和构建;
(4)	每个单词w的CA,火车一个向量为w“Word2vec”;
(5)	为每一个英国《金融时报》罚球
(6)	为每一个n_e ft.E
(7)	{识别事件e在节点n_e;
(8)	ES = ES∪{e};}
(9)	对于∀e_我和e_j ES、构建事件对<e_我,e_j>和每股收益=每股收益∪{<e_我,e_j>};
(10)	对每个<e_我,e_j>每股收益
(11)	如果 ft.G酸处理:e_我我( )∧e_j O( )或e_j 我( )∧e_我 O( )然后ECS = ECS∪{<e_我,e_j>};
(12)	其他{构造ISFe_ij和使用已经表示的向量ISFe_ij
(13)	计算Se_ij;
(14)	为每一个Se_p句子中Se_ij
(15)	构建向量spSe_p,年代_p=Σα_它 h_它;
(16)	生成的矢量和Se_ij;=Σα_我年代_我;
(17)	y=argmax(softmax ((+ )));
(18)	如果(y= = 1),那么ECS = ECS∪{< e_我e_j>};}
(19)	返回(ECS)
(20)	}

对于一个事件,我们首先提取明确的因果关系(见线(11)(12))。如果两个事件是位于不同的层次结构,与相同的逻辑门,他们有明确的因果关系。隐含的因果关系将进一步调查,一旦他们不明确的因果关系。在分析事件的内部结构特征,我们构造ISFe_ij和使用来表示的向量ISFe_ij。然后,句子的语义特征包括以下步骤获得的两人。我们得到了两个事件之间的所有句子,计算向量基于BiGRU神经网络对这些句子。最后,结合矢量的内部结构特征和句子的语义特征是发送到softmax分类器决定是否这两个事件有隐含的因果关系(见线(13)(18)。ECS CEFTAR返回的算法作为最终结果的因果关系。参数的含义在所有的公式和符号缩写展示在表1。


符号	意义

英国《金融时报》(V, G, E, V₀)	故障树,V是一组节点,G盖茨的集合,E边的集合,是根节点
V_米,V_l	中间节点和叶节点
脑电图描记器= (V,E)	事件的表达进化图,V组节点和吗E边的设置吗
Ψ(。)	的函数返回给定逻辑门的输入事件
(。)	该函数返回给定逻辑门的输出事件
e= {o, ,p,t}	事件e,在那里o, ,p,t用来表示事件的参与者,事件触发词,位置,和事件发生的时间戳,分别吗
生存研究实验室(.)	语义角色标注功能
SDP(.)	语义依赖解析函数
DP(.)	依赖性解析函数
π_F(年代,e)	函数来判断e失败的设置年代失败的是
P(。)	概率函数
个人电脑(,,。)	同现概率函数
采购经理人指数	点态互信息
z_t	更新门格勒乌单位
r_t	重置门格勒乌的单位
x_t	格勒乌单元的输入
h_t	在当前时刻的隐层信息
h_{t - 1}	前一刻的隐层信息
	在当前时刻的候选人隐层信息
W	权重矩阵
σ	乙状结肠激活函数
棕褐色h	双曲正切激活函数
⊕	向量连接函数
α_它	规范化的词的句子年代_我
年代_我	这个句子向量
u_我	的隐藏表示句子向量年代_我
α_我	规范化的句子句子组的重量Se_魁人党
	的向量Se_魁人党
μ^t	输入数据的平均值
Σ^t	输入方差
G,b	偏差的常量
f(.)	线性变换函数
Ζ	正则化参数
H ()。	熵函数

5。实验和分析

在本节中,我们目前的实验来验证该模型和方法的有效性。我们的实验数据集上执行由5867事故报告和故障树。五个领域的专家化学事故分析了提取和注释这些报告和故障树的因果关系。

计算机的硬件如下:3.2 GHz CPU是i7 - 8700, 6芯,十二个线程。16 g的内存。显卡是GTX1060 6克。采用Tensorflow实施这项研究中的因果关系提取模型。实验进行了五轮和平均值作为试验结果。一个网格搜索算法用于测试不同参数的组合来确定我们的模型最优参数。在我们的模型中最优参数的值如表所示2。


项	价值

学习速率	0.001
批量大小	50
Gru-size	128年
辍学	0.7
偏见在LN常数:	0.001
的迭代次数	200年
嵌入的大小	200年
层数	4
在LN正则化参数:ζ	0.0001
偏见在LN常数:t	0.001

我们比较我们的模型与其他常用的机器学习和神经网络模型来展示它的优点。从图6,我们可以看到,我们的模型更高的精度和召回率比BiLSTM提取因果关系,CNN,支持向量机,LR, NB。我们可以看到,BiGRU的准确率和召回率,BiLSTM,和CNN是高于SVM, LR, NB。因为神经网络模型优于传统的机器学习模型挖掘隐藏的特性。BiGRU BiLSTM有更高的精度和召回率比CNN由于LSTM网络可以更好地捕捉长文本上下文特征序列,而CNN适合捕捉地方特色。

四种最先进的方法包括Feature-SVM (F-SVM) [8],BiLSTM [37],pattern-argument语义(便士S) [38),多列CNN (MCCNN) [39]也上执行相同的数据集获取因果关系。如图7我们的方法的准确性和召回率是最高的。因此,实验结果表明,提出的模型和方法在提取因果关系优于现有方法。

两个数据曲线如图8,横坐标是运行步骤的数目,纵坐标是模型的准确性。我们可以看到,LN层正常化加速网络收敛和减少操作时间和成本。

6。结论

CEEG是脑电图描述化学事故的演化过程。我们可以很容易地获得进化序列在化学事故的事件。安全分析、预警和应急处置可以执行基于这些演化序列。准确、容易获得建筑CEEG因果关系,一个方法来提取安全事件的因果关系在化学事故故障树和本文提出的事故报告。

我们提出一种有效的方法来提取事件及其元素通过结合故障树与事故报告。这些事件之间的因果关系分为明确的因果关系和隐含的因果关系。我们获得明确的因果关系通过分析事件节点的层次结构关系,在故障树逻辑门。隐含因果关系生成基于BiGRU神经网络通过喂养内部结构特点的事件和事件的句子的语义特征。实验结果表明,该方法在精度和召回率有助于更好的性能在提取过程中因果关系。

在未来的工作中,更多的元素影响化学事故的事件将被考虑,如环境、天气、和政策导向因素。精度将进一步增加更多的元素后采用模型的事件。同时,将收集更多的化学事故的情况下,以丰富的训练数据集。该方法将会得到更好的性能调整后最优模型参数与更丰富的数据。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作的主要研究项目支持下山东省2018 ggx101052格兰特,自然科学基金资助下的中国61973180,和山东省自然科学基金授予ZR2019MF033。

引用

保j . w . Wang, s .元,“建议计划一个危险废物综合管理:化工园区,江苏,中国,“可持续性,11卷,不。10日,28-46,2019页。视图:出版商的网站|谷歌学术搜索
Krahn, l。法伊弗提到。j .克拉克d . Kosson和j·赫顿,“关键问题的初步分析化工事故报告,“安全科学卷,82年,第373 - 368页,2016年。视图:出版商的网站|谷歌学术搜索
m . Yazdi,美国Kabir, m·沃克“故障树建立风险评估的不确定性处理:最先进的和未来的视角,“过程安全和环境保护卷,131年,第104 - 89页,2019年。视图:出版商的网站|谷歌学术搜索
郭宏源。李,D.-J。李,学术界。Shin”特点的分析化学事故、伤亡事故”火灾科学与工程没有,卷。31日。1,第88 - 81页,2017。视图:出版商的网站|谷歌学术搜索
m . Versaci”模糊方法和涡流无损检测/设备在工业应用中,“电子信件,52卷,不。11日,第945 - 943页,2016年。视图:出版商的网站|谷歌学术搜索
p . Burrascano s Callegari a . Montisci m·里奇和m . Versaci超声无损评价系统施普林格,柏林,德国,2015年。
c . Joshi f .最近,s . p . Wilson”前为故障树分析法的贝叶斯实现鲁棒性,”IEEE可靠性,卷67,不。1,第183 - 170页,2018。视图:出版商的网站|谷歌学术搜索
w·戴l . Riliskis诉Vyatkin p . Wang和x关,“基于云的自我修复决策支持系统在分布式自动化系统使用故障树分析,“IEEE工业信息,14卷,不。3、989 - 1000年,2018页。视图:出版商的网站|谷歌学术搜索
x z,赵,叮,t·刘“脑电图:知识库事件进化的原则和模式,”中国国家社会媒体会议上处理,页40-52,北京,中国,2017年9月。视图:出版商的网站|谷歌学术搜索
大肠Ruijters和m . Stoelinga“故障树分析:一项调查的最先进的建模、分析和工具,”计算机科学评论15 - 16卷,29 - 62年,2015页。视图:出版商的网站|谷歌学术搜索
a . Rauzy和c . Bleriot-Fabre”声音语义动态故障树,”可靠性工程和系统安全卷,142年,第191 - 184页,2015年。视图:出版商的网站|谷歌学术搜索
a . Skarlatidis g . Paliouras a Artikis, g . a . Vouros“概率事件微积分的事件识别、”ACM交易计算逻辑,16卷,不。2,1-37,2015页。视图:出版商的网站|谷歌学术搜索
l . y . Chen, k . Liu d .曾和j .赵”事件提取通过动态multi-pooling卷积神经网络,”协会学报》第53届计算语言学和第七届国际联合会议上自然语言处理,(卷1:长论文),第176 - 167页,北京,中国,2015年7月。视图:出版商的网站|谷歌学术搜索
刘冯x、b .秦和t,“事件检测的神经网络语言,”中国科学信息科学,卷61,不。9篇文章ID 092106 2018。视图:出版商的网站|谷歌学术搜索
t·廖w·傅、s . Zhang和z . Liu”事件识别的紧急事件和其应用,”国际会议在网络安全和情报应用程序和技术施普林格,页1375 - 1384年,Cham瑞士,2019年。视图:谷歌学术搜索
f . Hogenboom f . Frasincar Kaymak, f·德容和大肠Caron”事件的调查从文本提取方法对于决策支持系统,”决策支持系统2016,,85卷,页12日至22日。视图:出版商的网站|谷歌学术搜索
l·梅·h·黄,魏x, x毛,“新词提取一种新的无监督方法。”中国科学信息科学卷,59号9日,第102 - 92页,2016年。视图:出版商的网站|谷歌学术搜索
威尔士和白色,“跳NLP曲线:自然语言处理研究的回顾,“IEEE计算机情报杂志,9卷,不。2,48-57,2014页。视图:出版商的网站|谷歌学术搜索
http://www.ltp-cloud.com/。
s . y . Liu, j·张,宗庆后,“智能代理经验的因果关系学习,”ACM交易在亚洲和资源缺乏语言信息处理,18卷,不。4、22页,2019页。视图:出版商的网站|谷歌学术搜索
m . Riaz和r . Girju认识因果关系在verb-noun对通过名词和动词的语义,”学报2014年EACL研讨会上因果关系在语言的计算方法(CAtoCL)2014年,页1 - 10,哥德堡,瑞典。视图:出版商的网站|谷歌学术搜索
s .赵问:Wang s Massung et al .,”构造和嵌入抽象事件因果关系网络从文本片段”学报第十届ACM国际会议网络搜索和数据Mining-WSDM 17剑桥大学,页335 - 344年,英国,2017年2月。视图:出版商的网站|谷歌学术搜索
赵,t·刘赵,y . Chen和J.-Y。聂,”事件因果关系提取基于连接词分析,”Neurocomputing卷,173年,第1950 - 1943页,2016年。视图:出版商的网站|谷歌学术搜索
s . Kabir t . k . Geok m·库马尔m . Yazdi, f·侯赛因,“时间故障树分析的方法利用直觉模糊集和专家启发式,”IEEE访问,8卷,第996 - 980页,2020年。视图:出版商的网站|谷歌学术搜索
j·w·邓h . Liu, h .赵和y的歌,“一种改进的量子激发微分进化算法所深信念网络,”IEEE仪表和测量,2020年。视图:出版商的网站|谷歌学术搜索
吴邓、j .徐和h .赵”一种改进的基于混合策略的蚁群优化算法的调度问题,“IEEE访问7卷,第20292 - 20281页,2019年。视图:出版商的网站|谷歌学术搜索
h·邓l .彭h . Zhang b·杨和z . Chen”排名偏向学习群优化器中大规模优化”信息科学卷,493年,第137 - 120页,2019年。视图:出版商的网站|谷歌学术搜索
h .赵j .郑w·邓,y的歌,“Semi-supervised广泛学习系统基于流形正则化和广泛的网络,”IEEE电路和系统I:普通文件,卷67,不。3、983 - 994年,2020页。视图:出版商的网站|谷歌学术搜索
f·h·汗,Qamar,巴希尔,“SentiMI:引入逐点互信息与SentiWordNet改善情绪极性检测”应用软计算39卷,第153 - 140页,2016年。视图:出版商的网站|谷歌学术搜索
h . d . Zhang徐,z .苏,”中国评论情绪分类基于word2vec SVMperf,”专家系统与应用程序,42卷,不。4、1857 - 1863年,2015页。视图:出版商的网站|谷歌学术搜索
郭和j . c, s . Wang,“基于双向GRU-CRF学习中文分词和CNN网络模型,”国际期刊的技术和人机交互,15卷,不。3,47 - 62、2019页。视图:出版商的网站|谷歌学术搜索
r·r·赵d . Wang Yan, k .毛f .沈和j·王,“机械健康监测使用本地特点的复发性单元网络,”IEEE工业电子产品,卷65,不。2、1539 - 1548年,2017页。视图:出版商的网站|谷歌学术搜索
p .周、w·史和j .田”引起双向长期短期记忆网络关系分类,”协会学报》第54届计算语言学(卷2:短论文),页207 - 212年,柏林,德国,2016年8月。视图:出版商的网站|谷歌学术搜索
林y,沈,z . Liu h .烹调的菜肴和m .太阳,”神经与选择性注意关系提取实例,”协会学报》第54届计算语言学(卷1:长论文),页2124 - 2133年,柏林,德国,2016年8月。视图:出版商的网站|谷歌学术搜索
美国约飞,“批量重正化:在batch-normalized朝着降低minibatch依赖模型,”先进的神经信息处理系统,页1945 - 1953,美国物理研究所,大学公园,医学博士,美国,2017年。视图:谷歌学术搜索
英航j . L。,Kiros J. R., Hinton G. E, Layer normalization, 2016.
张y、p·李和g .周”分类由深BiLSTM事件之间的时间关系,”学报2018年国际会议上对亚洲语言处理(IALP)万隆,页267 - 272年,印度尼西亚,2018年11月。视图:出版商的网站|谷歌学术搜索
l . i Pei-Feng z Guo-Dong, z Qiao-Ming,“基于语义的联合模型的中国事件触发提取、”软件学报,27卷,不。2、280 - 294年,2016页。视图:谷歌学术搜索
c . Kruengkrai k . Torisawa c .桥本j . Kloetzer j .哦,和m .田中”改善与多个事件因果关系识别背景知识来源使用多列卷积神经网络”美国31日AAAI会议上人工智能,页3466 - 3473年,旧金山,美国,2017年2月。视图:谷歌学术搜索