文摘
随着全球城市发展,核电站(不要在我家后院)危机一直是一个复杂的社会问题,这需要紧急补救措施。城市固体垃圾(垃圾)的不可避免的管理一直是风险管理最艰难的任务之一在全球现代化进程。目前,某些模糊和非结构化的结果和方法已经形成了MSW-NIMBY危机的反应,主要集中在社会学和政治分散在复杂和敏感和新闻报道。针对提高数据挖掘的效率从特定的稀疏文本MSW-NIMBY危机,一种改进的知识提取方法。通过基于规则的文本挖掘和复杂网络分析,实体关系(ER)网络MSW-NIMBY危机正在重建。与此同时,一种新的实体之间的关系的动词的语义分析提出了提高信息提取的可行性和准确性。MSW-NIMBY危机演变的特点和规律和经验的危机治理可以有效识别。结果表明,知识集成和ER传递性可以提高知识识别和主要的其他因素,这可能有助于制定地区性危机的治理策略的学术文本。
1。介绍
随着现代化和城市化的发展,环境冲突一直是全球最大的焦点和城市可持续发展的问题。人们普遍认为,一些负面影响的设施建在这个过程中,如核电站、垃圾焚烧炉植物、污水处理厂等。1- - - - - -3]。它广泛引起电阻和周边居民和地方政府之间的冲突4),这种现象称为“反对者”(5]。1970年代后,随着越来越多的国家和地区已经实现了工业化,反对者们逐渐成为世界性的问题。以美国为例,反对者们造成了几乎一半的清洁能源项目被推迟或放弃(6),而81年只有8有毒废物处置场所将于1980年和1987年之间建造成功完成(7]。各种类型的核电站设施对社会的影响是复杂和多样化的性质(8),由于不确定性和风险是不断变化的类型和利益相关方的利益9]。另一方面,地区性危机涉及群众的利益和高度敏感的政治决策。很难解决一旦出现,已成为一个严重的“现代性”的跨国世界面临的风险10]。提高公众的环境意识和社区生活标准,和媒体的快速发展也大大加速了地区性爆发危机11),特别是在发展中国家人口密度高。城市内的反对者们抗议运动上升造成的垃圾已成为一个严重的挑战在中国城市化过程中(12]。
直到2019年,大约有330在中国垃圾焚烧设施(13),但从2007年到2016年,每年有超过五anti-incinerator示威,焚烧设施的搬迁(14]。连续批评和抗议发生在中国近年来显示众多参与者的显著特点,不可预知的倾向,强烈的扩散系数,迫切需要系统的解决方案。MSW-NIMBY危机一旦发生,它通常创造居民之间的紧张关系,地方政府和私营部门,导致阻碍废物处置,导致政府信任危机,甚至引发大规模的公共活动(15]。如何缓解垃圾地区性危机管理将产生可持续的全球影响。虽然现有文献没有重视这个问题,它已经成为城市固体垃圾管理困境的关键,加强城市规划和发展控制,促进生态文明的建设和环境可持续性16,17]。
核电站危机的研究在中国的背景下显示磁滞,与许多西方国家相比。它主要侧重于相关的概念18),影响因素(15,19,控制措施20.),和相关的解决经验21),但他们中的大多数使用定性和常用的方法,如焦点访谈,分析公众参与的有效性(22),案例分析研究政府战略定位23),和促进公众参与24),等有相对简单的研究类型。定量研究只是关注核电站设施的选址(25)和其他方面主要使用结构化面试(26),调查问卷(27),和其他积极的方法进行统计分析。尽管学者在这一领域不断创新的研究方法在MSW-NIMBY危机,还有缺乏科学的定量方法来丰富MSW-NIMBY危机治理的理论基础。这是因为核电站的问题通常有很强的政治敏感性,涉及国家和社会稳定的问题。很难从开放存取资源获得权威的数据或信息,如不够浪费服务在发展中国家28]。它导致研究等政治敏感问题上有一定的局限性,并没有形成一个完整的方法体系。因此,我们工作的主要贡献可以总结如下:(我)构建一个系统的知识集成的方法对于复杂的和分散的信息,并提供参考文本研究政治敏感问题。(2)ER网络MSW-NIMBY危机重建,这可能有助于找到关键信息和关系,小说中动词的语义分析提出改善文本分析的可行性和准确性。(3)小说中动词的语义分析的应用可以帮助识别有效MSW-NIMBY危机的特点和规律,它提供了方法支持其他地区性危机治理。
本文的其余部分组织如下:它地址相关的分析工作MSW-NIMBY危机以及部分2。部分3描述了使用网络的方法详细研究。完整的实验和应用MSW-NIMBY危机提出了部分4。节5分析结果显示,挖掘信息和知识在这个领域。结论给出了部分6。
2。相关工作
本研究旨在从文本信息获取有价值的知识。这种类型的文本处理技术,从自然语言文本中提取指定类型的非结构化信息并将其转换为结构化数据输出被称为信息提取(29日]。ER提取是最重要和困难的内容之一,也是一个关键中文文本知识的集成和分析,特别是社会科学问题。中国ER萃取的方法创新是基于双向最大熵马尔可夫模型(30.)、本体和双向长期短期记忆(31日),提高提取的精度和可操作性。信息提取技术具有广泛的研究和应用领域的医学、卫生、交通、和人工智能(32- - - - - -34]。然而,当前研究领域的MSW-NIMBY没有一个统一的规范或标准表达式,和语义分析对中国的研究是有限的。更准确的指导选择提取方法来识别实体基于规则之间的关系。
MSW-NIMBY危机此外,现有的研究大多集中在解释结果的地区性冲突和决策对核电站设施,与多个理论和方法(35]。可是所有的动物都在很大程度上被忽视的非人类因素的作用也在这样的争议,不确定在所有的交互因素(36),因此一些学者呼吁社会研究地区性危机及其互动与所有因素(37,38]。已经讨论了核电站是一个动态的、复杂的问题,涉及复杂的实体,包括概念、组织部门、政策措施、影响因素39]等。它的特点是解不开的关系在社会、自然、和材料因素(40),麻烦在社会学研究的理解和分析。在试图开发一个更复杂的方法分析核电站危机的内在关系,复杂网络占据了显著的位置,是因为其强大的影响理论和实证社会学研究[41]。
复杂网络不仅关注个体之间的紧密的相互依存和其他客观系统中(42),但也一直关注的整体交互系统从整体的角度来看(43]。它可以分析结构组成和关系组件的系统,否则无法确定使用其他技术(44]。复杂网络掌握复杂系统的内部机制和制度特征,如核电站,并提供合理的网络指标定量分析,即通过社会网络分析(SNA)的方法45),解决地区性问题。这种研究以网络的形式主要是用于信息科学、环境科学、地理、生物医学等。46]。在垃圾和地区性,有许多学者利用网络表达研究公众的接受新能源基础设施(47),地区性的激进主义和组织活动的发展48,49在废物管理[],利益相关者之间的关系50]等。现有的大多数研究主要是表达形式的ER网络(51),即实体和它们之间的关系是直接从现实世界中抽象和网络的形式。
ER网络可以找到一个复杂系统的通用性在一个统一的框架下通过抽象实体具有不同属性节点,使用链接来表示实体之间的关系,然后量化网络结构的索引节点和链接作为组件(52]。在自然语言中,ER的不连续结构可以表示语义单位如单词、句子和段落,反映信息从文本作为一个网络。这是基于每个单词或短语与语言相关的约束,建立了映射到一个节点和边根据句法关系53]。这样的文本表示允许基本的人类行为的调查54]。例如,表达消息设置为一个无向图中的词(55),排名事件基于事件关系图一个文档(56],表示实体之间的关系由Multi-Entity贝叶斯网络(57),等等。基于网络模型的方法是有效的,因为它可以获得全球信息网络综合,即全球信息的文本,通过迭代计算58]。请注意,有一个问题,有关单位以外的特定单词的存在在网络可能会妨碍准确识别的模式。虽然几个可用的方法掌握ER之间所有单词或特定类别的单词作为复杂网络的特征(59,60),只有少数研究关注解决精度不足的问题和困难,把握网络的重点由文本信息。从这个意义上说,本文构造一个网络文本表示通过引入传递表达的关系,分析它更清楚。
科学文献通常包含大量的信息和知识,和储存丰富的研究成果。灵感来自ER网络,ER的一系列规则提取和传递关系模型可以建立从科学文献获取整体MSW-NIMBY危机的信息更准确,并提供一个解决环境冲突像MSW-NIMBY危机。
3所示。MSW-NIMBY危机网络
在本节中,我们提出并解释所有方法用于构造MSW-NIMBY危机网络。提出了基于规则的ER提取为MSW-NIMBY符合汉语句法结构信息提取。传递关系模型是由引入传递性以优化ER网络。这项研究的最终目的是挖掘有价值的信息从MSW-NIMBY ER网络危机。网络分析系统网络体系结构(SNA)是一种常见的方法,侧重于用社交网络的特性与数学方法(61年,62年]。结构网络分析方法着重于结构、模式、拓扑复杂性,影响交互的实体(63年,64年]。
为了建立MSW-NIMBY危机网络,我们提出一系列方法适应特定需求的管理域,如图1。
从提取ER三元组的句子语义注释和定制的规则提取、ER三元组的传播关系重建和重新解释小说传递关系模型。在网络分析,宏观层面和微观层面的综合学科可以分析和测量系统网络体系结构(SNA) (65年]。
3.1。基于规则的ER MSW-NIMBY提取
ER提取是信息提取的一个至关重要的部分,这是一个文本处理技术提取实体、关系、事件,从自然语言和其他非结构化的信息,将它们转化为结构化数据输出(66年]。它的任务是提取三(Entity1,的关系,Entity2从文本),(Entity1,Entity2)是一个实体对一些关系,“的关系”是词或连续的英语单词描述语义上下文中的实体之间的关系。例如,在文本”核电站设施产生负外部性的影响,“呃三(核电站设施、生成、负外部性影响)可以提取建立连接。也就是说,有一个关系”生成“之间”核电站设施”和“负外部性影响。”
是不方便提前指定的分类关系open-domain信息提取。此外,遗漏的内容和语义判断是必要的在提取复杂的句子。有一个常见的方法,使用语料库中的词汇代表ER模型的关系(67年)和提取所有类型的关系,存在于文本,因为大多数邻国之间的句法关系发生单词在同一个句子(68年]。摘要定制open-domain监督提取规则信息提取。它包括制定提前语义注释的模板为分词和语义角色标注的中国语言,和构建句子规则提取ER三元组。
3.1.1。模板的语义注释
模板应用于处理分词和语义角色标注。它使用特定的标签标记语义单位的角色如文本中的词或短语(69年),并完成分词当判断这些语义单位。通过这种方式,它可以正式代表的作用特点和主题连接语义单位在文本。指定的语义模板注释MSW-NIMBY的研究,包括角色标签和描述,如表所示1。
对于科学研究的文本,手动分词和标注可以做句子的语义单位,根据他们的语义和功能。他们是based-rules ER提取的前提。我们使用AE行动的执行者,它主要代表了主题句子,和行动执行人的具体行动,包括谓语动词或动词连接。基于“增大化现实”技术是一个动作接收器和IAR接收机是一种间接的行动,表示为直接宾语和间接宾语,分别在句子结构。预科和连词是连词和介词,两者都是不可或缺的部分分析句子的结构和语义。为了代表preposition-object结构在英语中,POBJ用于标签的对象介词与介词表达了一起行动。此外,组件作为一个状语可以省略在人工注释简化提取规则,或被保留更好地理解和提取句子,状语等方式(人)、目的(PRP),原因(REA),背景(BGD),条件(CND)、时间(TMP)、位置(LOC)等。因为它的定义是模糊的,这不是本研究的重点。
3.1.2。句子的规则提取
ER三元组几乎只出现在句法结构稳定,虽然在中国的语义表达式很复杂。有许多语法类型包含关系提取特征,如主谓,Predicate-Object, Preposition-Object、和协调等70年]。一组句子规则MSW-NIMBY ER提取的中国构建基于句法分析66年]。它是基于24种依赖关系提出的LTP (HIT-SCIR语言技术平台)(哈尔滨工业大学)71年]。它可以广义的组合词,词性标记,依赖路径,和依赖路径上的标签(72年]。我们定义逻辑表达和图形显示句子规则依照上面的标签模板中提取语义注释以及ER三元组的某些规则,如表所示2。矩形块代表带注释的语义单位,和箭头的曲线代表这两个单位之间的依赖关系,它是用来解释特定的关系(这些都是下面列出)。
这种基于规则的ER提取可以用于文本信息:使用语义注释的模板来阐明每个语义单元及其作用,然后提取文本信息中的ER三元组根据句子的规则。的具体应用Rule1-Rule6解释如下:(我)简单的语言结构。规则1通常使用的语言结构,动词充当谓语的短语和可能的关系词。为一个实体,一个是主语的谓语,而其他的对象是谓词,而取决于谓语词标签SBV和VOB(这些指的是那种依赖从HIT-SCIR LTP定义的标签。http://www.ltp-cloud.com/intro)。三倍(核电站设施、生成、负外部性影响)可以从句子中提取”核电站设施产生负外部性的影响”。我们可以很容易地提取这种基于规则1 ER三元组。(2)双对象结构。Rule2适用于双对象结构。这句话”政府的优惠政策给居民“作为一个例子,它应该贴上“[AE政府][行动给了][IAR居民][基于“增大化现实”技术优惠政策根据表)”1。也就是说,有一个主谓关系(AE(越南)之间政府]和[行动给了],[阿拉伯文优惠政策)的直接接收行动(行动给了VOB它们之间的依赖关系。(IAR居民][间接接收方的行动给了),即间接宾语(伯)依赖于它。内容应该在最大程度保留在不违反句子的原意,所以两个三元组(政府给予优惠政策)和(政府给予优惠政策,居住可以提取)。(3)轻动词结构。在汉语中有许多轻动词结构表达式,表示为preposition-object结构在英语。例如,在句子“政府与公民达成协议”,它通常被表达为“政府与公民达成协议“在中国,“与…达成协议”是一个典型的中国轻动词结构。(AE政府]的主题直接取决于光动词(行动使由SBV],[阿拉伯文一项协议)的对象取决于轻动词(行动使通过VOB),这显然是在规则1类似。与此同时(POBJ公民)是介词(预科与)作为介词对象,间接地取决于光动词POB和放置这个结构可以处理规则3,所以两个三元组(达成协议,政府的公民)和(政府,达成协议)应该提取。此外,不及物动词的结构,它也可以被视为轻动词结构ER萃取(73年]。例如,句子”公众在街上抗议“翻译成中文给我们”街上的公共抗议”。没有语言对象后,不及物动词(行动抗议]、[AE公众]、[准备在],[POBJ街上)与上述光一样的依赖关系动词结构。在这个时候,只有一个的三倍(公众抗议,街上)可以提取,不能省略介词确保语义的完整性。(iv)协调结构。规则4添加一个连接和一个动作接收器根据规则1,用于协调结构。这个连词连接两个动作接收器表达一种协调关系,两者都可以贴上AR(尊敬的阿里和ARII为了理解提取规则)。额外的动作接收器依赖于相同的角色与另一个动作接收器由首席运营官,取决于小伙子的结合。其他标签与规则1和依赖关系是相同的。这种句子结构协调可以提取两个三元组。例如,句子”垃圾焚化厂提供就业机会和财政收入“可以提取两个三元组(垃圾焚化厂,提供就业机会)和(垃圾焚化厂,提供了财政收入)。这个规则也适用于行动执行人的结构协调他们之间的关系,和原则是相同的。(v)多个结构。有多种提取方法可用于相同的句子。特别是,中国表达灵活和不同,一个句子往往包含多个结构。例如,句子”这种方式通过沟通和理解使利润”表示在中国可以被理解为一个状语从句。标注为“(AE这种方式][准备通过][MNR交流和理解]来(法使][基于“增大化现实”技术利润]。“条款通常遵循一个介词,取决于POB, Preposition-Object的结构。预科+状语从句的注释是用来表达这个句子结构更清晰,也应用于其他状语从句。Rule5适用于上述情况。“(MNR交流和理解”意义提取特定的礼仪可以省略,且仅考虑(AE的依赖关系这种方式]、[行动使]和[阿拉伯文利润)根据规则1可以提取三(这样,使利润)。同时,这句话也可以理解为目的的状语从句,注解为“(AE这种方式][行动通过][基于“增大化现实”技术交流和理解][准备来][PRP赚取利润]。“这符合的依赖结构规则6,所以三(这种方式,通过交流和理解)可以以类似的方式提取。Rule5的提取规则和规则6强调有不同的提取方法和结果相同的句子。
中国文章的写作风格后,有丰富的复杂表达式格式,可以分成多个注释和提取多个简单句。,一个简单的句子的结构主要是由Rule1-Rule6,合适的基础和规则提取。
为了最大化信息的完整性和正确性,并确保的可行性分析,基于规则的ER提取MSW-NIMBY遵循这些原则:(我)多个注释和提取的方法可以实现同样的句子。例如,考虑到从句作为一个单一的句子提取,提取所有方法符合句子结构应该尽可能多的应用,并保留所有这些结果。(2)手工语义标注需要掌握语义和词性的中国人,可以制定培训和统一监管标签人员之前注释。(3)并不是所有内容中出现的文本需要注释。内容的主要部分应该保留注释时,而毫无意义的内容尽可能省略。
3.2。小说传递关系模型
ER从科学文献中提取的三元组的信息是众多而复杂的,而且很难找到研究的关键。这部分结构传递关系模型和演示效果与多个关系传播,为了我的重要信息文本。
传递关系模型的原理是,当Entity1三是一样的Entity2在另三倍,这两个三元组之间的传递关系建立。新的关系也产生了连贯地,根据传递性的特点。传递关系模型的原理和例子如图所示2。
这是一个例子:与传递关系模型,Triple1 (各种方式,面对地区性项目)和Triple2 (核电站项目,面临大规模的反对)可以表示为(各种方式,面对地区性项目,是面对大众的反对)。因此,一种间接关系”不同的方式”和“大规模的反对”构造。没有紧张的问题在中国的表情,在英语表达中,因此更容易统一实体构建关系的表达式。后传播的关系是一种间接的关系,更复杂的表达式,不发挥重要作用。因此,特定的实体可以忽略间接关系,它只是被视为一个不确定它们之间的关系。传递的新奇ER利用率可以帮助信息接收机获得要点迅速没有很多噪音筛查工作。
为了描述ER传输网络,成对关系重建的进展,如图3。显然,nonvital ER信息传递关系逐渐被丢弃。传递关系的重建可以迭代实现。,有三个ER在原件三元组,可以构造连续的传递关系,这被视为第二个传递关系。以同样的方式表达的多个传递关系。经过多次关系传播,信息实体之间的联系和变化的ER网络表达如下:
f代表实体的节点,而它们之间的边表示的关系从Entity1 Entity2 ER。后,网络中节点和边传播有巨大的变化,与直接的次数。它可以直观地反映出节点的类型逐渐减少而幸存的节点之间的边逐渐增加,随着传播的时间增加。但是,值得注意的是,如果传输足够大的时候,太多的节点和边可以省略,这不能完成信息挖掘在网络分析的目的。传播的时间需要根据实际确定传递关系的影响在不同的问题。
简而言之,与传递关系模型、实体更紧密相连,而减少它的类型和数量增加。实体信息的主要和次要地位仍保持,只有放大的主要信息,并在一定程度上削弱次要信息。通过这种方式,可以凸显了网络中的重要节点和结构之间的关系,以便更容易分析和研究潜在的知识在MSW-NIMBY危机中基于文本信息。
4所示。应用程序分析MSW-NIMBY危机
在本节中,我们将演示如何实现ER网络MSW-NIMBY危机的分析过程。首先,ER提取详细证明过程中,通过基于规则的提取。然后,我们执行多个传输关系提取的ER和分析其实际效果,并确定最优的传播最终MSW-NIMBY ER网络分析的危机。
4.1。ER提取
ER MSW-NIMBY危机的提取,得到了相关科学文献和筛选文献数据库。然后,ER三元组是提取的基于规则的,最后提取的实体是过滤和改善的准确性和标准化统一从文献实体信息。
以下4.4.1。数据集选择
由于核电站的地区差异,CNKI数据库(纸的最全面的数据库收集在中国https://www.cnki.net/)选择的数据源MSW-NIMBY在中国。“浪费”的主题和关键字“反对者”,463年的科学文献收集在2019年之前从CNKI数据库高级搜索。执行整个过程从以下七个方面:删除所有的论文,将北大中文核心期刊目录定位为标准,全面考虑出版时间,时报引用次下载,基金支持,核心期刊定位。
作为一个快速发展的国家,MSW-NIMBY紧急在中国是一个相对新的核电站领域的问题。但只要是中国城市化的进展,MSW-NIMBY可能是一个严重的问题基于发达国家的历史。我们推导出关键文献(见表3)主要包含管理建议和社会分析MSW-NIMBY事件,涵盖大部分的观点和策略MSW-NIMBY危机在中国在某种程度上。
4.1.2。注释和提取
根据abovedefined方法基于规则的提取,提取ER来自13个文章MSW-NIMBY危机有关。
这13篇文章的内容大致分为语义单元的体积通过Jieba中文文本分割(Python组件的中文分词https://github.com/fxsjy/jieba)。根据语义注释的模板,每个语义单元是手工判断和语义标记,在分配前的词性的语法结构。专注于注释的句法结构的语义单位,巨大的ER三元组(Entity1、关系Entity2) MSW-NIMBY危机根据句子中提取规则。上述期间完成手动处理。为了尽可能提高ER提取的准确性,采用严格的提取工艺在实际提取ER三元组:(我)首先,可以制定统一的监管培训标签人员标签之前。(2)第二是抽样检验和一致性测试由多个人们反复经过多轮的标签。如果超过3人批准相同的标签,它被认为是可用的。(3)最后,多个随机筛选是由多人和reextracting它如果有更多的不正确。
在信息提取、实体消歧也是一个重要组成部分,它用于解决问题引起的歧义具有相同名称的实体(74年]。实体消歧时完成三元组被提取后注释,因为构造句子语义模板和规则是基于上下文的语义关系。
4.1.3。过滤和统一的实体
由于强烈的主体性人工注释,注释内容更加复杂。此外,科学文献的表达是多方面的,涉及的范围很广,信息。实体提取后过滤和统一的三倍,为了规范矿业信息的实体表达反映在文本定向和准确。
在这个过程中,实体的长度超过10个字符过滤,和包含它们的所有三元组也同时删除。然后,提取的ER三元组是过滤和建设统一命名的停止词列表和同义词列表。百度停止词删除英语单词(75年)是利用。如果一个实体出现在这些停止的话,所有的ER三元组,它的存在是过滤识别更准确的ER。基于频率提取的信息,每个实体的同义词列表是定制的MSW-NIMBY危机统一和规范的表达实体。这是通过使用同义词(中国同义词自然语言处理和理解https://github.com/huyingxi/Synonyms),它可以自动提供同义词和相似性为中国词基于Word2vec模型(76年]。通过计算词语之间的相似度,提取的实体具有相同含义的三元组取而代之的是一个统一的表达式基于词频统计的高频实体。
4.1.4。提取ER的有效性检查
提取的ER信息包含1954个实体和1660 ER最终的统计与高频实体按频率,如表所示4。
高频交易实体的信息反映了主体参与地区性问题的研究,通常是集中在这个领域。例如,“公共”,“政府”和“地方政府”无疑是MSW-NIMBY在现实世界的不可避免的话题。更重要的是,频率统计信息符合Zipf定律(77年]。也就是说,如果这句话是按发生频率、频率几乎是排名完全成反比。
Zipf 202高频实体信息分布频率大于3如图4,包括Zipf频率分布与对数轴。频率和等级之间的对数分布接近一条直线,它可以被视为符合Zipf定律。它表明通过介绍语料库中的高频词的一小部分,大部分的信息在整个语料库可以被理解。这一点也适用于一个单一的文章,这是有效使用实体信息来分析文本信息。
(一)
(b)
表5揭示了ER输出的摘录。没有紧张的问题在中国句子的单词,所以呃三元组的意义只有在这里表达英语,和他们的紧张可以忽略。
4.2。多个MSW-NIMBY危机传播的关系
直接从文本提取ER表达的网络无序层次结构的缺陷,错综复杂的关系,和模棱两可的优先级。这些可以避免传递关系模型中,一种关系数据挖掘的方法。多个关系传播的目的是将提取的三元组不止一次,然后比较和nontransmitted和传播ER网络拓扑参数的分析找出最合适的时候传递表达式研究MSW-NIMBY危机的问题。
4.2.1。准备ER传输
提取的ER三元组的相关文献传递关系处理的模型。如果相同的Entity1和Entity2存在于两个不同的三元组,这些三元组之间的关系建立与传递性的逻辑。有一个每一对在这三个不同实体之间的关系,以及三元组不被丢弃。重复此操作,我们可以观察到的变化的输出传递关系实验期间,关于实体的数量和ER。第三传递的信息表示的关系更为集中的实体和明确的关系,而第四传递关系表示实体的数量已经大大减少,其操作太长时间运行,实现有效的分析。因此,只有原始的ER信息和网络分析前三个传输保留。
4.2.2。ER网络属性的比较和分析
原来的ER和传播ER表达形式的网络,网络的有向图是由实体边缘节点及其实体之间的关系。Gephi ER网络用于计算各种参数,代表网络的属性。Gephi是一个开源的网络探索和操作软件,它提供了功能,如高质量的布局算法,聚类,具体特征和样本过滤的网络(78年]。它还提供了计算和统计分布的拓扑参数的函数,并给出了计算结果表6。
的参数进行了比较和分析ER网络属性在不同的时间传输完成,以便得到最好的传递关系模型的表达式。参数的变化,分析显示为数字5- - - - - -7。观察到,网络传播具有更明显的特征。
(一)
(b)
(一)
(b)
(1)加强实体连接。平均学历代表了每个节点的连接的边平均数量。其线性上升表明剩余的实体连接到越来越多的其他实体,前者更重要的是,作为传输的次数增加。图密度反映了网络中节点的亲密,和它的变化表明,实体之间的关系越来越紧密。网络没有传输太分散,它的密度几乎是零,因为它是由大规模的ER三元组个人直接从自然语言文本中提取。然而,传输时间的增加,图密度线性上升趋势的分散结构。研究这个复杂的问题,它反映了ER网络与第二传输有一个更严格的实体连接在某种程度上。
(2)细化模块划分。模块化指数用来衡量网络的力量分为模块(也称为组、集群或社区)。这个数据表明,模块化指数逐渐降低,因为信息实体之间的紧密联系的数量减少实体属于社区,即类别或模块。它间接地反映了精致的模块划分与增加传输时间。实体的数量在每个社区越来越多,和关闭实体连接在同一模块将产生负面影响。一般而言,模块化指数大于0.44,这意味着网络已经达到一定程度的模块化。复杂问题的丰富的实体,可以把握的要点提炼模块划分在第二传输。
(3)高内聚的聚类。网络平均距离反映了网络中节点之间的分离度。它逐渐降低,表明实体之间的联系越来越紧密,和节点更与其他过滤分离。同样,其下降趋势也会减缓第二次传播。聚类系数显示了所谓的“小世界”的影响和网络平均距离在一起,这样他们就可以显示一些整体节点集群或凝结的迹象。与ER网络没有传输相比,每个实体在ER网络往往会形成一个相对高内聚的聚类后传播,但《纽约时报》的传播对聚类系数几乎没有影响。
通过综合分析各种网络传输属性在不同的时间关系,它与第二个发现ER网络传播的特征越明显紧缩实体连接,精致的模块划分,和高内聚的聚类。同时,它并没有削弱的影响关系传播。因此,它更适合研究MSW-NIMBY危机。它可以直接用于ER网络结构分析和挖掘潜在的信息。
5。结果与讨论
ER网络与第二个关系传输应用于分析和挖掘信息详细的系统网络体系结构(SNA)的方法,从宏观和微观方面。它可能是有用的揭示一些一般性的发现提供MSW-NIMBY研究领域的知识。
5.1。宏观层面的ER网络分析
与原来的ER网络相比,ER网络与第二个关系传播的宏观层面分析了ER网络。它显示的优化影响传递关系模型在文本信息提取更直观。
有两个ER网络与原和第二传输。.Size设置节点度的节点,节点的颜色/不同的模块,和边缘的颜色取决于其连接节点的颜色。然后,nontransmission的网络结构和第二传输显示在Fruchterman和Reingold[的布局79年),以更大的对称和当地的聚合。这两个网络的比较显示在图中8。
(一)
(b)
从宏观层面来看,ER网络没有传输太分散在同样的参数设置和布局算法。据统计,它分为442个社区。即使模块化指数达到0.88,聚类系数只有0.03,因为模块化结构尚未形成与太多的小社区。除此之外,整体节点的大小太小判断不同实体的重要性。有很多无用的信息的干扰整体网络结构的分析,其结果在把握关键的困难。
相反,ER的模块化网络与第二传输相对明确,分为9个社区。主要的社区和实体是比以前更明显的传播,尽管实体在一些社区的总数很小。因此,在同样设置ER网络,文献中提到的关键信息与高内聚和低耦合更加突出,和更容易使用ER网络相关问题的研究。
5.2。微观层面的ER网络分析
从微观层面上来看,ER网络分析和知识挖掘可以从多个方面,实现在第二个关系传播。ER网络的模块化和介数中心选择的获取知识,包括通用MSW-NIMBY危机的对策提出的专家,以及研究重点和一般的想法。
5.2.1。ER网络分析和模块化
ER网络与第二个关系传播,模块化是明确和不同的颜色,和一个社区网络选择的深入分析来研究复杂问题的一个方面。
虽然实体过滤和统一在ER提取,结果提出了可视化仍然轻微缺陷是由于人工注释的主观性和不完备。为了分析本地网络更好,更明显的过滤和手动删除无用的信息,和节点合并有相似的含义。最后,仍有466个节点和2742个边缘与第二个关系网络中传播。同时,显示在上面的设置和布局一样,只有一个显示ER网络社区掌握关键信息的一个方面,它包含26节点边缘可见(5.53%)和70(2.55%可见)。英语显示节点的标签,一个社区的ER网络与第二传输图所示9。
这个社区最大的节点的标签是“反对者”,“研究”和“策略”,和其他节点,几乎指出的措施和建议。显然,从这个社区,共同和通用策略和建议MSW-NIMBY危机可以从现有的研究获得的结果如下:(我)专家管理有助于提高操作规程、风险预测、环境治理,确保损失评估。(2)不同决策优化引入媒体和监管政策应该监管系统中的应用。(3)必要的利益补偿机制,风险沟通和损失补偿,加强教育、建立畅通的通信通道,自组织规则可以增强居民保障居民的权益。
上述结果表明,提出的焦点主要包括环境的视角,监督和居民权益的策略MSW-NIMBY危机。
这些都是现有的文章中提到的主要部分MSW-NIMBY危机的对策。此外,“轻微的请愿书”的节点是远离网络其他节点的位置,也似乎不合适的内容。从网络结构的角度来看,这个节点穿透到橙色集团位于图的地方9。大多数信息的节点在这个领域有一些公共机构在地区性事件的关注和反思。可以看出请愿事件与公共机构密切,如生态环境、国家环境保护局,因为人们常常请愿书这些机构来满足他们的需求。请愿事件也是学者MSW-NIMBY危机治理的研究指出,所以它仍然属于社区的策略和建议。
5.2.2。ER网络分析与介数中心
ER网络的微观层面分析可以揭示每个节点的特点和获取更多有价值的信息,比如中间性的中心节点,这意味着如果一个节点被许多最短路径遍历,网络中的节点非常中央(80年]。这些实体的ER网络现有的研究的重点,它不仅密切连接其他实体中扮演重要的角色,但也反映出大多数MSW-NIMBY危机特点和现象。
关系传播的原则是建立关系通过相同的实体。所以,这些实体的中间性中心一定会变得更大,与关系网络中发挥核心作用的传播。ER网络MSW-NIMBY危机与第二传输的中间性中心有大量分布值,和最高的20个节点有足够的分析重点。前20名的节点介数中心和频率(见表7)是高度重叠,表明这些关键节点是当前在中国MSW-NIMBY研究中的热门话题。节点的大小代表介数中心和颜色的深度代表实体的频率,来构造一个ER网络。这两个指标可以更直观地呈现信息的ER网络如图10。
和ER网络的统计数据显示,关键构造传递关系MSW-NIMBY危机不仅是其研究的关键字,如“浪费”,“反对者”,和“研究”,但也主要是各种学科,包括公共或居民,政府或当地政府机构等。大部分专家倾向于探索这个复杂的固有特性和演化问题从不同学科的角度。大多数研究地区性危机形成的一般逻辑。基于分析问题的原因,有关冲突、利益,环境,等等,提出了危机治理的对策。它包括评估核电站项目和设施环境问题,清除多个主体之间的对话渠道,保障人民的参与权利,等等。
6。结论
从不同的角度和担忧,可以从ER网络获得更多的知识。它涵盖了MSW-NIMBY危机的理论研究成果,在一定程度上具有重要意义。下面的结果可以反映垃圾管理随着城市化的现实:(我)从学者的角度来看,“公共”的重要性在影响的地区性普遍是一致的,而专家的角色是不稳定的。公众的认识缺乏专业的指导,所以将会有高的声音,太强烈的公众的行为。因此,公众和政府之间的紧密联系已经成为一种对抗。例如,政府将给予称号垃圾焚烧植物与模棱两可的话,例如“绿色能源”。(2)从公众的角度来看,“谈话,”活动的“参与”和“评估”太远离对方,尤其是多代理协会稀少。因此,公众的力量无法满足有效,组织很容易分解,和公共组织的可持续性挑战非常。例如,毫无疑问,大多数的公众抗议组织自愿的轻易结束。(3)从关联的角度来看,“效益”已被搁置。事实上,地区性冲突是不平衡的结果分配利益和损害赔偿金。然而,地区性事件触发其他社会冲突和历史问题容易,但它削弱了反对者们的利益纠纷问题。这也解释了为什么“好处”不是最关键的政府与公众之间的链接点。
此外,我们可以认为在现阶段,政府反对者们采取了一种更加灵活的方式,和公众组织仍不能在现有制度下持续发展。存在邻避事件的演变可以产生危害和导数容易扩大影响范围。因此,仍有很长的路转换城市未来协商民主和开放的决策。
结果表明,开发的基于规则的信息提取的方法是普遍存在的,并且可以应用到管理其他研究领域的知识,尤其是政治敏感性的领域或专业。此外,transitivity-enhanced ER表达的信息挖掘技术克服了障碍的复杂语义和稀疏的语料库,帮助研究人员全面了解隐藏在大量科学文献知识。通过这种方法,可以为决策者提供更多信息,基于有限的数据和充分利用它。值得注意的是,学者们的研究重点和框架MSW-NIMBY危机得到,以及危机管理的对策和管理现有的集成研究。
目前,很少有研究地区性危机治理信息提取,和政治敏感性的研究等问题还没有形成一个完整的方法体系。虽然我们有效地传递性介绍给我信息,仍有挑战,沉重的工作量和强烈的主体性从许多科学文献中提取有价值的信息,因为众多的现有研究成果和其持续增长。因此,未来的工作应包括改善从文本信息提取的效率和精度,为了挖掘和整合现有研究成果更好的获取知识。此外,它可以继续我的ER网络中的信息基于更多和更新的研究文献,并进一步提供理论依据为地区性危机治理在城市。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称他们没有利益冲突的报道。
确认
这项研究的部分资金由中国国家社会科学基金重大项目(批准号16 zda045)。