TY -的A2 -元,Manman盟——他,Lanfei盟——张,贵院非盟-李,给非盟-肖,彭盟——魏梓鸣AU - Cheng徐盟——瞿Shaocheng PY - 2022 DA - 2022/02/07 TI -中国命名实体识别模型的维护记录电力主要设备基于渐进Multitype特征融合SP - 8114217六世- 2022 AB -目前,中国国家电网公司积累了大量的电力主要设备维护记录。不幸的是,大多数这些导致困难的非结构化数据记录分析和利用它们。自然语言处理技术的出现和深度学习方法为非结构化文本数据提供一个解决方案。提出了一种渐进multitype特征融合模型识别中文命名实体非结构化电力主要设备维护记录。首先,维护记录的文本特征和词分离困难进行了分析,然后7主要实体类别的权力技术术语选择了从非结构化维护记录,和3452年维护记录由这些类别标签,这是所谓的EPE-MR训练数据集。其次,标准测试报告,标准的维护和故障分析报告三种类型的电力主要设备(即主变压器、断路器和隔离开关)用作语料库训练字符嵌入为了获得某些词表示的能力维护记录。之后,进步的多级激进分子特征提取模块旨在获得详细和语义信息,以分层的方式。此外,激进分子特征表示和字符嵌入连接并送往BiLSTM模块提取上下文信息以提高中国实体识别能力。此外,介绍了CRF处理预测标签之间的依赖关系和输出最优预测序列,可以很容易地获得结构化数据的维护记录。最后,比较实验公共数据集同行,中国《人民日报》语料库和实现EPE-MR数据集,分别显示了该方法的有效性。 SN - 1076-2787 UR - https://doi.org/10.1155/2022/8114217 DO - 10.1155/2022/8114217 JF - Complexity PB - Hindawi KW - ER -