文摘

加权平均是一种有效的方式来解决冲突证据组合在Dempster-Shafer证据理论。然而,这是一个开放的问题如何确定权重合理的证据。尽管许多传统冲突证据组合解决方案基于距离或熵提出了证据,证据权重确定与一个单一的方面,也没有综合考虑其他有用信息的影响权重。因此,它并不能保证权重的确定是最合理的。通过引入深学习冲突证据组合,提出了一种综合方法确定证据权重基于卷积神经网络。以证据为网络输入和相应的重量作为输出,它利用卷积神经网络完全我的潜在有用的信息影响证据权重,为了确定综合权重。此外,我们定义了一个减肥的功能。权重不断优化通过反向传播,实现最佳的减肥时,函数值是最低的。分类实验结果表明,该方法优于传统的基于证据距离或熵和灵活扩展到其他应用领域,可以作为决策融合方法。

1。介绍

在实际应用中,不同来源的信息往往是不确定的,不一致的,模糊的1]。如何有效地处理不确定信息是一个开放的问题。一些数学理论讨论了解决这一问题,如贝叶斯理论(2[],模糊集理论3,4),Dempster-Shafer (d - s)的证据5,6],可能性理论[7,8],D-numbers [9,10],Z-numbers [11,12),粗糙集理论(13,14),和分形理论15,16]。特别是d - s证据理论,作为一个理性的和有效的方法来处理不确定信息,有以下三个优势。首先,它不需要先验概率或满足概率相加性相比,贝叶斯理论。其次,从不同的专家和数据源的信息可以被法官融合的组合规则17),得到更为合理的结果。第三,它可以描述不确定性更灵活和软件包比其他数学理论。因此,它被广泛应用于分类(18,19)、风险评估(20.,21),故障诊断22,23),决策(24,25),等等。

然而,德(26)指出,证据组合会产生反直觉的结果,当有证据之间的冲突。为了克服这一缺陷,学者们进行了深入的研究,提出了各种改进方法。一般来说,现有的方法可以分为两类。一个是修改的法官的组合规则;另一个是修改原始证据。

第一课,一些学者指出,冲突过程中信息丢失的证据组合。所以修改的法官的组合规则的关键是如何分配的冲突,也就是说,子集冲突分配和比例。手中等人建议的冲突应该被分配到空集(27]。勒费弗等人提出一种新颖的改进方法,按比例分配的冲突焦点元素集的信息(28]。Smardndache等人提出了冲突的按比例分配规则命名PCR3 [29日]。修改的法官的组合规则的方法可以在一定程度上解决冲突问题,而这种方法的缺点是破坏良好的性能,如交换性和结合性。所以本文重点是第二种方法。

第二课,最初的证据与权重修正得到加权平均证据。然后,加权平均融合通过法官的证据组合规则来得到合理的结果。因此,加权平均是一种有效的方式来解决冲突证据的组合。然而,这是一个具有挑战性的问题如何决定性证据权重合理。为此,学者们提出了一些新方法。邓邓定义一个新的不确定性度量熵构造证据的权重系数的身体30.]。唐等人提出一种加权熵衡量信念的不确定性通过使用信息质量函数和FOD的规模,以取得证据的重量(31日]。秦等人使用一种新颖的信念Dubois-Prade熵和熵是一个改进版本,阮熵,分配权重的证据(32]。燕等人使用一种改进的信念基于邓小平熵熵确定证据的权重(33]。刘等人提出一种新颖的基于加权证据组合MaxDiff距离(34]。汉等人介绍了证据支持的概念,基于Jousselme距离函数,把所有证据的加权平均(35]。刘等人设计一种改进的加权证据组合方法结合概率距离和冲突系数(36]。肖概括传统Jousselme距离复杂距离测量的复杂冲突证据的基本概率赋值(BPA)函数(37),并使用它作为加权系数修改原始证据(38]。上述方法只使用熵或距离信息来确定权重的不确定性和证据冲突。缺点是权重的确定相当片面,没有全面考虑影响权重的其他有用的信息,如重要性、可靠性、相对论,和未知之间及其内部的信息隐藏证据。因此,这些方法基于证据距离或熵不保证权重的确定是最合理的。

针对强大的自适应学习和信息挖掘功能的卷积神经网络(CNN),我们引入深度学习的冲突证据组合并提出一个全面的方法来确定证据权重基于CNN来解决这个问题。以证据为网络输入和相应的重量作为输出,我们定义了一个减肥的功能。通过反向传播、更新网络参数和影响权重完全我潜在的有用的信息。所以证据综合权重确定和不断优化,最终达到最优时的重量损失函数值最小。与传统算法相比基于证据距离或熵,该方法使权重的确定更加合理的分类应用程序中,可以达到更高的准确率。

总之,总结了本研究的主要贡献如下:(我)与传统方法不同,本文提出了一种综合方法确定证据权重基于CNN(2)证据权重并不确定在一定方面相关的证据,可以全面反映证据之间的关系(3)与传统算法相比基于证据距离或熵,该方法能够实现在应用程序分类准确率更高

本文的其余部分组织如下。部分2介绍了一些相关的基本理论知识对d - s证据理论。部分3提出了一种综合方法确定证据权重基于CNN和介绍该方法的概述,CNN架构和减肥的功能。部分4给出了应用该方法的分类,并分析和讨论了其结果。结论部分5

2。d - s证据理论

d - s证据理论是一种推理系统理论首先提出的法官在1967年和1976年由沙佛进一步发展。与贝叶斯概率理论相比,它能更灵活和有效地处理不确定信息,没有先验概率。因此,它是一个贝叶斯概率理论的延伸。在d - s证据理论的框架,法官的组合规则可用于combinate证据收集来自不同来源,满足交换律和关联的法律。一些关于证据理论的基本概念介绍如下。

定义1(识别的框架)。假设 是一组互斥和详尽的元素 它可以被定义为(31日]。 在哪里 被称为帧的识别(FOD),然后呢 被命名为单个元素的命题或子集。我们定义 幂集包含 元素和可以被描述为 在哪里 情商是一个空集。2)。

定义2(基本概率赋值函数)。双酚a函数 也被称为质量函数,定义为一组映射的力量吗 [0,1][33]。 满足 在质量函数 表示支持的程度 被称为焦点元素或命题。质量功能 在经典的d - s证据理论= 0。

定义3(法官的组合规则)。在d - s证据理论中,可以结合两个BPAs法官的组合规则,定义为追随者(17]: 在这 在哪里 代表了法官的组合规则。 被称为冲突系数,值在0和1之间。更大的 ,两个证据之间的冲突。

定义4(加权平均的证据)。假设 是来自不同数据源的证据收集, 是相应的重量的证据。然后,可以修改原始证据得到加权平均重量的证据: 在这

重量 = 1,表示相应的证据 是一个信息,可以完全可靠。相对较小的重量表明它在证据组合中扮演小角色,和重量等于0,这意味着它可以直接被丢弃。

3所示。基于卷积神经网络确定的证据权重

3.1。该方法的概述

确定证据权重更全面、合理,我们提出一种新颖的方法来确定权重的证据基于CNN。首先,我们把初始BPAs,即证据,作为CNN的输入,和相应的权重被定义为输出。然后,我们定义一个减肥函数和权重不断优化通过反向传播。最后,减肥时可获得最佳的证据权重函数值最小。

3.2。CNN架构

在本节中,介绍了CNN,它包含一个卷积层,两个完全连接层,和一个softmax函数输出层,如图1。最初的BPA 这是一个 被定义为网络的输入向量。 代表在FOD的元素数量,即分类的数据集的数量。卷积操作之前,这些输入向量是结合到证据 矩阵。在那之后,我们选择 卷积核和我之间的潜在的信息包含在和证据。最后,两个完全连接的输出层被送入softmax函数输出层,为了产生概率权重对应于输入的证据。卷积核的大小和softmax函数输出取决于输入证据的数量。

3.3。减肥功能

在冲突证据组合,输入证据 修改输出体重吗 : 在哪里 范围从0到1 是加权平均的证据。修正输入证据之后,最后结合的结果 可以通过法官的证据组合规则结合加权平均 时报》: 在哪里 代表法官的组合规则满足极化率。这意味着单个元素的总信仰程度增加和总信仰程度的多个元素减少当多个相同的证据融合。此外,提供了单个元素的证据的基本概率值是最大的,这个单一元素的基本概率值仍然是最大的两个相同的证据的组合时的法官的组合规则。

输出权重对应输入证据应该决定按照下列规则:(a)之间的相关性越高的输入向量和真正的类别向量是一个炎热的证据,更大的重量对应的输出。(b)越高输入向量和真正的证据分类之间的冲突是一个炎热的向量,相应的输出的重量将会越小,也就是说,证据将贡献相结合的结果。

基于上述规则,我们定义了一个减肥的功能 之间的交叉熵之和所有成对的 获得最佳的证据权重:

在上面的公式中, 代表了训练样本的数量。 是真正的类别一个炎热的向量。 是最后的组合结果。在寻求的过程中最小化损失函数值 , 不满足条件,不断更新网络参数和输出权重不断优化通过反馈。由于法官的组合规则满足极化率、体重正常的证据将会越来越大,和相互矛盾的证据的重量将会越来越小。当 满足条件,即达到最小值时,输出权值达到最优。流动的证据权重的优化是显示在图2

4所示。实验结果和讨论

4.1。实验装置

本节给出了引入加州数据集,数据集生成、参数设置和实验过程。

以下4.4.1。加州大学

加州数据集从加州大学获得时间序列数据挖掘存档(http://www.cs.ucr.edu/eamonn/timeseriesdata/)这是一个公开的和现实世界的时间序列数据集,一直用于分类。来验证该方法的分类能力,加州6日我们进行实验数据集,包括ElectricDevices (ED), UWaveGestureLibraryY (UY) UWaveGestureLibraryZ(是乌斯),CricketX CricketY, CricketZ。ElectricDevices由7711测试样品和包含7类。UWaveGestureLibraryY和UWaveGestureLibraryZ由3582个测试样本,并包含8类。每个CricketX CricketY, CricketZ由390测试样品和包含12个类别。

4.1.2。数据集生成

加州数据集包含属性信息的原始数据,不能直接作为模型的输入,确定证据权重。因此,获得初始BPAs从这些数据集,我们利用BPA代方法的概率神经网络的输出(39]。每个类在加州测试集可以被视为一个元素识别的框架内 这些元素是独家和独立。我们把加州的概率输出测试集BPAs在单个神经网络。多层感知器(MLP)以来,完全卷积网络(FCN),剩余网络(ResNet)被定义为时间序列分类的标准基线(40),这三个单一神经网络用于生成BPAs。测试样品会产生三个证据三个单一神经网络。同样的测试集,预测准确率得到了在三个单一神经网络在结构和性能不同肯定会不都是一样的,所以产生的BPAs三个神经网络将是不同的。换句话说,有一个BPAs之间的冲突。因此,它是合理的,我们使用测试集的概率输出延时,FCN, ResNet冲突证据组合研究的数据集。然而,BPAs神经网络只包含单元素生成的命题。因此,采用人工模拟方法获取BPAs包含多元化的命题。人工合成数据集是由手动收集经典算例从论文融合与冲突的证据。它由21个训练样本和42个测试样本。每个样本在这个数据集包含5部分的证据,用和3类 假设五件在第一个样本被定义为证据 , , , , ,BPAs如下所示。

4.1.3。参数设置

该方法在TensorFlow用反向传播训练亚当来更新网络。亚当的学习速率为0.001, = 0.9, = 0.999, = 1 e-8 [40]。第二种类型的随机数据集分为训练集和测试集的比例根据2:8日和训练集的数量是1542,716,716,78,78,和78年,分别。因此,批量大小13和19的选择。由于该模型并不复杂,我们时代的数量设置为2000。

4.1.4。实验过程

本文使用两种不同类型的数据集作为数据库,介绍了该方法在分类中的应用。的详细描述过程描述如下:(1)第一种数据集包含多元化的主张来源于人工合成数据集。每个样本在这个数据集包含5件证据。相应地,卷积核的大小,将softmax函数输出是5。第二种类型的数据集只包含单个元素命题。它是来自6加州测试集上的预测结果中的延时,FCN, Resnet。在这些测试集样本将产生3件证据。第二种类型的随机数据集分为训练集和测试集的比例根据2:8。为了验证模型的鲁棒性,每个数据集随机分为5次,重复相同的随机状态记录的平均价值的5倍(2)得到最佳的证据权重时,提出了交叉熵损失函数值满足最低(3)原始凭证与权重修正得到加权平均证据(4)然后,加权平均融合通过法官的证据规则得到最终的证据组合(5)组合预测的类别是由最后的证据。第一节课,相对应的类别单元素的最大值是预测的结果。第二类,类别对应的最大概率值预测的结果

为了进一步验证该方法的可行性,我们有四个著名的传统方法相比,即经典的d - s理论方法(17),两个信念entropy-based方法(30.,33,基于距离的方法(35]。分类精度和加工时间作为评价指标。

4.2。结果与讨论
4.2.1。准备分类结果

两种类型的数据集上的分类精度如表所示12,分别。根据实验结果,我们可以得出以下结论:(a)第一类型的数据集,燕等。' s方法,汉族等的方法,该方法和我们同样实现分类精度最高的97.6%,而法官的分类精度为64.2%,邓小平的方法的分类精度为95.2%。这表明,该方法性能保持竞争力。(b)该方法总是更高的分类精度与一个表现最好的神经网络分类算法相比,平均改善第二种类型的数据是2.47%,4.20%,1.59%,0.74%,3.21%,和1.73%,分别。这说明该方法相结合三个单一神经网络的预测结果比单一网络可以获得更好的分类结果。此外,方法是让最后的决定通过融合多个预测结果,这被认为是决策级融合,所以它可以灵活地扩展到其他应用领域。(c)为相同的数据集,该方法的分类精度5岁以下随机状态波动不大。它证明了我们的模型的鲁棒性。(d)与经典的传统方法相比,两个信念entropy-based传统方法和基于距离的第二种类型的数据集传统方法,该方法的分类精度最高,和总平均提高4.06%,10.11%,10.11%,和16.19%,分别。这些表明,权重的确定基于CNN更为合理,证明了该方法的有效性。

4.2.2。处理时间的结果

处理时间的实验是一个普通的个人计算机上实现与英特尔酷睿i7 - 9750 h在2.60 GHz CPU, 8 GB RAM。根据提出的时间复杂度计算41),四个传统算法的时间复杂度 , , , ,在哪里 代表FOD的证据和元素的数量,分别。邓和燕的算法的时间复杂度较高。对于所有的数据集,我们的平均处理时间5随机状态进行比较,结果见表3。该方法花费大量的时间在训练阶段,但在培训之后,我们的方法的处理时间是与其他四种方法。

5。结论

本文通过引入深学习冲突证据组合,我们提出一个全面的方法来确定权重的证据基于CNN。以证据为网络输入和相应的重量作为输出,它利用CNN完全我的潜在有用的信息影响证据权重,为了确定综合权重。此外,权重不断优化通过反向传播,实现减肥时的最优函数值满足最低。分类实验结果表明,该方法使权重的确定更加合理和获得更高的分类精度较传统的基于证据距离或熵和灵活扩展到其他应用领域,可以作为决策融合方法。

数据可用性

加州数据集从加州大学获得时间序列数据挖掘存档(http://www.cs.ucr.edu/eamonn/timeseriesdata/)。

的利益冲突

作者宣称没有利益冲突。

作者的贡献

在研究活动中,所有的作者都参与数据收集和预处理阶段,发展的理论概念模型,实证研究结果的分析和讨论,手稿准备。所有作者都同意发布版本的手稿。

确认

这项工作得到了国家自然科学基金(批准号61903373和61903373)。