文摘
InterCriteria分析(ICA)的方法是申请的目的减少变量的设置对神经网络的输入,考虑他们的大量网络中神经元的数量增加,从而使他们无法使用硬件实现。在这里,第一次与ICA方法的帮助下,三元组之间的相关性训练的神经网络的输入参数。在本例中,我们使用ICA用于数据预处理的方法,这可能会减少产量的总时间训练神经网络,因此,网络的数据处理和图像。
1。介绍
使用神经网络提出了许多困难;例如,个人感觉神经元的数量值可以过大,由于比例更大的内存和计算能力是必要的训练网络,这将导致一个较长时间进行训练。因此,研究人员被迫寻找更好的方法来训练神经网络。反向传播是最应用这种方法在神经网络训练与上行(应用于多层感知器)。然而,许多其他的方法,加快神经网络的训练(1- - - - - -3),通过减少内存使用量,进而降低了需要大量的计算能力。
在预处理阶段,数据输入的神经网络可以作为一个常数阈值区分静态和动态的活动,因为它是在4]。这样,偶然的数量值减少由于不可预见的情况下。
另一种方法是使用一个小波神经网络分类器来减少权力干涉神经网络的训练或随机偶然的测量5]。这里的离散小波变换(DWT)技术与神经网络建立一个分类器集成。
粒子群优化(PSO)是一种建立参数优化的方法。它代表以人群为基础的自适应优化技术,由几个“策略参数的影响。”Choosing reasonable parameter values for PSO is crucial for its convergence behavior and depends on the optimization task. In [6)提出了一个方法参数metaoptimization基于PSO是应用神经网络训练。优化的粒子群优化的想法(OPSO)的自由参数优化算法,在一群成群。
使用神经网络时必须减少隐层神经元的数量,这也减少了神经网络的权重系数的数量作为一个整体。这将导致一个更小的维度的权重矩阵,因此使用的内存数量。从这一个额外的结果是减少使用的计算能力和缩短培训时间7]。
多层感知器模型常用于复杂数据集之间的关系。删除不必要的组件的数据会导致神经网络的规模小,低,分别对输入数据的要求。在[8描述,这可以通过分析网络的常见干扰输出,这是造成扭曲的数据传递到神经网络的输入。试图找到多余的数据是基于灵敏度的线性神经网络的概念。在[9)开发的神经网络中,神经元的输出层的一部分不连接到下一层。由此产生的结构被称为“网络在一个网络。”In this way part of the inputs of the neural network are reduced, which removes part of the information, and along with it part of the error accumulated during training and data transfer. The improved local connection method given in [9)产生一个全球排序基本卡在分类层。这一层更容易解释而不易过载比传统的完全连接层。
在本文中,我们应用直觉模糊则InterCriteria分析方法来减少多层感知器的输入参数的数量。这将允许减少权重矩阵,以及神经网络的实现在有限的硬件,并将在训练中节省时间和资源。
减少后的神经网络测试数据(有效输入)的数量,以获得一个可以接受的输入和输出值之间的关系,以及结果的平均偏差(或匹配)。
2。表示InterCriteria分析
InterCriteria分析(ICA)方法介绍(10]Atanassov et al。进一步研究多目标多准则问题,适用于测量根据一些标准在哪里慢或更昂贵,导致延迟或提高整体的成本决策的过程。当解决这些问题可能需要采用合理的方法消除这些标准,以达到经济和效率。
ICA方法是基于两个基本概念:直觉模糊集和索引矩阵。定义了直觉模糊集Atanassov [11- - - - - -13)作为一个扩展的模糊集的概念定义为德(14]。该方法的第二个概念是依赖指数矩阵的概念,矩阵的特性两个指数集。背后的理论描述的指数矩阵(15]。
根据ICA方法,一组对象评估或测量一组标准,并与这些评估表的输入方法。标准的数量可以减少计算的相关性(在ICA分化:积极的和音,消极的和音,和失调)在每一对标准的形式直观的模糊双值,也就是说,两个数字的间隔的金额也在这个区间。如果一些(缓慢、昂贵等)标准表现出积极的自尊和一些其他的标准(更快,更便宜,等等),和这种程度的一致被认为是足够高的对一些预定义的阈值,这种程度的精确的决策者可能决定忽略他们进一步的决策过程。参与测量的对象数越高,越精确评估intercriteria调和(相关性)。这使得完全数据驱动的方法以及对各种应用程序问题和数据集的持续认可帮助我们更好地理解其可靠性和实用性。
让我们考虑一些标准, 和数量对象, ;也就是说,我们使用以下设置:一组标准 和一组对象 。
我们获得一个索引矩阵米包含两套指标,行,另一个用于列。对于每一个p,问( , ),在一个评价对象,是一个评价标准,的评价是pth对象对问th标准,定义为一个实数或另一个显示对象类似的关系与所有其他的元素的索引矩阵M。
下一步是应用InterCriteria分析计算评估。结果是一个新的索引矩阵与直觉模糊双代表的一个直觉模糊评价每一对标准之间的关系Ck和Cl。以这种方式指数矩阵米与评估对象与评估标准可以被转换到另一个索引矩阵给出了标准之间的关系:
算法的最后一步是确定的度相关性的指标选择阈值的不同和从用户。之间的相关性标准被称为“积极的和音,”“消极的和音,”或“失调。“在这里,我们使用一个可能的方法来定义这些阈值,即规模框所示1(16]。
3所示。InterCriteria分析三元组
识别intercriteria三元组的算法介绍了(17]Atanassova et al。
步骤1。从输入的数据集对象来衡量标准,我们计算的总数 直觉模糊双站的intercriteria调和并绘制这些双点到直觉模糊三角形。而不是保持一双两个数字为每一对标准,即我们计算(见[18)对于每一对数字: 给它的距离 点,即完全的真理的形象到直觉模糊三角。我们的目标是识别自上而下的所有 计算值最接近 同时,接近对方;因此我们按升序排序的距离 ;看到表中的示例2。
步骤2。让我们表示与Σ最接近的子集(1;0)三元组的标准。我们构建Σ子集可以略有差异每个用户的偏好或外部要求,至少有三种可能的选择,如下所示(见图1):(2.1)选择前或前问%的 ICA对(Σ子集的预定义的元素个数)。(2.2)选择所有ICA对给定半径内的对应点从 点。(2.3)选择所有的ICA对对应点之间形成的梯形横坐标,斜边,相对应的两行 和 两个预定义的数据 。
步骤3。检查是否有三元组的标准,每一对对应点,属于Σ子集。如果没有,那么没有三元组的标准符合规定的要求。然而,如果被发现三元组,然后相应地延长Σ子集,通过采取更多或(步骤),或一个更大的半径(步骤),或更小和/或更大(步骤)。如果现在的子集包含三元组的标准,同时满足要求,然后去一步4。
步骤4。我们开始自上而下的第一对标准,随它去C我- - - - - -Cj,也就是最小的,从而确保最大距离的对应点,说,, 点。我们可以选择第三标准三倍这是下一个最高关联准则,也就是说,与(>),或这是下一个最高关联准则,也就是说,与(>指出,这是可能的 )。然后,我们检查的距离 各自的第三点和,采取三重标准C我- - - - - -Cj- - - - - -Ck或C我- - - - - -Cj- - - - - -Cl有 然后为每个标准的三倍C我- - - - - -Cj- - - - - -Cx( ),我们计算的中值点形成三角形,这是一个点绘制在直觉模糊三角坐标: 这双给我们的水平和谐的三倍。重复步骤4直到数Σ耗尽三元组的子集。
4所示。人工神经网络
人工神经网络(4,19)是一个工具,可以用于对象的识别和鉴定。在第一步中,它必须是明白了之后,我们可以使用的认识和预测材料的属性。图2的缩写符号显示了一个典型的两层神经网络。
两层神经网络,一层的出口成为下一个条目。方程描述这个操作 在哪里(我) 是出口的吗米层的神经网络 ;(2) 是一个矩阵的权重系数的每个条目吗th层;(3) 是神经元的输入偏差;(iv) 是第一层的传递函数;(v) 是2层的传递函数。
在第一层神经元接收外面的条目。神经元的退出最后一层确定神经网络的出口。
“反向传播算法(20.)是用于学习神经网络。多层神经网络训练时,通常可用的数据必须分为三个子集。第一个子集,命名为“训练集”,用于计算梯度和更新网络权重和偏见。第二个子集是命名为“验证集。”的错误验证集监控培训过程中。验证错误通常减少在初始阶段的训练,训练集一样的错误。有时,当网络开始overfit数据,验证集误差通常开始上升。验证错误时指定的迭代次数增加,训练停止的重量和偏见至少返回验证错误(4]。最后一个子集是命名为“测试集”。这三组的和必须学习夫妇的100%。
对于这个调查我们使用MATLAB神经网络结构8:45:1(8输入、45神经元隐层和一个输出)(图2)。数字的重量系数 。
该方法的重点在于消除部分神经元的数量(和重量系数),因此并不减少样品的平均偏差,用于测试和验证神经网络学习。
5。测试
我们认为很多标准, 和数量测量十六烷数量的原油, ;也就是说,我们使用以下设置:一组群的标准 和一组测量的十六烷值 。
ICA方法应用于140年原油探针,来衡量8标准如下所列:(我)密度在15°C g / cm3;(2)10% (v / v) ASTM D86蒸馏、°C;(3)50% (v / v) ASTM D86蒸馏、°C;(IV)90% (v / v) ASTM D86蒸馏、°C;(V)折射率在20°C;(VI)H2内容,% (m / m);(七)苯胺点,°C;(八)分子量克/摩尔。
所以我们的工作 表,一个软件应用程序,实现了ICA算法返回结果的形式两个指数矩阵(见表1和2分别),包含会员以及直觉模糊相关性的nonmembership部分检测标准的每一对之间(28条)。矩阵中的值是红黄绿颜色的彩色规模不同程度的和谐和不和谐的绿色黄色(最高的值)。自然,每个标准最好与本身,使各自的直觉模糊对或1和0,沿着主要的表对角线1和2。
在表3对标准之间的关系通过应用ICA方法所示。
计算距离每一对的标准C我- - - - - -Cj从 在直觉模糊三角表所示4(注意, )。
下一步是选择C我- cj最小的,从而确保最大距离的对应点 点。我们选择第三标准为三倍这是下一个最高的相关标准,或者这是下一个最高的相关标准,三倍的标准C我- cj- ck或C我- cj- cl有。在表5对标准C我- cj在“强阳性调和”,“积极的和音,”和“弱积极和谐”。
在神经网络的输入,我们把实验数据获得十六烷数量的原油。测试是在第一步;140年原油的所有测量探针对8标准是为了做个比较分析之后的结果。对于这个比较可以,预定义的权重系数和偏移量,通常是随机值在−1和1之间正在建立和所有研究系数1中是相同的。
在学习过程中,我们设置以下参数:性能(MSE) = 0.00001;验证检查= 25。输入向量分为三个不同的部分:培训(70/100);验证(15/100);和测试(15/100)。为目标,我们使用十六烷ASTM D613数量。
在测试过程的第一步,我们使用上面列出的所有8标准,来训练神经网络。在培训过程是由神经网络模拟的所有输入值。
所有140个样本的平均偏差是1,8134。的系数(回归值测量输出之间的相关性和目标)获得的MATLAB程序(见表0.974346)。
在测试过程的下一步,我们做一个叉和独立尝试删除一个列和试验数据从剩下的七列。我们比较结果在下一节中,讨论。“首先,我们要减少1(基于表的列5),把神经网络的输入数据。
模拟训练过程后所有输入值。所有的140个样本的平均偏差为1.63系数是0.9772。
在下一步,我们或者执行表3(根据减少列5),把神经网络的输入数据。
模拟训练过程后所有输入值。所有140个样本的平均偏差为1.8525系数是0.97256。我们可以继续列5后,2,8,4。
在下一步,我们继续喂养6输入的神经网络,减少这两列,3和5,根据数据表5。所有的140个样本的平均偏差为1.7644系数是0.97089。以同样的方式,我们可以减少输入:1和5,1和3,2和3,3和8、3和4,同时和4和8。
在下一步,我们与一个减少输入的数量,也就是说,我们把输入的神经网络实验数据从5输入、删除列1,3,5。所有的140个样本的平均偏差为1.857系数是0.97208(见表6)。以同样的方式被参数2、3和8和3、4,8。
最后,我们尝试减少第四列,只有4输入的神经网络。减少后列1、2和4,第四列是减少5列。模拟后所有140个样本的平均偏差为2.19系数从MATLAB程序获得0.95927。
6。讨论
支持的方法,表6,7,8不同的标准之间的相关系数。的表也存在极大值系数每标准金额。在最后一列,三元组的选择标准,在降序排序的方式相关系数C我- cj。
在表9编译与ICA方法根据皮尔逊相关分析,肯德尔和斯皮尔曼所示。
选择的对,基于四种方法,第一行是相同的。在第二行三个方法产生相同的结果(ICA、肯德尔和枪兵),和唯一的区别是在选定的标准计算的皮尔森的方法。在第三行,情况都是一样的。这里的三元组和精度要求都是一样的。只有三重的相关标准计算皮尔森方法是不同的。在第四行,三元组非常相似。计算出的三元组ICA和皮尔森都是相同的。三由肯德尔关联表的第一行是一致的。过去的三倍,定义的斯皮尔曼相关性,恰逢三元组的第二和第三行定义的相关性分析ICA,皮尔森,和斯皮尔曼。
到目前为止,这样的四种方法进行了详细的比较医学(21,22和石油化工23)数据。这是观察到相当大的分歧的ICA的结果通过其他方法获得的结果只是发现当输入数据包含错误,由于遗忘与至少一个小数点的位置向左或向右。我们预计在未来的理论研究检查这实际观察的有效性。如果这是真的,那么ICA,连同其他三种类型的分析,将变成一个标准数据的正确性。
正如我们上面提到的,减少传统神经网络的输入参数会导致减少权重矩阵,从而实现神经网络的硬件和节省时间和资源有限的训练。对于这个目标,我们使用直觉模糊则InterCriteria分析(ICA)方法,使标准之间的依赖关系,从而帮助我们减少高度关联的输入参数的数量,但保持足够高的精度水平。
表10总结最重要的过程参数的测试与不同数量的输入神经网络,逐步减少为了发现最优的结果。这些工艺参数是NN-specific参数“平均偏差,”“回归系数R”和“数量的重量系数。”
平均偏差,当我们使用8输入向量与权重系数405 1.8134。通过减少的数量输入权重系数的数量也减少了,理论上应该减少匹配系数。在这种情况下,删除第1列(因此一个输入删除)的平均偏差原因进一步降低1.6327。附加信息(没有列5)用于训练神经网络,很少,少总均方误差。结果比以前曾经尝试通过训练神经网络8数据列。
当我们使用7列(和7输入神经网络)不包括的一些列给比上一个更好的结果。这表明,同时保持体重系数和减少的数量最大会员intercriteria如果对,神经网络接收到额外的少量的信息,它使用为进一步学习。
得到最好的结果(平均偏差= 1.5716)的两列(6输入没有输入1和3)最大的成员各自的组件d。
在这种情况下,减少体重的影响系数从360年到315年和相应的均方误差大于两列的影响。
5列的使用(没有列1,3,5)导致结果小于前面,也就是1.857。这表明减少体重系数(MSE)神经网络和信息的输入少量的信息丢失的网络培训。因此,神经网络的整体精度下降。
最坏的结果(平均偏差= 2.217)得到columns-4的最低数量。在这种情况下,列1、2、4和5中。虽然体重系数的数量是最小的,的信息用于训练神经网络的信息量是很少的。
7所示。结论
在论文中我们应用理论研究的最新腿InterCriteria分析数据与140年的测量探针的原油对8理化标准。第一步我们把所有这些测量数据在一个经典的神经网络的输入。执行ICA分析后成对intercriteria相关性,我们最近应用开发方法识别intercriteria三元组在试图减少神经网络的输入,没有重大损失的精度。这将导致减少权重矩阵,从而使实现神经网络的硬件和节省时间和资源有限的训练。
非常重要的方面,神经网络的测试后减少的一些数据(分别地。,the number of inputs) is to obtain an acceptable correlation between the input and output values, as well as the average deviation (or match) of the result.
的利益冲突
作者宣称没有利益冲突。
确认
作者感谢提供的支持保加利亚国家科学基金资助下引用没有。DFNI-I-02-5“InterCriteria分析:一种新的决策方法。”