文摘

优化神经网络的拓扑结构是一个困难的问题至少有两个原因:拓扑空间离散,和任意拓扑结构的质量必须评估将许多不同的权重分配给它的连接。这两个特点很容易引起“粗糙。“目标函数。这里我们演示如何自组装(SA)和粒子群优化(PSO)可以提供一种新颖的集成和有效的手段同时优化神经网络的权重和拓扑。结合SA和算法解决了两个关键的挑战。首先,它创建了一个更综合表示神经网络权重和拓扑结构,以便我们刚刚一个连续搜索领域,允许“平滑”目标函数。第二,它扩展了传统的自组装的焦点,从预定义的增长目标结构功能,自组装,增长是由最优标准定义的新兴结构预定义的性能计算问题。我们的模型包含一个查看算法的新方法,涉及人口的增长,网络互动,而不是粒子。我们的方法的有效性和拓扑优化回声状态网络的权值,通过演示了其基准性能在许多具有挑战性的问题。

1。介绍

在本文中,我们演示两种截然不同的自然方法,自组装(SA) [1),粒子群优化(PSO) (2),可以集成提供一种新颖的和有效的手段同时优化神经网络的权重和拓扑。这种方法解决两个重要挑战。第一个挑战是找到一个更综合表示神经网络权重和拓扑结构,因此,而不必搜索在两个连续的体重空间和离散拓扑空间,只有一个单一的、连续的搜索域,允许“平滑”目标函数。第二个挑战是将传统的自组装研究的焦点从预定义的增长目标结构功能自组装,经济增长是由最优标准中定义的质量或性能方面新兴预定义的结构计算问题

群体智慧系统,由自治代理在一个简单的和地方的方式互动,表现出复杂的全局行为,由于当地代理之间的交互(3- - - - - -10]。研究人员创建了一个广泛的新灵感来自自然和解决问题的算法基于群体智慧的管理原则(11- - - - - -17]。特别重要的研究摘要是强大和广泛适用的基于群体智能优化方法被称为粒子群优化(PSO) (18- - - - - -23]。

粒子群优化已广泛应用于神经网络权值训练。各种不同的适应性和杂交过程的PSO为此目的而开发的24- - - - - -30.]。尽管成功使用PSO优化网络权值,有有限的成功应用拓扑优化,这样的应用程序在很大程度上仅限于前馈网络。的方法确实存在基本PSO算法的实现相当复杂适应性或执行严格的限制在可行域的网络拓扑31日- - - - - -33]。虽然本文提出的方法不适应网络中节点的数量,和其他一些算法一样,它优化在一般情况下,递归神经网络拓扑结构使用PSO的最基本形式之一,它是一个独一无二的方法。此外,网络的底层模型的形式增长,我们现在这里没有地方限制PSO用于驱动优化的类型,因此用户可以随时交换的任何版本的算法被认为是最适合的学习任务。我们方法的整合基本PSO是特别有利的情况下,物理网络的拓扑结构优化。

这里介绍的工作涉及到优化最近开发的一类被称为递归神经网络模型回声状态网络(esn) [34]。回声状态网络已成功地应用于各种不同的问题(35- - - - - -45]。他们由一个输入层、隐藏层或“水库”和一个输出层(如图1)。通常情况下,输入层中的每个神经元连接到储层中的每个神经元;有随机生成稀疏储层神经元之间的连接;储层中的每个神经元连接到输出层中的每个神经元;偏见神经元可能连接到储层中的神经元,有时从输入层到输出层的连接和从输出层储层存在。中央回声状态网络的创新方法,只有连接上的重量从储层神经元的输出(输出权重)训练,和输出神经元的激活函数是线性所以训练他们所需要的是线性回归。剩余的重量通常分配随机值。一个回声状态网络 储层神经元和 输出神经元,输出权值训练如下。一系列的训练数据的长度 是选择, 。第一个 序列的值是通过网络,从而消除水库的初始状态的影响。然后,剩下的 值输入到网络,以及由此产生的储层 ,因为 ,被分配到矩阵的行 。为每个网络输入,造成储层的状态 ,都有一个目标网络输出 。被分配到目标网络输出矩阵的行 这样 th行 是相应的水库状态和目标输出。让 是输出权重矩阵,其中 th列 代表的重量从储层的连接 输出神经元。训练输出权重找到一个近似解 超定的系统 输出权值 是由解决(1)在一个“最小二乘法”意义。

自组装涉及离散组件的自组织成一个物理结构,例如,生长的物理网络中的节点之间的连接。工作在这个领域一直关注我们将称之为经典的自组装问题,这导致了当地的设计控制机制,使一组组件自组织到一个给定的目标结构,没有单独预先指定的组件的位置或中央控制机制。问题自组装是一个非常活跃的研究领域在群体智慧在过去的几年中,对近期的工作跨越计算机模拟(46- - - - - -51),物理机器人(52- - - - - -57),和自然系统的建模1,12]。然而,我们所知,还没有工作使用群体智能方法扩展经典的自组装问题功能的自组装中,组件自组织成一个计算结构优化的一个预定义的计算问题。

研究提出了神经网络的自组装体系结构。与大多数过去的自组装,这里给出的工作涉及的一个重要方面的发展之间的联系离散,空间上分开节点/组件(58]。我们最近演示了如何群体智慧的集体运动可以提高网络的健壮性自组装,提高生长能力大,拓扑复杂神经网络(50]。然而,这种早期研究集中在经典的自组装问题,网络预定的目标,这是与功能自组装,我们考虑的更困难的问题。

其他相关过去工作在计算机科学和工程中,在对人工神经网络的研究涉及与应用程序相关的性能,在很大程度上忽略了问题的神经网络增长,发展,和自组装,只有两个例外。首先,创建了许多计算技术来优化神经网络结构通过添加/删除节点连接动态学习期间(59- - - - - -63年]。这里采取的方法不同,这些过去的网络施工方法不涉及增长或自组装在一个物理空间,所以没有进一步考虑。第二,技术被称为发展编码已经被研究人员与遗传算法进化神经网络架构/编程[64年- - - - - -70年]。这里介绍的工作不同,在过去的技术不同的个体在一个人口不直接在发展过程中相互作用。这种相互作用只发生间接通过选择和转换的过程。

重量和拓扑影响神经网络的性能。迄今为止,更多的重点都是放在技术优化神经网络的权重与拓扑(节点)的数量和连通性。造成这种差距的主要原因之一是空间搜索的优化方法,一套好的权重(“重空间”)是连续的。因此一套好的权重可以发现使用一个各种各样的强大,研究优化技术基于局部梯度信息(71年]。此外全局优化技术,如粒子群优化(PSO),进化计算(EC),和模拟退火在重量优化已被证明是非常有效的。

在连续域优化,特别是多维欧几里得空间 操作,优化算法往往在最基本的启发式(这里指continuity-heuristic),给定两个点在搜索空间,每一个都代表了一个很好的解决方案,很可能存在一个更好的解决方案之间或在这些点。已经发现这种启发式方法是一般有用的优化目标函数上定义 。“拓扑空间”,然而,是一个离散的空间。这个搜索域的离散特性加上神经网络权值(参数)之间的内在相互依存和拓扑结构(结构)的结果在各种额外的挑战不是遇到当优化网络的权重与一个固定的架构。首先,它是常见的许多神经网络中的节点从计算的角度是相同的,如隐层中的节点,这意味着许多双点的拓扑空间远将代表相同或非常相似的拓扑。第二,可能会影响某些连接性能比其他人更多。这种影响取决于网络的拓扑结构等因素,所使用的学习算法,网络的计算问题是负责解决。这意味着在拓扑空间的典型代表,在网络,有一个input-to-output连接会有几乎相同的表示,没有这样一个连接(所有其他连接是相同的),许多点附近(拓扑)彼此将代表网络架构与截然不同的健身价值相关联。第三,一个特定的拓扑结构的质量依赖于权重的设置与之关联的,反之亦然。这种相互依存意味着,而不是一个固定的健身价值,一个点(拓扑)拓扑空间分布产生的健身价值关联不同的权重与其连接。这个事实会增加健身景观的“粗糙度”定义的拓扑空间。 The first of the above characteristics implies that the distance between two points in the topology space often does not accurately reflect the similarity/dissimilarity of the topologies represented by the points. The second and third characteristics, coupled with the discrete nature of the topology space, imply that nearby points often represent topologies with very different fitness values, which produces very rough fitness/objective functions. Therefore, the properties that make the continuity-heuristic useful in the weight space are largely absent from the topology space.

如果我们能找到一个更综合的手段表示神经网络权重和拓扑结构,这样搜索域由一个单一的、连续的“weight-topology空间,那么这表示可能保留continuity-heuristic并允许目标函数更平稳。这正是我们所做的。整合涉及到代表重量和使用自组装的拓扑通过单个神经网络生长,连续的三维空间。我们的方法利用这一事实给两个神经网络具有不同的拓扑结构,如果这些网络的连接共同点有权重大小足够小,那么网络将有大致相同的吗有效的拓扑,信号传输通过这些联系将高度减毒,因此往往很少影响网络动力学。因此,从网络性能的角度来看,好像不是实际上的连接。神经网络的概念有一个有效的拓扑结构是一个关键的概念在本文提供的工作。这解释了为什么我们的方法可以同时优化权重和拓扑操作在一个连续的空间。具体地说,只要体重阈值触发删除(加法)连接足够小,然后遍历这个阈值的方向,导致连接的去除(加法)将产生新的网络拓扑结构但有几乎相同的动力学相比,其对应的网络。是这种情况,因为删除(添加)连接权重大小接近0。因此,如果目标函数只取决于网络动态,那么这个新的网络及其同行将评估目标函数下几乎相同的值。

这里介绍的工作的主要贡献来自解决固有的挑战同时优化神经网络权值和拓扑。第一个贡献是发展的一种手段,使用网络搜索的自组装作为表示域遇到在这个优化问题,从而简化了域到一个连续的空间。第二,我们的工作提出了一种新的观看方式算法涉及到人口的增长,网络互动,而不是粒子。这个适应用于自组装过程转化为一个优化的过程,我们所知,是第一个演示这样的免费自组装和粒子群优化之间的关系。第三,PSO的版本,我们的工作了,这是一个特别的优雅的形式算法,以前没有同时用于优化神经网络权值和拓扑。最后,我们将演示一个基于软件实现的有效性的自组装的集成和使用其生长高质量的神经网络算法解决各种挑战性的基准问题域的时间序列预测和控制。

2。方法

在本节中,我们介绍我们的模型代表一个扩展传统的自组装问题,网络结构的发展是基于最优标准,而不是指定的目标结构先天的

2.1。结合自组装和粒子群优化

我们现在我们的模型的细节,同时优化神经网络权值和拓扑。我们称之为模型SINOSA,代表群智能网络优化通过自组装。在这个模型中组织生长锥,同时属于不同的网络增长通过相同的三维空间。在增长过程中生长锥不同网络的相互作用通过受粒子群优化机制。同时,网络接收输入来自他们必须学会解决计算问题。这种交互的结合,并通过网络活动运行在开发过程中,导致了自组装的神经网络权重和拓扑优化解决手头的问题。一个动画,充分体现了生长过程可以在网上提供的URL(见补充材料http://dx.doi.org/10.1155/2015/642429)。

2.1.1。对象和关系

在这部分模型的具体的例子如图2引用的澄清。SINOSA模型由一组细胞 与固定分配的位置在3 d空间先天的。细胞代表神经元细胞体。每一个细胞 有一组 ,这可能是空的,“邻居”的细胞,它可以连接到 。在图2三大灰色球体代表细胞 ,每个单元可以连接到任何其他细胞,包括自己。因此, ,因为

每个网络由同一组细胞生长 和一组独特的生长锥,引导网络通过三维空间的轴突。鉴于 同时不断增长的网络,每一个细胞 组生长锥 ,在那里 。任何给定的细胞 相同数量的增长锥有助于每个网络增长。也就是说, , ,确保所有的生长锥的社区(下面解释)在生长锥 是相同的大小。如果 是空的,那么是什么 ,尽管 。的 th日益增长的网络 包括细胞的集合 和生长锥的集合 生产网络的发展。也就是说, 定义的命令对吗 。因为每个网络由同一组细胞生长 ,他们都有完全相同数量的生长锥( ,在那里 )。在图2小圆圈表示生长锥,线连接细胞和轴突生长锥。在这种情况下 日益增长的网络,每个有六个轴突生长。任何特定网络的增长轴突所示一个独特的线条样式(固体,点缀,或dash-dot)。为了澄清这一点,图2 (b)只显示实线不断增长的网络。图2 (c)显示了来源于实线的静态网络不断增长的网络,这是下一节中描述。图2(一个)说明这三个网络同时通过相同的生长空间和共享相同的三个单元。

th细胞邻居 。然后为每个 ,细胞 贡献两个生长锥( 每个不断增长的网络) 。当 “+”生长锥代表积极加权连接,当 “−“生长锥代表消极的加权连接。正负生长锥模型 可以建立连接一个靶细胞,即 。由于基于这些关系 在图2,每一个细胞三对正负生长锥模型有助于三种网络增长。然而,为了清晰的只有6 18所示的是每个网络日益增长的轴突。

2.1.2。解释网络增长为自组装

SINOSA模型神经网络生长,在他们完成形式,有固定连接。因此,有必要解读网络生长的生长锥的位置相对于靶细胞以映射越来越多的网络 ,静态网络 。特别是,如果是正负生长锥 从细胞 和日益增长的网络 都是定位,能够建立一个连接细胞 ,然后连接上的重量 在静态网络 是个体权重之和由生长锥。

SINOSA模型中的函数空间的日益增长的网络空间的静态网络的设计需要创建一个更紧密的集成神经网络表示拓扑结构和连接权重的概念,这样标准PSO算法可以有效地优化这些网络特征。这个函数实现如下。每个生长锥被认为是自己的球对称中心的“重量场”在一定程度上是有限的,与其相应的体重减少到零级生长锥的距离增加。与靶细胞生长锥建立连接,如果细胞内边界的重量;否则没有创建连接。细胞之间的间距是这样的,不超过一个细胞可以在生长锥的体重在任何给定的时间。连接上的重量字段的值在目标细胞的中心。正式,重量字段是一个函数的 与形式 在哪里 , 是距离的目标细胞生长锥的中心, 是重量字段的程度, 。SINOSA模型中的假设 作为 。因此 ,这意味着 。数据2 (b)2 (c)说明三个互动之一,发展网络,显示在图2(一个)映射到一个静态的网络根据重量字段解释生长锥的位置相对于他们的靶细胞。生长锥与一个“+”符号绘制有积极的重量字段所代表的功能 在哪里 生长锥之间的距离,其靶细胞之一。生长锥,绘制“−”符号所表达的负重量字段功能 因此,在这种情况下的重量限制区间 。图2 (b)显示了实线网络日益增长的轴突,连同每个生长锥及其之间的距离最近的靶细胞。图2 (c)显示的是静态网络来自实线越来越多的网络。这里的数字连接权重。这种映射发生如下。所示的细胞较低的左手角落的数字2 (b)2 (c)建立一个与重量 上层细胞但不建立连接的细胞在右下角 。上层细胞连接较低的左手细胞与重量 。较低的右手细胞连接较低的左手细胞与重量 ,它连接上电池重量 。其他两个网络映射到相应的静态网络增长表示以类似的方式。

地图的功能日益增长的网络静态网络制定这样一个小变化在生长锥的位置产生一个微小的变化,体重在一个连接,或者位置的变化导致的添加或删除一个连接,然后添加或删除连接有一个的规模较小的重量。换句话说,一个小变化的物理配置网络将产生一个小的改变重量和静态网络的拓扑映射。这一特点,加上这一事实通过SINOSA网络优化模型发生在一个单一的连续weight-topology空间,导致更为顺畅的目标函数。

2.1.3。合并算法

使用网络自组装作为我们的代表计划产量单一、连续weight-topology空间,需要在优化过程中搜索。换句话说,我们需要扩展功能自组装的经典的自组装问题。考虑到我们有一个,连续搜索领域,各种不同的优化算法可以用于这一目的。然而,我们选择使用PSO算法,因为它是直观的和有效的,和我们的模型集成了一个版本的哪个应用程序的并行优化算法神经网络权重和拓扑之前未被探索。具体来说,我们使用的一个最基本的公式算法,将被称为规范算法。标准PSO指定粒子速度由 在哪里 的位置吗 th粒子在时间 , 是它的速度, 是当前最佳的位置吗 th粒子, 是最好的位置在任何邻居粒子, 是一个比例因子称为收缩系数, 都是正的常数, 向量的分量是来自单位间隔均匀概率分布,和 符号代表了特定组件的向量积(即 )。这是标准的做法来更新粒子的位置使用欧拉向前一步的步长1.0;也就是说, 。这个版本的PSO的吸引力在于它的简单性和证明的有效性范围广泛的优化问题。

为了将粒子群优化算法和自组装粒子被视为更大结构的一部分。几乎所有的实现算法考虑的粒子是运动和相互作用的基本类型的对象能够在优化过程中。在本文的研究中,越来越多网络扮演的角色基本类型的对象参与优化过程。,而不是人口的移动粒子,有一个人口不断增长的网络。从颗粒过渡到网络是通过生长锥扮演的角色粒子在传统的算法。生长锥出现在越来越多的轴突(连接)的主要技巧通过物理空间和指导他们的行动。生长锥的运动是由规范化算法方程(5),因为生长锥发生在轴突生长的主要技巧,他们的动作生成网络增长。与传统算法不同,生长锥的位置(粒子),无论如何解释,只是有意义的神经元轴突/它是一个正在考虑的一部分。

自增长锥从不同的网络相互作用根据标准PSO算法,在自组装过程中每个生长锥必须分配一个质量(健身)值表明最好的解决方案组件的实用性(连接)生长锥的发现,和它必须记住个人最好位置,代表最好的连接发现生长锥到目前为止的增长过程。具体来说,在每一个离散的时间步 每个静态网络的性能 在某些确定的训练数据集, 。为每一个日益增长的网络 ,如果的性能 比的性能 对所有 这样 ,然后的健身价值 ,或者更确切地说它生长锥 将性能值 ,每个生长锥的个人最佳位置 将鼠标的当前位置。理论上,它可以确定网络中每个生长锥的健身,而不是集体在网络层。做这个需要确定一个健身价值成正比 ,网络的性能的期望值的函数生长锥的重量。我们选择了前者的方法有两个原因。首先,计算这种期望值平均要求网络性能在大量可能的生长锥的位置构成实例化不同的网络。第二,每个连接只有最小的对网络性能的影响,从而优化他们单独往往导致收敛性非最优解决方案。

任何生长锥 必须有一个邻居集生长锥吗 影响其运动。在大多数算法的实现,本文提供的研究遵循的条件,你的邻居关系是对称的。也就是说,如果 是一个邻居 ,然后 是一个邻居 。有各种不同的方式生长锥的邻居可以选择。然而,某些特征的自组装/优化过程限制有用的数量选择。这是一个潜在的假设PSO算法的两个邻居粒子越接近,越相似的解决方案或解决方案组件,代表他们的职位。它对PSO算法的有效性至关重要,如果两个生长锥 是邻居,他们占据同一位置,然后他们代表同样的加权连接在各自的静态网络吗

在SINOSA模型中,如果两个生长锥占据相同的位置,但引导轴突从不同的细胞,然后是两个完全不同的连接(解决方案组件)。同样,如果两个生长锥占据相同的位置,但没有完全相同的靶细胞,然后他们可能代表不同的连接。这两个场景,生长锥是邻居需要避免的情况下,他们占据同一个位置代表不同的加权连接,导致三个必需的生长锥的社区属性。首先,如果一对生长锥是邻居,然后他们必须从相同的引导轴突细胞。第二,如果一对生长锥是邻居,然后他们必须有完全相同的靶细胞。第三,如果一对生长锥是邻居,然后体重字段必须表达的相同的功能。下面是一个简单而有效的方法选择一个生长锥的邻国,这些属性满意。对于任何一个细胞 和日益增长的网络 ,你的邻居增长生长锥的锥 与靶细胞 并签署 是一组的成员吗 。在图2(一个)生长锥之间的虚线明确显示18生长锥的两个社区(只有6增长18的轴突/网络如图所示)。因为每个生长锥附近包含三个生长锥环型拓扑连接,

当SINOSA模型用于增长的网络优化计算问题,在每一个时间步的增长过程,每个静态网络的性能评估和使用更新生长锥的健身价值。生长锥的位置然后根据标准PSO算法更新。然后,在下一个时间步,三个增长网络的新的物理配置映射到它们相应的静态网络,和评估过程重复。增长进程终止,表现最好的静态网络返回在增长过程中发现,在一个预定义的时间步的数量,或曾经的一个静态网络满足预定的性能指标。

2.2。实验方法

在本文中,我们将介绍SINOSA模型的实现细节时是Mackey-Glass用于优化神经网络时间序列预测问题和双极平衡问题。选择这些问题,因为他们是具有挑战性的和广泛使用的指标任务领域的时间序列预测和控制,和各种不同的神经网络训练/优化算法已被用于解决它们。

2.2.1。计算测试问题

第一个问题是预测的混沌Mackey-Glass时间序列(39,72年,73年]。生成的时间序列是延迟微分方程 在哪里 , , , 。当 混沌时间序列。图3时间序列的显示了一个示例。

第二个问题是双极平衡问题(见图4),这是一个典型的基准控制问题,特别是对神经网络控制器(神经控制器)74年- - - - - -76年]。双极平衡的问题由使用一个控制器来平衡两极与不同长度的铰链的手推车,沿着有限长度的轨道。控制器试图通过施加一个力保持两极的直立 两边的车方向平行于轨道。要想成功,控制器必须保持车在指定的距离 从轨道的中心,它必须保持每个杆在指定角度的限制 从垂直的。管理车的动力学方程 波兰人可以在找到76年]。

2.2.2。实现细节

SINOSA模型实现为一个用Java编写的仿真环境。中给出的计算实验部分3每个运行在一台电脑,两个四核2.33 GHz Intel Xeon处理器,8 GB的内存,共享和12 MB L2高速缓存每个处理器。这里列出的计算需求增长的回声状态网络使用集体行为,除非另有规定。网络成长的环境是无限的,没有分配给特定的单位时间和距离。越来越多网络的组件(细胞、轴突和生长锥)无法互相碰撞摩擦。细胞的位置仍然固定在整个生长过程。除非另有规定,在每一个实验细胞被固定在一个集中的位置矩形点阵8.0相邻格点之间的距离单位;有16个发展网络,生长锥社区坚持一个冯·诺依曼拓扑(平方晶格周期性边界条件)。

的动态生长锥由规范化算法方程(5), , Mackey-Glass实验, 双极平衡的实验。所有的实验,每个生长锥的重量字段是线性的( ),有一个半径 。按照惯例,一个时间步SINOSA模型相当于1.0的时间单位。

许多实验结果提出了部分3是相对于控制情况下结合随机生长锥运动,而不是集体行为的规范化算法方程,生成如下。在每一个时间步增长过程的每个生长锥被放置在一个独特的,距离不到一个随机选择的位置 从其靶细胞的中心,在那里 是生长锥的程度的体重。这种方式,连接的权值是随机生成的。

每个章节中讨论的计算问题2.2.1,SINOSA模型被用来种植回声状态网络的解决方案。结果描述的计算实验是为了测试SINOSA模型的优化功能。

3所示。结果

3.1。Mackey-Glass时间序列

在所有的实验,涉及Mackey-Glass时间序列的参数(6)被设置为以下常用的值: , , , 。这些值产生“温和”混沌时间序列。生成的时间序列是解决(6使用Matlab时滞微分方程解算器)dde23最大的步长为1.0,相对误差的宽容 ,一个绝对错误的宽容 。对于每一个时间序列生成的(6),数据点的初始序列是随机生成的均匀概率分布区间 ,(6)是集成1000时间步之前收集的时间序列数据开始。这径流初期是必要的,以消除随机生成的初始条件的影响。连续数据点生成的序列Mackey-Glass系统由1.0个单位的时间。数据从Mackey-Glass系统是更适合处理神经网络映射到区间 使用双曲正切函数 。网络输出映射回原范围使用的倒数 用于测试、验证和分析。使用的每个储层神经元 其传递函数和有一个内部状态由破积分器微分方程(34]。神经元的输出使用线性传递函数, ,没有一个内部状态。

Mackey-Glass切入发展的时间序列是由一个输入神经元,神经元的偏见,50一个输出神经元,神经元的水库。生长锥被允许从输入神经元建立连接到储层神经元,从偏见神经元到水库,水库的水库。另外,每个储层神经元有一个永久连接到输出神经元因为reservoir-to-output连接权重数据源自使用线性回归。“回声国家财产”,这是一个必要条件的油藏动态实现良好的性能,在过去的工作通常被实现通过手动缩放水库权重矩阵的谱半径小于一个(34),推导出完全通过网络增长过程。

邻居神经元的输入神经元的集是整个水库,是神经元的偏见。每个储层神经元的邻居神经元由5储层中的神经元中随机选出的。神经元的输出没有任何邻居神经元,因为它没有任何轴突生长。每一个16同时不断增长的网络,每个神经元贡献一个积极加权生长锥( 在(2)和一个消极的加权生长锥( ),每个邻居神经元。每一个正负生长锥模型对相同,单一目标神经元。

在每一个时间步每增长网络映射到静态网络由目前的物理配置。申请前输入网络,每个神经元的内部状态和/或输出设置为零。对于每一个静态的网络,连接上的重量从储层神经元的输出神经元被训练使用teacher-forcing [39序列从Mackey-Glass生成系统,有2100数据点。第一个100数据点的这个序列被送入网络之前,任何训练的目的与消除储层的初始状态的影响。接下来的2000数据点被送入网络,和线性回归的结果之间的最小二乘方法进行储层(神经元活动的水库)和所需的网络输出。的拓扑结构和权值从输入神经元的连接到水库,从偏见神经元到水库,水库的神经元回储层是由生长过程。

切入的性能数据用于训练输出权重通常不是一个好的测量网络的泛化能力的新数据(77年]。因此,在经济增长过程中每个静态网络的泛化性能计算在每一个时间步和用于更新的健身价值日益增长的网络。泛化性能测量是归一化均方根误差计算在一组84 -一步预测( )[34]。具体来说,在每一个时间步,培训输出权重后, 为每个静态网络计算在20国集团(g20)随机选择序列从Mackey-Glass系统。这些序列由184数据点。为了防止过度泛化,每10个时间步一套新的20序列是随机从200名不同的序列。的生长过程,持续了3600年的时间单位,最好的生长锥的位置在每个成长网络代表表现最好的网络发现的整个生长过程。越来越多是一个表现最佳网络/网络和通过翻译实例化网络的最佳位置的生长锥进相应的静态网络。最好的静态网络的表演被计算验证 每个网络使用100个新序列,每条长度为2084。表现最好的网络验证数据被作为解决方案。末增长过程日益增长的网络往往会趋同于一个特定的配置和最后的验证步骤确保网络的最佳解决方案泛化的性能。

SINOSA模型,37试验运行与规范算法生成的集体行为,和38试验运行随机运动。在Mackey-Glass实验中,平均而言,一个时代的增长(部分中解释3所示。1)的切入50神经元在水库需要2小时的CPU时间。切入的一个时代的增长与100个神经元的水库需要5个小时的CPU时间。切入的一个时代的增长与400个神经元的水库需要3天的CPU时间。网络使用集体行为意味着长大的 与随机波动小于68%增长有95%的信心。

一旦生长过程已经完成(3600年后时间单位)发展网络被精炼进一步优化搜索过程和运行额外的3600个时间单位。这个改进是实现继续增长(搜索)过程与新增长锥,重量小的领域最大的大小。具体而言,为每个连接在表现最好的静态网络中发现第一个时代,除了从储层到输出神经元的连接,固定连接相同的体重之间创建相应的细胞 。静态网络实例化时从日益增长的网络在第二期,权重在静态网络连接权重值之和由生长锥和固定连接。

网络SINOSA模型生成的生长过程延长一个时代,总共两个增长的时代。表1比较使用集体运动,获得的结果与那些获得使用随机运动,当生长过程扩展。每个数值代表的意思 和增长的95%置信区间对应的时代和阶级的运动。可以看出,对于集体和随机运动,有一个小但是显著减少的意思 每个时代的增长。此外,对于每个时代,的意思 使用集体行为的网络增长小于使用随机生成的网络发展的运动。

的进一步证据SINOSA方法的有效性可以通过比较与研究[34,39],它代表着最先进的性能Mackey-Glass时间序列预测。在[34与400年],回声状态网络神经元水库优化预测Mackey-Glass时间序列( )。这些网络的表现最好,由一个专家,hand-designed了 。在[39Mackey-Glass],使用相同的参数值时间序列用在这里,一个回声状态网络1000神经元水库hand-designed由一个专家了 。SINOSA模型被用来种植回声状态网络与400个神经元在储层预测Mackey-Glass时间序列。平均产生的网络增长 ,这些网络有一个最好的 。与400年平均增长网络神经元表现最好的hand-designed 400 -神经元ESN约一个数量级,他们也表现得比1000 -神经元切入。这些结果提供强有力的证据使用SINOSA模型的有效性增加回声状态网络,而不是优化的标准方法通过试验和错误。

3.2。双极平衡问题

在所有的实验中,双极平衡的问题,处理参数设置为最常用的值(75年)如下:车的质量 ,1号杆的质量 ,第二杆的质量 公斤,车和轨道之间的摩擦系数 Ns / m,两极之间的摩擦系数和铰链 Nms,第一杆的长度 ,第二杆的长度 。被限定在间隔的控制力量 。参数定义的领域成功的控制设置 m和 。在大多数过去一样工作,管理系统的动力学方程数值求解使用的步长四阶龙格-库塔方法 年代。在仿真中,一部分cart-pole系统的状态是一个神经控制器每0.02年代,此时被更新的控制力量。在本文的实验中,一个神经控制器不是获得速度信息作为输入;相反,它只收到当前位置的购物车和两极( , , )。这样做是为了使控制小车的任务更加困难。这些值被缩放的间隔 之前被输入到一个神经控制器。这样做的好处是,一系列的值是由神经元更适合处理与双曲正切传递函数。网络输出(控制信号)的时间间隔 ,乘以 为了产生控制力。储层神经元和神经元的输出使用双曲正切函数的传递函数。没有一个神经元有一个内部状态。

SINOSA模型被用来种植回声状态网络控制器的双极平衡的问题。这些网络有三个输入神经元,一个为每个类型的信息;网络给出了关于cart-pole系统的状态(极# 1车位置,位置,位置极# 2)。水库总是由20个神经元。一个输出神经元在场,产生控制信号。没有偏见神经元由于使用对称cart-pole系统。生长锥被允许建立连接从输入神经元的水库和水库神经元回水库。另外,每个储层神经元有固定连接神经元的输出。reservoir-to-output连接上的重量是固定和随机的均匀概率区间 。网络体系结构是否则相同的Mackey-Glass网络(见第三段的部分3所示。1)除了在这种情况下每个储层神经元只有4邻居神经元。

在经济增长过程中每个静态网络的性能在每个时间步计算。这个函数 评估来确定回声状态网络的性能增长作为控制器的双极平衡问题,是吗 方程(7在介绍了)75年)和基于性能(健身)函数在过去工作的双极平衡的问题。计算第一项(7)cart-pole系统设置为初始状态 。网络可以为1000时间步长控制系统。时间步的数量 控制器保留购物车和波兰的成功域( )计算。如果系统随时离开成功领域1000时间步之前,然后仿真停止。第二项是衡量系统的稳定性在过去100时间步长,而神经网络控制和表达的功能 在哪里 第三和第四项是神经控制器的措施归纳的能力。如果 计算后第一项,然后神经控制器可以控制系统100000时间步。额外的时间步的数量 控制器使购物车和波兰的成功域计算和仿真停止如果系统域或成功 。第四项是通过将计算625年cart-pole系统不同的初始条件,允许网络控制它从每个开始配置1000时间步。的变量 代表了许多不同的初始条件的神经控制器能使系统成功域连续1000时间步。625年(定义独特的初始条件74年]。

在每一个时间步的增长处理每个网络映射到静态网络代表了当前物理配置,使其性能可以通过评估计算(7)。申请前输入到网络每个神经元的输出总是设置为0。前网络允许控制购物车和波兰人cart-pole系统演化的动力 年代,以及由此导致的10系统状态序列输入到网络。神经网络生长过程持续了600年的时间单位,之后的静态网络的最佳性能(最大价值 )作为解决方案。

共有51运行试验从不同,随机生成的初始条件。在双极平衡实验200时间步的增长需要大约0.3小时的CPU时间,400时间步需要1.4小时,600时间步需要3.3小时。表2比较网络的性能增长使用集体运动性能的网络增长使用随机运动。比较的性能是由在增长过程中每200时间步。每个数值的表显示的95%置信区间。表中的值2计算如下。为每个审判,这三个预定义的时间步长(200、400和600年),两项措施表现最佳的网络在成长过程中都被记录下来。第一个措施是网络是否成功地实现 当计算(7)。第二个衡量的价值 。在表2这个词 指的是表现最好的网络实现 。这个词 是指的平均值 接管所有表现最佳的网络。从这些结果很明显,网络发展与集体行为大大超过了随机生成的运动性能的措施。

提出了一项研究,有助于比较(75年),代表最先进的双极平衡的性能问题。在这种情况下,回声状态网络优化控制器的双极平衡问题通过一个先进的适应形式的进化策略,利用协方差矩阵(CMA-ES)。在这项研究中CMA-ES被用来优化输出权重和水库权重矩阵的谱半径。的实验在本节中,讨论SINOSA模型用于种植esn的控制器双极平衡问题,坚持同样的实验装置和方法(75年),但在我们的研究中变得神经控制器只收到10从cart-pole系统输入之前开始控制而不是20。因为评估健身/网络的性能优化过程的计算瓶颈,这种评估的数量在一个优化运行是一个很好的衡量整个过程的计算成本。平均需要19796评估CMA-ES方法找到一个神经控制器能成功地控制了车至少200的625初始配置(平均是224),和这些网络91.4%的人能够成功地控制购物车100000时间步时开始在标准的初始配置。这些结果是非常好的关于过去工作在双极平衡的问题。SINOSA模型能够更好的生长表现神经控制器和更少的计算代价。只有9600的评估后,平均而言,表现最好的成长网络能够成功地控制625年最初的478年的车配置,和这些网络100%的人能够成功地控制100000时间步的车。

4所示。讨论

SINOSA模型包含了一个集成的网络的重量和拓扑。这个表示的对象是细胞(神经元),轴突生长锥。细胞有固定的位置,但生长锥能够引导细胞的轴突通过一个连续的、三维的空间,产生一个成熟的网络和固定连接和权重。综合表现的结果,可以将最简单、规范形式的算法模型的目的同时优化网络权值和拓扑。实际上,SINOSA模型把网络自组装过程的优化或搜索过程,同时增长的多个神经网络是由相互作用和与问题相关的网络输入。

的能力SINOSA模型来优化神经网络计算任务测试使用两种不同的极具挑战性的和广泛使用的基准问题域的时间序列预测和控制。每个计算问题的回声状态网络增长通过算法优于使用集体行为生成的那些种植使用随机生成的运动,而且在大多数情况下的性能差距是非常大的。具体地说,网络发展的随机运动相比,那些种植使用SINOSA模型与集体行为执行3倍Mackey-Glass时间序列预测问题和19倍和12倍两个双极平衡问题的综合措施。此外,大型网络性能的改善在随机搜索来获得额外的计算成本,因为很少评价网络性能的瓶颈。

与控制情况,包括随机搜索提供了一个基本水平的支持的优化功能SINOSA模型和演示的可行性功能的自组装作为网络优化的一种手段。的进一步证据的有效性模型优化网络可以通过比较找到这里给出的结果与研究,涉及不同的方法Mackey-Glass优化网络的时间序列预测问题和双极平衡问题。例如,400 -神经元回声状态网络增长使用SINOSA模型执行近一个数量级比400年表现最佳的神经元ESN提出了(34与Mackey-Glass时序)。此外,他们甚至比1000 -神经元切入了(39)平均1.6倍。进一步比较点,网络通过SINOSA方法比那些生长在(75年)平均2.1倍。此外,我们切入优化平均少52%计算费用。这些结果也有趣之处在于它们代表的一个相对少量的研究,回声状态网络已经成功被训练成神经控制器使用强化学习。

值得指出的是,SINOSA模型可以在更抽象的表示通过上述自组装组件。想象我们优化网络 可能的加权连接。然后,根据(2)有两种截然不同的一维欧几里得空间与每个可能的连接相关联。此外,有一个单峰函数 这是非负和对称的定义在第一空间和一个函数 在第二个定义空间。每一个这些空间将包含一组粒子(生长锥)限制移动。只有那些粒子在一个给定的空间将根据PSO算法进行交互。网络将创建基于粒子的位置以完全相同的方式描述的部分2.1。2。我们选择将自组装集成到我们的模型从一个渴望照亮的过程物理网络通过自组装可能会优化自己的重量和拓扑。

5。结论和未来的发展方向

并发优化的神经网络权重和拓扑是一项具有挑战性的任务很大程度上归因于粗糙度的目标函数时遇到的搜索域由一个连续的空间和重量离散拓扑空间。通过SINOSA模型我们已经演示了如何网络自组装可以提供一个有用的手段,简化了代表这个搜索域表示域单一、连续搜索空间平滑的目标函数可以定义。此外,利用群体智慧的形式集体行为来推动网络发展过程中,我们能够将自组装过程变成一个优化的过程。

我们的研究的四个主要贡献如下:(我)SINOSA模型构成的新的有效手段同时优化神经网络的权重和拓扑。模型被用来种植回声状态网络执行基准问题比网络更好通过随机搜索优化。更重要的是,发展网络也优于回声状态网络提出了两种不同的过去的研究,一个网络hand-designed由一个专家和他们的其他优化使用最先进的形式的进化策略(CMA-ES)。(2)没有过去的工作使用的并行优化算法神经网络权重和拓扑。例子确实存在往往涉及相当复杂适应性的方法,显著的限制允许的拓扑结构,或与其他类的方法如杂交过程的进化算法。相比之下,SINOSA模型使用PSO的优雅规范形式管理增长/优化过程。(3)过去绝大多数算法,粒子嵌入在高维抽象空间,如函数的领域,他们是“对象”的基本类空间,和一个粒子的位置代表一个解决方案要解决的问题或解决方案组件。相比之下,SINOSA模型包含了一种新奇的方式查看PSO的生长锥(粒子)是嵌入在一个连续的,旨在模型物理空间的三维空间,和越来越多的网络在空间对象的基本类。(iv)过去的大多数工作在自组装都集中在经典的自组装的问题,这需要当地控制机制的设计,使组件的自组织成一个集合鉴于目标结构。SINOSA模型表示一个扩展经典的自组装问题功能的自组装,其中包括网络结构的自组装生长的最优标准中定义的质量或性能方面新兴的结构,而不是增长指向组装一个预定的目标结构。

有各种各样的潜在SINOSA模型的未来研究方向。在这里我们提到三种可能性。首先,它是有用的扩展这项工作允许物理空间中的神经元的数量能够增加或减少取决于网络大会期间的计算需求要解决的问题。灵感可能从相当大数量的过去的研究涉及到动态地修改神经网络的节点数量。其次,还需要进一步的研究来确定在多大程度上依赖SINOSA模型的参数问题,和什么值适用于各种不同的问题。最后,自成立以来,粒子群优化的规范形式经历了大量的适应性和杂交过程。许多这些增强功能可以被纳入SINOSA模型,而无需改变其基本结构。

利益冲突

作者宣称没有利益冲突有关的出版。

补充材料

这个动画是一个网络的例子生长过程由SINOSA模型。小的彩色球体生长锥,它发生在连接(轴突)增长的主要技巧和负责指导连接从发射到目标细胞(神经元)。大型球体代表空间周围细胞生长锥的区域必须输入为了生长锥之间建立一个连接的发射单元和相应的靶细胞。连接建立的生长锥上的重量取决于生长锥的当前位置对细胞的“势力范围”的中心。为了清楚起见,只有一小部分的总数增长锥参与增长过程显示和没有显示的连接。有七个不同的生长锥显示,显示的颜色。在这个例子中每个生长锥有一个靶细胞,它可以建立联系。生长锥细胞内一组都有相同的目标,而正是这些生长锥相互作用通过受粒子群优化机制。增长发生在三维空间和生长锥的运动不是有界的。初始化生长过程通过将每个生长锥的势力范围内随机选择位置单一靶细胞。 Initially, the growth cones exhibit highly variable, wide-ranging movements as they explore different weighted connections or no connection at all. As the growth process progresses, and better networks are discovered, the growth cones exploit this information and begin to converge on single points in space, which ultimately represents a single best-performing network.

  1. 补充材料