文摘

有效的和高效的路由是最重要的一个部分的路由NoC-based神经形态系统。事实上,这种通信结构连接不同的单位通过数据包路由网络中路由器和交换机嵌入式芯片上。这种能力的帮助下,不仅可以创建高可伸缩性和高发展,但是通过减少全球芯片级线路,可以减少电力消耗。本文的自适应路由算法NoC-based神经形态系统提出了一种混合选择策略。因此,交通分析仪首次用于确定本地或外地交通的类型取决于啤酒花的数量。然后,考虑交通的类型,RCA和NoP选择策略用于外地和本地策略,分别。最后,使用在模拟器上进行的实验环境,它已经表明,这种解决方案可以减少平均延迟时间和功耗。

1。介绍

神经形态计算,也被称为“神经工程”,使用一个模型启发人类的大脑机制。这种技术不仅模型理论神经科学也解决机器学习问题。神经形态计算这个词是一个概念由Carver Mead在1980年代末描述使用超大规模集成(VLSI)系统包含电子模拟电路模拟神经和生物体系结构存在于神经系统。目前,神经形态一词用于描述模拟系统、数字系统、模拟/数字复杂系统和软件模型神经系统(1- - - - - -3]。处理机间通信是支持一个有效的组播管理的神经生物学基础。它使用一个分组交换网络实现高耦合的生物系统。source-routed数据包,即。,they move only information near the packet issuer; the network is answerable for liberating them to their destinations. The function of a router is to be able to specify several different destinations to reach the desired packet when faced with a routing problem in sending packets. Accordingly, routers have the ability to broadcast, i.e., they can send a packet to multiple path simultaneously.

数增加的组件在系统芯片(SoC)加上公交系统造成的干扰问题的增长导致NoC的外观。这些网络来消除这些问题,介绍了提高NoC-based神经形态系统的性能。在这个基础设施,而不是使用布线或通信路径,数据包路由技术是用于网络(3]。在这些网络中,有几种不同的路径从一个节点移动到另一个;因此,应该有一个算法来获取到达目的地的路线。路由算法可能仅仅使用当前和目标节点的地址计算路线(明确的路由),也可能使用其他的交通信息采集节点计算路线(自适应路由)4,5]。在自适应算法中,计算路径和使用存储在包的头部在中间节点的通道。死锁发生在数据包需要一个通道用于其他包继续他们的路径。流浪也意味着包不长和不合理的时间到达目的地。即自适应路由算法测量一组输出通道接受关于包的路径可以通过到达目的地6,7]。之后,根据网络的特点,包括拥塞率或长度的一个输出通道的路线,选择函数将被利用来选择输出通道从一组允许输出通道。在这种情况下,使用流量分析器决定函数的类型根据本地或外地车辆的类型。因此,在这种情况下,根据流量的类型,可以确定适当的战略。使用路由算法的整体示意图和选择函数呈现在图1(8]。因此,在这个研究中,一种混合函数自适应路由算法提出了流量分析仪,,除了增加NoC-based神经形态系统的效率,可以减少电力消耗创造平衡在这个基础设施(9,10]。

1.1。贡献

在之前的工作中,各种选择策略提出了改进路由算法,每一个都在研究成果提出了挑战。例如,在裁判。11),通过使用一个虚拟电路开关,路由是最小化,从而减少能源消耗。在[12- - - - - -15),选择函数提出了基于输入和输出选择和NOP技术,他们已经能够减少能源消耗。

此外,在[16),用于选择策略XY路由实现的改进减少延迟。在该方法中,我们第一次分离的计算可以离线完成的主要处理步骤。通过这种方式,可以减少处理开销每次运行。在下一步中,提出了一种选择策略根据交通情况。在这种情况下,使用流量分析仪,决定选择函数的类型根据本地或外地车辆的类型。因此,在这种情况下,根据流量的类型,可以确定适当的战略。这样,除了降低能耗,可以减少延迟和堵塞等其他参数与其他解决方案相比。

1.2。论文组织

研究组织如下。在下一节中,相关作品陈述前面算法用于NoC-based神经形态系统以及选择功能。节3声明,建议结合方法提出一个结合选择功能。节4分析的结果表明模型在不同的场景中。部分5本文总结道。最后,第六节讨论未来的工作。

近年来,许多研究人员研究了不同利用算法以及不同领域的选择函数NoC-based神经形态系统,我们检查一些在这些科目在以下部分中进行研究。神经形态模型在VLSI系统的开发范围,模仿神经system-SNN的神经网络。它是一个大规模并行系统组成的大量计算的单位称为神经形态由NoC原子核相互关联。沟通管理在神经形态框架NoC的责任。近年来,提出了自适应路由算法使用本地或外地NoC的信息。在每个路由器由于拥塞信息,区域交通拥堵NoC架构可分为两类:在某些架构,一个路由器控制整个网络的状态,而在其他架构的路由器都知道网络的一部分的状态(17]。

区域交通拥堵意识(RCA)使用一个轻量级的积累和传播网络拥塞信息(18]。其他的研究(11,12,19,20.)还提供全球交通拥堵已经审查,收集的信息。另一种类型的建筑在神经系统中,研究只有少数外地节点而不是所有节点是NoP架构,这是基于destination-based自适应路由。一般来说,NoC架构使用路由策略来避免死锁。NoC的结构基础上,两种类型的拓扑结构中常用的NoC: NoC树和NoC网。例子包括NoC网络TrueNorth和Loihi NoC多级网络Dynapse [21),并为CxQuad NoC树。大三角帆[13)可以实时模拟大脑通过连接100万ARM处理器。通过将十八ARM处理器集成到多片处理器(CMP)和2 ^ 16通过系统二维网络结构的形成。

在[22),一个名为PACMAN是提出研究的方法在大三角帆SNN映射。PACMAN使用模拟退火算法搜索最佳的分区计划。各种各样的先前的研究已经研究了神经网络加速器在降低功耗等参数23,24),增加吞吐量(25,26),为信息处理和内存带宽的使用评估。各种各样的先前的研究已经研究了神经网络加速器在降低功耗等参数23,24),增加吞吐量(25,26),信息处理和内存带宽的使用是评估(27]。在[9),大众传播下的各种拓扑结构的行为神经网络的交通调查。研究人员得出结论,网状网络执行比公交车在点到点和树链接。另一个大规模神经网络架构是拥抱,由一组相互关联的处理元素的矩阵称为神经瓷砖的5]。在H-NoC,节点被安排在三层,即模块,瓷砖,集群。

在第一层,高达10神经细胞连接到路由器模块形成一个神经元。此外,十个神经元模块连接到路由器形成瓷砖就越高。在更高的层。,the third layer, four tiles are connected to a router, forming an EMBRACE cluster. Traffic in the neural network is multicast and all-broadcast; therefore, many previous studies that support mass communication in the NOC can be effective in managing interneuronal traffic [28]。大众传播方法分类是基于消息的重复。主要课程包括单一的广播,基于路径,或者基于树的多播路由(29日]。可加工的系统的发展是一个重大挑战的大量的多种感觉的数据认知计算的新时代。这种类型的智能计算有一定的局限性等实时性能,低功耗和可伸缩性。结构和架构模仿大脑在这个领域蕴含着巨大的希望。由于这个原因,在30.,31日),TrueNorth突触神经已经开发了一个65兆瓦的实时处理器使用non-von诺伊曼体系结构,使用低功率,是高度并行的,是可伸缩的,是容错。NoC-enabled均匀CMP架构关注神经科学的程序已经被探索。例如,大大并行CMP平台包含一个专门设计的NoC体系结构被用来实施强化神经网络(32]。

神经网络的研究和分析不同的拓扑需要很高的配置这些加速器。这里有一些受欢迎的芯片是快速的例子加速器的神经系统。某些芯片如TrueNorth [33],Neurogrid [34],BrainScaleS [35],Loihi [32),和大三角帆36)激励强化神经网络用不同的特性。为进一步研究在这方面,我们考虑Furber解决方案(16,36这些芯片)。大三角帆使用处理器体系结构,连接到本地内存芯片。与其他结构相比,它可以配置,但在能源消耗方面,这是在一个较低的水平相比。BrainScaleS互联为几个相互关联的晶片,每一个都包括几个HiCANN神经元。模拟这种体系结构的目的是调查在加速生物神经行为。Neurogrid SNN分析仪为模拟电子应用程序而设计的。这种架构实时操作和遵循一些环保方法。最后,数字系统中实现的架构TrueNorth神经形态芯片。这四个架构了一大步发展的神经与模仿的目标处理器环境和神经形态系统降低能耗。表1,通过模仿Furber [16),检查每个建筑的特征与对方相比从不同的角度参数。

3所示。该方法

提出的策略,侧重于选择算法开发这些系统的基础设施部分的框架内。最初,建议的解决方案的主要要求是检查,和主要研究的核心,这是交通分析仪和混合选择函数的表达式,提出了表达及其功能。计算的一部分选择的策略是做过模拟操作;离线计算的执行算法可以减少延迟,由于减少了计算时间。

3.1。离线计算策略

部分的选择计算策略的研究,如链接连接和抗性的平等,离线计算和算法实现之前,这是解释如下:链接争用(CL):链接争用被称为流量值,可以通过一个特定的链接中提供基于通信的通信图(29日]。如果 是一个任意的通信路径, 是所有可能的路径的集合, 所产生的交通通讯, 是程序中指定的所有通信流量和提取通信图,争用CL的联系可以表示如下: 等效电阻(ER):通过定义这个概念(ER)对于每个给定的沟通,和使用的电气概念基尔霍夫定律,每个节点拓扑中被认为是一个电路节点和每个链接视为一个电阻体积等于该链接的争用(37,38]。

3.2。需求的在线功能

在算法的执行,其他额外的可用数据也用于路由,如下:(我)免费的缓冲行(d)(B):在输入缓冲区的行数是邻居相邻路径d在这d的北、南、东、西方向。(2)瞬时功率(Δp):瞬时功率的区别是路由器的功率消耗 ,在哪里 是最终的输出通道选择包。

利用这些信息,可以获得一个更好的估计的交通负载网络和一个更合适的决定将目前的下一跳。

3.3。流量分析仪

为了避免死锁的路由算法和减少延迟时间,一个分析器和选择函数添加到路由算法,以便它可以用来选择最好的出口基于本地或外地包的性质。因此,分析仪首次提取每个数据包的目的地址路由通过路由器T周期和检查其数据。为此,两位计数器是用于确定请求的本地或外地自然在路由器14]。如果数据包的目的地是两跳或更高版本从当前路由器,它被认为是一个外地包;否则,它被认为是当地的。定期分析仪计算包啤酒花,因此,它更新的柜台位置和(l)和非定域性(N)的数据包。这些信息被发送到切换器决定选择策略。计数器是每个月底T周期。确定交通类型的伪代码如图2

事实上,的帮助下流量分析器,它可能获得适当的信息的交通及其收敛到本地或外地交通(11),然后在下一步中,路由可以做相应的操作。图3显示解决方案的示意图。

因此,每个月底32周期,交通模式是由分析器的输出,和当地交通率计算外地(x)。如果 ,然后交通不均匀,RCA算法(20.必须使用);否则,NoP (39)将使用选择策略。换句话说,如果交通模式是面向当地交通的目的地,NoP-based选择策略被激活;否则,RCA-based策略将被激活为外地交通提出策略。切换操作的通用算法基于流量分析仪呈现在图4。这个算法的输入数据是本地或外地的数据类型,和相关的输出也是最好的策略。还应该指出的是,由于分析仪和切换只需要路由器的数据在任何时间,在网络通信没有额外的开销。

3.4。解决方案的制定

当路由功能接收到多个输出,检查预订表,选择算法为每个这些输出检查是否可用的通道传输数据包(头掠过)或其保留其他头掠过40]。通道必须可用,这样选择的分数计算,最终,选择得分最高的通道。如果更多的渠道有相同的分数,将选择第一个。分数的计算是通过以下公式: 在哪里 的重量因素的概率选择链接,打开的缓冲区,瞬时功率消耗。这些系数导致所选算法的全动态适应性,因此,设置值将在他们的最佳状态41]。开放以来缓冲区(B)和瞬时功耗( )有不同的单位,他们是规范化使用max-buffer-size和最大功率的因素。此外,由于Psel的范围内(0和1),不需要规范化。然后,使用下面的公式,自适应路由功能的得分和所有可能的值 评估和最好的系数得到的每个路由器:

例如,最好的价值 在单双数路由是0.3、0.4和0.3,分别在MMS交通场景。这个算法的另一个重要特性是它的适应性与任何网络拓扑结构(42]。

4所示。实验和模拟环境

本节提供了一个平台,模拟NoC-based神经系统的结构和框架。Nirgam模拟器是用来评估功能表中列出的建议的算法2(13,19]。这个模拟器的主要组件是路由器,处理元素,链接和缓冲区(43,44]。此外,配置参数的分析和仿真建议方法给出了表3。此外,平均延迟,最大延迟和功耗的效率标准。之间的延迟是假设随着时间进入头掠过网络和尾搬家到目标节点的到来。为了评估该方法,随机,RCA, NoP策略进行比较(45,46]。在这里,研究结果显示在不同的交通场景。

4.1。第一次评价:负荷= 40%

在这个评估中,评估解决方案的情况下交通负荷的40%。通过评估,性能可以测量低流量和nontraffic情况。平均仿真结果实现了5000年之后。评价结果如图所示5-10年。首先,在图5整体延迟,平均每个通道。因为它可以观察到,该策略在这种情况下比其他选择更优的解决方案。

自外地包的RCA选择策略具有更好的性能,它是什么,因此,渠道自然较低的性能;另一方面,自从提出策略不同的选择函数基于跳的长度和位置和非定域性的频道,它有最高的效率。总平均延迟如图6

总延迟,可以看到,RCA效率增加由于外地交通的增加率,但是考虑到建议的解决方案的核心除了使用RCA使用NoP路由功能,自然有更高的效率。在这种情况下,原因是使用不同的策略进行本地和外地数据包的包将以更少的延迟和通过更好的路径,从而导致网络中负载平衡和减少能耗,这是清晰的从图7

如图7,被提议的解决方案能够减少消耗功率,这样就减少了超过50%相比,随机的解决方案。事实上,的一个主要原因减少功耗,除了离线计算,运用不同的策略是根据数据包的状态,和,因此,最好的输出路径选择总是基于网络状态。因此,创建一个最佳的负载平衡,从而降低功耗,因为在其他方法如随机、输出缓冲区状态不是研究,因此,包可能会导致在一个路径导致增加交通或放置在其他路由器的队列的输入缓冲区,从而导致瓶颈和增加热量和电力消耗。

4.2。第二次评估:负荷= 70%

在这个评估中,评估解决方案的情况下交通负荷的70%。通过评估,可以检查一个性能水平在高负载的情况。平均后仿真结果取得了5000分。评估结果如图8- - - - - -10

如图8,尽管平均延迟有显著增加的解决方案,最好的选择输出通道已经提出解决方案使用选择函数,检测本地和外地的交通,这导致较低的延迟比其他解决方案。平均总延迟也显示在图9再次,可以验证解决方案的最优性。最后,在图10的功耗测试解决方案和加载速率为70%。提出的最优功耗策略也提出了图。

5。结论

通常会有几种不同的路径在NoC-based神经形态从一个节点移动到另一个系统;因此,选择使用功能以及路由算法。任何路由算法的效果取决于选择策略。路由时,函数返回一组输出通道,选择函数用于选择输出通道发送的数据包(19]。在这项研究中,一个自适应路由算法提出了一种混合选择策略,并利用交通的类型,它可能选择最好的出口通道的本地和外地的数据包。最后,在Nirgam模拟,结果表明,这种方法大大提高了效率。进行的测试表明,该方法能显著降低平均和最大延迟和RCA相比,NoP,和随机策略,当一些计算离线完成,能耗显著降低。

6。未来的工作

基于本文获得的结果,我们将提高我们的方法的效率,使之更适用于现实世界的物理环境。除此之外,将考虑更多的标准使我们的方法满足更NoC-based神经形态系统的并行处理。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。