能源消费的一个主要问题在当今计算机科学,以及越来越多的科学社区评估time-to-solution之间的权衡和energy-to-solution感兴趣。尽管在过去的二十年里,计算围绕集中的计算基础设施,如超级计算机和数据中心,广泛采用物联网(物联网)模式是目前反相这一趋势由于它生成的大量数据,将计算能力回到的地方数据生成了所谓的雾/边缘计算。这种转向分散模型需要一个等价的软件工程模式的变化,开发环境,五金工具、语言、科学和计算模型编程计算能力通常是有限的,因为当地的需要仔细评估的功耗。本文的目的是展示如何将这些概念实际上实现科学软件通过提供强大的艺术的状态,耗电量处理器从一边和节能意识从另一个工具和技术。
信息和通讯技术(ICT)发挥着基础性的作用,支持人类活动对全球经济、社会和环境可持续发展(
这种情况明显对于高性能计算(HPC)的基础设施,在能源费用之和超过一台超级计算机的寿命与收购成本和代表一个最相关的元素的总拥有成本(
的焦点performance-at-any-cost计算机操作导致了超级计算机的出现,消耗大量的电力和产生热量,延长冷却设施必须构造,以确保适当的性能。结果是,在部署一个exascale系统的背景下,当前技术的简单扩展将导致超级计算机100兆瓦的电力消耗,而限制20 MW被估计为最大可接受的限制(
同样的问题也出现在通用数据中心:在美国,这样的基础设施在2014年消费约700亿千瓦时,占美国电力消费总量的1.8%,在
这个场景必须结合,因为在过去的二十年里,计算机已经集中在集中(和可能比较复杂
虽然HPC well-specific市场领域,所谓的“嵌入式高性能计算”是一个新兴的话题
我们可以制定问题需要评估一个满意的time-to-solution和energy-to-solution之间的权衡。这个问题已经面对不同的方法,可以概括如下:供应商工作在低功耗处理器架构和软件开发人员如何使用它们。然而,达到exascale计算机,一个有效的解决方案可能是通过适当的管理系统的所有层,从软件堆栈到冷却系统(
能源效率是现代计算机系统的一个关键设计挑战了许多年。更多的现在,大数据范式需要解决两个问题相关的高效处理大量的数据,如何在一个绿色的方式实现这一目标,即。,考虑可持续发展问题和环境问题
因此,许多论文提出新颖的技术管理实力方面,呈现真实的经历,一起调查和概述,已经出版。一个关键分析如何绿化大数据系统的整个生命周期提出了(
然而,一个问题所代表的是,几乎所有现有的调查关注的只有一两个主要策略,也就是说,
新节能的发展和使用cpu和出类拔萃
使用软件工具和框架降低了功耗的软件使用现有的CPU
此外,正如被大多数的论文,这是一个快速发展的研究领域,新的研究成果不断。例如,在撰写本文时,以下五个欧洲研究项目和计划正在进行:
万宝龙2020年欧洲可伸缩的、模块化的和低功耗高性能的处理器
HiPEAC、高性能和嵌入式架构和编译
连奏的,低能的异构计算工具集
SDK4ED,软件开发工具包对能源优化和技术消除债务
TeamPlay、时间、能源和安全分析多/许多核心异构平台
这是因为欧盟委员会(European Commission)已经意识到至少自2010年以来,ICT行业负责碳排放快速增长和应该保持到最低限度,因此支持更节能的计算技术的发展。
因此,这项工作的主要目标是目前可用的最相关的解决方案为用户感兴趣的软件专注于改善能源消费的科学计算。这是通过调查当前的硬件设备和软件的可用性和性能科学应用的工具。
这意味着相关方面在这里不考虑通信能源效率。有兴趣的读者可以依靠
论文的结构如下:部分
首先,让我们回顾一下技术,利用硬件特性,以减少能源消耗。事实上,大多数目前的架构实现节能技术。它们是基于使用低级的电子特性运行速度不超过必要的电压不高于可接受。他们是
动态调整频率(DFS)
动态电压缩放(德国)
动态电压和频率缩放(dvf)
近门槛电压(NTV)
动态电源管理(DPM)
动态频率(DFS)或电压(dv)扩展允许调节功耗处理器和内存(
例如,电压降低异构加速器装备必须考虑当前系统也因为有效减少总可以实现不同电压的降低水平为每个可用的芯片(
通常,电压和频率范围是完全相互依存。,a change in clock frequency does imply changes in the supply voltage, and vice versa: in these cases, the technique is called dynamic voltage and frequency scaling (DFVS) [
例如,dvf是在Linux内核中实现与CPUfreq子系统(
最近,其他项目集中在近门槛电压(NTV)计算
相反,伺机英特尔Turbo Boost技术允许处理器运行速度比下面的标称频率如果CPU操作定义的功率和温度限制加速计算密集型应用程序(
高级配置和电源接口规范自1996年以来一直发展提供可能性通过软件来管理这些方面,例如,在操作系统级别。例如,ACPI定义16活跃的国家,名叫P0-P15,与一组电源/性能/延迟特性(
节能的架构从许多核心架构,如图形处理单元(GPU)系统芯片(SoC),到Systems-on-Chip (SoC)。gpu特性高每瓦特性能比率。编写本文时,最强大的GPU设备,AMD MI100和NVIDIA A100,分别给出了性能峰值38.33每瓦吉拍(GFlops / W)和24.25 GFlops / W考虑64位浮点操作,电力消耗的,分别为300和260瓦特。因此,显然,gpu瞄准一边在能源效率,但他们需要仔细的规划和优化提供高计算性能。
越来越多地采用了类的低功耗处理器,通常被称为芯片系统(SoC),最初设计为嵌入式和移动市场,是一个有吸引力的解决方案,科学和工业应用的提高计算性能加上相对较低的成本和较低的电力需求。
SoC硬件平台通常嵌入在同一模低功耗的多核处理器可能结合GPU和所需的所有电路几个I / O设备。现成的soc的情况下,可能出现各种限制,如32 bit-only架构,小CPU缓存、小内存大小,互连延迟高,不可用的ECC内存。
然而,一些解决方案逐步减少与高端处理器的性能差距,保持竞争优势的增值成本,减少他们的碳足迹,并保护环境。由于这些原因,在这篇文章中,我们忽视设备如Arduino或覆盆子π的设备,即使考虑计算密集型应用程序(
Fugaku代表最重要的例子,采用SoC HPC-the第一超级计算机TOP500超级计算机在2020年11月,最近在写这篇论文的时候配备了富士通的48核A64FX SoC,提供类似的性能/瓦特价值对基于gpu的系统(
在相应的Green500列表中,我们可以看到,Fugaku出现在位置10一个值为15.418 GFlops / W,而英伟达帕SuperPOD,最energy-savvy系统配备了NVIDIA A100 gpu,提供26.195 GFlops / W但排名仅在170年的全球地位。Fugaku之间的一个更有趣的比较是月之女神,又一台超级计算机配备A100 gpu:最后一个出现在位置5在这两个列表,一个值为23.983 GFlops / W但只提供63460年TFlops / s对Fugaku提供的442010 TFlops / s。
至于大多数HPC架构,问题是这个
这是计算的目标在SOC架构(科)项目(
特别是,深入比较了基于x86的soc的性能(即。,Pentium N3700 and J4205, Avoton C2750, Xeon D1540, and Atom C3958) and low-power GPUs (i.e., Jetson TK1 and TX1) for state-of-the-art high-end solutions (i.e., Xeon E5-2683 and Tesla K20) is discussed in [
虽然比较高端的商业/高性能计算服务器主板基于低功耗SoC的移动和嵌入式世界可以被认为是不公平的,结果评估,使用低功耗架构代表了一种可行的选择time-to-solution之间的权衡,energy-to-solution和经济方面。
作者还讨论在经济方面
对soc的使用基于ARM指令集架构(isa)或fpga,提出了一种定量评价,例如,在[
然而,要注意代码的移植在这些体系结构稍微复杂一点,因为开发和调优工具尚未达到成熟水平,易于使用,不提供广泛的功能,例如那些由英特尔提供免费或者NVIDIA (
如果我们从现成的产品的设计新加入高性能和节能解决方案,最重要的一个引用由万宝龙表示项目,始于2011年。其目标是促进发展的一个Exascale欧洲低功耗处理器,与50 GFlops / W的目标处理器的水平。这个项目是欧洲处理器倡议的一部分,一个框架合作协议开发欧洲等的设计和开发技能处理器。
这个项目,连同ExaNoDe [
此外,万宝龙项目考虑使用ARM指令集架构(isa),如ThunderX处理器家族(
异质性似乎代表了最有前途的方法,例如,通过集成cpu (X86或臂),gpu, FPGA在单个平台(
在前一节中,我们看到,电力和能源消耗已经成为计算硬件的驱动指标设计和最有趣的cpu。然而,硬件的进步必须紧随其后的是能源利用效率算法,适当的选择和配置应用程序特定的硬件,和足够的管理技术。
其中最完整、有趣的介绍加拉格尔(教授提出的问题
能源消费的关键概念是硬件,但这发生在软件的控制下。正常的高级语言(如c++和Java)隐藏的硬件特点,但关键是,可能有很多不同的相同的高层代码(例如,C + +)机器指令程序有不同的能源消耗数据。在这个程度上,一个有趣的工具是由编译器Explorer (
因此,节能已开始在软件层面传播到硬件水平。节能技术和节能硬件管理或电力限制
第一步实现节能行为调查软件行为使用信息作为程序执行(即。,剖析它)或模拟性能模型。
分析的最常用的工具之一是性能API(爸爸)分析图书馆(
同时,电源组框架(
可扩展并行代码的性能测量基础架构(Score-P) [
Extrae工具依赖爸爸允许收集其countermetrics(包括电力和热力数据)并行程序(
节能意识计算框架(EACOF),目的是允许开发人员为能源消耗(概要文件代码
一般来说,许多工具,如这两个一直在文献中提出的。值得引用EProf [
类似的命运发生的多个指标建模基础设施(MuMMI) [
一些工具的目标是实现自动节能数据。详细,其中许多已经提出,例如,(
全球可扩展的开放大国经理(GEOPM)是一个框架,探索电力和能源优化针对高性能计算(
倒计时松弛图书馆(
节能的运行时应用程序开发活力eXascale计算机(READEX)项目已由欧盟资助的地平线2020研究项目在2015年和2018年之间发展tool-aided方法动态自动性能和能源效率(
方法是基于插装和Score-P应用程序。这个可以自动地执行用Score-P编译它。然后,应用程序的动态检测和分析,以识别重大区域将与项目管理在运行时优化方法。
这个套件的主要优势是,它可以利用任何开发人员即使她/他不知道READEX方法,提高能源效率的结果她/他的应用程序。据估计,READEX工具套件的应用几乎复杂的应用程序可能需要数天(
异构计算的低能工具集(连奏的)项目已由欧盟资助的地平线2020研究项目在2017年和2020年之间,设计和开发一个软件工具链的节能计算在不同的硬件上,即。,系统配备cpu、gpu和FPGA (
工具链在2020年被释放,它可以通过GitHub (
壁炉的工具链由omps表示
omps编程模型的应用程序由一个或多个任务与可能的数据依赖流在其中的一些。运行时环境分析结果图和生成一个正确,可能并发的任务执行顺序。一些编译器和运行时系统(如Nanos6, XiTAO [
中定义的三个使用案例已经医疗、物联网智能家居和城市,和机器学习,因为他们有不同的需求在能源效率方面,容错和安全性。结果已发表在交付5.4 [
软件开发工具包对能源优化和技术消除债务(SDK4ED)项目已由欧盟资助的地平线2020研究项目在2018年和2020年之间尽量减少成本,开发时间和低能耗的软件开发过程的复杂性设计方法论的方法和软件工具链(
SDK4ED平台(
关注能源的工具箱,分析项目可用的在线存储库中(例如,GitHub)的机器上运行码头工人容器对其能源效率。这意味着它发现能源热点,估计,能源消耗通过静态或动态分析(
该项目在2020年底结束。因此,在写作的时候,并不是所有的细节和可用的代码。
多的时间、精力和安全分析/许多核心异构平台(TeamPlay)项目已由欧盟资助的地平线2020研究项目自2018年以来,设计和开发新的技术为低能耗生产高度并行软件系统,如物联网设备和CPS [
的想法是开发一套工具,允许程序员思考时间、能源和安全程序源代码级别的。这个想法是设计新的语言结构来管理这些extrafunctional属性作为源代码的一等公民和表达合同在源代码中由一个潜在machine-checkable证明系统。
这个项目正在进行中;因此,在撰写本文时,一些信息和软件组件。
能源消耗日益成为一个最相关的问题科学应用程序和工作负载的计算平台。
所(
在本文中,我们提出了最先进的解决方案,硬件和软件,为追求能源效率和方法科学软件有兴趣的读者提供一个更新的介绍这个主题。我们可以推出的结论是,有越来越多的项目关注这些主题,和一些有趣的SoC-based解决方案是可用的。从软件方面,相反,这种情况并不令人满意,因为工具有时很难被发现,不集成,结束后,通常,消失的项目开发。实际需要的是共同的定义方法和团体行动的协调努力在这个领域比较与虚拟Institute-High-Productivity超级计算(VI-HPS) [
没有数据被用来支持本研究。
作者宣称没有利益冲突有关的出版。