SP 科学的规划 1875 - 919 x 1058 - 9244 Hindawi 10.1155 / 2021/5514284 5514284 评论文章 硬件和软件解决方案节能计算在科学编程 https://orcid.org/0000 - 0003 - 2649 - 0071 达尼埃莱 1 https://orcid.org/0000 - 0003 - 3587 - 3680 Merelli 伊凡 2 https://orcid.org/0000 - 0001 - 8788 - 0829 Aldinucci 马可 3 https://orcid.org/0000 - 0002 - 1828 - 1715 Cesini 达尼埃莱 4 马特奥 克里斯蒂安 1 CNR-IEIIT 热那亚 意大利 2 CNR-ITB 贝鲁斯(MI) 意大利 3 都灵大学 都灵 意大利 unito.it 4 CNAF-Italian核物理研究所 博洛尼亚 意大利 2021年 9 6 2021年 2021年 25 1 2021年 28 5 2021年 9 6 2021年 2021年 版权©2021丹尼尔·达等。 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

能源消费的一个主要问题在当今计算机科学,以及越来越多的科学社区评估time-to-solution之间的权衡和energy-to-solution感兴趣。尽管在过去的二十年里,计算围绕集中的计算基础设施,如超级计算机和数据中心,广泛采用物联网(物联网)模式是目前反相这一趋势由于它生成的大量数据,将计算能力回到的地方数据生成了所谓的雾/边缘计算。这种转向分散模型需要一个等价的软件工程模式的变化,开发环境,五金工具、语言、科学和计算模型编程计算能力通常是有限的,因为当地的需要仔细评估的功耗。本文的目的是展示如何将这些概念实际上实现科学软件通过提供强大的艺术的状态,耗电量处理器从一边和节能意识从另一个工具和技术。

1。介绍

信息和通讯技术(ICT)发挥着基础性的作用,支持人类活动对全球经济、社会和环境可持续发展( 1]。然而,能源消耗是最相关的问题之一,目前的计算平台,和这一趋势预计将继续在可预见的未来。这意味着电费成本日益主导相关应用程序的运行和随之而来的环境污染 2]。

这种情况明显对于高性能计算(HPC)的基础设施,在能源费用之和超过一台超级计算机的寿命与收购成本和代表一个最相关的元素的总拥有成本( 3]。这是因为能源不仅用于计算也为冷却,通信、存储和显示( 4]。

的焦点performance-at-any-cost计算机操作导致了超级计算机的出现,消耗大量的电力和产生热量,延长冷却设施必须构造,以确保适当的性能。结果是,在部署一个exascale系统的背景下,当前技术的简单扩展将导致超级计算机100兆瓦的电力消耗,而限制20 MW被估计为最大可接受的限制( 5]。注意flop-per-watt性能证明了介绍,2007年,Green500的列表( 6)排名500强超级计算机的能源效率( 7]。

同样的问题也出现在通用数据中心:在美国,这样的基础设施在2014年消费约700亿千瓦时,占美国电力消费总量的1.8%,在 8]。一些预测估计2020年一个变化约1350亿千瓦时的电力需求,根据采用的节能措施( 9]。

这个场景必须结合,因为在过去的二十年里,计算机已经集中在集中(和可能比较复杂 10])的基础设施,但更广泛的扩散cyber-physical系统独立主办)目前想扭转这一趋势,将计算能力回到数据生成。在这两种情况下,电信网络的能源消耗是非常相关的 11]。趋势的一个引人注目的例子是物联网(物联网)模式,由数以百万计的设备生成大量的数据在本地pre-elaborated之前综合远程数据分析上下文。也不过,考虑科学、强大的数据采集设备的扩散增加的扩散pre-elaboration计算体系结构,如在生物信息学( 12, 13]。

虽然HPC well-specific市场领域,所谓的“嵌入式高性能计算”是一个新兴的话题 14开发和使用microservers CPS /高度并行的嵌入式计算系统。因此,采用节能系统代表了一个至关重要的方面考虑雾/边缘计算环境的特点( 15]。

我们可以制定问题需要评估一个满意的time-to-solution和energy-to-solution之间的权衡。这个问题已经面对不同的方法,可以概括如下:供应商工作在低功耗处理器架构和软件开发人员如何使用它们。然而,达到exascale计算机,一个有效的解决方案可能是通过适当的管理系统的所有层,从软件堆栈到冷却系统( 16)经过cpu耗电更少。这可以通过减少能源消耗的总系统通过低功耗软件和硬件集成解决方案( 17, 18]。

能源效率是现代计算机系统的一个关键设计挑战了许多年。更多的现在,大数据范式需要解决两个问题相关的高效处理大量的数据,如何在一个绿色的方式实现这一目标,即。,考虑可持续发展问题和环境问题 19]。

因此,许多论文提出新颖的技术管理实力方面,呈现真实的经历,一起调查和概述,已经出版。一个关键分析如何绿化大数据系统的整个生命周期提出了( 20.]。在一个更技术角度来看,Czarnul et al。 21)集中在可用的方法和工具允许适当的配置,管理和节能意识处理高性能计算系统的仿真。应用程序的性能分析工具的概述,包括应用程序的能量分析节能和自动工具,提出了在 22]。使用低功耗芯片系统(SoC)体系结构中讨论科学和工业应用程序( 23),打算评估time-to-solution之间的权衡,energy-to-solution和经济方面的科学和商业目的相比,他们可以实现传统server-grade架构采用目前的基础设施。

然而,一个问题所代表的是,几乎所有现有的调查关注的只有一两个主要策略,也就是说,

新节能的发展和使用cpu和出类拔萃

使用软件工具和框架降低了功耗的软件使用现有的CPU

此外,正如被大多数的论文,这是一个快速发展的研究领域,新的研究成果不断。例如,在撰写本文时,以下五个欧洲研究项目和计划正在进行:

万宝龙2020年欧洲可伸缩的、模块化的和低功耗高性能的处理器

HiPEAC、高性能和嵌入式架构和编译

连奏的,低能的异构计算工具集

SDK4ED,软件开发工具包对能源优化和技术消除债务

TeamPlay、时间、能源和安全分析多/许多核心异构平台

这是因为欧盟委员会(European Commission)已经意识到至少自2010年以来,ICT行业负责碳排放快速增长和应该保持到最低限度,因此支持更节能的计算技术的发展。

因此,这项工作的主要目标是目前可用的最相关的解决方案为用户感兴趣的软件专注于改善能源消费的科学计算。这是通过调查当前的硬件设备和软件的可用性和性能科学应用的工具。

这意味着相关方面在这里不考虑通信能源效率。有兴趣的读者可以依靠 24, 25]。

论文的结构如下:部分 2提出了硬件技术和解决方案实现energy-savvy处理,部分 3讨论了工具和方法支持开发人员在软件生产节能意识,而最后一部分总结了纸。

2。节能建筑 2.1。通用技术

首先,让我们回顾一下技术,利用硬件特性,以减少能源消耗。事实上,大多数目前的架构实现节能技术。它们是基于使用低级的电子特性运行速度不超过必要的电压不高于可接受。他们是

动态调整频率(DFS)

动态电压缩放(德国)

动态电压和频率缩放(dvf)

近门槛电压(NTV)

动态电源管理(DPM)

动态频率(DFS)或电压(dv)扩展允许调节功耗处理器和内存( 26),扩展一个或两个子系统的时钟频率根据内存或计算应用程序的执行内核( 27]。

例如,电压降低异构加速器装备必须考虑当前系统也因为有效减少总可以实现不同电压的降低水平为每个可用的芯片( 28]。

通常,电压和频率范围是完全相互依存。,a change in clock frequency does imply changes in the supply voltage, and vice versa: in these cases, the technique is called dynamic voltage and frequency scaling (DFVS) [ 29日]。特定的硬件机制可以实现以最小的软件和操作系统或通过参与dvf启用软件。

例如,dvf是在Linux内核中实现与CPUfreq子系统( 30., 31日]。2.6内核的原始实现被设计用于在没有实时任务执行。然而,它是可能的放松这个约束( 32]。

最近,其他项目集中在近门槛电压(NTV)计算 33),使处理器在更低的电压工作。因为这可能导致计算错误,适当的检查和重新计算添加算法。

相反,伺机英特尔Turbo Boost技术允许处理器运行速度比下面的标称频率如果CPU操作定义的功率和温度限制加速计算密集型应用程序( 34]。在细节中解释( 35),“热设计力量(TDP)代表权力的最大冷却系统在计算机需要消散。这是系统需要的功率预算操作。然而,这是不一样的处理器可以使用的最大力量。处理器可以消耗超过计划书在短时间内没有热显著。“更多的细节和硬件电源控制器称为运行平均功率极限(RAPL)介绍了桑迪大桥架构提供了( 36]。类似的解决方案,NVIDIA管理图书馆(NVML)已经提供了NVIDIA gpu ( 37, 38]。

高级配置和电源接口规范自1996年以来一直发展提供可能性通过软件来管理这些方面,例如,在操作系统级别。例如,ACPI定义16活跃的国家,名叫P0-P15,与一组电源/性能/延迟特性( 39]。P0,流程运行在最大功率和频率级别,而这些值减少支持从P1到最大π( 40]。

2.2。商用现货低功耗设备

节能的架构从许多核心架构,如图形处理单元(GPU)系统芯片(SoC),到Systems-on-Chip (SoC)。gpu特性高每瓦特性能比率。编写本文时,最强大的GPU设备,AMD MI100和NVIDIA A100,分别给出了性能峰值38.33每瓦吉拍(GFlops / W)和24.25 GFlops / W考虑64位浮点操作,电力消耗的,分别为300和260瓦特。因此,显然,gpu瞄准一边在能源效率,但他们需要仔细的规划和优化提供高计算性能。

越来越多地采用了类的低功耗处理器,通常被称为芯片系统(SoC),最初设计为嵌入式和移动市场,是一个有吸引力的解决方案,科学和工业应用的提高计算性能加上相对较低的成本和较低的电力需求。

SoC硬件平台通常嵌入在同一模低功耗的多核处理器可能结合GPU和所需的所有电路几个I / O设备。现成的soc的情况下,可能出现各种限制,如32 bit-only架构,小CPU缓存、小内存大小,互连延迟高,不可用的ECC内存。

然而,一些解决方案逐步减少与高端处理器的性能差距,保持竞争优势的增值成本,减少他们的碳足迹,并保护环境。由于这些原因,在这篇文章中,我们忽视设备如Arduino或覆盆子π的设备,即使考虑计算密集型应用程序( 41),主要用于装备物联网系统( 42, 43)没有显著,局部预处理的数据。

Fugaku代表最重要的例子,采用SoC HPC-the第一超级计算机TOP500超级计算机在2020年11月,最近在写这篇论文的时候配备了富士通的48核A64FX SoC,提供类似的性能/瓦特价值对基于gpu的系统( 44]。

在相应的Green500列表中,我们可以看到,Fugaku出现在位置10一个值为15.418 GFlops / W,而英伟达帕SuperPOD,最energy-savvy系统配备了NVIDIA A100 gpu,提供26.195 GFlops / W但排名仅在170年的全球地位。Fugaku之间的一个更有趣的比较是月之女神,又一台超级计算机配备A100 gpu:最后一个出现在位置5在这两个列表,一个值为23.983 GFlops / W但只提供63460年TFlops / s对Fugaku提供的442010 TFlops / s。

至于大多数HPC架构,问题是这个 45):与性能相关的原始数据每秒可实现的性能数据和瓦特对应的科学应用,特别是为应用程序我感兴趣?

这是计算的目标在SOC架构(科)项目( 46, 47),一项由意大利核物理研究所(INFN)在2015年和2018年之间。特别是,科项目集中在评估一组广泛的能源消费行为的最先进的体系结构使用基准测试和软件广泛应用于许多科学应用。

特别是,深入比较了基于x86的soc的性能(即。,Pentium N3700 and J4205, Avoton C2750, Xeon D1540, and Atom C3958) and low-power GPUs (i.e., Jetson TK1 and TX1) for state-of-the-art high-end solutions (i.e., Xeon E5-2683 and Tesla K20) is discussed in [ 23)有两个基准,所代表的广泛使用,计算量体算法和使用深度学习方法应用于分类问题,与实际的应用程序从分子生物学领域。

虽然比较高端的商业/高性能计算服务器主板基于低功耗SoC的移动和嵌入式世界可以被认为是不公平的,结果评估,使用低功耗架构代表了一种可行的选择time-to-solution之间的权衡,energy-to-solution和经济方面。

作者还讨论在经济方面 15, 48]通过展示一个适当的位置计算服务考虑边缘和雾组成的云基础设施的关键因素是实现最好的成本之间的权衡,性能和功耗。

对soc的使用基于ARM指令集架构(isa)或fpga,提出了一种定量评价,例如,在[ 49再次,使用体算法。这些设备都利用ExaNoDe项目中建立一个原型计算元件的exascale [ 50]。

然而,要注意代码的移植在这些体系结构稍微复杂一点,因为开发和调优工具尚未达到成熟水平,易于使用,不提供广泛的功能,例如那些由英特尔提供免费或者NVIDIA ( 51]。

2.3。高性能低功耗设备

如果我们从现成的产品的设计新加入高性能和节能解决方案,最重要的一个引用由万宝龙表示项目,始于2011年。其目标是促进发展的一个Exascale欧洲低功耗处理器,与50 GFlops / W的目标处理器的水平。这个项目是欧洲处理器倡议的一部分,一个框架合作协议开发欧洲等的设计和开发技能处理器。

这个项目,连同ExaNoDe [ 52),是一个更广泛的一部分群欧盟资助项目(例如," exane [ 53]关注互连和存储和Ecoscale [ 54)集中在异构体系结构,特别是使用fpga),追求经济的战略远景,低功耗的方法。

此外,万宝龙项目考虑使用ARM指令集架构(isa),如ThunderX处理器家族( 55),定量评估不同能效权衡实现在设计架构基于移动市场技术已经被提出了 56]。

异质性似乎代表了最有前途的方法,例如,通过集成cpu (X86或臂),gpu, FPGA在单个平台( 57]。同时,努力在发展中统一的编程模型和API支持所有这些异构硬件架构如OpenCL, SYCL, oneAPI [ 58]演示这一趋势。

3所示。节能计算工具

在前一节中,我们看到,电力和能源消耗已经成为计算硬件的驱动指标设计和最有趣的cpu。然而,硬件的进步必须紧随其后的是能源利用效率算法,适当的选择和配置应用程序特定的硬件,和足够的管理技术。

其中最完整、有趣的介绍加拉格尔(教授提出的问题 59在暑期学校“ICT-Energy:能源消费在未来ICT设备”组织在2016年的上下文中ICT-Energy欧洲项目( 60]。

能源消费的关键概念是硬件,但这发生在软件的控制下。正常的高级语言(如c++和Java)隐藏的硬件特点,但关键是,可能有很多不同的相同的高层代码(例如,C + +)机器指令程序有不同的能源消耗数据。在这个程度上,一个有趣的工具是由编译器Explorer ( 61年),一个开源的web应用程序交互的编译器代码生成观察基于节点。js ( 62年]。它展示了大会的输出使用不同版本的编译器和编译器编译后的代码中提取有价值的信息,例如,对于评估电力消耗。

因此,节能已开始在软件层面传播到硬件水平。节能技术和节能硬件管理或电力限制 63年在前一节中描述可以代表一个有价值的补充。然而,一个重要方面,忽略了几乎所有的程序员,是他们积极参与检查程序浪费能源和,因此,尝试不同的设计。这显然是加上这一事实结果必须在一个可接受的期限( 64年),经常忽视解决能源效率问题的一个方面。

3.1。分析工具

第一步实现节能行为调查软件行为使用信息作为程序执行(即。,剖析它)或模拟性能模型。

分析的最常用的工具之一是性能API(爸爸)分析图书馆( 65年]。爸爸是平台独立的,为开发人员提供了一个接口和方法收集绩效数据可用的硬件。的基本原则是使开发人员能够看到软件性能和处理器事件之间的关系。至于功耗,爸爸一直延伸到测量和报告能量和功率值也在复杂体系结构( 66年]。

同时,电源组框架( 67年)提供了一组工具,分析了能量性能。不像爸爸,测量聚集在一个单独的机器上,以限制探测效果。

可扩展并行代码的性能测量基础架构(Score-P) [ 68年)扩展了收集信息从英特尔RAPL技术,如前面提到的。

Extrae工具依赖爸爸允许收集其countermetrics(包括电力和热力数据)并行程序( 37]。Paraver有效支持此类信息的分析,可视化数据浏览器开发的巴塞罗那超级计算中心的前一个( 69年]。

节能意识计算框架(EACOF),目的是允许开发人员为能源消耗(概要文件代码 70年]。特别是,它允许分析代码以确切知道能量在哪里被使用。此外,它允许应用程序在运行时根据适应当前的能源消耗。作为一个示例应用程序,作者提出了一个视频播放器,可以智能地调整基于能源消耗数据,确保视频将完成在电池耗尽之前。框架可以在GitHub ( 71年),但自2015年以来,没有发布更新。

一般来说,许多工具,如这两个一直在文献中提出的。值得引用EProf [ 72年),能源消耗的主要功能来支持细粒度的归因到特定功能/软件部分。然而,在大多数情况下,他们不积极维护结束时他们已经开发的项目,和软件变得困难,如果不能按找到并运行。

类似的命运发生的多个指标建模基础设施(MuMMI) [ 73年)项目,专注于集成现有工具,如爸爸和电源组便于测量,建模和预测的多核系统软件。

3.2。动态优化

一些工具的目标是实现自动节能数据。详细,其中许多已经提出,例如,( 74年, 75年),但是,正如之前提到的,不是积极维护。在这里,我们只是其中的两个,因为他们不是更广泛和综合解决方案的一部分,下面讨论。

全球可扩展的开放大国经理(GEOPM)是一个框架,探索电力和能源优化针对高性能计算( 76年]。最有趣的特性之一是动态协调所有计算节点的硬件设置应用程序所使用的应用程序的行为和资源管理器的请求。例如,它可以优化MPI应用程序来提高能源效率或减少工作不平衡的影响,系统抖动,制造变异通过内置的或用户定义的控制算法。框架可以在GitHub ( 77年]。

倒计时松弛图书馆( 78年)允许识别和自动降低功耗在通信和同步原语( 79年]。图书馆面临的问题力量浪费在通信和同步操作,因为采用阻塞机制( 80年):例如,几乎所有的MPI实现使用一个忙等待机制。这个库,相反,能够在低功耗处理器运行模式,从而导致更低的能耗与有限或不影响执行时间( 81年]。

3.3。集成解决方案

节能的运行时应用程序开发活力eXascale计算机(READEX)项目已由欧盟资助的地平线2020研究项目在2015年和2018年之间发展tool-aided方法动态自动性能和能源效率( 82年]。该工具套件在2018年被释放,它可以通过GitHub ( 83年]。

方法是基于插装和Score-P应用程序。这个可以自动地执行用Score-P编译它。然后,应用程序的动态检测和分析,以识别重大区域将与项目管理在运行时优化方法。

这个套件的主要优势是,它可以利用任何开发人员即使她/他不知道READEX方法,提高能源效率的结果她/他的应用程序。据估计,READEX工具套件的应用几乎复杂的应用程序可能需要数天( 84年),主要是与Score-P编译应用程序。

异构计算的低能工具集(连奏的)项目已由欧盟资助的地平线2020研究项目在2017年和2020年之间,设计和开发一个软件工具链的节能计算在不同的硬件上,即。,系统配备cpu、gpu和FPGA ( 57, 85年]。

工具链在2020年被释放,它可以通过GitHub ( 86年]。它是由几个软件组件集成实现一致的跨异构硬件平台的编程环境。

壁炉的工具链由omps表示 87年),扩展OpenMP巴塞罗那超级计算中心研制的支持异构资源的异步并行多核cpu、gpu, fpga。

omps编程模型的应用程序由一个或多个任务与可能的数据依赖流在其中的一些。运行时环境分析结果图和生成一个正确,可能并发的任务执行顺序。一些编译器和运行时系统(如Nanos6, XiTAO [ 88年Mercurium)支持过程和管理所有能源效率、安全性和容错方面( 89年]。

中定义的三个使用案例已经医疗、物联网智能家居和城市,和机器学习,因为他们有不同的需求在能源效率方面,容错和安全性。结果已发表在交付5.4 [ 90年]。

软件开发工具包对能源优化和技术消除债务(SDK4ED)项目已由欧盟资助的地平线2020研究项目在2018年和2020年之间尽量减少成本,开发时间和低能耗的软件开发过程的复杂性设计方法论的方法和软件工具链( 91年]。

SDK4ED平台( 92年)包括五个工具箱:技术债务管理、能源优化、可靠性优化、预测和决策支持。实现它们microservice范式后,码头工人图像包含特定的web服务。

关注能源的工具箱,分析项目可用的在线存储库中(例如,GitHub)的机器上运行码头工人容器对其能源效率。这意味着它发现能源热点,估计,能源消耗通过静态或动态分析( 93年, 94年),检查可能的解决方案提出具体的代码重构。这是一种有价值的方法,特别是对软件复用( 95年]。

该项目在2020年底结束。因此,在写作的时候,并不是所有的细节和可用的代码。

多的时间、精力和安全分析/许多核心异构平台(TeamPlay)项目已由欧盟资助的地平线2020研究项目自2018年以来,设计和开发新的技术为低能耗生产高度并行软件系统,如物联网设备和CPS [ 96年]。

的想法是开发一套工具,允许程序员思考时间、能源和安全程序源代码级别的。这个想法是设计新的语言结构来管理这些extrafunctional属性作为源代码的一等公民和表达合同在源代码中由一个潜在machine-checkable证明系统。

这个项目正在进行中;因此,在撰写本文时,一些信息和软件组件。

4所示。结论

能源消耗日益成为一个最相关的问题科学应用程序和工作负载的计算平台。

所( 97年),巨大的能源消耗水平的ICT系统可能是由于一个事实:没有人真正关心很长一段时间,但如今,情况正在改变,因为经济原因,也因为我们的思维方式已经发生了改变。

在本文中,我们提出了最先进的解决方案,硬件和软件,为追求能源效率和方法科学软件有兴趣的读者提供一个更新的介绍这个主题。我们可以推出的结论是,有越来越多的项目关注这些主题,和一些有趣的SoC-based解决方案是可用的。从软件方面,相反,这种情况并不令人满意,因为工具有时很难被发现,不集成,结束后,通常,消失的项目开发。实际需要的是共同的定义方法和团体行动的协调努力在这个领域比较与虚拟Institute-High-Productivity超级计算(VI-HPS) [ 98年),记住time-to-solution之间的权衡,energy-to-solution和可用性的工具。

数据可用性

没有数据被用来支持本研究。

的利益冲突

作者宣称没有利益冲突有关的出版。

J。 年代。 H。 W。 Y。 信息和通信技术可持续发展目标:最先进的,需要和观点 IEEE通信调查和教程 2018年 20. 3 2389年 2406年 10.1109 / comst.2018.2812301 2 - s2.0 - 85042883350 大港马嘉奇诺艺术中心 C。 Porrini D。 G。 施耐德 N。 调查的链接在ict,电力消耗,空气污染,在欧盟国家和经济增长 能源,B部分:经济、规划和政策 2021年 1 23 10.1080 / 15567249.2020.1868622 Heikkurinen M。 科恩 年代。 Karagiannis F。 伊克巴尔 K。 Andreozzi 年代。 Michelotto M。 回答评估成本比例的挑战:造型为研究欧洲的年度成本计算服务 《网格计算 2015年 13 1 71年 94年 10.1007 / s10723 - 014 - 9302 - y 2 - s2.0 - 84925292245 丝腰带 G。 Gammaitoni l 加拉格尔 j . P。 保罗 D。 ICT-Energy概念对能源效率和可持续性 2017年 Norderstedt、德国 BoD-Books需求 https://www.intechopen.com/books/ict-energy-concepts-for-energy-efficiency-and-sustainability Kogge P。 博卡 年代。 坎贝尔 D。 Exascale计算机研究:在实现Exascale系统技术挑战 国防高级研究计划局信息处理技术办公室(美国国防部高级研究计划局IPTO) Techinal代表 2008年 15 1 2021年, https://www.top500.org/green500/ Scogland t·R。 史蒂芬 c·P。 王尔德 T。 功率测量方法对大规模、高性能计算 学报》第五届ACM /规格性能工程国际会议 2014年3月 爱尔兰都柏林 149年 159年 Shehabi 一个。 史密斯 年代。 裁缝 D。 美国数据中心能源使用情况报告 2016年 美国加利福尼亚州伯克利 劳伦斯伯克利国家实验室(LBNL) Shehabi 一个。 史密斯 年代。 Masanet E。 库米 j·G。 数据中心在美国增长:解耦从用电量的需求服务 环境研究快报 2018年 13 12 124030年 D。 铁线莲 一个。 Galizia 一个。 DRIHM项目:一个灵活的方法来整合HPC,为水文气象研究网格和云资源 诉讼SC的14:国际会议为高性能计算、网络、存储和分析 2014年11月 新奥尔良,洛杉矶,美国 IEEE 536年 546年 J。 Rangan 年代。 H。 绿色通信:理论基础、算法和应用程序 2016年 美国佛罗里达州波卡拉顿的 CRC的新闻 Chiappori F。 Merelli 我。 Milanesi l Marabotti 一个。 静态和动态GALK酶之间的相互作用和已知的抑制剂:指南为galactosemic设计新药的病人 欧洲药物化学杂志》上 2013年 63年 423年 434年 10.1016 / j.ejmech.2013.02.021 2 - s2.0 - 84875018353 选择 D。 Viti F。 Merelli 我。 巴塔利亚 C。 Milanesi l myMIR:全基因组微目标识别和注释工具 简报的生物信息学 2011年 12 6 588年 600年 10.1093 /龙头/ bbr062 2 - s2.0 - 82455172056 卡多佐 j·m·P。 Coutinho j·g·F。 Diniz p C。 卡多佐 j . M。 Coutinho j·g·F。 Diniz p C。 高性能的嵌入式计算 高性能的嵌入式计算 2017年 波士顿,美国 摩根考夫曼 17 56 http://www.sciencedirect.com/science/article/pii/B9780128041895000028 10.1016 / b978 - 0 - 12 - 804189 - 5.00002 - 8所示 D。 Morganti l 山茱萸 E。 Cesini D。 Merelli 我。 结合边缘和云计算对于低功耗,具有成本效益的宏基因组分析 未来一代计算机系统 2019年 90年 79年 85年 Conficoni C。 Bartolini 一个。 Tilli 一个。 Benini l Tecchiolli G。 节能意识冷却热水冷却的超级计算机 学报2015年设计、自动化和测试在欧洲会议与展览(日期) 2015年3月 法国格勒诺布尔 IEEE 1353年 1358年 丝腰带 G。 加拉格尔 j . P。 卢卡 G。 保罗 d . J。 ICT的能源挑战 ICT-Energy概念对能源效率和可持续性 2017年 英国伦敦 IntechOpen ·卡普拉 M。 Peloso R。 Masera G。 罗氏制药 m·R。 玛蒂娜 M。 边缘计算:一项调查在物联网硬件需求的世界 未来的互联网 2019年 11 4 One hundred. 10.3390 / fi11040100 2 - s2.0 - 85065873992 J。 年代。 J。 D。 大数据满足绿色挑战:绿化大数据 IEEE系统杂志 2016年 10 3 873年 887年 10.1109 / jsyst.2016.2550538 2 - s2.0 - 84984694261 J。 年代。 J。 D。 大数据满足绿色挑战:对绿色大数据的应用程序 IEEE系统杂志 2016年 10 3 888年 900年 Czarnul P。 Proficz J。 Krzywaniak 一个。 能源利用高性能计算:调查的最先进的工具、技术,和环境 科学的规划 2019年 2019年 8348791 10.1155 / 2019/8348791 2 - s2.0 - 85065627862 Vysocky O。 Riha l Bartolini 一个。 Wyrzykowski R。 应用仪器的性能分析和调优的概述 并行处理和应用数学 2020年 可汗、瑞士 施普林格国际出版 159年 168年 10.1007 / 978 - 3 - 030 - 43222 - 5 - _14 D。 Quarati 一个。 铁线莲 一个。 Soc-based科学应用程序的计算基础设施和商业服务:性能和经济评价 未来一代计算机系统 2019年 96年 11 22 10.1016 / j.future.2019.01.024 2 - s2.0 - 85061100184 Y。 T。 K。 年代。 绿色异构云无线接入网络:潜在的技术,性能权衡和挑战 IEEE通讯杂志 2017年 55 11 33 39 10.1109 / mcom.2017.1600807 2 - s2.0 - 85040546406 X。 l Y。 X。 对节能的无线网络在大数据时代:一项调查 IEEE通信调查和教程 2018年 20. 1 303年 332年 10.1109 / COMST.2017.2771534 2 - s2.0 - 85033700776 穆雷 J。 Wettin P。 潘德 P P。 Shirazi B。 穆雷 J。 动态电压和频率扩展 可持续的无线Network-on-Chip架构 2016年 波士顿,美国 摩根考夫曼 79年 105年 10.1016 / b978 - 0 - 12 - 803625 - 9.00014 - 5所示 D。 Riha l 索伊卡 R。 Kruzik J。 Beseda M。 能耗的优化total-FETI解算器和布拉斯特区例程通过改变CPU频率 《2016年国际会议上高性能计算模拟(手持电脑) 2016年7月 奥地利因斯布鲁克 1031年 1032年 10.1109 / HPCSim.2016.7568453 2 - s2.0 - 84991665786 Papadimitriou G。 Chatzidimitriou 一个。 Gizopoulos D。 极度保守的限制:一个综合分析现代硬件利润率 IEEE可靠性设备和材料 2020年 20. Calore E。 加巴纳 一个。 Schifano 美国F。 Tripiccione R。 dvf评价能源利用技术在现代高性能处理器和加速器的应用程序 并发性和计算:实践和经验 2017年 29日 12 e4143 10.1002 / cpe.4143 2 - s2.0 - 85016574309 2021年 https://www.kernel.org/doc/html/v4.14/admin-guide/pm/cpufreq.html Spiliopoulos V。 Kaxiras 年代。 Keramidas G。 为不断适应dvf绿色州长:一个框架 《2011年国际绿色计算会议和研讨会 2011年7月 美国佛罗里达州奥兰多市 IEEE 1 8 Scordino C。 Abeni l Lelli J。 Linux中实时和能源效率 ACM SIGAPP应用计算审查 2019年 18 4 18 30. 10.1145/3307624.3307627 加泰罗尼亚语的 年代。 埃雷罗 j . R。 Quintana-Orti 大肠。 Rodriguez-Sanchez R。 能量平衡电压频率扩展为线性代数的例程和弹性低功耗的多核架构 并行计算 2018年 73年 28 39 10.1016 / j.parco.2017.05.004 2 - s2.0 - 85019695786 D。 Kozyrakis C。 turbomode在现代多核芯片的动态管理 学报2014年IEEE 20国际研讨会上高性能计算机体系结构(HPCA) 2014年2月 美国佛罗里达州奥兰多市 IEEE 603年 613年 Pandruvada 年代。 运行平均功率限制,“01员工 2014年 美国加利福尼亚州圣克拉拉 英特尔打开Source.org https://01.org/blogs/2014/running-average-power-limit--rapl Rotem E。 Naveh 一个。 Ananthakrishnan 一个。 韦斯曼 E。 Rajwan D。 电源管理架构的英特尔微体系结构代号为桑迪大桥 IEEE微 2012年 32 2 20. 27 10.1109 / mm.2012.12 2 - s2.0 - 84859729360 多亏尤文和 F。 Calore E。 研制的高性能混凝土(HPC)和功率分析异构多节点集群工作负载 低功率电子技术和应用程序 2018年 8 2 13 10.3390 / jlpea8020013 2 - s2.0 - 85048271596 Kasichayanula K。 Terpstra D。 Luszczek P。 权力意识到gpu的计算 学报2012年研讨会在高性能计算应用程序加速器 2012年7月 美国阿贡, IEEE 64年 73年 Lefurgy C。 Rajamani K。 罗森 F。 跳纱 W。 Kistler M。 凯勒 t·W。 能源管理为商业服务器 电脑 2003年 36 12 39 48 10.1109 / mc.2003.1250880 2 - s2.0 - 0346750534 Ratković 我。 Bežanić N。 Unsal c·S。 克丽丝特尔 一个。 Milutinović V。 权力架构级节能设计技术的概述 电脑的发展 2015年 98年 1 57 10.1016 / bs.adcom.2015.04.001 2 - s2.0 - 84945437946 佩雷拉 p . M . M。 domingue P。 罗德里格斯 n·M·M。 法尔考 G。 法利亚 s·M·M。 评估性能和能源使用的cpu、多核和许多核心系统:MMP的图像编码器的案例研究 分布式和并行系统的国际期刊 2016年 7 5 1 20. 10.5121 / ijdps.2016.750 Patnaik Patnaikuni d·R。 arduino的比较研究,覆盆子π和esp8266物联网发展委员会 国际高级研究计算机科学杂志》上 2017年 8 5 Otte p . B。 也有 D。 成本效益和可靠的HPC应用程序环境监测系统 相关系数 2018年 abs / 1802 00724年 冈崎 R。 Tabata T。 Sakashita 年代。 超级计算机Fugaku Cpu A64fx实现高性能、高密度封装和低功耗 富士通技术评审 2020年 https://www.fujitsu.com/global/documents/about/resources/publications/technicalreview/2020-03/article03.pdf Danovaro E。 铁线莲 一个。 Galizia 一个。 Ripepi G。 Quarati 一个。 D。 异构计算密集型应用程序的架构:一个成本效益分析 计算和应用数学杂志》上 2014年 270年 63年 77年 10.1016 / j.cam.2014.02.022 2 - s2.0 - 84901245500 http://www.cosa-project.it/ Cesini D。 山茱萸 E。 Falabella 一个。 低功耗计算:从科项目经验 科学的规划 2017年 2017年 7206595 10.1155 / 2017/7206595 2 - s2.0 - 85031899100 Merelli 我。 Morganti l 山茱萸 E。 低功耗便携式设备对宏基因组分析:雾计算生物信息学准备物联网 未来一代计算机系统 2018年 88年 467年 478年 10.1016 / j.future.2018.05.010 2 - s2.0 - 85048751852 沙丘状积砂 D。 Ieronymakis G。 Papaefstathiou V。 性能和能源足迹评估fpga和gpu在HPC系统使用天体物理学应用程序 计算 2020年 8 2 34 10.3390 / computation8020034 马丁内斯 p Y。 Beilliard Y。 戈达尔 M。 Exanode:综合集成chiplets活跃插入器光着骰子在multi-chip-module异构的、可伸缩的高性能计算节点 2020年IEEE VLSI技术研讨会上 2020年 1 2 10.1109 / VLSITechnology18217.2020.9265100 Armejach 一个。 万宝龙2020应用程序移植到手臂isa和SVE 2020年 巴黎,法国 万宝龙项目 技术。众议员D3.5 里戈 一个。 平托 C。 Pouget K。 铺平了道路走向高度节能和高度集成计算节点的exascale革命:exanode方法 学报2017年Euromicro数字会议系统设计(DSD) 2017年9月 奥地利的维也纳 IEEE 486年 493年 Katevenis M。 Chrysos N。 Marazakis M。 " exane项目:exascale系统的互联、存储和包装 学报2016年Euromicro数字会议系统设计(DSD) 2016年9月 利马索尔,塞浦路斯 IEEE 60 67年 Mavroidis 我。 Papaefstathiou 我。 Lavagno l Ecoscale:可重构计算未来exascale系统和运行时系统 学报2016年设计、自动化和测试在欧洲会议与展览(日期) 2016年3月 德国德累斯顿 IEEE 696年 701年 Armejach 一个。 卡萨斯 M。 Moreto M。 设计权衡对新兴HPC处理器基于移动市场技术 《华尔街日报》的超级计算 2019年 75年 9 5717年 5740年 10.1007 / s11227 - 019 - 02819 - 4 2 - s2.0 - 85073321978 阿德里亚 一个。 马克 C。 纳斯 M。 设计权衡对新兴HPC处理器基于移动市场技术 《华尔街日报》的超级计算 2019年 75年 9 5717年 5740年 意大利蒜味腊肠 B。 Parasyris K。 克丽丝特尔 一个。 连奏的:低能耗、安全、和弹性的异构计算工具集 学报2020年设计、自动化和测试在欧洲会议与展览(日期) 2020年3月 法国格勒诺布尔 IEEE 169年 174年 2021年 https://khr.io/tr 2021年 https://www.nipslab.org/files/summerschool-aalborg-jpg-part1.pdf 埃德尔 K。 加拉格尔 J。 软件工程节能意识 ICT-Energy概念对能源效率和可持续性 2017年 103年 127年 2021年 https://repo.hca.bsc.es/epic/ Godbolt M。 在c++编译器的优化 队列 2019年 17 5 69年 One hundred. 10.1145/3371595.3372264 C。 De Supinski b R。 艾布拉姆森 D。 调查软件方法提高并行计算的能源效率 高性能计算应用的国际期刊 2017年 31日 6 517年 549年 10.1177 / 1094342016665471 2 - s2.0 - 85034964354 Quarati 一个。 铁线莲 一个。 D。 提供云服务的QOS要求:商业机会、建筑和节能方面的解决方案 未来一代计算机系统 2016年 55 403年 427年 10.1016 / j.future.2015.02.009 2 - s2.0 - 84954386736 Terpstra D。 Jagode H。 H。 J。 与PAPI-C收集性能数据 2009年高性能计算工具 2010年 柏林,德国 施普林格 157年 173年 10.1007 / 978 - 3 - 642 - 11261 - 4 - _11 莫科 H。 拉尔夫 J。 Danalis 一个。 J。 电力监控与爸爸extreme scale架构和基于数据流编程模型 学报2014年IEEE集群计算国际会议(集群) 2014年9月 马德里,西班牙 IEEE 385年 391年 通用电气 R。 X。 首歌 年代。 电源组:能源分析和高性能的系统和应用程序的分析 IEEE并行和分布式系统 2009年 21 5 658年 671年 Knupfer 一个。 Rossel C。 最大经济产量 d . A。 Score-p:联合性能测量运行时基础设施潜望镜,scalasca,τ,vampir 2011年高性能计算工具 2012年 柏林,德国 施普林格 79年 91年 10.1007 / 978 - 3 - 642 - 31476 - 6 _7 2 - s2.0 - 84885232486 Munera 一个。 Royuela 年代。 Llort G。 经历的描述并行应用程序与extrae / paraver嵌入式系统 美国第49国际会议Processing-ICPP平行 2020年8月 埃德蒙顿,加拿大 1 11 H。 安德森 G。 埃德尔 K。 Eacof:框架提供能量的透明度,使软件开发节能意识 《第29届ACM研讨会上应用计算 2014年3月 韩国庆州 1194年 1199年 2021年 https://github.com/eacof/eacof 舒伯特 年代。 Kostic D。 Zwaenepoel W。 胫骨 k·G。 为能耗分析软件 学报2012年IEEE国际会议上绿色计算和通讯 2012年11月 法国比 IEEE 515年 522年 X。 活泼的 C。 泰勒 V。 Mummi:多个指标建模基础设施 学报2013年14埃西斯软件工程国际会议上,人工智能,网络和并行/分布式计算 2013年7月 美国檀香山,嗨 IEEE 289年 295年 Rountree B。 Lowenthal d·K。 De Supinski b R。 慢板:让德国焊接学会实际复杂HPC应用程序 第23届国际会议上超级计算机学报,ICS的09年 2009年6月 美国纽约约克镇 10.1145/1542275.1542340 2 - s2.0 - 70449728146 Marathe 一个。 贝利 p E。 Lowenthal d·K。 Rountree B。 舒尔茨 M。 De Supinski b R。 电量有限HPC应用程序的运行时系统 在计算机科学的课堂讲稿 2015年 9137年 柏林,德国 施普林格 394年 408年 10.1007 / 978 - 3 - 319 - 20119 - 1 - _28 2 - s2.0 - 84978499980 Eastep J。 西尔维斯特 年代。 坎塔卢波 C。 Kunkel j . M。 全球可扩展的开放大国经理:车辆为HPC社区协作联合能源管理解决方案 高性能计算 2017年 可汗、瑞士 施普林格国际出版 394年 412年 10.1007 / 978 - 3 - 319 - 58667 - 0 - _21 2 - s2.0 - 85026247920 2021年, https://github.com/geopm/geopm 2021年, https://github.com/EEESlab/countdown Cesarini D。 Bartolini 一个。 Borghesi 一个。 Cavazzoni C。 Luisier M。 Benini l 倒计时松:一个运行时库来减少能源足迹在大规模MPI应用程序 IEEE并行和分布式系统 2020年 31日 11 2696年 2709年 10.1109 / tpds.2020.3000418 Torquati M。 德森西 D。 Mencagli G。 Aldinucci M。 Danelutto M。 节能与自动流水线的并发控制 并发性和计算:实践和经验 2019年 31日 5 e4652 10.1002 / cpe.4652 2 - s2.0 - 85052432360 Cesarini D。 Bartolini 一个。 Bonfa P。 倒计时:一个运行时库MPI performance-neutral节能的应用程序 IEEE计算机 2020年 70年 Schuchart J。 Gerndt M。 Kjeldsberg p·G。 自动优化能源效率的readex形式主义 计算 2017年 99年 8 727年 745年 10.1007 / s00607 - 016 - 0532 - 7 2 - s2.0 - 85009205005 2021年 https://github.com/readex-eu Riha l D5.3:评估READEX工具套件使用READEX测试套件 2018年 美国佛罗里达州那不勒斯 READEX项目 https://www.readex.eu/wp-content/uploads/2018/11/D5.3.pdf Gizopoulos D。 Papadimitriou G。 Chatzidimitriou 一个。 最近的现代硬件利润率:cpu、gpu fpga系统级研究 《2019年IEEE 25日国际研讨会上联机测试和健壮的系统设计(IOLTS) 2019年7月 罗兹,希腊 IEEE 129年 134年 2021年 https://github.com/legato-project 杜兰 一个。 Ayguade E。 十二月 r·M。 omps:编程异构多核架构的建议 并行处理信件 2011年 21 2 173年 193年 10.1142 / s0129626411000151 2 - s2.0 - 79959734507 Pericas M。 弹性的地方:一个自适应资源管理器可伸缩的和便携式的性能 ACM交易架构和代码优化 2018年 15 2 10.1145 / 3185458 2 - s2.0 - 85047121504 Givaki K。 意大利蒜味腊肠 B。 Hojabr R。 深度学习的韧性下降电压fpga 学报2020年28日Euromicro国际会议上平行,分布式和基于网络的处理(PDP) 2020年3月 瑞典韦斯特罗斯 IEEE 110年 117年 2021年 https://legato-project.eu/sites/default/files/uploaded/d5.4.pdf 帕帕多普洛斯 l Marantos C。 Digkas G。 软件质量指标之间的相互关系,在嵌入式应用程序性能和能量消耗 21国际研讨会的诉讼对嵌入式系统软件和编译器,作用域的18岁 2018年5月 圣Goar、德国 10.1145/3207719.3207736 2 - s2.0 - 85054145578 2021年, https://gitlab.seis.iti.gr/sdk4ed-wiki/wiki-home/wikis/home M。 D3.2适合能耗的监测指标 2019年 海勒斯SDK4ED ProjectCentre的研究与技术——(CERTH) Marousi,希腊 https://drive.google.com/file/d/1zkX71EfL2ybfWTzPNUPKTHhb145-DzuH/view Tsoukalas D。 D3.4 TD /能源/可靠性预测方法 2019年 海勒斯SDK4ED ProjectCentre的研究与技术——(CERTH) Marousi,希腊 https://drive.google.com/file/d/1DVhM9JvSD3LsSVXlE9SfBrBXWobHMSXT/view Nikolaidis N。 Digkas G。 Ampatzoglou 一个。 Chatzigeorgiou 一个。 从stackoverflow重用代码:对技术债务的影响 45 Euromicro会议程序软件工程和先进的应用程序(SEAA 19) 2019年8月 Kallithea,希腊 IEEE Coutinho德米特里 a . M。 德森西 D。 Lorenzon 答:F。 性能和能量平衡并行应用程序异构多处理系统 能量 2020年 13 9 2409年 10.3390 / en13092409 D 'Elia 年代。 供电:能量和计算 HiPEAC信息 2020年 59 2021年, https://www.vi-hps.org/about/about.html