关键词:
高性能计算
互连网络
片上网络
作业映射
资源分配
摘要:
下一代超级计算机正在朝着E级规模的方向发展,将在访存、通信、可靠性、能耗、应用等方面面临一系列重大挑战,其中能耗挑战已成为影响E级系统稳定性、可靠性和可扩展性的重要因素。目前TOP500榜单冠军富岳(Fugaku)以2.8倍的优势领先于排名第二的Summit系统,但是在Green500榜单中,富岳却位于Summit之后,分别位列第9和第8位。因此,为了实现E级超级计算机,只提升计算性能是远远不够的,需要减少功耗、提高能效比。众所周知,网络拓扑、路由规则、资源分配策略都是影响高性能互连网络能耗的重要因素。由于实际系统采用的固定的网络拓扑结构和路由规则,资源分配策略成为影响高性能互连网络能耗的直接原因之一。本文基于并行计算系统中互连网络功耗优化领域的国内外研究,主要从作业映射和资源分配的角度出发,研究单个计算结点内片上互连网络功耗优化及计算结点间的拓扑划分资源分配策略。对于片上互连网络而言,大量处理器核心被集成到一个芯片中。目前多核处理器上的任务映射方法,通常是根据处理器核的占用情况对作业进行映射,往往忽略片上互连网络中路由器的实时占用情况,导致单个作业映射后,片上互连网络中的通信延迟和能耗不是最优的。特别是当共用路由器数量(共用路由器指被多个作业同时使用的路由器)增加时,会造成网络拥塞,导致作业的通信延迟增大,能耗也会相应增加。本文提出基于拓扑划分的映射算法(JMATP),在对单个作业进行映射时,优先分配对应路由器空闲的处理器核,以尽可能减少共用路由器数量。通过与其他两种方法(INC,CASq A)进行比较来评估所提出的方法。结果显示,JMATP相对其他两种方法分别降低了5.19%和2.99%的通信延迟,降低了17.94%和12.68%的能耗。对计算结点间互连网络而言,计算结点独占或者共享两种不同的情形下,所产生的低功耗资源分配结果是不同的。本文在现有计算结点独占的资源分配方法基础上,研究了计算结点共享情况下的低功耗资源分配方法,结合路由器关闭技术,提出了基于拓扑图划分的计算结点共享的资源分配策略,减少了高性能计算互连网络的静态能耗。并与计算结点独占情况下的资源分配策略进行了对比,模拟结果表明,在资源利用率较高的Mesh和Tours网络拓扑下,基于拓扑图划分的计算结点共享的资源分配策略可以多关闭7.46%的空闲路由器,降低了计算结点间互连网络的能耗。