近日,专业媒体"架构师技术联盟"发布了基于浪潮GPU服务器NF5468A5的性能测评报告。报告显示,NF5468A5搭载2颗AMD Milan-X 7773X运行常见的气象应用WRF和计算流体力学应用OpenFOAM作为性能基准测试,其性能相比搭载两颗Rome 7742时的计算性能提升可高达80%。
NF5468A5是一款4U支持2颗AMD EPYC处理器和8颗双宽GPU卡,面向AI训练、推理、视频编解码等多种应用场景的GPU服务器。此次测试采用分别搭载2颗AMD Milan-X 7773X、Milan 7543和Rome 7742的配置组合。
AMD Milan-X处理器最大的亮点,就是采用3D堆叠技术(3D V-Cache),在不改变处理器面积的前提下,可用L3 缓存(SRAM)总数增加三倍。做个形象的比喻,这种3D堆叠技术就像将把相同面积的平房升级成三层小楼,通过纵向空间成倍扩展缓存数量。评测采用的NF5468A5平台是浪潮信息畅销海内外的弹性云AI服务器NF5468系列的全新产品,率先支持PCIe 4.0技术,4U空间内可装载2颗采用7nm先进制程工艺的AMD EPYC处理器和8块PCIe Gen4接口的AI加速卡,能够最大限度的发挥Milan-X处理器的极致性能。
WRF(The Weather Research and Forecasting Model),即天气预报模式,被誉为是次世代的中尺度天气预报模式,往往用于大范围高分辨的气候模拟,对系统的运算性能、内存的要求非常高;OpenFOAM(Open Source Field Operation and Manipulation)是对连续介质力学问题进行数值计算的软件,经常应用于汽车仿真等行业,进行仿真计算需要处理大量的实时数据,所以对系统的计算能力、数据吞吐能力都有很高的要求。
基于浪潮NF5468A5评测报告显示,Milan-X处理器通过搭载3D堆叠技术获得更高的L3缓存,确实对计算性能有较大提升,而性能改进意味着企业可以在更少的服务器上运行相同的作业,消耗的功率也能有明显降低。如下是评测报告中的性能测试数据:
在WRF测试中,使用单节点相同核心数,以Rome 7742处理器运行时间为基准,在Milan 7543上的计算性能提升14%~27%,而在Milan-X 7773X处理器上性能提升 23%~34%。
在OpenFOAM基准算例motorBike测试中,使用不可压稳态求解器simpleFoam计算模拟摩托车和骑手周围空气的运动情况。同样以Rome 7742处理器为基准,OpenFOAM在Milan 7543处理器使用单节点相同核心测试性能提升23%~28%,在Milan-X 7773X处理器上性能提升34%~80%。
在本次评测中也对NF5468A5有比较细致的介绍,据浪潮官网显示NF5468A5正在推出"超值机型 限免试用",对该GPU服务器感兴趣的不妨一试。如下是评测中对于浪潮NF5468A5的介绍:
NF5468A5采用分区散热设计,内置独立的CPU和GPU主板,且分别安装在不同的平面。从机箱内部结构来看,设计者将发热量高的的GPU放在了机箱上3U空间,CPU板处于机箱下1U,内置6对12个6056风扇模组配合导风罩,实现机箱内风道分流,正是基于这种独特分层散热设计,使得送测的NF5468A5服务器可以支持280W最高功耗的Milan-X 7773X。系统设计支持32条DDR4 ECC内存,支持LRDIMM/RDIMM,提供高达8T的本地内存,实现与1536 MB 超大L3 cache间的高速数据交互。
NF5468A5采用了CPU直连GPU架构设计,率先支持PCI-E 4.0技术,最大限度提升CPU与GPU间的带宽,降低通信延迟,达到最佳效能,为客户提供极致优化的算力。系统提供丰富的IO扩展能力,提供10个PCIe 4.0 X16扩展槽位,支持8个全高全长的GPU加速卡。提供灵活存储方案,可选前置12 × 3.5英寸硬盘或24 × 2.5英寸硬盘,提供超大的本地存储能力,同时最大可支持8个热插拔NVMe SSD全闪配置,提供存储到内存到L3 cache的高速访存,可实现十倍于高端企业级SATA SSD的IOPS性能,带来极致IO存储性能飞跃。
稿源:美通社