为了冲击百亿亿次计算,美国官方准备了三套不同系统,分别由Intel、AMD、AMD+NVIDIA联合打造。现在看起来,AMD+NVIDIA的联合方案进展最快。这套名为“Polaris”(北极星)的超算,隶属于美国能源部阿贡国家实验室ALCF(阿贡领先计算设施),主要为用户的算法和科学领域的超级规模的研究和探索提供支持,并对学术界、政府机构、行业研究人员开放使用。
它基于Cray Slingshot 10高性能可扩展互连架构,惠与(HPE)负责建造,共有560个节点,每个节点配备两颗AMD EPYC 7532处理器、四块NVIDIA A100计算卡。

EPYC 7532拥有32核心64线程(Zen2机构),A100计算卡则有6912个CUDA核心(Ampere架构),因此这套超算总共有多达35840个CPU核心、15482880个GPU核心,只是不知道A100这里的显存是40GB还是80GB。
整套系统的FP64双精度浮点峰值性能将达44PFlops(44千万亿次每秒),在当今全球超算TOP500榜单上可以排在第十位。
不过,它的理论AI性能可以高达惊人的1.4EFlops(140亿亿次每秒),通过处理数据密集型和AI高性能计算工作负载,将模拟和机器学习相结合。
Polaris超算将在今年年内上线,明年3月份升级为Slingshot 11架构,处理器更换为Zen3架构的EPYC 7543,仍是32核心,但性能将再上一个台阶。