AMD 百万兆次级 APU MI300A 量产:OpenFOAM 测试是英伟达 H100 的 4 倍

12 月 7 日消息,AMD 在推出旗舰 MI300X 加速卡之外,还宣布 Instinct MI300A APU 已进入量产阶段,预估明年开始交付,上市后有望成为世界上最快的 HPC 解决方案。

AMD Instinct MI300A 加速器以创新的 AMD CDNA 架构为基础,经优化可实现百万兆次级性能和节能,是创新的针对 HPC 和 AI 的加速处理器 (APU),提供 24 个“Zen 4”CPU 核心和 128 GB 的 CPU 与 GPU 共享的 HBM3 内存,带来非凡的性能。

AMD Instinct MI300A APU 结合了 Zen 4、CDNA 3 和第 4 代 Infinity 架构和互联技术,其部分性能如下:

  • FP64 精度下,最高算力 61 TFLOPS

  • FP32 精度下,最高算力 122 TFLOPS

  • 最高 128 GB HBM3 内存

  • 1460 亿个晶体管

MI300A 的封装和 MI300X 非常相似,不过前者使用了 TCO 优化的内存容量和 Zen 4 内核。

每个活动 die 有 2 个 CDNA 3  GCD,提供单独的缓存和核心 IP 池。每个 CCD 有 8 个内核和 16 个线程,因此活动芯片上总共有 24 个内核和 48 个线程。还有 24 MB 的 L2 缓存(每个内核 1 MB)和一个单独的缓存池(每个 CCD 32 MB)。

在 GPU 方面,AMD 基于 CDNA 3 架构共支持了 228 个计算单元,相当于 14592 个内核。也就是说,每个 GPU 小芯片有 38 个计算单元。

简要总结下 AMD Instinct MI300 加速器的突出功能

  • 首款集成 CPU+GPU 封装

  • 瞄准百万兆次级超级计算机市场

  • 1460 亿个晶体管

  • 最多 24 个 Zen 4 核心

  • CDNA 3 GPU 架构

  • 228 个计算单元(14,592 个内核)

  • 最高 128 GB HBM3 内存

  • 最多 8 个 Chiplets + 8 个存储器堆栈(5nm + 6nm 工艺)

性能

AMD 再次将 MI300A 与 H100 进行了比较,得益于统一的内存布局、GPU 性能以及整体内存容量和带宽,在 OpenFOAM 测试中,性能是 H100 的 4 倍。

AMD 还证实,Instinct MI300A APU 现已出货,还将用于为下一代 El-Capitan 超级计算机提供动力,该超级计算机预计将提供高达 2 Exaflops 的计算能力。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注