AMD 百万兆次级 APU MI300A 量产:OpenFOAM 测试是英伟达 H100 的 4 倍

[知识] 时间:2024-04-20 04:28:25 来源:蓝影头条 作者:综合 点击:86次

    

12 月 7 日消息,次级测试AMD 在推出旗舰 MI300X 加速卡之外,量产还宣布 Instinct MI300A APU 已进入量产阶段,英伟预估明年开始交付,达H的倍上市后有望成为世界上最快的次级测试 HPC 解决方案。

AMD Instinct MI300A 加速器以创新的量产 AMD CDNA 架构为基础,经优化可实现百万兆次级性能和节能,英伟是达H的倍创新的针对 HPC 和 AI 的加速处理器 (APU),提供 24 个“Zen 4”CPU 核心和 128 GB 的次级测试 CPU 与 GPU 共享的 HBM3 内存,带来非凡的量产性能。

AMD Instinct MI300A APU 结合了 Zen 4、英伟CDNA 3 和第 4 代 Infinity 架构和互联技术,达H的倍其部分性能如下:

FP64 精度下,次级测试最高算力 61 TFLOPS

FP32 精度下,量产最高算力 122 TFLOPS

最高 128 GB HBM3 内存

1460 亿个晶体管

MI300A 的英伟封装和 MI300X 非常相似,不过前者使用了 TCO 优化的内存容量和 Zen 4 内核。

每个活动 die 有 2 个 CDNA 3  GCD,提供单独的缓存和核心 IP 池。每个 CCD 有 8 个内核和 16 个线程,因此活动芯片上总共有 24 个内核和 48 个线程。还有 24 MB 的 L2 缓存(每个内核 1 MB)和一个单独的缓存池(每个 CCD 32 MB)。

在 GPU 方面,AMD 基于 CDNA 3 架构共支持了 228 个计算单元,相当于 14592 个内核。也就是说,每个 GPU 小芯片有 38 个计算单元。

简要总结下 AMD Instinct MI300 加速器的突出功能

首款集成 CPU+GPU 封装

瞄准百万兆次级超级计算机市场

1460 亿个晶体管

最多 24 个 Zen 4 核心

CDNA 3 GPU 架构

228 个计算单元(14,592 个内核)

最高 128 GB HBM3 内存

最多 8 个 Chiplets + 8 个存储器堆栈(5nm + 6nm 工艺)

性能

AMD 再次将 MI300A 与 H100 进行了比较,得益于统一的内存布局、GPU 性能以及整体内存容量和带宽,在 OpenFOAM 测试中,性能是 H100 的 4 倍。

AMD 还证实,Instinct MI300A APU 现已出货,还将用于为下一代 El-Capitan 超级计算机提供动力,该超级计算机预计将提供高达 2 Exaflops 的计算能力。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。

(责任编辑:百科)

    相关内容
    精彩推荐
    热门点击
    友情链接