作者:上方文Q
2017 年,AMD Zen 架构诞生,从锐龙到霄龙,从桌面到笔记本再到数据中心,刮起了一股强劲的旋风,打破了 x86 处理器行业多年的沉寂,尤其是霄龙带领 AMD 重返数据中心市场,开启了一个新的时代。
两年过去了,第二代霄龙终于来了!
美国当地时间 8 月 7 日,在有着上百年历史的旧金山艺术宫(Palace Of Fine Arts),AMD CEO 苏姿丰博士亲自发布了全新一代霄龙 7002 系列(代号 Rome),创下 80 项世界纪录的史上最强 x86 处理器。
二代霄龙和桌面三代锐龙一样使用了台积电 7nm 工艺,官方指标是可以将晶体管密度翻一番,同等功耗下频率提升 25%,或者同等性能下功耗减半。
同样与三代锐龙一致,二代霄龙也使用了 Zen 2 新架构,单线程 IPC (可理解为架构性能或者单核性能)提升幅度平均 15%,32 核心 64 线程下 IPC 平均提升幅度则达到了 23%,同时加入了大量的服务器、数据中心、云等相关功能特性,互连、内存、安全、电源等等都得到了相应的强化。
二代霄龙也采用了 chiplet 小芯片设计,基础单元还是 CCX,每个 CCX 包含 4 个核心(8 个线程),然后两个 CCX 组成一个 CCD,也就是一个 CPU Die,包含 8 个核心(16 个线程),然后每颗处理器包含多个 CPU Die,最多 8 个组成 64 个核心(128 个线程)。
同时,每颗芯片上还有一个单独的I/O Die 负责输入输出,并集成 DDR4 内存控制器、PCIe 控制器,通过第二代 Infinity Fabric 总线连接所有 CPU Die,采用 GF 14nm 工艺制造(锐龙三代上的I/O Die 工艺是 GF 12nm)。
这种做法的好处最直接的就是可以降低大芯片的设计、制造难度,节省成本,提高良品率,同时相比于一代霄龙将I/O部分独立出来之后,可以与所有 CPU 核心平等连接,无论带宽还是延迟都保持一致,更便于管理和系统、软件的调用。
内存继续支持八通道 DDR4,类型包括 RDIMM、LRDIMM、NVDIMM、3DS,最高频率 3200MHz (一代为 2666MHz),每个核心最大还是 64GB,但是凭借翻番的核心数量,单路最大内存容量也翻倍来到了 4TB。
二代霄龙还是第一个支持 PCIe 4.0 的服务器平台,每路最多 128 条 PCIe 4.0 总线,分为八条 x16(可继续细分成 x8/x4/x2/x1),每一条的双向带宽都是 64GB/s(可连接最多 8 个设备),因此每路的峰值总带宽达 512GB/s,同时完整支持 PCIe P2P、IOMMU。双路系统中,每颗处理器分出 64 条彼此互连,对外合计还是 128 条 PCIe 4.0。
相比于消费级桌面平台,PCIe 4.0 对于数据中心的作用和意义更加明显,尤其是 NVMe SSD 存储性能和网络性能,都可以获得巨大的飞跃。
二代霄龙最多支持四路并行,每两颗处理器之间的 Infinity Fabric 总线通道带宽为 18GT/s,比一代的 10.7GT/s提升了多达 68%。
内置独立安全子系统和 AMD 安全处理器,是一个基于 ARM A5 架构的 32 位微控制器,同时内存控制器内置 AES-128 加密引擎,内存加密秘钥从一代的 15 个暴增至 509 个,同时继续支持 SME 安全内存加密、SEV 安全加密虚拟化,并增加支持虚拟透明加密。
当然,二代霄龙保持向下兼容,现有平台可以无缝升级。
二代霄龙首发共有 19 款型号,包括 14 款双路型、5 款单路型,其中双路旗舰型号是霄龙 7742,64 核心 128 线程,256MB 三级缓存,基准频率 2.25GHz,加速最高 3.4GHz,默认热设计功耗 225W,最高可以开放到 240W,价格 6950 美元。
相比之下,一代旗舰霄龙 7601 为 32 核心 64 线程,频率 2.2-3.2GHz,热设计功耗 180W,也就是说第二代在核心数量翻番的同时,加速频率最多提升了 200MHz,热设计功耗则只增加了 45W,或者说 25%。
霄龙 7702 也是 64 核心,频率 2.0-3.35GHz,默认热设计功耗 200W,最高还是 200W,但是最低可以降到 165W。
此外还有48 核心两款、32 核心三款、24 核心两款、16 核心两款、12 核心一款、8 核心两款。
单路旗舰型号是霄龙 7702P,规格完全同霄龙 7702,但是价格从 6450 美元降低到 4425 美元,还有 32 核心、24 核心、16 核心、8 核心各一款。
频率方面,一代霄龙基准最高只有 2.4GHz,二代则是 2.0GHz 起步,最高能做到 3.1GHz (虽然只是 8 核心),而加速频率一代只有 2.7-3.2GHz,二代则来到了 3.2-3.4GHz。
价格方面,从 32 核心旗舰霄龙 7601 到 64 核心旗舰霄龙 7742 只会增加 65%,而到同样 32 核心、规格更高的霄龙 7502(2600 美元),其实价格降低了几乎 40%!
按照 AMD 给出的数据,霄龙 7742 相比于至强铂金 8280L (28 核心),SPECrate2017 整数性能高出 97%,浮点性能高出 88%、SPECjob2015 虚拟机性能高出 84%,各项应用性能也是全面秒杀,综合而言性能领先 80-100%,性价比领先超过 1 倍,成本则降低 40-50%,TCO 降低 25-50%。
对于数据中心产品,除了本身的表现,更关键的是生态系统支持。经过两年的建设,霄龙的生态已经枝繁叶茂,软硬件平台数量比一代翻了一番还多,AMD 也在会场特意竖起一面墙列出了各家合作伙伴的名字。
HPE 现场宣布,基于二代霄龙的全新 ProLiant DL325/385、Apollo 35 已经同步上市,后续 AMD 产品将扩大三倍,同时宣布 HPE、AMD 联合创下了 37 项新的世界纪录。
Twitter 数据中心基础架构将在今年底升级到二代霄龙,单个机柜 CPU 核心数从 1240 个增加 40% 来到 1792 个,但是功耗保持不变,散热也无需改变,同时 TCO 则降到了 25%。
Cray 则介绍了联合 AMD、美国能源部、橡树岭国家实验室打造的新一代超级计算机“Frontier”,基于二代霄龙处理器,将成为世界上最快的超算之一,另外美国空军天气情报机构将利用 Cray Shasta 超算系统、二代霄龙,为美国空军和军队提供全面的陆地和太空气象信息。
其他主要合作:
Google已在内部基础架构生产数据中心环境部署二代霄龙,今年底 Google 云计算引擎也会支持二代霄龙。
微软通用应用的全新 Azure 虚拟机今天开始提供预览,并开始提供基于云的远程桌面和高性能计算工作负载的限量预览,全都基于二代霄龙。
联想宣布可充分利用二代霄龙所有增强功能的全新解决方案, 同步上市的 ThinkSystem SR655/SR635 均基于二代霄龙。
戴尔即将推出全新设计的专为二代霄龙优化的服务器。
VMware vSphere 将支持二代霄龙的安全和其他特性。