经过近十年的生态建设之后,Arm 高性能 CPU 终于在服务器市场崭露头角,亚马逊、Marvell 都已经将 Arm 架构应用于云端,华为海思也推出了基于 Neoverse N1 设计的鲲鹏系列服务器,Ampere Computing 在去年推出了首款云原生服务器 CPU,已经展现出了性能和功耗的优势。
近日,Ampere 在 2022 年度战略和产品路线图更新的分享中透露,Ampere 将在今年发布自研核心的 5nm CPU AmpereOne。
Ampere Computing 首席产品官 Jeff Wittich 告诉雷峰网 (公众号:雷峰网):“AmpereOne 也是以 ARM ISA 为基础。客户每年都期待有性能更高、能效更好,扩展性更好的 CPU,通过开发和推出自研核 CPU,能够帮助我们把所有的注意力和重心都放在客户的需求方面,也能够去满足他们相应的要求。”
也就是说,在获得包括微软 Azure、阿里云、腾讯云等全球七大超大规模的数据中心客户的认可之后,Ampere 要将其 CPU 的性能和功耗表现进一步提升。作为 Arm 高性能服务器 CPU 提供商的代表,Ampere 进一步提升的产品也意味着 Arm 服务器 CPU 与 x86 服务器 CPU 的差距将进一步扩大。
靠高性能、低功耗、云原生抢食 x86 服务器市场
Arm 架构服务器 CPU 相比 x86 服务器 CPU 一个显著的特征就是更高性能和更低功耗。根据 Ampere 给出的数据,其 CPU 的性能超越传统 x86 处理器 3 倍,性能功耗比领先近 4 倍。
与 x86 服务器 CPU 相比,Ampere Altra 系列可用 50% 的能耗,提供 200% 的性能。
Altra CPU 能够实现高性能的关键是高核数。
Jeff Wittich 解释,“我们 128 核的产品目前在业内领先,是其它 CPU 的两倍。每个核上仅运行一个单线程,并保持以一致的高频率全核运行。同时,我们为每个核提供大容量低延迟的专用缓存,借助智能高带宽 Mesh 互联结构,将所有高性能核都连接在一起,打破了传统的 CPU 在需求增加时会产生递减回报的使用瓶颈。还采用先进的 DDR 和 PCIe 技术设计,可实现最大容量,扩展内存和 I / O 的带宽。能够有效避免用户之间的相互干扰,同时提供优秀的可扩展性能,最终达到最大利用率。”
还有非常关键的一点,Ampere Altra 系列是为云计算而生,作为云原生 CPU,Ampere 为了优化功耗和面积,去除了传统架构不受云欢迎的特性,实现单核功耗比比传统 CPU 低 67% 以上。
“传统 x86 最大的一个劣势是,它们并不是专门为数据中心所设计,也不是专门为云端、云业务所设计,过去被用于数据中心,也是由于当时除了 x86 CPU 没有更好的选择。” Jeff Wittich。
云原生处理器的优势具体可以体现为,由于拥有高核心数量的优势,每一个核心仅运行一个单线程,可以表现出比较好的性能和安全性,不用担心工作负载数量、压力的增加而导致性能的下降,也可以抵御很多用户干扰。
Altra CPU 也有比 x86 CPU 更好的可扩展性,对于云计算客户也十分有用。
进一步拉大与 x86 CPU 的性能差距
Ampere Computing 董事长 Renee James 透露,“我们已经就产品的性能和功能申请了数百项专利,最新的产品 AmpereOne 采用 Ampere Computing 自研核,基于 5nm 工艺,支持 PCIgen5 和 DDR5。新产品已经开始送样,非常期待客户的反馈。”
“我们即将推出的自研核 AmpereOne,也是以 Arm ISA 为基础,微架构与 Arm 提供的 Neoverse 有非常多区别,但目前还不能提供过多信息。”Jeff Wittich 透露,“自研核 AmpereOne 能够完美地与我们现在的产品 Altra 和 Altra Max 云原生处理器互相兼容。从用户的角度,他们针对 Ampere Altra/ Altra Max 实现的优化,在我们的 AmpereOne 上也可以是完美适用的。除此之外,我们还与编译器,例如 GCC 和 LLVM 进行过相应的合作,进一步确保我们所有产品的适配性。”
虽然还没有更具体的信息,但 Ampere 的 CPU 会进一步提升性能和功耗,这无疑会进一步拉大与 x86 CPU 的差距。
不过,Arm 高性能 CPU 还有一个明显的短板,那就是软件生态。
生态仍是 Arm 服务器 CPU 短板
要完善 Arm 高性能计算生态,软硬件都需要不断提升,Ampere 除了与云平台以及硬件的 ODM 和 OEM 合作外,也和技嘉和凌华科技等合作伙伴的开发套件,用于人工智能和自动驾驶等多个场景,拓展应用场景。
Ampere 强调,其高性能、低功耗的边缘云原生处理器,还可将功率降至超低的 40W (32C) 或低于 70W (64C)。意味着 Ampere Computing 32 核处理器的功耗比同等的 x86 CPU 低 4.6 倍,能够开辟其他竞争对手无法涉足的新领地,如 Cruise 的自动驾驶汽车。
当然,Ampere 也在探索 AI 以及混合量子计算的方向。
另外,Ampere 通过设立 Ampere Developer Program 开发者计划,希望吸引更多开发者,在开发者社区提供 130 多个应用程序,并且每天在网站上进行回归和更新,从数据库到 AI 推理的各种解决方案。
“通过回归测试,可以保证我们广泛的适配性,同时在适配性的基础上确保高性能的效果。” Jeff Wittich 表示。
但无论如何,Ampere 所选择的 Arm 高性能计算生态,还需要更多企业和开发者共同建设,才能真正与 x86 CPU 在服务器市场一较高下。
全球综合数据资料库 Statista 预测,到 2028 年,Arm 架构处理器在数据中心和云的市场规模将达到 580 亿美元,是 2019 年的 14 倍多,市场份额也将从 2019 年的 5% 增长到 25%。
Arm 在数据中心的云市场仍然还有一段路要走。