ARM发布全新架构CPU、GPU及AI内核,华为或将无缘-编程之家

  来源:anandtech、theverge 等

  编辑:金磊、鹏飞

  新智元报道

  【新智元导读】近日,ARM 发布了下一代架构设计方案,三款重磅利器腾空出世:Cortex-A77 CPU、Mali-G77 GPU 和 ARM ML 处理器,性能全面提升。ARM 表示,新的旗舰级 IP 将定义 2020 年高端智能手机性能,提供新一代的人工智能体验。

  ARM 祭出了三把利器。

  昨日,全球领先半导体知识产权(IP)提供商ARM重磅发布了下一代架构设计方案,其中包括:

  • Cortex-A77 CPU;

  • Mali-G77 GPU;

  • ARM ML 处理器。

ARM发布全新架构CPU、GPU及AI内核,华为或将无缘-编程之家

  ARM 表示,新的旗舰级 IP 将定义 2020 年高端智能手机性能,提供新一代的人工智能体验。

  而在此前,新智元也报道了 ARM 宣布暂停与华为的合作的相关消息,或许此次 ARM 发布的旗舰级 IP 将与华为无缘。

  不过,华为目前已经获得了 ARM8 架构的永久授权(ARM8 是 ARM 公司的 32/64 位指令集,目前的处理器都是这一指令集的产物)。也有可能完全自主设计 ARM 处理器,并掌握核心技术和完整知识产权,具备长期自主研发 ARM 处理器的能力。

  代号 Deimos,新一代 CPU 性能大幅提升

  去年的 ARM 发布的 Cortex-A76 其实是一个非常成功的核心架构,全新的架构体系与 7nm TSMC 工艺的结合,带来了巨大的性能和效率飞跃,麒麟 980 和骁龙 855 就是很好的例子。

  但 ARM 真正的竞争对手主要来自苹果的 CPU 设计团队。仅从 CPU 来说,目前,苹果的 A11、A12 仍然有着较为明显的性能、效率优势。

ARM发布全新架构CPU、GPU及AI内核,华为或将无缘-编程之家

  ARM 发布的 Cortex-A77 代号为 Deimos (戴莫斯,畏惧之神),与上一代 A76 可谓是一脉相承,很大程度上保持了上一代的特性。

ARM发布全新架构CPU、GPU及AI内核,华为或将无缘-编程之家

  从官方给出的参数来看,有如下几个关键特性:

  • 依旧采用 Armv8.2 架构,支持 AArch32 和 AArch64;

  • 64KB L1 指令和数据缓存;

  • 256 或 512KB L2 缓存;

  • 以及高达 4Mb L3 缓存

  ARM 表示,Cortex-A77 和 Cortex-A76 保持相同的 3.GHz 峰值频率目标。但预计厂商不会在新一代 Soc 达到这么高的频率。

  Cortex-A77 将更多的计算能力用于设备安全的边缘计算上。这些计算能力使用范围包括 AI 摄像机、视觉场景检测、3D 扫描、生物特征用户 ID (人脸识别)、语音识别、游戏中的 ML 和 AR 中的 ML 等。

ARM发布全新架构CPU、GPU及AI内核,华为或将无缘-编程之家

  从性能角度来看,Cortex-A77 相比于 A76 有了许多性能上改进:

  • 单线程性能提升 20%;

  • FP 性能提升 35%;

  • 内存宽带提升 15%。

  更高的性能也意味着能更好地响应支持 AR 的新应用程序以及带来的体验。通过 Cortex-A77,手机游戏领域的增强现实技术在未来几年有望实现大幅增长。并且 Cortex-A77 还将支持 5G,爱立信在 2018 年 11 月的移动报告中预测,到 2024 年,将有大约 15 亿台智能手机设备具备 5G 功能。

  而众所周知,对于计算密集型 ML、AR 和其他新出现的设备来说,5G 是一个基本需求。它将带来更快的速度、大带宽(5 到 20 Gbps)、8K 分辨率的流媒体和 360 度视频。

  ARM GPU 采用全新架构 Valhall,性能大跃进

  除了 Cortex-A77 之外,ARM 还重磅发布了新一代 Mali-G77。

  划重点Mali-G77 采用了全新架构,Valhall。而在 G71-G76 采用的架构都是 Bifrost。

  Mali-G77 在性能、密度和效率方面取得了一些重大改进。虽然去年的 Mali-G76 引入了对执行引擎计算架构的一些重大更改,但 G77 的改进更大,并且脱离了 ARM 相对不同寻常的计算核心设计。

ARM发布全新架构CPU、GPU及AI内核,华为或将无缘-编程之家

  据 ARM 官方宣称,Mali-G77 较前代产品相比:

  • 效能提升 30%、性能提升 30%、机器学习性能提升 60%;

  • 每 mm²性能较 A76 预计提升 1.4 倍;

  • 在相同的工艺和相同的性能下,实现 30% 的同比能效改进;

  • 并且比 Mali-G72 节省 50% 的功耗。

ARM发布全新架构CPU、GPU及AI内核,华为或将无缘-编程之家

  从官方给出的性能来看,ARM Mali-G77 的性能已然接近目前苹果 A12 的性能,同时也超过了高通 Adreno 640 的性能。

  ARM ML NPU

  随着智能手机和计算机继续利用 AI 来实现摄影中的场景识别或增强现实中的物体识别等功能。同时,许多公司也构建了专门的神经处理单元来处理这些任务,从而减轻了 CPU 和 GPU 的压力。

  而此次,ARM 还发布了其最新的 NPU,提供了高达两倍的能效,并且是上一代内存压缩的三倍。与开源的 ARM NN 软件框架相结合,ARM 表示该芯片的八核版本可提供高达 32 TOP/s的性能。

  网友怎么看?

  worldvoipcenter:可惜了华为不能用

ARM发布全新架构CPU、GPU及AI内核,华为或将无缘-编程之家

  abufrejoval 指出,虽然扩展所有 Prefetch(预加载)对于性能来说似乎是一件好事,但它也增加了旁路攻击的概率。

  syxbit 吐槽:ARM 的每个Q&A环节都应该有人说“嘿,赶上 Apple 之前请闭嘴”作为 Android 用户,拥有严重劣质的 SoC 真的很令人沮丧。

  raptormissle:所以看起来 SD 865 最终将打破 4000 geekbench 单核心得分,并且可能在多核心中获得 12000+。ARM 终于在苹果公司的竞争环境中占据了一席之地,因为我真的不希望看到 A13 那么火!

  GC2:CS 对苹果的发热问题非常不满:76 性能实现了飞跃。老实说,我很乐意以较低的功率获得相同的性能。并削减/限制峰值功率…而不是购买风扇配备手机

  0iron 邪魅一笑发出灵魂一问:那么 A77 属于“美国原厂技术”,会受到出口禁令的影响吗?

  wilsonkf 回应 0iron:非常有可能,但也许为时已晚。设计阶段大部分应该(在禁令之前)早就完成了。

  Lodix 想知道海思关于今年晚些时候使用 ARM IP 推出麒麟 SOC 以及所有正在发生的事情,目前的情况看起来让人有些沮丧。

  Wilco1:由于大内核之间的性能差距鸿沟正在加速撕裂,因此提高小内核的性能似乎比进一步增加性能更为重要。

  附:Cortex、Mali 全家福一览

  1、面向嵌入式的 Cortex 家族

  ARM 处理器能耗和成本低,性能高,被广泛应用在动通信领域。另一方面,超级计算机消耗大量电能,ARM 同样被视作更高效的选择。

  但是移动设备对嵌入式微处理器的综合性能越来越高,为了应对日益增长的算力需求,ARM 推出了 Cortex 系列,Cortex 在英文里代表大脑皮层。

  针对不同的应用需求,ARM 推出了 Cortex-A、Cortex-R 和 Cortex-M。其中 Cortex-R 追求实时性,而 Cortex-M 追求低成本。

  Cortex-A 系列则追求极致性能,是 Cortex 系列中性能王者,而且制作工业也在不断挑战极限。从 A76 的 10nm 开始,到 A77 的7+nm,未来A系列还会推出 5nm 芯片。

ARM发布全新架构CPU、GPU及AI内核,华为或将无缘-编程之家

  A 系列利用多核技术为传统 MPCore 处理器提供单个到四个内核的可扩展性,为 DynamIQ 处理器提供单个多达八个内核;改进了数据安全性和隐私性,高级安全性和 RAS 功能以及集成的 AI 功能,使基于 DynamIQ 的系统能够提供广泛的解决方案。集成在 DynamIQ 处理器中的高级电源管理功能可为节能设计提供更高的功耗节省。主要应用于性能密集型同,例如移动设备、自动驾驶以及医疗。

  下图是 Cortex-A 系全家福:

ARM发布全新架构CPU、GPU及AI内核,华为或将无缘-编程之家

  Cortex-A 系列器件的主要特性:

  • 支持单核和多核配置的可扩展集群

  • RISC 内核支持 Armv7-A 和 Armv8-A 架构

  • 完全向后兼容以前 ARM 处理器的代码

  • VFP 和 Neon 单元执行浮点和高级 SIMD 指令集

  • 可选的加密加速器引擎,支持 AES,SHA1 和 SHA2-256 等算法

  • 内存管理支持(MMU)支持具有各种页面大小的虚拟地址和物理地址空间

  • 硬件转换表走向虚拟到物理地址转换

  • Big-endian 和 little-endian 数据访问支持

  • 对基本加载/存储指令的未对齐访问支持

  2、ARM 的 GPU:Mali 家族

  除了 ARM 处理器授权,ARM 还有一整套 GPU 授权方案,称为 Mali。之前很多不具备独立开发 GPU 技术的芯片供应商,直接使用了 ARM 处理器 +Mali GPU 的设计,比如三星、瑞芯微、展讯、意法半导体、全志等。

  Mali 全家福:

ARM发布全新架构CPU、GPU及AI内核,华为或将无缘-编程之家

  ARM Mali 系列多媒体处理器为 SoC 提供图形和显示解决方案。能够为从入门级大众市场智能手机扩展到视觉震撼的高性能智能手机、以及基于 Android OS 的平板电脑和智能电视提供非常好的视觉体验。

  和其他基于 IP 核心(IP cores)嵌入式技术的 3D 显示芯片一样,Mali 显示芯片组没有提供特别用来驱动 LCD 显示器显示图像的显示控制器(类似于显卡),相反地,它是一个纯 3D 显示引擎,它将图像加载到缓存中,并且由专门负责图像显示处理的内置显示核心来显示这些图像。

  参考链接:

  https://www.anandtech.com/show/14384/arm-announces-cortexa77-cpu-ip

  https://www.anandtech.com/show/14385/arm-announces-malig77-gpu

  https://www.theverge.com/2019/5/27/18641190/arms-cortex-a77-mali-g77-premium-smartphone-2020-chip-design

  https://liliputing.com/2019/05/arm-launches-cortex-a77-cpu-mali-g77-gpu-and-arm-ml-npu.html

  https://www.tomshardware.com/news/arm-cortex-a77-mali-g77-ml-processor,39430.html