苹果 Mac M1 Pro/Max 芯片解密,如何打造出性能怪兽

10 月 22 日报道,本周三凌晨,苹果两款全新电脑芯片 M1 Pro 和 M1 Max 彪悍登场,性能与能效再度较上一代大幅升级。

此时距离 Mac 过渡到苹果芯片的计划时间已经过去一半,而这两款苹果迄今打造出的最强芯片,将该计划向前推进了重要一步。在性能、定制技术、能效方面,M1 系列芯片阵容均领先业界。

苹果从整体系统出发,专门针对 14 英寸和 16 英寸 MacBook 重新定义芯片设计,量身定制出这两款全新芯片。跟 M1 芯片一样,两款芯片采用苹果自己定制的封装方式,实现高速统一内存架构,是在 M1 架构基础上进一步拓展,因此两款芯片均仍以 M1 命名,通过 Pro 和 Max 加以区别。

两款芯片的 CPU 运行速度相比 M1 提升最高可达 70%,处理 Xcode 编译代码等任务更高效,内存带宽与容量也进行了大幅提升。

此外,相比 M1,M1 Pro 的图形处理器运行速度提升最高达 2 倍,M1 Max 更是提升最高达 4 倍,使得处理图像工作流速度飞涨。M1 Pro 和 M1 Max 内部集成的媒体处理引擎也经过加强,配备 ProRes 专用加速器,专用于专业级的视频处理。通过采用高能效架构,两款芯片在接入电源或仅靠电池供电时,均能具备一致的性能表现。

苹果硬件技术高级副总裁 Johny Srouji 说:“依托中央处理器和图形处理器性能的大幅提升,最高可达 6 倍的内存带宽,新增 ProRes 加速器的媒体处理引擎,以及其他多种先进技术,M1 Pro 和 M1 Max 引领苹果的芯片产品开辟新天地,在专业级笔记本电脑领域独树一帜。”

M1 Pro 和 M1 Max 如何将电脑芯片性能发挥到极致?我们来完整梳理一下它们的架构细节信息。

M1 Pro:GPU 核心对称放置,SRAM 区域变得更大

M1 Pro 采用业界领先的 5nm 工艺,封装多达 337 亿个晶体管,是 M1 的 2 倍以上,面积约为 245mm²

其定制化封装延续此前的特色,将 SoC 模组和内存模组封装在单个有机 PCB 上,这种方法可能有助于显著提升能效。

全新 10 核 CPU 由 8 颗高性能核心和 2 颗高效率核心组成,运行速度相比 M1 提升最高可达 70%。

与最新的 8 核 PC 笔记本电脑芯片(英特尔酷睿 i7-11800H)相比,M1 Pro 在同等功耗水平下的 CPU 性能更可高达 1.7 倍,达到其峰值水平性能的功耗则少了 70%。

其 GPU 最高配置为 16 核,速度最快达到 M1 的 3 倍以上,速度相较最新款 8 核 PC 笔记本电脑芯片集成显卡最快可达 7 倍以上。与 PC 笔记本电脑所用的大功率独立图形处理器(GeForce RTX 3050 Ti 4GB)相比,M1 Pro 在性能更强的同时,功耗减少了 70%。

M1 Pro 内部集成了苹果设计的媒体处理引擎,对 ProRes 专业视频编解码器进行针对性加速,仅需极低功耗,便可同时播放多条高质量画面的 4K 及 8K ProRes 视频。

外媒 AnandTech 对 M1 Pro 的内部设计做了分析。从图中可以看到,M1 Pro 中的高性能核心、两个 L2 块都是对称放置的。

内存接口被整合到 SoC 的两个角,因界面宽度增加,内存控制器占用了相当大一部分 SoC。苹果还在内存控制器后面直接使用两个系统级缓存 SLC 块,这跟 M1 上也不一样,SRAM 单元格区域看起来变得更大。

相比 M1,M1 Pro 的内存总线增加了一倍,从 128 位 LPDDR4X 接口转向新的更宽、更快的 256 位 LPDDR5 接口,最高可配置 32GB 的高速统一内存和 200GB/s 的内存带宽。

M1 Max:苹果芯片野心的集大成者,一个周围有 SoC 的 GPU

M1 Max 是苹果迄今打造的最大芯片,可以说是苹果将在芯片领域的野心推到最大的作品,设计复杂程度前所未有。

其面积约为 432mm²,内部共计集成 570 亿个晶体管,比 M1 Pro 多出 70%,比 M1 多达 3.5 倍。

这款芯片同样采用 10 核 CPU,GPU 则最高多达 32 核,图像处理速度相比 M1 提升最高可达 4 倍,可将在 Final Cut Pro 中渲染复杂时间线的速度较上一代 13 英寸 MacBook Pro 提升最高可达 13 倍。苹果称 GPU 算力可达 10.4TFLOPS。

在达到紧凑型专业级 PC 笔记本电脑内高端图形处理器(GeForce RTX 3080 100W TDP)的相近水平性能时,其 GPU 功耗少 40%。

在达到最大型 PC 笔记本电脑内最高端图形处理器(GeForce RTX 3080)的同等性能水平时,其功耗则要少 100 瓦。降低功耗使得 MacBook Pro 能实现更长的电池续航时间。

相比集成 GPU 的 SoC,M1 Max 更像是一个周围有 SoC 的 GPU。

由于面积变得更大,M1 Max 的封装略有变化,DRAM 芯片从 2 个增加到 4 个,这也与内存接口宽度从 256 位增加到 512 位相对应。

GPU 上方芯片看起来与 M1 Pro 基本相同,改变主要出现在下方区域,比如 SLC 块的数量增加。如果每个块 16MB,整个 SoC 将使用 64MB 片上通用缓存,除了明显的 GPU 用途外,不知道 CPU 能用如此巨大的内存带宽资源实现什么。

M1 Max 芯片结构采用更高带宽,内存带宽是 M1 Pro 的 2 倍,达到 400GB/s,接近 M1 的 6 倍,最高可配置 64GB 的高速统一内存。这种带宽在 SoC 中闻所未闻,在非常高端的 GPU 中相对正常。

此前最新款笔记本电脑的显存容量也没超过 16GB 的上限,而将高达 64GB 的统一内存用于需要处理大量图像的任务,将可令专业人士能够使用笔记本电脑完成许多以往无法想象的工作。

M1 Max 在媒体处理引擎方面也更胜一筹,视频编码速度相比 M1 Pro 提升最高可达 2 倍,并配有 2 个 ProRes 加速器。

在搭载 M1 Max 的新款 MacBook Pro 上使用 Compressor 对 ProRes 视频进行转码,速度相比上代 16 英寸 MacBook Pro 可提高 10 倍。

总体来看,M1 Max 堪称迄今为止 Mac 上最强大的专业级笔记本电脑芯片。

更多量身定制设计,与操作系统高度适配

M1 Pro 和 M1 Max 还采用了许多量身打造的先进技术,包括全新的显示引擎可同时驱动多台外部显示器,新增的雷雳 4 控制器可提供更高的 I/O 带宽等。

加速 AI 和图像处理方面,16 核神经网络引擎可加速设备端机器学习功能,提升摄像头性能,苹果定制的 GPU 配合神经网络引擎,利用计算视频技术提升内置摄像头的画质,能令视频画面更加清晰,视频中的人物肤色更加自然。

此外,macOS Monterey 操作系统与 M1 Pro 和 M1 Max 高度适配,可充分发挥两款芯片的性能和能效实力,Metal 等开发者技术可帮助各类 App 充分利用两款新芯片的性能,对 Core ML 的相关优化则可借助于神经网络引擎,以更快的速度运行机器学习模型。

专业级 App 的任务处理数据将被用于协助优化 macOS 对多线程任务的 CPU 核心分配,从而进一步优化性能。先进的电源管理功能则可为不同任务智能分配不同数量的性能核心和效率核心,同时达成更好的处理速度和电池续航时间。

苹果为 Mac 提供的所有 App 全部针对苹果芯片进行了优化,并可基于苹果芯片原生运行,还有超过 10000 款通用 App 及插件可供选择使用。

目前尚未升级至通用 App 的各类 Mac App,则可借助苹果的 Rosetta 2 技术无缝运行,用户还可在 Mac 上直接运行各类 iPhone 及 iPad App。

在安全系统设计方面,苹果最新的安全隔区、基于认证硬件的安全启动以及运行时防数据利用技术都值得一提。macOS 与 M1、M1 Pro、M1 Max 三款芯片的组合能提供基于认证硬件的安全启动、运行时防数据利用技术以及高速的文件数据内联加密等业界领先的安全保护能力。

苹果承诺计划在 2030 年年底前让全部公司业务实现碳中和,包括制造供应链和所有产品生命周期在内,这也意味着苹果所生产的每一枚芯片,从设计到制造,都将实现 100% 碳中和。

结语:苹果自研芯片连环炸场,留给英特尔还有多少空间?

新一代苹果 Mac 芯片的性能,已经超过大多数的期待,苹果预告中定义的“炸场”两字可以说是当之无愧。苹果再次用堪称标杆的芯片产品展现自己世界一流的芯片设计实力。

距离苹果设定的两年转型期已经过去 1/2,如今苹果接连推出与 Mac 系列产品高度适配、性能和能效更强的自研芯片,未来英特尔芯片在苹果产品中还有多大生存空间,大概要画上一个问号。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注