今天,Intel正式发布了第三代至强可扩展处理器,代号“Cooper Lake”,频率、核心数、内存等提升的同时,重点强化了DLBoost深度学习能力,是当今全球唯一内置AI的主流数据中心处理器。
Cooper Lake主要面向四路、八路市场,今年晚些时候还将有基于10nm Ice Lake的志强,针对单路、双路市场,二者互补构成完整的第三代家族。
至于为何如此划分,Intel给出的解释是更多客户希望在更多路系统上进行AI强化。
Cooper Lake仍然采用14nm工艺制造,最多28核心56线程(八路就是最多224核心448线程),部分型号增加了核心数量,同时频率更高,基准频率提升至最高3.1GHz,单核睿频加速最高则可达4.3GHz,三级缓存最多38.5MB(每核心对应1.375MB),热设计功耗150-250W。
内存支持六通道DDR4,最高频率3200MHz,单路最多12条,并支持16Gb高密度颗粒,单路最大容量可达4.5TB,八路就是36TB,当然也支持Intel自家的Optane PMem傲腾可持续内存,而且配合发布了新的200系列。
技术方面,部分型号新增加了Intel Speed Select(SST)技术,包括STT Core Power(SST-CP)、SST Turbo Frequency(SST-TF),可优化处理资源,提升工作负载性能、提高资源利用率、优化平台TCO成本,同时支持Intel AVX-512指令集、VNNI/BFloat16深度学习加速指令集。
由于面向四路、八路系统,Cooper Lake都内置了六条UPI互连总线,最高传输率达10.4GT/s。
输入输出方面,处理器支持最多48条PCIe 3.0通道,搭配C620A系列芯片组(包括C621A、C627A、C629A)还可提供最多20条PCIe 3.0、10个USB 3.0、14个SATA 6Gbps,处理器与芯片组互连通道为DMI 3.0 x4。
Cooper Lake封装接口自改成了新的Socket P+,又称为LGA4189,未来的Ice Lake也是这一新接口,都不兼容现在的LGA3647平台。
AI无疑是这三代可扩展至强的最大特色,而且一直在飞速前进。
2017年的第一点支持AVX-512 FP32浮点格式,具备高精度优势,得到了24项优化,金山云、美的、南京大学、盈谷等中国科技企业、机构等都做了部署。
2018年的第二代加入了DLBoost INT8整数格式,44项优化,我们也看到了更多国产机构的名字:科大讯飞、上海交大、京东云、云创大数据、智芯原动、汇医慧影、青云QingCloud、东软等等。
而在最新的第三代上,我们又迎来了新的BFloat16(简称BF16),专为AI运算、深度学习等应用而开发,一方面适当降低了精度(依然很接近FP32),从而提高能效,软件应用也不需要太多调整,另一方面则大幅提升了AI性能,官方宣称相比上代FP32训练性能提升最多1.93倍、推理性能提升最多1.9倍。
目前,支持BF16的第三代至强可扩展处理器已经获得了阿里云、蚂蚁金服、腾讯云、海鑫科金、东软等公司的支持,实测显示各项性能提升少则54%,多则97%。
BF16标准还已经获得Google、微软、ARM及其他AI公司的广泛采纳,Intel至强则是x86阵营中第一家、也是唯一一家支持它的CPU处理器。
根据Intel官方数据,如果以至强E7 v4系列为基准,AI训练性能方面,三代可扩展至强使用AVX-512的话提升幅度为82%,BF16加持的DLBoost则能带来2.14倍的提升;AI推理性能方面,AVX-512只能获得1.04倍的提升,INT8可达到5.25倍,BF16则是2.66倍。
强大的生态支持从来都是Intel的无敌优势,这次也不例外,在官方支持名单中可以看到一连串大名,其中既有诸多全球的科技企业、科研机构、软件巨头、高校,也不乏众多中国互联网和科技企业、高等院校、通信运营商,甚至可以看到银联、韵达快递。
Cooper Lake三代可扩展至强分为三个子系列,总计11款不同型号,编号都以H或者HL结尾,区别在于HL支持单路最多4.5TB内存,H的则是1.12TB。
最高端的至强铂金8300系列有六款型号,分别是8380HL、8380H、8376HL、8376H、8354H、8353H,前四款28核心56线程,后两款18核心36线程,热设计功耗150250W,内存频率最高3200MHz(每通道一条)或者2933MHz(每通道两条),支持四路、八路扩展。
至强金牌6300系列有三款型号,分别是6348H、6328HL、6328H,前一款24核心48线程,后两款16核心32线程,热设计功耗都是165W,内存频率最高2933MHz,仅支持四路。
至强金牌5300系列有两款型号,分别是5320H、5318H,一个20核心40线程, 一个18核心36线程,热设计功耗150W,内存频率降至2666MHz,仅限四路,该系列RAS能力有所精简。
其中,金牌6328HL、6328H、5320H、5318H四款支持SST技术。
Intel称,对比五年前的老平台(应该是至强E7 v3?),三代可扩展至强的平均性能提升达90%,平均数据库性能提升则可达98%。
如果客户不知道该选择哪款型号,Intel还根据实际应用做了针对性的推荐,比如主做AI训练的,就选更多核心的8380H、8376H、8354H;如果是内存密集型应用,自然优先选更多核心还支持大内存的8380HL、8376H;如果主要用于虚拟机,则推荐6348H这种核心数、内存都最适中的;
视频会员活动汇总>>
爱奇艺视频会员限时优惠5折
优酷视频会员年卡5折购(99元)
腾讯视频会员年费99元/京东plus联合年卡128元
芒果TV 13个月 98元(6.16-6.22)