新闻  |   论坛  |   博客  |   在线研讨会
Yes!AMD发布7nm服务器芯片「米兰」:Zen 3架构,IPC提升19%,最高64核
机器之心 | 2021-03-20 15:02:14    阅读:1276   发布文章

AMD 全新发布 Epyc(霄龙)7003 系列处理器,代号「米兰」。该处理器基于 Zen 3 内核和 AMD Infinity 架构打造,每核心最多可达 32 MB 的 L3 缓存,相比二代处理器「罗马」,实现了 19% 的 IPC 提升。

当地时间周一,AMD 发布了全新的 Epyc(霄龙)7003 系列处理器,代号「米兰」(Milan),搭载了去年 10 月发布的全新 Zen 3 架构。Epyc「米兰」服务器芯片的规格与 Ryzen 5000 系列 CPU 大致相同:多核心、高加速时钟频率、19% 的单核性能提升,以及相较竞争对手英特尔表现出的巨大优势。

1.png

据 AMD 官网数据显示,EPYC 7003 系列处理器基于 Zen 3 内核和 AMD Infinity 架构打造,具有整套功能和特性:先进的 I/O、7nm x86 CPU 工艺技术以及片上集成安全处理器。

EPYC 7003 处理器具有每核心最多可达 32 MB 的 L3 缓存,支持 4-6-8 内存通道交织从而让多 DIMM 配置具有更好的性价比,并且其互联电路和内存之间时钟同步,所有这些特性都将促进更好、更快地得到结果。

2.png

AMD Epyc 处理器。

AMD 发布「米兰」服务器芯片,旨在从竞争对手英特尔手中抢占更多的市场份额。与消费级 PC 和工作站相比,AMD 与英特尔在服务器芯片领域的竞争更为明显。即使在 AMD 开始主导多线程性能之后,英特尔依然在单线程方面占据领先地位。这一领先地位在 2020 年趋于消失,但英特尔依然可以拿出与 AMD 几乎相同的单线程性能,尽管在全线程性能方面遭到了碾压。

据悉,AMD 已经完成该芯片的设计,并委托台积电采用 7nm 芯片制程工艺来实现量产。

全方位领先 Intel 至强可扩展处理器

与 2019 年自家发布的第二代 7nm 制程 Epyc 罗马(Rome)处理器相比,AMD Epyc「米兰」完成了从 Zen 2 架构到 Zen 3 架构的过渡,并且与桌面端 Ryzen 5000 系列 CPU 相比相差不大。

但与英特尔 Xeon 处理器相比,Epyc「米兰」的速度更快,且能够使用更少的物理空间和功率完成更多的工作。下图展示了 AMD Epyc 处理器与英特尔 Xeon 处理器不同的发展曲线,其中 Epyc 处理器在 2017 年实现了突飞猛进,超越了英特尔 Xeon,并在之后几年继续遥遥领先:

3.png

此外我们可以看到,2017 年和 2018 年,AMD Epyc 和英特尔 Xeon Scalable 之间并没有拉开太大差距,但是 AMD 在 2019 年推出了 Zen 2 架构,实现了真正的巨大飞跃。

以具体数据说话,AMD Epyc 7763 系统上运行的 VDI 桌面会话数量是英特尔 Xeon Platinum 8280 系统上的 2.12 倍:

4.png

AMD 首席执行官苏姿丰在发布会上。

在高性能计算(HPC)和云计算工作负载方面,第三代 Zen 架构的 AMD Epyc 处理器较竞争对手英特尔双双提升了 106%:

5.jpg

在企业工作负载方面,AMD Epyc 处理器提升了 117%。此外,即使从 64 核心的 Eypc 7763 降至 32 核心的 75F3,其性能依然较英特尔最佳性能提升了 70%。

6.jpg

从罗马到米兰,Epyc 处理器有哪些架构变化

7.png

「米兰」实现了 19% 的 IPC 提升,而这主要由于其采用了全新 Zen 3 架构,该架构改进了分支预测、执行 pipeline 更宽,每时钟周期加载 / 存储操作有所增加。

8.png

Zen 3 架构还提供了比 Zen 2 更统一的 L3 缓存设计。Zen 2 / Rome 为每个四核组提供 16MiB L3 缓存,而 Zen 3 / Milan 为每个八核组提供 32MiB 的 L3 缓存。虽然每核的 L3 缓存还是 4MiB,但对于多核共享数据的工作负载而言,Zen 3 这种更统一的设计可以更好地节省缓存空间。

如果八核的 L3 缓存数据为 3MiB,则二代罗马处理器需要 6MiB,在每个四核组中它需要进行一次复制。而三代「米兰」处理器可以节省 3MiB 缓存,只用 3MiB 就可以服务八核,这也意味着单核可以处理更多 L3 缓存。其结果就是针对大型工作负载实现更快的内核与缓存通信,同时有效存储延迟也出现对应的降低。

安全性改进

9.jpg

AMD Epyc 处理器在安全性方面的声誉要好于英特尔至强处理器。从 Epyc 罗马开始,Spectre 和 Spectre V4 攻击可以通过硬件和操作系统 / 虚拟机监视器(Hypervisor)得到缓解。而这次新发布的「米兰」处理器支持安全嵌套分页(Secure Nested Paging),即为受信任的虚拟机提供保护,使其免于不受信任的虚拟机监视器,并且米兰还提供了一个新特性——CET Shadow Stack。

该特性能够提供返回地址的镜像,从而免受面向返回编程(ROP)的攻击。这使得系统能够检测和缓解攻击,即使成功实现了某个堆栈溢出攻击,但它无法攻击影子堆栈。该特性要求操作系统 / 虚拟机监视器进行软件更新。

Epyc 「米兰」CPU 型号

Epyc 「米兰」处理器共有 19 种型号,包括 15 款双路型和 4 款单路型,核心数从 8 核到 64 核不等(每路 16 线程到 128 线程不等),下至 8 核 72F3(3.70-4.10GHz,180W TDP),上达 64 核 7763(2.45-3.50GHz,280W TDP)。

10.jpg

图源:https://www.amd.com/zh-hans/processors/epyc-7003-series

所有的「米兰」型号均提供同时多线程(单核双线程)、8 通道 DDR4-3200 RAM、128 lane PCIe4、安全内存加密、安全加密虚拟化等。

其 SKU 被分为三个类别:

最高单核性能,这类 SKU 名称中的第三位为字母「F」,从 8 核 180W 72F3 到 32 核 280W 75F3;

针对每个 socket 的最高核 / 线程数量进行优化,名称中带有「76」或「77」,从 48C/225W 7643 到 64C/280W 7763。

其他 SKU 名称以 73、74、75 开头,旨在「平衡」,可以优化性能和 TCO。

此外,如果 SKU 名称中有「P」,则表示这是一个单 socket 模型。

AMD 与英特尔之争

AMD 表示,「米兰」数据中心处理器比英特尔目前最好的数据中心芯片还要快。据了解,这款芯片由 AMD 设计,并委托台积电使用其 7 纳米芯片制程进行生产。

与之相反,英特尔的一贯做法是「芯片设计与制造一体化」。但近年来英特尔的芯片制程技术略显落后。AMD「米兰」芯片及二代「罗马」芯片都超过了英特尔芯片,这帮助 AMD 抢占市场份额,比如谷歌弃用英特尔芯片,转用 AMD 数据中心处理器。

AMD 高级副总裁兼服务器业务部总经理 Dan McNamara 表示,他相信只要 AMD 继续将客户反馈集成到每一代芯片中,AMD 将保持领先地位。

「我们已经生产出了第三代处理器,我们认为这是针对数据中心的顶尖 CPU。如果我们继续这一步调,我们将保持高竞争力。」Dan 表示。

参考链接:

https://arstechnica.com/gadgets/2021/03/amds-zen3-comes-to-the-server-room-with-epyc-milan/

https://www.reuters.com/article/us-amd-intel/amd-launches-milan-chip-for-data-centers-as-battle-with-intel-intensifies-idUSKBN2B71VY

https://www.amd.com/zh-hans/processors/epyc-7003-series

*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。

参与讨论
登录后参与讨论
推荐文章
最近访客