在经历了长久的预热之后,2024年7月15日, AMD 公司副总裁兼客户渠道业务总经理 David McAfee先生正式为我们揭开了锐龙9000系列桌面处理器的神秘面纱。新的处理器带来了全新设计的Zen 5架构、最新的工艺以及相比前代产品至少16% IPC的提升。毫不夸张的说,今年夏天最令人期待和激动的产品就是AMD锐龙9000系列了,相比竞争对手,它在工艺、技术和性能上都实现了超越,并且拥有极佳的稳定性和可靠性,尤其是顶级型号。话不多说,我们先来快速预览一下本次解密的具体内容。
AMD 公司副总裁兼客户渠道业务总经理 David McAfee先生为我们揭开了锐龙9000系列桌面处理器的神秘面纱
顶级性能和极高能效比的合体:锐龙9000系列桌面处理器AMD的Zen系列微架构和锐龙系列处理器是目前市场上最重要也是最主流的桌面处理器了,从初代Zen架构50%以上IPC提升的开始,一直到Zen 2的多核心、Zen 3强悍的游戏性能、Zen 4的高频率高性能,AMD一步一个脚印,不断提升着桌面处理器的性能,同时带给用户更为出色的使用体验。在2024年的ComputeX上,AMD官宣了有关Zen 5架构以及锐龙9000系列处理器的信息,引得业内无数用户翘首以待。现在,这款全新处理器的详细信息终于正式公布。
AMD针对锐龙9000系列桌面处理器的定位是:拥有极致的性能和能耗比。AMD认为锐龙9000系列带来了强悍的性能、出色的能耗比、优秀的超频体验以及长寿命的平台。其中,前两点来自于Zen 5架构和全新工艺,超频体验方面AMD本次带来了调节更为精细同时更为实用的新功能,长寿命方面除了新发布的AMD 800系列芯片组外,锐龙9000系列依旧可以使用在AMD 600系列芯片组上,用户只需要刷新BIOS就可以使用新处理器,非常方便。
本次AMD发布的锐龙9000系列桌面处理器包含四款,分别是锐龙9 9950X、锐龙9 9900X、锐龙7 9700X以及锐龙5 9600X。相比前代锐龙7000系列,新的处理器乍一看在频率、核心数量、线程数量、缓存方面都没有太大变化,不过TDP功耗方面,除了顶级的锐龙9 9950X外,其余三款TDP功耗相比前代锐龙7000对应的产品都有很大幅度的降低,比如锐龙9 9900X的TDP从锐龙7 7900X的170W下调到120W,锐龙7 9700X的TDP从锐龙7 7700X的105W降到65W,同时最高加速频率反而略有提升,这意味着锐龙9000系列桌面处理器内部存在巨大的革新。
截止我们发稿时间,AMD已经在官网上更新了锐龙9000系列桌面处理器的规格,有兴趣的读者可以直接移步AMD官网查看。
Zen 5立功:全新设计微架构带来16% IPC提升微架构方面,锐龙9000系列桌面处理器采用了最新的Zen 5微架构,整体相比前代Zen 4进行了重大改进,从前端到后端,Zen 5都更宽、更大、执行能力更强。我们在这里简单介绍一下。
Zen 5的四大设计目标包括每周期执行更多指令、整体宽度更宽、缓存数据带宽翻倍以及AI加速。虽然看起来简单的四句话,但是反映在架构中,则是天翻地覆的变化。
前端方面,Zen 5改进的重点在于解码器改为2个4宽度的解码器,在同一时间可以实现8宽度的解码。从Zen架构开始,AMD使用单个4宽度解码器已经历经多代,在Zen 5中终于彻底改进。相对应的分支预测方面也大幅度提升,包括更少的延迟、更高的准确性以及更大的吞吐能力等。指令缓存方面也由于解码器的调整,更快、更宽了。总的来说,Zen 5现在拥有了一个更大的前端,随之而来的则是更多的优化和调整工作,尤其是分支预测等。我们预测AMD在Zen 6架构上还会对前端进行大幅度改进和提升。
前端的变化带来了更多指令的涌入,因此AMD的执行部分更大、更宽。包括更宽的指令拾取单元、分派、回收单元,更多的ALU单元以及更大的执行窗口等。
缓存和数据处理方面,AMD带来了新的48KB L1 12路数据缓存,延迟为4周期。带宽方面,L1缓存带宽翻倍,浮点单元带宽翻倍(对应浮点执行部分的调整)。另外数据预取性能也得到了加强。
浮点执行单元方面,AMD带来了一个强大的、支持AVX-512的SIMD单元,队列深度为384,拥有6个2周期延迟的FADD单元,整体的FP指令执行能力也大幅度提升。浮点能力提升将带来AMD在AI和游戏计算以及部分科学计算方面性能的提升,这也和AMD设计目标相符。
IPC提升方面,由于Zen 5微架构的改进,整体IPC相对前代产品的平均提升幅度达到了16%,完成了AMD“两位数”IPC提升的承诺,其中AES XTS提升高达35%,这可能和更大的带宽和更强大的浮点计算能力有关。
整个Zen 5的架构性能提升中,解码和执行部分带来的性能增幅最大,其次是数据带宽提升,指令拾取和分支部分则最少,这可能是AMD下一代微架构的改善重点了。
在生产工艺上,基于Zen 5架构核心,以锐龙9000系列处理器为代表的产品将采用台积电4nm工艺,采用Zen 5c小核心的处理器则将使用台积电的3nm工艺制造。总的来说,Zen 5微架构的性能提升是有目共睹的,仅从现在的资料来看,相比Zen 3到Zen 4的“小改动”而言,Zen 5的改动可谓天翻地覆,基本上重置了架构的大部分内容。更宽更大的解码和前端、更宽更快的执行部分以及大幅度加强的存储部分等,都带来了更为优秀的综合性能表现。Zen 5应该是一个非常优秀的基础微架构,很值得期待。
强悍性能:最高94%生产力优势,最高31%游戏优势那么Zen 5处理器的性能表现到底如何呢?接下来让我们先看看AMD的官方测试数据。
AMD给出了大量性能对比的数据。锐龙9 9900X对比英特尔酷睿i9 14900K,AMD数据显示器创作和生产力性能领先竞争对手2%~41%不等,游戏性能领先4%~22%不等。AMD在对比中采用的参数是默认英特尔设置和默认AMD设置,并未有特殊调节,考虑到英特尔处理器PL2下高达300W的功耗,因此无论是性能还是能耗比方面,12核心、24线程设计的AMD锐龙9 9900X就能击败24核心、32线程设计的酷睿i9-14900K。
另外,AMD还给出的锐龙7 9700X对比核心和线程数量更多、功耗也更高的英特尔酷睿i7-14700K的性能测试结果,和锐龙9 9900X的性能表现类似。AMD在Handbrake测试中表现出了惊人的领先幅度,这个软件是一个视频转码软件,如此高的领先幅度可能和AMD支持AVX-512指令集有关,目前13代、14代酷睿系列处理器全部都无法提供针对AVX-512的支持。同样,不论是在游戏还是生产力、内容创建测试中,8核心、16线程设计的锐龙7 7700X都击败了20核心、28线程设计的酷睿i7-14700K。
在中端处理器的对比中,整体性能差距被拉的更大了。我们注意到锐龙5 9600X仅仅只是一颗6核心12线程的处理器,对比的酷睿i5-14600K则拥有多达14核心、20线程,但锐龙5 9600X的转码速度领先酷睿i5-14600K高达94%,在7-Zip文件压缩与解压缩测试中也有22%的领先幅度。同时在游戏F1 2023、《地平线:零之曙光》中也有高达20%以上的领先幅度,这意味着AMD处理器拥有远超对手的单核心性能,才会在核心数量差距较大的情况下有如此的性能表现。
针对游戏用户而言,AMD测试显示,锐龙9 9700X在游戏性能方面终于可以胜出初代使用3D V-Cache即3D堆叠缓存的处理器锐龙7 5800X3D了,整体胜出幅度约为12%。一般来说,3D V-Cache在游戏中拥有极为显著的优势,其作用机制依旧是降低冯诺依曼计算机架构固有的存储延迟,使得更多的游戏中产生的碎片数据可以被高速的3D V-Cache直接存放并命中,不需要再去内存中查询。不过锐龙9000系列桌面处理器通过改进IOD和CCD之间的通讯性能,降低内存到IOD的延迟等,再加上CCD微架构的提升,也能够实现等效的结果,还是相当令人兴奋的。
卓越能耗比:65W TDP也强悍在能耗比方面,由于桌面处理器的定位以高性能为主,因此无论是AMD还是英特尔,往往会给出超强的“X”、“K”、“KS”系列,然后再推出不带后缀同时降低功耗的产品。在这种情况下,普通用户最常接触到的桌面处理器的TDP功耗一般都在100W以上,英特尔部分产品甚至飙升至250W~300W左右,这个现象其实是不正常的。
就其本质,还是厂商之间的竞争使得处理器频率、电压设定偏离了“最佳能耗比区间”,导致功耗暴增,甚至带来了一系列由于高电压、高频率发生的不稳定事件。AMD在这方面表现一直都很克制,上代锐龙7000系列最高TDP就被限制在170W,本次由于新架构、新工艺等,整体性能功耗比又得到了大幅度提升,甚至直接推出了65W TDP的版本。
在这方面,AMD先介绍到通过提升能耗比实现了整体平台更低的功耗、更低温度的系统以及更安静的操作体验。
在处理器封装材料方面,通过使用热阻更低的材料,降低了15%的热阻,并带来了在相同TDP下7摄氏度的温度降低。
更具体来看的话,在相同的TDP或者更低的TDP下,锐龙9000相比锐龙7000,整体功耗更低,但性能提升在11%~22%之间,尤其是锐龙7和锐龙5,锐龙7 9700X和锐龙5 9600X的TDP功耗现在仅为65W,这也是数年来TDP功耗值最低的高性能处理器之一(不包含特殊的ECO版本处理器),要知道对应的英特尔处理器,哪怕是定位较低的酷睿i5-14600K TDP也有125W,其PL2最大功耗甚至高达181W。
超频更有趣:支持DDR5 8000、PBO更智能、新Curve Shaper更冷静针对桌面用户的处理器产品就不能不提超频了。这一次AMD给出了针对处理器和内存的超频新功能。
内存方面,AMD目前正式支持了DDR5-8000内存,并且支持新的内存优化和超频功能。所有AM5接口的主板都可以开启内存相关超频能力。针对企业级和追求稳定的用户,JEDEC内存规格支持DDR5-5600,相比前代也有一定提升。
在处理器超频方面,除了不锁倍频等优势外,AMD也优化了PBO超频。如果用户散热配置非常出色,优先考虑性能尤其是多线程性能的话,那么开启锐龙9000系列桌面处理器的PBO超频功能可以带来最多15%的性能提升。AMD提到,如果TDP较低,那么通过PBO能够得到的性能提升会比较明显,典型的就是TDP为65W的锐龙7 9700X,8核心16线程,默认频率为5.5GHz。PBO应该能让该处理器在高频率下稳定更长时间,或者达到更高的频率。我们也会针对此功能进行详细测试。
除了传统的PBO更新外,AMD还带来了Curve Optimizer(曲线优化器) 的更新版本,并新加入了Curve Shaper超频调整功能。Curve Optimizer用于通过调整处理器特定核心的AVFS曲线,简单来说通过降压超频从而获取更好的性能,目前已经支持锐龙9000系列桌面处理器。
后者Curve Shaper主要用于解决处理器在不同状态下的功耗、温度和频率等问题。Curve Shaper允许用户根据处理器最低频率、低频率、中等频率、高频率和超高频率五个工作状态,进行不同的偏移电压和频率设定,以确定处理器在游戏或者日常应用非满载情况下尽可能多的降低频率和功耗,以实现更高的性能功耗比。不过Curve Shaper调整相对较为复杂,需要更有经验的DIY玩家进行操作。
AMD 800系列芯片组:换不换主板全由你除了处理器之外,AMD本次也发布了新的800系列芯片组产品。原因自然不是处理器接口更换或者老主板不能使用新处理器这样的“借口”,而单纯就是产品规格更新换代,之前的600系主板也依旧可以使用Zen 5处理器。
根据AMD的介绍,AMD在平台稳定性上的表现非常出色,AMD 600系列芯片组依旧可以使用锐龙9000系列桌面处理器,甚至AMD之前宣称要到2027+年才更新接口,这意味着用户可以更加放心的购买AMD产品,毕竟后期换个处理器就可以实现全面升级,这可为用户大大节约了成本。
而最新的AMD 800系列芯片组。主要包含X870系列、B850以及B840。B850和B840发布,在很大程度上丰富了AMD主板中低端市场的产品,毕竟目前B650系列主板价格也比较贵,A620则较为弱势。从规格来看,支持PCIe 5.0、带宽为20Gbps的USB 3.2 Gen 2x2技术的AMD B850有望成为中端主流选择,而X870E和X870的优势则在于它们不仅支持PCIe 5.0显卡与SSD,还支持USB4技术,该技术基于雷电3协议规范,具备超大带宽(40Gbps)的数据传输能力,并支持和雷电3同等的视频拓展能力以及PD充电功能。
AI算力提升:AVX-512支持立大功最后再来看看锐龙9000系列桌面处理器在AI方面的支持。其主要内容是针对AVX-512以及VNNI等AI相关指令集的支持。
AMD提到,目前AM5平台可以实现针对多GPU和SSD的PCIe 5.0同步支持,这是竞争对手产品无法实现的。英特尔Z790平台的处理器只支持PCIe 5.0 x16以及PCIe 4.0 x4,因此SSD或者GPU并不能全部使用PCIe 5.0规格。在实际应用中,由于AI计算需要更多带宽,因此PCIe 5.0针对GPU和SSD的支持是必要的,AMD测试的数据显示,全面PCIe 5.0后,将带来大概100%的AI性能提升以及58%的SSD性能提升。
在AI计算方面,由于锐龙9000系列桌面处理器拥有AVX-512以及VNNI的支持,因此在处理器上运行Llama、Mistral大语言模型的话,相比英特尔产品可以有17%~20%的领先。值得注意的是,AMD并未使用目前最强的锐龙9 9950X,而是使用了12核心24线程的锐龙9 9900X对比英特尔酷睿i9-14900K,如果换用更强的处理器,整体性能应该还有提升空间。
以少胜多、锐龙9000系列桌面处理器值得期待好了,有关锐龙9000系列桌面处理器的简介就到此为止了。从本次AMD透露的内容、数据来看,我们认为最让人震撼的就是新一代Zen 5处理器可以以少胜多,12核心的处理器可以击败竞争对手24核心的产品,8核心的处理器就能超越对手20核心的产品,6核心处理器可以击败14核心的酷睿i5-14600K。当然事实是否如此呢?请大家继续关注《微型计算机》公众号,我们将在锐龙9000系列处理器上市时间,即7月31日左右公布我们的详细评测,敬请期待。