美光宣布提供GDDR7样品,将用于下一代GPU

袁遗说科技 2024-06-06 19:43:01

本文由半导体产业纵横(ID:ICVIEWS)综合

GDDR与HBM双管齐下,AI GPU动力十足。

美光宣布,推出业界最高比特密度的下一代GDDR7显存芯片样品,将为人工智能(AI)和游戏GPU提供更高水平的图形性能。美光表示,新款GDDR7提供了更高的性能,吞吐量提升了33%,响应时间缩短了20%,非常适用于当下流行的生成式AI工作负载。与现有的GDDR6和GDDR6X相比,在FHD、2K和4K分辨率下,使用GDDR7的显卡预计能将帧数提高30%以上。

与GDDR6使用的NRZ/PAM2或英伟达和美光合作共同开发的GDDT6X使用的PAM4信号编码机制不同,GDDR7采用的是PAM3信号编码机制。NRZ/PAM2每周期提供1位的数据传输,PAM4每周期提供2位的数据传输,而PAM3每两个周期的数据传输为3位。

美光的GDDR7采用了1β(1-beta)工艺打造,功耗方面也做了优化设计,并带有4个独立通道,速率达到了32Gbps,提供了超过1.5TB/s的系统带宽。与GDDR6相比,GDDR7的能效提高了50%以上,带宽高出了60%,而且有着更好的散热效果,并延长了电池续航时间,引入新的休眠功能则将待机功耗降低了70%。

美光表示,GDDR7芯片将从2024下半年开始供货。

配备GDDR7内存的下一代GPU或将在年底上市

三星和SK海力士在 GTC 2024 上展示了他们即将推出的 GDDR7 内存解决方案。

SK海力士和三星都展示了16Gb(2GB)产品。16Gb芯片正在生产中,可能在今年年底前出现在出货产品中。24Gb(3GB) 芯片不会出现在最初的量产中,很可能会在2025年出现。

这是有道理的,因为在 GTC 2024 上也有传言称,消费者 Blackwell GPU 可能会在今年年底前开始发货。

从历史上看,在10~12月的时间范围内看到“RTX 5090”Blackwell 卡是完全有意义的。英伟达在为新的GPU架构提供两年的节奏方面一直做得很好,可以追溯到10年前。Maxwell GTX 900 系列于 2014 年 9 月推出,Pascal GTX 10 系列于 2016 年 5 月推出,Turing RTX 20 系列于 2018 年 9 月推出。然后在 2020 年 9 月推出了 Ampere 和 RTX 30 系列——正好赶上加密货币激增——最后是 Ada Lovelace 和 RTX 40 系列于 2022 年 10 月~11月推出。

关于Blackwell消费级GPU是否会在2024年上市一直存在疑问,而RTX 40系列超级更新的推出相对较晚,至少暗示了下一代的潜在推动力。但是,我在GTC上采访过的一些人说,超级卡“迟到了”, Blackwell消费部件可能不会受到影响。所以,RTX 50 系列将于 2024 年底推出?在GTC上看到的情况之后,包括大规模的 Blackwell B200 展示之后,这似乎越来越有可能。

目前,Blackwell GPU 传闻表明,顶级消费型号 GB202 将配备 512 位内存接口,而降压版 GB203 将仅配备 256 位接口。在看到 GB200 通过 NV-HBI(英伟达高带宽接口)链接的双芯片解决方案后,我们认为这至少有可能用于消费类芯片。想象一下,如果 GB202 只是两个 GB203 芯片,那么这将解释内存总线宽度翻倍的原因。否则,另一个 384 位接口似乎更有意义。

除此之外,还有其它影响。16Gb GDDR7 芯片基本准备就绪,将于今年晚些时候批量出货......正好赶上 512 位内存接口。16个芯片协同工作将产生32GB的VRAM,对于未来的“RTX 5090”来说,这似乎是一个非常明智的配置。但是,“RTX 5080”的256位接口的升级就不那么令人印象深刻了。

使用相同的 16Gb GDDR7 芯片将在第二层 GPU 上为我们提供 16GB 的 VRAM。对于目前除AI之外的大多数工作负载来说,这当然是足够的,但AMD已经出货16GB显卡4年了。另一种方法是等待 24Gb GDDR7 设备可用,这意味着 24 位接口上的 256GB。我们更喜欢它而不是另一张 16GB 卡,但我们必须看看事情如何发展。

如果我们已经有了需要 12GB 的游戏,那么开始发布更多超过 12GB 的主流GPU才有意义。AMD 的 RX 7800 XT 和 RX 7900 GRE 都有 16GB,价格约为500~550美元,而英伟达的 RTX 4070 和 RTX 4070 Super 只有 12GB,因为它们使用 192 位内存接口。但是,如果英伟达等待 24Gb GDDR7,同样的 192 位接口可以轻松提供 18GB 的总 VRAM——在 PCB 两侧都有芯片的翻盖模式下,这个数字翻了一番。

更关键的是,24Gb GDDR7意味着更窄的128位接口——这一直是RTX 4060 Ti和RTX 4060的一个严重问题——不会是一个大问题。这些仍然能够提供 12GB 内存,每个 32 位通道一个设备,因此不需要消费级 RTX 4060 Ti 16GB。当然,同样的数学也适用于AMD,未来升级的RX 7600级GPU将获得12GB。

这不仅仅是关于内存容量,尽管这当然很重要。三星称,GDDR7 的速度将高达 32 Gbps,而SK海力士表示,它将提供高达40 Gbps的GDDR7芯片。即使我们坚持使用较低的数字,每台设备为128 GB/s,128 位接口为 512 GB/s,192 位接口为 768 GB/s。两者都将大幅增加内存带宽,这将解决我们对当前一代较低层GPU的第二个担忧。40 Gbps GDDR7 将使 128 位接口达到 640 GB/s,将 192 位总线提高到 800 GB/s,尽管我们怀疑最早要到 2025 年底才能在消费级 GPU 中看到这样的配置。

*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。

0 阅读:15