英伟达Blackwell再传过热问题

袁遗说科技 2024-11-18 20:35:13

本文由半导体产业纵横(ID:ICVIEWS)综合

英伟达重新设计 NVL72 服务器以解决过热问题。

据The Information报道,英伟达的下一代 Blackwell 处理器在安装在高容量服务器机架时面临着过热的重大挑战 。据报道,这些问题导致了设计变更和延迟,并引起了Google、Meta 和Microsoft等客户的担忧,他们担心自己是否能按时部署 Blackwell 服务器。

据知情人士向The Information透露,英伟达用于 AI 和 HPC 的 Blackwell GPU 在装有 72 个处理器的服务器中使用时会过热。这些机器预计每机架功耗高达 120kW。这些问题导致 英伟达多次重新评估其服务器机架的设计,因为过热会限制 GPU 性能并有损坏组件的风险。据报道,客户担心这些挫折可能会阻碍他们在数据中心部署新处理器的时间表。

据报道,英伟达已指示其供应商对机架进行几项设计更改,以解决过热问题。该公司与供应商和合作伙伴密切合作,开发工程修订版以改善服务器冷却。虽然这些调整对于如此大规模的技术发布来说是标准做法,但它们仍然增加了延迟,进一步推迟了预期的发货日期。

“英伟达正在与领先的云服务提供商合作,这是我们工程团队和流程不可或缺的一部分。工程迭代是正常的,也是意料之中的。”该公司发言人在给媒体的一份声明中表示。

此前,由于该处理器的设计缺陷会影响产量, 英伟达不得不推迟 Blackwell 的生产 。英伟达的 Blackwell B100 和 B200 GPU 使用台积电的 CoWoS-L 封装技术连接两个芯片。该设计包括一个带有局部硅片互连 (LSI) 桥接器的 RDL 中介层,支持高达 10 TB/s 的数据传输速度。这些 LSI 桥接器的精确定位对于该技术按预期运行至关重要。

然而,GPU 芯片、LSI 桥接器、RDL 中介层和主板基板的热膨胀特性不匹配导致了翘曲和系统故障。为了解决这个问题,据报道 英伟达修改了 GPU 硅的顶部金属层和凸点结构,以提高生产可靠性。虽然 英伟达从未透露有关这些变化的具体细节,但它指出作为修复的一部分,新的掩模是必要的。

因此,Blackwell GPU 的最终版本直到 10 月下旬才开始量产,这意味着 英伟达将能够从 1 月下旬开始出货这些处理器。

英伟达的客户包括谷歌、Meta 和微软等科技巨头,他们使用 英伟达的 GPU 来训练其最强大的大型语言模型。Blackwell AI GPU 的延迟自然会影响 英伟达客户的计划和产品。

英伟达财报即将公布

英伟达将于本周三公布季度财报,届时该公司对截至明年1月财季的业绩展望或许不会让华尔街感到惊艳。但瑞穗(Mizuho)分析师认为,英伟达在明年晚些时候的前景依然光明。

英伟达近期一直是业绩超预期并上调展望的典型代表,但在该公司下周三公布财报时,这种情况会不会戛然而止?

一位分析师认为也许会,但接着英伟达可能会回到原来的状态。

虽然英伟达以发布乐观指引而闻名,但瑞穗分析师Vijay Rakesh认为,英伟达对截至明年1月财季的业绩展望可能或多或少会与分析师的预期相符。他对英伟达截至明年1月财季收入的最新预测为367亿美元,FactSet调查得出的市场平均预期为366亿美元。Rakesh表示,其他机构得出的市场平均预期与他预测的367亿美元持平。

Rakesh指出,买方投资者很可能预计英伟达该财季收入指引将在360亿至390亿美元之间。

FactSet的数据显示,英伟达在过去七份财报中发布的季度销售额指引均超出市场预期。不过,在最近一份财报中,英伟达给出的销售额预期与市场预期的差距是这段时间内最小的。

Rakesh预计,对截至明年1月财季的展望会符合预期,他的这一预测涉及到英伟达新Blackwell芯片相关时间安排。他认为爬坡将发生在当季末,这会限制Blackwell图形处理器(GPU)和系统所能带来的提振。

但瑞穗分析师Jordan Klein详细介绍了英伟达投资者对2025年的乐观预期;2025年大致对应英伟达从明年2月开始的2026财年。Klein认为,英伟达的业务增长料将在2026财年下半年加速,“得益于Blackwell芯片的大量订单以及被压抑需求的释放,这背后是英伟达的供应链能够大批量生产和交付全机架NVL72系统”。

Klein表示,投资者“超级看好”英伟达股票,押注今年晚些时候可能会有加速的业绩超预期和展望上调。

Klein指出:“大家都想要以做多和坚守来迎接这种提升。”他还称,投资者似乎也希望在明年3月份英伟达首席执行官黄仁勋(Jensen Huang)出席该公司年度GTC大会发表讲话时,听到有关英伟达下一代Rubin芯片以及“可能更多基于以太网的网络”的消息。

与此同时,花旗(Citi)分析师Christopher Danely称,在工业芯片和汽车芯片等领域持续面临挑战之际,人工智能(AI)是半导体行业的“亮点”。花旗目前预计,今年美国云服务提供商的资本支出将达到1,660亿美元,高于此前预期的1,550亿美元。Danely称,这对英伟达和其他AI芯片公司来说是个好兆头。

*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。

0 阅读:2