黄仁勋公布英伟达未来三年路线图

袁遗说科技 2024-06-04 19:18:57

6月2日晚,黄仁勋在2024中国台湾国际电脑展上宣布,英伟达(Nvidia)将打破摩尔定律,计划每年更新一次GPU,并披露未来三代数据中心半导体技术路线图。

此外,黄仁勋宣布,去年发布的Blackwell芯片现在开始投产,2025年将推出Blackwell Ultra,而下一代 AI 芯片架构平台名为Rubin,采用HBM4芯片,预计将于2026年推出。

Rubin 芯片系列将包括新的 GPU、CPU 和网络处理器。名为 Versa 的新 CPU 将用于提高 AI 功能。GPU 对 AI 应用至关重要,它将使用 SK Hynix、Micron 和三星等行业巨头的下一代高带宽内存。尽管人们对 Rubin 平台的推出感到兴奋,但黄仁勋只透露了有关该平台具体功能和能力的有限信息。

同时,黄仁勋还宣布推出推理模型微服务NVIDIA NIM,以部署在云、数据中心或工作站上,并且开发者能够轻松地为Copilot、ChatGPT等构建生成式 AI 应用,所需时间从数周缩短至几分钟。另外,英伟达面向GeForce RTX AI电脑平台推出AI助理,为数字人推出G-Assist和NVIDIA ACE(数字人技术) NIMs,以及为微软Windows Copilot Runtime推出用于RTX加速API的小语言模型(SLM)等等。

“今天,我们正处于计算领域重大转变的风口浪尖。AI 和加速计算的交汇将重新定义未来。”黄仁勋强调,未来,全球AI产业规模将高达100万亿美金,比之前IT时代的3万亿美元高出33万倍以上,具有强大的市场前景。黄仁勋引领的新一轮以 AI 为核心的产业革命已经开始。从CUDA软件到GPU硬件,英伟达正“加速一切”。

消费者创新:个人电脑和游戏上的人工智能

Nvidia 自 2018 年推出首款为 AI 打造的消费级图形处理器GeForce RTX以来,一直是个人电脑AI 领域的先驱。这项创新包括深度学习超级采样 (DLSS),它通过使用 AI 生成像素和帧来显著提升游戏性能。从那时起,Nvidia 已将其 AI 应用扩展到内容创作、视频会议、直播、流媒体视频消费和生产力等各个领域。

如今,Nvidia 在新兴的生成式 AI 用例中处于领先地位,拥有 500 多个由 RTX GPU 加速的 AI 应用和游戏。在中国台湾国际电脑展上,Nvidia 宣布了华硕和MSI等主要制造商推出的新款 GeForce RTX AI 笔记本电脑。这些笔记本电脑将配备先进的 AI 硬件和 Copilot 功能,支持支持 AI 的应用和游戏。

这些笔记本电脑利用最新的 Nvidia AI 库和 SDK,针对 AI 推理、训练、游戏、3D 渲染和视频处理进行了优化。与 Mac 相比,它们的稳定扩散速度提高了 7 倍,大型语言模型推理速度提高了 10 倍,标志着性能和效率的显著飞跃。

Nvidia 还推出了RTX AI 工具包,帮助开发人员在 Windows 应用程序中定制、优化和部署 AI 功能。它包括用于微调预训练模型、针对各种硬件对其进行优化以及将其部署用于本地和云推理的工具。据 Nvidia AI PC 产品总监 Jesse Clayton 介绍,AI 推理管理器将允许开发人员将混合 AI 功能集成到应用程序中,根据系统配置在本地和云推理之间做出决策。

“我们认为个人电脑上的人工智能是技术史上最重要的发展之一,”Clayton说。“人工智能正被融入到每一个主要应用程序中,它将影响几乎每一个个人电脑用户。”

在游戏领域,AI 被广泛用于通过 DLSS 渲染环境并增强非玩家角色或 NPC。Project G-Assist的推出将帮助开发人员为游戏创建 AI 助手。G-Assist 通过提供对游戏内查询的情境感知响应、在游戏过程中跟踪系统性能以及优化系统设置来增强游戏玩家体验。

此外,微软和 Nvidia 正在合作,使开发人员能够创建具有 AI 功能的 Windows 原生和 Web 应用程序。此次合作将于今年晚些时候在开发者预览版中推出,它将允许 API 访问 GPU 加速的小型语言模型 (SLM) 以及作为 Windows Copilot Runtime 的一部分在设备上运行的检索增强型 RAG 生成功能。SLM 为从事内容摘要、内容生成、任务自动化等工作的 Windows 开发人员打开了大门。

加速计算:Blackwell 平台和 AI 工厂

Gen AI 正在推动一场新的工业革命,将数据中心从成本中心转变为 AI 工厂。这些数据中心利用加速计算来处理大型数据集并开发 AI 模型和应用程序。Nvidia 于今年早些时候宣布推出Blackwell 平台,在 AI 性能和效率方面取得了重大飞跃。Blackwell 的性能比八年前发布的 Pascal 平台高出 1,000 倍。

Nvidia 的 AI 能力不仅限于芯片级的进步。Nvidia 不断在数据中心的各个层面进行创新,以改进 AI 工厂。Nvidia 的MGX平台为从远程可视化到边缘超级计算等多种用例的加速计算提供了模块化参考设计。

该平台支持多代硬件,确保与 Blackwell 等新加速架构兼容。据 Nvidia 加速计算总监 Dion Harris 介绍,MGX 平台的采用率大幅提升,合作伙伴数量从 6 家增加到 25 家。

Nvidia 宣布推出 GB200 NVL2 平台,旨在为每个数据中心带来生成式 AI 功能。该平台在单个节点中提供 40 petaflops 的 AI 性能、144 个 Arm Neoverse CPU 核心和 1.3 TB 的快速内存。与传统 CPU 系统相比,它显著提高了 LLM 和数据处理任务的性能。GB200 NVL2 将数据处理速度提高了 18 倍,将矢量数据库搜索查询的性能提高了 9 倍。

Harris 表示:“我们的平台是一个真正的 AI 工厂,包含计算、网络和软件基础设施。与传统 CPU 系统相比,它显著提高了 LLM 和数据处理任务的性能。”

网络:用于 AI 的 Spectrum-X 以太网

Nvidia 的Spectrum-X是专为 AI 工厂设计的以太网网络。传统的以太网网络针对超大规模云数据中心进行了优化,但由于其服务器到服务器通信量极小且抖动容忍度高,因此不适合 AI。相比之下,AI 工厂需要对分布式计算的强大支持。

Spectrum-X 是 Nvidia 的端到端以太网解决方案,它利用网络接口卡 (NIC) 和交换机来优化 GPU 到 GPU 的连接。据 Nvidia 网络产品副总裁 Amit Katz 介绍,它显著提高了性能,提供了更高的带宽、更大的全到全带宽、更好的负载平衡和 1,000 倍更快的遥测速度,可实现实时 AI 应用程序优化。

“网络决定数据中心,”Katz 说。“Spectrum-X 是基于以太网的 AI 工厂的关键,而这仅仅是个开始。Spectrum-X 令人惊叹的一年路线图即将推出。”

Spectrum-X 已投入生产,越来越多的合作伙伴将其部署到全球的 AI 工厂和生成 AI 云中。合作伙伴正在将BlueField-3 SuperNIC 整合到他们的系统中,并将 Spectrum-X 作为 Nvidia 参考架构的一部分提供。在中国台湾国际电脑展上,Nvidia 将展示 Spectrum-X 支持跨行业 AI 基础设施和运营的能力。

企业计算:NIM 推理性能

Nvidia NIM是一组旨在运行新一代 AI 模型的微服务,专门用于推理任务。NIM 现已向所有开发人员开放,包括现有开发人员、企业开发人员和 AI 新手。

开发人员可以从 Nvidia 的门户或流行的模型存储库访问 NIM(以标准 Docker 容器的形式提供)。Nvidia 计划通过其 Nvidia开发者计划为开发人员提供免费的 NIM 访问权限,供其进行研究、开发和测试。NIM 与不同的工具和框架集成,无论开发环境如何,都可以访问它。

Nvidia 企业计算副总裁 Manuvir Das 表示:“这意味着人工智能现在不必局限于了解数据科学的人。任何人工智能开发人员、任何新的企业开发人员都可以专注于构建应用程序代码。NIM 负责处理底层的所有管道。”

NIM 解决了两个主要挑战:优化模型性能和简化开发人员部署。它包含 Nvidia 的运行时库,以最大限度地提高模型执行速度,与现成的模型相比,吞吐量提高了三倍。这一改进可以更有效地利用 AI 基础设施,在更短的时间内产生更多的产出。据 Das 介绍,NIM 通过将设置和优化模型所需的时间从几周缩短到几分钟来简化部署。

NIM 的推出标志着一个重要的里程碑,超过 150 个合作伙伴将其集成到他们的工具中。Nvidia 通过其开发者计划免费提供 NIM 访问权限。对于企业生产部署,Nvidia AI Enterprise 许可证的价格为每 GPU 每年 4,500 美元。

工业数字化:Omniverse 和机器人技术

由于人工智能和数字孪生技术的进步,制造业正在经历工业数字化。在过去十年中,Nvidia 开发了Omniverse平台,该公司声称该平台已达到工业数字化的临界点。Omniverse 与西门子和罗克韦尔等关键工业技术相连接,提供模拟、用于人工智能训练的合成数据生成和高保真可视化等功能。

Nvidia 在人工智能和机器人领域采用了三台计算机的解决方案:一台用于在数据中心创建模型的人工智能超级计算机、一台用于机器人实时传感器处理的运行时计算机,以及一台用于数字孪生模拟的 Omniverse 计算机。这种设置允许对人工智能模型和机器人系统进行广泛的虚拟测试和优化。

Nvidia 机器人和边缘计算副总裁 Deepu Talla 表示:“在现实世界中训练和测试机器人是一个极具挑战性的问题。它成本高昂、不安全且耗时。我们可以拥有数十万甚至数百万个机器人来模拟数字孪生。许多这种人工智能功能可以在带入现实世界之前在模拟中测试。”

在中国台湾国际电脑展上,Nvidia 展示了富士康、台达、和硕和纬创等领先电子制造商如何采用 AI 和 Omniverse 实现工厂数字化。这些公司使用数字孪生来优化工厂布局、测试机器人并提高工人安全。Nvidia 还将展示西门子、Intrinsic 和 Vention 等公司如何使用其 Isaac 平台来制造机器人。

0 阅读:4