Arm发布全新终端计算子系统:优化人工智能体验,打造最高性能终端AI应用体验

鱼云 2024-11-26 12:03:22

软硬件技术的快速发展正在推动人工智能从数据中心/云端走向终端设备。如今,在手机、电脑等设备上运行AI已成为未来趋势。 Arm终端事业部产品管理副总裁James在近日接受记者采访时指出,过去一年来人工智能(AI)技术给移动设备带来的变化是惊人的。我们正在见证从手机到笔记本电脑的人工智能领域的重大创新,从而催生了人工智能智能手机和人工智能个人电脑的诞生。

James表示,设备端AI再次重新定义了智能手机的“智能”,而Arm是这一切的基石。发布会上,Arm发布了最新的终端计算子系统(CSS),该子系统采用最新的Armv9.2 CPU、Arm™ GPU、基于3nm工艺的可量产CPU和GPU物理实现,以及最新的™系统互连和系统内存管理单元(SMMU)。

此外,为了使开发者能够以最高性能快速实现AI创新,Arm还推出了为开发者量身定制的软件,包括针对AI工作负载和计算机视觉应用的软件。

CPU/GPU性能大幅提升

从数据中心/云到终端设备,边缘AI对终端设备的计算性能提出了更高的要求。 James 认为,AI 时代正在加速发展,复杂性不断增加,计算需求呈指数级增长。为此,Arm不断听取合作伙伴的意见,不断迭代更新我们的产品和解决方案,利用好最新的工艺节点,提供一个可以为实现设备端AI奠定基础的平台。

据介绍,Arm终端CSS是迄今为止最快的Arm计算平台。数据显示,Arm 终端 CSS 将计算和图形性能提高了 30% 以上,以应对要求严格的实际用例中的 工作负载,同时还将 AI 推理速度提高了 59%,适用于更广泛的 AI/机器学习 (ML) 和计算视觉工作负载。

Arm终端CSS的关键在于Arm目前最强大、最高效、最通用的CPU集群,提供最佳的性能和能效。 James强调,自2021年推出专为性能和AI设计的Armv9架构以来,性能得到显着提升,包括:提高矢量加速和机器学习(ML)等领域的计算能力;增强系统的安全性和稳健性;更重要的是,增加了面向AI的功能。

此次推出的全新Arm®-X925取得了自-X系列推出以来最高的同比性能提升。 CPU采用领先的三纳米工艺节点,主频3.8GHz,最大缓存大小,与2023年旗舰智能手机的四纳米SoC相比,单线程性能显着提升36%。在AI性能方面,-X925实现了41%的性能提升,可显着提升大型语言模型(LLM)等设备端生成式AI的响应能力。

此外,全新Arm-A725 CPU将对尖端性能的不懈追求与卓越的效率相结合。该 CPU 将 AI 和移动游戏用例的性能效率提高了 35%。这一改进还受益于更新的 Arm-A520 CPU 和更新的 DSU-120,允许使用最新 Armv9 CPU 集群的消费电子设备提高能源效率和可扩展性。

除了性能提升之外,Arm还更加注重数据安全能力。据了解,Arm提供的内存标签扩展(MTE)可以帮助开发者在不进行侵入式检测的情况下发现并修复代码中的错误,也可以用来减少实际运行环境中安全漏洞的利用。目前,vivo X100、X100 Pro以及Pixel 8旗舰机现已允许用户启用MTE。

除了提升CPU性能之外,Arm还特别注重提升GPU性能。为此,Arm发布了Arm-G925 GPU,这是迄今为止最强大、最高效的GPU。数据显示,Arm-G925 GPU在各种领先的移动游戏应用中实现了37%的性能提升,在多个AI和ML网络上实现了34%的性能提升。 -G925面向旗舰智能手机市场,而新的高度可扩展GPU系列,包括Arm Mali™-G725和Mali-G625 GPU,面向从高端手机到智能手表和XR可穿戴设备市场的广泛消费电子设备。

“-G925是Arm第三代具有光线追踪技术的GPU。随着这一功能在市场上的推广,Arm一直致力于让开发者尽可能轻松地在移动设备上实现游戏主机级别的内容。” James 表示:“我们正在与 Epic Games 合作,确保他们的桌面平台渲染器在我们的 GPU 上快速高效地运行。今年,我们将继续开展全球开发者教育工作,以确保游戏开发者能够重现一些最佳示例。 ”

为开发者量身定制

在上周的发布会上,除了新的CPU和GPU之外,Arm还带来了为开发量身定制的开发软件,即。

詹姆斯告诉记者,“”,在希腊语中是“钥匙”的意思。它将帮助软件开发人员无缝地释放 Arm CPU 的最佳性能,包括人工智能工作负载和计算机视觉应用程序。

它是一套面向AI框架开发者的计算核心,使他们能够轻松地在各种设备上获得Arm CPU上的最佳性能,并支持Neon™、SVE2和SME2等关键的Arm架构功能。与 、 、 、 等流行的AI框架集成,旨在加速Meta Llama 3和Phi-3等关键模型的性能,并且还向后和向前兼容,以确保Arm在引进更多技术。

计算机视觉和人工智能紧密相连,让相机管线不仅可以运行神经网络,还可以运行传统的计算机视觉算法,保证相机或社交媒体应用的顺利运行。 James表示,当Arm集成到常用库中时,性能将会得到显着提升。今年,Arm 还与 .ai 合作,让 开发者能够更轻松地将其融入到自己的项目中,并从其带来的改进中受益。

“我们的最终目标是让我们的合作伙伴和生态系统能够继续创新、差异化并更快地进入市场。 Arm终端CSS通过物理实现和持续的“软件优化将彻底改变开发者和消费者的体验”,带来了Armv9.2的能效优势。 James表示,Arm多年来投入巨资,让人们全天享受更加身临其境的体验。但这一切正在改变,人工智能也正在向另一个方向突破计算的极限,创造大量新的应用。

0 阅读:10