AI应用遍地开花,AI应用该如何选择显卡?

微型计算机 2024-04-19 10:02:52

在我们分析了显卡市场情况、游戏显卡的选择之后,也需要为目前热门的AI进行分析和推荐。那么,对AI应用用户来说,如何选择显卡呢?怎样的显卡更适合AI计算用户的需求呢?

随着GPU和AI行业发展关系越来越近,有关AI计算的用户也逐渐增多,无论是AIGC相关的内容生成用户,还是AI大模型本地支持等,都需要显卡的介入。那么,AI应用、AI计算如何选择显卡呢?选择这类应用的显卡,关注的点应该放在哪里呢?

AI应用:软件支持更重要

AI应用目前的情况来看,多数是依靠之前的训练完成的大模型,进行优化、包装后再推出的应用产物。比如著名的Stable Diffusion,其原版需要自行创建运行环境,打包运行库等。但是也有很多厂商、爱好者等基于训练成熟的模型,再度进行二次创作,比如打包所有运行环境、简化安装步骤等,使得用户可以做到随用随装。但是无论如何,大模型本质上依旧需要自己完整的应用环境,这一点是不可避免的。

在这种情况下,如果要选择显卡,那么首先需要选择在软件支持上更为成熟、稳定的产品,毕竟AI应用或者软件的用户一般都会用于生产力创作而不是单纯娱乐。在软件环境方面,英伟达有非常成熟的CUDA以及一系列AI相关软件、加速库的支持,并且基本上已经形成了业内标准、闭环运行等,整体稳定性和可靠性非常出色,是目前最值得选择的AI应用显卡GPU品牌。

▲CUDA目前已经成为英伟达最大的护城河,也是英伟达在AI上最核心的竞争力。

其次还有AMD和英特尔等厂商,也在AI方面做了很多努力。比如英特尔目前在OneAPI方面投入了很多资源,因此在很多AI应用中表现也开始展露出独特的优势。AMD主要是ROCm软件,不过目前针对Radeon Pro系列支持更为出色一些,在日常使用领域支持尚可,依旧需要时间优化。

▲AMD也在大力构建自己的AI软件支持生态圈,ROCm 6.1带来了诸多创新功能。

因此,对绝大部分用户来说,AI计算的需求还是考虑英伟达RTX 40系列甚至RTX 30系列会更为友好,对一些专业用户或者有特殊要求的用户来说,采购AMD的Radeon或者英特尔ARC系列也未尝不可,但可能需要比较强的动手能力。

显卡选择:算力、显存缺一不可

在AI应用显卡选择上,算力和显存两个因素都很重要,缺一不可。

先来看算力。这个大家都比较熟悉了,更高的算力意味着计算AI相关模型推理的时候,速度更快、效能更高。但是值得注意的是,硬件架构对应的软件支持在这里也有很重要的地位。比如英伟达的GPU在Stable Diffusion的应用中,专门推出了针对GPU Tensor Core加速的版本,整体效能又提升了不少。因此在算力选择上,一方面要看自己的实际需求,另一方面则是考虑技术持续进步的原因,尽量选择目前新一代的产品,比如有条件选择RTX 40系列,针对RTX 30系列的优先级可以适当降低,毕竟新技术、新架构才能发挥出更强的性能。

▲芯片更大,显然算力就更强,这一点无可厚非。

其次是显存。对显存来说,轻AI应用,比如典型的抠图、降噪等操作,对显存要求不高,一般显卡都可以满足需求。但是,针对大模型相关的应用,比如自然语言问答、文生图、图生图等应用,这些应用涉及大模型相关计算,有很多层、很多相关的零散数据以及新生成的数据都需要被临时存放,这些存放的地方就是显存。因此我们看到,在大模型计算方面,大显存的GPU相比小显存的GPU有非常强大的计算优势,尤其是数据量大、计算要求复杂的时候,这个优势会更为明显。一些实际测试中,以RTX 4060Ti为例,8GB的版本在AI相关性能上只有16GB版本产品的1/2~1/3,甚至更低。

▲显存容量和速度,成为显卡计算AI的瓶颈之一,在企业级产品上,人们使用的是HBM3这样的超高速、超高带宽显存。

因此,上述两个因素基本上决定了我们将如何选择AI显卡,我们也将目前比较合适用作AI的显卡列举如下:

首先顶级市场,如果有条件并且对算力需求很高的话,PCIe版本的H100、H800等产品肯定是最佳选择,个人用户可以考虑RTX 4090或者RTX 4090 D,也可以带来极为出色的算力表现。

▲显存更大的确运行速度快太多,这里面涉及数据存储、耦合等多种原因。

对高端市场用户而言,RTX 4080 SUPER、RTX 4070Ti SUPER以及RTX 4080整体性能应该在伯仲之间,16G显存的这三款产品对高端用户来说也基本可以满足需求。

接下来是中高端市场,其实目前中端市场主要以RTX 4070 SUPER和RTX 4070为主,从规格来看,两款显卡显存一样,只是流处理器存在差异,性能和价格严谨对位,用户可以根据预算自行选择。

在主流的中端市场,目前针对AI应用,最推荐的应该是16GB显存的RTX 4060 Ti显卡,更大的显存在大量AI推理中带来了远超8GB显存版本显卡的性能和实际表现,值得推荐。

在入门级市场,目前只有选择RTX 3060系列。部分千元级入门用户也可以尝试选择英特尔ARC A750、A580系列显卡,目前英特尔在AI相关API和软件方面还是下了不少功夫,基本的文生图、图生图等AI工作还是可以满足的。

▲英特尔ARC目前也在大幅度加强AI计算能力,比如增加更多数据格式,为更多模型引擎优化等。

在梳理完成上述信息后,接下来就是针对AI应用的显卡推荐了。

索泰RTX 4090D TRINITY 24G

芯片:RTX 4090 D流处理器数量:14592核心频率:2280~2520MHz显存配置:384bit 24GB GDDR6X参考售价:13999元

点评:这款RTX 4090 D整体外观设计非常独特,圆润的曲面造型让人一眼难忘。在用料和供电方面,24+4相供电和高品质元器件、扎实的做工以及规模巨大、效果出色的散热模块、RGB灯效,都彰显了这款显卡的不凡。

影驰RTX 4070Ti SUPER大将OC

芯片:RTX 4070 Ti SUPER流处理器数量:10240核心频率:2295~2595MHz显存配置:256bit 16GB GDDR6X参考售价:6499元

点评:作为一款AI应用的显卡,显存必须放在优先级很高的位置。整个RTX 40系列显卡中,RTX 4070Ti SUPER显存配备了16GB容量,同时维持了较高的算力。影驰这款显卡整体用料做工都表现出色,很值得用户选择。

技嘉RTX 4060Ti WF OC 16GB

芯片:RTX 4060 Ti流处理器数量:4325核心频率:2310~2565MHz显存配置:128bit 16GB GDDR6X参考售价:3599元

点评:RTX 4060 Ti 16GB是整个RTX 40系16G显存显卡中最便宜的一款,被很多入门AI用户选择。技嘉这款显卡采用了双风扇设计,小巧玲珑,搭配风之力散热、强化金属背板,带来了不错的使用体验。

0 阅读:11