Deepseek开源FlashMLA的意义。Deepseek本周密集开源多

薇菡谈军事 2025-02-24 18:14:47

Deepseek开源FlashMLA的意义。

Deepseek本周密集开源多项技术,第一天开源了FlashMLA,目前已经引起轰动,引起轰动的主要原因是把H800卡的性能做到英伟达官方给出的2-3倍,而一般来说H100的性能是H800的2倍,也就是说用H800干出了H100的性能。前一段时间Scale AI的创始人亚历山大·王(华裔)说Deepseek搞到了5万张H100卡才训练出Deepseek R1等,可以说他并不清楚Deepseek的具体工作才得出那样的结论。目前Deepseek开源了FlashMLA,可以说在一定程度上回答了亚历山大·王的疑问。

开源FlashMLA的意义非常重大,首先是相当于国内目前采购的H800的算力普遍提高2-3倍,相当于拿H800当H100用,这对未来的人工智能的发展和普及有很大的意义。

其次,开源FlashMLA后,相关技术也可以用在国产芯片上,有文章提到“当前国产GPU(如壁仞、摩尔线程)正试图兼容CUDA生态,但缺乏深度优化案例。FlashMLA的开源为国产GPU厂商提供了参考模板:若能针对国产芯片实现类似优化,或可打破英伟达的生态壁垒。”如果这个文章中提到的技术用在国产GPU上的说法是对的,那么可以预料国产芯片将会获得更大的发展空间,国产算力的实际发挥也能大大增强。

FlashMLA在大量释放GPU性能后,也会降低部署大模型部署成本,进而进一步推动大模型在各行各业的应用,进一步激发出更多创新应用的出现。

考虑到国内大量的工程人员,国内齐全的工业体系,大模型在各行各业的应用必然是加快的,这将使得中国在人工智能发展方面和美国竞争中出现你打你的,我打我的局面,而且“我打我的”涉及到点比“你打你的”更广,这会形成更多差异化竞争,美国所谓卡算力来影响中国人工智能的发展思路基本落空,而在各行各业竞争人工智能方面美国可能会落后于国内。

联想到几天前上海的GDC上Deepseek参与的闭门会议,再早是民营企业家会议,那么开源释放GPU的能力有可能是这些会议的结果,这个开源促进的发展能力在后续是有很大的意义的,以前认为部署Deepseek可能是亏本的生意有可能会赚钱,可以说:

人工智能发展竞争已经进入新的阶段。

期待Deepseek后续开源能够带来更多惊喜。

0 阅读:0
薇菡谈军事

薇菡谈军事

感谢大家的关注