市场对幻方DeepSeekV3大模型的讨论
薄皮大馅西瓜
2024-12-30 11:31:50
市场对幻方DeepSeekV3大模型进行了讨论,甚至有人认为幻方能用极低的成本完成对大模型的训练,这证伪了算力的需求空间。
但这种观点其实是很片面的。
首先,Deep SeekV3并非通用大模型,多模态、通用大模型在训练上是不可能用这么低的算力实现的。
而未来大厂会搭建的一定是多模态通用大模型。这也是为什么国内大厂对算力动辄几百亿投资。
其次,幻方的算法很可能没计入数据清洗等成本,如果采用传统的统计方式,训练价格会相应的增加。
最后,周末上海出了建设算力集群的政策规划,计划到2025年建设超过100EFlops的算力,
换算下来约等于1000万张英伟达3060gpu。这个是最直接的证明。
不管技术上如何进步,未来对算力的巨大需求都是板上钉钉的。#DeepSeekV3
0
阅读:0