市场对幻方DeepSeekV3大模型的讨论

薄皮大馅西瓜 2024-12-30 11:31:50
市场对幻方DeepSeekV3大模型进行了讨论,甚至有人认为幻方能用极低的成本完成对大模型的训练,这证伪了算力的需求空间。 但这种观点其实是很片面的。 首先,Deep SeekV3并非通用大模型,多模态、通用大模型在训练上是不可能用这么低的算力实现的。 而未来大厂会搭建的一定是多模态通用大模型。这也是为什么国内大厂对算力动辄几百亿投资。 其次,幻方的算法很可能没计入数据清洗等成本,如果采用传统的统计方式,训练价格会相应的增加。 最后,周末上海出了建设算力集群的政策规划,计划到2025年建设超过100EFlops的算力, 换算下来约等于1000万张英伟达3060gpu。这个是最直接的证明。 不管技术上如何进步,未来对算力的巨大需求都是板上钉钉的。#DeepSeekV3
0 阅读:0
薄皮大馅西瓜

薄皮大馅西瓜

职场上的那些事~