DeepSeek何以震撼美国硅谷 DeepSeek训练成本仅为同性能模型10% 权威媒体分析认为,这家初创公司之所以在人工智能领域掀起了一场风暴至少有如下几个因素。
首先,由于美国禁止先进芯片出口中国,DeepSeek居然能够使用不那么先进的芯片做成据指几乎可与美国对手媲美的产品,尤其1月20号发布的DeepSeek-R1正式版,被指性能堪比OpenAI 01正式版,用华尔街日报的一句话说:“这让硅谷惊叹不已。” 根据一项热门排名,DeepSeek的AI模型在性能方面已跃居全球前十。
其次,DeepSeek开发成本远远低于同类美国高科技公司。2024 年 12 月底,这家小型初创公司 发布了一个模型,可与该行业中最好的模型相匹敌,然而成本极低。美国的 OpenAI 在 2024 年花费了 30 亿美元(28.5 亿欧元)来训练其各种模型,而 DeepSeek 声称自己只花了 600 万美元就开发出了自己的模型。
就效率而言,这一壮举不禁让人质疑美国制裁的局限性,因为制裁本应阻止中国人获得最先进的人工智能芯片,以确保美国在人工智能领域的主导地位。
然而,DeepSeek 声称只花了 560 万美元就开发出了自己的模型,与美国巨头数十亿美元的投资相比简直是小巫见大巫。
在业内专家看来,DeepSeek 的成功让人们对 “生成式人工智能需要巨额资金 ”这一观点产生了质疑。『麻省理工科技评论』称,出口限制正在推动中国初创企业 “以效率、资源共享和协作为重点 ”进行创新。
英伟达一位女发言人称,“DeepSeek 的工作说明了如何利用不同的技术,基于完全符合出口法规的广泛可用的模型和芯片,来创建新的模型”。
第三,开源。与 ChatGPT、Llama 和 Claude 等西方竞争对手一样,DeepSeek 依靠从大量文本中建立的大型语言模型(LLM)来掌握自然语言的微妙之处。但与这些开发专有模型的竞争对手不同, DeepSeek 是开源的。这意味着任何人都可以免费获取该应用程序的代码,从而了解其工作原理并对其进行修改;可自行下载与部署, 随时随地可用。