DeepSeek突围:用“小米加步枪”挑战ChatGPT的中国力量! 1月25日

语兰谈趣 2025-01-27 05:29:21

DeepSeek突围:用“小米加步枪”挑战ChatGPT的中国力量! 1月25日,全球芯片制造巨头AMD宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上。 此举被解读为DeepSeek的实力得到了全球顶尖企业的认可。 就在5天前,1月20日高层今年首场座谈会上,DeepSeek创始人梁文锋成为9位受邀发言的“座上宾”之一。 2023年7月,梁文锋创立了深度求索(DeepSeek),专注于AI大模型的研究和开发。 DeepSeek推出的DeepSeek V2模型,以其高性价比和创新的模型架构,引发了国内大模型价格战,被誉为“AI界的拼多多”。 DeepSeek提出的MLA(多头潜在注意力机制)架构和DeepSeekMoESparse结构,大幅降低了模型的计算量和显存占用,从而降低了推理成本。 据报道,DeepSeek的DeepSeek-V3模型训练成本仅为557.6万美元,而OpenAI训练ChatGPT-4所花费的成本高达7800万美元甚至1亿美元,双方的成本至少有10倍的差距。 在数学、代码能力和中文知识问答方面,DeepSeek-V3甚至超过了ChatGPT-4。

0 阅读:71
语兰谈趣

语兰谈趣

感谢大家的关注