AI国产之光"DeepSeek"已经超越OpenAI

Tech食堂 2025-01-21 23:33:14

大家是否都还在用『文心一言』『豆包』『通义』『Kimi』等国产大厂的模型,甚至是手机自带的语音助手。然后一直到25年的今天他们依旧是比较笨,对上下文的理解也很不到位,对比ChatGPT则是差了十万八千里。

『大厂』们可能会狡辩说ChatGPT背靠国际大厂是花钱喂出来的性能,然而就是一款国产一个名不见经传的小公司开发的大模型确狠狠的将它们打脸了,它的总结分析能力、上下文理解能力几乎和ChatGPT相当。

DeepSeek V3 是2024年12月25日发布的,来自杭州的量化基金公司幻方量化。一经发布,它就引起了国际范围的轰动。 它在多个参数上,击败了 OpenAI 公司最新的 o1 模型。 目前,它在大模型排行榜上排名第7,要知道前十名里面,只有它是开源模型,而且是最少限制的 MIT 许可证,其他都是大公司的专有模型。

并且据采访报道,DeepSeek V3的训练成本不到600万美元,它的成本大概是Meta 公司的 Llama 3.1 405B 模型的11分之一

0 阅读:153