DeepSeek又更新了
DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑
这次更新突出特点是不要钱,直接开源扔出权重,而且硬件要求很低,不需要很贵的GPU就能部署。
性能方面,它在数学和编程能力相比上个版本进步很大。
需要注意,这次是deepseek-V3的改进V3-0324,是“非推理模型”,基础能力进步了,估计又有不小的数据结构和算法优化。而后面应该会有基于它,再加上强化学习,提升复杂任务思考推理能力,做出deepseek-R1的后续版本R2。
直接效果就是美国闭源模型压力很大。