DeepSeek最近发了一篇文章,叫《DeepSeek-V3/R1推理系统概览》,这里面有很多重要信息:
1,DeepSeek的成本和赚钱情况。
DeepSeek一天的总成本大概是87072美元。要是按照DeepSeek R1的定价来算,所有业务都满打满算的话,一天理论上能赚562027美元,利润率高达545%。
DeepSeek的商业模式完全没有问题。
2,V3/R1推理系统,它的目标很明确,就是要让处理速度更快、延迟更低。
DeepSeek用了个超强的方法,叫大规模跨节点专家并行。这个方法就像把一个大任务拆分成好多小份,分给不同的“小助手”(GPU)去做。
3,DeepSeek是如何平衡训练和推理。
它用的是英伟达的H800 GPU,白天业务忙的时候,就把所有节点都用来做推理服务;晚上业务少了,就减少推理节点,把这些节点拿去做研究和训练。
OpenAI的模型收费一直挺贵的,像刚发布的GPT-4.5,API调用价格高得离谱,每100万tokens输入就要75美元,和DeepSeek的正常价格比起来,贵了280倍。
如果我们的国际环境更好,DeepSeek有实力替代ChatGPT。