DeepSeek-R1可能以成本引发了人工智能市场的震荡 中国公司DeepSe

睿诚评世界 2025-01-29 18:18:44

DeepSeek-R1可能以成本引发了人工智能市场的震荡 中国公司DeepSeek推出了R1模型,颠覆了人工智能市场。受芯片制造商英伟达近17%的损失影响,纳斯达克指数周一下跌了3%。与此同时发表的一篇研究论文称,DeepSeek在每次训练模型上的计算能力支出仅为600万美元,低于ChatGPT或谷歌的Gemini等流行应用的估计(并已得到部分证实)成本。尽管自1月20日上线以来,DeepSeek-R1在性能上赢得了与大型竞争对手相媲美的好成绩。高端计算机芯片,如英伟达生产的芯片,是开发和运行大型人工智能模型的核心,但这一新的发展表明,人工智能的高质量结果也可以用更少的预算、更少的芯片或不那么先进的芯片来实现。 与DeepSeek-R1相关的较低价格也可以在聊天机器人提供商DocsBot发布的定价信息中看到。商业上使用人工智能模型的价格通常被分解为token的使用(最小的人工智能模型处理单元,大约4个字符长)。根据DocsBot网站的数据,上传100万个tokens到DeepSeek-R1只需要55美分。根据最新数据,下载100万个token需要花费219美元。美国公司OpenAl推出的与R1最相似的人工智能机型是ChatGPT - o1 Mini,这是该公司最新款人工智能产品ChatGPT - o1 Mini的弱化版,仅能处理文本,而不是完整版的文本和图像。与DeepSeek-R1一样,ChatGPT - o1 Mini能够使用124,000个标记作为对话的上下文(在忘记最早的提示之前)。DeepSeek的程序可以在单个请求中输出32,000个token,而ChatGPT- o1 Mini最多可以输出65,500个token。然而,这两个程序在测试学科知识、理解、推理能力、准确性和一致性的一系列行业基准测试中获得的分数是相当的,DeepSeek-R1甚至略微超过了它的竞争对手。 埃隆·马斯克的xAl公司的人工智能模型Grok也拥有更大的输出窗口(每个请求128,000个token),并且支持文本和图像,但与R1相比,它在基准测试中的表现也略差。在商业使用场景中,这两种美国型号都比R1贵得多,100万token输入的成本为3- 5美元,100万token输出的成本为12- 15美元。 谷歌的Gemini和亚马逊的Nova  AI比OpenAi和xAl的产品便宜,但仍比R1略贵。然而,它们只能部分地与列表中的其他程序相媲美,因为它们是为处理多媒体格式的输入而开发的,因此具有更大的输入窗口(而具有更小的输出窗口-可能是因为它们是为客户和搜索支持功能量身定制的,而不是其他模型采用的更广泛的LLM方法)。在性能测试中,这些模型的性能再次与DeepSeek-R1相似。最后,一个基于开源技术的更便宜的选择是英伟达的Llama 3.1 Nemotron 70B指令。纯文本模型使用Meta的Llama AI,在用户和性能测试中都得到了很好的评价。

0 阅读:0
睿诚评世界

睿诚评世界

感谢大家的关注