DeepSeek-R1可能以成本引发了人工智能市场的震荡中国公司DeepSe

DeepSeek-R1可能以成本引发了人工智能市场的震荡中国公司DeepSeek推出了R1模型，颠覆了人工智能市场。受芯片制造商英伟达近17%的损失影响，纳斯达克指数周一下跌了3%。与此同时发表的一篇研究论文称，DeepSeek在每次训练模型上的计算能力支出仅为600万美元，低于ChatGPT或谷歌的Gemini等流行应用的估计（并已得到部分证实）成本。尽管自1月20日上线以来，DeepSeek-R1在性能上赢得了与大型竞争对手相媲美的好成绩。高端计算机芯片，如英伟达生产的芯片，是开发和运行大型人工智能模型的核心，但这一新的发展表明，人工智能的高质量结果也可以用更少的预算、更少的芯片或不那么先进的芯片来实现。与DeepSeek-R1相关的较低价格也可以在聊天机器人提供商DocsBot发布的定价信息中看到。商业上使用人工智能模型的价格通常被分解为token的使用（最小的人工智能模型处理单元，大约4个字符长）。根据DocsBot网站的数据，上传100万个tokens到DeepSeek-R1只需要55美分。根据最新数据，下载100万个token需要花费219美元。美国公司OpenAl推出的与R1最相似的人工智能机型是ChatGPT - o1 Mini，这是该公司最新款人工智能产品ChatGPT - o1 Mini的弱化版，仅能处理文本，而不是完整版的文本和图像。与DeepSeek-R1一样，ChatGPT - o1 Mini能够使用124,000个标记作为对话的上下文（在忘记最早的提示之前）。DeepSeek的程序可以在单个请求中输出32,000个token，而ChatGPT- o1 Mini最多可以输出65,500个token。然而，这两个程序在测试学科知识、理解、推理能力、准确性和一致性的一系列行业基准测试中获得的分数是相当的，DeepSeek-R1甚至略微超过了它的竞争对手。埃隆·马斯克的xAl公司的人工智能模型Grok也拥有更大的输出窗口（每个请求128,000个token），并且支持文本和图像，但与R1相比，它在基准测试中的表现也略差。在商业使用场景中，这两种美国型号都比R1贵得多，100万token输入的成本为3- 5美元，100万token输出的成本为12- 15美元。谷歌的Gemini和亚马逊的Nova AI比OpenAi和xAl的产品便宜，但仍比R1略贵。然而，它们只能部分地与列表中的其他程序相媲美，因为它们是为处理多媒体格式的输入而开发的，因此具有更大的输入窗口（而具有更小的输出窗口-可能是因为它们是为客户和搜索支持功能量身定制的，而不是其他模型采用的更广泛的LLM方法）。在性能测试中，这些模型的性能再次与DeepSeek-R1相似。最后，一个基于开源技术的更便宜的选择是英伟达的Llama 3.1 Nemotron 70B指令。纯文本模型使用Meta的Llama AI，在用户和性能测试中都得到了很好的评价。

0 阅读：0

DeepSeek-R1可能以成本引发了人工智能市场的震荡 中国公司DeepSe

DeepSeek-R1可能以成本引发了人工智能市场的震荡中国公司DeepSe