【AI专家透露DeepSeek大热的真正原因】[只能说,美国AI从硬件到软

理性闲谈天下事 2025-02-15 00:26:40

【AI 专家透露 DeepSeek 大热的真正原因】

[只能说,美国AI从硬件到软件都在骗钱]

(CNN)DeepSeek 上个月让科技界大为震惊,而人工智能专家表示,这并非没有理由。他们认为,我们可能才刚刚看到这家中国科技初创公司在人工智能领域影响力的开始。

1 月底,DeepSeek 凭借其 R1 人工智能模型登上头条,该公司声称该模型能够在成本低得多的情况下大致匹配 Open AI 的 o1 模型的性能。随着 DeepSeek 短暂超越 ChatGPT 成为苹果应用商店中的头号应用,科技股应声下跌。

这一成就促使美国科技巨头质疑美国在人工智能领域与中国的竞争地位,以及背后的数十亿美元投入。尽管美国副总统 JD Vance 在周二巴黎举行的人工智能行动峰会上的讲话中没有提到 DeepSeek 或中国,但他肯定强调了美国在该领域保持领先地位的重要性。

“美国是人工智能领域的领导者,我们的政府计划保持这一地位,”他说,尽管他补充说“美国希望与其他国家合作”。

但 DeepSeek 的优势不仅仅在于其效率和强大功能。专家表示,DeepSeek R1 能够推理并“思考”答案以提供高质量结果的方式,以及该公司决定公开其部分关键技术,也将推动该领域的发展。

人工智能长期以来一直被用于科技产品,但在过去两年里,随着 ChatGPT 和其他生成式人工智能服务的兴起,它达到了一个临界点,这些服务改变了人们工作、交流和获取信息的方式。它让像芯片制造商英伟达这样的公司成为华尔街的宠儿,并改变了硅谷巨头的发展轨迹。因此,任何能够帮助构建更强大、更高效的模型的发展都肯定会受到密切关注。

“这绝对不是炒作,”艾伦人工智能研究所前首席执行官奥伦·埃齐奥尼说。“但同时,这是一个变化非常快的世界。”

——人工智能的“TikTok 时刻”

科技界领袖迅速对 DeepSeek 的崛起做出回应。谷歌 DeepMind 首席执行官德米斯·哈萨比斯称围绕 DeepSeek 的炒作是“夸大其词”,但也表示其模型是“我所见过的来自中国最好的作品”,据 CNBC 报道。

微软首席执行官萨提亚·纳德拉在 1 月份公司季度财报电话会议上表示,DeepSeek 有一些“真正的创新”,而苹果首席执行官蒂姆·库克在 iPhone 制造商的财报电话会议上表示,“推动效率的创新是好事”。

但并非所有关注都是积极的。半导体研究公司 SemiAnalysis 对 DeepSeek 声称其训练成本仅为 560 万美元的说法表示怀疑。据《金融时报》报道,OpenAI 表示发现证据表明 DeepSeek 使用了美国公司的模型来训练自己的竞争对手。

“我们注意到并正在审查有关 DeepSeek 可能不当提取我们模型的迹象,一旦有更多信息,我们将分享,”OpenAI 发言人在接受 CNN 采访时说。DeepSeek 未能立即回应评论请求。

据美联社和美国广播公司新闻报道,两名美国国会议员在安全研究人员强调其与中国政府的潜在联系后,呼吁将该应用程序从政府设备中禁用。类似的担忧也围绕着流行的社交媒体应用程序 TikTok,该应用必须出售给美国所有者,否则将面临在美国被禁的风险。

“DeepSeek 是(大语言模型)的 TikTok,”埃齐奥尼说。

——DeepSeek 对科技界的深刻影响

科技巨头已经在思考 DeepSeek 的技术如何影响他们的产品和服务。

“DeepSeek 给我们的本质上是一份技术报告形式的‘食谱’,但他们没有提供额外缺失的部分,”Hugging Face 的高级研究科学家刘易斯·图恩斯特尔说,Hugging Face 是一个为开发人员提供工具的人工智能平台。

图恩斯特尔正在领导 Hugging Face 的一项努力,以完全开源 DeepSeek 的 R1 模型;尽管 DeepSeek 提供了研究论文和模型的参数,但没有透露代码或训练数据。

纳德拉在微软的财报电话会议上表示,Windows Copilot+电脑(即按照一定规格构建以支持人工智能模型的电脑)将能够本地运行从 DeepSeek R1 提炼的人工智能模型。移动芯片制造商高通周二表示,从 DeepSeek R1 提炼的模型已在一周内运行在其芯片驱动的智能手机和电脑上。

人工智能研究人员、学者和开发人员仍在探索 DeepSeek 对人工智能进步的意义。

DeepSeek 的模型并非唯一的开源模型,也不是第一个能够在回答之前对答案进行推理的模型;OpenAI 去年的 o1 模型也可以做到。

DeepSeek 的重要之处在于它能够推理并从其他模型中学习,以及人工智能社区可以看到幕后发生的事情。在 DeepSeek 应用程序中使用 R1 模型的人还可以看到它在回答问题时的“思考”过程。

“你可以看到机器内部的齿轮在转动,”高通技术规划和边缘解决方案高级副总裁兼总经理杜加·马拉迪对 CNN 说。

图恩斯特尔认为,我们可能在不久的将来会看到一波能够像 DeepSeek 一样推理的新模型。这可能至关重要,因为科技巨头竞相构建人工智能代理,硅谷普遍认为这是聊天机器人和消费者与设备交互方式的下一个演变——尽管这种转变尚未完全实现。

周四,社交媒体平台 X 上的聊天机器人 Grok 3 的所有者埃隆·马斯克在世界政府峰会上通过视频露面时表示,Grok 3 将具有“非常强大的推理能力”。

目前,人工智能社区将继续研究 DeepSeek 提供的东西。当然,直到下一个突破出现。

“我肯定预测,在接下来的 12 个月内,它将被其他东西取代,”埃齐奥尼说。“但这是一个非常真实的进步。”

0 阅读:32
理性闲谈天下事

理性闲谈天下事

感谢大家的关注