OpenAI的先进模型遭遇瓶颈,堆数据做不成AGI

三易生活 2024-11-15 19:54:57

外界对于人工智能最初的“期待感”正在消退,这无疑是当下整个AI行业最大的痛点,因此继续支撑资本市场信心的似乎只剩下了AGI(通用人工智能)。而AGI将在未来5年内实现,这也是OpenAI CEO阿特尔曼、特斯拉创始人马斯克、英伟达创始人黄仁勋等一众科技界大咖的预测。

从ChatGPT到GPT-4到o1,从LLama 1.0到3.0、Claude1到Claude3,如同打怪升级一般逐步实现AGI,这是以OpenAI为代表的AI厂商试图描绘的未来图景。只是近日有消息显示,OpenAI下一代旗舰模型“猎户座”(Orion)的进步速度大幅放缓,合成数据越训越像旧模型、编码性能甚至还在退步。

其实不仅仅是OpenAI,谷歌的Gemini 2.0、Anthropic的Claude 3.5 Opus等先进AI模型也被传出遇到了瓶颈,以至于业界开始讨论如今被奉为圭臬Scaling law即将失效。事实上,关于Scaling law的论战也是近期X平台的热点,从OpenAI的开发者到NYU、OSU等知名大学的教授都参与其中。

所谓Scaling law,其实是OpenAI在2020年提出的一个关于基于transformer语言模型的规律,指的是大模型的最终性能主要与计算量、模型参数量和训练数据量三者的规模大小相关,与模型的具体结构基本无关。OpenAI在发现了这个规律后,就搭建了拥有200亿参数的GPT-3.5-Turbo,而ChatGPT正是在后者的基础上诞生。

要知道在过去相当长的一段时间里,机器学习研究领域并没有把数据量作为主要研究对象,因为数据一般被认为是被动变量,大量的研究是集中在如何有效降低训练误差和控制模型复杂度上。客观来说,Scaling law也是过去两年AI大模型赛道风起云涌的基础,因为它证明了通过预训练使用更多的数据和算力,能够让AI模型的性能暴涨。

Scaling law在AI领域的意义就如同摩尔定律之于半导体行业,用李开复博士在知乎上的回答就可以解释这条规律的重要性,“Scaling Law的持续影响下,无论是硅谷还是国内,大模型赛道正在掀起一场AI Infra的‘军备竞赛’”。

过去两年,OpenAI、微软、谷歌、Meta、Anthropic等AI赛道的头部厂商其实都在做同一件事,即以巨额计算资源为赌注,来赌Scaling Law的收益递减未来能够得到解决。在这一趋势下,海量资金被用于购买算力芯片、筹建数据中心,以及购买数据。

而Scaling Law的存在也让整个业界弥漫着一股乐观情绪,仿佛购买更多的英伟达芯片、拿下更多的数据、获取更多的水电资源,AGI似乎就是水到渠成的事情。对于OpenAI等大厂来说,实现Scaling Law需要的硬件资源和工程实践也是远胜于技术和思想的护城河。

那么为什么会出现OpenAI Orion越训练越像旧模型呢?因为“新的、未开发的高质量人类生成训练数据”正在成为稀缺资源。在过去几年里,大模型的迭代升级过程几乎已经把各种公开可用的数据集、网站、书籍,以及其他来源的数据耗尽,而合成数据的广泛使用,则会导致新模型在训练中变得与旧模型更贴近。

换而言之,如果解决了高质量训练数据的供给,业界就能继续在Scaling law这条道路上前进。问题在于高质量训练数据的产出跟不上大模型的“消耗”,并且随着越来越多内容拥有者认识到了数据的价值,使得其变得越来越贵。这就意味着数据匮乏的问题不仅在2024年变得严峻,在未来还将变得更难以解决。

Scaling Law的边际效应愈发凸显、AI大模型撞上“数据墙”,这对于整个AI行业无疑是一个危险的信号。著名美国认知科学家、AI泡沫论支持者Gary Marcus就在社交平台上表示,整个AI行业相关公司的高估值是建立在模型能力不断增强,能够迅速达到AGI的预期之上。

所以一旦迭代速度放缓,行业就将进入价格战,这就意味着AI行业在找到自己的“现金牛”、获得切实的业绩增长、回收基础设施上的庞大投入前,需要先进行残酷的消耗战。这对于投资者而言无疑是一个晴天霹雳,也很难不让他们联想到当年的互联网泡沫。

如果不想重蹈二十年前互联网泡沫破裂的覆辙,AI公司就必须找到Scaling Law之外的新道路。目前,OpenAI给出的解决方案是切换赛道,The Verge日前就发文称, OpenAI方面计划于2025年1月推出名为“Operator”的AI智能体,其能力类似于Claude 3.5 Sonnet、主打能像人类一样操作电脑。

对此OpenAI首席产品官凯文・韦尔指出,2025年可能是智能体进入主流市场的关键时间。其实智能体并不是什么新概念,早在一年前,比尔·盖茨就曾在博客文章中预言,AI智能体将会成为继Windows、iOS/Android之后的下一个平台。在此之前,OpenAI、Anthropic、谷歌、Meta等引流潮流的头部AI厂商之所以不做智能体,只是因为追逐AGI显然更有“钱景”。

如今在Scaling law失灵已经近在咫尺的情况下,头部AI厂商的AGI梦看来将会变得遥遥无期。这时候重新捡起商业前景更好的智能体,就说明OpenAI更务实了,毕竟想要实现远大的理想先得活下来才行。

0 阅读:2