OpenAI‘草莓’项目曝光,匿名大模型测试引热议

程序员咋不秃头 2024-08-10 02:54:40

今天,Sam Altman在X上晒了一张自家花园的照片,结果却把AI界的创始人们“惊”到了。

公司高层突发的巨大变动,似乎并没有太多影响到这位当家人,奥特曼在海外媒体秀出了一张花园花盆中生长的草莓的宜人景色,并用他典型的全小写文字风格配文“我喜欢花园里的夏天”。看起来,既在像回应外界对于OpenAI前途的担忧,同时又用自己花园里的“草莓”暗示着代号“Strawberry”的新基础模型的神秘项目即将公布。

没错,就这么一张“淡”图,足以让Altman 粉丝和各个活跃的AI 社区兴奋了起来,因为 Altman 此前已经承认了:OpenAI 努力开发一种代号为“Strawberry”的新基础模型,而且坊间传言:该模型可能与预期的 GPT-5 基础模型相同。

有粉丝调皮地问奥特曼:这张照片的提示词是什么?奥特曼机智回复:这真是我的花园。

“我们还需要什么线索?”,一位经常爆料和传播AI谣言的账户 X 上的 @kimmonismus 发帖称。

开源 AI 初创公司 Abacus AI 的首席执行官 Bindu Reddy 也在 X 上发帖称,这是“对草莓计划的引用”。

“草莓就要发布了!”类似的观点比比皆是。

新的“匿名聊天机器人”

好巧不巧,流行的开源lmsys ar ena 中今天也正好添加了一种新的“匿名聊天机器人”AI 模型,

这个网站是包括 OpenAI 在内的众多 AI 模型提供商们经常光顾的地方,尤其会把一些即将发布的测试版本交由该平台上线,让用户来一起测试。

事情变得太妙:有些让人禁不住往“草莓”身上联想了!!!

更过分的是,这个新的“匿名聊天机器人”在被问及时声称自己是 OpenAI 的 GPT-4 模型系列的一部分,并且与2024 年 5 月 OpenAI 的 GPT-4o 多模态模型发布之前出现在 lmsys 上的“ gpt2-chatbot ”使用了类似的语言。

新“匿名聊天机器人”的早期用户报告称,它比 GPT-4o 和其他竞争对手的前沿模型表现出更先进的推理能力,这表明它可能比它们更强大。

神秘草莓,究竟有哪些功能

透露OpenAI神秘项目的一切来源是路透社。

有关 OpenAI 新模型的传言始于2023 年 11 月路透社的一篇报道,该报道描述了一种名为“Q*”(报道称发音为“Q-Star”)的新 AI 模型:

“OpenAI 的一些人认为 Q*(发音为 Q-Star)可能是这家初创公司在寻找所谓的通用人工智能(AGI)方面的突破,”其中一位知情人士告诉路透社。OpenAI 将 AGI 定义为在大多数具有经济价值的任务上超越人类的自主系统。

路透社随后于 7 月中旬发表独家报道称:

据知情人士和路透社审阅的内部文件显示,ChatGPT 制造商 OpenAI 正在一个代号为“Strawberry”的项目中研究其人工智能模型的新方法。

至于 Strawberry 可能提供哪些具体新功能,消息人士称,“该文件描述了一个使用 Strawberry 模型的项目,目的是使公司的人工智能不仅能够生成查询的答案,而且能够提前规划,自主可靠地浏览互联网,从而执行 OpenAI 所称的‘深度研究’”。

此外,自OpenAI 发布其最后一个重要的新基础模型类GPT-4 以来,已经过去了近 17 个月,大约一年半。在此期间, GPT-4o 和GPT-4o mini(原生多模态),但竞争对手的进展似乎更为迅速,Anthropic、谷歌和Meta相继跟平,宣布各自拥有了同等甚至在某些任务下更强大的模型。

“草莓”收获的季节,还没到!

按照“草莓”项目功能的描述,无须用户提示就能提前推理、自主规划并执行“深度任务”,可以说是将大模型做成了大众所期待的智能体。因此,草莓也被外界视为通往AGI的关键突破。

然而,有关“草莓”的计划和时间表,依旧是个未知数。

因为,奥特曼这位掌舵者太擅长跟外界沟通周旋了!这个“草莓”帖子也可能只是在OpenAI动荡时期培养人气的一种尝试,毕竟重要的战友,联合创始人John Schulman辞职,联合创始人Greg Brockman宣布休长假,加剧了华尔街对人工智能的降温。

正如外界所看到的,自从OpenAI用ChatGPT震撼了整个行业以来,进展已经放缓。GPT5更是一拖再拖。一方面,有研究人员认为,模型正在耗尽可供训练的数据,另一方面最近有媒体报道OpenAI正在损失数十亿美元。这些都不是近期新产品推出的积极迹象。

写在最后:

OpenAI今年的重点,不是模型

由于种种原因,大模型并不会是OpenAI的重点,小编发现了另一个可以佐证这个观点的证据。今年OpenAI DevDay的日期已经有了预告,旧金山,10月1日。

预告文中透露出,此次的重点不在于下一个训练的模型,而是API和DevTools的进展。

“我们知道开发人员正在等待我们的下一个大型模型,我们已经在今年早些时候分享了该模型正在训练的消息,(但)此次活动将重点关注应用程序接口和我们开发工具的进展,以及令人惊叹的开发人员社区在该平台上的建设成果。”

不知道各位是否认同呢?

0 阅读:0