#马斯克称Grok3是地球上最聪明的人工智能# 马斯克口中号称“地球上最聪明的人工智能”的 Grok 3 终于生了。马斯克携 xAI 天团(四个人里就有两位华人),从各个方面介绍了 Grok 3 究竟有多厉害。有人已经提前体验上了 Grok 3 ,Andrej Karpathy 说它的推理能力跟 o1-pro 差不多,而且还要略优于 DeepSeek R1 和 Gemini 的推理模型。 还有老哥用 AI 生成了一个奥特曼看到 Grok 3 发布后的视频。。。(图3)
根据官方的介绍,这次的 Grok 3 事实上是一个模型家族,大致可以分为非推理模型和推理模型两种。非推理模型 Grok 3 在 AIME ’ 24 数学竞赛、GPQA(研究生水平科学知识问答能力的基准测试)和代码三项测试中,成绩肉眼可见高出了其他模型一大截。
而 Grok 3 mini 通过牺牲一定程度的准确性,来换取更快速度的回答。另外,在 Chatbot Arena 的盲测中,Grok 3 代号叫“巧克力”的早期版本也登上了榜一,分数更是史无前例破了 1400 分。
而推理模型 Grok 3 Reasoning Beta 和 Grok 3 mini Reasoning 表面一看还是吊打的姿态。但有个需要注意的地方,测试中加了 Test-Time Compute 。简单理解就是给了模型更多的时间去思考。说实在的,如果不算上加时赛,好像还是 o3-mini (high)的推理能力更强。。。
另外现场演示的思考过程是被模糊处理过的,理由跟奥特曼的差不多,为了防止模型被抄袭。根据马斯克的说法,Grok 3 在未来的两到三年内,还可能参与到特斯拉的生产还有火箭发射的过程当中。
Grok 3 之所以看上去如此强大,抛不开只花了 122 天就搭建起来的 10 万卡集群。
在此之后,他们又花了 92 天扩展到了 20 万卡集群,一招大力出奇迹,这就是算力的绝对力量。
虽然我还没上手,但从一些实测案例来看,Grok 3 似乎也没有营销的这么神。抢先体验的用户分享当中,也有翻车的。而 xAI 一般是新模型发布后再开源旧模型,马斯克想狙的还是老对手奥特曼。等一手 GPT 4.5。