【xAI官方的Grok3全面介绍】Grok3是一款在其Colossus超

爱生活爱珂珂 2025-02-21 08:41:13

【xAI官方的Grok 3全面介绍】

Grok 3是一款在其 Colossus 超级集群上训练的先进模型,在推理、数学、编程、世界知识和指令执行任务上显著提升。Grok 3 采用了大规模强化学习,能够进行长时间的思考,自我纠错,探索替代方案,并提供准确答案。该模型在学术基准和用户偏好上的表现领先,在 Chatbot Arena 获得了 1402 的 Elo 评分。同时,xAI 还推出了 Grok 3 mini,这是一款成本效率更高的推理模型。两款模型仍在训练中,预计将根据用户反馈快速进化。xAI 计划在未来几天内向用户推出 Grok 3,并提供其推理能力的早期预览。

Grok 3 的推理能力通过两个测试模型 Grok 3 (Think) 和 Grok 3 mini (Think) 展现,它们在测试时间计算和推理方面表现出色,能够解决复杂问题,并在多个问题领域中展现泛化能力。Grok 3 (Think) 在 2025 年美国邀请赛高级数学竞赛(AIME)上达到了 93.3% 的成绩,在研究生水平的专家推理(GPQA)和实时编码基准(LiveCodeBench)上也有显著的表现。Grok 3 mini 在 STEM 任务上实现了成本效益的新突破,在 AIME 2024 上达到了 95.8% 的成绩。

Grok 3 的推理过程完全透明,用户可以检查模型的思考过程和最终答案。xAI 提供了 Grok 3 推理能力的示例,包括一个名为 “Break-Pong” 的 Pygame 游戏,它结合了经典游戏 Pong 和 Breakout 的元素,并具有吸引人的视觉效果。

在推理功能关闭时,Grok 3 能够即时提供高质量的回答,在多个学术基准上表现出色,包括研究生水平的科学知识(GPQA)、一般知识(MMLU-Pro)、数学竞赛问题(AIME)、图像理解(MMMU)和视频理解(EgoSchema)任务。Grok 3 拥有 100 万个令牌的上下文窗口,能够处理复杂的提示和长文档,并在 LOFT(128k)基准上展现了强大的信息检索能力。

xAI 还推出了DeepSearch,这是一个旨在跨越人类知识全部范围以寻求真理的 AI 代理。它能够合成关键信息、解决事实和意见的冲突,并在复杂的环境中提供清晰的见解。此外,xAI 计划通过其 API 平台发布 Grok 3 和 Grok 3 mini,并将DeepSearch提供给企业合作伙伴。

Grok 3 的训练正在继续,xAI 计划在未来几个月内推出新功能,包括工具使用、代码执行和先进的代理能力。Grok 3 目前已经向𝕏高级和高级加用户提供,并将逐步向所有 Grok 用户开放,高级加用户将享有更高的使用限制和高级功能的访问权限。

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注