【xAI官方的Grok3全面介绍】Grok3是一款在其Colossus超

【xAI官方的Grok 3全面介绍】

Grok 3是一款在其 Colossus 超级集群上训练的先进模型，在推理、数学、编程、世界知识和指令执行任务上显著提升。Grok 3 采用了大规模强化学习，能够进行长时间的思考，自我纠错，探索替代方案，并提供准确答案。该模型在学术基准和用户偏好上的表现领先，在 Chatbot Arena 获得了 1402 的 Elo 评分。同时，xAI 还推出了 Grok 3 mini，这是一款成本效率更高的推理模型。两款模型仍在训练中，预计将根据用户反馈快速进化。xAI 计划在未来几天内向用户推出 Grok 3，并提供其推理能力的早期预览。

Grok 3 的推理能力通过两个测试模型 Grok 3 (Think) 和 Grok 3 mini (Think) 展现，它们在测试时间计算和推理方面表现出色，能够解决复杂问题，并在多个问题领域中展现泛化能力。Grok 3 (Think) 在 2025 年美国邀请赛高级数学竞赛（AIME）上达到了 93.3% 的成绩，在研究生水平的专家推理（GPQA）和实时编码基准（LiveCodeBench）上也有显著的表现。Grok 3 mini 在 STEM 任务上实现了成本效益的新突破，在 AIME 2024 上达到了 95.8% 的成绩。

Grok 3 的推理过程完全透明，用户可以检查模型的思考过程和最终答案。xAI 提供了 Grok 3 推理能力的示例，包括一个名为 “Break-Pong” 的 Pygame 游戏，它结合了经典游戏 Pong 和 Breakout 的元素，并具有吸引人的视觉效果。

在推理功能关闭时，Grok 3 能够即时提供高质量的回答，在多个学术基准上表现出色，包括研究生水平的科学知识（GPQA）、一般知识（MMLU-Pro）、数学竞赛问题（AIME）、图像理解（MMMU）和视频理解（EgoSchema）任务。Grok 3 拥有 100 万个令牌的上下文窗口，能够处理复杂的提示和长文档，并在 LOFT（128k）基准上展现了强大的信息检索能力。

xAI 还推出了DeepSearch，这是一个旨在跨越人类知识全部范围以寻求真理的 AI 代理。它能够合成关键信息、解决事实和意见的冲突，并在复杂的环境中提供清晰的见解。此外，xAI 计划通过其 API 平台发布 Grok 3 和 Grok 3 mini，并将DeepSearch提供给企业合作伙伴。

Grok 3 的训练正在继续，xAI 计划在未来几个月内推出新功能，包括工具使用、代码执行和先进的代理能力。Grok 3 目前已经向𝕏高级和高级加用户提供，并将逐步向所有 Grok 用户开放，高级加用户将享有更高的使用限制和高级功能的访问权限。

0 阅读：0