阿里云确认:李飞飞团队s1模型基于Qwen2.5-32B-Instruct

许攸评体育啊 2025-02-06 23:56:18

阿里云确认:李飞飞团队 s1 模型基于 Qwen2.5-32B-Instruct 模型训练

今日,李飞飞研究团队以不到 50 美元的云计算费用训练了一个名叫 s1 的人工智能推理模型,该模型在数学和编码能力测试中的表现与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型类似。

不过很快,该 s1 模型被指“并非从零开始训练”,其基座模型为“阿里通义千问(Qwen)模型”。对此,新浪科技向阿里云方面求证,阿里云方面确认了这一消息。

阿里云回应称:“他们以阿里通义千问 Qwen2.5-32B-Instruct 开源模型为底座,在 16 块 H100 GPU 上监督微调 26 分钟,训练出新模型 s1-32B,取得了与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型数学及编码能力相当的效果,甚至在竞赛数学问题上的表现比 o1-preview 高出 27%。”

0 阅读:0
许攸评体育啊

许攸评体育啊

感谢大家的关注