李飞飞团队用不到50美元训练出新模型
要早睡早起,因为早点起来用DeepSeek不卡[吃瓜][嘻嘻]
李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提炼出来的。
李飞飞团队用不到50美元训练出新模型
要早睡早起,因为早点起来用DeepSeek不卡[吃瓜][嘻嘻]
李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提炼出来的。
评论列表
作者最新文章
热门分类
财经TOP
财经最新文章
腹黑小公主
不是[doge]为啥挑战deepseek啊,你该挑战GPT啊[doge],早干嘛去了