前几天很火的李飞飞的s1项目发了个升级版本:s1.1第一版是用Qwen2.5-

又仁看科技 2025-02-12 09:20:19

前几天很火的李飞飞的s1项目发了个升级版本: s1.1

第一版是用Qwen2.5- 32B-Instruct作为基础模型,通过蒸馏Gemini 2.0 Flash Thinking实验版,最终得到了s1模型。而s1.1就是把Gemini 2.0 Flash Thinking换成了DeepSeek r1,性能又有提升。

0 阅读:2
又仁看科技

又仁看科技

感谢大家的关注