前几天很火的李飞飞的s1项目发了个升级版本: s1.1
第一版是用Qwen2.5- 32B-Instruct作为基础模型,通过蒸馏Gemini 2.0 Flash Thinking实验版,最终得到了s1模型。而s1.1就是把Gemini 2.0 Flash Thinking换成了DeepSeek r1,性能又有提升。
前几天很火的李飞飞的s1项目发了个升级版本: s1.1
第一版是用Qwen2.5- 32B-Instruct作为基础模型,通过蒸馏Gemini 2.0 Flash Thinking实验版,最终得到了s1模型。而s1.1就是把Gemini 2.0 Flash Thinking换成了DeepSeek r1,性能又有提升。
作者最新文章
热门分类
科技TOP
科技最新文章