关于李飞飞团队S1模型“剽窃说”成立与不成立的理由如下: “剽窃说”成立的理由 1、基座模型依赖:S1模型并非从零训练,而是对阿里云Qwen2.5-32B-Instruct的监督微调,有观点认为这就如同直接使用了他人的核心成果,而不是自主研发。 2、知识蒸馏争议:S1的蒸馏法与DeepSeek技术路线高度相似,被批是“换皮操作”,有利用他人已有技术路线而缺乏自身独特创新的嫌疑。 3、数据来源问题:S1K数据集样本全来自谷歌Gemini的蒸馏,连“思考过程”都是API生成的二手知识,被指缺乏数据原创性。 4、夸大宣传质疑:部分自媒体将论文简化为“50美元复刻顶级模型”,忽略基座模型的决定性作用,给人一种S1是完全独立创造的错觉,引发公众误解,也让人觉得有故意误导以窃取成果之嫌。 5、“预算强制”争议:使用“预算强制”技术人为延长模型思考时间来提升性能,被比作考试时偷偷多写半小时,被质疑是不正当的提升方式。 “剽窃说”不成立的理由 1、技术公开性:知识蒸馏是AI领域的公开技术,并非某家独有,李飞飞团队使用该技术在技术层面上不能完全算是剽窃。 2、数据标注规范:论文已明确标注了数据来源,没有刻意隐瞒数据的出处,从学术规范角度看,在数据使用上没有违反基本的学术道德。 3、遵循开源协议:基于阿里云Qwen的开源代码进行微调,是在开源协议允许的范围内进行的操作,属于合理利用开源资源进行二次开发。 简而言之,老蛇最后结论是:用50美元训练出新模型的课题肯定是假的,用来帮助投资人割意淫小韭菜的;训练过程是在开源技术上的二次开发,是没有技术创新的。不违法,但是整体是不道德的。 李飞飞 李飞飞是否存在剽窃行为
开源代码变弹药!李飞飞套壳Qwen美军精准度飙升。李飞飞团队用阿里云开源的Qw
【63评论】【56点赞】
二马户
死叛徒,把她送男监去打公……😄