关于李飞飞团队S1模型“剽窃说”成立与不成立的理由如下： “剽窃说”成立的理

关于李飞飞团队S1模型“剽窃说”成立与不成立的理由如下： “剽窃说”成立的理由 1、基座模型依赖：S1模型并非从零训练，而是对阿里云Qwen2.5-32B-Instruct的监督微调，有观点认为这就如同直接使用了他人的核心成果，而不是自主研发。 2、知识蒸馏争议：S1的蒸馏法与DeepSeek技术路线高度相似，被批是“换皮操作”，有利用他人已有技术路线而缺乏自身独特创新的嫌疑。 3、数据来源问题：S1K数据集样本全来自谷歌Gemini的蒸馏，连“思考过程”都是API生成的二手知识，被指缺乏数据原创性。 4、夸大宣传质疑：部分自媒体将论文简化为“50美元复刻顶级模型”，忽略基座模型的决定性作用，给人一种S1是完全独立创造的错觉，引发公众误解，也让人觉得有故意误导以窃取成果之嫌。 5、“预算强制”争议：使用“预算强制”技术人为延长模型思考时间来提升性能，被比作考试时偷偷多写半小时，被质疑是不正当的提升方式。 “剽窃说”不成立的理由 1、技术公开性：知识蒸馏是AI领域的公开技术，并非某家独有，李飞飞团队使用该技术在技术层面上不能完全算是剽窃。 2、数据标注规范：论文已明确标注了数据来源，没有刻意隐瞒数据的出处，从学术规范角度看，在数据使用上没有违反基本的学术道德。 3、遵循开源协议：基于阿里云Qwen的开源代码进行微调，是在开源协议允许的范围内进行的操作，属于合理利用开源资源进行二次开发。简而言之，老蛇最后结论是：用50美元训练出新模型的课题肯定是假的，用来帮助投资人割意淫小韭菜的；训练过程是在开源技术上的二次开发，是没有技术创新的。不违法，但是整体是不道德的。李飞飞李飞飞是否存在剽窃行为

0 阅读：107

关于李飞飞团队S1模型“剽窃说”成立与不成立的理由如下： “剽窃说”成立的理

开源代码变弹药！李飞飞套壳Qwen美军精准度飙升。李飞飞团队用阿里云开源的Qw

这两天科技圈被一记响亮的耳光炸开了锅。美国李飞飞团队高调来华展示"50美元低成本

斯坦福AI女神突然包机抵京！李飞飞团队刚落地就提出要参观国家超算中心，这波操作把

中国的十大科技巨头震撼全球！1、DeepSeek——大模型2、宇树科技——人型机

同样的地方美国跌倒了两次：你可以骂美国人制裁国内应用，但是永远不要怀疑他的眼光！

美籍华人李飞飞带领美国顶尖AI团队访华，交流目的好像不明。已经开源了，核心代码都

转，和一家国产大模型负责人聊了一下deepseek的影响。他告诉我，d

美国一觉醒来发现，Deepseek并不是最大的敌人。西方和欧洲也傻眼了，因为他们