美国AI教母李飞飞再次盯上DeepSeek,看似验证了DeepSeek的训练逻辑

星空表哥 2025-02-08 14:22:22

美国AI教母李飞飞再次盯上DeepSeek,看似验证了DeepSeek的训练逻辑,证明了低成本也可以训练出优秀的大模型,但事实上却是在污名化DeepSeek!

李飞飞是斯坦福大学教授,美国人工智能与计算机视觉领域的教母级人物。她创建了ImageNet数据集,推动深度学习革命。曾任Google Cloud AI首席科学家,致力于AI伦理与公平性研究。她也是斯坦福“人类中心AI研究院”(HAI)联合主任,推动AI技术的社会责任发展。

李飞飞在AI界的动作绝对会引起轩然大波,她以50美元的成本、半小时的训练时间就搞出了一个推理水平与DeepSeek同级别的大模型,看起来就是证明了DeepSeek的逻辑是可行的,但各位知道她干了什么吗?是通过蒸馏谷歌的推理模型杰米尼2.0提炼出来的。

这意味着什么?关于这点并没有详细说明,但通过这点让大家明白了一个道理,低成本的AI大模型并不是不能搞,她李飞飞用50美元蒸馏谷歌大模型就能搞出一个,那么接下来的推理逻辑就不言而喻了吧,请问中国人的DeepSeek是不是也是这样来的呢?

高手出的阴招实在是令人恶心,这玩法就是污名化DeepSeek,让大家都认为中国人干了下三滥手段,但是作为AI教母的李飞飞也太着急了一点,以至于事件发生的逻辑都没有太注意而留下了太多的漏洞!

首先第一个用的方法和DeepSeek到底是否一样,其实作为业内人士一眼就知道,DeepSeek独创的"渐进式知识蒸馏"技术与李飞飞的玩法完全不同,而且目前DeepSeek的底层思维逻辑已经使用的中文、具有空间三维信息含量的中文思考,比密码式的英文更优秀。

第二个是美国想再次拿回AI大模型主导权,美国人如果要玩这个模式肯定比中国人玩得更好,成本还能更低;李飞飞这样搞就是说美国依然拥有AI大模型界的主导权,DeepSeek只是低阶玩法,你们愿意和DeepSeek一起玩就一起玩。

第三个是李飞飞明显是急了,完全没顾及到OpenAI以及谷歌与微软以及马斯克的xAI动辄数十亿美元的大模型训练费用,既然可以这样搞,那美国人为什么要去花那冤枉钱呢?

还有一个非常有趣的信息,李飞飞这个50美元成本的训练成本用的是谷歌的Gemini2.0 FTE提炼出的1000个样本,然后再以阿里通义千问2.5-32B Instruct模型为基座训练的,李飞飞在这件事中最大的贡献是找到了这1000个样本,并且配合阿里通义千问才达到这一水准,国外也有其他团队用了同样的基座以及类似的样本得到了同样的结果,如果基座换成其他模型就做不到这一点,各位知道问题在哪里了吗?

更令人好奇的是DeepSeek一公开,全世界都会了,这个总觉的哪里有问题!但还有一个几乎令西方绝望的事实摆在面前,目前在AI大模型对决的前沿人物,竟然都是中国人,似乎AI大模型上没有中国人就玩不下去了。

0 阅读:65
星空表哥

星空表哥

感谢大家的关注