在英伟达主任工程师陈源博士看来,DeepSeek并不是通过大量数据训练出来的大模型,而是通过模型蒸馏技术从大模型(如GPT-4o和o1)提炼出来的小模型,并用少量数据进行了微调。
这就解释了为什么DeepSeek在多模态领域如此领先,即使美国限制东方大国使用先进GPU训练模型,但对使用大模型并没有限制,DeepSeek正是借用了这一政策空子。
至于公司是否会发布先进的大模型,已经不重要了,因为“猫已经完全从袋子里跑出来了”。在资金、政策、人才等多方面支持下,东方大国在多个技术领域已经与世界平起平坐,作为后发企业,唯有谦虚,踏实走好自己的路,大步向前。
大模型是美国的基石,抵挡美国的垄断也算是一种胜利,只要还有机会,就还有翻盘的可能。
考试第一名成绩出来被反超,马上跳出来说第一名是抄它的[哭笑不得]
对方正在怼入
开源的是抄了闭源的,也就美国佬脸皮厚说得出来了
电话卡便宜 回复 02-02 00:02
外行人说外行话
用户15xxx28 回复 02-01 23:39
无耻的美丽国
pc2boy
打不过就贬低呗,漂亮国老套路了,现在主流ai谁不蒸溜了
玄和 回复 02-01 15:44
打不过我们就抹黑,就打压,就危害国家安全!
用户10xxx13 回复 02-04 13:07
看到各方人士,只从数据蒸馏来贬低,没有否认算法的,基本确认是个好技术
用户18xxx10
2B!这么简单,美帝也可以蒸馏几个小模型灭了Deepseek!毕竟大模型是美帝的!就你这弱智还看世界?去看厕所大门差不多!
用户10xxx09 回复 02-03 18:49
都他娘的是你这额思维,还会有大模型吗?用不了多久大模型都会破产完。大家一起比谁更烂是吗?
等待 回复 用户10xxx09 02-05 22:06
你不懂瞎逼逼啥?蒸馏是所有大模型都在使用的技术,美国业界早就实验和计算过,蒸馏模型只有原模型的40%的能力,deepseek是算法先进才使能力强大
用户17xxx74
可以这么理解,陈源博士可能不是被父母创造的,而是在某种蒸馏技术下来到地球的。虽然这很难被人们理解,但显然陈博士对此有自己的心得。
回头是暗 回复 02-01 18:01
XX看世界,XX看国际,清一色美弟蒸馏出来的号。[doge]
追忆似水年华 回复 回头是暗 02-01 22:34
是的,这种什么东西看世界的都是拿了米的走狗
壹骑绝尘
叫得最凶的就是这种出口的老狗。
金怪
看看无耻的美国人的傲慢愚蠢,输不起!
用户90xxx03
又是世界号和国际号!
用户88xxx11
不用英伟达的芯片产生的模型,就是偷的。
用户63xxx84 回复 02-01 08:11
deepseek也是英伟达芯片,只是没有用到那么多的芯片就干出一个ai模型,你属于啥也不懂
first rose 回复 02-01 09:36
目前用的还是英伟达的芯片,可能开始布局国产芯片替代,但是没那么快能够实现。
萨瓦
西方只会喝蒸馏酒
昵称
戴面具的说露脸的是照他们的脸整容?滑稽的很!
劍帝萊維
公知二狗竟然要自带狗粮为霉爹效力,话术还是一如既往的low啊,闭源的货色指责别人开源的抄袭,还蒸馏技术,你怎么不说无土栽培?
账号已注销
英伟达怎么这么多华人工程师啊?难道英伟达是靠华人工程师撑起来的?
有何不可 回复 02-05 02:42
说这话过脑子了吗?除了有市场的专利,世界上哪个科学家比明星赚的钱多?而且你知道中国科学家的待遇吗?
谢德斌 回复 有何不可 02-05 19:11
这过脑子的话好伽知道[笑着哭]
用户18xxx21
看来,黄皮白心现在进化和他的主子思维是一样的了——无耻的那么坦然……
愚人节
结果英伟达在诋毁之后,无耻的加入了,那么坦然。
fengpc 回复 02-01 07:46
领域内大家互相学习正常的
用户10xxx90
大家要理解,美国佬准备融资5000亿,收割全世界,哪晓得被咱中国无名小辈坏了好事,现在美国歇斯底里的在嚎叫,可以不理它。做好自己就可以了。
浪流连
啊?那美国不就可以蒸馏下deepseek,多搞几个出来了?怎么美股的AI板块还跌得这么惨?不是利好么?毕竟deepseek是开源的,要蒸馏,方便得很。
杂说 回复 02-02 09:07
大家都只在大楼顶上搭阁楼的话谁来盖大楼呢?
天行道2024 回复 02-02 23:11
早就有了,多的是,国内外都有。直接套壳的都有。没有炒作,不出名罢了。
2088
美国在中国的养狗业发展得不错
YM
拜访一下专家,当汉奸的感觉好不?
泡泡团
这些间谍号又开始为主子抹黑中国,总之都是一句话,中国落后的就嘲笑你不行,中国领先的就说你是投机取巧抄袭,间谍号说的话别信
sahata0701 回复 02-01 10:40
90%以上都是1450,只有它们才这么急
bluefish
谁说对使用没限制,美国根本不给中国用chatgpt。
子曰当下
英伟达工程师看来,舔狗真行,西方的强盗手法都学的666了
来自星星的大橘喵
汉奸急了
睿婕爸
看世界,哈哈哈……
用户17xxx79
拿了美金的写手你良心不痛吗?可能AI抹黑编辑文字
用户13xxx89 回复 02-01 10:18
你一看世界号,都是拿美分的!
风无形
让那些美国二货猜吧
飘摇无限
道理都明白,网络无秘密。
匹夫
给自己找个台阶下,不然很难看
用户10xxx87
客观之言,不可能那么快就追上来,中国现在没这个能力,投机取巧,不可能产生什么实际效益
赛博情报官 回复 02-01 01:58
客观的说,你的回复没有一句客观的,全是猜测和情绪,数据和事实一个没有;按照你的客观逻辑,你可能没父母
用户10xxx90 回复 02-01 01:28
汪汪叫小狗,没有动到切身利益,美国得这么上肝火。
用户10xxx77
胡说八道,ds是改变国运的app,是中国复兴的希望,中国网民都寄托在这款伟大的app,这几天ds已经为公司炒股赚了多少钱你知道吗?你居然敢说是偷美国的大数据?岂有此理!大汉奸
果果哥
科盲
凡人
开始各种抹黑抵毁了,这就西方人的嘴脸
z111111a
还到不了第一,主要是利用第一的作文缩写改编了一下,节省了大量成本
常回家看看回家看看
蒸馏这说法,还真有道理。想当年,姜萍就是蒸馏了王润秋的大模型,生成了自己的小模型,才能在阿里巴巴预赛上超越了王润秋。至于姜萍之后的一众清北超一流们,没有超越姜萍,只能说他们蒸馏的技术弄反了,把飞天茅台蒸馏成了红星二锅头。姜萍挨骂了,DS也被美西群殴了。额额额,继续围观,窗外日迟迟,草堂春睡足。。。
常回家看看回家看看 回复 还好 02-01 10:37
卞圣也是蒸馏了柯洁,烫得柯洁一去不回头,不肯做个温水里的好青蛙。。。。。。好像哪里有点不对??
还好 回复 02-01 10:31
哦明白了,DS就是姜圣
Jet-罐头鱼
看不出来吗?他们正在宣传和“固化”一个词“蒸馏”,我们提的越多越能反证他们的谬论,所以大家其实不需要讨论“蒸馏”,因为这是一个无中生有的“创造”,我们本来就已经被带偏了,感受不到吗?
四哥
DeepSeek大模型需要挖掘大量数据要素来支撑……蛇年拥抱大数据+数据要素+数据确权+……
用户10xxx08
谁抄袭侵权世界自有公认,我们不懂无法评价!👍
古往今来
你终于消灭了自己的智商!
超级福娃
扎克伯格咬牙切齿了
点击设置昵称
既然觉得DeepSeek是靠GPT练出来的,那美国不是可以用自己家的英伟达和大模型,练比DeepSeek强的AI出来,左脚踏右脚,反复循环直接上天!还磨叽什么?
fengpc 回复 02-01 07:47
DS也是用英伟达练出来
建国
deepserk运行成本是最低的。一些低算力的环境,运营成本更加低。
涛哥
蒸馏技术高大上
宁远
只要坚信被美国打压抹黑制裁的都是好的
用户15xxx72
所以你懂得蒸馏反而不想去蒸馏是吧,手拿一手资料的开卷考试你还考不过就只剩逼逼。
一定会回来
不看谁吹得有多厉害,是骡子是马拉出来蹓蹓。
my god
问题是为什么最先进的欧美不这么干,反而中国干出来了?!何解?!呵呵呵,不就是利益问题吗?说一大堆废话!
猫咪鱼
扯淡,deepseek已经确定的c++编写的,和外国佬AI没关系。你没听说现在外国佬都争着要学中文了吗?语言决定了我们和他们思维不同,所以我们做的AI也更精简高效!
catiger
我个人使用了两个软件,而且对比了,很大程度上是一个东西。有些时候两个软件回答的都稀里糊涂。我比较认可这个说法。但是中国肯定有相当的进步和创新。现在目标已经基本上达成。美国太托大了。砸碎ai垄断比追究谁是老大更重要。
用户30xxx33
难道是美国佬自己不会蒸?
书同文车同轨
中国加油。。
乌云墨覝
同一首歌,原唱与翻唱,歌曲不变,不同的声音不同的味道,缺的就是原唱想收版权费,翻唱的红遍大江南北。
2002
英伟达的股票一夜蒸发5900亿,估计黄教主跳脚了吧?你牛逼为啥算力要求那么高,成本那么高?炒你个毛啊!
飞鸟
嗯,罪名成立,所有知识都是从现象中“蒸馏”出来的[墨镜]
匿名
从来都是落后的抄袭先进的,如果说deepseek抄袭OpenAI那么,应该就是说OpenAI先进,那么,那些人慌什么?哈哈哈哈哈哈
还好 回复 02-01 10:39
你说的很对,那为什么还要保护知识产权呢
用户10xxx15
让子弹飞三个月就知道咋回事儿了,或许用不了三个月。
社蚁鼓与呼
小瞧美帝,绝不明智!人工智能本就是两条腿走路:硬件➕软件。“深度探索”取得的暂时的在算法模型上的突破和领先,其实体现了现阶段中美人工智能之争,就是两个瘸子在赛跑,待到老美的瘸腿健壮起来,那时怎么个哭法合适?[捂脸][捂脸][捂脸]
阿里山
美国说自己是古罗马再现。问题是古罗马是当年英国胡编乱造出来的伪史,美国拿伪史(架空穿越小说)当治国蓝图掉进深渊,十分可笑,这是英国无意识中对前殖民地最狠的报复了。当然了英国自己也被这套伪史给骗了,要不它怎么衰落的那么快。
睿睿居士
陈源:承认DS聪明,不就是承认自己蠢吗[抠鼻]
波波沙 回复 02-01 07:30
英伟达不做Ai,英伟达不挖金矿,但英伟达卖挖矿的铲子。所以英伟达的首席科学官赞DS没问题。
我行故我在
这个蒸馏技术是什么意思?是提纯的意思?
还好 回复 02-01 10:38
简单的说,通过注册openai的api向其提大量(百万以上)问题训练自己模型,而不是完全依靠自己的大语言模型进行自主深度学习
用户11xxx89
嗯,我大漂亮永远是世界第一,不允许别人超过
老夏
这一届群众的眼睛都是雪亮的。公智的钱不好赚了。
用户12xxx77
如果我师从爱因斯坦,然后成就超过他,那也是我的本事啊。
A0000落叶何翩翩
他说的应该是事实。
凋零向日葵
让openai开放源代码跟deepseek对比一下,是否抄袭一目了然[滑稽笑]
二师兄妖怪被师傅抓走了
GPT是闭源,怎么抄?
娇子牌香烟
不敢承认被别人超越?其实是最蠢的智商?[滑稽笑][滑稽笑]
执着
抄作业的确比较省劲[哭笑不得]
tb9507032
结案理论出来了,那就实践一下呀,再造一个不是很容易吗,为什么不去行动呢
飘动的雾
让美国失败
海的声音
美国闭源的是抄了中国开源的技术的作业
用户11xxx35
广东抓美奸,江浙抓日奸,一抓一大把,一抓一个准
良民
管他是不是抄袭,这个世界根本就没有规矩,讲的是拳头和脸皮是否厚。否则华为大公主,也不会被扣留,tiktok也不会被叫停。
既来之则安之
这么简单,你咋不去干呢?是不是显得更蠢
Footman
国际号,世界晓号又出来收美分?发一个专业词语用来暗指deepseek抄袭?
abcde
免费我喜欢!
外乡人
当然怎么说呐,断人财路犹如……
白云老仙
盎撒人是坏,但最坏的还是香蕉人
闲情逸致
肯定有人有机构在操纵自媒体,堂堂的中国为什么要匿名什么东方大国什么龙国什么兔子?真怀疑这些作者究竟是不是中国人!
哦哦哦
弱智,大模型数据又没有共享出来,其他人怎么获取?靠接口调用获取数据?一亿年你都不可能把数据拿下来,能使用蒸馏技术的只有大模型自己。模型都开源了,还怀疑什么?
*冰河*
既然是美国的,那美国禁什么,还要盟友一起。
用户14xxx32
为什么不在别人出来之前出,后出的肯定是要低人一等,那怕升级了,淘宝在中国是电商之祖,难道京东和唯品会是吗?QQ和微信是中国软件社交之祖,难道抖音和叮叮也想争这个名头吗
用户64xxx23
就像02年上交那个国产芯片一样,这种投机取巧的又要祸害国内ai几十年
静默的梧桐0
总之,好象不太好
用户45xxx17
最反华就是那些所谓高等华人,英伟达宣布上线deepseek啪啪打了这个主任的脸,这条狗连主人都不待见啊。
它山之石
虽然 DNA 不同,但外观、功能雷同,明显是抄袭🤣🤣🤣
用户15xxx31
你GPT先开源了再说
平头哥
这个解释好像还有点站得住脚
啊哈 回复 02-01 08:20
哦,难怪你用舌头舔着吃
用户38xxx75
问一下这个所谓的AI,5090显卡。会有意外惊喜。估计还是一个金融属性的陷阱,为春节后造势。
用户92xxx36
香蕉人才是无耻之徒
王l
说啥都没用,你们卡脖子的办法都用尽了,我们研究出的东西摆在那和你们有关系吗?
run2running
大家还是把这个账号拉黑吧,批量发布起号,下一步不是卖国就是割韭菜
用户15xxx12
什么数据模型蒸馏?给数据模型加热,去掉水分,留下干货?
用户14xxx91
等更多的证据出来。况且蒸馏技术也不是完全没有意义,看谁蒸馏的更快更好也行
Vaker
这种假借什么华人之口,狗屁,这种帖子有人故意放出,该查
用户10xxx77
不懂就问,第三方怎么从“闭源的大模型”怎么蒸馏出“开源的小模型”?
云起云飞
老美现在各种贬低、攻击deepseek。因为这超出了他们的认知,更因为deepseek动了他们的蛋糕。
雨夜*星空
别太急 下结论 想想我们芯片造假多少专家都没发现! 时间会证明这个是我们真的有能力还是又一个骗钱的居而已
刚板
丑国的AI技术壁垒没了,装不了13了,能不急眼吗
z111111a
现在对Al知识蒸馏还没有明确法律界定,它的哪些部分属于创新,哪些部分属于侵犯知识产权还没有什么法律依据。相应法律应该很快会出来,中国也会跟进的
用户18xxx15
戒骄戒躁!稳打稳扎!领先全球不是梦!
风云笑
不管如何狡辩,如何辟谣。资本市场的表现最真实,华尔街是很多事实的巨像投影!
用户10xxx10
你也把这些蒸馏出来吧?!