在英伟达主任工程师陈源博士看来,De­e­p­S­e­ek并不是通过大量数据训练

晨凯看世界 2025-01-31 17:12:02

在英伟达主任工程师陈源博士看来,De­e­p­S­e­ek并不是通过大量数据训练出来的大模型,而是通过模型蒸馏技术从大模型(如GPT-4o和o1)提炼出来的小模型,并用少量数据进行了微调。

这就解释了为什么De­e­p­S­e­ek在多模态领域如此领先,即使美国限制东方大国使用先进GPU训练模型,但对使用大模型并没有限制,De­e­p­S­e­ek正是借用了这一政策空子。

至于公司是否会发布先进的大模型,已经不重要了,因为“猫已经完全从袋子里跑出来了”。在资金、政策、人才等多方面支持下,东方大国在多个技术领域已经与世界平起平坐,作为后发企业,唯有谦虚,踏实走好自己的路,大步向前。

大模型是美国的基石,抵挡美国的垄断也算是一种胜利,只要还有机会,就还有翻盘的可能。

考试第一名成绩出来被反超,马上跳出来说第一名是抄它的[哭笑不得]

1 阅读:59126

评论列表

对方正在怼入

对方正在怼入

463
2025-01-31 21:21

开源的是抄了闭源的,也就美国佬脸皮厚说得出来了

电话卡便宜 回复 02-02 00:02
外行人说外行话

用户15xxx28 回复 02-01 23:39
无耻的美丽国

pc2boy

pc2boy

292
2025-01-31 21:00

打不过就贬低呗,漂亮国老套路了,现在主流ai谁不蒸溜了

玄和 回复 02-01 15:44
打不过我们就抹黑,就打压,就危害国家安全!

用户10xxx13 回复 02-04 13:07
看到各方人士,只从数据蒸馏来贬低,没有否认算法的,基本确认是个好技术

用户18xxx10

用户18xxx10

169
2025-01-31 23:43

2B!这么简单,美帝也可以蒸馏几个小模型灭了Deepseek!毕竟大模型是美帝的!就你这弱智还看世界?去看厕所大门差不多!

用户10xxx09 回复 02-03 18:49
都他娘的是你这额思维,还会有大模型吗?用不了多久大模型都会破产完。大家一起比谁更烂是吗?

等待 回复 用户10xxx09 02-05 22:06
你不懂瞎逼逼啥?蒸馏是所有大模型都在使用的技术,美国业界早就实验和计算过,蒸馏模型只有原模型的40%的能力,deepseek是算法先进才使能力强大

用户17xxx74

用户17xxx74

97
2025-01-31 23:13

可以这么理解,陈源博士可能不是被父母创造的,而是在某种蒸馏技术下来到地球的。虽然这很难被人们理解,但显然陈博士对此有自己的心得。

回头是暗 回复 02-01 18:01
XX看世界,XX看国际,清一色美弟蒸馏出来的号。[doge]

追忆似水年华 回复 回头是暗 02-01 22:34
是的,这种什么东西看世界的都是拿了米的走狗

壹骑绝尘

壹骑绝尘

68
2025-01-31 23:38

叫得最凶的就是这种出口的老狗。

金怪

金怪

59
2025-01-31 21:57

看看无耻的美国人的傲慢愚蠢,输不起!

用户90xxx03

用户90xxx03

54
2025-01-31 22:16

又是世界号和国际号!

用户88xxx11

用户88xxx11

41
2025-01-31 22:06

不用英伟达的芯片产生的模型,就是偷的。

用户63xxx84 回复 02-01 08:11
deepseek也是英伟达芯片,只是没有用到那么多的芯片就干出一个ai模型,你属于啥也不懂

first rose 回复 02-01 09:36
目前用的还是英伟达的芯片,可能开始布局国产芯片替代,但是没那么快能够实现。

萨瓦

萨瓦

40
2025-01-31 22:01

西方只会喝蒸馏酒

昵称

昵称

38
2025-01-31 22:34

戴面具的说露脸的是照他们的脸整容?滑稽的很!

劍帝萊維

劍帝萊維

37
2025-02-01 02:40

公知二狗竟然要自带狗粮为霉爹效力,话术还是一如既往的low啊,闭源的货色指责别人开源的抄袭,还蒸馏技术,你怎么不说无土栽培?

账号已注销

账号已注销

37
2025-01-31 23:43

英伟达怎么这么多华人工程师啊?难道英伟达是靠华人工程师撑起来的?

有何不可 回复 02-05 02:42
说这话过脑子了吗?除了有市场的专利,世界上哪个科学家比明星赚的钱多?而且你知道中国科学家的待遇吗?

谢德斌 回复 有何不可 02-05 19:11
这过脑子的话好伽知道[笑着哭]

用户18xxx21

用户18xxx21

35
2025-02-01 00:26

看来,黄皮白心现在进化和他的主子思维是一样的了——无耻的那么坦然……

愚人节

愚人节

35
2025-01-31 23:33

结果英伟达在诋毁之后,无耻的加入了,那么坦然。

fengpc 回复 02-01 07:46
领域内大家互相学习正常的

用户10xxx90

用户10xxx90

33
2025-02-01 01:25

大家要理解,美国佬准备融资5000亿,收割全世界,哪晓得被咱中国无名小辈坏了好事,现在美国歇斯底里的在嚎叫,可以不理它。做好自己就可以了。

浪流连

浪流连

33
2025-02-01 05:49

啊?那美国不就可以蒸馏下deepseek,多搞几个出来了?怎么美股的AI板块还跌得这么惨?不是利好么?毕竟deepseek是开源的,要蒸馏,方便得很。

杂说 回复 02-02 09:07
大家都只在大楼顶上搭阁楼的话谁来盖大楼呢?

天行道2024 回复 02-02 23:11
早就有了,多的是,国内外都有。直接套壳的都有。没有炒作,不出名罢了。

2088

2088

30
2025-02-01 00:24

美国在中国的养狗业发展得不错

YM

YM

29
2025-01-31 22:00

拜访一下专家,当汉奸的感觉好不?

泡泡团

泡泡团

28
2025-02-01 06:38

这些间谍号又开始为主子抹黑中国,总之都是一句话,中国落后的就嘲笑你不行,中国领先的就说你是投机取巧抄袭,间谍号说的话别信

sahata0701 回复 02-01 10:40
90%以上都是1450,只有它们才这么急

bluefish

bluefish

27
2025-01-31 22:59

谁说对使用没限制,美国根本不给中国用chatgpt。

子曰当下

子曰当下

20
2025-02-01 01:10

英伟达工程师看来,舔狗真行,西方的强盗手法都学的666了

来自星星的大橘喵

来自星星的大橘喵

18
2025-01-31 23:05

汉奸急了

睿婕爸

睿婕爸

17
2025-01-31 23:18

看世界,哈哈哈……

用户17xxx79

用户17xxx79

17
2025-02-01 04:41

拿了美金的写手你良心不痛吗?可能AI抹黑编辑文字

用户13xxx89 回复 02-01 10:18
你一看世界号,都是拿美分的!

风无形

风无形

15
2025-01-31 23:10

让那些美国二货猜吧

飘摇无限

飘摇无限

15
2025-02-01 05:08

道理都明白,网络无秘密。

匹夫

匹夫

15
2025-01-31 23:42

给自己找个台阶下,不然很难看

用户10xxx87

用户10xxx87

13
2025-01-31 23:55

客观之言,不可能那么快就追上来,中国现在没这个能力,投机取巧,不可能产生什么实际效益

赛博情报官 回复 02-01 01:58
客观的说,你的回复没有一句客观的,全是猜测和情绪,数据和事实一个没有;按照你的客观逻辑,你可能没父母

用户10xxx90 回复 02-01 01:28
汪汪叫小狗,没有动到切身利益,美国得这么上肝火。

用户10xxx77

用户10xxx77

13
2025-02-01 03:01

胡说八道,ds是改变国运的app,是中国复兴的希望,中国网民都寄托在这款伟大的app,这几天ds已经为公司炒股赚了多少钱你知道吗?你居然敢说是偷美国的大数据?岂有此理!大汉奸

果果哥

果果哥

12
2025-01-31 23:37

科盲

凡人

凡人

12
2025-02-01 11:03

开始各种抹黑抵毁了,这就西方人的嘴脸

z111111a

z111111a

11
2025-02-04 06:44

还到不了第一,主要是利用第一的作文缩写改编了一下,节省了大量成本

常回家看看回家看看

常回家看看回家看看

11
2025-02-01 10:26

蒸馏这说法,还真有道理。想当年,姜萍就是蒸馏了王润秋的大模型,生成了自己的小模型,才能在阿里巴巴预赛上超越了王润秋。至于姜萍之后的一众清北超一流们,没有超越姜萍,只能说他们蒸馏的技术弄反了,把飞天茅台蒸馏成了红星二锅头。姜萍挨骂了,DS也被美西群殴了。额额额,继续围观,窗外日迟迟,草堂春睡足。。。

常回家看看回家看看 回复 还好 02-01 10:37
卞圣也是蒸馏了柯洁,烫得柯洁一去不回头,不肯做个温水里的好青蛙。。。。。。好像哪里有点不对??

还好 回复 02-01 10:31
哦明白了,DS就是姜圣

Jet-罐头鱼

Jet-罐头鱼

11
2025-02-01 08:29

看不出来吗?他们正在宣传和“固化”一个词“蒸馏”,我们提的越多越能反证他们的谬论,所以大家其实不需要讨论“蒸馏”,因为这是一个无中生有的“创造”,我们本来就已经被带偏了,感受不到吗?

四哥

四哥

10
2025-02-01 08:19

DeepSeek大模型需要挖掘大量数据要素来支撑……蛇年拥抱大数据+数据要素+数据确权+……

用户10xxx08

用户10xxx08

9
2025-02-01 03:32

谁抄袭侵权世界自有公认,我们不懂无法评价!👍

古往今来

古往今来

9
2025-01-31 23:19

你终于消灭了自己的智商!

超级福娃

超级福娃

9
2025-02-01 00:57

扎克伯格咬牙切齿了

点击设置昵称

点击设置昵称

8
2025-02-01 05:55

既然觉得De­e­p­S­e­ek是靠GPT练出来的,那美国不是可以用自己家的英伟达和大模型,练比De­e­p­S­e­ek强的AI出来,左脚踏右脚,反复循环直接上天!还磨叽什么?

fengpc 回复 02-01 07:47
DS也是用英伟达练出来

建国

建国

8
2025-02-01 06:48

deepserk运行成本是最低的。一些低算力的环境,运营成本更加低。

涛哥

涛哥

7
2025-01-31 23:14

蒸馏技术高大上

宁远

宁远

7
2025-02-01 06:51

只要坚信被美国打压抹黑制裁的都是好的

用户15xxx72

用户15xxx72

7
2025-02-01 11:33

所以你懂得蒸馏反而不想去蒸馏是吧,手拿一手资料的开卷考试你还考不过就只剩逼逼。

一定会回来

一定会回来

7
2025-02-01 00:54

不看谁吹得有多厉害,是骡子是马拉出来蹓蹓。

my god

my god

7
2025-02-01 02:43

问题是为什么最先进的欧美不这么干,反而中国干出来了?!何解?!呵呵呵,不就是利益问题吗?说一大堆废话!

猫咪鱼

猫咪鱼

6
2025-02-01 03:04

扯淡,deepseek已经确定的c++编写的,和外国佬AI没关系。你没听说现在外国佬都争着要学中文了吗?语言决定了我们和他们思维不同,所以我们做的AI也更精简高效!

catiger

catiger

6
2025-02-01 09:56

我个人使用了两个软件,而且对比了,很大程度上是一个东西。有些时候两个软件回答的都稀里糊涂。我比较认可这个说法。但是中国肯定有相当的进步和创新。现在目标已经基本上达成。美国太托大了。砸碎ai垄断比追究谁是老大更重要。

用户30xxx33

用户30xxx33

6
2025-02-01 07:32

难道是美国佬自己不会蒸?

书同文车同轨

书同文车同轨

6
2025-02-01 10:43

中国加油。。

乌云墨覝

乌云墨覝

6
2025-02-05 13:15

同一首歌,原唱与翻唱,歌曲不变,不同的声音不同的味道,缺的就是原唱想收版权费,翻唱的红遍大江南北。

2002

2002

5
2025-02-01 09:21

英伟达的股票一夜蒸发5900亿,估计黄教主跳脚了吧?你牛逼为啥算力要求那么高,成本那么高?炒你个毛啊!

飞鸟

飞鸟

5
2025-02-01 11:55

嗯,罪名成立,所有知识都是从现象中“蒸馏”出来的[墨镜]

匿名

匿名

5
2025-02-01 09:43

从来都是落后的抄袭先进的,如果说deepseek抄袭OpenAI那么,应该就是说OpenAI先进,那么,那些人慌什么?哈哈哈哈哈哈

还好 回复 02-01 10:39
你说的很对,那为什么还要保护知识产权呢

用户10xxx15

用户10xxx15

5
2025-02-01 11:23

让子弹飞三个月就知道咋回事儿了,或许用不了三个月。

社蚁鼓与呼

社蚁鼓与呼

4
2025-02-01 09:23

小瞧美帝,绝不明智!人工智能本就是两条腿走路:硬件➕软件。“深度探索”取得的暂时的在算法模型上的突破和领先,其实体现了现阶段中美人工智能之争,就是两个瘸子在赛跑,待到老美的瘸腿健壮起来,那时怎么个哭法合适?[捂脸][捂脸][捂脸]

阿里山

阿里山

4
2025-02-01 08:34

美国说自己是古罗马再现。问题是古罗马是当年英国胡编乱造出来的伪史,美国拿伪史(架空穿越小说)当治国蓝图掉进深渊,十分可笑,这是英国无意识中对前殖民地最狠的报复了。当然了英国自己也被这套伪史给骗了,要不它怎么衰落的那么快。

睿睿居士

睿睿居士

4
2025-02-01 07:10

陈源:承认DS聪明,不就是承认自己蠢吗[抠鼻]

波波沙 回复 02-01 07:30
英伟达不做Ai,英伟达不挖金矿,但英伟达卖挖矿的铲子。所以英伟达的首席科学官赞DS没问题。

我行故我在

我行故我在

4
2025-02-01 10:03

这个蒸馏技术是什么意思?是提纯的意思?

还好 回复 02-01 10:38
简单的说,通过注册openai的api向其提大量(百万以上)问题训练自己模型,而不是完全依靠自己的大语言模型进行自主深度学习

用户11xxx89

用户11xxx89

4
2025-02-01 13:16

嗯,我大漂亮永远是世界第一,不允许别人超过

老夏

老夏

4
2025-02-01 07:36

这一届群众的眼睛都是雪亮的。公智的钱不好赚了。

用户12xxx77

用户12xxx77

4
2025-02-01 08:34

如果我师从爱因斯坦,然后成就超过他,那也是我的本事啊。

A0000落叶何翩翩

A0000落叶何翩翩

4
2025-02-01 22:03

他说的应该是事实。

凋零向日葵

凋零向日葵

4
2025-02-01 16:48

让openai开放源代码跟deepseek对比一下,是否抄袭一目了然[滑稽笑]

二师兄妖怪被师傅抓走了

二师兄妖怪被师傅抓走了

3
2025-02-01 01:34

GPT是闭源,怎么抄?

娇子牌香烟

娇子牌香烟

3
2025-02-01 07:21

不敢承认被别人超越?其实是最蠢的智商?[滑稽笑][滑稽笑]

执着

执着

3
2025-01-31 22:05

抄作业的确比较省劲[哭笑不得]

tb9507032

tb9507032

3
2025-02-01 07:07

结案理论出来了,那就实践一下呀,再造一个不是很容易吗,为什么不去行动呢

飘动的雾

飘动的雾

3
2025-02-01 10:23

让美国失败

海的声音

海的声音

3
2025-02-01 10:39

美国闭源的是抄了中国开源的技术的作业

用户11xxx35

用户11xxx35

3
2025-02-01 14:55

广东抓美奸,江浙抓日奸,一抓一大把,一抓一个准

良民

良民

3
2025-02-01 16:26

管他是不是抄袭,这个世界根本就没有规矩,讲的是拳头和脸皮是否厚。否则华为大公主,也不会被扣留,tiktok也不会被叫停。

既来之则安之

既来之则安之

3
2025-02-01 11:11

这么简单,你咋不去干呢?是不是显得更蠢

Footman

Footman

3
2025-02-01 10:26

国际号,世界晓号又出来收美分?发一个专业词语用来暗指deepseek抄袭?

abcde

abcde

3
2025-02-01 20:32

免费我喜欢!

外乡人

外乡人

3
2025-02-01 07:32

当然怎么说呐,断人财路犹如……

白云老仙

白云老仙

3
2025-02-01 06:46

盎撒人是坏,但最坏的还是香蕉人

闲情逸致

闲情逸致

3
2025-02-01 07:20

肯定有人有机构在操纵自媒体,堂堂的中国为什么要匿名什么东方大国什么龙国什么兔子?真怀疑这些作者究竟是不是中国人!

哦哦哦

哦哦哦

3
2025-02-01 07:49

弱智,大模型数据又没有共享出来,其他人怎么获取?靠接口调用获取数据?一亿年你都不可能把数据拿下来,能使用蒸馏技术的只有大模型自己。模型都开源了,还怀疑什么?

*冰河*

*冰河*

3
2025-02-01 08:12

既然是美国的,那美国禁什么,还要盟友一起。

用户14xxx32

用户14xxx32

3
2025-02-03 10:24

为什么不在别人出来之前出,后出的肯定是要低人一等,那怕升级了,淘宝在中国是电商之祖,难道京东和唯品会是吗?QQ和微信是中国软件社交之祖,难道抖音和叮叮也想争这个名头吗

用户64xxx23

用户64xxx23

3
2025-02-05 15:02

就像02年上交那个国产芯片一样,这种投机取巧的又要祸害国内ai几十年

静默的梧桐0

静默的梧桐0

2
2025-02-02 21:15

总之,好象不太好

用户45xxx17

用户45xxx17

2
2025-02-01 19:50

最反华就是那些所谓高等华人,英伟达宣布上线deepseek啪啪打了这个主任的脸,这条狗连主人都不待见啊。

它山之石

它山之石

2
2025-02-01 09:45

虽然 DNA 不同,但外观、功能雷同,明显是抄袭🤣🤣🤣

用户15xxx31

用户15xxx31

2
2025-02-01 08:27

你GPT先开源了再说

平头哥

平头哥

2
2025-02-01 06:41

这个解释好像还有点站得住脚

啊哈 回复 02-01 08:20
哦,难怪你用舌头舔着吃

用户38xxx75

用户38xxx75

2
2025-02-02 10:19

问一下这个所谓的AI,5090显卡。会有意外惊喜。估计还是一个金融属性的陷阱,为春节后造势。

用户92xxx36

用户92xxx36

2
2025-02-01 22:49

香蕉人才是无耻之徒

王l

王l

2
2025-02-01 18:11

说啥都没用,你们卡脖子的办法都用尽了,我们研究出的东西摆在那和你们有关系吗?

run2running

run2running

2
2025-02-02 10:42

大家还是把这个账号拉黑吧,批量发布起号,下一步不是卖国就是割韭菜

用户15xxx12

用户15xxx12

2
2025-02-02 20:55

什么数据模型蒸馏?给数据模型加热,去掉水分,留下干货?

用户14xxx91

用户14xxx91

2
2025-02-01 16:54

等更多的证据出来。况且蒸馏技术也不是完全没有意义,看谁蒸馏的更快更好也行

Vaker

Vaker

2
2025-02-03 08:16

这种假借什么华人之口,狗屁,这种帖子有人故意放出,该查

用户10xxx77

用户10xxx77

2
2025-02-01 19:05

不懂就问,第三方怎么从“闭源的大模型”怎么蒸馏出“开源的小模型”?

云起云飞

云起云飞

2
2025-02-01 18:28

老美现在各种贬低、攻击deepseek。因为这超出了他们的认知,更因为deepseek动了他们的蛋糕。

雨夜*星空

雨夜*星空

2
2025-02-02 13:07

别太急 下结论 想想我们芯片造假多少专家都没发现! 时间会证明这个是我们真的有能力还是又一个骗钱的居而已

刚板

刚板

2
2025-02-02 21:27

丑国的AI技术壁垒没了,装不了13了,能不急眼吗

z111111a

z111111a

2
2025-02-04 06:48

现在对Al知识蒸馏还没有明确法律界定,它的哪些部分属于创新,哪些部分属于侵犯知识产权还没有什么法律依据。相应法律应该很快会出来,中国也会跟进的

用户18xxx15

用户18xxx15

2
2025-02-05 08:11

戒骄戒躁!稳打稳扎!领先全球不是梦!

风云笑

风云笑

2
2025-02-04 21:52

不管如何狡辩,如何辟谣。资本市场的表现最真实,华尔街是很多事实的巨像投影!

用户10xxx10

用户10xxx10

2
2025-02-05 17:58

你也把这些蒸馏出来吧?!

晨凯看世界

晨凯看世界

感谢大家的关注