DeepSeek创始人梁文锋访谈:为什么我们要开源?这个周末,国产模型Dee

绮梅说世界 2025-01-27 23:11:59

DeepSeek 创始人梁文锋访谈:为什么我们要开源?

这个周末,国产模型 DeepSeek 在美国 AI 界闹翻了天,各种角度的解读充斥了媒体:使用体验、技术分析、对比测试、经济效应、地缘政治等等。

很多人不敢相信,一家名不见经传的中国小公司,据说只有200个员工,只用550万美元的训练成本,就做出了可以与业界顶级模型媲美的产品,要知道那些顶级模型的训练成本在1亿美元左右,这怎么可能?

而且,DeepSeek 的所有模型都是开源的,任何人都可以自由使用。这简直太讽刺了,业界领头的 OpenAI 公司,号称自己的使命是“用 AI 造福全人类”,可是它的顶级模型都是封闭的,既没有代码,也没有论文,你想使用还要付200美元的月费。

现在,大家纷纷质疑,那些美国巨头公司投入几十亿美元,购置硬件、收罗人才,是否是正确的做法?

DeepSeek 创始人是浙江大学的计算机博士梁文锋,他很低调,很少面对媒体,只在去年接受过两次业内专访。

他谈了很多,为什么要把模型无偿公开,以及他们公司是怎么管理的。我把要点整理在下面。

(1)我们要做的不是生成式 AI,而是通用人工智能 AGI。前者只是后者的必经之路,AGI 会在我们有生之年实现。

(2)任何 AI 公司(短期内)都没有碾压对手的技术优势,因为有 OpenAI 指路,又都基于公开论文和代码,大厂和创业公司都会做出自己的大语言模型。

(3)在颠覆性的技术面前,闭源形成的护城河是短暂的。即使 OpenAI 闭源,也无法阻止被别人赶超。我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,就是我们的护城河。

(4)我们不会闭源。我们认为先有一个强大的技术生态更重要。

(5)当前阶段是技术创新的爆发期,而不是应用的爆发期。大模型应用门槛会越来越低,创业公司在未来20年任何时候下场,也都有机会。

(6)过去很多年,很多的中国公司习惯了别人做技术创新,拿过来做应用变现,自己等着摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。中国也要逐步成为贡献者,而不是一直搭便车。

(7)大部分中国公司习惯 follow,而不是创新。中国创新缺的不是资本,而是缺乏信心以及不知道怎么组织高密度的人才。我们没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。

(8)我们每个人对于卡和人的调动是不设上限的。如果有想法,每个人随时可以调用训练集群的卡无需审批。同时因为不存在层级和跨部门,也可以灵活调用所有人,只要对方也有兴趣。

(9)我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历,很有意思。很多人对做研究的渴望,远超对钱的在意。

(10)我们在做最难的事。对顶级人才吸引最大的,肯定是去解决世界上最难的问题。其实,顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事,对他们就是有吸引力的。

(11)中国产业结构的调整,会更依赖硬核技术的创新。很多人发现过去赚快钱很可能来自时代运气,现在赚不到了,就会更愿意俯身去做真正的创新。

(12)我是八十年代在广东一个五线城市长大的。我的父亲是小学老师,九十年代,广东赚钱机会很多,当时有不少家长觉得读书没用。但现在回去看,观念都变了。因为钱不好赚了,连开出租车的机会可能都没了。一代人的时间就变了。以后硬核创新会越来越多,因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。

别动不动就往体制机制上扯!创新是一个量变到质变的过程,是厚积薄发的过程。现在,这个时间点到了!中国超越美西方是历史的大趋势,我们将有幸见证这一波澜壮阔的历史!

3 阅读:13337

评论列表

用户93xxx31

用户93xxx31

57
2025-01-28 09:13

中国不缺人才,就是目前的筛选机制僵化了点,中国不缺点子,就是管理跟不上没法正确导向,中国手里好牌不缺,就看你敢不敢跟

8888 回复 01-28 12:38
都缺[哭笑不得]

用户10xxx06 回复 8888 01-29 10:53
急了没用

赵强

赵强

53
2025-01-28 11:08

只要中国更开放包容,不再压制人性,使中华民族本来性格释放,会有更多更多的创新呈现在国人面前!

用户10xxx06 回复 01-29 10:53
压制人性?你那儿看出来了?

用户10xxx97 回复 01-29 08:06
人之初,性本恶[并不简单]

陈醉

陈醉

49
2025-01-28 14:23

当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。。。。。。这句说得太好了,有力量。赞啊。

NEMO 回复 01-29 07:37
是的,说的太好了,不是需要所谓体制或制度,只是事实和过程。

用户10xxx74

用户10xxx74

44
2025-01-28 15:19

早几个月我就听周鸿祎讲到deepseek了,国内太少人关注中国科技。用“日新月异”形容一点不为过。E∪V光源.六代机及AI大模型爆发只是个开头,今后会更多,不然阿斯麦、川普为啥讲话软了呢?他们没嗅到一些气味吗?尽管我个人在单位受到了一些委屈,但我依靠自已的能力也是党的宏观政策受益者,我仍深爱这个国家、民族和这片土地。

泥丸函关 回复 01-28 17:09
有格局[点赞]

且听风吟 回复 01-29 11:24
说的真好

larry

larry

39
2025-01-28 11:18

说的真的很好,很少见到这么有深度的

行江湖

行江湖

36
2025-01-28 12:19

惊为天人,超级巨星。

用户10xxx14

用户10xxx14

34
2025-01-28 12:10

中国人非常聪明勤奋,相对内向,更适合科研,中国人只要掌握了核心技术,外国人就没什么事了。其实外国人并不聪明,只是靠的锲而不舍,我们拿出他们一半的精神就会敢超他们

齐振曦

齐振曦

32
2025-01-28 16:20

我从来就相信,一个技术大创新爆发的中国时代一定会来临!就在即将到来的10年,我从来不怀疑。

点亮那颗星星

点亮那颗星星

31
2025-01-28 22:55

体制内才有实力组织创新!所以中国必将超越美国!

曙光

曙光

23
2025-01-28 14:32

中国确实有很多想攀登高峰的人才,不为利只为贡献,只是没有平台知机会,在教学中,发现好多对科技有浓厚的兴趣和好奇。+

用户57xxx61

用户57xxx61

21
2025-01-28 10:18

👍终于看到了中国的真正的创新

老钓手

老钓手

21
2025-01-28 13:03

民企在科技创新方面有其独特优势,国家在这方面应该放宽放开。

项昵薛

项昵薛

18
2025-01-28 07:17

离不开一个求是——

用户15xxx70

用户15xxx70

13
2025-01-28 23:34

说的很对,也很尊敬这样的人,但你不建立自己的护城河,不在优势阶段打下经济基础,也许很快就会泯然众人,十年后agi都会记住你的贡献,但也许你的公司已经消失不见

星辰大海

星辰大海

12
2025-01-29 11:44

中国社会更开放包容,就要允许个别人超常行为,不能管的过严过死!同时全社会形成崇尚科学、依赖科学、科学见真章的风气。

天朗

天朗

10
2025-01-28 18:49

说实话,我很认真地看了二遍,还是没有看懂国产模型是个啥东西?做什么用?[并不简单],是我笨,还是也有许多人跟我一样看不懂呢?

用户88xxx11 回复 01-28 21:15
知道通用模型就行了。

Gilbert 回复 01-29 00:25
写文章和写程序代码的,以及经常查资料信息的,先受益。您这几方面都不从事?那可能受益晚点或间接一点。

用户15xxx72

用户15xxx72

7
2025-01-29 14:45

总结就是现在的AI水平很low,无法大规模商业化,开源能加快真正的人工智能问世,自己的护城河是企业文化跟员工,他不想局限于商人这个身份,而是探索者、开拓者,在人工智能历史上留下自己的身影。

碧海蓝天

碧海蓝天

6
2025-01-29 06:49

中国人,有智慧,有能力,开创自己的未来!👍👍👍👍👍

乐乐

乐乐

5
2025-01-28 21:26

新的用人结构和架构,也是发展的动力源泉。符合自然发展变化规律。这也是无阻力的发展方向,战争阻碍社会进步的,以后没有战争,就是科技发展到脱离地球,探索宇宙。

用户73xxx86

用户73xxx86

4
2025-01-28 21:42

事出反常必有妖 过几个月再来看看到底禁得起今天的吹捧不[滑稽笑]

三生石 回复 01-28 23:13
据说很多美国科技公司已经对deepseek做了测评和分析,确认了他的能力和open AI差不多。

王者

王者

4
2025-01-29 07:49

梁文锋这名字一听就知道很广

用户20xxx25

用户20xxx25

4
2025-01-28 15:47

因为他的母公司是个基金公司,做空那些华尔街的AI公司和老黄

用户86xxx55

用户86xxx55

3
2025-01-28 11:55

他旁边是谁?

WWWYY

WWWYY

3
2025-01-28 12:53

牛人啊!

チツ天堂口~

チツ天堂口~

3
2025-01-28 17:06

Deepseek的逻辑应该是得益于中文的理解与英文的理解方式优势。

大家好

大家好

3
2025-01-28 20:12

80后

bydagl

bydagl

3
2025-01-28 08:46

创新第一步

三毛

三毛

3
2025-01-29 08:15

对做研究的渴望,超过了对钱的在意

泥丸函关

泥丸函关

2
2025-01-29 19:52

有远见[点赞]

一定会回来

一定会回来

2
2025-01-29 22:22

你能看到的只是冰山一角!

用户10xxx89

用户10xxx89

2
2025-01-28 15:55

果然数据是23年10月的,难怪有些问题回答的有点不对

用户36xxx40 回复 01-28 23:33
12月了,确实还是滞后很多。只能联网

月淡风清

月淡风清

2
2025-01-28 14:41

[赞][赞][赞][赞][赞][赞][赞][赞][赞][赞][赞]

Betty

Betty

2
2025-01-29 09:43

说的真好[点赞]

对方正在怼入

对方正在怼入

1
2025-01-28 09:42

绮梅说世界

绮梅说世界

感谢大家的关注