市场对幻方DeepSeekV3大模型的讨论

薄皮大馅西瓜 2024-12-30 11:31:50

市场对幻方DeepSeekV3大模型进行了讨论，甚至有人认为幻方能用极低的成本完成对大模型的训练，这证伪了算力的需求空间。但这种观点其实是很片面的。首先，Deep SeekV3并非通用大模型，多模态、通用大模型在训练上是不可能用这么低的算力实现的。而未来大厂会搭建的一定是多模态通用大模型。这也是为什么国内大厂对算力动辄几百亿投资。其次，幻方的算法很可能没计入数据清洗等成本，如果采用传统的统计方式，训练价格会相应的增加。最后，周末上海出了建设算力集群的政策规划，计划到2025年建设超过100EFlops的算力，换算下来约等于1000万张英伟达3060gpu。这个是最直接的证明。不管技术上如何进步，未来对算力的巨大需求都是板上钉钉的。#DeepSeekV3

0 阅读：0

薄皮大馅西瓜

职场上的那些事~

作者最新文章

1

泰国真的不能去，泰国就是贩卖人口的中转站，去了各种陷阱等着你。就拿去年的数据

2

21岁的中国女孩吴佳琪独自去泰国旅游后失联了。她是第一次出国旅游，跟着网上认识的

3

王星被朋友金灿骗去缅甸搞电信诈骗，囚禁殴打！还好，警方跨国合作把他救回来了。

4

泰国在这一诈骗乱象里也扮演着复杂的角色。尽管有泰国警察承认境内存在协助诈骗的公司

5

为何诈骗集团对明星群体如此“青睐”？一方面，明星的高曝光度使其拥有庞大且忠

6

西藏地震，亲历者讲述: 卓玛，地震时，卓玛正在定日县珠峰三路三楼的家中睡觉，睡

7

地震逃生，一定要记住这3点： 1.不管你住在1楼还是30楼，地震刚发生的几十秒

8

地震震级有 6.8 级，能量巨大，关键震源深度才 10 千米，是浅源地震，那破坏

9

泰国警方强调必须确认王星是人口贩卖受害者才能让他回国，也就意味着，泰国警方对王星

10

西藏定日县地震，已致53人遇难62人受伤。今天（1月7日）上午9时05分，在

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

职场TOP

1

南京师范大学宋老师的“办公室”可不是两人学术交流的地方，而是两人的战地。根据知

2

勒布朗.詹姆斯今天拿到了职业生涯的49999分，离50000分仅差1分。下场比

3

真有这种招聘吗？

4

休假完回到单位，一进办公室，看见个年轻女子坐在我的位置。我诧异的问:“您找我什么

5

白➕蓝职场搭配

6

如果这待遇，不用招聘，得托关系进。

7

我办公室四个女同事，就我一个男的，只有一个共用的洗手间。最尴尬的事是上洗手间

8

难怪今天办公室一股味儿，原因可算找到了。

9

这简历，是不是称得上位列仙班了

10

现在泽-川会谈已经结束。刚刚在椭圆形办公室发生的事情非常严重，因为全世界都看到了

职场最新文章

1

大厂“反内卷”：从“996”到“强制下班”，职场风向大转变近日，大厂开启“不准

2

63岁的张凯丽，两会发声，一句话让2.4亿打工人破防！“35岁就被职场嫌弃，

3

纪委抓贪现场曝光，第一次见这么抓的，两人抓手掐肩，一人一人拽着皮带，从办公室拎出

4

我们办公室有个女同事，她女儿现在读初二。她老公是那种稳稳当当的人，每天朝九晚五，

5

与同事表面上处好关系与领导私下处好关系前几天看到这句话的，真的！很认同！怎么做？

6

被AI弄的很惨的职业，已经开始了！1.律师全球最大律所已经开始裁员了。

7

喝酒时曾听闻一位职业保安的传奇经历。此人专挑一二线城市的别墅区应聘保安，时间久了

8

上班后才知道，人心有多坏，有多么毒辣，你老实你实在，就是一个傻子，你干活累死老板

9

杭州开始打响第一枪！杭州市教育厅办公室发布通知：凡是在杭州市有工作的家庭，

10

那天，女领导从海外出差归来。下班后，人事部门人员拿着一份名单通知大家：晚上领导请