【国产低价、高性能大模型DeepSeek-V3火爆西方科技圈,外媒:美国政府或调

俊笙聊武器 2025-01-26 21:25:46

【国产低价、高性能大模型DeepSeek-V3火爆西方科技圈,外媒:美国政府或调查他们高端芯片的来源!】 近日,总部位于杭州的DeepSeek公司发布了两款大模型DeepSeek-V3和DeepSeek-R1,他们凭借着优异的表现迅速引起西方国家互联网科技公司的重视。 DeepSeek两款大模型主要有三个优势,一、性能卓越,可与OpenAI掰一掰手腕;二、价格低廉,训练费用大约是目前主流大模型的三十分之一。三、开源,任何一家公司在符合规则的情况下都可以下载使用。 据了解DeepSeek-V3拥有个6710亿参数,一共投入2048片H800花费2个月时间训练。而Meta的Llama 3一共有4050亿参数,用了用了16384片高性能H100,前后花了54天,这意味着 Deepseek的训练效率比Meta高11倍。 更重要都是,开发着两款开源大模型总投入才550万美元,而Meta的一名负责研发高管的年薪就不止550万美元,关键是类似高管还有十几个,所以巨大的成本差异造成Meta高管十分警惕。 但就在DeepSeek大模型频繁登上热搜的时候,有国外媒体和专家指出需警惕这家公司使用的训练芯片! 网传Deepseek公司目前拥有五万个H100 GPU高性能芯片,按照美国法律规定英特尔不得向中国出售这款芯片,那么Deepseek公司是如何获得这些高性能芯片的呢? 土豆想说的是,这是西方媒体的一贯做法,不愿承认对方的优秀,总是千方百计的找茬、鸡蛋里挑骨头。要知道DeepSeek公司已经明确表示这两款大模型可以在性能不是特别高的芯片完成训练。    DeepSeek被美国科技圈盯上了中国大模型刷屏 Meta进入恐慌模式

0 阅读:556

评论列表

金怪

金怪

9
2025-01-26 23:31

一不小心戳破了美国人的科技骗局。

俊笙聊武器

俊笙聊武器

感谢大家的关注