嘿,家人们!最近中国的人工智能初创公司 DeepSeek 那可是在科技圈里火得一塌糊涂,赚足了大家的眼球。你们说这事儿奇不奇怪,特朗普刚讲 DeepSeek 传递出积极信号,结果转头 美国对deepseek下手了 ,这一连串操作,真让人看得一头雾水,直呼看不懂啊!
当地时间 1 月 27 号,特朗普表示,DeepSeek 的崛起得给美国企业敲响“警钟”了,还觉得这说不定是个积极信号呢。为啥这么说?他觉得这意味着说不定不用砸数十亿资金,就能找到同样不错的解决方案。可谁能想到,1 月 28 号,美国好几个官员就跳出来,硬说 DeepSeek 是“偷窃”,还要对它展开国家安全调查。更离谱的是,美国海军早在 24 号就发了警告信,严禁他们的工作人员使用 DeepSeek 模型。
这 DeepSeek 到底凭啥有这么大影响力啊?就说它推出的 DeepSeek - R1,价格那叫一个美丽,才 2.2 美元/百万词元,再看看同性能的 OpenAI - o1,要 60 美元/百万词元呢,DeepSeek 的费用大概只有 OpenAI 的三十分之一。而且啊,在训练成本这块儿,DeepSeek 更是把美国公司远远甩在身后,还不到 600 万美元,仅仅是同性能模型的 5%到 10%。这性价比超高的优势,还有独特的创新模式,简直就像一颗重磅炸弹,把美国大模型的垄断地位炸得七零八落。就拿 Meta 来说,耗费了老多资金去训练 Llama,结果效果还比不上 DeepSeek,这差距一目了然啊!
从技术层面看,DeepSeek - R1 还尝试了直接强化学习、多阶段渐进训练和模型蒸馏等技术。美国那些人所谓的“偷窃”,指的就是模型蒸馏技术。但这技术在资源受限的情况下是很常用的,DeepSeek 也主要是针对开源模型进行蒸馏优化,这怎么能算“偷”呢?
现在啊,DeepSeek 正承受着来自美国的各种压力,不过它的实力和潜力那可是大家有目共睹的。我真心希望 DeepSeek 能顶住这股压力,继续为全球人工智能的发展贡献咱中国的智慧。话说回来,大家觉得 DeepSeek 能不能突破美国的“围剿”呢?快来留言区说说你的看法,咱们一起讨论讨论!