说到底,也是被美国的制裁给逼得。 因为在同样的架构下,国内的训练速度与国外本来就有代差,再加上芯片被制裁,算力跟不上,差距只会越拉越大,无奈之下,幻方团队决定从架构入手缩小硬件和投入的差距,实现了轻量化的结构创新,结果一鸣惊人。 梁文峰自己也都非常意外,他没想到把价格打下来之后,直接掀起了全行业跑马圈地的价格战。 先是国内,清华大学的智普AI在deepseek v3横空出世五天后就果断跟进降价了,然后是字节、阿里、百度、腾讯等大厂的大模型接连降价,很多都是烧钱补贴,因为整个AI行业的竞争态势已经变了。 国内大厂如此,国外OPENAI降价也就是迟早的事情了,关键是美国人的成本更高,投入更大,估值更高,关键是不想降价也得降,因为deepseek的代码数据都已经公开,无数本来没有足够资金的中小公司会纷纷加入战场,把砸了几千亿上万亿的大厂们拖入了降本降价的价格战漩涡中。 接下来,会发生什么事情呢?没有人敢肯定,但有一个前提已经确定了。 那就是马斯克在1月13日说,现实世界能用来训练AI模型的数据资料,已经在2024年消耗的差不多了。很多大模型训练都是相互借鉴数据。ChatGPT5.0迟迟出不来可能也就是这个原因,那种全知全能的AI暂时就先别想了,大家手里AI大模型的水平可能拉不开太大差距,拼的是谁能更快找到应用场景以及谁能把价格打下来。 这个时候,幻方给大模型底层架构的算法创新带来了软件基础,前几天英伟达发布的3000美元家用迷你AI超算又提供了硬件基础,开发大模型的成本投入大大降低,各行各业,各个公司甚至很多个人都会开发出适合自己的AI应用。 就好像无数程序员八仙过海纷纷开发APP和小程序,整个AI生态会在未来某个时候迎来超级爆发,创造过去二十年互联网产业一样的繁荣。 最终就会有AI+电商、AI+教育、AI+医疗等等,就好像移动互联网的普及,得益于更低的成本和更好的基建,同样的技术普惠条件下,AI领域,中国也更有可能率先爆发出超级应用。 更何况,中国每年工科毕业生超全球总数1/3,已经储备了超过600万理工科研人才,搞不好从哪冒出一群批人就把老外给超了。连梁文锋本人都曾自豪的说,他们没有海外回来的人,他们也没有世界前50名的顶尖人才,但是他认为他们也许能自己打造这样的人。可见这群新技术极客身上,不再妄自菲薄。 无论如何,扎克伯格有一点没说错,接下来依旧是中美两强的战争,只不过决定胜负的时间点谁也说不好,唯一可以肯定的是,前期投入大量人力物力财力的公司无论中美,肯定会死掉一大批,一次重大泡沫危机也必不可免,甚至倒掉上一个时代的巨头,然后给新的AI巨头提供空间和养料。 总之,新架构的横空出世、训练数据的提前枯竭以及个人AI超算的到来,三个领域,两个国家,几个大佬不约而同的共识,不是巧合,显然已经勾勒出了未来的大致轮廓。