Sora火了,但想抢光模块的人大概率没看原文,因为这个视频模型参数量大概只有3B;看着ARM大涨,转头想买AH股AI芯片的人,大概率没弄清ARM的商业模式是IP内核授权。
几个Sora的60秒视频,让“原定10年后到来的AGI可能会提前至1年”的声音不绝于耳,但真正的艺术从来不是:“哇,好美啊!”因为即使脱离开艺术,很多商业化的作品,无论武侠小说、《热辣滚烫》还是氪金游戏,都有属于自己完整的制作套路——每一步都是为了切中人类的内心共鸣点。
所以——这是基于“涌现能力”的AI所天然欠缺的。而真正Sora让人惊艳的其实是:“damn,居然还能这么玩?”
视频,是由无数个单帧图片构成的;生活,是由无数个60秒片段搭建的;世界,是由无数个IP内核赋予的。很多事情从没变过,就像美股一天比一天贵、AH股一天比一天便宜,同时也像把固有的“找对标”思维放到AI板块,散户回本所需要的涨幅越来越高。
先说我个人从ARM大涨和Sora爆红找AH股映射的逻辑:Sora是利用视觉补丁visual patches与卷积网络结合,用——“算法”,实现参数更小情况下的更精确AI模型涌现;而ARM是利用IP内核授权来解决未来AI的——本地化和碎片化市场。
所以找对标,应该找的是AI商业模式,找也要找Sora和ARM的两个核心:完整的算法平台、能本地化部署的AI模型调用(MaaS)。下面行文部分,会先分析Sora的白皮书原文逻辑,因为要根据一手资料的事实做推论,免得被黑;后文会避开一些大热的标杆股,列举一个H股对标致富代码@百融云-W(6608.HK),省着被骂。
Sora的理论基础,是“一张图像胜过16x16个单词”,transformers架构在计算机视觉领域的应用效果是比自然语言处理要差的,因为在视觉任务中,注意力要么与CNN(卷积网络)结合使用,要么用于替代卷积网络的某些组件,同时保持其整体结构不变。Sora的论文展示了其对CNN的依赖并不是刚需,并且直接应用于图像补丁序列的transformers在图像分类任务上表现很好,同时需要较少的计算资源进行训练。
所以第一个重点,Sora生成的60秒视频效果惊艳,是因为——“算法”。CNN卷积网络的作用,是让AI视频模型类比人脑的思维方式,本质是算法的一种。比如当AI识别图中的小狗,通过判断狗的面部及形体特征来进行归类。卷积层完成基础任务之后,池化层则开始为了让训练的参数更少,在保持采样不变的情况下忽略一些信息,最终在全连接层完成总结。重点在于卷积层,所谓“卷积”,就是2个f(x)函数的叠加,应用在图像上,则可以理解为拿一个滤镜放在图像上,找出图像中的某些特征,而AI模型需要找到很多特征才能区分图中的狗。视频生成也是一样,当有了更精细的提示词和更多滤镜,Sora生成的视频长度和精度才会更高。
为什么开篇说,看到Sora之后第一时间想冲CPO的人没读原文,是因为OPEN AI的技术架构就是在为了在CNN的池化层节省算力的同时,尽可能更精确的“涌现”。说简单点,就是少浪费点算力,用算法的优势生成更好看的视频。所以比起不断卷AI模型的参数量,不断消耗算力,不如在算法的精度上下文章。但是AI算法之所以差距很大,原因就是因为实体层面的商业经验决定了算法的多样性。所以要找的对标公司,必须有一个“算法平台”。能搜到的相关公司很多,但“涨出来的基本面”不宜多提,像百融云这种才翻过1倍、回踩完、有ORCA算法平台的AI公司,拿出来举个例总不会至于被说是引导散户去接盘。
Sora之所以能有那么出色的效果,是因为参考了LLM当中“把统一代码、数学和各种自然语言等多样化文本模态进行标记”的原理,将LLM中使用的文本标记text tokens,继承为了Sora中使用视觉补丁visual patches。就是将视频转化为补丁,就能将视频压缩为较低维度的潜在空间,然后做成一个视频压缩网络。所以Sora才可以对宽屏1920x1080p视频、纵向1080x1920视频以及其中的任何尺寸进行采样,以原始纵横比为不同的设备创建内容,甚至进行视频内容的拓展和延申。
说简单点,Sora的最大突破就是用视频补丁,来与CNN的多个函数(也就是AI算法)叠加组合,然后用更精确的视觉补丁来让卷积网络更精确的涌现,同时节省算力。那么要找的对标公司,必须在AI算法上很精通,而不是一味的卷参数。
那就继续拿百融云举例,这家公司的客户有一半是金融业的,他要解决的事情就是帮金融机构完善用户画像、提供信贷或者理财产品,最终提高KPI。金融机构的用户信息会涉及很多,但最终决定理财产品和信贷投放的,无外乎用户的年收入、资产情况、银行流水、社会关系网络。那仅有的几个信息维度,就需要依靠AI算法来推测用户潜在的金融属性。比如已知函数f(x)=用户家庭年收入50万、无贷款、银行全年流水支出35万元、无复杂社会关系网络及股权钩稽关系,那百融云这种公司大概率就会通过这些特征,来彼此构建算法关系,然后进行信贷及理财产品推荐的扩展。跟Sora生成视频应该是一样的逻辑思路。
如果按照整个财富管理和同业头部玩家的规模来算,比如1000亿元的财富管理市场,促交易会拿到1.5%-1.8%的服务费用,百融云通过AI算法作为基石的BaaS业务应该能算出未来的潜在业绩空间。
另外一个假期期间刷屏的公司是ARM,原因是2月7日披露的Q3财报和Q4指引超预期,而业绩上涨的核心原因还是因为AI需求。因为AI是个比较碎片化的市场,不是规模化效应,所以B端客户对于本地化和私有化部署要求很高。ARM预计未来各类终端,比如手机、PC、汽车等都会加入AI,而他们为终端AI设计的V9芯片(v9升级主要集中在向量处理等AI计算能力提升)授权收入占比已经由23Q3的10%提升到了23Q的15%。另外英伟达也要开始下场做ASIC,目的就是为了保证下游客户的差异化需求,之所以英伟达老黄之前不做这一块业务,是因为相比起GPU,定制化的ASIC用途单一且毛利低。但是AI定制化大势所趋,能满足客户的差异化需求才能保住饭碗。
但是A股和H股的AI芯片公司跟海外是一个水平线上的吗?显然不是。所以“硬对标”不如“软对标”,比起看“产品”,更重要的是看“模式”。百融云的MaaS业务肯定不是唯一的“类定制化”AI业务,但既然拿他举例了,就不拿其他AI公司说事儿了,免得拉踩。
百融云这个MaaS业务,中文名叫模型即服务,就是客户自己来调用百融云的AI模型。比如电商的客户需要用AI辅助决策下一个季度的主打产品、汽车业客户需要用AI来测算新款车型下线之后用多大折扣力度清理老款库存、物流业客户需要用AI来综合规划特定时间段的发货安排、金融业客户用AI的地方只会更多。所以百融云的MaaS业务在我理解,本质是百融云给客户提供一个AI平台,让客户去自我实现。你想成为什么样的企业,就自己去调用自己需要的AI模型;百融云要做的事情,就是尽可能寻求算力参数、用户意图与实时反馈之间的平衡,让模型性能调优、场景变多。本质上也是跟ARM一样,找一个能解决AI碎片化市场的解决方案。
至于Sora出现之后,越来越多的人担心自己的饭碗会被AI抢走,其实也不至于。因为“降本增效”其实是一个组合词,AI是为了增效的,但有些行业会选择直接降(cai)本(yuan)。所以不是AI的锅,而是——“不会用AI”的锅。