11月27日,商汤绝影举办「绝影实力AI DAY」,围绕「驾-舱-云」三位一体的通用人工智能产品体系与战略布局,发布了智能座舱大模型「A New Member For U」,高阶智驾和端到端智驾等量产智驾产品,以及全新升级的「开悟」世界模型。
“一家公司能活10年肯定有自己的道理。”几天前,李斌在蔚来十周年之际的内部讲话曝光,从「风雨飘摇」走到「智能汽车的代表企业」,蔚来做了很多开创性的事。
但“十年前的竞争对手与今天完全不同”,李斌清醒地认识到,“今天我们的同行太优秀了”,接下来两三年,会是整个行业最激烈、最残酷的阶段。
恰好,今年也是商汤科技走过的第10个年头。将自己定位在AI平台型公司的商汤,过去10年间业务板块涉猎广泛,包括智慧商业、智慧城市、智慧生活以及智慧汽车等等。
“一开始很多人都要求,(希望)商汤专注在某一个垂直领域,有可能是当时最赚钱的领域,或者最有未来的领域。”商汤绝影CEO、商汤科技联合创始人、首席科学家王晓刚却坚持认为,“商汤的发展,一定是在每一个时期,都有AI创新性非常强的领域来驱动它。”
△商汤绝影CEO、商汤科技联合创始人、首席科学家王晓刚
顺应大势,一路追着风口前进的商汤,终于跑进汽车赛道。但正如李斌所言,经过近10年的野蛮生长,汽车行业即将迎来竞争最激烈、最残酷的时刻。与众多优秀的同台竞技者站在一起,商汤时刻提醒自己,机会稍纵即逝,“只有半年的时间”。
端到端明年上车,牵手奇瑞、东风
活动上,商汤绝影宣布和大卓智能、东风汽车等合作伙伴签订战略合作协议,在高阶智驾量产、端到端量产、AI云服务、AI大模型等领域开展全方位深度合作,加速自动驾驶的落地与进化。
看似商汤追上了端到端这个智驾最新热点,但其实早在2017年,商汤就已经用纯视觉做自动驾驶。
2017年夏天,在一场大暴雨中,商汤依靠只有摄像头的纯视觉方案,顺利完成自动驾驶测试任务,拿下了与丰田长达5年的合作,双方携手共同研发L4自动驾驶技术。
在没有高精地图的情况下实现自动驾驶,如今回想,不少人将这套方案视为「端到端的雏形」。
几乎是从那时起,商汤就意识到平台化的重要性,2018年开始布局算力基础设施SenseCore,包括AI原生算力基础设施、大模型生产平台、模型即服务等。
《中国模型即服务(MaaS)及AI大模型解决方案市场追踪,2024H1》报告显示,截至今年上半年,SenseCore商汤大装置已有超过5.4万块GPU,算力规模已经达20,000 PetaFLOPS,以14.8%的市场份额位居第二。
王晓刚认为,这套坚固的基础设施,就是绝影能够赢得市场的底气。
“接下来端到端最核心的点,不一定是软硬一体或者进行垂直整合,而是数据,谁离数据最近,谁的数据基础设施最强,谁能把这些数据基础设施铺到主机厂,谁在未来发展和竞争当中就有主动权。”
比起大模型本身,车企更需要其背后的数据生产管线和训练平台,通过这些能否把模型再训练一遍,是非常重要的。
王晓刚曾经举过这样一个例子,一个模型要几千块GPU一起才能训练成功,如果一般的集群训练,每20分钟就要中断一次,之后又要花一两天的时间做诊断,是根本跑不起来的,只有在一套平台下面,大模型才能发挥作用。
有了坚实的底座,大模型研发水到渠成。
2023年3月31日,特斯拉发布V12版FSD智能驾驶系统,智能驾驶行业一夜之间进入端到端时代。但早在2022年底,绝影就已经发布端到端自动驾驶大模型UniAD;
2023年4月,商汤开源多模态大模型“日日新SenseNova”,今年7月,更新至 v5.5。据介绍,在多模态能力上,“日日新SenseNova 5.5”在大部分核心测试集指标上,都对标甚至超过了Open AI的GPT-4o;
除此之外,商汤还研发了语言大模型(SenseChat-5)、多模态大模型(SenseChat-Vision)、语音大模型(Nova-tts-1)、文生图大模型(SenseMirage)以及向量大模型(Nova-Embedding)等等。
通过这些模型的建构,绝影积累了大量的knowhow,并非追随别人已经完成的模型,而是从头开始训练,有自己创新的内容。
王晓刚曾表示,虽然目前各种公司都在做大模型,但是很多人只看到了表面现象,比如Open AI演示了它能够做什么样的能力,我就去学那样的一个能力。“但其实人家的大模型就好像是一个非常有天赋的运动员,教练不需要一招一式地演示,只要输出一些方法论,他就能够学出新的动作来。”一旦应用到新的场景中,出现新的问题,资质不好的模型就干不了了。
“商汤在大模型方面累计投入超过100个亿,后面还会持续投入,这对任何一家公司来说都是难以承受的。”王晓刚认为,在智能汽车窗口期,尤其是面对特斯拉这样恐怖的对手——既做AI,又拥有大量基础设施,更重要的是每年还有数百万台新车实时上传信息和数据,这样的积累和能力很多车企都是无法效仿的。
因此,在他看来,车企和供应商之间达成有效合作,才能实现共赢共生、长久持续的发展。
汽车业务增长100%
虽然一路追着风口前进,但全力投入汽车赛道,对于商汤来说,更像是一次没有选择的选择。
无法回避的现实是,曾经被誉为“AI四小龙”之一的商汤,一直在亏损的路上。2018-2023年,仅6年就已累计亏损超500亿元。
2021年,商汤凭借在“元宇宙”概念上的前瞻布局,一度风光无限,IPO后,最高市值一度达到3000亿港元。很快,随着“元宇宙”热度消散,AI行业进入寒冬,商汤股价开始一路下滑。今年4月,股价最低跌至0.58港元/股,市值仅剩198亿港元。
放眼整个行业,商汤只是代表之一。据统计,今年上半年,34家AI上市公司中,有19家依然处于亏损状态。哪怕是手握ChatGPT的OpenAI,预计今年亏损也将达到50亿美元,2029年或才能实现盈利。
要活下去,找到能够尽快落地的场景,迫在眉睫。
“新的技术革命到来的时候,必须要打破你原有的技术体系,你的研发体系,甚至有一些组织架构的方式,谁有这样的勇气,能够率先实现变革,在竞争中就能够取得先机。”
2023年商汤开启业务重组,明确新的三大业务板块:生成式AI、传统AI和智能汽车。今年年初,商汤再次强调,将集中资源于生成式AI业务以改善现金流和减少亏损,推动核心业务盈利。
押注生成式AI,商汤终于迎来转机。
上半年业绩报显示,商汤整体收入17.4亿元,同比增长21%。其中生成式AI收入大幅增长256%,接近11亿元,占集团收入60%。绝影智能汽车业务收入1.68亿元,同比增长100.4%。
上半年,汽车业务新增交付70.5万辆,同比增长80%。累计交付车辆数达到260万辆、覆盖104个车型。同时新增15个车型定点和600万车辆定点,包括大众汽车、雷克萨斯等海外品牌。
同时,股价迎来回升。数据显示,与4月份最低点相比,商汤股价最高涨幅超过400%,市值回到800亿港元。截至11月29日发稿当日,商汤股价最高1.52港元/股,市值为524亿港元。
缓过一口气,商汤却丝毫不敢松懈。“因为在汽车行业特定的时间点上,产业的演进速度与竞争格局是非常激烈的。”王晓晨清楚地知道,“当你的技术落后了,或者是没有去交付好的时候,半年以后你可能就没有客户了。”
所以,大模型上车、端到端自动驾驶,在这个时间窗口里,能否在更短时间内拿出市场认可的产品和技术,是重中之重。
在2024「绝影实力AI DAY」上,相比于计算平台和大模型的技术宣讲,这一次商汤带来了感知体验更强的舱驾产品和量产时间。
智舱方面,绝影发布大模型产品「A New Member For U」(你的家庭新成员),能够感知和理解用户需求,提供有温度、有情感的主动关怀。
在路途中,如果在后排的孩子睡着了,「A New Member For U」就会主动做出一系列调整,例如空升高调温度,降低音乐声量,将底盘和驾驶模式调整为舒适模式等等,贴心营造一个更加舒适的睡眠环境。
智驾方面,绝影共推出三个版本智驾方案,包括AD Pro、AD Max和AD Ultra。其中,AD Pro基于征程J6E芯片打造,算力最高达80TOPS,支持7个摄像头和多个雷达;AD Max基于征程J6M芯片打造,算力最高达128TOPS,支持11个摄像头和多个雷达。这两个方案计划明年二季度实现量产。
基于英伟达Orin/Thor推出的AD Ultra,采用一段式端到端技术,算力超过200 TOPS,支持激光雷达,可实现点到点智驾、L3级高速领航以及最高支持端到端城区领航,将于明年四季度量产。
除此之外,绝影还推出了「开悟」世界模型,其生成的场景视频,时间最长为150秒、分辨率可达1080P、视角可以实现11V,预计2025年对行业开放。
据介绍,目前绝影的智驾方案已量产交付广汽埃安、一汽红旗等3家车企6款车型,座舱AI大模型产品也已上车小米SU7、智己、LEVC L380等车型,预计至今年年底,量产交付累计将突破350万辆。
有关AI行业,我看到过这样一句话,“用AI赚钱,根本不是个技术问题,而是商业与产品的问题。”如果从这个角度来看,商汤绝影已经成功向“赚钱”迈出了第一步。