算力超500TOPS的智驾芯片,小米先投了

马氪说汽车 2024-11-02 08:06:35

10 月,北京亦庄深秋的季节里,空气格外冷冽。

与此同时,世界智能网联汽车大会上的展厅内,人潮涌动。

台下坐着的,是亦庄产投、蔚来、小米、经纬恒润等一众投资者角色,他们目光交汇在一颗芯片上。

这颗芯片来自辉羲智能,这家初创企业用两年时间,研发出第一颗数据闭环定义芯片——光至 R1。

造一颗芯片的难度,不亚于造车。

辉羲智能创始人徐宁仪把这项突破比喻为攀登上海拔 7500 米的慕士塔格峰。

登顶慕士塔格峰意味着达到国家一级运动员的标准,辉羲选择把芯片对标 OrinX,代表其挺进了国际造芯第一梯队。

7nm 制程,拥有 450 亿个晶体管,符合车规级要求;500TOPS 算力,相当于两颗 Orin;8 核 SIMT 架构,24 核 CPU,15 核 GPU;带宽超过 200GB/s;

2025 年,光至 R1 将率先在一家国际车企上量产上车。

辉羲还定下目标,要让这颗芯片成为国内量产上车速度最快、业内最好用的大算力智驾芯片。

芯片市场已经群雄林立,前有英伟达等巨头企业占据大量市场份额,后有黑芝麻、地平线等上市企业分食剩余市场蛋糕,辉羲想要冲出重围,它需要做出更极致的动作。

这个极致包括产品性能、交付速度、降本增效等。

同时,辉羲必须保证,从决定造芯的那一刻开始,迈出的每一步都不容有错。

01、造芯方法论:打造可扩展的数据闭环

1950 年,阿兰·图灵在著作《计算机器与智能》中,描述了通向通用人工智能的两条路径:

基于抽象计算,聚焦抽象任务所需要的人工智能,做针对性算法训练,比如国际象棋;基于具身学习,给机器配置传感器,像人类幼儿一样与环境互动,培养感知、学习与认知能力。

两种路径的区别是,前者依靠规则,应用范围有限,但上车快;后者强调智能,泛化性、适应能力强,但要求极高的数字基建能力。

图灵认为,这两条路径,都值得探索。

于是,在人工智能 70 年的发展脉络中,两条路径以一种递进式关系,迸发出了技术变革的巨大火花,形成四个阶段的演进:

第一阶段,计算智能,通过深度检索与相应算法,一台名为「深蓝」的超级计算机打败了人类世界冠军;第二阶段,感知智能,在 CNN 算法与 GPGPU 硬件协同下,机器完成了对十亿级别人脸数据的记忆与检索;第三阶段,认知智能,基于 Transformer 算法与专用芯片架构的应用,ChatGPT 展现出大语言模型的交互能力;第四阶段,具身智能,同样在算法与硬件作用下,机器拥有了类人思维模式,真正接棒了探索、创造物理世界的任务。

随着问题规模的增长,数据处理量级从 10ZB 进阶到 1000ZB,算法结构、硬件架构进行了相应扩展,指数级增长的性能要求得到满足。

这种可扩展性的能力,充当了驱动技术变革的强力引擎。

现在的辉羲,就站在第四阶段的端口,踏上了图灵口中的第二条路径。

它的任务,是造出一颗支撑高阶智能驾驶,满足具身智能要求的高性能芯片。

而它的方法论已经明确,正是瞄准算法、硬件的可扩展性,打造出高效的数据闭环。

建立在这条方法论之上,辉羲定义了首颗芯片的基本样貌。

一是从数据闭环的系统需求出发,在芯片设计上首次做到,一颗芯片,满足三大应用场景,即:

数据采集:连接多条视频处理链路,支持影子模式等;实时控制:在处理复杂运行工况时保持高帧率、高吞吐;算法验证:数据解码后进行回灌测试,完成推理训练。

二是在架构设计上,满足可编程性的要求。

辉羲把芯片架构定位于「领域通用架构」。

它介于传统 CNN 与 GPGPU 硬件架构之间,既满足重点领域性能要求,比如智能驾驶,同时支撑它的演进。

辉羲在分析了智能驾驶与具身智能算法特征之后,研发了一套图灵完备的指令集。

图灵完备,意味着这套编程语言,可以像图灵机一般解决任何计算问题,它可以让用户,随心所欲地支配先进算法,包括现在的端到端技术架构。

由此,辉羲的光至 R1 展现出了对标英伟达 OrinX 的能力。

从参数对比可以直观看到,根据已公开的数据信息,光至 R1 在制程、功能安全方面,都与 OrinX 保持在同一水平线,而在算力、CPU 性能方面,光至 R1 展现出一定优势,这意味它拥有更强大的通用计算能力。

在发布会上,徐宁仪以加速 Transformer 算法模型为例,结果是,光至 R1 的算子性能提升能力,是 OrinX 的 9 倍,甚至在个别配置上达到了近 20 倍。

毫无疑问,这是一颗原生于大模型时代,服务于领域通用计算的高性能芯片。高阶智驾,是辉羲智能最直接的应用场景。

02、充分利用算力,裕量高达 60%

回溯神经网络模式的发展史,起初人工智能行业锚定的关键词是「BEV」。

这种多传感器结合鸟瞰图的感知路线,成为自动驾驶识别障碍物的基本路径。分辨率上升后,BEV 网络模型由稀疏栅格进阶为稠密栅格。

随着感知精度的进一步提升,神经网络模型由二维转变为三维的 Occupancy 网格,能对通用空间障碍物进行判断。

再往后,AI 技术的加持下,「端到端」网络成为了各家竞争的主要筹码。这种从感知到决策一体化的神经网络模型,能通过自我判断应对多样化的极端场景。

需要强调的一点是,从「BEV」到「端到端」的模式演进过程中,算力成为了每个节点质变的筹码。

这与强化学习教父 Richard Sutton,在《The bitter lesson》中写下的箴言构成了回振。

Richard Sutton 认为,要充分利用算力,避免过度依赖人类知识,重视搜索与学习方法。这是最终,也是最有效的方法。

底层逻辑是摩尔定律,计算成本持续呈指数级降低,计算能力同样不断呈指数级提升。

这种负相关反应贯穿始终,是人工智能技术突破的关键。

而辉羲,抓住了这把算力钥匙,打开了摩尔定律的大门。

辉羲的光至 R1,清晰地定位于大算力芯片:

500TOPS 的深度学习算力,意味着它能够从容应对各种新的模型结构。同时,光至 R1 拥有高效的异构计算能力。所谓异构计算,是指在新的计算形态下,将不同类型的计算需求合理分配到不同的处理单元上,实现系统效率的最优解。

光至 R1 配置了 CPU、NPU、GPU、ISP 等多样的协同处理加速器,这些加速器在自动驾驶场景下,灵活分配对应的计算需求,使得算力能够进行充分配合,满足系统可靠性、稳定性的第一需求。

另外,辉羲给芯片性能加上了一道严谨的安全防线。

信息安全层面,光至 R1 在启动和执行过程中,除了常规解密算法外,还支持国密 SM2/3/4,确保用户信息流安全。

而在功能安全方面,辉羲同样在这颗仅有 7nm 芯片的复杂工程中,把道场做大。

在基本功能安全方式之上,辉羲新增了 RIF 架构,即一套分级、分域的诊断机制,让用户能够根据系统设计的需求,灵活配置与裁剪不同的情况,可以在局部处理单元处理问题,也可以层层上报至外部独立的 MCU 系统中。

这种创新性的安全设计,给车规级芯片做到有效把关。

总结就是,这是一张为自动驾驶服务的专业级芯片,它能够形成一个强大的数字基座。

辉羲在这个基座上,基于「BEV+Transformer」的算法架构,打造出了高阶城区无图自动驾驶解决方案——RINA,支持不依赖高精地图的城区 NOA,具备从感知到路径规划的端到端处理能力。

徐宁仪表示,这套方案能够实现 60% 的算力裕量,系统层面可以做到降本 40%。

这意味着,即便出现计算要求更高的模型,光至 R1 能够以一种高性价比的方式,轻松拉动数据、算法、算力三驾马车。

03、最快量产上车,12 个月内完成交付

所谓三年磨一剑。

辉羲把这个时间,缩短到了两年半,造出首颗芯片。

某种程度上,「高效」的确是当前自动驾驶行业中最具杀伤力的武器。尤其在各家都在拼端到端大模型上车的阶段,谁交付越快,量产上车越早,谁就能在智能化下半场掌握更多话语权。

9 月底,辉羲光至 R1 流片成功后,立刻被交到了合作商手中,进而推动了 2025 年与国际车企的量产合作项目。

另外,高效这层价值建设,也得益于辉羲在「好用」层面上的努力。

毕竟,芯片是一项系统性的大工程,它不局限于在硬件性能上造壁垒,而在于软硬一体的稳定性、可靠性能力,以及整个供应链的协同性构建。

这也是蔚来、小鹏等车企选择自研芯片的原因,因为能够从根源上满足智能驾驶需求,掌控系统优化全流程。

在这种背景下,芯片企业的供应链服务能力排在了下游合作商的考核首位。

很显然,辉羲在这点上也做得非常完善。

比如硬件层面,辉羲提供了进一步的硬件解决方案——RCM,这是搭载光至 R1 最小系统子卡,具备可插拔式设计,支持同一款母板,不同子板的即插即用,并与 Orin 生态做到兼容,未来还能实现整车所有接口设计不动,轻松升级算力;以及域控制器硬件的设计,支持一块或两块子卡,单域控算力超过 1000T,是车上强悍的中央大脑。

在软件层面,它设计了一套功能完备、用户友好的 AI 工具链,能够兼容常见的神经网络模型格式,将数据编译成在芯片上高效运行的指令集。

值得一提的是,基于这套工具链,用户在 30 天内可以实现模型平台的迁移,从而降低研发成本。

最后,通过这种体系化的建设,辉羲能够在 12 个月内,完成一个智能驾驶量产项目从启动到交付的全过程。

实际上,辉羲对于高效能力上的注解,体现其对于芯片未来生态的前瞻性洞察,即懂技术、懂创新、懂车企的芯片企业才更具竞争力。

而辉羲从诞生起,就已经置身于这个框架设定中。

翻开三位创始人的履历,就能看到一种来自互联网科技企业、车企、高校的同频共振。

其中,徐宁仪曾担任微软亚洲研究院硬件计算组负责人、百度智能芯片部主任架构师、阵量智能 CEO 等职位,是业内少有的主导过多款 AI 芯片设计并实现大规模商用的 TOP 级专家;

章健勇曾任蔚来汽车自动驾驶助理副总裁,从零开始组建团队并搭建自动驾驶技术平台,主导过多个高阶智驾项目的首发量产;

贺光辉的身份则是上海交通大学教授、电子信息与电气工程学院副院长,长期从事高能效数字系统芯片和高算力芯片互连技术研究,入选国家级高层次人才计划。

由此,三位创始人基于学界、业界的不同语境,赋予了辉羲这家芯片企业正确、全面的战略视角。

当然,这更不乏资本的高调关注。

成立两年半时间内,辉羲已经到达了 A 轮融资阶段,融资金额达到数亿元。

而在诸多投资者中,可以看到亦庄产投、国汽投资等产业角色,以及真格、卓源亚洲、朗玛峰创投、元生资本等知名投资机构,还有一些供应链上下游角色,比如经纬恒润、商汤科技这类智驾供应商,以及小米、蔚来等车企,都对辉羲展现出极高兴趣。

可以确定,首颗芯片的问世,意味着辉羲已经给资本交出了一份优秀答卷。

并且,这份答卷还不局限于智能驾驶范围,辉羲把星辰大海定得更高远——具身智能,在这个阶段,需要面临更复杂的三维空间任务,与更加泛化的场景与交互类型。

而光至 R1 已经展示出了应对具身智能挑战的能力,比如完成简单的指令理解、动作控制与规划等。

很显然,躬身入局芯片市场,辉羲已经在开端把调起高。这意味着,凭借芯片的高性能与快速的交付能力,它注定成为搅动芯片市场格局的一个新变量。

0 阅读:0