地平线征程 6 平台也是可以上 VLA 的。
★到底什么是 VLA?
第一代端到端主要是系统一(端到端)、系统二(VLM)为主。
系统二像老师,系统一是个学生。系统一做不会的问题就问老师,老师答。
但难题在于老师不太会开车,所以老师很难出一个精确轨迹执行开车,所以只能传递信号给学生,并不高效。
VLA 把它们合二为一,没有了老师和学生的关系,而是合成一个大脑系统,老师变成了直接参与了决策,学生负责执行,而不是传递纸条的关系。
★地平线的 VLA 叫做分层式 VLA。
去年地平线发了一个论文,主讲了一个 Senna 模型,感兴趣的同学可以翻阅。
分层其实也是一种话术,简单理解就是系统二 VLM 本身是视觉语言模型系统,所以它只负责更高维的决策模型。他比学生有经验,更懂复杂的世界环境。
比如懂路上的交警、泥头车等特种车,还包括 SR 中我们看到的各种具备三维能力的推理信息,可以告诉学生你怎么开。
而端到端本身胜在一些精确数值的预测,更会算,比如处理一些规划轨迹的预测,变道、绕行、窄路的通行等,轨迹出的更类人和丝滑。
这样一来 VLA 很好避免过去我们体验的一些系统明明看起来决策很老司机,执行起来却崩溃了,也就是有下限问题。还有一些执行起来一部分很“端味”但有一部分有浓浓的“规则感”。这些都因为加了规则,干预了一些体验。
所以 VLA 它不是一个算法,更好的理解应该是一个架构。它改变的不是单一某个体验维度,而是整合系统本身。所以今明年上了 VLA 系统的软件,体验有很大不同。
★SuperDrive不是重点,重点是明年有很多“小SuperDrive ”
地平线征程 6 最大的作品就是 SuperDrive ,第一个客户签订落地的时间是今年三季度,这样反而给地平线留足了开发时间。
而且比较恐怖的是地平线不是单芯片、单软件作战。明年有大量的小“征程6”芯片,小“SuperDrive”软件上车,还有更具吸引力的价格,这才是最具重要性的。
最近有大量媒体同学一起实测,也会释放很多体验的信息,大家可以围观…