经常有人问理想智驾的VLM(Vision Language Model)视觉语言模型是啥~
看个例子,Mega正确识别可变车道
即当车辆行驶到一个特殊的交通标志前,VLM能够结合图像中看到的标志形状、颜色以及导航地图中该区域的相关提示信息,理解这个标志所代表的具体交通规则含义。
经常有人问理想智驾的VLM(Vision Language Model)视觉语言模型是啥~
看个例子,Mega正确识别可变车道
即当车辆行驶到一个特殊的交通标志前,VLM能够结合图像中看到的标志形状、颜色以及导航地图中该区域的相关提示信息,理解这个标志所代表的具体交通规则含义。