经常有人问理想智驾的VLM(VisionLanguageModel)视觉语言

太空橘子啊 2024-11-18 08:19:52

经常有人问理想智驾的VLM(Vision Language Model)视觉语言模型是啥~

看个例子,Mega正确识别可变车道

即当车辆行驶到一个特殊的交通标志前,VLM能够结合图像中看到的标志形状、颜色以及导航地图中该区域的相关提示信息,理解这个标志所代表的具体交通规则含义。

0 阅读:28