魔女团新闻

经常有人问理想智驾的VLM（VisionLanguageModel）视觉语言

太空橘子啊 2024-11-18 08:19:52

经常有人问理想智驾的VLM（Vision Language Model）视觉语言模型是啥～

看个例子，Mega正确识别可变车道

即当车辆行驶到一个特殊的交通标志前，VLM能够结合图像中看到的标志形状、颜色以及导航地图中该区域的相关提示信息，理解这个标志所代表的具体交通规则含义。

0 阅读：28