目前,自动驾驶已经积累了很多数据算法和经验,甚至包括标注过的数据,都可以沿用到新

奇玮的趣事 2024-09-21 11:20:16

目前,自动驾驶已经积累了很多数据算法和经验,甚至包括标注过的数据,都可以沿用到新的领域。 但是与操作型机器人相比,自动驾驶有一个比较难处理的问题——在自动驾驶中的一切前提都是避免碰撞,而操作型机器人的一切执行目的都是为了操作和物理接触。 但对环境的理解和移动,这个技术可能还不成熟,但我不认为这是根本性的技术挑战。 涉及到操作就是另一个故事了,操作的最大问题在于,操作对象太多,当前第一步是攻克刚性物体的非精确操作,这个问题现在也还没有完全解决。 当前采用的主流方法是模仿学习,通过反复操作来学习。但这个过程中,各家技术有所不同,有的需要几千次甚至更多的操作才能学会。 刚性物体操作更多的是对操作臂的控制,而未来肯定要往精确操作和非刚性物体方向发展。 比如给人刮胡子、翻身,这就是操作活生生的人,叠衣服等都是非刚性物体的操作,要求更高的准确性,比如插电子元件。 我们在大模型的应用中也有不同的投资,比如推理芯片、光芯片、RISC-V应用等,投得最多的还是机器人。 尽管在操作上,尤其是上肢操作方面,未来两三年内可能还不容易实现通用的“基础模型”。数据不够,标注的更少,所以更多的是专用场景的泛化模型。 假如我是一个能识别室内物体并能带着你移动的机器人,这在某种程度上是可以讲得通的。 目前大多数人认为,由于操作对象多且操作交互方式不同,更多倾向于就事论事,比如搬箱子就训练搬箱子的模型,捡零件就训练捡零件的。 很少有人尝试做一个能进行各种操作的基础模型。要构建这样的基础模型,可能需要从小的例子开始,慢慢合并一类东西,再扩展到其他领域。 回到机器人的下肢问题,目前强化学习对下肢运动有一定的效果。 我们讲的是跨平面运动,包括上下台阶、楼梯、爬坑等。这类运动是有可能单独出基础模型的,因为它综合了视觉、触觉与运动控制。 之所以谈论语言大模型能出现的原因,是因为其内在规则和数据多样性支持了它的泛化能力。 而今天热衷的居身智能机器人,大模型能否直接迁移过来还有挑战。也许上肢需要垂直场景下的中小模型,而下肢有可能实现基础模型。 同时,现有的语言大模型在任务理解和规划上肯定有帮助。这也是居身智能热起来的原因之一,因为过去你很难告诉机器人去做什么,通过自然语言,现在你可以更方便地指示机器人做事。

0 阅读:4