钛媒体对话王兴兴:有生之年,人形机器人将重塑所有行业(3)
摘自 饶翔宇 钛媒体
“所有的技术突破运气,
成分都是占很大部分的”
钛媒体APP:机器人模型具体指的是什么?
王兴兴:你可以认为,首先最简单直接的就是运动能力很强,适用于大部分地形,甚至可能有些运动能力比人还好很多。比如说跃障能力、速度、跳的能力比人可能还好一点。
另外一部分就是去工厂里干活,他可以干很多活,而且是不需要人为编程的。通过大模型的能力,只要稍微教他一下,他就是可以自己学会,然后就干好了。
钛媒体APP:还需要仿真环境的模拟训练吗?
王兴兴:可能不太需要。你训练好了,你确认好了,就不太需要仿真了。当然硬件完成可能需要时间,但我觉得这个仅仅是时间问题。
而对于AI,还是有点不确定。虽然刚刚说我个人比较乐观,2025年年底之前会出现,但也有可能不是,可能3—5年都没有做出来。这得看全球人类的运气,有时候就得看运气?
钛媒体APP:怎么理解这种运气?
王兴兴:技术突破很多都是看运气的。举个例子,如果没有爱因斯坦,他的那些理论估计也会有人发现。但是可能晚几年,甚至晚个几十年。就是你可认为,所有的技术突破运气成分都是占很大部分的。
钛媒体APP:还有一点,大模型的突破除了算法和模型,还有数据。现在数据收集是不是存在很大难度?
王兴兴:需要做的事情确实挺多的,但其实也是有方法的,没有大家想的那么复杂,很多问题都没有大家想那么复杂。你也知道,就目前所有的科技领域,如果你真的去看,没有什么复杂的东西,相对都是比较直接、简单。哪怕是光刻机,也就那么点东西。
钛媒体APP:所以你们这个行业是不是也分成两派,乐观和悲观。比如你偏乐观,觉得整个事情没有那么困难。
王兴兴:肯定是需要时间和脑力投入的,但这些事可以解决和推进的事情,并不是像常温超导体、可控核聚变这样的问题。
常温超导体、可控核聚变最大的问题是什么,就是它在物理原理上有没有可能是个问号。可能这个宇宙就不允许这种东西存在,人类花再多时间精力也不可能实现。
人工智能机器人这种东西,它是个很常见的东西,不是什么高明的事情,就是一堆人、一堆动物的智能。智能,是个很普遍的东西。有些动物很聪明的,很多人的话都能听懂,只是他不能说话。还有乌鸦,有些乌鸦甚至是可以直接用工具的。
所以,智能这种东西没有很多限制性,没有什么物理约束,是可以被复现的。
钛媒体APP:推动你来做这件事情的最大动力是什么?
王兴兴:其实推动我个人最大的原因是AI。
早些年有投资人问我,你们公司做不做人形机器人,我跟他说我们死也不会做。
原来的人形机器人太复杂了,你用传统算法根本没办法驾驭这种复杂机器。传统人形机器人的训练算法,相当于是靠一些聪明的人类大脑去写一些数学方程式,然后去求解这个方程,制定机器人的运动轨迹。但这些方程式有很大的局限性,一旦环境出现变化,可能就没法用了,需要重新设计新的方程式。
这样的训练方式会导致代码量非常大,而且当系统复杂到一定程度,单纯靠人力是无法维护这个系统的。但是对于AI来说,只要模型搭建得足够好,然后不断给AI投喂数据和算力,AI就可以不断地试错。利用强化学习算法中的奖励机制,AI就能自动把好的训练结果留下来,坏的扔掉,训练效率得到质的提升。
目前AI的技术进步,包括AI能力是远超我个人的预期。所以,你可以看到我们的人形机器人之前差不多只做了一年多的时间,现在性能已经非常非常好了。我们做这么快原因很简单,就是因为AI的技术进步。
AI的好处就是,你只要这个模型搭建得很好,剩下的问题你就丢给算力,你不用管。你觉得要测试的场景,OK,你再给他推点数据,你也不用管。所以你可以看到,像特斯拉的自动驾驶团队的人比国内的自动驾驶团队少很多少,非常多。我知道他们大概只有几百人,中国的很多团队一个公司可能有几千人。
钛媒体APP:这也是后来者能够超越波士顿动力的原因吧。
王兴兴:对,比传统算法的话,我们跟波士顿动力完全比不了。原因很简单,波士顿动力有一堆的MIT的博士,中国肯定搞不过人家。
钛媒体APP:你觉得未来大家的人形机器人最重要的差异点在哪?
王兴兴:机器人是一个综合的产品。他不会像燃油汽车和新能源汽车这种偏差那么大,而是一些小的技术方案的差别。比如这个电机用多大尺度、电机放在什么位置、工作空间多大、外观大概怎么设计、腿的形状怎么样等这些领域的差别。
包括AI也一样,比如说大语言模型,大家也差不多,对吧。但目前偏差最主要就是各种细节上偏差,GPT整个架构还是比较干净的。