1、当前通往机器人革命的路径
AGI,Metaverse与机器人会是未来最重要的三个主题,最终我们希望能够发展机器人,能够帮人类从事一些枯燥,危险,无聊的工作,实现生产力革命。要走到最后一步,每一个人,每一家公司都有不同的想法。下面我们先来看一下不同公司的做法。
1.1 Tesla
tesla的思路是从电动车开始做,然后做自动驾驶,最后利用前面积累的技术走向机器人。tesla做很强的垂直整合,走了一条很特别的路,很可能实现弯道超车,率先在机器人上有突破。
1.2 Google
Google是搜索起家,所有的业务和机器人没有太多关系,但是一切都围绕AI。因此,Google对AI极其重视,发展出了全球最牛逼的AI研究机构,网罗最强的AI研究人员。这使得Google走的是一条从Research->Product的路线。先围绕算法去攻关,攻关到能够落地,然后成立专门的公司来落地。目前自动驾驶上Waymo也是No.1的公司,但是对比Tesla因为没有垂直整合,只能走合作造车的路线,最终很大可能会远远落后于Tesla。Google的机器人也一样,只做算法,不做机器人本体,日后可能面临类似的问题。
1.3 Nvidia
Nvidia 早年围绕游戏做GPU起家,后来运气特别好,赶上了深度学习革命,GPU的需求大增,Nvidia在巩固自己的硬件优势的基础上,也直接在其上面做深度学习的研发,同时沿着游戏,AI,机器人的发展提出了Omniverse的战略,打造通往Metaverse和机器人的工具平台。Nvidia 和Google不同的地方在于有很强的底层平台构建优势,结合算法,可以为广大开发者提供很好的开发环境。Omniverse里的Isaac Gym能够为训练机器人提供仿真环境,这在四足机器人上已得到了很好的验证,未来很可能成为机器人研发的必备工具。
显然,Nvidia并不追求垂直整合,而是做基础,去支持广大研究员和开发者,这样的商业价值也非常大。
就像深度学习一样,很多算法都不是Nvidia做的,但都是在其GPU上实现的,这就是Nvidia的价值。
1.4 初创公司Vacarious, Covariant, Osaro, XYZrobotics
初创公司没有任何基础,所以往往通过进入门槛较低,弯道超车机会较多的AI算法入手,先在工业场景中使用AI进行落地,再慢慢转化为通用机器人。比如这里列举的几个初创公司都是使用视觉算法在机械臂物流抓取的场景中去落地。和Google比较像,他们也不设计生产机器人本体,以算法为核心。和Google不同的是,初创公司为了存活,优先选择更好落地的技术,比如仅使用计算机视觉,但Google不担心这个,则可以更多的聚焦到未来的技术如深度强化学习上。
1.5 初创公司Agility Robotics, AnyBotics
这两家公司则分别从人型四足机器人本体硬件起家,然后慢慢加上顶层AI算法,来提升机器人的智能水平。
相比boston dynamics的算法路线,这两家机器人更拥抱深度强化学习的方向。
2、机器人革命的要素
从上面的分析可以看到,机器人革命要成功首先是AI算法要突破,其次是要有强的垂直整合能够把软硬件的每一个环节都打通做好。不同的公司的做法不同和公司本身的基因有直接关系,主要是选择的重点不一样,不外乎先做硬件还是先做算法,抑或提供研发平台。
3、另一条路:从现实到虚拟再到现实
在未来之路一文中,我们提到Game,Metaverse,AGI,Robotics有如上紧密的联系,因此,我们在这里提出一条这样一条从现实到虚拟再到现实的路线:
就是从虚拟的动画角色入手,通过AI算法变革这部分原有的工作流程,提高游戏动画生产力,并提供更好的视觉体验, 然后,我们进一步的基于虚拟的物理环境构建虚拟机器人,在视觉,语音,动作等各个方面融合当前AI的前沿技术,为Metaverse提供AI NPC,创造全新的游戏体验。 最后,我们补足真实机器人的软硬件,构建sim2real,迁移到真实机器人,应用到现实场景。
为什么叫从现实到虚拟呢?
因为3A游戏里的角色动画核心要求就是要模拟出真实的动作效果,所以我们往往要在现实中通过动捕设备采集人真实的动作,然后再应用到虚拟的角色上。
为什么叫从虚拟到现实呢?
因为我们如果能够在虚拟的物理环境下实现各种机器人的操作,比如打扫卫生,收拾东西,那么这个虚拟如果和真实没有区别的话,就能迁移到现实。
4 道路分析
首先对于终点的机器人革命,目的是让机器人实现生产力革命并进入千家万户,这毋庸置疑是一个提升人类文明并影响全人类的事情,包括马斯克要殖民火星,也需要机器人革命。这里很重要的一点就是要防止机器人变成武器,否则有可能引发第三次世界大战而毁灭人类。把机器人应用到生产车间,外星探索及各种危险的场景,都是很好的。
接下来就是实现的路线了。这条路线是建立在Sim2Real的认知基础上提出的。我们认为机器人革命的核心是机器人的大脑,也就是算法,而要实现有效的算法仅靠现实世界进行学习是远远不够的,要依靠仿真环境来提供大量的数据。更进一步的推理就是如果在仿真环境中的虚拟机器人无法做到通用,那么真实场景更不可能。所以,我们倒推要实现机器人革命,要先能在虚拟环境中实现通用的虚拟机器人。
所以,我们有了第二步:Virtual Robot with Physics
第二步除了为真实的机器人提供基础之外,能否本身也产生价值?
答案当然是可以,面向Metaverse,创造高真实度的智能NPC。可以想象未来的Metaverse将充斥着不计其数的智能NPC,这些NPC从动作,表情,语言到行为,思想都和真人别无二致。通过VR或AR,我们可以和他们进行拟真的交互,结合区块链的NFT,智能NPC将产生前所未有的价值(价格)。
因此,智能NPC将会是一个全新的完全虚拟存在的物种。智能NPC的要求和通用机器人的需求不完全一样,对于更顶层比如思想决策层的要求甚至更高,完全是面向AGI的一个需求,但外在的动作层则和通用机器人高度匹配。也因此,我们如果能在虚拟物理环境中很好的构建智能NPC,展现出和真人一样的动作行为,那么这个技术也能应用到真实的机器人上。所以我们更关心外在的动作层。
根据上面的分析,Virtual Robot with Physics同样极具价值,在虚拟世界中创造的价值不亚于现实世界。
但是第二步目前还离落地有一段距离,基于物理的动画都没有在真实游戏中有直接的应用。所以,我们进一步倒推,得到了
第一步:3D animated character
这一步是基于Kinematics运动学的,没有物理,也是现有游戏能应用的。我们可以利用动捕数据(real)训练出motion ai应用到游戏(sim)中,这一层可以变革整个游戏动画领域,也会影响到很多的从业者,大幅提升游戏动画品质,从而也影响了很多人。
同时,利用动捕数据训练出来的AI可以作为基础给第二步基于物理的虚拟机器人提供数据。这样也就建立了联系。和机器人问题不同的是对于character animation,我们更看重自然度,也就是和人类真实行为的相似性,不过这个问题并不冲突,如果我们要造人形机器人,那么一样需要自然度。
所以,这就是从现实到虚拟再到现实(Real2Sim2Real)的整个过程。我们需要有大量的真实数据,并且能构建神经网络去学习这些数据,然后在仿真环境中验证,最终又应用到真实世界当中。
总的来说,上面的过程逻辑上是ok的,每一层都有独立的价值,同时又可以为下一层提供技术支撑。
并且,这些事情将AGI,Metaverse和Robotics紧密的结合在一起。
5、Are you with us?
目前,我们正在朝着这条道路去走,它需要很长很长的时间,可能是10-20年才能走到最后一步,甚至第二步基于物理的虚拟机器人离落地也需要很久,但这或许是它让人兴奋的地方,我们可以在这条道路上不断前进。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com