机器狗会中国功夫是一种什么体验?
且看下面这只黑白狗,直接就是一个花式过梅花桩:
瞧这单桩跳:腾空一跃,四脚稳稳落在前方小圆盘上,连个趔趄都没打。
当然,站立和起身作揖这样的传统技能也不在话下。虽然是在桩子上,但狗子完全能控制好力道不至于摔跤。
更别提下桩时,它还会耍一个完美的前空翻,稳稳落地结束表演。
真狗都很难做到吧~
如此身轻如燕的狗子很快就吸引了一波关注。
有人就表示希望再做大一点,这样就能当坐骑了。(话说见过骑狗的吗)
还有网友想让它可以帮忙取快递……(这还差不多)
所以,这只灵活的机器狗,到底什么来头?
它是Max二代机器狗,来自腾讯Robotics X实验室,今天正式对外亮相。
在一开始的训练思路上,腾讯的做法就和大众不同。
我们知道,学会适应复杂地形是大多数机器狗要学习的重要任务之一。
对于出现的踩歪、打滑等危险情况,业界一般做法都是采用提⾼步频、减慢速度、加⼤控制算法鲁棒性的⼿段来恢复它们的平衡。
而腾讯选择机器狗在梅花桩这样“一旦踩歪踩错就没有挽救机会”的极端地形上练习,就是为了限制它们规划路线的误差范围。
这样一来,机器狗就能够做到一出脚就是对的,不需要试探、也不需要多余的动作来维持或者恢复平衡,从而做到走得又快又稳。
那么,Max是如何做到每一步都找准桩⾯中⼼,精准完成各种高难度动作穿越梅花桩的呢?
简单来说,分为三大招:地图识别、行动轨迹规划和动作控制。
Max面对的是一段全长10米,高0.8米(Max两倍身高),最小桩面直径仅10厘米梅花桩阵列。
在上桩之前,系统并不会给Max配备先验地图,也就是每次它面对的都是未知的地图。
因此,它要学的第一件事就是识别地形,感知自己和梅花桩的位置,以便为后面的轨迹规划做准备。
据研究人员介绍,这一步最大的挑战是如何在持续力冲击下实现精准视觉定位和地形识别,同时兼顾实时性与低延迟。
为此,他们给Max身上配备了单⽬RGB摄像头、惯性传感器(IMU)、深度传感器等多种设备,所有传感数据融合在一起获得高质量的环境数据。
在各传感器数据融合过程中,一种启发式的算法被用来保证数据一致性,并通过合理评估和选择各种传感器数据在优化过程中的权重,保证定位实时、稳定并具有鲁棒性。
由于Max在移动过程具有速度快、步频⾼、⼒冲击⼤等特点,这会使得各种传感器数据出现大量噪声,引发干扰。
比如,在跳等动作的持续力冲击下,深度传感器就会出现拖影现象。
因此,在地形的时域融合过程中,研究人员还引⼊了一个统计分布策略,它能在⾼效过滤错误地形信息的同时,保留精确的有效地形区域结果,估计出桩⾯中⼼相对于机器⼈的精准位置,在⼀定程度上也能缓解梅花桩晃动带来的⼲扰。
最终,Max做到了地形识别精度⼩于2cm、视觉定位累积误差⼩于1%。
建成的地形⾼度图可以获取平⾯任意坐标对应的⾼度以及局部法向。
看准地形后,下⼀步Max要根据所⻅信息完成动作轨迹规划,最大的难点是如何在快速穿越的过程中,保证实时规划出最优的路线。
这里就采用了一种6D最优轨迹⽣成技术。
所谓6D,除了X、Y、Z轴上的位置数据,还包括机器狗需要做出的偏航、俯仰和滚动维度的信息。
该生成技术可根据Max的运动步态、速度等指令,预估落脚点,并根据落脚点周边的地形⾼度图,选出最优的点,也就是桩面中心。
此外,系统还会结合最优点,考虑Max运动过程中的动⼒学约束、摩擦约束、⾜端⼯作空间约束等,进行⼆次优化,实时求解真正的最优6D轨迹。
对于跳跃、空翻这类动作,Max还需要达到的一个目标是省⼒,即驱动⼒最⼩化。
这里就用到了一种基于⾮线性优化的轨迹规划技术。
该技术可以兼容四脚跳(Pronking)和双脚跳(Bounding)等多样化步态,通过跳跃距离、跳跃步态、最⼤关节⼒矩等约束条件,得出结果。
动作轨迹规划好后,Max就可以开始正式⾏动,最大的考验是如何控制恰到好处的力、按照规划轨迹实现精准落点
在跟踪参考轨迹方面,Max 采用了最新版xMPC+WBC(Model Predictive Control and Whole-Body Impulse Control,模型预测控制和全身控制)控制架构, 基于更精确的线性化动力学模型,效果更好。
而在力控方面,据研究人员介绍,一般来说,动作越是高动态、越是不稳,就越要求控制精度。
本次表演的动作中,每个环节都有自己的难度:
空翻属于高动态,作揖、双轮站立属于易失稳;而对于单桩跳跃这个动作,机器狗的四⾜落脚点距离很近,⽀撑区域很⼩,收拢的腿部姿势也导致 Max的运动及发⼒空间受限,对力控的精度更是要求极高。
为了实现以上动作的精准力控,团队⾃研了一个模型预测控制算法,并给Max加⼊了基于关节⼒矩反馈的触地检测能⼒。
这个算法的相关论文登上了机器人领域顶会ICRA 2022。
对于平移运动的追踪,自研线性模型预测控制算法获得了和业界经典算法同等的控制效果;而对于旋转运动的追踪,其表现甚至比其他算法更优秀。
具体而言,这个算法利⽤轴⻆和指数坐标来表示旋转运动,成功规避了之前线性化⽅法中的多个近似性假设,如:⼩⻆速度、转动惯量在预测窗⼝内时不变等。
最终保留了更多的参数,从⽽获得了一个更精确的动⼒学模型。
基于该动⼒学模型,研究团队进⼀步构建了模型预测控制(model predictive control) 问题,通过求解⼆次规划(quadratic programming)的优化问题,来得出最优⾜端接触⼒。
此外,Max在做跳跃、前空翻等需要腾空的动作时,可利用关节⼒矩反馈来判断四肢触地状态,从而及时且精准地进⾏主动的质⼼轨迹规划与柔顺⼒控,有效避免身体大幅晃动,使整个动作看起来更流畅丝滑。
由此,借助以上三大招的功夫,Max二代完成了精彩的花式过桩表演。
去年,一代Max亮相,当时它就开创了腿轮一体化设计,让机器狗不仅能站起来,还能滑着走。
这次,二代Max不仅学会了在桩上表演各种难度动作,过桩速度也比国内第一个会过桩的四足机器人Jamoca快了4倍。
除此之外,硬件方面,Max的轮足切换功能也做了改进,磁吸式的腿部锁定机构升级为了机械式的,并增加了冲击力解耦设计,最终提高了轮足切换的稳定性。
以及Max的整体结构上也进行了拓扑优化,增加了电池功率,外形上看起来更加紧凑简洁,在整机强度、抗冲击性能等方面也有所提升。
研究人员表示,接下来,他们会基于Max这个四足机器人平台,探索更精准的传统控制和AI控制算法,最终让机器狗实现复杂环境下的任意行走。
看完了Max的精彩表演和它搭载的硬核技术,再来了解下这只机器狗的诞生地——
成立于2018年的腾讯旗下机器人实验室:Robotics X。
目前,实验室里一共“养”了两只“狗子”,除了Max还有一个叫Jamoca的前辈,它是国内第一只学会走梅花桩的机器狗。
当然,除了“狗子”之外,这个实验室里还有其他机器人成员:
比如会花样空翻、灵活越障的轮式机器人Ollie。
可以保持平衡并自动驾驶的摩托车。
该实验室的负责人张正友博士,是著名的AI和机器人研究员,现任腾讯最高专业职级——17级科学家。
同时,他还是腾讯 AI Lab负责人,以及ACM Fellow和IEEE Fellow。
在加入腾讯之前,张正友曾任微软人工智能及研究事业部首席研究员和研究经理,在MSR工作了近20年。
正如前文介绍Max的未来发展方向所说,比起做简单、重复劳动的机器人,Robotics X更关注机器人的自主特性研究,注重于让其学会自主判断、自主决策等。
最后,一个小彩蛋:
如果你觉得机器狗遛起来没有灵魂,不妨看看这个场面。
虽为机器,Max二代却会“扑脚”、“撒欢跑”,是不是有点遛真狗的意思了?
不过,这其实是Max二代内部AI训练完成后第一次测试时的样子,研究人员表示:
当时我们也不知道它会跑成什么效果,只是意外记录下了这个视频。
看来Max很有自己的想法啊!(Doge)
当然,如果想让它成为一只听主人话的狗, 通过指令即可对其发号施令。
“