(图自:MPI-IS / Dynamic Locomotion Group / Felix Ruppert)
(资料图)
在大自然中,新生的小鹿或小马驹必须尽快学会行走,以躲避掠食者。即使动物天生就有位于脊髓中的肌肉协调网络,但学习腿部肌肉和肌腱的精确协调,还是需要一些时间的。
起初,婴儿动物主要依赖于硬连接的脊髓反射。虽然更加底层,但运动控制反射有助于其在第一次尝试行走时避免跌倒和伤害自己。
通过一段时间的练习,它们才会掌握更高级和更精确的肌肉控制,直到神经系统最终能够很好地适应年轻动物的腿部肌肉和肌腱。在越过了失控的障碍后,它们就可以跟上成年动物了。
研究配图 - 1:四足机器人 Morti
MPI-IS 动态运动研究小组的前博士生 Felix Ruppert 表示:
作为一名工程师和机器人专家,其正在通过构建一个像动物一样具备反射能力、并从错误中习得经验的机器人。
若动物只是偶尔绊倒,这个错误还不好说。但若它经常绊倒,就可以拿来衡量机器人行走的质量好坏了。
研究配图 - 2:弹性可塑框架示意图
值得一提的是,在仅仅一小时的走路学习后,机器狗 Morti 就已充分掌握其复杂的腿部力学。
在贝叶斯优化的指导学习下,足部传感器测得的信息,可与程序建模的虚拟脊髓目标数据相匹配。
通过不断比较发送和预期的传感器信息,机器狗得以找到循环反馈的改进,调整其电机控制模式来学习行走。
研究配图 - 3:模拟与实践试错的对比参照
学习算法能够适应中央模式生成器(CPG)的控制参数,在人类和动物中,CPG 就是脊髓中的神经元网络。
它能够在不依赖大脑输入的情况下,产生周期性的肌肉收缩,可在步行、眨眼或消化等有节奏的任务中提供帮助。
至于反射,则由腿部传感器和硬编码的神经通路,来触发非自愿运动的控制动作。
研究配图 - 4:CPG 参数与弹性反馈活动
只要幼小动物在完全平坦的路面上行走,CPG 就足以控制来自脊髓的运动信号。但只要地面上有个小颠簸,其步行方式就会发生改变。
为避免跌倒,反射会介入并调节运动模式。而运动信号的这些瞬时变化,又是可逆或“弹性的”。即使受到干扰,后续也能够恢复如初。
但若动物在多次运动循环中不停地跌跌撞撞 —— 即使反应活跃 —— 那也必须通过重新学习运动模式、并使其具有不可逆转的“可塑性”。
研究配图 - 5:塑性适应的结果
新生动物最初的 CPG 调节还不够号,导致其在平坦或不平坦的地形上蹒跚而行,本文介绍的机器狗 Morti 也是如此。
更重要的是,在大约一小时内,机器狗已能够做到比小动物更快地优化其运动模式 —— 这得益于 Morti 的 CPG 在控制机器腿部运动的小型轻量计算机上进行了模拟。
这个虚拟脊髓被放置在了四足机器狗的头背部位置,在平稳行走的一小时内,来自其足部的传感器数据能够与 CPG 的预测效果不断进行比较。
研究配图 - 6:扭矩性能的标准化测量
若机器人绊倒,学习算法会改变其腿的来回摆动距离、摆动速度、以及落地行程。同时调节后的运动,也会影响机器人灵活运用其脚力的能力。
在学习过程中,CPG 会向电机发送经过调整的信号,以便机器狗从此减少磕绊并优化其行走。
但是在这一框架中,虚拟脊髓并没有对机器人的腿部动作设计、电机和弹簧的物理特征有明确的了解。
(来自:Nature Machine Intelligence)
Flix Ruppert 解释称:这台机器狗实际上有些“天生”的特性,即使对自己的腿部解剖结构或工作原理一无所知,内置 CPG 还是可以自然且智能地帮助其行走。
计算机产生了控制腿部电机的信号,起初有些跌跌撞撞。但从传感器不断回流的数据,还是可以通过与虚拟脊髓 CPG 产生的进行比较。
若传感器数据与预期结果不匹配,则学习算法会让它改变行走行为,直到机器人能够在不被绊倒的情况下良好行走。
综上所述,在保持反射活跃的情况下改变 CPG 输出、并监测机器狗绊倒的学习过程,就是其中最核心的部分。
更棒的是,Morti 的板载电脑,只会在行走过程中消耗 5 瓦的电力。
最后,尽管来自某些知名制造商的工业四足机器人已学会在复杂的控制器的帮助下运行,但它们的功耗也要大得多。