「威锋网」通过观察狗的活动谷歌AI教会机器人行动


谷歌研究人员开发了一种 AI 系统 , 该系统可以从动物的动作中进行学习 , 从而赋予机器人更大的灵活性 , 该机器人可以完成现实世界中的任务 , 例如在多层仓库和履行中心之间运输物料 。
「威锋网」通过观察狗的活动谷歌AI教会机器人行动
本文插图

团队的框架采用了动物(在这种情况下为狗)的运动捕捉剪辑 , 并使用强化学习(一种训练技术 , 刺激软件代理通过奖励来完成目标)来训练控制策略 。他们说 , 通过为系统提供不同的参考运动 , 研究人员可以“教”四腿的 Unitree Laikago 机器人执行一系列行为 , 从快速行走(每小时最高 2.6 英里的速度)到跳跃。
为了验证他们的方法 , 研究人员首先汇编了具有各种技能的真狗的数据集 。 然后 , 通过在奖励函数中使用不同的运动 , 研究人员进行了约两亿次训练采样一个模拟机器人来模仿运动技能 。
但是模拟器通常仅提供真实世界的粗略近似情况 。 为了解决这个问题 , 研究人员采用了一种自适应技术 , 该技术可以随机化模拟中的动力学 , 例如改变物理量 , 机器人的质量和摩擦力 。 这些值使用编码器映射到数字表示形式(即编码) , 该数字表示形式作为输入传递到机器人控制策略 。在将策略部署到实际的机器人时 , 研究人员删除了编码器 , 并直接搜索了一组变量 , 这些变量使机器人能够成功执行技能 。
【「威锋网」通过观察狗的活动谷歌AI教会机器人行动】该团队说 , 他们能够在大约 50 个试验中使用不到 8 分钟的真实数据来使策略适应实际情况 。 此外 , 他们证明了现实世界中的机器人学会了模仿狗的各种动作 , 包括快跑和慢跑 , 以及一些关键帧动作 。


    推荐阅读