这种形式的机器学习与传统的有监督或无监督学习明显不同,在传统的有监督或无监督学习中,机器学习模型需要标记的训练数据来学习 。深度强化学习将强化学习方法与深度学习相结合,传统的机器学习的规模随着强大的计算能力而大大扩展 。
斯坦福大学助理教授Chelsea Finn表示:“这项工作令人感到非常兴奋 。” 芬恩也为谷歌工作,但没有参与这项研究 。“让这个过程不再出现人工干预真的很难 。机器人能够更自主地学习,就更有可能在我们生活的现实世界中学习,而不是在实验室里 。”但她也提醒到,目前的设置依赖于机器人上方的动作捕捉系统来确定其位置 。这在现实世界中是不可能的 。

文章插图

文章插图
尽管研究团队将Rainbow Dash的学习能力归功于自己,但人为干预仍在实现该目标方面发挥了重要作用 。例如研究人员必须创建边界,机器人可以在该边界内学习走路,以防止机器人离开该区域 。他们还必须设计特定的算法来防止机器人摔倒,其中一些算法集中在限制机器人的运动上 。为了防止诸如坠落损坏之类的事故,通常在数字环境中进行机器人强化学习,然后再将算法转移到物理机器人上以保持其安全性 。
接下来,研究人员希望他们的算法能适用于不同种类的机器人,或适用于多个机器人在同一环境中同时进行学习 。谭杰相信,破解机器人的运动能力将是解锁更多有用机器人的关键 。“很多地方都是为人类建造的,我们都用腿来走路,” 他说,“如果机器人学不会使用腿,它们就不能在人类世界中行走 。”
这确实是机器人自主行动的重要一步了,距离机器人自己自主行动也并不遥远,到时候,我们到底是该恐惧还是兴奋呢?
推荐阅读
- 绿茶的最佳搭配㎡㎡银壶
- 从鹅厂人的答辩故事,教你做晋级汇报
- 粉墙掉在地上的白灰怎么去除 墙上白灰掉粉怎么去除
- 维生素C可以代替蔬菜水果吗?吃维生素c片的危害
- 橙子果肉上的白色东西是什么 果肉是黑紫色的橙子能吃吗
- 儿菜的做法要去皮吗 儿菜的皮怎么去除
- 新婚姻法:夫妻离婚孩子抚养权归属,是由以下五点来确定的
- 最齐全的羊肉16个部位图解,真正的教您如何食用羊肉和辨别真羊肉
- 做面食时,食用碱、小苏打、酵母粉、泡打粉的区别和用法,涨知识
- 通篇都是干货——那些你想了解的汽修行业不为人知的“内幕”
