和讯名家AI：我又又又打败了人类冠军！小学生：叫爸爸！( 二 )

本文插图
听起来是不是很像小孩子走迷宫的游戏？这能让智能体接触到各种各样的经验，在信息较少的环境中工作；减少对数据量的依存，改变目前算力资源紧张的局面，让许多小数据、少样本的领域（如金融、医疗）也能实现智能化。
将儿童探索行为应用于AI ，一切都能变得更好，理想层面上确实如此，但现实总喜欢跟科学家们开玩笑，也算是给人类保留了一个“杀手锏”吧。
AI能力暴涨的当下，
人类为什么还能稳坐智慧王座？
需要注意的是，这些类似儿童探索的策略，通常更多被用在训练期间提高代理人的经验值，而不是在决策时支持快速学习和探索。用人话说就是“懂得了许多道理，却不一定能过好这一生” ，因为一到关键选择时刻就会掉链子。
就拿前面提到的深度优先搜索（DFS）来说，科学家们发现，如果让孩子们自由探索，那么他们与智能体按DFS做出的行动有90%的相似，而以目标为导向（找到橡皮糖）来探索的话，有96%的路线都是相似的。但不同的是，探索越多的孩子，最后能花费更少的时间完成任务，智能体却相反。

本文插图
如果智能体发现一个地方很有趣（能得到奖励），就会一直重新访问该区域，直到它终于终于终于觉得那里不再有趣了，这会导致其概括性不佳（无法形成最佳策略）。
其中的差别就在于，孩子不是被动地孤立学习或由目标驱动，而是在不断实验和收集信息，将自己的认知和经验与获得的信息结合起来，编织出一个丰富的世界模型。而即使最复杂的机器探索方法，也只能为特定的目标服务，一时半会还无法完美匹配这个充满了各种“意外”的真实世界。
为什么有了一定的探索能力， AI智能体的表现还是不尽如人意呢？
首当其冲就是实验室与现实环境的巨大不同。
深度强化学习过去都是“机上谈兵” ，不是跟人类在二维游戏里PK ，就是数字网格里下棋，而儿童的探索则是发生在信息丰富的三维现实世界之中，许多潜在因素很难被应用到实验中。
这也是为什么，当今最强大的AI智能机器人也达不到一个仅小学毕业的优秀人类服务员的工作能力，能像他们一样快速适应环境、完成各种复杂任务。

本文插图
此外，儿童的发展心理学研究很难在AI产业链中形成“闭环” 。要真正激发AI生长出服务现实的能力，不仅要构建出具有更强探索能力的智能体，还要继续学习人类的认知能力，推进人工智能自身的理论创新和软硬件升级（比如搭建三维训练环境），这一系列链式突破，才能最终将技术构想转化为现实生产力。 “大力出奇迹”的深度学习，其高光时刻就是这么来的。
沿着这个方向，我们可以进一步了解，怎样才能弥合智能体与人类之间的差距。
下一代AI ，逐渐浮出迷雾的真实未来
在过去的数年里，深度学习做到了传统算法所无法企及的进度，催生了大量的工业界应用，但其实，现在的深度学习还是很傻——举个例子，大部分人都可以通过几十个小时的学习学会开小汽车，而完全自动的L5级无人汽车至今还是个遥远的梦。
图灵奖得主Geoffrey Hinton就一直非常渴望找到一种新的实现深度网络的方法，认为目前（最广泛的反向传播算法）根本不是大脑的工作机制。
另一位图灵奖得主Yann Lecun ，就认为在某些游戏中，需要大量增加模型训练时间才能达到或超过专业人类玩家的水平。
通过儿童的学习模式，发现当前最优秀的AI也比不上5岁小孩的智力，或许我们可以回答“下一代AI应该是什么样” ，这个神经网络最重要的未解难题之一。

和讯名家AI：我又又又打败了人类冠军！小学生：叫爸爸！( 二 )

推荐阅读

女人怎样才能过得好

GeekPwn2019上演实力攻防战京东展示安全硬核实力

应不应该让父母利用资源在家乡找一个好工作

最不爱说“普通话”的四大城市，买菜都说方言

「新华网」一名白衣天使的“逆行”冲锋——记泰康同济医院感染十三科医生石蕊

中年|碧蓝航线SSR科研三期柴郡养成攻略用最好的装备武装顶级猫女仆

组合衣柜尺寸介绍组合衣柜安装策略

山楂泡水饮用能帮助减肥吗,喝哪种花草茶保养水润肌肤3山楂

如果暑期全国实行昼伏夜出，有哪些利弊

水浒传108将哪个好汉水分最大，绰号唬人却武功差

SaraSAra蕾蕾酱|| 女明星的夏季穿搭，凉爽又时髦，明星穿搭红榜

三易生活■中端5G新机荣耀30S发布，售价从2399元起跳

长期戴眼镜为何眼神会显得呆滞

梦见朋友来家里吃饭自己没吃女人梦见朋友来家里吃饭

伊然美|娱乐圈姓胡的男星，原创

美军舰▲美军舰突然现身黄海，紧贴京唐港演习区域，距南通仅100海里

爱否科技|Mate 40 信息汇总：首发 5nm 麒麟芯片，配备潜望式长焦，华为

自动离职和辞职的区别在哪

小学数学统计图有哪些统计图有哪些

[电池]最伤手机的充电方式，严重影响电池寿命，你中招了吗？