和讯名家AI:我又又又打败了人类冠军!小学生:叫爸爸!( 二 )
本文插图
听起来是不是很像小孩子走迷宫的游戏?这能让智能体接触到各种各样的经验 , 在信息较少的环境中工作;减少对数据量的依存 , 改变目前算力资源紧张的局面 , 让许多小数据、少样本的领域(如金融、医疗)也能实现智能化 。
将儿童探索行为应用于AI , 一切都能变得更好 , 理想层面上确实如此 , 但现实总喜欢跟科学家们开玩笑 , 也算是给人类保留了一个“杀手锏”吧 。
AI能力暴涨的当下 ,
人类为什么还能稳坐智慧王座?
需要注意的是 , 这些类似儿童探索的策略 , 通常更多被用在训练期间提高代理人的经验值 , 而不是在决策时支持快速学习和探索 。 用人话说就是“懂得了许多道理 , 却不一定能过好这一生” , 因为一到关键选择时刻就会掉链子 。
就拿前面提到的深度优先搜索(DFS)来说 , 科学家们发现 , 如果让孩子们自由探索 , 那么他们与智能体按DFS做出的行动有90%的相似 , 而以目标为导向(找到橡皮糖)来探索的话 , 有96%的路线都是相似的 。 但不同的是 , 探索越多的孩子 , 最后能花费更少的时间完成任务 , 智能体却相反 。
本文插图
如果智能体发现一个地方很有趣(能得到奖励) , 就会一直重新访问该区域 , 直到它终于终于终于觉得那里不再有趣了 , 这会导致其概括性不佳(无法形成最佳策略) 。
其中的差别就在于 , 孩子不是被动地孤立学习或由目标驱动 , 而是在不断实验和收集信息 , 将自己的认知和经验与获得的信息结合起来 , 编织出一个丰富的世界模型 。 而即使最复杂的机器探索方法 , 也只能为特定的目标服务 , 一时半会还无法完美匹配这个充满了各种“意外”的真实世界 。
为什么有了一定的探索能力 , AI智能体的表现还是不尽如人意呢?
首当其冲就是实验室与现实环境的巨大不同 。
深度强化学习过去都是“机上谈兵” , 不是跟人类在二维游戏里PK , 就是数字网格里下棋 , 而儿童的探索则是发生在信息丰富的三维现实世界之中 , 许多潜在因素很难被应用到实验中 。
这也是为什么 , 当今最强大的AI智能机器人也达不到一个仅小学毕业的优秀人类服务员的工作能力 , 能像他们一样快速适应环境、完成各种复杂任务 。
本文插图
此外 , 儿童的发展心理学研究很难在AI产业链中形成“闭环” 。 要真正激发AI生长出服务现实的能力 , 不仅要构建出具有更强探索能力的智能体 , 还要继续学习人类的认知能力 , 推进人工智能自身的理论创新和软硬件升级(比如搭建三维训练环境) , 这一系列链式突破 , 才能最终将技术构想转化为现实生产力 。 “大力出奇迹”的深度学习 , 其高光时刻就是这么来的 。
沿着这个方向 , 我们可以进一步了解 , 怎样才能弥合智能体与人类之间的差距 。
下一代AI , 逐渐浮出迷雾的真实未来
在过去的数年里 , 深度学习做到了传统算法所无法企及的进度 , 催生了大量的工业界应用 , 但其实 , 现在的深度学习还是很傻——举个例子 , 大部分人都可以通过几十个小时的学习学会开小汽车 , 而完全自动的L5级无人汽车至今还是个遥远的梦 。
图灵奖得主Geoffrey Hinton就一直非常渴望找到一种新的实现深度网络的方法 , 认为目前(最广泛的反向传播算法)根本不是大脑的工作机制 。
另一位图灵奖得主Yann Lecun , 就认为在某些游戏中 , 需要大量增加模型训练时间才能达到或超过专业人类玩家的水平 。
通过儿童的学习模式 , 发现当前最优秀的AI也比不上5岁小孩的智力 , 或许我们可以回答“下一代AI应该是什么样” , 这个神经网络最重要的未解难题之一 。
推荐阅读
- 表情包小萌妹|我又来丢人了,搞笑沙雕表情包:大家好
- 家长|警惕!10分钟,7名家长被骗!
- 和讯科技九号智能IPO“一波三折”:依赖症无良药电动车难补亏损“窟窿”
- 和讯银行|拟募资5.75亿元“补血”,景德镇农商银行资本充足率逐年下降
- 绿色青浦|来青浦看名家书画展 感受国医之伟、医者之美
- 社会谈资|80名家属陪产,知道孩子性别后笑出眼泪,湖南宝妈生下5胞胎
- 名家诗歌|名家|风中的灯盏
- 花生知道|在四川美术馆成功举办,百城冬奥文化推广计划冰雪文化美术作品名家公益行
- 和讯名家iPhone 12卖疯了!苹果官网被挤爆,电商平台瞬间售罄…大型真香现场?
- 赵露思|被质疑120斤?赵露思发出体重照片打脸,看到全身照我又酸了!
