■那个AlphaGo背后的男人,获得2019 ACM计算奖( 二 )
本文插图
但对于研究人员来说 , 目标不仅仅是开发赢得游戏的程序 , 而是将游戏作为开发具有模拟人类智能能力的机器的试金石 。 2016 年 3 月 , 全世界数百万人在电视上观看了 AlphaGo 击败围棋世界冠军李世石(Lee Sedol)的比赛 。 但这仅仅是 David Silver 团队惊人成就影响的开始 。 他对深度强化学习的见解已经被应用于很多领域 , 比如提高英国电网的效率 , 降低谷歌数据中心的能耗 , 以及为欧洲航天局设计太空探测器的轨道 。 ”Cherri M. Pancake说道 。 Silver 是深度强化学习的最重要的贡献者之一 , 在深度强化学习这种工具中 , 算法通过在交互式环境中反复试验来学习 , 根据运行过程中积累的信息不断调整 , 并利用不同数学处理层次的计算模型——人工神经网络与强化学习策略有效地结合起来 , 对试错结果进行评估 。 该算法不需要对每一个可能的结果进行计算 , 而是进行预测 , 从而更有效地执行给定的任务 。
阿尔法狗
2500 年前 , 中国发明了围棋游戏 , 至今仍然流行 , 尤其是在亚洲 。 围棋被认为比象棋要复杂得多 , 因为棋手可以做出更多潜在的动作 , 而且游戏可以有更多的方式进行 。 Silver 在艾伯塔大学(University of Alberta)攻读博士学位时 , 就开始探索开发一种可以掌握围棋的计算机程序的可能性 。 Silver 开发 AlphaGo 的关键见解 , 是将深层神经网络与计算机游戏中使用的算法 Monte Carlo 树搜索相结合 。 Monte Carlo 树搜索的一个优点是 , 在追求游戏中最佳感知策略的同时 , 该算法还在不断研究其他替代方案 。 2016 年 3 月 , AlphaGo 击败世界围棋冠军李世石被誉为AI里程碑式的时刻 。 Silver 和他的同事在 2016 年发表在《自然》杂志上的论文《用深层神经网络和树搜索掌握围棋游戏》中发表了支撑 AlphaGo 的基础技术 。
本文插图
AlphaGo Zero、AlphaZero和AlphaStar
Silver 和他在 DeepMind 的团队一直在开发新的算法 , 这些算法极大地提高了计算机游戏的发展水平 , 并取得了许多被认为人工智能系统无法实现的结果 。
在开发 AlphaGo Zero 算法时 , Silver 和他的合作者证明了程序可以在不接触人类专家游戏的情况下掌握围棋 。 该算法完全通过在没有任何人类数据或先验知识的情况下自己来学习 , 而在进一步的迭代版本中 , 算法甚至不需要知道规则 。
后来 , DeepMind 团队的 AlphaZero 在国际象棋、将棋和围棋中也获得了超人的表现 。 在国际象棋中 , AlphaZero 轻松击败了世界计算机国际象棋冠军 Stockfish, 这是一个由大师和国际象棋编程专家设计的高性能程序 。 就在去年 , 由 Silver 领导的 DeepMind 团队开发的 AlphaStar, 掌握了多人电子竞技游戏《星际争霸 II》 , 该游戏被视为 AI 学习系统面临的一项艰巨挑战 。
关于 David Silver
David Silver 是 DeepMind 强化学习研究小组的负责人 , 也是伦敦大学学院的计算机科学教授 。 他所在的 Google 子公司 DeepMind 试图将机器学习和系统神经科学方面的最佳技术结合起来 , 以构建功强大的通用学习算法 。
Silver 分别于 1997 年和 2000 年获得剑桥大学的学士和硕士学位 。 1998 年 , 他和别人共同创立了视频游戏公司 Elixir Studios , 并在那里担任首席技术官兼首席程序员 。 后来 Silver 返回学术界 , 并于 2009 年获得了艾伯塔大学的计算机科学博士学位 。
本文插图
2015 年 , Silver 和他的同事发表的一篇题为《通过深度强化学习实现人类水平控制》(Human Level Control Through Deep reinforcement learning)的开创性论文中 , 描述了他们将强化学习与人工神经网络相结合的方法 。 该论文发表在《自然》(Nature)杂志上 , 被引用了近1万次 , 对该领域产生了巨大的影响 。 随后 , Silver 和他的同事继续用新的技术完善这些深度强化学习算法 , 这些算法仍然是机器学习中最广泛使用的工具之一 。 Silver 的众多荣誉包括:马文·明斯基人工智能杰出成就奖(2018年)、皇家工程院对英国工程杰出贡献银奖(2017年)、门萨基金会人工智能领域最佳科学发现奖(2017年) 。
推荐阅读
- 『像素』荣耀潮流情报局:揭秘荣耀30系列预热视频背后的故事
- 『粤新房客』如果人类在太阳系中发现了比自己更落后的文明会怎样?
- 【什么值得买】24 期免息四舍五入等于不要钱?进化后的 Galaxy Buds+ 开箱及轻度体验
- [马云]卸任后的马云只拥有7的股权,为何却仍可以控制阿里
- 『极客公园』罗永浩和刘作虎,一场直播背后的故事与想象
- 『』AI 最前沿 | NVIDIA 技术专家带你探索自动驾驶背后的科学
- 「」iOS13.4.5 Beta2 系统推出,时隔两周后的更新
- 直播:对话海澜集团总裁:一场小程序直播300万观看背后的秘密
- 用户@行业寒冬月活用户千万级,深扒分期乐、360借条APP背后的运营策略
- #搜狐新闻#相比新机vivoZ6,降价后的老旗舰,荣耀note10价格更合适
