『科技小灵』博弈论速成指南:那些融入深度学习的经典想法和新思路
博弈论速成指南:那些融入深度学习的经典想法和新思路

文章图片
机器之心Pro
1583298290选自TowardsDataScience
作者:JesusRodriguez
机器之心编译
参与:魔王、杜伟
随着人工智能的发展 , 博弈论迎来了复兴 。 关于博弈论 , 数据科学家需要了解哪些经典思想和新思路呢?本文作者就这些问题一一展开了分析 。 通过此文 , 相信读者会对博弈论的概念和分类有更清晰的理解 。
博弈论是最让人着迷的数学领域之一 , 它影响了多个不同领域 , 如经济学、社会科学、生物学 , 显然还有计算机科学 。 博弈论的定义有很多 , 但我认为以下这个定义非常有帮助 , 尽管它过分简洁:
博弈论是具备激励机制的概率 。
游戏在人工智能发展过程中起到关键作用 。 对于初学者而言 , 游戏环境在强化学习或模仿学习等领域中逐渐成为流行的训练机制 。 理论上 , 任何多智能体AI系统都要经历玩家之间的游戏化交互 。 构建游戏原则的数学分支正是博弈论 。 在人工智能语境和深度学习系统语境下 , 要想使多智能体环境具备一些必备的重要能力 , 博弈论必不可少 。 在多智能体环境中 , 不同的AI程序需要交互或竞争才能达成目标 。
博弈论的历史与计算机科学史密不可分 。 目前博弈论领域中的许多研究可以追溯至阿兰·图灵、冯·诺伊曼这些计算机科学先驱的工作 。 因电影《美丽心灵》而闻名于世的纳什均衡(Nashequilibrium)是现代系统中很多AI交互的基础 。 但是 , 利用博弈论原则多次建模AI宇宙超出了纳什均衡的范畴 。 想理解如何利用博弈论构建AI系统 , 最好先理解我们在社会或经济互动中常遇到的博弈类型 。
我们每天参与数百种基于游戏动态(gamedynamics)的交互 。 但是 , 游戏化环境的架构与此完全不同 , 其激励和参与者目的也不相同 。 如何将这些原则应用到AI智能体建模中呢?这个难题推动AI研究某些领域的发展 , 如多智能体强化学习 。
显然 , 游戏是博弈论最具可见性的实体 , 但它远远不是应用博弈论概念的唯一空间 。 也就是说 , 还有很多其他领域也受到博弈论和AI的共同影响 。 大多数需要多个「参与者」合作或竞争才能完成任务的场景都可以利用AI技术进行游戏化和改进 。 尽管之前的陈述是一种泛化 , 但我认为它传达出了一个信息:博弈论和AI是一种思考和建模软件系统的方式 , 而不只是一种技术 。
利用博弈论的AI场景应包含不止一个参与者 。 例如 , SalesforceEinstein这类销售预测优化AI系统就不是应用博弈论原则的完美场景 。 但是 , 在多智能体环境中 , 博弈论又有明显不同 。
在AI系统中建构游戏动态需要两步:
参与者设计:博弈论可用来优化参与者的决策 , 以获得最大效用;机制设计:逆博弈论(inversegametheory)主要为一组智能参与者设计游戏 。 拍卖就是机制设计的经典案例 。那么AI时代的数据科学家又需要了解哪些博弈呢?这些博弈彼此之间是否存在着联系呢?本文作者、InvectorLabs首席科学家兼执行合伙人JesusRodriguez对此发表了自己的看法 。
本文作者JesusRodriguez 。
数据科学家应该知道的5种博弈
假设我们正在构建一个需要多个智能体互相合作竞争才能完成特定目标的AI系统 , 即博弈论的经典场景 。 自20世纪40年代诞生以来 , 博弈论专注于建模最常见的交互模式 , 现在我们每天在多智能体AI系统中看到的就是它们 。 理解环境中不同类型的游戏动态是设计高效游戏化AI系统的关键元素 。 从较高层次来看 , 五元素标准有助于理解AI环境中的游戏动态 , 即对称vs非对称、完美信息vs非完美信息、合作vs非合作、同时vs序列和零和vs非零和 。 下面将一一展开介绍 。
作者提出的五元素标准 。
推荐阅读
- 「定焦爱科技」3拯救低电量焦虑症,超大电池搭配超快闪充,续航出色的iQOO
- #科技小李#小屏爱好者嗨起来,4.7寸新iPhone确认四月发布,价格是大亮点!,原创
- 中国网科技@撤出液晶面板生产,三星将关闭两座工厂
- #即科技#107国赞同票作废!,想“加入”联合国?中国使用一票否决
- 【腾讯科技】全球应用市场第一季度大爆发:花费达234亿美元创纪录 时长增20%
- 即科技■决定权掌握在中国手,?联合国五常将变六常?此国获美俄一致力挺
- [笔记本电脑]乙辰科技正式发布首款WiFi6新品:北斗II号分布式无线路由器
- 『极速聊科技』目前仅剩10余人,暴风集团:员工持续大量流失
- 【科技生活快报】普京:已与欧佩克和美国就石油价格下跌问题进行讨论
- 「科技小数据」消费信贷的客户呈现出年轻化的趋势,新消费崛起
