『科技小灵』博弈论速成指南：那些融入深度学习的经典想法和新思路博弈论速成指南：那些融入深度学习的经

博弈论速成指南：那些融入深度学习的经典想法和新思路

文章图片
机器之心Pro
1583298290选自TowardsDataScience
作者：JesusRodriguez
机器之心编译
参与：魔王、杜伟
随着人工智能的发展，博弈论迎来了复兴。关于博弈论，数据科学家需要了解哪些经典思想和新思路呢？本文作者就这些问题一一展开了分析。通过此文，相信读者会对博弈论的概念和分类有更清晰的理解。
博弈论是最让人着迷的数学领域之一，它影响了多个不同领域，如经济学、社会科学、生物学，显然还有计算机科学。博弈论的定义有很多，但我认为以下这个定义非常有帮助，尽管它过分简洁：
博弈论是具备激励机制的概率。
游戏在人工智能发展过程中起到关键作用。对于初学者而言，游戏环境在强化学习或模仿学习等领域中逐渐成为流行的训练机制。理论上，任何多智能体AI系统都要经历玩家之间的游戏化交互。构建游戏原则的数学分支正是博弈论。在人工智能语境和深度学习系统语境下，要想使多智能体环境具备一些必备的重要能力，博弈论必不可少。在多智能体环境中，不同的AI程序需要交互或竞争才能达成目标。
博弈论的历史与计算机科学史密不可分。目前博弈论领域中的许多研究可以追溯至阿兰·图灵、冯·诺伊曼这些计算机科学先驱的工作。因电影《美丽心灵》而闻名于世的纳什均衡（Nashequilibrium）是现代系统中很多AI交互的基础。但是，利用博弈论原则多次建模AI宇宙超出了纳什均衡的范畴。想理解如何利用博弈论构建AI系统，最好先理解我们在社会或经济互动中常遇到的博弈类型。
我们每天参与数百种基于游戏动态（gamedynamics）的交互。但是，游戏化环境的架构与此完全不同，其激励和参与者目的也不相同。如何将这些原则应用到AI智能体建模中呢？这个难题推动AI研究某些领域的发展，如多智能体强化学习。
显然，游戏是博弈论最具可见性的实体，但它远远不是应用博弈论概念的唯一空间。也就是说，还有很多其他领域也受到博弈论和AI的共同影响。大多数需要多个「参与者」合作或竞争才能完成任务的场景都可以利用AI技术进行游戏化和改进。尽管之前的陈述是一种泛化，但我认为它传达出了一个信息：博弈论和AI是一种思考和建模软件系统的方式，而不只是一种技术。
利用博弈论的AI场景应包含不止一个参与者。例如， SalesforceEinstein这类销售预测优化AI系统就不是应用博弈论原则的完美场景。但是，在多智能体环境中，博弈论又有明显不同。
在AI系统中建构游戏动态需要两步：
参与者设计：博弈论可用来优化参与者的决策，以获得最大效用；机制设计：逆博弈论（inversegametheory）主要为一组智能参与者设计游戏。拍卖就是机制设计的经典案例。那么AI时代的数据科学家又需要了解哪些博弈呢？这些博弈彼此之间是否存在着联系呢？本文作者、InvectorLabs首席科学家兼执行合伙人JesusRodriguez对此发表了自己的看法。
本文作者JesusRodriguez 。
数据科学家应该知道的5种博弈
假设我们正在构建一个需要多个智能体互相合作竞争才能完成特定目标的AI系统，即博弈论的经典场景。自20世纪40年代诞生以来，博弈论专注于建模最常见的交互模式，现在我们每天在多智能体AI系统中看到的就是它们。理解环境中不同类型的游戏动态是设计高效游戏化AI系统的关键元素。从较高层次来看，五元素标准有助于理解AI环境中的游戏动态，即对称vs非对称、完美信息vs非完美信息、合作vs非合作、同时vs序列和零和vs非零和。下面将一一展开介绍。
作者提出的五元素标准。

『科技小灵』博弈论速成指南：那些融入深度学习的经典想法和新思路

推荐阅读

底妆|鞠婧祎新剧大穿帮：“马”竟戴美瞳画眼线，国产剧又把观众当傻子

「苹果」苹果将iPhone 12的量产推迟了一个月

5G手机最核心的基带芯片，全球仅7大厂商掌握，中国占了四家

「」老婆在飘窗装了一圈柜子，发到业主群，群里消息999！

新华网@菲律宾塔阿尔火山喷发约1万居民疏散

IT之家美国商务部新规发布！“有条件”允许美企与华为合作制定5G标准

增幅明显！?澳门9月入境旅客环比增长97.7%

上市|每经热评｜应进一步完善重组上市定义

「影视控控」还有什么是梁家辉不会的？，《监狱风云》：百米11秒到文弱书生

综艺节目|这些综艺节目到底多“虚假”？看清这些细节你就明白了！

三本|曾经火爆全网的三本小说，那是多少老书虫的青春？

团团陪你一起看■探出16亿光年外一颗超级地球！，振奋！中国天眼再立功

悬疑打拐题材电影《再见，陌生人》全国各大院线正在热映，愿天下无拐！

咖妃说娱乐1|随便一枚价值700元，赶紧回家找找，梅花5角硬币究竟有什么特别

我和班干部的那些事?某班的班干部在看到班上的同学违反纪律时

运势|13-28号好运十足，喜讯天天有，生活乐无忧的四生肖

蛋壳筑梦公寓联手亚洲餐饮联盟启动餐饮业"员工宿舍租金补贴计划"

鞋|减压透气达芙妮旗下鞋柜男女飞织椰子鞋69元大促

万华化学|万华化学的最后一口大肉，不容错过的机会

恰逢全国高考首日，前清华球员爆发，齐麟14分创生涯新高