【博弈论】博弈论速成指南：那些融入深度学习的经典想法和新思路( 三 ) |深度学习|人工智能|数学|

本文插图
平均场博弈中的鱼群统一游动经典案例。
随机博弈
随机博弈可以追溯至 1950 年代，由诺贝尔经济学奖获得者 Lloyd Shapley 提出。从概念上来看，随机博弈由有限数量的玩家在有限状态空间中执行，在每个状态中，每个玩家从有限多的动作中选择一个；最终动作组合决定了每个玩家的奖励和下一个状态的概率分布。

本文插图
已故数学家、随机博弈概念提出者 Lloyd Shapley 。
随机博弈的经典形式是哲学家晚餐问题：有 n + 1 位哲学家 (n ≥ 1) 坐在圆桌旁，圆桌中间有一碗米饭，任意两位相邻的哲学家之间有一根筷子，筷子在两人可及范围内。由于桌子是圆的，因此筷子的数量与哲学家人数一样。为了吃到碗中的米饭，每位哲学家需要拿到可及范围内的两根筷子。如果一位科学家吃到了，那么他的两位邻座就不能同时吃到。哲学家的生活很简单，只有思考和吃饭，为了生存，哲学家必须一次次地思考和吃饭。该任务就是设计一个使所有哲学家生存下去的机制。

本文插图
随机博弈中的哲学家晚餐经典案例。
演化博弈
演化博弈论（Evolutionary Game Theory ， EGT）从达尔文进化论中获得灵感。 EGT 的起源可以追溯至 1973 年的 John Maynard Smith 和 George R. Price ，也可以作为策略来分析，该数学标准可用于预测竞争策略的结果。
从概念上看， EGT 是博弈论概念在如下场景中的应用：通过选择和复制的进化过程，随着时间的变化，智能体群体使用不同策略来创建稳定的解决方案。 EGT 的主要思想是很多行为涉及群体中多个智能体的交互，任意一个智能体的成果都离不开其策略与其他智能体策略之间的交互。经典博弈论专注于静态策略（即策略不随时间变化），而演化博弈论专注于策略随时间的变化，以及在进化过程中最成功的动态策略。
EGT 的经典案例是鹰鸽博弈，即让鹰和鸽子围绕可共用资源竞赛。在该游戏中，每位选手严格遵循以下策略中的一个或全部：

鹰：发起攻击行为，在受伤或对手后退之前绝不停下。
鸽：如果对手发起攻击行为，直接撤退。

如果我们假设存在如下情况：1）当两个个体都发起攻击行为时，战斗最终走向结束，二者具备同等受伤概率；2）战斗成本将个体的健康度降低了某个常量 C；3）当鹰鸽相遇时，鸽子直接逃跑，鹰获取资源；4）两只鸽子遇到资源并平分资源，则鹰鸽博弈的健康情况如下所示：

本文插图
逆博弈论
很多案例不需要优化参与者的策略，而是围绕理智参与者的行为设计游戏，这就是逆博弈论。拍卖被认为是逆博弈论中的主要案例。
总之，随着人工智能的发展，博弈论正在复兴。阿兰·图灵或冯·诺伊曼等计算机科学界传奇人物提出的博弈论原则现在已经是全球某些最智能系统的核心，人工智能近期进展也有助于推动博弈论研究的发展。随着 AI 继续进化，我们将看到更多博弈论新想法找到融入主流深度学习系统的方式。
原文链接：https://towardsdatascience.com/a-crash-course-in-game-theory-for-machine-learning-classic-and-new-ideas-50e33ba2636d