【博弈论】博弈论速成指南:那些融入深度学习的经典想法和新思路( 三 )
本文插图
平均场博弈中的鱼群统一游动经典案例 。
随机博弈
随机博弈可以追溯至 1950 年代 , 由诺贝尔经济学奖获得者 Lloyd Shapley 提出 。 从概念上来看 , 随机博弈由有限数量的玩家在有限状态空间中执行 , 在每个状态中 , 每个玩家从有限多的动作中选择一个;最终动作组合决定了每个玩家的奖励和下一个状态的概率分布 。
本文插图
已故数学家、随机博弈概念提出者 Lloyd Shapley 。
随机博弈的经典形式是哲学家晚餐问题:有 n + 1 位哲学家 (n ≥ 1) 坐在圆桌旁 , 圆桌中间有一碗米饭 , 任意两位相邻的哲学家之间有一根筷子 , 筷子在两人可及范围内 。 由于桌子是圆的 , 因此筷子的数量与哲学家人数一样 。 为了吃到碗中的米饭 , 每位哲学家需要拿到可及范围内的两根筷子 。 如果一位科学家吃到了 , 那么他的两位邻座就不能同时吃到 。 哲学家的生活很简单 , 只有思考和吃饭 , 为了生存 , 哲学家必须一次次地思考和吃饭 。 该任务就是设计一个使所有哲学家生存下去的机制 。
本文插图
随机博弈中的哲学家晚餐经典案例 。
演化博弈
演化博弈论(Evolutionary Game Theory , EGT)从达尔文进化论中获得灵感 。 EGT 的起源可以追溯至 1973 年的 John Maynard Smith 和 George R. Price , 也可以作为策略来分析 , 该数学标准可用于预测竞争策略的结果 。
从概念上看 , EGT 是博弈论概念在如下场景中的应用:通过选择和复制的进化过程 , 随着时间的变化 , 智能体群体使用不同策略来创建稳定的解决方案 。 EGT 的主要思想是很多行为涉及群体中多个智能体的交互 , 任意一个智能体的成果都离不开其策略与其他智能体策略之间的交互 。 经典博弈论专注于静态策略(即策略不随时间变化) , 而演化博弈论专注于策略随时间的变化 , 以及在进化过程中最成功的动态策略 。
EGT 的经典案例是鹰鸽博弈 , 即让鹰和鸽子围绕可共用资源竞赛 。 在该游戏中 , 每位选手严格遵循以下策略中的一个或全部:
- 鹰:发起攻击行为 , 在受伤或对手后退之前绝不停下 。
- 鸽:如果对手发起攻击行为 , 直接撤退 。
本文插图
逆博弈论
很多案例不需要优化参与者的策略 , 而是围绕理智参与者的行为设计游戏 , 这就是逆博弈论 。 拍卖被认为是逆博弈论中的主要案例 。
总之 , 随着人工智能的发展 , 博弈论正在复兴 。 阿兰·图灵或冯·诺伊曼等计算机科学界传奇人物提出的博弈论原则现在已经是全球某些最智能系统的核心 , 人工智能近期进展也有助于推动博弈论研究的发展 。 随着 AI 继续进化 , 我们将看到更多博弈论新想法找到融入主流深度学习系统的方式 。
原文链接:https://towardsdatascience.com/a-crash-course-in-game-theory-for-machine-learning-classic-and-new-ideas-50e33ba2636d
推荐阅读
- 晨株洲▲高速免费!株洲高速警察发布清明假期出行指南
- 远程运维方案选型指南——官网可下载的ZStack私有云平台
- 「汽车大咖」平桥勤务大队两公布一提示丨清明出行指南
- 人民网:清明出行防疫指南:北京太子峪陵园 上海滨海古园热度高
- #人民网#清明节准备去祭祖?先看看这份防病养生指南
- 『绍兴体育』你要的体育消费指南来了!,绍兴首轮体育消费券4月3日开抢
- 「什么值得买」业内人总结的内存条终极选购指南—厂商篇
- 『镇江城事809』单反相机入门指南
- 「慢慢买比价」鼠标选购防坑指南丨“人体工程学”有多厉害?其实并不适合你
- 『历史每日揭秘』日产逍客和Jeep指南者应该如何取舍,最近打算买车
