『科技小灵』博弈论速成指南:那些融入深度学习的经典想法和新思路( 三 )
平均场博弈中的鱼群统一游动经典案例 。
随机博弈
随机博弈可以追溯至1950年代 , 由诺贝尔经济学奖获得者LloydShapley提出 。 从概念上来看 , 随机博弈由有限数量的玩家在有限状态空间中执行 , 在每个状态中 , 每个玩家从有限多的动作中选择一个;最终动作组合决定了每个玩家的奖励和下一个状态的概率分布 。
已故数学家、随机博弈概念提出者LloydShapley 。
随机博弈的经典形式是哲学家晚餐问题:有n+1位哲学家(n≥1)坐在圆桌旁 , 圆桌中间有一碗米饭 , 任意两位相邻的哲学家之间有一根筷子 , 筷子在两人可及范围内 。 由于桌子是圆的 , 因此筷子的数量与哲学家人数一样 。 为了吃到碗中的米饭 , 每位哲学家需要拿到可及范围内的两根筷子 。 如果一位科学家吃到了 , 那么他的两位邻座就不能同时吃到 。 哲学家的生活很简单 , 只有思考和吃饭 , 为了生存 , 哲学家必须一次次地思考和吃饭 。 该任务就是设计一个使所有哲学家生存下去的机制 。
随机博弈中的哲学家晚餐经典案例 。
演化博弈
演化博弈论(EvolutionaryGameTheory , EGT)从达尔文进化论中获得灵感 。 EGT的起源可以追溯至1973年的JohnMaynardSmith和GeorgeR.Price , 也可以作为策略来分析 , 该数学标准可用于预测竞争策略的结果 。
从概念上看 , EGT是博弈论概念在如下场景中的应用:通过选择和复制的进化过程 , 随着时间的变化 , 智能体群体使用不同策略来创建稳定的解决方案 。 EGT的主要思想是很多行为涉及群体中多个智能体的交互 , 任意一个智能体的成果都离不开其策略与其他智能体策略之间的交互 。 经典博弈论专注于静态策略(即策略不随时间变化) , 而演化博弈论专注于策略随时间的变化 , 以及在进化过程中最成功的动态策略 。
EGT的经典案例是鹰鸽博弈 , 即让鹰和鸽子围绕可共用资源竞赛 。 在该游戏中 , 每位选手严格遵循以下策略中的一个或全部:
鹰:发起攻击行为 , 在受伤或对手后退之前绝不停下 。 鸽:如果对手发起攻击行为 , 直接撤退 。如果我们假设存在如下情况:1)当两个个体都发起攻击行为时 , 战斗最终走向结束 , 二者具备同等受伤概率;2)战斗成本将个体的健康度降低了某个常量C;3)当鹰鸽相遇时 , 鸽子直接逃跑 , 鹰获取资源;4)两只鸽子遇到资源并平分资源 , 则鹰鸽博弈的健康情况如下所示:
【『科技小灵』博弈论速成指南:那些融入深度学习的经典想法和新思路】逆博弈论
很多案例不需要优化参与者的策略 , 而是围绕理智参与者的行为设计游戏 , 这就是逆博弈论 。 拍卖被认为是逆博弈论中的主要案例 。
总之 , 随着人工智能的发展 , 博弈论正在复兴 。 阿兰·图灵或冯·诺伊曼等计算机科学界传奇人物提出的博弈论原则现在已经是全球某些最智能系统的核心 , 人工智能近期进展也有助于推动博弈论研究的发展 。 随着AI继续进化 , 我们将看到更多博弈论新想法找到融入主流深度学习系统的方式 。
原文链接:https://towardsdatascience.com/a-crash-course-in-game-theory-for-machine-learning-classic-and-new-ideas-50e33ba2636d
推荐阅读
- 「定焦爱科技」3拯救低电量焦虑症,超大电池搭配超快闪充,续航出色的iQOO
- #科技小李#小屏爱好者嗨起来,4.7寸新iPhone确认四月发布,价格是大亮点!,原创
- 中国网科技@撤出液晶面板生产,三星将关闭两座工厂
- #即科技#107国赞同票作废!,想“加入”联合国?中国使用一票否决
- 【腾讯科技】全球应用市场第一季度大爆发:花费达234亿美元创纪录 时长增20%
- 即科技■决定权掌握在中国手,?联合国五常将变六常?此国获美俄一致力挺
- [笔记本电脑]乙辰科技正式发布首款WiFi6新品:北斗II号分布式无线路由器
- 『极速聊科技』目前仅剩10余人,暴风集团:员工持续大量流失
- 【科技生活快报】普京:已与欧佩克和美国就石油价格下跌问题进行讨论
- 「科技小数据」消费信贷的客户呈现出年轻化的趋势,新消费崛起
