工程院|美国工程院院士深度解析:博弈论与控制面临哪些挑战和机遇?


翻译 | 冯维维
近年来 , 博弈论相关的概念和工具在控制、多智能体系统和网络研究中的应用几乎呈指数增长 。
在接受《国家科学评论》(NSR)访谈时 , 美国国家工程院院士 , 伊利诺伊大学香槟分校Swanlund讲席教授(该校教师最高荣誉)、高等研究中心主任 , IEEE控制系统学会和美国自动控制理事会前任主席 , 国际动态博弈论学会创始主席塔米尔·巴萨(Tamer Basar) , 谈到了最近博弈论在控制和网络研究中的新兴角色、它如何将控制领域的边界拓展到工程以外的学科 , 以及未来的机遇和挑战 。
工程院|美国工程院院士深度解析:博弈论与控制面临哪些挑战和机遇?
本文插图

Tamer Basar(Swanlund讲席教授、伊利诺斯大学香槟分校高等研究中心主任)
博弈论是什么及其在控制中的作用
NSR:您能简单地告诉我们什么是博弈论、它是做什么的吗?
Basar:
博弈论解决的是多个决策者即博弈参与者(某些情况下称为代理人)之间的策略交互 。 由一个目标函数刻画每个参与者在多个可能的博弈结果之间的排序偏好 , 她要么试图最大化目标函数(在此情况下 , 目标函数是效用函数或效益函数) , 要么最小化目标函数(在这种情况下 , 我们称目标函数为成本函数或损失函数) 。

对非平凡博弈来说 , 参与者的目标函数取决于至少一位其他参与者的选择(行为或决策变量) , 并且通常是所有参与者的选择 , 因此参与者不能简单地独立于其他人的选择而优化自己的目标函数 。
因此 , 这使参与者的行动之间产生了耦合 , 并导致即便在非合作环境下 , 参与者在决策过程中也绑定在一起 。
如果参与者能达成合作协议 , 形成集体性的、完全可信的行动或决策选择 , 让所有参与者都能尽可能地受益 , 那么我们将处于合作博弈论的领域 。
如果参与者之间不允许合作 , 那么我们就处于非合作博弈论的领域 。 博弈论 , 作为一种系统性的方法 , 首先必须引入一个令人满意的解概念 。
首要地 , 解应具有这样的特征:所有参与者都不能通过单边行动来提高收益 , 这就是所谓的非合作均衡或以约翰?纳什的名字命名的纳什均衡 。
60多年前 , 约翰·纳什引入了它 , 并且证明它存在于有限博弈(即每个参与者只有有限数量的替代方案的博弈)和混合策略中 。 对任意一个参与者 , 如果其他参与者按照纳什均衡采取行动 , 这个参与者将无法通过偏离纳什均衡来提高自己的收益 。

请注意 , 我们不允许两个或两个以上的参与者从解点集体行动 , 因为这样的集体行动需要合作 , 这是不允许在非合作博弈中发生的 。
另一个非合作均衡解的概念是斯塔克尔伯格均衡(Stackelberg equilibrium) , 它实际上先于纳什均衡提出 。
其中 , 参与者的决策之间有一个层次 , 一些参与者被指定为领导者 , 有能力首先宣布他们的策略(并承诺执行他们);其余的参与者被指定为跟随者 , 根据领导者的策略决定他们的策略(追随者之间也存在相互博弈) 。
然而 , 在宣布策略之前 , 领导者会预测追随者的反应 , 并以一种对自己最有利的方式决定其行动(就其目标函数而言) 。
NSR:我们遇到的不同类型的博弈有哪些?
Basar:
我们可以把博弈分为两大类 , 即合作博弈和非合作博弈 。 后一类是更广泛意义下的控制界所感兴趣的 , 我们可以对它做进一步的分类 。
如果参与者的目标函数之和不能在适当的正缩放和/或不依赖于参与者的决策变量的平移后变为零 , 我们称这样的非合作博弈是严格的(或真正的)非零和博弈 。
如果一个博弈只有两个参与者 , 两个参与者的目标函数之和为零 , 或者可以通过适当的正缩放和/或不依赖于参与者的决策变量的平移使其为零 , 我们称它是零和博弈 。


推荐阅读