AlphaGo原来是这样运行的，一文详解多智能体强化学习( 十 )

[10] Foerster J, Farquhar G, Afouras T, et al. Counterfactual Multi-Agent Policy Gradients[J]. arXiv: Artificial Intelligence, 2017.
[11] Sunehag P, Lever G, Gruslys A, et al. Value-Decomposition Networks For Cooperative Multi-Agent Learning.[J]. arXiv: Artificial Intelligence, 2017.
[12] Rashid T, Samvelyan M, De Witt C S, et al. QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning[J]. arXiv: Learning, 2018.
[13] OpenAI Five, OpenAI, https://blog.openai.com/openai-five/, 2018.
[14] Vinyals, O., Babuschkin, I., Czarnecki, W.M. et al. Grandmaster level in StarCraft II using multi-agent reinforcement learning. Nature 575, 350–354 (2019).
[15] P. Long, T. Fan, X. Liao, W. Liu, H. Zhang and J. Pan, ''Towards Optimally Decentralized Multi-Robot Collision Avoidance via Deep Reinforcement Learning,'' 2018 IEEE International Conference on Robotics and Automation (ICRA), Brisbane, QLD, 2018, pp. 6252-6259, doi: 10.1109/ICRA.2018.8461113.
[16] Y. F. Chen, M. Everett, M. Liu and J. P. How, ''Socially aware motion planning with deep reinforcement learning,'' 2017 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), Vancouver, BC, 2017, pp. 1343-1350, doi: 10.1109/IROS.2017.8202312.
【AlphaGo原来是这样运行的，一文详解多智能体强化学习】[17] Hernandez-Leal P , Kartal B , Taylor M E . A survey and critique of multiagent deep reinforcement learning[J]. Autonomous Agents & Multi Agent Systems, 2019(2).

AlphaGo原来是这样运行的，一文详解多智能体强化学习( 十 )

推荐阅读

巴威|受台风“巴威”影响辽宁多地陆岛运输船及海上客运停航

[吾念长安]波浪卷发大蝴蝶结，完美上演甜美女神范，郑爽又出新造型

「平安巴南」巴南民警：破案不费吹灰之力，偷车贼：实名制卖车

川航一外籍机长航前酒测超标被罚款8万并停飞半年

学生保养皮肤的方法学生吃什么食物有助于保养皮肤？

萌宠■黄金周将至，萌宠抢占“豪华房”！考验钱包的时候到了

ZAKER生活|炫神粉丝与FPX发生争论，炫神：加大力度我得继续看，LOL

妆酷的仙女会负责到底，李佳琦方回应买完不让换：已进行退款

上海热线军事|26枚导弹砸向叙利亚叛军：美军事先毫无察觉，俄罗斯海军猛烈开火

秦绪文自媒体|好用到爆，谁用谁知道，自媒体团队和大V都在用的选题起标题方法

疼到想笑，为啥

中国民航局：两岸确认春节加班等航空运输安排

如何品出茶的香气

足光散泡脚脱皮能撕吗

蔡依林|40岁蔡依林罕见晒视频，上万手机镶珠宝项链抢眼，出道20年似少女

下载|下载的文件打不开甚至中毒？教你几招Hash文件

名医手记丨老年人头晕警惕心血管疾病

女副区长被家暴致死|女副区长被家暴致死男友获无期被告上诉被驳回

猪肉价格春节期间会降价吗,猪肉价格春节前能降下来吗-

三毛时尚|街拍：小姐姐一身蓝色的吊带长裙，女人味道十足，气质高贵