最终决战!人工智能战队OpenAI将战Dota2人类最强战队( 六 )

本文原始标题为:最终决战!人工智能战队OpenAI将战Dota2人类最强战队---来源是:

如何让五个神经网络协作团战是另一个让不少人好奇的地方 , 这其实也是建立在奖励机制上 。 OpenAI为AI模型开发了一个叫TeamSpirit的超参数 , 数值从0到1 , 数字越小每个神经网络就越「自私」 , 相反则越考虑团队的整体利益 。 到最后 , OpenAI发现将TeamSpirit设置为1都能赢得比赛 。

在训练初期 , 研究员其实会将数值调整的很小 , 这样AI会更考虑自身的奖励 , 学习如何分路、对线、提供金钱和经验 。 等到每个神经网络学会了基本的策略和玩法后 , 研究员才将数值慢慢提高 。

由于所有参数都是随机 , AI没有引入任何人类的经验 , 所以AI没有1-5号位的概念 , 不会区分辅助和carry , 出装备也是从头开始学习 。

在第一场游戏中 , 英雄漫无目的地在地图上探索 , 而在几个小时的训练后 , 出现了规划、发育或中期战斗等概念 。 几天后 , 智能体能一致地采用基本的人类策略:试图从对手偷财富、推塔发育、在地图旋转控制英雄以获得线路优势 。 通过进一步的训练 , 它们开始学会了5个英雄一起推塔这样的高级策略 。

TI8冠军OG战队

OpenAI卷土重来 , 这一次直接选择挑战目前人类最强战队OG , 展示了自己的强大自信 。 这次的「最终对决」 , OpenAI直接以Finals为名 , 看来是最后一战了 。 更令人兴奋的是 , 它的对手OG绝非等闲之辈 。

最终决战!人工智能战队OpenAI将战Dota2人类最强战队

----最终决战!人工智能战队OpenAI将战Dota2人类最强战队//----


推荐阅读