谷歌与暴雪联手发布星际争霸人工智能工具包-技术开发专区

谷歌与暴雪联手发布星际争霸人工智能工具包

作者：陈毅东编辑：陈毅东 2017-08-10 17:19 IT168网站原创

　　【IT168 资讯】教计算机和机器人玩游戏、比赛是衡量它们智慧的手段之一。随着机器变得更聪明，人类不断为他们寻找新的挑战。首先是国际象棋，然后是Atari，然后是围棋，现在它们正在面临更大挑战：星际争霸。

谷歌与暴雪联手发布星际争霸AI工具包
▲

　　确切地说是星际争霸2，Google的AI子公司DeepMind的研究人说，星际争霸2是培养计算机高级技能(如记忆和规划)的完美环境。DeepMind在2017年表示，将与暴雪合作，将即时战略游戏变成AI工程师的研究环境，现在该软件正式发布。

　　来自DeepMind和暴雪的工具包包涵各种辅助工具，包括从专业比赛(AI可以观察学习人类战术)收集的星际争霸2重播的大型数据集;以及一组分离某些游戏元素(如地图勘探和资源收集)的迷你游戏，可用于磨练特定技能。但是最重要的一个工具包就是一个API，它允许AI代理人像人类一样玩游戏，并将数据反馈给研究人员。这意味着代理可以被赋予与人类相同的限制(因此他们无法立即看到所有的地图，或者无法快速点击鼠标)，而要通过尝试和错误学习，整个过程被称为“加强学习”。

　　但为什么星际争霸是训练人工智能的好方法呢?这不是因为我们想要计算机学习军事战略或手段，而是因为我们需要教它们某些抽象的技巧，而视频游戏就是一个很好的方法。视频游戏是虚拟环境，这意味着游戏可以快速反复重复;人们玩游戏有助于生成许多培训数据;而星际争霸还有一些游戏机制，对计算机来说是特别有挑战性的。

　　DeepMind研究员Oriol Vinyals(他曾经是是优异星际争霸选手)，他解释说，游戏提供的一个有趣的限制是“战争之雾”机制，其中涵盖了地图，并强迫玩家探索，找出他们的敌人是什么。 “所以对于一个AI来说，记住这一点可能是至关重要的，我以前看过一个单位，但是我现在看不到，所以我应该回去侦察，看看他们是否有一个靠近该地点的基地。

　　对于一个游戏玩家来说，这是一个很明显的想法，它几乎不值得考虑，但是对于AI是需要学习才能有用的一种常识。在星际争霸中，一个玩家能够侦查对手的是获胜的关键，而且这个挑战在国际象棋或围棋这样的游戏中并不存在，在这些游戏中，两个玩家都可以随时了解自己和对方的环境。

　　Vinyals说，这种记忆技巧可以应用于各种环境，并给出了一个在数据中心管理电力以降低电力成本的计算机的例子。 “比如可能在星期天，无论什么原因都有一个用电高峰，并且下周日将不得不记住这个信息来与上周进行比较，记忆在这里起着关键作用，教计算机来推断世界状态可能对我们来说是非常有趣的。”

谷歌与暴雪联手发布星际争霸AI工具包
▲在星际争霸2中，玩家必须收集资源，探索领土，建立基地，打败对手。

　　除了教AI某些技能，新发布的API为人类与计算机在星际争霸的较量提供了舞台。暴雪和DeepMind都没有说过他们打算进行类似AlphaGo对抗人类冠军的比赛，但是星际争霸2最好的职业选手肯定会热衷于与AI一争高低，为人类正名。在今年早些时候，职业玩家星际争霸选手Byun Hyun Woo在麻省理工学院技术评论发表演讲的时候，表达了对自己战胜AI的信心。他说：“我不认为AI能够击败一个职业选手，至少不会在我的职业生涯中。

　　问题在于，人工智能目前还无败绩，就像DeepMind的AlphaGo之前的表现，击败李世石，以Master的身份连胜利60，与排名世界靠前的世界围棋冠军柯洁对战，以3比0的总比分获胜。

　　那么DeepMind的AI未来会与星际争霸职业选手PK吗?你最期待AI跟哪位全球优异的星际争霸职业选手对局，是Flash、大魔王Joedong，还是Bisu?AI又会使用怎样的战术和技巧对局呢?

　　最后我想问，AI有APM吗?

关注我们