技术开发 频道

谷歌与暴雪联手发布星际争霸人工智能工具包

  【IT168 资讯】教计算机和机器人玩游戏、比赛是衡量它们智慧的手段之一。随着机器变得更聪明,人类不断为他们寻找新的挑战。首先是国际象棋,然后是Atari,然后是围棋,现在它们正在面临更大挑战:星际争霸。

谷歌与暴雪联手发布星际争霸AI工具包

  确切地说是星际争霸2,Google的AI子公司DeepMind的研究人说,星际争霸2是培养计算机高级技能(如记忆和规划)的完美环境。DeepMind在2017年表示,将与暴雪合作,将即时战略游戏变成AI工程师的研究环境,现在该软件正式发布。

  来自DeepMind和暴雪的工具包包涵各种辅助工具,包括从专业比赛(AI可以观察学习人类战术)收集的星际争霸2重播的大型数据集;以及一组分离某些游戏元素(如地图勘探和资源收集)的迷你游戏,可用于磨练特定技能。但是最重要的一个工具包就是一个API,它允许AI代理人像人类一样玩游戏,并将数据反馈给研究人员。这意味着代理可以被赋予与人类相同的限制(因此他们无法立即看到所有的地图,或者无法快速点击鼠标),而要通过尝试和错误学习,整个过程被称为“加强学习”。

  但为什么星际争霸是训练人工智能的好方法呢?这不是因为我们想要计算机学习军事战略或手段,而是因为我们需要教它们某些抽象的技巧,而视频游戏就是一个很好的方法。视频游戏是虚拟环境,这意味着游戏可以快速反复重复;人们玩游戏有助于生成许多培训数据;而星际争霸还有一些游戏机制,对计算机来说是特别有挑战性的。

  DeepMind研究员Oriol Vinyals(他曾经是是优异星际争霸选手),他解释说,游戏提供的一个有趣的限制是“战争之雾”机制,其中涵盖了地图,并强迫玩家探索,找出他们的敌人是什么。 “所以对于一个AI来说,记住这一点可能是至关重要的,我以前看过一个单位,但是我现在看不到,所以我应该回去侦察,看看他们是否有一个靠近该地点的基地。

  对于一个游戏玩家来说,这是一个很明显的想法,它几乎不值得考虑,但是对于AI是需要学习才能有用的一种常识。在星际争霸中,一个玩家能够侦查对手的是获胜的关键,而且这个挑战在国际象棋或围棋这样的游戏中并不存在,在这些游戏中,两个玩家都可以随时了解自己和对方的环境。

  Vinyals说,这种记忆技巧可以应用于各种环境,并给出了一个在数据中心管理电力以降低电力成本的计算机的例子。 “比如可能在星期天,无论什么原因都有一个用电高峰,并且下周日将不得不记住这个信息来与上周进行比较,记忆在这里起着关键作用,教计算机来推断世界状态可能对我们来说是非常有趣的。”

谷歌与暴雪联手发布星际争霸AI工具包
▲在星际争霸2中,玩家必须收集资源,探索领土,建立基地,打败对手。

  除了教AI某些技能,新发布的API为人类与计算机在星际争霸的较量提供了舞台。暴雪和DeepMind都没有说过他们打算进行类似AlphaGo对抗人类冠军的比赛,但是星际争霸2最好的职业选手肯定会热衷于与AI一争高低,为人类正名。在今年早些时候,职业玩家星际争霸选手Byun Hyun Woo在麻省理工学院技术评论发表演讲的时候,表达了对自己战胜AI的信心。他说:“我不认为AI能够击败一个职业选手,至少不会在我的职业生涯中。

  问题在于,人工智能目前还无败绩,就像DeepMind的AlphaGo之前的表现,击败李世石,以Master的身份连胜利60,与排名世界靠前的世界围棋冠军柯洁对战,以3比0的总比分获胜。

  那么DeepMind的AI未来会与星际争霸职业选手PK吗?你最期待AI跟哪位全球优异的星际争霸职业选手对局,是Flash、大魔王Joedong,还是Bisu?AI又会使用怎样的战术和技巧对局呢?

  最后我想问,AI有APM吗?

0
相关文章