Google DeepMind 和暴雪娱乐发布工具,AI 研究者可据此打造机器人,在《星际争霸 2》中打赢人类玩家[1]。DeepMind 和暴雪还开放了 65 000 个过去的游戏数据缓存,之后每月增加 500 000 个,这个基础对开发机器人来说是至关重要的。Facebook 近期也发布了 65 000 个原版《星际争霸》人对人游戏的数据集,来帮助机器人开发者。
多年来,研究者使用非官方、开源插件,为原版《星际争霸》打造了多个机器人。这些机器人玩家主要依赖于编码的策略,所以表现平庸。通过机器学习技术打造的机器人,是要能够自己掌握和领会游戏。这也反映出 Google 和 Facebook 在 AI 技术方面的雄心。
《星际争霸》是一款实时策略游戏。让 AI 玩好这个游戏,要比让其下围棋难度更大。围棋里,你可以了解对手的动作等信息,即所谓“完全信息游戏”(perfect information game)。《星际争霸》则属于“不完全信息游戏”,需要你利用看到的信息加上自己对游戏的心理模型,预测你的下一步动作。
而且,《星际争霸》比围棋更复杂,机器人不可以利用其超人的学习能力横扫无数可能性。围棋版面上,有效的位置总和是 1 后面 170 个 0,研究者预测《星际争霸》的复杂度至少要在这个数字上再加 100 个 0。
所以说,挑战《星际争霸》需要更大的突破。简单地让机器学习算法学习过去的游戏来模仿人,是不够的。比如在多任务情形下,计算机要能够发展出自己的游戏打法风格,以调整到发挥自己优势的地步。就像怀特兄弟不是靠模仿鸟来使飞机飞起来一样,机器人玩《星际争霸》游戏的方式也会和人类不一样。
DeepMind 最新发表的论文报告了 AI 利用游戏数据进行学习的初步结果,一个事实是:离 AI 掌握这款游戏还有很长的路要走。《星际争霸》的属性非常像现实生活的属性,所测试的技术也可以应用于现实世界,向 DeepMind 《星际争霸》工具提供建议的 David Churchill 教授表示。
Churchill 估计《星际争霸》机器人战胜人类,要等 5 年时间。值得注意的是,AlphaGo 在围棋上成功挑战人类玩家之前,很多专家也预测这需要 5 年时间。
关于 Google 与暴雪的合作,还可以参考去年 11 月 Google Fans 的分享[2]。
1. https://www.wired.com/story/googles-ai-declares-galactic-war-on-starcraft-/
2. https://plus.google.com/u/0/+GoogleFansPageBlogspotGFP/posts/UhF5wMSgGVR
多年来,研究者使用非官方、开源插件,为原版《星际争霸》打造了多个机器人。这些机器人玩家主要依赖于编码的策略,所以表现平庸。通过机器学习技术打造的机器人,是要能够自己掌握和领会游戏。这也反映出 Google 和 Facebook 在 AI 技术方面的雄心。
《星际争霸》是一款实时策略游戏。让 AI 玩好这个游戏,要比让其下围棋难度更大。围棋里,你可以了解对手的动作等信息,即所谓“完全信息游戏”(perfect information game)。《星际争霸》则属于“不完全信息游戏”,需要你利用看到的信息加上自己对游戏的心理模型,预测你的下一步动作。
而且,《星际争霸》比围棋更复杂,机器人不可以利用其超人的学习能力横扫无数可能性。围棋版面上,有效的位置总和是 1 后面 170 个 0,研究者预测《星际争霸》的复杂度至少要在这个数字上再加 100 个 0。
所以说,挑战《星际争霸》需要更大的突破。简单地让机器学习算法学习过去的游戏来模仿人,是不够的。比如在多任务情形下,计算机要能够发展出自己的游戏打法风格,以调整到发挥自己优势的地步。就像怀特兄弟不是靠模仿鸟来使飞机飞起来一样,机器人玩《星际争霸》游戏的方式也会和人类不一样。
DeepMind 最新发表的论文报告了 AI 利用游戏数据进行学习的初步结果,一个事实是:离 AI 掌握这款游戏还有很长的路要走。《星际争霸》的属性非常像现实生活的属性,所测试的技术也可以应用于现实世界,向 DeepMind 《星际争霸》工具提供建议的 David Churchill 教授表示。
Churchill 估计《星际争霸》机器人战胜人类,要等 5 年时间。值得注意的是,AlphaGo 在围棋上成功挑战人类玩家之前,很多专家也预测这需要 5 年时间。
关于 Google 与暴雪的合作,还可以参考去年 11 月 Google Fans 的分享[2]。
1. https://www.wired.com/story/googles-ai-declares-galactic-war-on-starcraft-/
2. https://plus.google.com/u/0/+GoogleFansPageBlogspotGFP/posts/UhF5wMSgGVR
评论
发表评论