原创击败了世界冠军的AI,玩捉迷藏居然还要作弊?
时间:2019-11-13 18:01:25 热度:37.1℃ 作者:网络
这几年,OpenAI 公司训练出来的 AI 接连在星际争霸2、Dota2 等项目上击败了职业选手,放眼望去几乎已经没什么项目能引起 OpenAI 的兴趣了。
和职业选手们高强度的 “ 比赛 ” 后 OpenAI 有种独孤求败的感觉,但就这么闲着也不是个事儿,于是乎 OpenAI 选择让 AI “ 放松一下 ”,开始训练 AI 玩捉迷藏。
结果,这些 AI 的能力似乎超出了 OpenAI 的想象。。。
一开始 AI 们只是知道捉迷藏最基本的规则,就是藏的人( 蓝色 )不能被找的人( 红色 )给看到,双方都不能攀爬到墙壁或者道具上( 可以走上斜坡 )。
而且一开始红队有一段时间是不能动的,所以负责藏起来的蓝队就会千方百计地趁着这段时间躲起来。
可问题在于,地图就那么大,还有通道,能躲的地方统共就那么些,所以蓝队只能疲于奔命。
不过毕竟他们可是当今行业领先的 AI 啊,这成长的速度也不是盖的,经过几百万次失败,蓝队很快就找到了自己的 “ 制胜策略 ” :用方块把路堵住。( 方块有上锁标记后红队就无法移动或者使用它 )
这下子局面不就僵持住了?蓝队倒是安逸,躲在里面等待胜利就完事儿了,可红队也想赢啊,那咋办呢?
正所谓你有张良计,我有过墙梯,这不还有个木块带着斜坡呢么?于是胜利的天平又一次向红队倾斜了。
接着蓝队也很快学会了利用红队一开始不能动的时间,把他们的梯子也藏进来,没梯子了我看你还怎么翻墙。
没错,这就是这个地图上对于蓝队来说的最优解,蓝队的 AI 做到这一步时,相当于这张地图已经被他们 “ 通关 ” 了,而这也正是 OpenAI 工作人员所期望达到的效果。
显然这张地图只是最初级的,地图上的元素很简单,可用道具也不多,对于 AI 能展现的 “ 智商 ” 上限不高。
在随后的地图上,可以让蓝队躲避的墙壁变少了,地图上的道具则增加了许多,这意味着地图有更大的 “ 自由度 ” ,可以选择的策略数量也急剧增多,如何找到 “ 最优解 ” 对于蓝队来说变得更加困难。
双方你来我往,见招拆招,颇有武林高手比试的感觉,最终经过大量失败后的蓝队居然学会了利用长条来建造 “ 避难所 ” ,成功地把红队关在了门外。
这么一来,只要有一堵墙壁加上两块木板,就可以建造一个简易 “ 避难所 ” ,这蓝队不就无敌了?
大家都是 AI ,凭啥红队就必须接受失败的命运呢?
所谓兔子急了还咬人,AI 急了你知道它会干嘛吗?
作为一段程序,它深谙作为一个程序的弱点:BUG !
红队的 AI 在蓝队使用 “ 无赖手段 ” 之后,终于忍无可忍,找到了训练地图上的一处 BUG ,居然能站在方块上滑行( 看红色小人的手,还保持着拉推方块的姿势 )。。。
根据官方人员的解释,在他们的设定中,只要小人和木块有接触,他们就可以移动木块,这个小小的 “ BUG ” 就这样被红队小人发现并且加以利用了。
就连之前那张最简单的地图,也被红队找到了一个特别的破解方法:在不断尝试后,红队发现只要把带斜坡的木块以特定角度推向墙壁,他们就会被顶得 “ 飞起来 ” 。
没想到吧,哥能飞!这下你喊破喉咙也没人能救你了!
没人救那就只能自救了,同样是经过上百万次的试验,蓝队也发现了斜坡的特殊之处,于是它们会赶在红队能动之前把斜坡以一个特殊角度推到训练地图之外。。。
这甚至是个工作人员自己都没发现的漏洞,单纯是 AI 经过无数次的尝试自己试验出来的。
这一次的训练告诉了所有人一个事实:AI 认真玩起游戏来那可不是通关那么简单,而是直接把游戏给玩 “ 爆 ” 了。。。
虽说训练场地的程序都是人写的,但是即便是工作人员来玩,难免也会带入作为一个 “ 人 ” 的思考壁垒,而 AI 作为人类创造的一段程序,却可以跳出这个思想牢笼,至少在这个捉迷藏的地图上,人类应该是无法击败他们的。
没准 AI 才是我们能破解所有宇宙奥秘的关键所在啊。。。