ViZDoom官方网站介绍图片[游戏论坛大全align]2019年10月30日,科学领域的顶级学术期刊《自然》(Nature)刊登了游戏论坛一篇来自DeepMind团队题为《使用多智能体强化学习在<星际争霸 II>中达到宗师级别》(Grandmaster level in StarCraft II using multi-agent reinforcement learning)的论文,在文章中DeepMind自豪地宣布:他们的人工智能AlphaStar参与《星际争霸II》比赛,表现超过了99.8%的人类玩家。
暴雪的《星际争霸》系列是具有历史意义的游戏作品,它超凡的成功直接催生了电子竞技行业的繁荣。正如其名“即时策略”,《星际争霸II》是游戏论坛一款既需要手眼协调能力进行操作,也非常考验玩家策略选择规划的游戏,游戏内丰富的机制模拟出了游戏论坛一个非常接近现实的虚拟对战环境。在利用《星际争霸II》对人工智能进行强化学习的过程中,DeepMind团队也发现过往在围棋、象棋和扑克中行之有效的学习方式,在环境更加复杂的游戏中失效。在此基础上进行修正后,他们从政策强化学习算法(off-policy reinforcement learning),让AlphaStar能够更有效地更新自己的游戏策略。AlphaStar目前并不是无敌的,依然有0.2%的顶级玩家能够击败它,但参考它的前辈Alpha Go游戏论坛一路的战绩,AlphaStar彻底碾压人类玩家也许只是时间问题。对于人工智能电竞选手不太了解的人可能会产生“外挂”之类的联想,误以为人工智能在电子竞技中具有先天优势。实则不然,在AlphaStar参与《星际争霸II》的多人对战时,它获取和反馈信息的方式受到了严格的限制。正如DeepMind在论文中介绍:AlphaStar 拥有与人类相同的限制条件——包括通过摄像头观察世界,以及对其动作频率的更严格限制(AlphaStar每5秒可以使用鼠标进行22次非重复动作)。[img]网络游戏nimg.ws.126.net游戏论坛大全?url=论坛%3A%2F%2Fdingyue.ws.126.net%2F2022%2F0628%2F96d272e0j00re64bd001qc000z800juc.jpg&thumbnail=660x2147483647&quality=80&type=jpg[游戏论坛大全img]
图片源自DeepMind官方网站[游戏论坛大全align]AlphaStar不能看到玩家看不到的地图,也不能用更高的速度进行操作,因此在击败99.8%的人类玩家的过程中,AlphaStar依赖于它通过深度学习获得的洞察力和策略。如图所示,DeepMind展示了AlphaStar在游戏过程中如何运用“石头剪刀布”方式平衡优势与劣势。游戏论坛一位《星际争霸II》的职业选手Dario "TLO" Wünsch在同AlphaStar对战后,评价它“就像在真正地玩游戏”:
“我发现 AlphaStar 的游戏玩法令人印象深刻——该系统非常擅长评估其战略位置,并且准确地知道何时与对手交战或脱离交战。虽然 AlphaStar 具有出色而精确的控制,但它并没有超人的感觉——当然不是人类理论上无法达到的水平。总的来说,感觉很公平——就像在真正地玩《星际争霸》游戏。”
从游戏技术到世界仿真
以游戏为平台探索人工智能的潜力,并没有仅仅停留在游戏领域内。前文中提到,相比棋牌等规则抽象的竞技游戏,电子游戏规则高度复杂、能够更加接近地模拟人类生活的现实世界。复杂的规则和仿真的空间,除了为人工智能决策制造更多困难和问题,要求它们提高算力不断进化,还让其技术推广向现实世界更加便捷。
对于游戏玩家来说,英伟达(NVIDIA)这家公司的名字绝不陌生,它所研发的显卡游戏论坛一直颇受玩家们追捧。在2021年8月12日举行的计算机图形学顶级年度会议SIGGRAPH 2021上,英伟达公布了游戏论坛一条让人哭笑不得的消息:早在4月时英伟达发布的游戏论坛一条15秒的由首席执行官黄仁勋出镜的发布会视频,完完全全是“Deep Fake”视频。它由英伟达的Omniverse平台合成制作,以假乱真的程度骗过了所有人——三个多月的时间过去,直到英伟达自己公布真相,都没有人看出这段视频是人造的。[img]网络游戏nimg.ws.126.net游戏论坛大全?url=论坛%3A%2F%2Fdingyue.ws.126.net%2F2022%2F0628%2F47ce28dcj00re64be007lc000g5009bc.jpg&thumbnail=660x2147483647&quality=80&type=jpg[游戏论坛大全img]
英伟达2021年4月发布视频截图[游戏论坛大全align]