为何让人工智能玩《王者荣耀》，我们和研发团队聊了聊

2021年07月15日19:28

来源：中国新闻网

　　中新网客户端北京7月15日电(记者宋宇晟)“整体的感觉就是AI太猛了，它们总是能做出异于常人的反应……”

　　在1:3输给人工智能后，有王者荣耀电竞职业选手这样说到自己对战时的感受。

　　此后更有网友在社交媒体直言，“人类连玩游戏也打不过AI了”“人类再次一败涂地”……

　　那么，让人工智能去玩《王者荣耀》就是为了“虐菜”吗？中新网记者最近和该AI模型负责人聊了聊。

　　3:1 “属于正常发挥”

　　几天前，在世界人工智能大会现场，一款名为“绝悟”的游戏AI与五位来自王者荣耀职业联赛的选手现场进行了一场表演赛。

　　有报道指出，人工智能在比赛中相继打出了“蹲草”“前后拉扯输出”“辅助开团”等操作，并在团队合作上颇具专业意识。

　　在这场五局三胜的赛事中，人工智能以3:1的比分战胜了五位职业选手。

　　尽管胜负成绩成了关注这场比赛的网友讨论的热点话题，但王者绝悟AI模型负责人邱福浩却告诉记者，团队对比赛的胜负没有预期。

　　作为研发人员，他们更希望人工智能可以把握与高水平玩家切磋的机会，验证能力并不断成长，虽然这样的成绩“属于正常发挥”。

　　此外，很多网友猜测，相较于人类职业选手的反应速度，人工智能或许在操作方面有着“绝对优势”。

　　然而，邱福浩却向记者明确表示，在数值和操作上，王者绝悟AI并没有独特的优势，在游戏中的客观条件限制是一致的。

　　“在英雄的自身状态参数上，AI并没有额外的加成，与人类玩家相同；AI在视野观测上与人类玩家保持一致，对于战争迷雾中的不可见单位，AI同样也看不到；AI的操作反应也做了客观限制，其反应分布和均值与KPL职业选手是相接近的。根据实际观察，人类玩露娜等英雄会比AI更秀。”

　　AI一天对局数≈人类440年

　　既然客观条件没有什么不同，人工智能为何能战胜人类职业选手？

　　邱福浩给出的答案是训练量。“AI的优势在于其庞大的训练量，一天对局数约等于人类440年。”

　　用研发团队的话说，自2017年启动项目，王者绝悟AI从模仿人类的监督学习，到自我博弈的强化学习，经过了多次迭代，攻克了多个难题，才逐步进化成了全英雄职业电竞水平的“完全体”。

　　邱福浩介绍，2018年，王者绝悟AI还只是顶尖业余玩家的水平；到了2019年，王者绝悟AI不再需要模仿人类数据，而是通过自己和自己对战，进一步提升微操水平和大局观，已达到了王者荣耀职业电竞水平；去年，它学会了更多英雄玩法，并用40个英雄首次接受玩家们的挑战；最新版本中，团队又在竞技比赛的局前和局内阶段，进行了针对性优化。

　　几年前，AlphaGO击败人类职业围棋选手时，一度震惊世界。

　　与围棋相比，《王者荣耀》是一个不完全信息博弈场景，需要多个AI协作完成任务，且需在复杂连续的决策空间下进行长期决策。

　　换句话说，教会人工智能玩《王者荣耀》，比让人工智能下围棋更难。

　　邱福浩说，围棋的动作空间多达10的172次方，而AI在王者荣耀一局游戏中的操作可能性则多达10的20000次方。

　　让AI打游戏不是终点

　　但，进行如此复杂的研发、训练，就只是为了让人工智能在游戏中打败人类吗？

　　邱福浩并不这么看。因为人工智能最终是要服务于人类的。

　　他告诉记者，团队之所以就此进行研发，首先是因为“这是一个多人协作的游戏场景，它在设计上的高复杂度、高挑战性，满足了对高水平AI+游戏的研究需要”。

　　“从近年AI发展的关键事件可以看到，AI的下一个里程碑很有可能就是在复杂策略游戏中诞生。”

　　而人工智能进行复杂游戏训练的，是为了帮助人类解决现实生活中的问题。

　　邱福浩说，AI在虚拟环境学习通用的感知、决策能力，未来可能在现实世界中发挥更大作用。以无人车研究为例，AI学习外界环境，感知道路环境信息并加以表达，进而作出驾驶决策；再如机器人在虚拟世界仿真学习，再在现实世界对环境的未知变化做出反应。

　　他认为，未来，AI研究还将覆盖到更多场景。对于不少研究人员和开发者来说，多智能体技术研究依然存在显著的现实困难，包括环境的不确定性、信息获取的局限性、个体目标与全局目标的一致性，以及对高算力的要求。

　　在邱福浩看来，“AI+游戏”研究将是团队攻克AI终极研究难题——通用人工智能(AGI)的关键一步。AGI代表研发能在通用系统中执行多种复杂命令，达到或超越人类水平的AI。

　　“这中间的经验、方法与结论，长期来看，有望在大范围内，如医疗、制造、无人驾驶、农业到智慧城市管理等领域带来更深远影响。”(完)

编辑：张馨予

新闻标签：

我来说两句 0条评论 0人参与,