AI斗地主获新突破,网易最新研究入选国际顶会NeurIPS

AI百科1个月前更新 快创云
40 0

  继围棋、德州扑克、星际争霸之后,AI技术再次“卷”入斗地主游戏领域。近日,网易互娱 AI Lab 联合上海交通大学和 CMU 推出了开源斗地主AI模型“PerfectDou”。该模型不仅超越了所有已知的开源AI,成为当前实力最强的斗地主AI,其研究成果还在AI顶级学术会议NeurIPS 2022上获得了国际学术界的高度认可。

  对人类而言,斗地主可能只是一个简单的纸牌游戏;但在AI眼中,斗地主的玩法极具挑战性。作为一款非完美信息游戏,斗地主不仅涉及策略合作和队友/对手水平等复杂因素,其牌型组合更是高达27472种,这极大地限制了搜索类算法如 CFR 的使用,对算法模型的创新探索提出了更高的要求。

  针对上述难点,网易互娱 AI Lab 联合上海交通大学和 CMU 提出了基于完美信息蒸馏(PTIE)的斗地主 AI“PerfectDou”。在斗地主游戏中,非完美信息的引入主要是由于三位玩家均不能看到别人的手牌。针对此类非完美信息问题,完美信息蒸馏的思路是构建一个第三方角色,该角色可以看到三位玩家的手牌,通过信息蒸馏的方式,引导玩家打出基于当前情况相对合理的出牌,并赢得比赛。

  为验证AI模型的强度,PerfectDou 与各个斗地主AI分别进行了1万局的对战,并与之前达到 SOTA 水平的 DouZero 模型单独进行了10万局对战。实验结果显示,PerfectDou 在主要指标胜率(WP)和场均得分(ADP)上均击败了所有已知AI斗地主模型,创下最新的SOTA水平。

  目前,网易互娱AI LAB已公布论文全文、对外开源PerfectDou代码,并提供在线试玩平台,以帮助人工智能领域学者进一步研究AI技术在斗地主游戏上的应用。据悉,包括PerfectDou在内的最新AI游戏智能体研究成果,均已集成于网易互娱AI LAB自研游戏AI系统Athena AI中。该系统还拥有模仿学习、强化学习、进化学习算法等众多前沿AI技术,为网易不同类型的热门游戏提供丰富的AI解决方案。

  网易互娱AI Lab成立于2017年,隶属于网易互动娱乐事业群。作为游戏行业领先的人工智能实验室,网易互娱AI Lab提供的AI服务包括计算机视觉、自然语言处理、语音信号处理、游戏AI等;并应用于《梦幻西游》《哈利波特:魔法觉醒》《阴阳师》《大话西游》《荒野行动》等网易旗下多款热门游戏。

  论文链接:https://arxiv.org/abs/2203.16406

  开源代码地址: https://github.com/Netease-Games-AI-Lab-Guangzhou/PerfectDou

  试玩地址:https://outer-perfectdou-demo-gzailab.nie.netease.com

© 版权声明

相关文章