对人胜率84%,DeepMind AI首次在西洋陆军棋中达到人类专家水平

AI百科2个月前发布 快创云
27 0

  机器之心编辑部发布最新消息,DeepMind在游戏AI领域再次取得突破,这次是在西洋陆军棋(Stratego)上的新成就。这款游戏不仅考验了AI在复杂环境中的策略制定能力,还揭示了无模型(model-free)强化学习在策略博弈中的巨大潜力。

  在AI游戏研究的征途中,棋盘游戏常作为测试智能体策略和执行能力的理想平台。从国际象棋到扑克,AI在这些游戏中的进步显著,但西洋陆军棋因其独特的挑战性和复杂性,成为研究的新前沿。该游戏包含大量可能状态,且行动决策复杂,使得传统AI技术难以应对。

  DeepMind最新提出的DeepNash智能体,通过无模型强化学习,成功实现了在Stratego Classic中的专家级表现。其核心算法Regularized Nash Dynamics(R-NaD)与深度神经网络结合,使智能体能在自我博弈中收敛至纳什均衡,展现出强大的竞争力和稳健性。

  研究方法上,DeepNash采用端到端学习策略,无需建立对手模型,而是基于强化学习和博弈论思想,引导智能体学习近似均衡策略。这一创新方法不仅避免了复杂的状态模拟,还使AI在无需搜索的情况下,首次达到人类专家水平。

  实验结果显示,DeepNash在与多种SOTA策略和人类玩家对抗时,表现卓越。它不仅击败了包括Probe、Master of the Flag等在内的多个顶尖计算机程序,还在与人类玩家的较量中占据优势。这些成就标志着AI在策略博弈领域取得了重要进展。

  此外,DeepNash还展示了其在策略欺骗和复杂决策方面的能力,如积极和消极唬骗等策略的运用,进一步证明了其智能和适应性。这些成果不仅为AI研究提供了新的视角和工具,也为未来策略博弈和游戏AI的发展奠定了坚实基础。

  综上所述,DeepMind通过DeepNash智能体在西洋陆军棋上的突破,再次证明了无模型强化学习和博弈论结合在策略博弈中的巨大潜力。这一成果不仅为AI游戏研究开辟了新方向,也为解决其他复杂决策问题提供了新的思路和方法。

© 版权声明

相关文章